213
/
176109
Meta bị cáo buộc dùng nội dung sách vi phạm bản quyền để huấn luyện AI
meta-bi-cao-buoc-dung-noi-dung-sach-vi-pham-ban-quyen-de-huan-luyen-ai
news

Meta bị cáo buộc dùng nội dung sách vi phạm bản quyền để huấn luyện AI

Thứ 2, 10/02/2025 | 10:23:00
2,097 lượt xem

Một vụ kiện chống lại Meta cáo buộc công ty này sử dụng sách vi phạm bản quyền để huấn luyện mô hình AI (trí tuệ nhân tạo).

Theo TechSpot, một nhóm tác giả tại Mỹ đã đệ đơn kiện Meta với cáo buộc công ty này sử dụng trái phép các cuốn sách để huấn luyện mô hình AI tạo sinh (generative AI). Trong khi Meta phủ nhận hành vi vi phạm bản quyền, các email nội bộ vừa được công khai cho thấy một số nhân sự cấp cao và kỹ sư của công ty đã thảo luận về việc tải xuống kho sách lậu để phục vụ quá trình huấn luyện AI.

Meta AI đang vướng vào tranh cãi pháp lý khi bằng chứng nội bộ về việc đã tải xuống và lan truyền kho sách lậu để huấn luyện AI ẢNH: META

Hồ sơ vụ kiện cho thấy Meta đã sử dụng các tập dữ liệu gây tranh cãi, bao gồm "LibGen" - kho lưu trữ hàng triệu cuốn sách bị vi phạm bản quyền. Trước đây, Meta từng lập luận rằng việc sử dụng những dữ liệu này thuộc phạm vi "sử dụng hợp lý". Tuy nhiên, các email mới tiết lộ Meta không chỉ tải về mà còn phân phối các tệp dữ liệu này thông qua mạng BitTorrent, đặt ra những vấn đề pháp lý nghiêm trọng.

Theo nội dung email, Meta đã tải xuống và chia sẻ ít nhất 81,7 terabyte dữ liệu từ nhiều kho sách vi phạm bản quyền, trong đó có 35,7 terabyte từ Z-Library và LibGen. Các nguyên đơn gọi đây là một "chiến dịch torrent đáng kinh ngạc" khi Meta không chỉ tải về mà còn chủ động lan truyền các tệp dữ liệu này ở quy mô lớn.

Một email nội bộ từ tháng 4.2023 của nhà nghiên cứu Nikolay Bashlykov thuộc Meta ghi nhận: "Torrent trên máy tính công ty có vẻ không ổn." Dù câu nói này kết thúc bằng một biểu tượng cảm xúc cười, nhưng chỉ vài tháng sau, giọng điệu của ông đã thay đổi rõ rệt. Vào tháng 9.2023, Bashlykov cho biết ông đã liên hệ với bộ phận pháp lý của Meta vì hành vi sử dụng torrent - đồng nghĩa với việc "gieo mầm" dữ liệu vi phạm bản quyền rõ ràng là vi phạm luật.

Các tài liệu cũng chỉ ra rằng Mark Zuckerberg, CEO của Meta, đã nhận thức được việc công ty sử dụng LibGen. Để tránh bị phát hiện, Meta được cho là đã triển khai các máy chủ bên ngoài hệ thống chính của Facebook nhằm che giấu hoạt động torrent và phân phối dữ liệu. Một email nội bộ khác của nhân viên Frank Zhang đề cập đến chiến thuật này với thuật ngữ "chế độ tàng hình" (stealth mode).

Hiện tại, Meta đang đầu tư mạnh vào phát triển AI và các dịch vụ liên quan đến AI tạo sinh. Công ty cũng đang tìm cách tích hợp các chatbot và nhân vật AI vào hệ sinh thái mạng xã hội của mình. Tuy nhiên, trước những bằng chứng mới được tiết lộ, Meta có thể gặp nhiều khó khăn trong việc bảo vệ lập luận "sử dụng hợp lý" của mình khi đối mặt với vụ kiện từ các tác giả.

Theo Khải Minh/ Thanh Niên

https://thanhnien.vn/meta-bi-cao-buoc-dung-noi-dung-sach-vi-pham-ban-quyen-de-huan-luyen-ai-185250209012630928.htm

  • Từ khóa

iPhone 16 sắp cho sạc nhanh 25W với sạc không dây của bên thứ ba

Apple âm thầm "mở khóa" tốc độ sạc không dây 25W cho iPhone 16, người dùng sắp có thêm lựa chọn giá rẻ.
11:04 - 25/08/2025
383 lượt xem

Google Maps trên Android sắp nhận loạt cải tiến đáng chú ý

Google hiện chuẩn bị cho một loạt thay đổi đáng chú đối với ứng dụng Google Maps trên Android.
08:37 - 25/08/2025
422 lượt xem

Lộ diện concept Windows 12.2 khiến cộng đồng mạng mê mẩn

Microsoft còn chưa lên tiếng, người hâm mộ đã tung concept Windows 12.2 đẹp mãn nhãn khiến người dùng ao ước.
07:16 - 25/08/2025
462 lượt xem

AI trả lời thông minh hơn khi chat bằng tiếng Anh?

Nhiều người dùng tin rằng chatbot AI thông minh hơn khi trả lời bằng tiếng Anh. Nhưng liệu đây có phải là sự thật, hay chỉ là tin đồn nảy sinh từ thói...
16:30 - 24/08/2025
820 lượt xem

Nâng cao năng lực số, kiến thức số, kỹ năng số, đẩy nhanh tiến trình hiện đại hóa nền ngoại giao

Theo Thứ trưởng Ngoại giao Lê Anh Tuấn, Bộ Ngoại giao nhận thức rằng, việc nâng cao năng lực số, kiến thức số và kỹ năng số để đẩy nhanh tiến trình hiện...
07:31 - 24/08/2025
1,048 lượt xem