Anthropic Giải Quyết Vụ Kiện Bản Quyền Về Việc Sử Dụng Sách Lậu Để Huấn Luyện AI Claude

Nhóm biên tập BigGo
Anthropic Giải Quyết Vụ Kiện Bản Quyền Về Việc Sử Dụng Sách Lậu Để Huấn Luyện AI Claude

Công ty AI Anthropic đã đạt được thỏa thuận giải quyết mang tính bước ngoặt với một nhóm tác giả đã cáo buộc công ty sử dụng hàng triệu cuốn sách lậu để huấn luyện chatbot Claude . Thỏa thuận này, được công bố trong hồ sơ tòa án liên bang vào thứ Ba, đã tránh được cuộc chiến pháp lý có thể trị giá hàng nghìn tỷ đô la và có thể thiết lập những tiền례 mới về cách các công ty AI xử lý nội dung có bản quyền.

Các nhân vật pháp lý chính:

  • Nguyên đơn: Andrea Bartz , Charles Graeber , Kirk Wallace Johnson (các tác giả)
  • Bị đơn: Anthropic (công ty AI)
  • Thẩm phán: Thẩm phán Quận U.S. William Alsup (tòa án liên bang San Francisco )
  • Luật sư của các tác giả: Justin Nelson
Dario Amodei, đại diện cho Anthropic, phát biểu về thỏa thuận mang tính bước ngoặt đã đạt được với các tác giả về các vấn đề bản quyền
Dario Amodei, đại diện cho Anthropic, phát biểu về thỏa thuận mang tính bước ngoặt đã đạt được với các tác giả về các vấn đề bản quyền

Thách Thức Pháp Lý Cốt Lõi

Vụ kiện do các tác giả Andrea Bartz , Charles Graeber và Kirk Wallace Johnson đệ trình, đại diện cho vụ kiện tập thể được chứng nhận đầu tiên chống lại một công ty AI về vấn đề tài liệu có bản quyền. Các tác giả cáo buộc rằng Anthropic đã tham gia vào việc trộm cắp quy mô lớn bằng cách tải xuống hàng triệu cuốn sách từ các thư viện ngầm và trang web lậu như Library Genesis ( LibGen ) để huấn luyện Claude . Mặc dù một thẩm phán liên bang đã phán quyết vào tháng 6 rằng việc sử dụng sách được mua hợp pháp để huấn luyện AI cấu thành việc sử dụng hợp lý, công ty vẫn phải đối mặt với trách nhiệm pháp lý về cách họ có được tài liệu ngay từ đầu.

Thiệt Hại Tiềm Tàng và Điều Khoản Thỏa Thuận

Mức độ tài chính liên quan là rất lớn. Nếu bị kết tội vi phạm bản quyền có chủ ý, Anthropic có thể phải đối mặt với thiệt hại theo luật định từ 750 đến 150.000 đô la Mỹ cho mỗi tác phẩm, có thể đạt tới hơn 1 nghìn tỷ đô la Mỹ do có hàng triệu cuốn sách liên quan. Số tiền thỏa thuận thực tế vẫn được giữ bí mật, và các chi tiết về cách phân phối bồi thường cho các chủ sở hữu bản quyền, bao gồm các tác giả cá nhân và các nhà xuất bản, vẫn đang được hoàn thiện.

Thiệt hại tiềm tàng được tránh:

  • Mức bồi thường theo luật định: 750 đến 150.000 USD cho mỗi tác phẩm có bản quyền
  • Tổng trách nhiệm pháp lý tiềm tàng: Hơn 1 nghìn tỷ USD (do có hàng triệu tác phẩm liên quan)
  • Quy mô dữ liệu huấn luyện: Hơn 7 triệu cuốn sách được sử dụng để huấn luyện Claude

Phán Quyết Sử Dụng Hợp Lý Tạo Ra Tiền Lệ Quan Trọng

Phán quyết tháng 6 của Thẩm phán Quận William Alsup thuộc Tòa án Quận Hoa Kỳ đã cung cấp sự rõ ràng quan trọng về các thực hành huấn luyện AI. Ông xác định rằng việc huấn luyện các mô hình AI trên các tác phẩm có bản quyền được coi là việc sử dụng hợp lý mang tính chuyển đổi điển hình, so sánh nó với bất kỳ độc giả nào có khát vọng trở thành nhà văn. Thẩm phán nhấn mạnh rằng các hệ thống AI học từ các tác phẩm không phải để sao chép chúng, mà để rẽ sang một hướng khác và tạo ra thứ gì đó khác biệt. Tuy nhiên, sự bảo vệ này chỉ áp dụng khi các công ty có được tài liệu huấn luyện một cách hợp pháp.

Tác Động Trên Toàn Ngành

Các chuyên gia pháp lý xem thỏa thuận này có khả năng là quân domino đầu tiên rơi trong việc thiết lập cách các công ty AI xử lý nội dung có bản quyền. Mặc dù thỏa thuận không tạo ra tiền lệ pháp lý, nó có thể hợp pháp hóa các khiếu nại của tác giả và khuyến khích các chủ sở hữu bản quyền khác theo đuổi các vụ kiện tương tự. Thỏa thuận có thể đẩy ngành công nghiệp hướng tới mô hình cấp phép nơi các nhà sáng tạo nhận được bồi thường cho các tác phẩm của họ được sử dụng trong huấn luyện AI, chuyển khỏi thực hành hiện tại là sử dụng nội dung internet được thu thập miễn phí.

Dòng thời gian các sự kiện:

  • Vụ kiện được đệ trình: 2024
  • Phán quyết Sử dụng Hợp lý: Tháng 6 năm 2025
  • Chứng nhận Vụ kiện Tập thể: Tháng 11 năm 2025
  • Thông báo Thỏa thuận: 26 tháng 8 năm 2025
  • Phiên tòa Ban đầu được Lên lịch: 1 tháng 12 năm 2025
  • Dự kiến Hoàn tất Thỏa thuận: 3 tháng 9 năm 2025

Bối Cảnh Rộng Hơn Cho Phát Triển AI

Vụ việc này làm nổi bật một thách thức cơ bản mà các công ty AI phải đối mặt khi họ mở rộng quy mô các mô hình của mình. Các hệ thống AI hiện đại đòi hỏi lượng dữ liệu huấn luyện khổng lồ— GPT-4 được huấn luyện trên 1 nghìn tỷ tham số, trong khi Anthropic được báo cáo đã tích lũy hơn 7 triệu tác phẩm cho Claude . Thỏa thuận này diễn ra vào thời điểm chính quyền Trump chưa có lập trường rõ ràng về các vấn đề bản quyền AI, với Văn phòng Bản quyền Hoa Kỳ ủng hộ việc đánh giá từng trường hợp cụ thể thay vì các chính sách toàn diện.

Thỏa thuận dự kiến sẽ được hoàn tất vào ngày 3 tháng 9 năm 2025, có khả năng tạo ra lộ trình cho cách các công ty AI khác xử lý các thách thức bản quyền tương tự. Khi ngành công nghiệp tiếp tục phát triển, thỏa thuận này có thể đánh dấu sự khởi đầu của một kỷ nguyên mới nơi phát triển AI bao gồm các thỏa thuận cấp phép chính thức với các nhà sáng tạo nội dung.