Anthropic Thắng Kiện Lớn Về Bản Quyền AI Liên Quan Đến Dữ Liệu Huấn Luyện Nhưng Vẫn Phải Ra Tòa Vì Cáo Buộc Vi Phạm Bản Quyền

Nhóm biên tập BigGo
Anthropic Thắng Kiện Lớn Về Bản Quyền AI Liên Quan Đến Dữ Liệu Huấn Luyện Nhưng Vẫn Phải Ra Tòa Vì Cáo Buộc Vi Phạm Bản Quyền

Một phán quyết của tòa án liên bang đã đưa ra quyết định mang tính bước ngoặt trong các cuộc chiến pháp lý đang diễn ra xung quanh trí tuệ nhân tạo và luật bản quyền, với những tác động đáng kể đối với toàn bộ ngành công nghiệp AI. Vụ án tập trung vào việc liệu các công ty AI có thể hợp pháp huấn luyện mô hình của họ trên các tài liệu có bản quyền mà không cần xin phép hay không, một câu hỏi đã châm ngòi cho hàng chục vụ kiện trên khắp Hoa Kỳ.

Học Thuyết Sử Dụng Biến Đổi Bảo Vệ Việc Huấn Luyện AI

Thẩm phán Quận Hoa Kỳ William Alsup đã phán quyết rằng việc Anthropic huấn luyện chatbot Claude của mình trên hàng triệu cuốn sách có bản quyền cấu thành việc sử dụng hợp lý theo luật bản quyền. Thẩm phán xác định rằng quá trình huấn luyện AI về bản chất là mang tính biến đổi vì nó không sao chép hoặc thay thế các tác phẩm gốc mà tạo ra thứ gì đó hoàn toàn khác biệt. Thẩm phán Alsup nhấn mạnh rằng công nghệ này đại diện cho một trong những thứ mang tính biến đổi nhất mà nhiều người trong chúng ta sẽ thấy trong đời, rút ra những điểm tương đồng giữa việc học của AI và những độc giả con người có khát vọng trở thành nhà văn.

Đây là phán quyết lớn đầu tiên trong một vụ kiện bản quyền AI tạo sinh giải quyết việc sử dụng hợp lý một cách chi tiết toàn diện. Quyết định này đặc biệt bác bỏ các lập luận phân biệt giữa quá trình học của con người và máy móc, nhận định rằng cả hai đều liên quan đến việc sử dụng biến đổi các tài liệu nguồn.

Dòng thời gian pháp lý chính

  • Tháng 8/2024: Vụ kiện tập thể được đệ trình chống lại Anthropic
  • Tháng 2/2025: Anthropic yêu cầu phán quyết tóm tắt về việc sử dụng hợp lý
  • Cuối năm 2024: Phán quyết tóm tắt được ban hành
  • Tháng 12/2025: Phiên tòa được lên lịch cho các cáo buộc vi phạm bản quyền

Cáo Buộc Vi Phạm Bản Quyền Tạo Ra Rủi Ro Pháp Lý Đáng Kể

Bất chấp chiến thắng về các thực hành huấn luyện, Anthropic đối mặt với rủi ro pháp lý đáng kể về cách công ty thu thập tài liệu huấn luyện. Tòa án nhận định rằng công ty đã tải xuống hơn bảy triệu cuốn sách lậu từ các thư viện ngầm bao gồm Books3, Library Genesis ( LibGen ), và Pirate Library Mirror ( PiLiMi ) từ năm 2021 đến 2022. Các tài liệu tòa án tiết lộ rằng đồng sáng lập Anthropic Ben Mann đã cá nhân tải xuống những bộ sưu tập khổng lồ này, biết rằng chúng chứa nội dung lậu.

Thẩm phán Alsup làm rõ rằng trong khi huấn luyện trên các tài liệu thu thập hợp pháp đủ điều kiện là sử dụng hợp lý, việc thu thập các bản sao lậu không nhận được sự bảo vệ tương tự. Công ty duy trì thư viện lậu này ngay cả sau khi quyết định không sử dụng những bản sao cụ thể đó để huấn luyện, cuối cùng chuyển sang mua các bản sao hợp pháp của sách.

Lịch thời gian thu thập nội dung vi phạm bản quyền

  • Mùa đông 2021: Ben Mann đã tải xuống toàn bộ cơ sở dữ liệu Books3
  • Tháng 6/2021: Tải xuống hơn 5 triệu cuốn sách từ Library Genesis ( LibGen )
  • Tháng 7/2022: Tải xuống hơn 2 triệu cuốn sách từ Pirate Library Mirror ( PiLiMi )
  • Giai đoạn sau: Chuyển sang mua các bản sao hợp pháp

Thiệt Hại Tiềm Tàng Hàng Tỷ Đô La Lơ Lửng

Mức độ tài chính đang là rất lớn đối với Anthropic . Với thiệt hại theo luật định bắt đầu từ 750 đô la Mỹ cho mỗi tác phẩm có bản quyền và thư viện lậu của công ty chứa ít nhất bảy triệu cuốn sách, các khoản phạt tiềm tàng có thể lên tới hàng tỷ đô la Mỹ. Số tiền chính xác sẽ được xác định tại phiên tòa, với chưa có ngày nào được ấn định cho thủ tục tố tụng.

Vụ án bắt nguồn từ một vụ kiện tập thể được đệ trình vào tháng 8 năm 2024 bởi các tác giả Andrea Bartz , Charles Graeber , và Kirk Wallace Johnson , những người cáo buộc rằng Anthropic đã tham gia vào việc trộm cắp quy mô lớn các tác phẩm của họ để xây dựng hệ thống AI.

Rủi ro Tài chính

  • Thiệt hại tối thiểu theo luật định: 750 USD cho mỗi tác phẩm có bản quyền
  • Ước tính số sách bị vi phạm bản quyền: hơn 7 triệu bản
  • Trách nhiệm pháp lý tối đa có thể: hơn 5,25 tỷ USD
  • Thiệt hại thực tế sẽ được xác định tại phiên tòa

Tác Động Toàn Ngành

Phán quyết chia đôi này tạo ra những tiền례 quan trọng cho nhiều vụ kiện bản quyền AI hiện đang được xử lý qua hệ thống tòa án. Các công ty như OpenAI và Meta đối mặt với những vụ kiện tương tự, và phân tích chi tiết của Thẩm phán Alsup về học thuyết sử dụng hợp lý có khả năng sẽ ảnh hưởng đến cách những vụ án này được tranh luận và quyết định.

Quyết định này cung cấp lộ trình cho các công ty AI: huấn luyện trên các tài liệu có bản quyền có thể hợp pháp theo học thuyết sử dụng hợp lý, nhưng phương pháp thu thập những tài liệu đó có ý nghĩa đáng kể. Các công ty dựa vào các nguồn lậu có thể đối mặt với trách nhiệm pháp lý đáng kể ngay cả khi các thực hành huấn luyện của họ cuối cùng được coi là mang tính biến đổi.

Các chuyên gia pháp lý xem đây là khoảnh khắc bước ngoặt đối với ngành công nghiệp AI. Phán quyết xác nhận mô hình kinh doanh cốt lõi của việc huấn luyện các mô hình ngôn ngữ lớn trên nội dung hiện có trong khi thiết lập ranh giới rõ ràng về cách nội dung đó phải được thu thập. Đối với Anthropic , kết quả hỗn hợp đại diện cho cả việc minh oan cho cách tiếp cận phát triển AI của họ và một bài học tốn kém về các thực hành thu thập dữ liệu.