Anthropic đối mặt với khoản bồi thường hàng tỷ đô la sau khi thẩm phán phán quyết việc cướp bản quyền 7 triệu cuốn sách là bất hợp pháp bất chấp việc huấn luyện theo nguyên tắc sử dụng hợp lý

Nhóm Cộng đồng BigGo
Anthropic đối mặt với khoản bồi thường hàng tỷ đô la sau khi thẩm phán phán quyết việc cướp bản quyền 7 triệu cuốn sách là bất hợp pháp bất chấp việc huấn luyện theo nguyên tắc sử dụng hợp lý

Một thẩm phán liên bang đã đưa ra phán quyết chia đôi trong một vụ kiện bản quyền lớn có thể định hình lại cách các công ty AI thu thập dữ liệu huấn luyện. Trong khi Anthropic giành được chiến thắng quan trọng về mặt sử dụng hợp lý, công ty hiện đối mặt với khoản bồi thường tiềm năng hàng tỷ đô la vì đã tải xuống hơn 7 triệu cuốn sách cướp bản quyền để xây dựng trợ lý AI Claude của họ.

Vụ việc này tiết lộ hai cách tiếp cận rất khác nhau mà Anthropic đã sử dụng để thu thập tài liệu huấn luyện. Một mặt, công ty đã chi hàng triệu đô la mua sách vật lý đã qua sử dụng, sau đó cắt nhỏ và quét thành các tệp kỹ thuật số trước khi loại bỏ bản gốc. Thẩm phán William Alsup phán quyết rằng quy trình này có tính chuyển đổi cao và đủ điều kiện là sử dụng hợp lý theo luật bản quyền.

Phương pháp Thu thập Dữ liệu của Anthropic

  • Cách tiếp cận hợp pháp: Mua hàng triệu cuốn sách đã qua sử dụng, cắt và quét chúng, sau đó loại bỏ bản gốc
  • Cách tiếp cận bất hợp pháp: Tải xuống 5 triệu cuốn sách từ Library Genesis (2021) + 2 triệu từ Pirate Library Mirror (2022)
  • Phán quyết của tòa án: Quét sách vật lý = sử dụng hợp lý; tải xuống sách lậu = vi phạm bản quyền

Chiến thắng pháp lý đi kèm với cái giá

Phán quyết về sử dụng hợp lý của thẩm phán đại diện cho một chiến thắng lớn cho ngành công nghiệp AI. Alsup so sánh việc huấn luyện AI với việc học của con người, lưu ý rằng con người luôn đọc sách, tiếp thu các chủ đề của chúng và sử dụng kiến thức đó để tạo ra các tác phẩm mới. Ông lập luận rằng việc yêu cầu thanh toán mỗi khi ai đó nhớ lại thông tin từ trí nhớ sẽ là không thể tưởng tượng được.

Tuy nhiên, chiến thắng này đi kèm với một điều kiện quan trọng. Tòa án nhận thấy rằng đồng sáng lập của Anthropic, Ben Mann, đã cố ý tải xuống ít nhất 5 triệu cuốn sách từ Library Genesis vào năm 2021, tiếp theo là thêm 2 triệu cuốn từ Pirate Library Mirror vào năm 2022. Các thông tin liên lạc nội bộ tiết lộ công ty thích ăn cắp sách để tránh những rắc rối pháp lý/thực hành/kinh doanh của việc cấp phép hợp pháp.

Câu chuyện về hai tiêu chuẩn

Phán quyết này đã gây ra cuộc tranh luận gay gắt về tính công bằng trong việc thực thi bản quyền. Nhiều thành viên cộng đồng chỉ ra sự tương phản rõ rệt giữa cách đối xử với cá nhân và doanh nghiệp đối với các vi phạm tương tự. Trong khi thanh thiếu niên phải đối mặt với các cáo buộc hình sự và tiền phạt khổng lồ vì tải xuống nhạc vào đầu những năm 2000, và Aaron Swartz phải đối mặt với việc truy tố liên bang vì tải xuống các bài báo học thuật, các tập đoàn lớn dường như chỉ phải đối mặt với các hình phạt dân sự.

Tác động tài chính tiềm năng là đáng kinh ngạc. Theo luật bản quyền tiêu chuẩn, thiệt hại theo luật định dao động từ 750 đến 150.000 đô la Mỹ cho mỗi tác phẩm bị vi phạm cố ý. Với 7 triệu cuốn sách cướp bản quyền, Anthropic về mặt lý thuyết có thể phải đối mặt với khoản bồi thường vượt quá 1 nghìn tỷ đô la Mỹ, mặc dù các chuyên gia pháp lý dự kiến bất kỳ thỏa thuận cuối cùng nào sẽ thấp hơn nhiều.

Mức phạt vi phạm bản quyền

  • Thiệt hại theo luật định tiêu chuẩn: 750 - 30.000 USD cho mỗi tác phẩm
  • Thiệt hại vi phạm cố ý: Lên đến 150.000 USD cho mỗi tác phẩm
  • Trách nhiệm pháp lý tối đa tiềm tăng của Anthropic: 1,05 nghìn tỷ USD (7 triệu tác phẩm × 150.000 USD)
  • Ngày xét xử về thiệt hại: Tháng 12 năm 2025

Tác động toàn ngành

Vụ việc này dường như chỉ là phần nổi của tảng băng chìm. Các cuộc thảo luận cộng đồng cho thấy rằng hầu hết các công ty AI lớn đều dựa vào nội dung cướp bản quyền cho dữ liệu huấn luyện, với một số chỉ ra các thực hành tương tự tại Meta, Google và các gã khổng lồ công nghệ khác. Phán quyết này thiết lập một tiền lệ rõ ràng: các công ty có thể huấn luyện mô hình AI trên tài liệu có bản quyền mà họ sở hữu hợp pháp, nhưng việc tải xuống nội dung cướp bản quyền vẫn là vi phạm bản quyền bất kể mục đích sử dụng.

Quyết định này cũng làm nổi bật căng thẳng rộng lớn hơn trong ngành công nghệ giữa đổi mới và đạo đức. Trong khi các công ty lập luận rằng việc thực thi bản quyền nghiêm ngặt sẽ kìm hãm sự phát triển AI, các nhà phê bình đặt câu hỏi tại sao một số tập đoàn giàu nhất thế giới lại phải dùng đến cướp bản quyền khi họ có thể đủ khả năng cấp phép nội dung một cách hợp pháp.

Nhìn về phía trước

Một phiên tòa xét xử bồi thẩm được lên lịch vào tháng 12 năm 2025 sẽ xác định khoản bồi thường thực tế mà Anthropic phải trả cho các cuốn sách cướp bản quyền. Công ty đã mua các bản sao hợp pháp của những cuốn sách liên quan đến vụ kiện, mặc dù thẩm phán lưu ý rằng điều này không miễn trừ cho họ khỏi vi phạm trong quá khứ.

Phán quyết này có thể buộc các công ty AI phải xem xét lại chiến lược thu thập dữ liệu của họ. Một số nhà quan sát ngành cho rằng điều này có thể dẫn đến một hệ thống hai tầng trong đó các công ty được tài trợ tốt có thể đủ khả năng cấp phép hợp pháp trong khi các đối thủ cạnh tranh nhỏ hơn bị loại khỏi thị trường. Những người khác hy vọng điều này sẽ khuyến khích phát triển các thực hành huấn luyện có đạo đức hơn và bồi thường tốt hơn cho các nhà sáng tạo nội dung.

Khi ngành công nghiệp AI tiếp tục phát triển, vụ việc này phục vụ như một lời nhắc nhở rằng ngay cả công nghệ chuyển đổi cũng phải hoạt động trong ranh giới pháp lý. Câu hỏi bây giờ là liệu các công ty AI khác sẽ học hỏi từ bài học đắt giá của Anthropic hay tiếp tục thử thách giới hạn của luật bản quyền.

Tham khảo: Anthropic cut up millions of used books to train Claude - and downloaded over 7 million pirated ones too, a judge said