Thẩm phán Liên bang Phán quyết Huấn luyện AI trên Sách là Sử dụng Hợp lý, nhưng Các Mô hình Mở Đối mặt với Tương lai Bất định

Nhóm Cộng đồng BigGo
Thẩm phán Liên bang Phán quyết Huấn luyện AI trên Sách là Sử dụng Hợp lý, nhưng Các Mô hình Mở Đối mặt với Tương lai Bất định

Một phán quyết của tòa án liên bang có lợi cho Anthropic đã tuyên bố rằng việc huấn luyện các mô hình AI trên những cuốn sách đã xuất bản mà không có sự cho phép của tác giả là sử dụng hợp lý theo luật bản quyền. Tuy nhiên, quyết định này đã gây ra cuộc tranh luận gay gắt về tương lai của các mô hình AI mở và đặt ra câu hỏi về điều gì phân biệt việc huấn luyện AI hợp pháp với việc vi phạm bản quyền.

Phán quyết của Thẩm phán William Orrick xác định rằng các công ty AI có thể hợp pháp huấn luyện mô hình của họ trên các tác phẩm có bản quyền, với điều kiện họ thực hiện các biện pháp bảo vệ thích hợp. Quyết định này dựa trên một sự phân biệt quan trọng: trong khi các mô hình AI có thể ghi nhớ những phần đáng kể của các tác phẩm có bản quyền, các công ty như Anthropic có thể tránh vi phạm bằng cách sử dụng bộ lọc phía máy chủ để ngăn người dùng trích xuất nội dung đã ghi nhớ.

Các Phân Biệt Pháp Lý Quan Trọng:

  • Huấn luyện mô hình AI trên sách có bản quyền = Sử dụng hợp lý (với việc lọc phù hợp)
  • Sử dụng bản sao lậu để huấn luyện = Vi phạm bản quyền
  • Lọc phía máy chủ = Bảo vệ pháp lý cho các mô hình đóng
  • Mô hình trọng số mở không có lọc = Vi phạm bản quyền tiềm tàng

Tình thế Khó xử của Mô hình Mở

Phán quyết này tạo ra một thách thức đáng kể cho các mô hình AI mở như dòng Llama của Meta . Không giống như các hệ thống đóng có thể kiểm soát đầu ra thông qua các bộ lọc phía máy chủ, các mô hình mở có thể được tải xuống và chạy cục bộ mà không có bất kỳ hạn chế nội dung nào. Điều này có nghĩa là người dùng có thể trích xuất tài liệu có bản quyền đã ghi nhớ trực tiếp từ trọng số mô hình.

Các cuộc thảo luận trong cộng đồng công nghệ cho thấy mối lo ngại ngày càng tăng rằng khung pháp lý này có thể loại bỏ hiệu quả các mô hình AI mã nguồn mở có khả năng rộng rãi. Chi phí để có được hợp pháp các tài liệu huấn luyện cho các hệ thống AI toàn diện có thể đòi hỏi sự hỗ trợ trị giá hàng triệu đô la Mỹ , tạo ra những rào cản đáng kể cho các nhà phát triển và nhà nghiên cứu nhỏ hơn.

Tác động đến các loại mô hình AI:

  • Mô hình đóng ( ChatGPT , Claude ): Được bảo vệ bởi bộ lọc phía máy chủ, có thể tiếp tục thực hành hiện tại
  • Mô hình trọng số mở ( Llama , v.v.): Đối mặt với nguy cơ tuyệt chủng do không thể kiểm soát đầu ra
  • Chi phí đào tạo: Việc thu thập bộ dữ liệu hợp pháp có thể tốn hàng triệu USD cho các mô hình toàn diện

Vấn đề Vi phạm Bản quyền Vẫn Chưa được Giải quyết

Trong khi tòa án phán quyết có lợi về khía cạnh huấn luyện, Anthropic vẫn phải đối mặt với một phiên tòa riêng biệt vì sử dụng các bản sao vi phạm bản quyền của sách trong quá trình huấn luyện ban đầu của họ. Thẩm phán Alsup đã làm rõ rằng việc mua các bản sao hợp pháp sau đó không miễn trừ trách nhiệm của công ty đối với việc vi phạm bản quyền ban đầu, mặc dù có thể giảm thiệt hại theo luật định.

Sự phân biệt này giữa các phương pháp huấn luyện hợp pháp và việc thu thập dữ liệu bất hợp pháp có thể định hình lại cách các công ty AI tiếp cận việc tạo tập dữ liệu. Phán quyết cho thấy rằng các công ty phải có được các bản sao hợp pháp của các tác phẩm có bản quyền trước khi huấn luyện, tương tự như cách Google Books hoạt động với các thỏa thuận cấp phép thích hợp.

Tác động đối với Ngành Công nghiệp AI

Quyết định này đại diện cho một chiến thắng đáng kể cho các công ty AI lớn trong khi có thể tạo ra những rào cản mới cho việc phát triển mã nguồn mở. Các chuyên gia cộng đồng lưu ý rằng phán quyết này không tạo ra tiền lệ ràng buộc vì nó đến từ một tòa án quận, nhưng nó cung cấp một lộ trình cho các thẩm phán khác đối mặt với các vụ án tương tự.

Các mô hình mở có khả năng rộng rãi đang trên đường bị tiêu diệt. Chi phí để có được hợp pháp tất cả các tài liệu huấn luyện sẽ đòi hỏi sự hỗ trợ tài chính lớn.

Phán quyết cũng đặt ra câu hỏi về khả năng cạnh tranh quốc tế, vì các quốc gia có cách tiếp cận thực thi bản quyền khác nhau có thể có được lợi thế trong phát triển AI. Khung pháp lý này có thể đẩy nhiều phát triển AI hơn về phía các khu vực pháp lý có luật sở hữu trí tuệ khoan dung hơn.

Vụ án này làm nổi bật căng thẳng đang diễn ra giữa việc bảo vệ quyền của người sáng tạo và thúc đẩy đổi mới công nghệ. Khi khả năng AI tiếp tục phát triển, các tòa án và nhà làm luật sẽ cần cân bằng những lợi ích cạnh tranh này trong khi đảm bảo bồi thường công bằng cho những người sáng tạo nội dung mà công việc của họ tạo điều kiện cho những hệ thống mạnh mẽ này.

Tham khảo: A federal judge sides with Anthropic in lawsuit over training AI on books without authors' permission