Cuộc chiến về bồi thường dữ liệu huấn luyện AI đã bước vào giai đoạn mới khi các nhà xuất bản web lớn đoàn kết đằng sau một giao thức cấp phép tiêu chuẩn hóa được thiết kế để kiếm tiền từ nội dung của họ ở quy mô lớn. Nỗ lực tập thể này đại diện cho sự thay đổi đáng kể từ các cuộc đàm phán cá nhân sang sự phối hợp toàn ngành trong việc giải quyết tình trạng thu thập dữ liệu trái phép bởi các công ty trí tuệ nhân tạo.
![]() |
---|
Một robot hình người tương tác với dữ liệu trong bối cảnh tương lai, tượng trưng cho sự giao thoa giữa công nghệ AI và các nỗ lực cấp phép nội dung của các nhà xuất bản |
Really Simple Licensing Nổi Lên Như Giải Pháp Ngành
Tiêu chuẩn Really Simple Licensing ( RSL ) đã nhận được sự ủng hộ từ các nền tảng nổi bật bao gồm Reddit , Yahoo , Medium , Quora và People Inc. , cùng với các thương hiệu lớn khác như O'Reilly , wikiHow và chủ sở hữu IGN là Ziff Davis . Được phát triển bởi tổ chức phi lợi nhuận RSL Collective , giao thức mở này được xây dựng dựa trên khung robots.txt hiện có từ lâu đã quản lý hành vi của web crawler. Tiêu chuẩn này được tạo ra bởi Eckart Walther , đồng tác giả của tiêu chuẩn Really Simple Syndication ( RSS ) và cựu CEO CardSpring , cùng với Doug Leeds , cựu CEO của IAC Publishing và Ask.com .
Các Nhà Xuất Bản Lớn Hỗ Trợ Tiêu Chuẩn RSL
- Yahoo
- Medium
- Quora
- People Inc.
- O'Reilly
- wikiHow
- Ziff Davis (chủ sở hữu IGN )
Mô Hình Kiếm Tiền Linh Hoạt Cho Người Tạo Nội Dung
Khung RSL hỗ trợ nhiều cấu trúc bồi thường để phù hợp với các nhu cầu và mô hình kinh doanh khác nhau của nhà xuất bản. Các nhà xuất bản có thể triển khai truy cập dựa trên đăng ký, phí trả theo lượt thu thập được tính mỗi khi bot AI truy cập nội dung của họ, hoặc phí trả theo suy luận tạo ra doanh thu khi các mô hình AI tham chiếu công việc của họ trong các phản hồi. Hệ thống cũng hỗ trợ các tùy chọn cấp phép miễn phí và duy trì khả năng tương thích với các web crawler hiện có được sử dụng cho công cụ tìm kiếm và mục đích lưu trữ, đảm bảo chức năng internet bình thường không bị ảnh hưởng.
Các Mô Hình Cấp Phép Tiêu Chuẩn RSL
Loại Mô Hình | Mô Tả | Tạo Ra Doanh Thu |
---|---|---|
Đăng ký | Thanh toán định kỳ cố định để truy cập | Doanh thu định kỳ |
Trả phí theo lần thu thập | Phí được tính mỗi khi bot AI truy cập nội dung | Định giá dựa trên mức sử dụng |
Trả phí theo suy luận | Bồi thường khi AI tham chiếu nội dung trong phản hồi | Doanh thu dựa trên hiệu suất |
Miễn phí/Ghi nhận | Không yêu cầu thanh toán, chỉ ghi nhận nguồn | Phi tiền tệ |
Creative Commons | Các điều khoản cấp phép mở tiêu chuẩn | Thay đổi theo loại giấy phép |
Thách Thức Triển Khai Kỹ Thuật và Thực Thi
Mặc dù tiêu chuẩn này cung cấp khung kỹ thuật cho việc cấp phép, hiệu quả của nó phụ thuộc rất nhiều vào sự tham gia của công ty AI . Các nhà xuất bản nhúng các điều khoản cấp phép trực tiếp vào tệp robots.txt của họ, làm cho các yêu cầu bồi thường hiển thị với các hệ thống tự động. Tuy nhiên, tiêu chuẩn RSL một mình không thể chặn vật lý việc truy cập trái phép. Tập thể này đang hợp tác với mạng phân phối nội dung Fastly để tạo ra các cơ chế thực thi, với Fastly đóng vai trò là người gác cổng chỉ cho phép các AI crawler tuân thủ vào. Các nhà xuất bản sử dụng các nhà cung cấp CDN khác sẽ cần phải chờ đợi các giải pháp kỹ thuật bổ sung xuất hiện.
Khung Pháp Lý và Tiền Lệ Ngành
RSL Collective định vị mình tương tự như các tổ chức quyền đã được thành lập như ASCAP trong ngành công nghiệp âm nhạc, nhằm thu phí cấp phép và phân phối chúng cho các thành viên trong khi chia sẻ chi phí thực thi pháp lý. Leeds nhấn mạnh rằng hệ thống này thông báo cho các công ty AI về các điều khoản cấp phép trước khi họ truy cập các trang web, có khả năng củng cố vị thế pháp lý trong các vụ kiện vi phạm. Cách tiếp cận này xuất hiện khi ngành AI đối mặt với áp lực pháp lý ngày càng tăng, với Anthropic gần đây đồng ý trả 1,5 tỷ đô la Mỹ để giải quyết vụ kiện tập thể về việc sử dụng trái phép sách có bản quyền, và Warner Bros. kiện Midjourney vì tạo ra hình ảnh của các nhân vật có bản quyền.
Các Vụ Kiện Pháp Lý Gần Đây Trong Ngành AI
- Anthropic: Thỏa thuận bồi thường 1,5 tỷ USD vì sử dụng trái phép các cuốn sách có bản quyền
- Midjourney: Đang đối mặt với vụ kiện từ Warner Bros. vì tạo ra hình ảnh nhân vật có bản quyền
- Nhiều công ty AI: Hàng chục vụ kiện bản quyền đang chờ xử lý tại các tòa án Mỹ
Phản Ứng Ngành và Triển Vọng Tương Lai
Mặc dù chưa có công ty AI nào đồng ý với các điều khoản RSL , các nhà sáng lập của tập thể vẫn lạc quan về việc đảm bảo các quan hệ đối tác lớn. Cách tiếp cận tiêu chuẩn hóa giải quyết nhu cầu của các công ty AI về việc cấp phép hợp lý trong khi có khả năng giảm rủi ro kiện tụng. Sự phát triển này tương phản với các thỏa thuận cấp phép cá nhân hiện có giữa các công ty truyền thông như Vox Media , News Corp và The New York Times với các công ty AI như OpenAI và Amazon . Tiêu chuẩn RSL nhằm dân chủ hóa quy trình này, cho phép các nhà xuất bản và người sáng tạo nhỏ hơn tham gia vào doanh thu cấp phép AI trước đây chỉ giới hạn ở các tổ chức truyền thông lớn có sức mạnh đàm phán.