Google đã âm thầm sử dụng thư viện video khổng lồ của YouTube để huấn luyện các mô hình AI tiên tiến, bao gồm cả trình tạo video Veo 3 được công bố gần đây. Tiết lộ này đã gây ra cuộc thảo luận sôi nổi về quyền của nhà sáng tạo, bồi thường công bằng và sức mạnh ngày càng tăng của các gã khổng lồ công nghệ trong kỷ nguyên AI.
Thực tiễn này ảnh hưởng đến hàng triệu nhà sáng tạo nội dung tiềm năng tải video lên YouTube hàng ngày, với nhiều người chỉ mới phát hiện gần đây rằng tác phẩm của họ góp phần huấn luyện các hệ thống cuối cùng có thể cạnh tranh với chính họ. Điều đặc biệt đáng lo ngại là quy mô và tác động đối với ngành công nghiệp sáng tạo.
Quy mô YouTube và Dữ liệu Huấn luyện AI
- Tổng số video YouTube : 20 tỷ
- Tải lên hàng ngày: 20 triệu video
- Huấn luyện chỉ với 1% sẽ tương đương 2,3 tỷ phút nội dung
- Điều này đại diện cho lượng dữ liệu huấn luyện nhiều gấp 40 lần so với các mô hình AI cạnh tranh khác sử dụng
Thực Tế Sản Phẩm vs Khách Hàng
Tình huống này làm nổi bật sự thay đổi cơ bản trong cách các nền tảng kỹ thuật số hoạt động. Các cuộc thảo luận cộng đồng cho thấy nhận thức ngày càng tăng rằng người dùng đã trở thành sản phẩm bất kể họ có trả tiền cho dịch vụ hay không. Điều này mở rộng ra ngoài YouTube đến nhiều dịch vụ kỹ thuật số hiện đại khác nơi dữ liệu và nội dung người dùng tạo ra giá trị cho các công ty.
Câu nói truyền thống nếu bạn không trả tiền, bạn chính là sản phẩm không còn nắm bắt được toàn bộ bức tranh. Ngay cả khách hàng trả tiền thường thấy dữ liệu của họ bị kiếm tiền, như thấy với TV thông minh giảm giá bằng cách bán dữ liệu xem, hoặc đại lý ô tô thu lợi nhuận từ thông tin khách hàng sau khi bán xe.
Lợi Thế Cấu Trúc Của Google Tạo Ra Cạnh Tranh Không Công Bằng
Các nhà phê bình chỉ ra vị thế thị trường áp đảo của Google trên nhiều lĩnh vực tạo ra lợi thế cạnh tranh không thể vượt qua. Công ty kiểm soát tìm kiếm web, nền tảng di động, quảng cáo, và giờ đây tận dụng tất cả những tài sản này để phát triển AI. Cách tiếp cận tích hợp này cho phép Google sử dụng nội dung từ một dịch vụ để nâng cao sản phẩm có thể cạnh tranh với các nhà sáng tạo ban đầu.
Họ sẽ loại bỏ rất nhiều doanh nghiệp trong thập kỷ này và thu về tất cả tiền. Không có đồng đô la nào được tạo ra mà không chảy qua Google bằng cách nào đó.
Quy mô là đáng kinh ngạc - với 20 tỷ video có sẵn và 20 triệu video tải lên mới hàng ngày, ngay cả việc huấn luyện chỉ trên 1% danh mục của YouTube cũng cung cấp dữ liệu nhiều hơn rất nhiều so với các mô hình AI cạnh tranh sử dụng.
Kiểm Soát Hạn Chế Của Nhà Sáng Tạo và Ranh Giới Không Rõ Ràng
Trong khi YouTube cho phép các nhà sáng tạo từ chối huấn luyện bởi một số công ty bên thứ ba như Amazon, Apple và Nvidia, họ không thể ngăn Google sử dụng nội dung của họ để phát triển AI riêng. Điều khoản dịch vụ của nền tảng cấp cho YouTube quyền cấp phép rộng rãi, nhưng nhiều nhà sáng tạo báo cáo không biết nội dung của họ sẽ được sử dụng rộng rãi đến mức nào.
Các công cụ tồn tại để các nhà sáng tạo yêu cầu gỡ bỏ nội dung do AI tạo ra bắt chước hình ảnh của họ, nhưng phản hồi cộng đồng cho thấy những hệ thống này không đáng tin cậy. Điều này tạo ra tình huống bực bội khi các nhà sáng tạo thấy phiên bản do AI tạo ra của tác phẩm họ lưu hành mà không có biện pháp khắc phục hiệu quả.
Hạn chế quyền từ chối của người sáng tạo
- Có thể từ chối: Huấn luyện AI của Amazon , Apple , Nvidia
- Không thể từ chối: Huấn luyện mô hình AI riêng của Google
- Không có cách nào ngăn chặn việc sử dụng nội dung YouTube cho Gemini và Veo 3 của Google
Tác Động Rộng Lớn Hơn Đối Với Các Ngành Công Nghiệp Sáng Tạo
Thực tiễn này đặt ra câu hỏi về tương lai của công việc sáng tạo và bồi thường công bằng. Khi các hệ thống AI được huấn luyện trên nội dung nhà sáng tạo sản xuất tài liệu cạnh tranh, các nhà sáng tạo ban đầu không nhận được tín dụng, sự đồng ý, hoặc bồi thường cho đóng góp của họ vào quá trình huấn luyện.
Một số nhà sáng tạo chấp nhận AI như cạnh tranh thân thiện và tiến bộ công nghệ không thể tránh khỏi. Tuy nhiên, những người khác lo lắng về sinh kế của họ khi nội dung do AI tạo ra trở nên tinh vi hơn và có khả năng thay thế tài liệu do con người tạo ra.
Tình huống phản ánh căng thẳng rộng lớn hơn trong ngành AI, nơi các công ty chạy đua để huấn luyện mô hình trên các bộ dữ liệu khổng lồ trong khi các nhà sáng tạo và chủ sở hữu quyền đấu tranh để duy trì quyền kiểm soát tài sản trí tuệ của họ. Các vụ kiện gần đây từ các hãng phim lớn chống lại các trình tạo hình ảnh AI cho thấy cuộc chiến này chỉ mới bắt đầu.
Khi khả năng AI tiếp tục tiến bộ, mối quan hệ giữa nền tảng, nhà sáng tạo và phát triển AI có thể sẽ yêu cầu khung mới cân bằng tốt hơn giữa đổi mới với quyền nhà sáng tạo và bồi thường công bằng.
Tham khảo: Creators say they didn't know Google uses YouTube to train AI