OpenAI ra mắt trình tạo video Sora 2 với khả năng âm thanh giữa những lo ngại về deepfake và bản quyền

Nhóm biên tập BigGo

OpenAI ra mắt trình tạo video Sora 2 với khả năng âm thanh giữa những lo ngại về deepfake và bản quyền

OpenAI đã chính thức ra mắt Sora 2, mô hình AI video và âm thanh thế hệ tiếp theo, đánh dấu một bước tiến đáng kể trong việc tạo nội dung bằng trí tuệ nhân tạo. Nền tảng mới giới thiệu khả năng tạo video được cải tiến cùng với một ứng dụng chuyên dụng cho phép người dùng tạo, chia sẻ và remix các video được tạo bởi AI một cách dễ dàng chưa từng có.

Các tính năng chính của Sora 2:

Âm thanh được tạo bởi AI đồng bộ với nội dung video
Cải thiện khả năng kết xuất chuyển động siêu thực
Tính năng "Cameos" cho phép người dùng chèn bản thân thông qua ghi âm xác minh
Ứng dụng chuyên dụng để tạo, chia sẻ và remix
Các tính năng xã hội để remix các sáng tạo của bạn bè

Tạo video nâng cao với tích hợp âm thanh

Sora 2 đại diện cho một cải tiến đáng kể so với phiên bản tiền nhiệm, giới thiệu khả năng tạo âm thanh bằng AI đồng bộ với nội dung video. Mô hình này thể hiện khả năng kết xuất chuyển động siêu thực được cải thiện và giới thiệu tính năng cameos mới lạ, cho phép người dùng chèn chính mình vào các video được tạo bởi AI thông qua quy trình ghi âm xác minh đơn giản. Những tiến bộ này định vị Sora 2 như một công cụ tạo đa phương tiện toàn diện, thu hẹp khoảng cách giữa sản xuất video chuyên nghiệp và công nghệ tiêu dùng dễ tiếp cận.

Người dùng áp dụng ngay lập tức và nội dung viral

Việc ra mắt nền tảng đã tạo ra sự tương tác ngay lập tức từ người dùng, với clip phổ biến nhất được báo cáo là một video giám sát giả mạo về CEO OpenAI Sam Altman đang ăn cắp card đồ họa. Được tạo bởi nhà nghiên cứu OpenAI Gabriel Petersson, deepfake hài hước này cho thấy bản sao kỹ thuật số của Altman nói Làm ơn, tôi thực sự cần cái này cho suy luận Sora—video này quá tuyệt trong khi ôm chặt các card đồ họa từ một màn hình có nhãn gratics cards do AI vẫn gặp khó khăn với độ chính xác kết xuất văn bản.


CEO OpenAI Sam Altman tham gia vào một cuộc thảo luận nghiêm túc khi nội dung do người dùng tạo ra xung quanh Sora 2 gây ra một cuộc tranh cãi hài hước

Thách thức về bản quyền và kiểm duyệt nội dung

Việc ra mắt Sora 2 đã làm dấy lên những lo ngại đáng kể về bảo vệ bản quyền và kiểm duyệt nội dung. Nền tảng yêu cầu các chủ sở hữu bản quyền phải chủ động từ chối việc sử dụng tài liệu của họ trong các video được tạo bởi AI, đặt gánh nặng bảo vệ lên các chủ sở hữu tài sản trí tuệ thay vì triển khai các biện pháp bảo vệ chủ động. Các báo cáo cho thấy người dùng có thể tạo nội dung có các nhân vật có bản quyền bao gồm Pikachu, SpongeBob SquarePants và các nhân vật từ The Simpsons, làm nổi bật các lỗ hổng pháp lý tiềm ẩn.

Hạn chế Kỹ thuật:

Vẫn tiếp tục gặp khó khăn trong việc hiển thị văn bản chính xác
Không có dấu watermark AI trên các video đầu ra
Yêu cầu chủ sở hữu bản quyền phải chủ động từ chối thay vì chọn tham gia
Tiềm năng tạo ra nội dung có các nhân vật được bảo hộ bản quyền

Tính năng an toàn và kiểm soát của phụ huynh

OpenAI đã triển khai kiểm soát của phụ huynh thông qua tích hợp ChatGPT, cho phép phụ huynh tùy chỉnh trải nghiệm của thanh thiếu niên với các nguồn cấp dữ liệu không cá nhân hóa, kiểm soát tin nhắn trực tiếp và quản lý luồng nội dung. Tuy nhiên, các video Sora 2 thiếu watermark cho biết việc tạo bằng AI, làm dấy lên lo ngại về khả năng lan truyền thông tin sai lệch. Nghiên cứu gần đây của Microsoft cho thấy mọi người gặp khó khăn trong việc nhận diện hình ảnh được tạo bởi AI 62% thời gian, làm gia tăng những lo ngại này về tiềm năng của nền tảng trong việc tạo nội dung thuyết phục nhưng giả mạo.

Tính năng An toàn và Kiểm duyệt:

Kiểm soát của phụ huynh thông qua tích hợp ChatGPT
Tùy chọn nguồn cấp dữ liệu không cá nhân hóa cho thanh thiếu niên
Kiểm soát tin nhắn trực tiếp cho trẻ vị thành niên
Khả năng quản lý luồng nội dung

Hạn chế kỹ thuật và tác động tương lai

Mặc dù có những cải tiến đáng kể, Sora 2 vẫn thể hiện các hạn chế kỹ thuật, đặc biệt trong độ chính xác kết xuất văn bản. Khả năng của nền tảng trong việc tạo nội dung trông thực tế mô tả các hoạt động nguy hiểm mà không có tuyên bố từ chối trách nhiệm AI rõ ràng đã gây ra lo ngại về tác hại tiềm ẩn, đặc biệt trong số người xem trẻ tuổi có thể cố gắng bắt chước các pha nguy hiểm không thể thực hiện được trong các video được tạo bởi AI.

Bối cảnh thị trường và tác động ngành

Việc ra mắt diễn ra giữa các cuộc thảo luận rộng rãi hơn về tác động của AI đối với việc làm, với nghiên cứu gần đây từ Yale's Budget Lab và Brookings Institution không tìm thấy bằng chứng về sự gián đoạn đáng kể của thị trường việc làm kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022. Bối cảnh này cho thấy rằng trong khi các công cụ AI như Sora 2 đang phát triển nhanh chóng, tác động xã hội rộng lớn hơn của chúng có thể diễn ra từ từ hơn so với dự đoán ban đầu. Việc giới thiệu nền tảng trùng hợp với việc gia tăng tiết lộ của doanh nghiệp về các rủi ro liên quan đến AI, với 72% các công ty S&P 500 hiện đang nêu các lo ngại liên quan đến AI trong hồ sơ của họ, tăng từ chỉ 12% vào năm 2023.

Tin tức liên quan

‌

‌
‌

‌

‌
‌

‌