OpenAI đã khẳng định lại vị thế dẫn đầu trong lĩnh vực tạo video AI với việc ra mắt Sora 2, phiên bản kế nhiệm được cải tiến đáng kể so với mô hình tạo video gốc. Ứng dụng iOS mới đã nhanh chóng leo lên vị trí số một trên App Store của Apple tại Mỹ, cho thấy nhu cầu chưa từng có đối với khả năng video AI tiên tiến mặc dù chỉ có thể truy cập thông qua mã mời.
Tình trạng có sẵn và Giá cả:
- Nền tảng: Chỉ trên iOS (ban đầu tại Mỹ và Canada)
- Truy cập: Hệ thống chỉ theo lời mời
- Giá cả: Ban đầu miễn phí với giới hạn hào phóng
- Cao cấp: Người dùng ChatGPT Pro được truy cập vào mô hình Sora 2 Pro
- Truy cập web: Có sẵn thông qua sora.com cho người dùng được mời
Bước tiến kỹ thuật lớn
Sora 2 đại diện cho cái mà OpenAI mô tả là một bước nhảy vọt thế hệ có thể so sánh với quá trình chuyển đổi từ GPT-1 sang GPT-3.5. Mô hình mới thể hiện khả năng hiểu vật lý được cải thiện đáng kể, cho phép chuyển động và di chuyển thực tế hơn trong các video được tạo ra. Không giống như phiên bản tiền nhiệm gặp khó khăn với các tình huống phức tạp như cảnh nhảy dù dẫn đến khuôn mặt biến dạng và dù biến mất, Sora 2 xử lý các chuyển động phức tạp với độ chính xác đáng chú ý.
Hệ thống hiện tạo ra âm thanh đồng bộ cùng với nội dung video, tạo ra trải nghiệm đa phương tiện hoàn chỉnh từ một lời nhắc văn bản duy nhất. Sự tích hợp này cho phép người dùng sản xuất nội dung với hiệu ứng âm thanh phù hợp, lồng tiếng và thậm chí khả năng đồng bộ môi phù hợp với các yếu tố hình ảnh một cách liền mạch.
Những cải tiến kỹ thuật so với Sora gốc:
- Mô phỏng vật lý và độ chính xác chuyển động tốt hơn
- Tích hợp tạo âm thanh với đồng bộ hóa môi
- Cải thiện khả năng xử lý các cảnh phức tạp với nhiều yếu tố
- Nâng cao chất lượng kết xuất đặc điểm khuôn mặt và chuyển động tóc
- Khả năng duy trì đối tượng ổn định hơn (giảm ảo giác)
- Hỗ trợ nhiều hiệu ứng video khác nhau (CCTV, biến dạng fisheye)
Tích hợp người thật gây tranh cãi
Một trong những tính năng được bàn tán nhiều nhất của Sora 2 là khả năng tạo video có sự xuất hiện của người thật, bao gồm các nhân vật công chúng và chính người dùng. Khả năng này đã tạo ra cả sự phấn khích lẫn lo ngại, vì nó cho phép tạo ra deepfake đồng thời mở ra những khả năng sáng tạo mới. Người dùng đã tạo ra nhiều video có sự xuất hiện của CEO OpenAI Sam Altman trong các tình huống khác nhau, làm nổi bật cả tiềm năng của công nghệ và những tác động đạo đức của nó.
Tính năng này cho phép người dùng tải lên hình ảnh tham khảo và xem các trang phục hoặc tình huống khác nhau có thể trông như thế nào trên những cá nhân cụ thể, gợi ý các ứng dụng thực tế trong ngành thời trang, giải trí và tiếp thị.
Những minh chứng sáng tạo ấn tượng
Những người dùng đầu tiên đã thể hiện tính linh hoạt của Sora 2 thông qua một loạt các dự án sáng tạo. Nền tảng này thành công trong việc tạo ra mọi thứ từ quảng cáo ô tô thực tế hoàn chỉnh với lồng tiếng chuyên nghiệp đến nội dung siêu thực như chương trình nấu ăn của người ngoài hành tinh với đối thoại đồng bộ. Một minh chứng đặc biệt ấn tượng cho thấy một clip chất lượng phim dystopian với biểu cảm khuôn mặt chi tiết, chuyển động tóc tự nhiên và các yếu tố nền phức tạp thường gây vấn đề cho các trình tạo video AI.
Hệ thống xử lý các tình huống thách thức như video tổng hợp sự cố kiểu CCTV, hoàn chỉnh với lớp phủ dấu thời gian, hiệu ứng biến dạng fisheye và suy giảm hình ảnh phù hợp mô phỏng camera an ninh chất lượng thấp.
Các tính năng chính của Sora 2:
- Tạo âm thanh và video đồng bộ từ một lời nhắc văn bản duy nhất
- Tích hợp người thật với khả năng tải lên ảnh tham chiếu
- Hiểu biết vật lý nâng cao để tạo chuyển động chân thực
- Nhiều tùy chọn phong cách: điện ảnh, hoạt hình, siêu thực
- Khả năng chia sẻ mạng xã hội và remix video
- Hỗ trợ giọng nói con người và hiệu ứng âm thanh
Tính khả dụng hạn chế tạo nhu cầu cao
Mặc dù phổ biến, Sora 2 vẫn chỉ có thể truy cập thông qua hệ thống chỉ theo lời mời, tạo ra áp lực nhu cầu đáng kể. Ứng dụng ra mắt độc quyền cho các thiết bị iOS tại Hoa Kỳ và Canada, với kế hoạch mở rộng quốc tế nhanh chóng. Người dùng không có mã mời phải yêu cầu quyền truy cập, mặc dù OpenAI chưa chỉ định thời gian chờ dự kiến.
Công ty ban đầu cung cấp dịch vụ miễn phí với giới hạn sử dụng hào phóng, mặc dù những điều này vẫn phụ thuộc vào các ràng buộc tính toán. Người đăng ký ChatGPT Pro có quyền truy cập vào mô hình Sora 2 Pro chất lượng cao thử nghiệm thông qua giao diện web, với việc tích hợp ứng dụng di động được lên kế hoạch cho tương lai.
Vị thế thị trường và cạnh tranh
Việc ra mắt Sora 2 diễn ra sau một thời kỳ mà các đối thủ cạnh tranh đã giành được lợi thế trong không gian tạo video AI. Mô hình Sora gốc, mặc dù tiên phong, đã bị vượt qua bởi các sản phẩm mới hơn từ các công ty khác. Bản phát hành mới nhất này dường như được thiết kế để khẳng định lại sự thống trị của OpenAI trong thị trường video AI đang phát triển nhanh chóng, kết hợp các cải tiến kỹ thuật với các tính năng gây tranh cãi giúp phân biệt nó với các lựa chọn thay thế.
Khả năng của nền tảng trong việc tạo ra nội dung tham chiếu các chương trình truyền hình và phim hiện có, mặc dù phức tạp về mặt pháp lý và đạo đức, cung cấp tính linh hoạt sáng tạo giúp nó khác biệt so với các đối thủ cạnh tranh hạn chế hơn.