Ra mắt GPT-5 không đạt kỳ vọng khi tuyên bố "siêu trí tuệ" của OpenAI đối mặt với thực tế

Nhóm biên tập BigGo
Ra mắt GPT-5 không đạt kỳ vọng khi tuyên bố "siêu trí tuệ" của OpenAI đối mặt với thực tế

Mô hình GPT-5 được mong đợi từ lâu của OpenAI đã xuất hiện với làn sóng thất vọng, đánh dấu sự khác biệt đáng kể so với những dự đoán táo bạo của CEO Sam Altman về siêu trí tuệ sắp tới. Việc phát hành này được nhiều người coi là một cuộc kiểm tra thực tế nghiêm túc đối với những tuyên bố tham vọng nhất của ngành công nghiệp AI.

Hiệu suất kỹ thuật cho thấy kết quả trái chiều

Mô hình mới thể hiện những cải tiến từng bước trong một số lĩnh vực trong khi lại tụt hậu ở những lĩnh vực khác. GPT-5 hoạt động tốt hơn so với người tiền nhiệm GPT-4o trong các tác vụ như tạo trò chơi cờ vua và viết kịch bản video, và nó có thể phân bổ thông minh mô hình phù hợp nhất cho các tác vụ cụ thể. Tuy nhiên, nó gặp khó khăn với các tác vụ tạo hình ảnh như thumbnail YouTube và thiệp mời tiệc sinh nhật, nơi GPT-4o vẫn duy trì sự vượt trội.

Đáng lo ngại hơn là những vấn đề kỹ thuật đang làm phiền việc triển khai. Người dùng đã báo cáo về phản hồi chậm chạp, ảo giác và những lỗi đáng ngạc nhiên. Cơ chế chuyển đổi mô hình giữa GPT-5 và GPT-4o đã bị hỏng, tạo ra sự thất vọng trong số các khách hàng trả phí đã mong đợi một trải nghiệm cao cấp.

Kết quả benchmark tiết lộ tiến bộ hạn chế

Hiệu suất trên các benchmark AI được tôn trọng kể một câu chuyện nghiêm túc về khả năng của GPT-5 . Trên Abstraction and Reasoning Corpus for Artificial General Intelligence ( ARC-AGI-2 ), GPT-5 chỉ đạt 9,9%, tụt hậu đáng kể so với Grok-4 của Elon Musk ở mức 15,9%. Ngay cả trên bài kiểm tra ARC-AGI-1 cũ hơn, GPT-5 đạt độ chính xác 67,5%, không đạt được mô hình o3 của chính OpenAI , mô hình này đã đạt 76% vào tháng 12 năm 2024.

Hiệu suất lập trình mang đến một sự thất vọng khác. Trong khi GPT-5 cho thấy những cải tiến trong phân tích kho mã nguồn, việc kiểm tra tiết lộ rằng nó thực sự đại diện cho một bước lùi trong khả năng lập trình tổng thể, không thể mang lại sự tiến bộ thay đổi cuộc chơi mà nhiều người đã mong đợi.

So sánh Benchmark Cạnh tranh:

  • Grok-4 ( xAI ): 15.9% trên ARC-AGI-2
  • GPT-5 ( OpenAI ): 9.9% trên ARC-AGI-2
  • Mô hình OpenAI o3 : 76% trên ARC-AGI-1 (tháng 12 năm 2024)
  • GPT-5 : 67.5% trên ARC-AGI-1

Tình trạng khó xử của định luật mở rộng

Hiệu suất không ấn tượng của GPT-5 đã làm bùng phát lại các cuộc tranh luận về những giả định cơ bản thúc đẩy phát triển AI. Định luật mở rộng, cho rằng việc đơn giản tăng kích thước mô hình và cường độ huấn luyện sẽ liên tục cải thiện hiệu suất, dường như đang mất đi sức mạnh dự đoán của nó. Nguyên tắc này, được nêu trong nghiên cứu năm 2020 của OpenAI và dường như được xác nhận bởi thành công của GPT-3 , có thể không còn đúng nữa.

Các nhà quan sát ngành lưu ý rằng trong khi GPT-3 lớn gấp mười lần GPT-2 với những bước nhảy hiệu suất tương ứng, các mô hình gần đây cho thấy lợi nhuận giảm dần bất chấp những khoản đầu tư tài nguyên khổng lồ. Ẩn dụ về phát triển AI đã chuyển từ việc xây dựng những chiếc xe tốt hơn thông qua tiền huấn luyện sang trở thành thợ máy tập trung vào những cải tiến hậu huấn luyện.

Sự phản đối từ giới học thuật chống lại sự cường điệu AI

Các nhà nghiên cứu ngày càng thách thức những tuyên bố của ngành về khả năng lập luận AI. Nghiên cứu gần đây của Apple kết luận rằng các mô hình lập luận lớn không thể lập luận một cách nhất quán theo bất kỳ nghĩa nào có ý nghĩa, trở nên thất thường khi đối mặt với các vấn đề phức tạp. Nghiên cứu phát hiện rằng những mô hình này trải qua sự sụp đổ hoàn toàn về độ chính xác vượt quá những phức tạp nhất định.

Các nhà nghiên cứu của Đại học Bang Arizona cũng đã bác bỏ nhận thức về lập luận có chủ ý trong các mô hình AI. Họ mô tả những đầu ra chuỗi suy nghĩ dài dòng như một ảo ảnh mong manh biến mất khi bị đẩy ra ngoài phân phối huấn luyện, cho thấy rằng khả năng lập luận rõ ràng thì hời hợt hơn chúng xuất hiện.

Tác động kinh tế của tiến bộ đình trệ

Những tác động mở rộng xa hơn sự thất vọng kỹ thuật. Nếu định luật mở rộng thực sự đã thất bại, nền kinh tế AI có thể nhỏ hơn đáng kể so với dự kiến. Các nhà phân tích hiện ước tính thị trường AI tạo sinh có thể đạt 50-100 tỷ đô la Mỹ thay vì những định giá hàng nghìn tỷ đô la đã thúc đẩy cơn sốt đầu tư gần đây.

Việc đánh giá lại này diễn ra vào thời điểm quan trọng khi các công ty công nghệ lớn đã đầu tư 560 tỷ đô la Mỹ vào AI trong 18 tháng qua trong khi chỉ tạo ra 35 tỷ đô la Mỹ doanh thu liên quan. Với khoảng 35% giá trị thị trường chứng khoán Mỹ gắn liền với bảy gã khổng lồ công nghệ đầu tư mạnh vào AI, cổ phần cho tiến bộ liên tục vẫn còn rất lớn.

Đầu tư so với Doanh thu trong Ngành AI (18 tháng qua):

  • Tổng Đầu tư AI: 560 tỷ USD
  • Doanh thu AI Tạo ra: 35 tỷ USD
  • Tỷ lệ Đầu tư trên Doanh thu: 16:1

Nhìn về phía trước

Việc ra mắt GPT-5 đóng vai trò như một thời điểm bước ngoặt cho mối quan hệ của ngành công nghiệp AI với thực tế. Trong khi mô hình đại diện cho tiến bộ kỹ thuật thực sự, nó còn xa so với bước đột phá cách mạng mà lời nói về siêu trí tuệ của Altman đã hứa hẹn. Khi ngành đang vật lộn với những hạn chế của các phương pháp hiện tại, trọng tâm có thể chuyển hướng về những kỳ vọng thực tế hơn và các ứng dụng thực tiễn thay vì những tuyên bố biến đổi về trí tuệ nhân tạo tổng quát.