Sự ra mắt được mong đợi của GPT-5 từ OpenAI vào ngày 7 tháng 8 năm 2025 đã gây ra cuộc tranh luận rộng rãi về định hướng của công ty và tương lai của việc phát triển trí tuệ nhân tạo. Điều được kỳ vọng sẽ là một khoảnh khắc đột phá thay vào đó lại làm nổi bật những xu hướng đáng lo ngại trong cả tiến bộ kỹ thuật và chiến lược kinh doanh.
Hiệu suất Kỹ thuật Không Đạt Kỳ vọng
GPT-5 tiếp tục gặp khó khăn với các tác vụ lý luận cơ bản đã từ lâu làm khổ các mô hình ngôn ngữ lớn. Bài kiểm tra blueberry khét tiếng - đếm các chữ cái trong từ blueberry - vẫn chưa được giải quyết, với mô hình tự tin đưa ra các câu trả lời sai. Sự thất bại này đặc biệt nổi bật khi CEO Sam Altman mô tả GPT-5 như một chuyên gia cấp tiến sĩ trong túi của bạn.
Cộng đồng đã xác định rằng OpenAI hiện sử dụng nhiều mô hình trong họ GPT-5 , với một hệ thống định tuyến hướng các yêu cầu đến các phiên bản khác nhau. Trong khi một số mô hình suy nghĩ có thể xử lý các tác vụ đếm chữ cái một cách chính xác, mô hình chat chính vẫn thất bại ở những thách thức cơ bản này. Sự không nhất quán này đặt ra câu hỏi về độ tin cậy cần thiết cho các ứng dụng nghiêm túc.
Cấu trúc họ mô hình GPT-5:
- gpt-5-chat (gpt-5-main): Phản hồi nhanh, mô hình không có khả năng suy nghĩ và thất bại trong các bài kiểm tra lý luận cơ bản
- gpt-5-nano: Mô hình có khả năng suy nghĩ có thể giải quyết chính xác các tác vụ đếm chữ cái
- Hai mô hình suy nghĩ bổ sung khác chưa được đặt tên trong họ mô hình này
- Hệ thống định tuyến điều hướng các yêu cầu đến mô hình phù hợp dựa trên loại truy vấn
Mô hình Kinh doanh Cho thấy Dấu hiệu Tuyệt vọng
Có lẽ đáng lo ngại hơn những hạn chế kỹ thuật là các quyết định kinh doanh được tiết lộ trong buổi ra mắt. OpenAI thông báo họ sẽ tính phí cho việc tùy chỉnh màu sắc chat - một tính năng đã thu hút sự chỉ trích đáng kể từ cộng đồng công nghệ. Động thái này báo hiệu một công ty đang vật lộn để kiếm tiền từ cơ sở người dùng theo những cách ngày càng tầm thường.
Nếu bạn thực sự vừa ra mắt một chuyên gia cấp tiến sĩ trong túi của mình, thì màu sắc của các bong bóng chat người dùng không phải là điều bạn sẽ tập trung vào.
Công ty tiếp tục đốt tiền cho mỗi yêu cầu trong khi đối mặt với sự cạnh tranh gay gắt từ Google , Anthropic và các đối thủ được tài trợ tốt khác. Không giống như các công ty như Uber cuối cùng đã tìm thấy lợi nhuận, kinh tế cơ bản của OpenAI vẫn đầy thách thức, không có con đường rõ ràng nào đến lợi nhuận bền vững do chi phí cơ sở hạ tầng khổng lồ của họ.
Các chỉ số kinh doanh được đề cập:
- Cursor IDE : doanh thu định kỳ hàng năm 500 triệu USD
- OpenAI : doanh thu hàng tỷ USD một chữ số so với chi phí hàng trăm tỷ USD
- Doanh thu AI của Microsoft 2025: 13 tỷ USD (với 10 tỷ từ OpenAI ở mức giá hòa vốn)
- Chi tiêu vốn AI năm 2025 của các công ty công nghệ lớn: 70-105 tỷ USD mỗi công ty
Rủi ro Nền tảng và Mối đe dọa Cạnh tranh
Buổi thuyết trình chính cũng thể hiện chiến lược sherlocking của OpenAI - tích hợp các tính năng từ các nhà phát triển bên thứ ba thành công vào nền tảng chính của họ. Cursor , một IDE lập trình được hỗ trợ bởi AI đã đạt 500 triệu đô la Mỹ doanh thu hàng năm định kỳ, đã chứng kiến OpenAI dành 27 phút để giới thiệu các công cụ lập trình tương tự trong ChatGPT . Cách tiếp cận này đe dọa cả các đối tác kinh doanh API của họ và sự phát triển hệ sinh thái của chính họ.
Sự Kết thúc của Cơn sốt AGI
Đáng chú ý là thông điệp AGI (Trí tuệ Nhân tạo Tổng quát) tích cực đã đặc trưng cho các sự kiện OpenAI trước đây đã vắng mặt trong buổi thuyết trình. Công ty dường như đang lùi bước khỏi các tuyên bố về những đột phá sắp xảy ra, thay vào đó tập trung vào các cải tiến từng bước và nâng cao giao diện người dùng. Sự thay đổi này cho thấy sự nhận thức nội bộ rằng các phương pháp mở rộng hiện tại có thể đã chạm đến những hạn chế cơ bản.
Cộng đồng công nghệ ngày càng hoài nghi về các tuyên bố AGI táo bạo, đặc biệt là do thành tích của các giám đốc điều hành như Sam Altman , người có những dự đoán trước đây liên tục thất bại trong việc hiện thực hóa. Khoảng cách giữa lời hứa tiếp thị và khả năng được giao vẫn tiếp tục mở rộng.
Các Hạn Chế Kỹ Thuật Đã Được Xác Định:
- Đếm chữ cái trong từ (bài kiểm tra blueberry): Vẫn thất bại trên mô hình chat chính
- Độ chính xác khi vẽ bản đồ: Kích thước bang không chính xác ( Maine được ghi nhãn là 89, Oregon là 1)
- Kiến thức về Pokemon : Thông tin kháng thuộc tính không chính xác
- Các tác vụ suy luận cơ bản: Hiệu suất không nhất quán giữa các biến thể mô hình
Kết luận
Sự ra mắt của GPT-5 đại diện cho một bước ngoặt đối với OpenAI và ngành công nghiệp AI rộng lớn hơn. Thay vì thể hiện tiến bộ cách mạng mà nhiều người mong đợi, nó tiết lộ một công ty đang vật lộn với các cao nguyên kỹ thuật, kinh tế không bền vững và thách thức duy trì niềm tin của nhà đầu tư. Trong khi công nghệ vẫn hữu ích cho nhiều ứng dụng, giấc mơ về tiến bộ nhanh chóng hướng tới AI cấp độ con người dường như ngày càng xa vời. Trọng tâm giờ đây có thể chuyển từ việc theo đuổi AGI sang xây dựng các doanh nghiệp bền vững xung quanh các khả năng hiện tại.
Tham khảo: The GPT-5 Launch Was Concerning