Việc Ra Mắt GPT-5 Của OpenAI Đối Mặt Với Phản Ứng Dữ Dội Từ Người Dùng Do Gỡ Bỏ Mô Hình Và Vấn Đề Hiệu Suất

Nhóm biên tập BigGo

Việc Ra Mắt GPT-5 Của OpenAI Đối Mặt Với Phản Ứng Dữ Dội Từ Người Dùng Do Gỡ Bỏ Mô Hình Và Vấn Đề Hiệu Suất

Việc phát hành GPT-5 được mong đợi từ lâu của OpenAI đã gây ra tranh cãi đáng kể trong vòng 24 giờ kể từ khi ra mắt, khi người dùng bày tỏ sự bất mãn rộng rãi với cả hiệu suất của mô hình mới và quyết định của công ty gỡ bỏ quyền truy cập vào các phiên bản trước đó mà không có cảnh báo. Việc triển khai, vốn được dự định để giới thiệu hệ thống AI tiên tiến nhất của OpenAI cho đến nay, thay vào đó lại trở thành tâm điểm của sự thất vọng từ người dùng và những lời chỉ trích về mặt kỹ thuật.

Kiến Trúc Cách Mạng Gặp Phải Phản Ứng Trái Chiều

GPT-5 giới thiệu một cách tiếp cận hoàn toàn khác đối với xử lý AI thông qua hệ thống trí tuệ thống nhất. Không giống như các kiến trúc mô hình đơn lẻ trước đây, GPT-5 hoạt động như một hệ thống định tuyến thông minh quản lý hai thành phần cốt lõi: một mô hình mặc định tốc độ cao cho các tác vụ thường ngày và GPT-5 Thinking cho các vấn đề suy luận phức tạp. Bộ định tuyến thời gian thực này phân tích các truy vấn của người dùng để xác định đường xử lý phù hợp, về mặt lý thuyết tối ưu hóa cả tốc độ và độ chính xác. Người dùng cũng có thể kích hoạt thủ công phân tích sâu hơn bằng cách bao gồm các cụm từ như hãy suy nghĩ sâu về vấn đề này trong lời nhắc của họ.

Tuyên Bố Về Hiệu Suất So Với Trải Nghiệm Người Dùng

Dữ liệu đánh giá của OpenAI cho thấy những cải tiến ấn tượng trên nhiều lĩnh vực. Trong khả năng kỹ thuật phần mềm được đo bằng thử nghiệm SWE-bench, GPT-5 đạt được độ chính xác 74,9% so với 30,8% của GPT-4o. Suy luận toán học có những cải tiến thậm chí còn ấn tượng hơn, với GPT-5 đạt 94,6% độ chính xác trên các bài toán thi AIME mà không cần hỗ trợ công cụ, cao hơn đáng kể so với 42,1% của GPT-4o. Công ty cũng tuyên bố giảm 45% lỗi thực tế so với các mô hình trước đó, với cải tiến 80% khi sử dụng chế độ suy nghĩ.

Tuy nhiên, thử nghiệm thực tế của người dùng cho thấy những khoảng cách đáng kể giữa những tuyên bố này và hiệu suất thực tế. Người dùng báo cáo các lỗi cơ bản như đếm sai số chữ cái trong những từ đơn giản như blueberry, tạo ra bản đồ vô nghĩa của Hoa Kỳ, và gặp khó khăn với các phương trình toán học cơ bản mà các mô hình cạnh tranh xử lý đúng. Những lỗi cơ bản này đã đặt ra câu hỏi về tính hợp lệ của phương pháp thử nghiệm đánh giá của OpenAI.

Điểm chuẩn hiệu suất GPT-5

Danh mục kiểm tra	Điểm GPT-5	Điểm GPT-4o	Cải thiện
SWE-bench (Kỹ thuật phần mềm)	74.9%	30.8%	+144%
Cuộc thi toán AIME	94.6%	42.1%	+125%
Giảm lỗi thông tin sai lệch	Ít hơn 45% lỗi so với GPT-4o	-	-45%
Giảm lỗi chế độ suy nghĩ	Ít hơn 80% lỗi so với o3	-	-80%


Một so sánh các kịch bản giải quyết vấn đề làm nổi bật sự khác biệt giữa kỳ vọng của người dùng và hiệu suất của mô hình GPT-5

Chiến Lược Ngừng Sử Dụng Mô Hình Gây Tranh Cãi

Nguồn gốc lớn nhất của sự tức giận từ người dùng xuất phát từ việc OpenAI gỡ bỏ tất cả các mô hình trước đó mà không thông báo, bao gồm GPT-4o, o3, và các biến thể 4.5. Quyết định này đã loại bỏ sự lựa chọn của người dùng qua đêm, buộc mọi người phải sử dụng hệ thống GPT-5 mới bất kể sở thích hoặc các trường hợp sử dụng cụ thể của họ. Nhiều người dùng đã phát triển quy trình làm việc xung quanh các mô hình khác nhau cho các mục đích riêng biệt, sử dụng GPT-4o cho các tác vụ sáng tạo, o3 cho suy luận logic, và các biến thể khác cho các ứng dụng chuyên biệt.

Tác động cảm xúc của thay đổi này đã đặc biệt đáng chú ý, với một số người dùng mô tả sự gắn bó của họ với các mô hình cụ thể theo những thuật ngữ đáng ngạc nhiên về mặt cá nhân. Một số người dùng báo cáo sử dụng GPT-4o để hỗ trợ sức khỏe tâm thần, thấy các phản hồi của nó đồng cảm và giống con người hơn so với hệ thống mới. Việc mất quyền truy cập đột ngột đã dẫn đến việc hủy đăng ký và kêu gọi tẩy chay trên các nền tảng mạng xã hội.

Tóm tắt khiếu nại của người dùng

Vấn đề kỹ thuật:

Đếm chữ cái không chính xác trong các từ đơn giản
Thất bại trong các phương trình toán học cơ bản
Tạo bản đồ địa lý vô nghĩa
Khoảng cách hiệu suất so với các tuyên bố chuẩn mực

Vấn đề chính sách:

Loại bỏ tất cả các mô hình trước đó mà không thông báo
Buộc di chuyển sang hệ thống GPT-5
Lựa chọn mô hình hạn chế cho người dùng không phải Pro
Lịch trình không rõ ràng cho tính khả dụng của mô hình cũ

Chiến Lược Định Giá Và Vị Thế Thị Trường

Bất chấp những tranh cãi kỹ thuật, cấu trúc định giá của GPT-5 đại diện cho một sự thay đổi đáng kể trong chiến lược thị trường của OpenAI. Giá API được đặt ở mức 1,25 đô la Mỹ cho một triệu token đầu vào và 10,00 đô la Mỹ cho một triệu token đầu ra, với biến thể GPT-5 mini tiết kiệm hơn có sẵn. Quan trọng hơn, GPT-5 đang được triển khai cho tất cả các cấp độ người dùng, bao gồm cả người dùng miễn phí sẽ có quyền truy cập vào hệ thống với giới hạn sử dụng trước khi được chuyển sang phiên bản mini.

Cách tiếp cận định giá tích cực này dường như được thiết kế để gây áp lực lên các đối thủ cạnh tranh như Gemini của Google và Claude của Anthropic, đặc biệt khi những công ty này đã xây dựng vị thế của họ xung quanh những lợi thế cụ thể như xử lý ngữ cảnh dài và các tính năng an toàn. Động thái này cũng thách thức các lựa chọn thay thế mã nguồn mở, mặc dù các dự án như DeepSeek và Tongyi Qianwen có thể hưởng lợi từ người dùng tìm kiếm các lựa chọn thay thế cho hệ sinh thái của OpenAI.

Cấu trúc giá của GPT-5

API Input: 1.25 USD cho một triệu token
API Output: 10.00 USD cho một triệu token
Người dùng miễn phí: Truy cập GPT-5 với giới hạn sử dụng, sau đó tự động chuyển sang GPT-5 mini
Người dùng Plus: Hạn mức sử dụng cao hơn + quyền truy cập tạm thời GPT-4o
Người dùng Pro: 200 USD/tháng để lựa chọn mô hình thủ công và truy cập GPT-5 Pro


GPT-5 được quảng bá là mô hình tốt nhất cho công việc, được thiết kế để hỗ trợ các doanh nghiệp thực hiện nhiều tác vụ khác nhau một cách hiệu quả hơn

Phản Ứng Của Công Ty Và Kiểm Soát Thiệt Hại

Đối mặt với những lời chỉ trích ngày càng tăng, CEO OpenAI Sam Altman đã nhanh chóng công bố một số biện pháp khắc phục thông qua mạng xã hội. Công ty đã tăng gấp đôi giới hạn tốc độ cho người dùng ChatGPT Plus, hứa hẹn cải thiện trí tuệ mô hình, và quan trọng là, khôi phục quyền truy cập vào GPT-4o cho người đăng ký trả phí. Altman thừa nhận rằng việc triển khai đang tiến hành chậm hơn dự kiến và cam kết làm cho việc lựa chọn mô hình minh bạch hơn cho người dùng.

Quyết định đưa GPT-4o trở lại, dù chỉ tạm thời, đại diện cho một sự lùi bước đáng kể từ chiến lược ban đầu của OpenAI là buộc người dùng sử dụng hệ thống mới. Tuy nhiên, công ty chưa cam kết về tính khả dụng lâu dài của các mô hình cũ, khiến người dùng không chắc chắn về quyền truy cập trong tương lai vào các công cụ AI ưa thích của họ.

Tác Động Ngành Và Triển Vọng Tương Lai

Tranh cãi về việc ra mắt GPT-5 làm nổi bật sự phức tạp ngày càng tăng của việc triển khai mô hình AI khi những hệ thống này trở nên tích hợp hơn vào quy trình làm việc hàng ngày của người dùng. Những phản ứng cảm xúc mạnh mẽ đối với những thay đổi mô hình cho thấy rằng các công ty AI có thể cần xem xét lại cách tiếp cận của họ đối với việc chuyển đổi sản phẩm, đặc biệt khi người dùng phát triển sự phụ thuộc sâu sắc hơn vào các hành vi và khả năng AI cụ thể.

Đối với ngành AI rộng lớn hơn, tình huống này chứng minh rằng các tiêu chuẩn kỹ thuật có thể không chuyển đổi trực tiếp thành sự hài lòng của người dùng, đặc biệt khi các chiến lược triển khai làm gián đoạn các mô hình người dùng đã được thiết lập. Sự cố này cũng nhấn mạnh tầm quan trọng của sự lựa chọn và minh bạch của người dùng trong thiết kế hệ thống AI, vì các tính năng chuyển đổi tự động mà OpenAI quảng bá như những lợi thế đã được nhiều người dùng coi là những hạn chế đối với quyền kiểm soát và tính linh hoạt của họ.


Một đồ họa quảng cáo giới thiệu mô hình GPT-5 tiên tiến, làm nổi bật các khả năng của nó giữa những lo ngại của người dùng và tác động ngành công nghiệp

Tin tức liên quan

‌

‌
‌

‌

‌
‌

‌