Người dùng GPT-5 báo cáo các vấn đề về hiệu suất và thiếu tính năng sau bản phát hành mới nhất của OpenAI

Nhóm Cộng đồng BigGo
Người dùng GPT-5 báo cáo các vấn đề về hiệu suất và thiếu tính năng sau bản phát hành mới nhất của OpenAI

Bản phát hành GPT-5 mới nhất của OpenAI đã gây ra nhiều thảo luận trong cộng đồng người dùng, những người báo cáo trải nghiệm hỗn hợp với mô hình mới này. Trong khi công ty định vị GPT-5 như một bước tiến đáng kể, nhiều người dùng thấy thất vọng với các khía cạnh khác nhau về hiệu suất và chức năng của nó.

Mối quan ngại về chất lượng và vấn đề định tuyến mô hình

Người dùng đã báo cáo sự khác biệt chất lượng đáng chú ý giữa GPT-5 và các mô hình tiền nhiệm. Nhiều người thấy rằng GPT-5 tạo ra ít vòng suy nghĩ hơn so với mô hình O3 trước đó và không sử dụng tìm kiếm web một cách hiệu quả. Các Custom GPT , mà nhiều người dùng dựa vào cho các tác vụ chuyên biệt, dường như bị hỏng và bỏ qua hướng dẫn bất kể mô hình nào được chọn. Chức năng nghiên cứu sâu, một tính năng quan trọng đối với nhiều người dùng chuyên nghiệp, có vẻ như không hoạt động ngay cả khi được chọn một cách rõ ràng.

Hệ thống định tuyến mô hình, được thiết kế để tự động chọn mô hình tốt nhất cho từng tác vụ, đã trở thành điểm gây khó chịu. Người dùng báo cáo rằng các quyết định định tuyến thiếu minh bạch, và họ không thể dễ dàng kiểm soát mô hình cụ thể nào xử lý yêu cầu của mình. Điều này đã dẫn đến kết quả không thể đoán trước và giảm niềm tin của người dùng vào hệ thống.

Các Vấn Đề Kỹ Thuật Được Báo Cáo:

  • Custom GPTs bỏ qua hướng dẫn bất kể mô hình nào được chọn
  • Tính năng nghiên cứu sâu có vẻ không hoạt động
  • Các quy trình dọn dẹp ngữ cảnh gây mất luồng hội thoại
  • Vấn đề ảo giác vẫn tồn tại trong các lĩnh vực chuyên môn
  • Khả năng suy luận không gian và xử lý hình ảnh vẫn còn vấn đề
  • Định tuyến mô hình thiếu minh bạch và kiểm soát của người dùng

Vấn đề quản lý ngữ cảnh và cuộc trò chuyện

Một vấn đề đáng kể ảnh hưởng đến trải nghiệm người dùng là khó khăn rõ ràng của GPT-5 trong việc duy trì ngữ cảnh cuộc trò chuyện. Người dùng mô tả các tình huống mà mô hình mất mạch cuộc trò chuyện một cách đột ngột, đòi hỏi các lời nhắc như Vui lòng xem lại cuộc trò chuyện gần đây trước khi tiếp tục để quay trở lại đúng hướng. Các phản hồi cũng trở nên ngắn gọn hơn một cách đáng chú ý, tạo ra trải nghiệm khó chịu giống như nói chuyện với ai đó không lắng nghe.

Vấn đề quản lý ngữ cảnh này dường như xuất phát từ các quy trình dọn dẹp ngữ cảnh tích cực có thể tóm tắt các điểm nổi bật của cuộc trò chuyện một cách kém, thực tế là cho mô hình một bộ nhớ làm việc nhỏ hơn mong đợi.

Sự đánh đổi giữa hiệu suất và chi phí

Việc phát hành này dường như là một phần trong chiến lược của OpenAI để quản lý chi phí trong khi mở rộng quy mô cho cơ sở người dùng lớn hơn. Các nhà quan sát ngành lưu ý rằng việc chạy các mô hình này ở hiệu suất tối đa có thể tốn hàng nghìn đô la Mỹ mỗi người dùng mỗi tháng. Thiết kế của GPT-5 có vẻ được tối ưu hóa cho việc áp dụng hàng loạt hơn là hiệu suất đỉnh cao, điều này giải thích tại sao những người dùng chuyên nghiệp đã quen với khả năng của O3 cảm thấy thất vọng.

Thú vị là GPT-5 Pro , phiên bản cao cấp, cho thấy hiệu suất tốt hơn trong các tác vụ lập trình và có thể giải quyết các vấn đề phức tạp mà các mô hình trước đó không thể. Tuy nhiên, nó đi kèm với chi phí cao hơn và giới hạn tốc độ khiến nó ít tiếp cận hơn cho việc sử dụng thường xuyên.

So sánh GPT-5 với các mô hình trước đó:

  • Quản lý ngữ cảnh: GPT-5 cho thấy khả năng duy trì luồng hội thoại giảm so với O3
  • Tìm kiếm web: Tích hợp tìm kiếm web kém hiệu quả hơn so với mô hình O3 trước đó
  • Custom GPTs: Chức năng bị hỏng, bỏ qua hướng dẫn của người dùng
  • Nghiên cứu sâu: Không hoạt động ngay cả khi được chọn một cách rõ ràng
  • Phong cách phản hồi: Phản hồi ngắn gọn hơn, giảm số vòng suy nghĩ
  • Chi phí: Được thiết kế để áp dụng đại trà thay vì hiệu suất đỉnh cao

Các hạn chế kỹ thuật vẫn tồn tại

Bất chấp bản phát hành mới, các vấn đề cơ bản đã ảnh hưởng đến các mô hình ngôn ngữ lớn vẫn tiếp tục ảnh hưởng đến GPT-5 . Mô hình vẫn gặp khó khăn với việc nói Tôi không biết khi thiếu thông tin, thay vào đó tạo ra các phản hồi nghe có vẻ tự tin nhưng không chính xác. Vấn đề ảo giác này đặc biệt ảnh hưởng đến các lĩnh vực chuyên biệt nơi người dùng cần thông tin đáng tin cậy, chính xác.

Khả năng lý luận không gian và xử lý hình ảnh của mô hình vẫn còn vấn đề, với người dùng báo cáo rằng nó thất bại trong các tác vụ thị giác cơ bản và tạo ra các phản hồi vô nghĩa khi làm việc với hình ảnh.

Sự thích ứng và kỳ vọng của người dùng

Phản ứng của cộng đồng làm nổi bật một thách thức rộng lớn hơn trong phát triển AI : quản lý kỳ vọng của người dùng so với thực tế kỹ thuật. Trong khi GPT-5 đại diện cho những cải tiến từng bước trong một số lĩnh vực, nó không đạt được bước tiến cách mạng mà nhiều người dùng mong đợi. Một số người dùng đã thích ứng bằng cách sử dụng nhiều mô hình AI cho các tác vụ khác nhau, coi mỗi mô hình như một công cụ chuyên biệt hơn là một giải pháp đa năng.

Việc tiếp nhận hỗn hợp GPT-5 phản ánh tình trạng hiện tại của phát triển AI , nơi tiến bộ đến theo những bước nhỏ hơn thay vì những bước nhảy vọt đáng kể. Người dùng đang học cách điều hướng các điểm mạnh và điểm yếu của các mô hình khác nhau, thường giữ đăng ký nhiều dịch vụ để truy cập công cụ tốt nhất cho từng tác vụ cụ thể.

Tham khảo: GPT-5: Overdan, overhyped and underwhelming. And that's not the worst of it.