GPT-5 Nhận Phản Hồi Trái Chiều Khi Người Dùng Tranh Luận Liệu Sự Tiến Bộ AI Đã Chạm Trần

Nhóm Cộng đồng BigGo
GPT-5 Nhận Phản Hồi Trái Chiều Khi Người Dùng Tranh Luận Liệu Sự Tiến Bộ AI Đã Chạm Trần

Việc OpenAI phát hành GPT-5 gần đây đã gây ra cuộc tranh luận sôi nổi trong cộng đồng AI về việc liệu sự phát triển trí tuệ nhân tạo đã đạt đến ngưỡng trần hay chưa. Trong khi công ty đã trình bày sự tiến hóa từ những phản hồi không mạch lạc của GPT-1 đến khả năng suy luận tinh vi của GPT-5 , nhiều người dùng đang đặt câu hỏi liệu mô hình mới nhất này có thể hiện sự tiến bộ thực sự hay là một bước lùi.

Dòng thời gian phát triển mô hình:

  • 2018 GPT-1: Phản hồi thiếu mạch lạc, dữ liệu huấn luyện tập trung nhiều vào văn học
  • 2019 GPT-2: Khả năng đối thoại cơ bản, vẫn còn thiếu tập trung
  • 2021 text-davinci-001: Phản hồi trực tiếp, súc tích
  • 2023 GPT-4-0314: Giọng điệu có cấu trúc, chuyên nghiệp với các tuyên bố từ chối tr책nhiệm
  • 2025 GPT-5: Phản hồi dài dòng, nhiều lời khen ngợi với các vấn đề kỹ thuật

Những Mối Quan Ngại Về Hiệu Suất Che Lấp Tuyên Bố Marketing

Người dùng báo cáo những vấn đề đáng kể với chức năng cốt lõi của GPT-5 . Nhiều người mô tả mô hình này bị rối loạn và dễ mắc lỗi mà không có trong GPT-4 . Việc tạo mã đã trở nên đặc biệt có vấn đề, với AI hiểu sai cú pháp lập trình thông thường và không thể hoàn thành các tác vụ dài hơn. Một người dùng lưu ý rằng khi làm việc với các tài liệu markdown có độ dài vừa phải (khoảng 700 dòng), GPT-5 sẽ đơn giản dừng lại giữa câu, không thể hoàn thành tác vụ.

Mô hình cũng gặp khó khăn với biểu thức chính quy, lấp đầy chúng bằng các token vô nghĩa mà sau đó nó thừa nhận là lỗi hiển thị. Những thiếu sót kỹ thuật này đã khiến một số người nghi ngờ rằng GPT-5 có thể được tối ưu hóa nhiều hơn để giảm chi phí tính toán của OpenAI thay vì cải thiện trải nghiệm người dùng.

Các vấn đề chính của GPT-5 được báo cáo:

  • Lỗi tạo mã (ví dụ: .ends_with thay vì .endswith)
  • Xử lý không hoàn chỉnh các tài liệu dài (700+ dòng)
  • Biểu thức chính quy chứa đầy các token vô nghĩa
  • Tăng độ dài dòng làm giảm tính thực用性
  • Nhầm lẫn trong các tác vụ lý luận nhiều bước

Sự Đánh Đổi Giữa Sáng Tạo và Khả Năng

Một mô hình thú vị xuất hiện khi so sánh các phản hồi qua các thế hệ mô hình khác nhau. Các mô hình trước đó như GPT-1 và GPT-2 , bất chấp những hạn chế kỹ thuật, thường tạo ra nội dung sáng tạo và hấp dẫn hơn. Phản hồi của chúng, mặc dù đôi khi không mạch lạc, có chất lượng thơ ca mà nhiều người dùng thấy truyền cảm hứng cho công việc sáng tạo.

Một số thứ khó tìm kiếm trên Google, vì bạn không thể đặt câu hỏi đúng cách. Ví dụ bạn biết bối cảnh và một lời giải thích kém về những gì bạn đang tìm kiếm. Việc tìm kiếm trên Google sẽ không đưa bạn đến đâu, LLMs sẽ đưa ra câu trả lời đúng 95% thời gian.

Khi các mô hình trở nên có khả năng hơn, chúng cũng trở nên dễ đoán và dài dòng hơn. Phản hồi của GPT-5 thường bắt đầu bằng việc khen ngợi quá mức câu hỏi của người dùng trước khi đưa ra những câu trả lời dài như bài luận mà nhiều người thấy ít hữu ích hơn so với phản hồi trực tiếp từ các phiên bản trước.

Độ Tin Cậy Kiểm Tra Sự Thật Vẫn Gây Tranh Cãi

Cộng đồng vẫn chia rẽ về việc sử dụng các mô hình ngôn ngữ lớn cho thông tin thực tế. Trong khi một số người dùng báo cáo tỷ lệ chính xác cao cho các truy vấn kiến thức tổng quát, những người khác chỉ ra các lỗi dai dẳng ngay cả trong các chức năng lập trình cơ bản. Hiệu ứng Gell-Mann amnesia - tin tưởng một nguồn trong các lĩnh vực không quen thuộc bất chấp biết rằng nó mắc lỗi trong các lĩnh vực quen thuộc - tiếp tục là mối quan ngại trong số các người dùng kỹ thuật.

Các phiên bản hiện đại có bao gồm khả năng tìm kiếm và liên kết trích dẫn, giúp ích cho việc xác minh. Tuy nhiên, câu hỏi cơ bản về độ tin cậy vẫn tồn tại, đặc biệt đối với những người dùng cần độ chính xác nhất quán trong công việc của họ.

Xu hướng sở thích của người dùng:

  • GPT-3.5 đến GPT-4: Được coi là bước tiến quan trọng nhất
  • GPT-4o: Cải thiện đáng kể về độ chính xác, xứng đáng với gói đăng ký 20 USD
  • Các mô hình o1: Cải thiện đáng kể khả năng lập trình
  • GPT-5: Được nhiều người dùng đánh giá là chỉ cải tiến ít ỏi hoặc thậm chí lùi bước

Thực Tế Thị Trường So Với Thành Tựu Kỹ Thuật

Sự đón nhận vlà lạnh của GPT-5 làm nổi bật khoảng cách ngày càng tăng giữa thành tựu kỹ thuật và kỳ vọng của người dùng. Trong khi mô hình cho thấy cải thiện trong một số điểm chuẩn và tác vụ suy luận, trải nghiệm thực tế đối với nhiều người dùng cảm thấy như một sự xuống cấp. Sự ngắt kết nối này đã dẫn đến suy đoán rằng ngành công nghiệp AI có thể đang tiếp cận giới hạn của các phương pháp đào tạo hiện tại.

Sự tiến triển từ GPT-3.5 đến GPT-4 đại diện cho một bước nhảy lớn về khả năng, làm cho các công cụ AI thực sự hữu ích cho nhiều tác vụ. Tuy nhiên, các cải tiến tiếp theo đã mang tính gia tăng hơn, với mỗi mô hình mới mang lại sự đánh đổi thay vì lợi thế rõ ràng trên tất cả các trường hợp sử dụng.

Tình hình hiện tại cho thấy rằng bước đột phá tiếp theo trong phát triển AI có thể đòi hỏi các phương pháp khác biệt cơ bản thay vì chỉ đơn giản mở rộng quy mô các mô hình hiện có. Cho đến lúc đó, người dùng tiếp tục tranh luận liệu các mô hình AI mới nhất có đại diện cho sự tiến bộ hay chỉ là những bài tập marketing đắt tiền.

Tham khảo: What would you say if you could talk to a future OpenAl model?