Google đã phát hành các phiên bản cập nhật của model Gemini 2.5 Flash và Flash-Lite, hứa hẹn hiệu suất và tính hiệu quả tốt hơn. Tuy nhiên, phản ứng của cộng đồng công nghệ cho thấy những lo ngại đang diễn ra về các vấn đề độ tin cậy và thực hành đặt tên gây nhầm lẫn đã che lấp những cải tiến kỹ thuật.
![]() |
---|
Thông báo về các mô hình Gemini 25 Flash và Flash-Lite mới nhất, thể hiện những tiến bộ gần đây trong công nghệ AI |
Các Vấn Đề Độ Tin Cậy Dai Dẳng Tiếp Tục Khiến Người Dùng Thất Vọng
Mặc dù có những nâng cấp về hiệu suất, người dùng báo cáo rằng các model Gemini vẫn gặp phải một lỗi nghiêm trọng: các phản hồi đột ngột dừng lại giữa câu. Điều này không liên quan đến giới hạn token hoặc bộ lọc nội dung, mà dường như là một lỗi trong cách model báo hiệu hoàn thành. Vấn đề này đã được ghi nhận trên GitHub và các diễn đàn nhà phát triển trong nhiều tháng như một vấn đề ưu tiên cấp 2, nhưng vẫn chưa được giải quyết.
Những lo ngại về độ tin cậy mở rộng ra ngoài các phản hồi bị cắt cụt. Người dùng mô tả hiệu suất không nhất quán khiến Gemini cảm thấy bị hỏng so với các đối thủ cạnh tranh như Claude và GPT-4, ngay cả khi chất lượng của các phản hồi hoàn chỉnh có tính cạnh tranh. Điều này tạo ra trải nghiệm người dùng khó chịu khi các nhà phát triển phải liên tục nhắc nhở model tiếp tục các suy nghĩ chưa hoàn thành.
Các Vấn Đề Kỹ Thuật Chính
- Lỗi cắt ngắn phản hồi dai dẳng (được ghi nhận là vấn đề P2 trên GitHub )
- Các phản hồi bị dừng giữa câu không liên quan đến giới hạn token hoặc bộ lọc nội dung
- Hiệu suất không ổn định ảnh hưởng đến độ tin cậy trong môi trường sản xuất
- Các vấn đề với các chức năng giao diện người dùng đơn giản như cuộn trang trong AI Studio
- Các vấn đề về tô sáng cú pháp trong giao diện web
Sự Nhầm Lẫn Về Đặt Tên Phiên Bản Gây Ra Chỉ Trích Từ Ngành Công Nghiệp
Cộng đồng đã bày tỏ sự thất vọng đáng kể với cách tiếp cận của Google đối với việc đánh số phiên bản model. Thay vì tăng số phiên bản cho các bản cập nhật, Google tiếp tục sử dụng 2.5 trong khi thêm các định danh phức tạp dựa trên ngày tháng như gemini-2.5-flash-preview-09-2025. Thực hành này khiến các nhà phát triển khó theo dõi các thay đổi và quản lý quy trình làm việc của họ một cách hiệu quả.
Số phiên bản trở nên vô dụng với loại chính sách đó.
Sự nhầm lẫn được gia tăng bởi việc Google giới thiệu các bí danh -latest, tự động trỏ đến các phiên bản model mới nhất. Mặc dù có ý định đơn giản hóa việc truy cập, cách tiếp cận này gây ra lo ngại về các thay đổi hành vi không mong muốn trong các ứng dụng sản xuất. Google hứa hẹn thông báo trước hai tuần trước khi cập nhật, nhưng nhiều nhà phát triển thích sự ổn định của các số phiên bản cố định hơn.
Định danh Model và Quyền truy cập
- Các phiên bản preview mới:
gemini-2.5-flash-preview-09-2025
vàgemini-2.5-flash-lite-preview-09-2025
- Các bí danh mới nhất:
gemini-flash-latest
vàgemini-flash-lite-latest
- Các phiên bản ổn định:
gemini-2.5-flash
vàgemini-2.5-flash-lite
- Có sẵn trên: Google AI Studio và Vertex AI
Các Cải Tiến Hiệu Suất Cho Thấy Triển Vọng Mặc Dù Có Vấn Đề
Những cải tiến kỹ thuật trong các bản cập nhật này đáng chú ý. Gemini 2.5 Flash-Lite tập trung vào việc tuân theo hướng dẫn tốt hơn, giảm tính dài dòng và khả năng đa phương thức mạnh hơn. Model Flash cho thấy cải thiện 5% trên benchmark SWE-Bench Verified (từ 48.9% lên 54%) và thể hiện việc sử dụng công cụ tốt hơn cho các ứng dụng phức tạp.
Người dùng báo cáo rằng Gemini xuất sắc trong các lĩnh vực cụ thể như lý luận bối cảnh dài, nhận dạng hình ảnh và hỗ trợ đa ngôn ngữ. Tính hiệu quả về chi phí của model khiến nó hấp dẫn đối với các ứng dụng khối lượng lớn, với một số người dùng đạt được hiệu quả token đầu ra tốt hơn từ 24% đến 50%.
Cải thiện hiệu suất
- Benchmark SWE-Bench Verified : 48.9% → 54% (cải thiện 5%)
- Hiệu quả token đầu ra: cải thiện từ 24% đến 50%
- Giảm độ trễ phản hồi cho các ứng dụng có lưu lượng cao
- Khả năng tuân theo hướng dẫn tốt hơn và giảm độ dài dòng trong Flash-Lite
- Nâng cao khả năng đa phương thức bao gồm phiên âm âm thanh và hiểu hình ảnh
![]() |
---|
Biểu đồ phân tán so sánh các phiên bản khác nhau của Gemini 25 dựa trên Chỉ số Thông minh và hiệu suất thời gian phản hồi |
Vị Thế Thị Trường Vẫn Cạnh Tranh Mặc Dù Có Thách Thức
Các cuộc thảo luận trong cộng đồng cho thấy rằng Gemini 2.5 Flash đã trở thành model được nhiều người dùng lựa chọn cho một số tác vụ nhất định, đặc biệt là xử lý hình ảnh và đầu ra có cấu trúc. Lợi thế về tốc độ và giá cả so với các đối thủ cạnh tranh như các model của OpenAI và Anthropic khiến nó phổ biến cho các ứng dụng mà các vấn đề độ tin cậy có thể được quản lý thông qua xử lý lỗi thích hợp.
Tuy nhiên, các vấn đề kỹ thuật dai dẳng và thực hành đánh số phiên bản gây nhầm lẫn làm nổi bật khoảng cách giữa khả năng kỹ thuật của Google và việc thực thi trải nghiệm người dùng. Mặc dù công nghệ cơ bản cho thấy triển vọng, những vấn đề hoạt động này tiếp tục hạn chế việc áp dụng rộng rãi hơn của Gemini trong các môi trường sản xuất nơi tính nhất quán là rất quan trọng.
Các bản cập nhật đại diện cho tiến bộ từng bước, nhưng sự tập trung của cộng đồng vào các lo ngại cơ bản về độ tin cậy và khả năng sử dụng cho thấy rằng Google cần giải quyết những vấn đề cơ bản này trước khi người dùng hoàn toàn chấp nhận các khả năng tiên tiến của nền tảng.
Tham khảo: Continuing to bring you our latest models, with an improved Gemini 2.5 Flash and Flash-Lite release