Google âm thầm tăng giá Gemini 2.5 Flash lên tới 4 lần trong khi công bố mô hình Flash-Lite mới

Nhóm biên tập BigGo

Google âm thầm tăng giá Gemini 2.5 Flash lên tới 4 lần trong khi công bố mô hình Flash-Lite mới

Google đã chính thức ra mắt các mô hình Gemini 2.5 Flash và Pro đồng thời giới thiệu phiên bản Flash-Lite mới. Tuy nhiên, thông báo này đã gây ra nhiều tranh luận trong cộng đồng nhà phát triển do mức tăng giá đáng kể mà không được nhấn mạnh rõ ràng trong bài đăng blog chính thức.

Mức tăng giá bị che giấu khiến các nhà phát triển bất ngờ

Việc chuyển từ phiên bản xem trước sang bản phát hành ổn định đã mang đến những thay đổi giá cả đáng kể cho Gemini 2.5 Flash. Chi phí đầu vào tăng gấp đôi từ 0,15 đô la Mỹ lên 0,30 đô la Mỹ cho mỗi triệu token, trong khi giá đầu ra tăng vọt từ 0,60 đô la Mỹ lên 2,50 đô la Mỹ cho mỗi triệu token ở chế độ non-thinking - mức tăng 4 lần. Cộng đồng đã chỉ trích Google vì đã hạ thấp những thay đổi này, khi bài đăng blog chỉ đề cập đến việc giảm từ 3,50 đô la Mỹ xuống 2,50 đô la Mỹ cho đầu ra chế độ thinking.

Tin tức thực sự là đầu ra non-thinking hiện đắt hơn 4 lần, điều mà họ tất nhiên cẩn thận tránh đề cập trong blog, chỉ so sánh giá của chế độ thinking.

Chiến lược định giá này ảnh hưởng đến các nhà phát triển đã xây dựng ứng dụng trong giai đoạn xem trước, đặc biệt là những người sử dụng chế độ non-thinking cho các tác vụ nhạy cảm về tốc độ như AI giọng nói hoặc ứng dụng thời gian thực.

Thay đổi giá của Gemini 2.5 Flash

Chỉ số	Giá Preview	Giá Stable mới	Mức tăng
Input tokens	$0.15/triệu	$0.30/triệu	2x
Output (không suy nghĩ)	$0.60/triệu	$2.50/triệu	4.2x
Output (có suy nghĩ)	$3.50/triệu	$2.50/triệu	0.7x (giảm)
Audio tokens	$1.00/triệu	$1.00/triệu	Không thay đổi

Flash-Lite xuất hiện như giải pháp thay thế tiết kiệm

Google đã giới thiệu Gemini 2.5 Flash-Lite như lựa chọn tiết kiệm chi phí nhất, được định vị để cạnh tranh với mô hình 2.0 Flash cũ hơn. Phiên bản mới duy trì cửa sổ ngữ cảnh 1 triệu token và khả năng đa phương thức trong khi cung cấp thời gian phản hồi nhanh hơn, thường dưới 400ms. Tuy nhiên, các thử nghiệm ban đầu cho thấy nó có thể không đạt được hiệu suất của mô hình Flash đầy đủ cho các tác vụ phức tạp.

Chi phí xử lý âm thanh cũng đã tăng đáng kể trên toàn bộ, với Flash-Lite tính phí 0,50 đô la Mỹ cho mỗi triệu token so với 0,075 đô la Mỹ của 2.0 Flash-Lite trước đó - mức tăng 6,3 lần.

Các Tính Năng Chính của Gemini 2.5 Flash-Lite

Cửa sổ ngữ cảnh: 1 triệu token
Thời gian phản hồi: Thường dưới 400ms, thấp nhất 200ms
Khả năng: Đầu vào đa phương thức, tích hợp Google Search , thực thi mã
Chế độ suy nghĩ: Có sẵn với ngân sách có thể điều chỉnh
Định vị: Mô hình tiết kiệm chi phí nhất trong dòng 2.5

Phản ứng cộng đồng chia rẽ về chất lượng mô hình

Phản hồi của nhà phát triển về các cập nhật gần đây của Gemini cho thấy kết quả hỗn hợp. Trong khi một số người dùng khen ngợi hiệu suất lập trình được cải thiện và cửa sổ ngữ cảnh lớn, những người khác báo cáo chất lượng giảm sút so với các phiên bản xem trước trước đó. Một số nhà phát triển đã ghi nhận các vấn đề với phản hồi dài dòng, bình luận quá mức trong mã được tạo và hiệu suất không nhất quán.

Hệ thống giới hạn tốc độ cũng đã thu hút sự chỉ trích, với một số người dùng không thể đạt được các tầng chi tiêu cao hơn do giới hạn yêu cầu hạn chế, buộc họ quay lại các đối thủ cạnh tranh như OpenAI mặc dù thích khả năng kỹ thuật của Gemini.

So sánh giá xử lý âm thanh

Model	Giá mỗi triệu Token
Gemini 2.0 Flash-Lite	$0.075
Gemini 2.5 Flash-Lite	$0.50
Mức tăng giá	6.3x

Định giá chiến lược phản ánh sự trưởng thành của thị trường

Mức tăng giá phù hợp với xu hướng rộng lớn của ngành khi các công ty AI chuyển từ thu hút khách hàng tích cực sang các mô hình kinh doanh bền vững. Việc định giá cực thấp ban đầu của Google đã giúp thiết lập sự hiện diện trên thị trường, nhưng công ty hiện có vẻ đủ tự tin để tính phí theo mức thị trường. Sự thay đổi này phản ánh bối cảnh AI đang trưởng thành nơi các nhà cung cấp đang cân bằng cải thiện hiệu suất với yêu cầu lợi nhuận.

Những thay đổi này làm nổi bật thách thức đang diễn ra đối với các nhà phát triển xây dựng trên các mô hình xem trước, nơi sự ổn định về giá cả không được đảm bảo cho đến khi có sẵn chung. Khi thị trường AI tiếp tục phát triển, các công ty phải cân nhắc lợi ích của khả năng tiên tiến với rủi ro của chi phí và điều khoản biến động.

Tham khảo: We're expanding our Gemini 2.5 family of models

Tin tức liên quan

‌

‌
‌

‌

‌
‌

‌