Ngành công nghiệp trí tuệ nhân tạo đang đối mặt với một tình thế khó khăn về định giá ngày càng gia tăng, buộc các công ty phải từ bỏ các mô hình đăng ký không giới hạn và đẩy chi phí cao hơn cho người dùng. Trong khi các công ty AI hứa hẹn rằng token sẽ trở nên rẻ hơn theo thời gian, thực tế lại phức tạp hơn nhiều khi các mô hình nhu cầu và hành vi sử dụng tạo ra những vấn đề kinh tế không bền vững.
Vấn đề của gói không giới hạn
Vấn đề cốt lõi nằm ở cách mọi người thực sự sử dụng các dịch vụ AI. Các công ty ban đầu cung cấp các gói không giới hạn hoặc giới hạn cao với kỳ vọng mức sử dụng vừa phải, nhưng họ phát hiện ra một thực tế khắc nghiệt: một số lượng nhỏ người dùng chuyên nghiệp tiêu thụ nhiều tài nguyên hơn dự kiến rất nhiều. Điều này tạo ra cái mà các chuyên gia gọi là phân phối giống như Zipf, trong đó hàng nghìn người dùng thông thường có thể sử dụng vài trăm token mỗi ngày, trong khi một nhóm nhỏ người dùng tự động hóa nặng tiêu thụ hàng chục triệu token.
Những thay đổi gần đây của Claude đối với gói 200 đô la Mỹ hàng tháng minh họa rõ thách thức này. Mặc dù không bao giờ thực sự không giới hạn, nhưng các giới hạn hào phóng của gói này đã chứng minh là không bền vững khi người dùng bắt đầu chạy các phiên lập trình chuyên sâu và xử lý tài liệu lớn. Công ty buộc phải thực hiện các biện pháp kiểm soát nghiêm ngặt hơn, khiến nhiều người dùng thất vọng với những hạn chế sử dụng đột ngột.
Mô hình Phân bố Sử dụng:
- Hàng nghìn người dùng thông thường: Vài trăm token mỗi ngày
- Nhóm nhỏ người dùng chuyên sâu: Hàng chục triệu token mỗi tháng
- Ví dụ về mức sử dụng cực cao: 10 tỷ token mỗi tháng (tương đương với 12.500 bản sao của War and Peace)
- Phân bố theo đường cong giống Zipf khiến việc định giá cố định trở nên không bền vững
Chi phí thực sự đằng sau việc định giá Token
Trong khi các mô hình AI cũ hơn thực sự trở nên rẻ hơn để vận hành theo thời gian, cộng đồng liên tục chuyển sang các mô hình mới nhất, có khả năng nhất ngay khi chúng được phát hành. Điều này tạo ra một mục tiêu di động cho các chiến lược định giá. Các công ty thấy mình ở vị thế phải định giá dựa trên các mô hình mới nhất, đắt đỏ nhất thay vì những mô hình cũ rẻ hơn mà ít người thực sự muốn sử dụng.
Tình hình trở nên phức tạp hơn với các trợ lý lập trình và AI agent đốt cháy token với tốc độ chưa từng có. Người dùng báo cáo việc chi 5 đô la Mỹ chỉ trong 15 phút khi sử dụng các công cụ như Claude Code, vì những ứng dụng này tạo ra lượng lớn ngữ cảnh và tương tác qua lại nhanh chóng tích lũy chi phí.
So sánh giá Token:
- Claude Opus : 75 USD cho một triệu token
- Claude Sonnet : 15 USD cho một triệu token
- Claude Haiku : Mức giá thấp hơn cho các tác vụ đơn giản
- Ví dụ sử dụng: Tiêu thụ 5 USD trong 15 phút trong các phiên lập trình chuyên sâu
Vấn đề minh bạch
Một nguồn thất vọng đáng kể của người dùng xuất phát từ sự mờ mịt của hệ thống thanh toán dựa trên token. Nhiều người dùng gặp khó khăn trong việc hiểu chính xác họ đang chi bao nhiều hoặc dự đoán chi phí hàng tháng của mình. Vấn đề này mở rộng ra ngoài AI đến các dịch vụ đám mây nói chung, nơi các công ty như Amazon Web Services đã tạo ra các hệ thống thanh toán phức tạp đến mức các doanh nghiệp thường cần thuê chuyên gia chỉ để hiểu hóa đơn của họ.
Bạn có thể thiết lập cảnh báo thanh toán và viết một hàm lambda để phản hồi và vô hiệu hóa tài nguyên. Tất nhiên họ không làm cho nó dễ dàng nhưng nếu bạn không học cách sử dụng giới hạn thì bạn mong đợi gì?
Cách tiếp cận của ngành game đối với tiền tệ ảo cung cấp một sự tương đồng rõ ràng - các công ty cố tình che giấu chi phí thực tế bằng cách sử dụng token hoặc tín dụng thay vì số tiền đô la trực tiếp, khiến người dùng khó theo dõi chi tiêu thực tế của họ.
Tìm kiếm các mô hình bền vững
Các công ty đang thử nghiệm nhiều cách tiếp cận khác nhau để giải quyết khủng hoảng định giá. Một số đang triển khai hệ thống phân tầng tự động chuyển đổi giữa các mô hình AI khác nhau dựa trên độ phức tạp của nhiệm vụ - sử dụng các mô hình đắt tiền như Opus cho lý luận phức tạp và các lựa chọn thay thế rẻ hơn như Haiku cho các nhiệm vụ đơn giản. Những công ty khác đang khám phá các cách tiếp cận lai kết hợp xử lý AI với các phương pháp tính toán truyền thống để giảm tiêu thụ token.
Thị trường doanh nghiệp đặt ra những thách thức khác biệt, vì các doanh nghiệp thường thích định giá cố định có thể dự đoán được hơn là các mô hình dựa trên sử dụng, ngay cả khi họ cuối cùng phải trả nhiều hơn. Tuy nhiên, sự biến động cực lớn trong các mô hình sử dụng khiến các công ty AI gần như không thể cung cấp các gói cố định bền vững mà không mất tiền từ người dùng nặng hoặc định giá quá cao cho người dùng nhẹ.
Thay đổi gói đăng ký:
- Claude Code : gói từ 20-200 USD hàng tháng (giống như Cursor )
- Các gói "không giới hạn" trước đây có áp dụng giới hạn phiên 5 giờ
- Giới hạn mềm 50 phiên mỗi tháng (thường không được thực thi)
- Các gói đang được tái cấu trúc do các mô hình sử dụng không bền vững
Nhìn về phía trước
Khủng hoảng định giá hiện tại phản ánh những câu hỏi sâu sắc hơn về tính bền vững của các mô hình kinh doanh của ngành AI. Khi các công ty đốt cháy lượng lớn vốn để đào tạo và phục vụ các mô hình ngày càng mạnh mẽ, áp lực để đạt được lợi nhuận đang gia tăng. Sự căng thẳng giữa khả năng, chi phí và khả năng tiếp cận này có thể sẽ định hình lại cách các dịch vụ AI được định giá và đóng gói trong những năm tới.
Phản ứng của cộng đồng đã trái chiều, với một số người dùng chấp nhận định giá dựa trên sử dụng là công bằng trong khi những người khác tìm kiếm các lựa chọn thay thế như các mô hình tự lưu trữ hoặc chuyển đổi giữa các nhà cung cấp dựa trên chi phí. Giải pháp cuối cùng có thể đòi hỏi việc suy nghĩ lại cơ bản về cách các khả năng AI được cung cấp và kiếm tiền.
Tham khảo: tokens are getting more expensive