Những Lo Ngại Về Quyền Riêng Tư và Câu Hỏi Về Hiệu Suất Xuất Hiện Xung Quanh Dịch Vụ Đăng Ký LLM Mã Nguồn Mở Mới Với Giá 20 Đô La

Nhóm Cộng đồng BigGo
Những Lo Ngại Về Quyền Riêng Tư và Câu Hỏi Về Hiệu Suất Xuất Hiện Xung Quanh Dịch Vụ Đăng Ký LLM Mã Nguồn Mở Mới Với Giá 20 Đô La

Một dịch vụ đăng ký theo gói cước cố định mới cho các mô hình ngôn ngữ lớn mã nguồn mở đã ra mắt, hứa hẹn làm cho các coding agent trở nên phải chăng hơn. Tuy nhiên, những người dùng đầu tiên đang đặt ra những câu hỏi quan trọng về chính sách bảo mật và thực tiễn xử lý dữ liệu mà các người dùng tiềm năng nên xem xét.

Dịch vụ này cung cấp quyền truy cập vào các mô hình lập trình phổ biến như GLM-4.5 , Kimi K2 , và Qwen3 Coder với giá 20 đô la Mỹ mỗi tháng, định vị mình như một giải pháp thay thế phải chăng hơn so với các giải pháp hiện có. Nhưng khi người dùng tìm hiểu sâu hơn về các chi tiết, một số lo ngại đã nổi lên làm nổi bật những khó khăn trong giai đoạn phát triển của các nhà cung cấp dịch vụ AI mới.

So sánh giá cả

  • Dịch vụ mới: $20 USD/tháng cho 100 yêu cầu mỗi 5 giờ
  • Dịch vụ mới premium: $60 USD/tháng cho 1,000 yêu cầu mỗi 5 giờ
  • Claude Code : $20 USD/tháng (giới hạn tốc độ thấp hơn khoảng một nửa)
  • Claude Max : $200 USD/tháng (ít yêu cầu hơn so với gói $60 USD)

Chính Sách Bảo Mật Gây Ra Những Tín Hiệu Cảnh Báo

Người dùng xem xét các điều khoản bảo mật của dịch vụ đã xác định ngôn ngữ có vấn đề xung quanh quyền sử dụng dữ liệu. Chính sách hiện tại dường như cấp quyền rộng rãi để sử dụng thông tin cá nhân, điều này mâu thuẫn với kỳ vọng về các dịch vụ tập trung vào quyền riêng tư. Ngoài ra, việc sử dụng Google Tag Manager để theo dõi đã gây ra lo ngại về khả năng rò rỉ dữ liệu, đặc biệt là do các tương tác LLM thường chứa mã và prompt nhạy cảm.

Một người dùng đã lưu ý về sự mâu thuẫn giữa việc tiếp thị với những khách hàng quan tâm đến quyền riêng tư trong khi duy trì các chính sách không phù hợp với những giá trị đó. Nhà cung cấp dịch vụ đã thừa nhận những lo ngại này và cho biết họ đang xem xét lại cách tiếp cận bảo mật của mình, lấy các công ty như Kagi làm ví dụ về các thực tiễn bảo mật tốt hơn.

Điều Khoản Lưu Trữ và Sử Dụng Dữ Liệu Không Rõ Ràng

Các điều khoản của dịch vụ chứa ngôn ngữ gây nhầm lẫn về lưu trữ dữ liệu và quyền sử dụng. Trong khi một phần nói rằng các yêu cầu API chỉ có thể được lưu trữ trong 14 ngày và chỉ được sử dụng để gỡ lỗi, các phần khác của thỏa thuận đề cập đến quyền cấp phép rộng hơn để cải thiện nền tảng. Sự mơ hồ này đã khiến người dùng không chắc chắn về cách dữ liệu của họ sẽ thực sự được xử lý.

Công ty đã làm rõ rằng giới hạn gỡ lỗi 14 ngày được ưu tiên, nhưng sự hiện diện của ngôn ngữ mâu thuẫn trong các tài liệu pháp lý cho thấy nhu cầu về các chính sách bảo mật rõ ràng hơn, nhất quán hơn.

Câu Hỏi Về Hiệu Suất và Triển Khai Kỹ Thuật

Ngoài những lo ngại về quyền riêng tư, người dùng đang đánh giá các khía cạnh kỹ thuật của dịch vụ. Các benchmark hiệu suất cho thấy kết quả đầy hứa hẹn, với GLM-4.5 đạt 150-200 token mỗi giây trong thử nghiệm. Tuy nhiên, vẫn còn câu hỏi về mức độ quantization của mô hình và cách dịch vụ so sánh với các đối thủ cạnh tranh như Cerebras về tốc độ và chất lượng.

Dịch vụ tuyên bố cung cấp các triển khai đáng tin cậy hơn so với một số đối thủ cạnh tranh, trích dẫn sự khác biệt hiệu suất đáng kể trong các tác vụ coding agent. Họ thử nghiệm các mô hình của mình với coding agent riêng để đảm bảo chức năng phù hợp, giải quyết các vấn đề với các triển khai mô hình bị hỏng hoặc bị cắt giảm tìm thấy ở nơi khác.

Điểm chuẩn hiệu suất

  • GLM-4.5 : 150-200 token mỗi giây ( Bay Area , California )
  • Qwen3 Coder : Chạy với lượng tử hóa FP8
  • Chênh lệch 10 điểm phần trăm trong tỷ lệ hoàn thành tác vụ lập trình giữa các API chính thức và một số triển khai OpenRouter

Đếm Yêu Cầu và Giới Hạn Tốc Độ

Người dùng làm việc với coding agent cần sự rõ ràng về cách các yêu cầu được tính vào giới hạn đăng ký. Dịch vụ đếm các yêu cầu API thay vì các lệnh gọi công cụ riêng lẻ, có nghĩa là các batch lệnh gọi công cụ song song thường được tính như các yêu cầu đơn lẻ. Cách tiếp cận này có thể thuận lợi hơn cho người dùng các framework có thể batch các hoạt động một cách hiệu quả.

Cấu trúc giới hạn tốc độ cung cấp 100 yêu cầu mỗi năm giờ cho gói cơ bản 20 đô la Mỹ , mà công ty định vị là khoảng gấp đôi giới hạn tốc độ của các dịch vụ tương đương. Tuy nhiên, các tác động thực tế phụ thuộc rất nhiều vào cách các framework lập trình riêng lẻ cấu trúc các lệnh gọi API của họ.

Các Mô Hình Được Hỗ Trợ

  • GLM-4.5: Bộ xử lý lý luận lai, được đánh giá tương đương với Sonnet 4
  • Kimi K2: Mô hình không có khả năng lý luận
  • Qwen3 Coder 480B: Giải quyết bài toán lập trình trong một lần thực hiện
  • DeepSeek 3.1: Được tối ưu hóa cho các tác vụ lập trình tự động

Nhìn Về Phía Trước

Trong khi dịch vụ giải quyết nhu cầu thực sự về quyền truy cập phải chăng vào các mô hình lập trình mã nguồn mở, phản hồi ban đầu nhấn mạnh tầm quan trọng của các chính sách bảo mật rõ ràng và thực tiễn xử lý dữ liệu minh bạch. Khi các dịch vụ AI trở nên phổ biến hơn, người dùng đang trở nên tinh tế hơn trong việc đánh giá không chỉ hiệu suất và giá cả, mà còn cả độ tin cậy của các nhà cung cấp dịch vụ.

Sự sẵn sàng của công ty trong việc tương tác với phản hồi của người dùng và thừa nhận những thiếu sót là đáng khích lệ. Tuy nhiên, các thuê bao tiềm năng nên xem xét cẩn thận các điều khoản hiện tại và cân nhắc liệu các đánh đổi về quyền riêng tư có phù hợp với nhu cầu của họ hay không, đặc biệt khi làm việc với mã nhạy cảm hoặc thông tin độc quyền.

Tham khảo: A flat monthly subscription to open-source LLMs