MiniMax Ra Mắt Mô Hình Suy Luận M1 Thách Thức DeepSeek Với Ngữ Cảnh 1 Triệu Token Và Chi Phí Huấn Luyện Siêu Thấp

Nhóm biên tập BigGo

MiniMax Ra Mắt Mô Hình Suy Luận M1 Thách Thức DeepSeek Với Ngữ Cảnh 1 Triệu Token Và Chi Phí Huấn Luyện Siêu Thấp

Startup AI Trung Quốc MiniMax đã gia nhập đấu trường mô hình suy luận cạnh tranh với thách thức táo bạo dành cho nhà dẫn đầu ngành DeepSeek . Thông báo mới nhất của công ty đánh dấu một cột mốc quan trọng trong cuộc đua đang diễn ra giữa sáu công ty AI lớn của Trung Quốc nhằm phát triển khả năng suy luận tiên tiến có thể cạnh tranh với các nhà lãnh đạo toàn cầu.

Đột Phá Cách Mạng Về Độ Dài Ngữ Cảnh Và Hiệu Quả

Mô hình M1 của MiniMax giới thiệu khả năng đột phá với hỗ trợ đầu vào ngữ cảnh 1 triệu token, ngang bằng với Gemini 2.5 Pro của Google và thể hiện sự cải thiện gấp 8 lần so với khả năng của DeepSeek R1 . Mô hình cũng hỗ trợ lên đến 80.000 token cho đầu ra suy luận, thiết lập tiêu chuẩn ngành mới cho xử lý ngữ cảnh dài. Thành tựu này xuất phát từ cơ chế Lightning Attention độc quyền của MiniMax , một phương pháp mới để tính toán ma trận attention giúp giảm đáng kể chi phí tính toán trong cả giai đoạn huấn luyện và suy luận.

Thông số kỹ thuật chính của MiniMax M1

Đầu vào ngữ cảnh: 1.000.000 token (gấp 8 lần DeepSeek R1)
Đầu ra lập luận: 80.000 token
Chi phí huấn luyện: 534.700 USD (512 GPU H800, 3 tuần)
Kiến trúc: Mixed MoE với cơ chế Lightning Attention
Thuật toán: Học tăng cường CISPO (hội tụ nhanh gấp 2 lần so với DAPO)

Huấn Luyện Hiệu Quả Chi Phí Thông Qua Đổi Mới Kỹ Thuật

Công ty đã đạt được hiệu quả chi phí đáng kể trong phát triển mô hình, hoàn thành toàn bộ giai đoạn học tăng cường chỉ với 512 GPU H800 trong ba tuần với chi phí thuê chỉ 534.700 đô la Mỹ. Điều này thể hiện mức giảm gấp mười lần so với dự báo ban đầu, chứng minh hiệu quả của các đổi mới kỹ thuật của MiniMax . Đột phá đến từ thuật toán học tăng cường CISPO mới phát triển, tối ưu hóa trọng số lấy mẫu quan trọng thay vì cập nhật token truyền thống, dẫn đến tốc độ hội tụ nhanh gấp đôi so với các phương pháp cạnh tranh bao gồm thuật toán DAPO gần đây của ByteDance .

Hiệu Suất Cạnh Tranh Trên Các Tiêu Chuẩn Ngành

Kiểm tra toàn diện trên 17 bộ dữ liệu đánh giá chính thống cho thấy vị thế cạnh tranh mạnh mẽ của M1 trên thị trường. Mô hình thể hiện hiệu suất tương đương với DeepSeek R1 và Qwen3 trong nhiều bài kiểm tra tiêu chuẩn, đồng thời tiếp cận khả năng của mô hình O3 của OpenAI . Đặc biệt đáng chú ý là hiệu suất vượt trội của M1 trong các tình huống sử dụng công cụ agent thông qua đánh giá TAU-bench , nơi nó vượt trội hơn Gemini 2.5 Pro của Google mặc dù hơi thua kém trong các nhiệm vụ hiểu ngữ cảnh dài tổng quát.

Điểm chuẩn hiệu suất

Đã thử nghiệm trên 17 bộ dữ liệu đánh giá chính thống
Hiệu suất tương đương với DeepSeek R1 và Qwen3
Tiệm cận khả năng của OpenAI O3
Vượt trội hơn Gemini 2.5 Pro trong TAU-bench (sử dụng công cụ tác nhân)
Chậm hơn một chút so với Gemini 2.5 Pro trong hiểu ngữ cảnh dài

Chiến Lược Định Giá Để Thâm Nhập Thị Trường

MiniMax đã triển khai cấu trúc định giá theo tầng được thiết kế để tối đa hóa khả năng tiếp cận đồng thời duy trì lợi thế cạnh tranh. Đối với độ dài ngữ cảnh 0-32k token, công ty tính phí 0,8 nhân dân tệ trên triệu token đầu vào và 8 nhân dân tệ trên triệu token đầu ra. Phạm vi 32k-128k có giá 1,2 nhân dân tệ cho đầu vào và 16 nhân dân tệ cho đầu ra trên triệu token, trong khi phạm vi tối đa 128k-1M được định giá 2,4 nhân dân tệ cho đầu vào và 24 nhân dân tệ cho đầu ra. Chiến lược định giá này định vị M1 hiệu quả về chi phí hơn DeepSeek R1 ở hai tầng đầu, đồng thời cung cấp khả năng độc đáo ở tầng cao nhất mà DeepSeek không thể sánh kịp.

So sánh giá cả (trên triệu token)

Độ dài ngữ cảnh	Giá đầu vào (CNY)	Giá đầu ra (CNY)
0-32k	0.8	8
32k-128k	1.2	16
128k-1M	2.4	24

Lưu ý: Hai bậc đầu tiên có tỷ lệ giá-hiệu suất tốt hơn DeepSeek R1; bậc cao nhất không có sẵn trong DeepSeek

Hệ Sinh Thái Sản Phẩm Rộng Lớn Hơn Và Tham Vọng IPO

Việc ra mắt M1 chỉ là một thành phần trong chuỗi thông báo sản phẩm năm ngày toàn diện của MiniMax , bao gồm cả mô hình tạo video Hailuo 02 và nền tảng MiniMax Agent . Đợt tung sản phẩm tích cực này diễn ra khi công ty được báo cáo đang chuẩn bị cho IPO tiềm năng tại Hồng Kông, theo sau động thái trước đó của đối thủ Zhipu AI nộp hồ sơ niêm yết công khai. Các nhà quan sát ngành lưu ý rằng MiniMax đối mặt với những thách thức đáng kể trong việc đáp ứng yêu cầu doanh thu IPO, với thu nhập hiện tại chủ yếu phụ thuộc vào ứng dụng nhập vai nhân vật Talkie thành công và nền tảng video AI Hailuo mới hơn.

Vị Thế Thị Trường Và Triển Vọng Tương Lai

Định vị chiến lược của MiniMax phản ánh sự cạnh tranh gay gắt giữa các startup AI Trung Quốc để duy trì sự liên quan sau sự gián đoạn thị trường của DeepSeek . Trọng tâm của công ty vào khả năng đa phương thức, đặc biệt trong tạo video nơi Hailuo AI đã đạt được vị trí dẫn đầu toàn cầu trong bảng xếp hạng sản phẩm tạo video, cung cấp phương pháp khác biệt so với các đối thủ chỉ tập trung vào văn bản. Tuy nhiên, thành công của M1 và các sản phẩm liên quan cuối cùng sẽ quyết định liệu MiniMax có thể duy trì vị thế trong số các công ty AI hàng đầu Trung Quốc đồng thời xây dựng nền tảng doanh thu cần thiết cho việc gia nhập thành công thị trường công khai.

Tin tức liên quan

‌

‌
‌

‌

‌
‌

‌