Công ty nghiên cứu AI Trung Quốc DeepSeek đã chính thức công bố mô hình mã nguồn mở mới nhất của mình, DeepSeek-V3.1 , đánh dấu một bước tiến đáng kể trong khả năng trí tuệ nhân tạo đồng thời công bố việc tăng giá đáng kể cho các dịch vụ API. Bản phát hành này không chỉ là một nâng cấp tham số từ 671 tỷ lên 685 tỷ tham số—mà còn giới thiệu kiến trúc lý luận lai đột phá có thể định hình lại cách các hệ thống AI tương tác với người dùng và xử lý các tác vụ phức tạp.
Kiến trúc lý luận lai cách mạng
DeepSeek-V3.1 giới thiệu kiến trúc lý luận lai đầu tiên trong ngành cho phép một mô hình duy nhất chuyển đổi liền mạch giữa chế độ suy nghĩ ( deepseek-reasoner ) và chế độ không suy nghĩ ( deepseek-chat ). Người dùng có thể chuyển đổi giữa các chế độ này thông qua ứng dụng chính thức hoặc giao diện web bằng nút suy nghĩ sâu. Chế độ không suy nghĩ nhắm đến các truy vấn đơn giản như thời tiết hoặc câu hỏi bách khoa toàn thư, cung cấp kết quả được tối ưu hóa với thời gian phản hồi nhanh hơn 20%. Trong khi đó, chế độ suy nghĩ giải quyết các vấn đề phức tạp như chứng minh toán học và gỡ lỗi mã bằng cách kích hoạt chuỗi lý luận sâu bên trong, tạo ra logic chặt chẽ hơn với chi phí phản hồi chậm hơn một chút.
Nâng cao hiệu quả thông qua nén chuỗi suy nghĩ
Mô hình mới thể hiện những cải thiện hiệu quả đáng kể thông qua việc đào tạo nén chuỗi suy nghĩ tiên tiến. DeepSeek-V3.1 duy trì mức hiệu suất tương đương với phiên bản tiền nhiệm R1-0528 trong khi giảm việc tạo token đầu ra 20-50%. Các tác vụ trước đây yêu cầu 1000 token giờ đây có thể hoàn thành chỉ với 500 token trong khi vẫn duy trì chất lượng đầu ra tương đương. Việc tăng hiệu quả này dẫn đến chi phí tính toán thấp hơn đáng kể và giảm độ trễ phản hồi, làm cho công nghệ này dễ tiếp cận hơn cho việc triển khai rộng rãi.
Điểm chuẩn hiệu suất
Bài kiểm tra | Điểm số DeepSeek-V3.1 | Điểm số mô hình trước đó |
---|---|---|
Toán học AIME 2015 | 87.5/100 | 88.4/100 |
Khoa học GPQA | 81/100 | 80.1/100 |
liveCodeBench | 73.3/100 | 74.8/100 |
Giảm thiểu Token | Ít hơn 20-50% | Cơ sở |
Thông số kỹ thuật và điểm chuẩn hiệu suất
Được xây dựng trên kiến trúc Mixture-of-Experts (MoE), 685 tỷ tham số của DeepSeek-V3.1 chỉ kích hoạt 37 tỷ tham số mỗi token, đạt được sự cân bằng tối ưu giữa hiệu quả và hiệu suất. Mô hình hỗ trợ nhiều định dạng tensor bao gồm BF16, FP8 (F8_E4M3) và F32, cung cấp cho các nhà phát triển tính linh hoạt tối ưu hóa phần cứng. Mô hình cơ sở đã trải qua đào tạo bổ sung với 840 tỷ token ngoài nền tảng V3, mở rộng khả năng xử lý ngữ cảnh dài lên 128K token—tương đương với khoảng 130.000 ký tự Trung Quốc hoặc 80 chương đầu của Hồng Lâu Mộng.
So sánh Thông số Kỹ thuật Mô hình
Tính năng | DeepSeek-V3 | DeepSeek-V3.1 |
---|---|---|
Tổng số Tham số | 671 tỷ | 685 tỷ |
Tham số Hoạt động mỗi Token | 37 tỷ | 37 tỷ |
Cửa sổ Ngữ cảnh | 128K token | 128K token |
Huấn luyện Bổ sung | - | 840B token |
Tiêu chuẩn Độ chính xác | FP8 tiêu chuẩn | UE8M0 FP8 |
Kiến trúc | MoE | MoE Lai |
Áp dụng chiến lược tiêu chuẩn UE8M0 FP8
Có lẽ quan trọng nhất đối với bối cảnh AI toàn cầu, DeepSeek-V3.1 áp dụng tiêu chuẩn độ chính xác UE8M0 FP8 được thiết kế đặc biệt cho chip nội địa Trung Quốc thế hệ tiếp theo. Quyết định kỹ thuật này đại diện cho sự khởi hành chiến lược khỏi các tiêu chuẩn E4M3/E5M2 FP8 của NVIDIA , có khả năng tạo ra hai con đường hệ sinh thái AI riêng biệt. Định dạng UE8M0 ưu tiên tiêu thụ điện năng thấp hơn và tính toán nhanh hơn so với độ chính xác cao hơn được cung cấp bởi các tiêu chuẩn của NVIDIA , làm cho nó phù hợp hơn cho các kiến trúc chip nội địa với triết lý thiết kế khác nhau.
Điều chỉnh giá API đáng kể
Cùng với thông báo kỹ thuật, DeepSeek đã tiết lộ những thay đổi giá đáng kể có hiệu lực từ ngày 6 tháng 9. Giá đầu vào cho cache miss sẽ tăng từ 2 nhân dân tệ lên 4 nhân dân tệ mỗi triệu token, trong khi giá đầu ra tăng từ 8 lên 12 nhân dân tệ mỗi triệu token. Công ty cũng đang loại bỏ các khoản giảm giá ban đêm. Những điều chỉnh này phản ánh các khoản đầu tư nghiên cứu và phát triển đáng kể cần thiết cho việc nâng cấp V3.1, bao gồm việc đào tạo bổ sung 840 tỷ token và thích ứng độ chính xác UE8M0 FP8 để tương thích với chip nội địa.
Thay đổi giá API (Có hiệu lực từ ngày 6 tháng 9 năm 2025)
Loại dịch vụ | Giá trước đây | Giá mới | Thay đổi |
---|---|---|---|
Đầu vào (cache miss) | ¥2/triệu token | ¥4/triệu token | +100% |
Đầu vào (cache hit) | ¥0.5/triệu token | ¥0.5/triệu token | Không thay đổi |
Đầu ra | ¥8/triệu token | ¥12/triệu token | +50% |
Giảm giá ban đêm | Có sẵn | Đã loại bỏ | Bị xóa |
Tác động thị trường và ý nghĩa ngành
Việc phát hành đã tạo ra phản ứng thị trường đáng kể, với các cổ phiếu liên quan đến AI có mức tăng đáng chú ý. Các công ty như Cambricon , sản xuất chip AI tương thích với công nghệ của DeepSeek , đã có mức tăng trong phiên gần 14%. Giấy phép MIT mã nguồn mở của mô hình và tối ưu hóa API dự kiến sẽ đẩy nhanh việc triển khai AI agent trong các lĩnh vực tài chính, y tế và tự động hóa văn phòng. Các nhà phân tích ngành dự đoán thị trường AI agent có thể đạt 852 tỷ nhân dân tệ vào năm 2028, với tỷ lệ tăng trưởng kép hàng năm là 72,7%.
Tác động thị trường chứng khoán (Ngày công bố)
- Cambricon (688256.SH): Tăng +14% trong phiên
- Kunlun Wanwei (300418.SZ): Tăng +10%
- Hanvon Ugee (300170.SZ): Giao dịch sôi động trong các khái niệm AI agent
- iFlytek (002230.SZ): Hiệu suất +35% tính từ đầu năm
- Wondershare (300624.SZ): Tăng +80% trong năm, tăng trưởng lợi nhuận +42%
Tương lai cạnh tranh hệ sinh thái AI
Các lựa chọn chiến lược của DeepSeek với V3.1 báo hiệu một sự thay đổi rộng lớn hơn trong bối cảnh AI toàn cầu. Bằng cách áp dụng các tiêu chuẩn kỹ thuật nội địa và chứng minh rằng khả năng AI tiên tiến không yêu cầu tài nguyên tính toán khổng lồ, công ty đang định vị mình như một nhà lãnh đạo trong con đường phát triển hiệu suất cao nhẹ. Cách tiếp cận này cung cấp cơ hội cho các nhà phát triển nhỏ hơn trên toàn thế giới tham gia vào đổi mới AI trong khi có khả năng tạo ra các hệ sinh thái AI song song dựa trên các nền tảng kỹ thuật khác nhau và các cân nhắc địa chính trị.