NVIDIA đã âm thầm phát hành một họ mô hình AI lý luận mới có tên OpenReasoning-Nemotron , đánh dấu một sự thay đổi đáng kể trong cách tiếp cận phát triển AI mã nguồn mở của công ty. Trong khi thông báo ban đầu tập trung vào họ Llama Nemotron , bản phát hành thực tế lại tiết lộ một nền tảng kỹ thuật khác biệt đã thu hút sự chú ý của cộng đồng AI.
Các Mô Hình Được Xây Dựng Trên Kiến Trúc DeepSeek R1
Khía cạnh nổi bật nhất của bản phát hành này là các mô hình OpenReasoning-Nemotron của NVIDIA thực sự được chưng cất từ mô hình R1 0528 khổng lồ 671 tỷ tham số của DeepSeek , thay vì được xây dựng trên kiến trúc Llama của Meta như ban đầu được gợi ý. Điều này thể hiện một sự khởi hành đáng chú ý khỏi các hợp tác trước đây của NVIDIA và làm nổi bật ảnh hưởng ngày càng tăng của khả năng lý luận của DeepSeek trong bối cảnh AI.
Họ mô hình bao gồm bốn biến thể với 1,5 tỷ, 7 tỷ, 14 tỷ và 32 tỷ tham số, mỗi biến thể được thiết kế để phục vụ các yêu cầu tính toán và kịch bản triển khai khác nhau. Phạm vi này cho phép các nhà phát triển chọn kích thước mô hình phù hợp dựa trên các ràng buộc phần cứng cụ thể và nhu cầu hiệu suất của họ.
DeepSeek R1: Một mô hình ngôn ngữ lớn được phát triển bởi công ty AI Trung Quốc DeepSeek , nổi tiếng với khả năng lý luận mạnh mẽ và số lượng tham số khổng lồ.
Các biến thể mô hình OpenReasoning-Nemotron :
- 1.5B tham số - Được tối ưu hóa cho các thiết bị edge và PC
- 7B tham số - Hiệu suất cân bằng cho triển khai GPU đơn
- 14B tham số - Nâng cao khả năng lý luận cho các máy chủ tầm trung
- 32B tham số - Độ chính xác tối đa cho các hệ thống doanh nghiệp đa GPU
Phản Ứng Cộng Đồng và Chi Tiết Kỹ Thuật
Cộng đồng phát triển AI đã thể hiện phản ứng trái chiều về thời điểm phát hành và thông số kỹ thuật. Một số nhà phát triển đã lưu ý sự nhầm lẫn giữa thông báo tháng 3 ban đầu và bản phát hành hiện tại, cho rằng việc truyền thông của NVIDIA xung quanh việc ra mắt sản phẩm này không được rõ ràng.
Việc truy cập các mô hình yêu cầu xác thực thông qua nền tảng build của NVIDIA , điều này đã tạo ra một số ma sát cho các nhà phát triển mong muốn thử nghiệm các khả năng lý luận mới. Các mô hình có sẵn thông qua cả các kênh chính thức của NVIDIA và Hugging Face , cung cấp nhiều con đường để tích hợp vào các quy trình làm việc AI hiện có.
Nền tảng kỹ thuật:
- Được chưng cất từ DeepSeek R1 0528 (671 tỷ tham số)
- Có sẵn thông qua NVIDIA build.nvidia.com và Hugging Face
- Yêu cầu xác thực để truy cập mô hình
- Là một phần của nền tảng phần mềm NVIDIA AI Enterprise
Tuyên Bố Hiệu Suất và Ứng Dụng Thực Tế
NVIDIA tuyên bố các mô hình mới mang lại độ chính xác tốt hơn tới 20% so với các mô hình cơ sở và đạt tốc độ suy luận nhanh hơn 5 lần so với các mô hình lý luận mở cạnh tranh. Những cải thiện hiệu suất này có thể tác động đáng kể đến việc áp dụng doanh nghiệp, đặc biệt trong các kịch bản yêu cầu ra quyết định phức tạp và các nhiệm vụ lý luận nhiều bước.
Công ty đã định vị các mô hình này như những công cụ nền tảng để xây dựng các hệ thống AI tác nhân - các tác nhân AI tự động có thể hoạt động độc lập hoặc theo nhóm để giải quyết các vấn đề phức tạp. Điều này phù hợp với xu hướng rộng lớn của ngành hướng tới các ứng dụng AI tinh vi hơn có thể xử lý các thách thức kinh doanh thực tế với sự can thiệp tối thiểu của con người.
Việc phát hành OpenReasoning-Nemotron thể hiện sự tiếp tục thúc đẩy của NVIDIA vào bối cảnh cạnh tranh của các mô hình AI lý luận. Mặc dù nền tảng kỹ thuật có thể khác với các thông báo ban đầu, việc tập trung vào các ứng dụng doanh nghiệp thực tế và các chỉ số hiệu suất được cải thiện cho thấy những mô hình này có thể đóng vai trò quan trọng trong giai đoạn tiếp theo của việc triển khai AI trên các ngành công nghiệp.