Bối cảnh điện toán trí tuệ nhân tạo đang chứng kiến một sự thay đổi đáng kể khi NVIDIA mở rộng nền tảng phần mềm CUDA vượt ra ngoài các kiến trúc bộ xử lý truyền thống. Sự phát triển này hứa hẹn sẽ dân chủ hóa điện toán AI bằng cách giới thiệu một giải pháp thay thế mã nguồn mở có thể định hình lại cách các công ty tiếp cận các giải pháp điện toán hiệu suất cao.
![]() |
---|
Cận cảnh bo mạch chủ tượng trưng cho công nghệ phức tạp đằng sau việc mở rộng CUDA của NVIDIA sang kiến trúc RISC-V |
Cam Kết Chiến Lược Của NVIDIA Đối Với Tích Hợp RISC-V
Tại Hội nghị thượng đỉnh RISC-V Trung Quốc 2025 được tổ chức tại khu Zhangjiang của Shanghai vào ngày 17 tháng 7, Phó Chủ tịch NVIDIA Frans Sijstermanns đã đưa ra một thông báo đột phá trong bài phát biểu chính có tiêu đề Triển Khai Bộ Xử Lý Ứng Dụng RISC-V Trên Nền Tảng Điện Toán NVIDIA. Công ty chính thức xác nhận rằng ngăn xếp phần mềm CUDA hàng đầu trong ngành sẽ nhận được sự hỗ trợ toàn diện cho kiến trúc RISC-V, đánh dấu một thời điểm quan trọng đối với hệ sinh thái bộ xử lý mã nguồn mở.
Mối quan hệ của NVIDIA với RISC-V mở rộng sâu hơn nhiều so với thông báo gần đây này. Công ty đã chọn RISC-V làm kiến trúc kế thừa cho các vi điều khiển Falcon độc quyền của mình từ năm 2015, thể hiện cam kết một thập kỷ với nền tảng này. Quyết định chiến lược này đã mang lại kết quả đáng kể, với NVIDIA đã vận chuyển hơn một tỷ bộ xử lý RISC-V được tích hợp vào GPU, CPU, SoC và các sản phẩm khác trong suốt năm 2024.
Lộ trình và Cột mốc RISC-V của NVIDIA
- 2015: NVIDIA chọn RISC-V làm người kế nhiệm cho vi điều khiển Falcon
- 2024: Hơn 1 tỷ bộ xử lý RISC-V được xuất xưởng trong các sản phẩm NVIDIA
- 2024 tháng 10: Tiết lộ tại Hội nghị thượng đỉnh RISC-V Bắc Mỹ
- 2025 ngày 17 tháng 7: Thông báo chính thức hỗ trợ CUDA RISC-V tại Hội nghị thượng đỉnh Trung Quốc
Kiến Trúc Kỹ Thuật và Thách Thức Triển Khai
Hệ sinh thái phần mềm CUDA bao gồm hai thành phần cơ bản cần được chuyển đổi cẩn thận sang hệ thống RISC-V. CUDA Toolkit hoạt động như một trình biên dịch toàn diện với khả năng biên dịch mở rộng và nhiều thành phần tích hợp, trong khi thành phần driver quản lý giao tiếp phần cứng và phân bổ tài nguyên. Sijstermanns giải thích rằng NVIDIA đang tích cực làm việc để chuyển đổi các phần được đánh dấu màu xanh lá cây trong ngăn xếp phần mềm của họ, bao gồm các yếu tố quan trọng như CUDA Kernel Mode Driver (KMD) và CUDA User Mode Driver (UMD).
Quá trình chuyển đổi mở rộng ra ngoài tầm kiểm soát trực tiếp của NVIDIA, vì các ứng dụng bên thứ ba và thư viện chuyên biệt cũng phải trải qua quá trình thích ứng để tương thích với RISC-V. NVIDIA đã phát triển hơn 900 thư viện chuyên biệt trên nhiều ngành công nghiệp khác nhau trong hai thập kỷ phát triển CUDA, bao gồm thư viện tăng tốc suy luận, công cụ phân tích dữ liệu và gói tăng tốc sản xuất chất bán dẫn. Những thư viện này đại diện cho một hệ sinh thái khổng lồ sẽ dần dần có sẵn cho các nhà phát triển RISC-V.
Các thành phần của CUDA Software Stack cần chuyển đổi sang RISC-V
- CUDA Toolkit (trình biên dịch và công cụ phát triển)
- CUDA Kernel Mode Driver (KMD)
- CUDA User Mode Driver (UMD)
- Hơn 900 thư viện chuyên ngành
- Các ứng dụng và framework của bên thứ ba (ví dụ: PyTorch )
Yêu Cầu Phần Cứng và Hạn Chế Hiện Tại
Thách thức chính đối với việc triển khai CUDA trên RISC-V tập trung vào tính khả dụng và khả năng tương thích của phần cứng. Sijstermanns nhấn mạnh rằng việc triển khai CUDA thành công không chỉ yêu cầu CPU RISC-V mà còn cần cấu hình phần cứng GPU tương thích. Trong khi NVIDIA đã làm việc với các bộ xử lý như CPU C920 RISC-V của DAMO Academy Alibaba cho mục đích phát triển, hệ sinh thái hiện tại thiếu các SoC hỗ trợ đầy đủ đặc tả RVA23 được phê duyệt gần đây.
Bộ nhớ ảo thống nhất đại diện cho một yêu cầu quan trọng để có hiệu suất CUDA tối ưu trên hệ thống RISC-V. Công nghệ này cho phép chia sẻ dữ liệu liền mạch giữa không gian bộ nhớ CPU và GPU, cho phép sao chép dữ liệu hiệu quả và duy trì tính nhất quán trên các đơn vị xử lý. Không có sự hỗ trợ bộ nhớ thống nhất phù hợp, trải nghiệm người dùng và lợi ích hiệu suất xác định sức hấp dẫn của CUDA sẽ bị ảnh hưởng đáng kể.
Tác Động Ngành Công Nghiệp và Ý Nghĩa Thị Trường
Việc mở rộng hỗ trợ CUDA cho các bộ xử lý RISC-V đặt ra một thách thức đáng kể đối với song đầu độc quyền x86 và ARM hiện có trong điện toán AI. Intel và AMD đã thống trị thị trường máy chủ x86, trong khi NVIDIA và các gã khổng lồ công nghệ khác đã đầu tư mạnh vào các giải pháp dựa trên ARM cho khối lượng công việc AI chuyên biệt. Bản chất mã nguồn mở của RISC-V loại bỏ phí cấp phép và thanh toán tiền bản quyền, khiến nó đặc biệt hấp dẫn đối với các startup, nhà phát triển quy mô nhỏ và các tổ chức quan tâm đến chi phí.
Lợi thế về khả năng mở rộng của kiến trúc RISC-V trở nên đặc biệt liên quan trong các ứng dụng AI biên, nơi thiết kế chip đơn giản hóa và quy trình xác minh có thể tăng tốc thời gian phát triển. Các công ty như Tenstorrent của Jim Keller đã bắt đầu tận dụng RISC-V để phát triển chip AI, với các bộ xử lý Wormhole n150 và n300 của họ thể hiện tiềm năng của kiến trúc trong các giải pháp AI hiệu quả về chi phí.
Tích Hợp Tương Lai Với Hệ Sinh Thái Của NVIDIA
Sijstermanns gợi ý về khả năng tích hợp rộng hơn trong hệ sinh thái phần cứng của NVIDIA, đặc biệt liên quan đến công nghệ NVLink. Kiến trúc NVLink Fusion, cho phép giao tiếp tốc độ cao giữa các bộ xử lý và bộ tăng tốc trong môi trường trung tâm dữ liệu, có thể kết hợp các bộ xử lý RISC-V làm thành phần đường dẫn điều khiển. Sự tích hợp này sẽ định vị RISC-V như một yếu tố cơ bản trong thiết kế kiến trúc quy mô rack của NVIDIA.
Cách tiếp cận bất khả tri phần cứng của công ty phản ánh một chiến lược kinh doanh thực dụng tập trung vào điện toán tăng tốc thay vì lòng trung thành với kiến trúc bộ xử lý. Như Sijstermanns lưu ý, mối quan tâm chính của NVIDIA nằm ở việc cung cấp cho các nhà phát triển và người dùng sự linh hoạt tối đa trong lựa chọn điện toán của họ, cho dù họ thích giải pháp x86, ARM hay RISC-V.
Tiến Bộ Của Hệ Sinh Thái RISC-V Kể Từ Năm 2022
- Hơn 10 thông số kỹ thuật mới được phê duyệt bởi Quỹ Quốc Tế RISC-V
- Thông số kỹ thuật RVA23 (quan trọng cho các ứng dụng máy chủ)
- Thông số kỹ thuật SoC máy chủ đã được phê duyệt
- 75 gói phần mềm khác nhau có sẵn trên RISC-V
- Hệ điều hành Linux và hỗ trợ toolchain đã hoàn thành
Lộ Trình Thời Gian và Phát Triển Hệ Sinh Thái
Trong khi NVIDIA đã cam kết hỗ trợ RISC-V của CUDA, công ty nhấn mạnh cách tiếp cận có phương pháp để triển khai. Nhóm phát triển đang làm việc chặt chẽ với các đối tác hệ sinh thái để giải quyết các vấn đề tương thích và đảm bảo chức năng cấp hệ thống toàn diện trước khi phát hành công khai. Cách tiếp cận cẩn thận này phản ánh sự phức tạp của việc chuyển đổi một ngăn xếp phần mềm trưởng thành như CUDA sang một kiến trúc bộ xử lý tương đối mới.
Sự thành công của sáng kiến này phụ thuộc rất nhiều vào sự hợp tác liên tục trong hệ sinh thái RISC-V, bao gồm các nhà sản xuất phần cứng, nhà phát triển phần mềm và nhà tích hợp hệ thống. Khi Quỹ Quốc tế RISC-V tiếp tục phê duyệt các đặc tả mới và mở rộng tính khả dụng của gói phần mềm, nền tảng cho việc tích hợp CUDA trở nên ngày càng vững chắc, hứa hẹn một bối cảnh điện toán AI đa dạng và cạnh tranh hơn.