Siêu chip Vera Rubin của Nvidia ra mắt: 6 nghìn tỷ bóng bán dẫn và 100 PetaFLOPS cho AI

Nhóm biên tập BigGo
Siêu chip Vera Rubin của Nvidia ra mắt: 6 nghìn tỷ bóng bán dẫn và 100 PetaFLOPS cho AI

Trong một bước nhảy vọt quan trọng đối với điện toán trí tuệ nhân tạo, Nvidia đã chính thức trình làng nền tảng siêu chip Vera Rubin thế hệ tiếp theo. Được tiết lộ trong bài phát biểu quan trọng tại GTC của Giám đốc điều hành Jensen Huang, kiệt tác kiến trúc này đại diện cho thế hệ kế thừa đầy tham vọng của công ty sau thế hệ Blackwell hiện tại và hứa hẹn sẽ định nghĩa lại ranh giới của hiệu suất tính toán cho các tác vụ AI và điện toán hiệu năng cao. Thông báo này báo hiệu sự thống trị tiếp tục của Nvidia trong lĩnh vực phần cứng AI với một sản phẩm kết hợp số lượng bóng bán dẫn khổng lồ với mật độ tính toán chưa từng có.

Tổng quan Kiến trúc và Thiết kế Vật lý

Siêu chip Vera Rubin xuất hiện như một bảng mạch tính toán hoàn chỉnh thay vì một con chip đơn lẻ, có một bo mạch in dày đóng vai trò chủ nhà cho ba thành phần chính trong một dạng thức cực kỳ nhỏ gọn. Trái tim của nó là hai GPU Rubin chuyên cho các tác vụ AI và HPC, nằm hai bên CPU Vera 88 nhân được Nvidia thiết kế tùy chỉnh. Toàn bộ cụm lắp ráp đại diện cho một bước tiến hóa quan trọng trong tích hợp hệ thống, với bo mạch đáng chú ý là loại bỏ các đầu nối cáp truyền thống để ưu tiên các giải pháp tích hợp hơn. Hai đầu nối mặt phẳng NVLink được đặt ở cạnh trên tạo điều kiện mở rộng quy mô theo chiều dọc trong các tủ máy chủ, trong khi ba đầu nối ở cạnh dưới xử lý việc cấp nguồn, kết nối PCIe và các giao diện CXL.

Thông số Hiệu suất Chưa từng có

Nvidia tuyên bố Siêu chip Vera Rubin mang lại hiệu suất 100 PetaFLOPS ở chuẩn FP4 được tối ưu hóa đặc biệt cho các tác vụ AI. Sức mạnh tính toán này thể hiện mức tăng gấp 100 lần so với hệ thống AI DGX Spark của công ty và là minh chứng cho sự tăng tốc nhanh chóng của khả năng phần cứng AI. Sáu nghìn tỷ bóng bán dẫn của nền tảng—gấp 60 lần so với GPU chơi game RTX 5090 dự kiến dành cho người tiêu dùng—cho phép thông lượng tính toán khổng lồ này. Thành phần CPU Vera mang lại khả năng xử lý đa năng đáng kể với 88 nhân Arm tùy chỉnh hỗ trợ 176 luồng phần mềm, cung cấp kiến trúc hệ thống cân bằng cho các tác vụ tính toán đa dạng.

Thông số kỹ thuật chính của Nvidia Vera Rubin Superchip:

  • Hiệu năng AI: 100 PetaFLOPS (FP4)
  • Tổng số Transistor: 6 nghìn tỷ
  • CPU: Bộ xử lý Arm tùy chỉnh Vera 88 nhân (176 luồng)
  • Cấu hình GPU: Hai gói Rubin GPU, mỗi gói chứa hai die tính toán
  • Bộ nhớ: 8 module SOCAMM2 với LPDDR, 8 stack HBM4 trên mỗi GPU
  • Kết nối: 2 đầu nối backplane NVLink, 3 đầu nối đa năng ở phía dưới
  • Lộ trình sản xuất: Quý 4 năm 2026 (dự kiến triển khai đầu năm 2027)
Con chip NVIDIA là trái tim của nền tảng Vera Rubin Superchip, đại diện cho khả năng hiệu năng AI và HPC tiên tiến hàng đầu
Con chip NVIDIA là trái tim của nền tảng Vera Rubin Superchip, đại diện cho khả năng hiệu năng AI và HPC tiên tiến hàng đầu

Thông tin Chi tiết về Đóng gói và Sản xuất

Việc kiểm tra vật lý mẫu trình diễn cho thấy các công nghệ đóng gói tinh vi cho phép đạt được các thông số kỹ thuật ấn tượng của Siêu chip. Mỗi GPU Rubin dường như bao gồm hai chiplet tính toán đi kèm với tám chồng bộ nhớ HBM4 và các chiplet I/O chuyên dụng. Bản thân CPU Vera cho thấy bằng chứng về thiết kế đa chiplet với các đường nối bên trong có thể nhìn thấy và các chiplet I/O riêng biệt được đặt liền kề với cụm bộ xử lý chính. Các ký hiệu trên vỏ GPU cho thấy chúng được lắp ráp tại Đài Loan vào tuần thứ 38 của năm 2025, ám chỉ rằng Nvidia đã phát triển và thử nghiệm các linh kiện này trong vài tháng qua.

Bộ nhớ và Quản lý Nhiệt

Bo mạch Vera Rubin tích hợp tám mô-đun SOCAMM2 chứa bộ nhớ LPDDR, cung cấp băng thông đáng kể để cấp dữ liệu cho các động cơ tính toán. Việc quản lý nhiệt được xử lý thông qua các tấm tản nhiệt bằng nhôm hình chữ nhật lớn phủ lên các GPU Rubin, với kích thước tương tự như những tấm được sử dụng trên các bộ xử lý Blackwell hiện tại. Thiết kế nhỏ gọn nhưng mạnh mẽ này cho thấy sự tập trung của Nvidia vào mật độ tính toán trong khi vẫn duy trì khả năng khả thi về nhiệt cho các triển khai trong trung tâm dữ liệu. Toàn bộ nền tảng đại diện cho một cách tiếp cận cân bằng cẩn thận đối với hệ thống phân cấp bộ nhớ, cấp nguồn và tản nhiệt cho hoạt động hiệu năng cao được duy trì.

Lộ trình Sản xuất và Tác động Ngành

Nvidia đã thông báo rằng Siêu chip Vera Rubin sẽ bước vào giai đoạn sản xuất vào khoảng quý 4 năm 2026, với CEO Jensen Huang gợi ý rằng lộ trình thậm chí có thể sớm hơn một chút so với mục tiêu đó. Điều này định vị nền tảng này để triển khai vào đầu năm 2027, tiếp tục nhịp độ giới thiệu bộ tăng tốc AI hàng năm đầy tham vọng của công ty. Mẫu kỹ thuật được trình diễn dường như đang ở giai đoạn phát triển nâng cao, cho thấy kiến trúc về cơ bản đã được hoàn thiện và đang tiến tới sản xuất hàng loạt. Chu kỳ đổi mới nhanh chóng này củng cố chiến lược của Nvidia trong việc duy trì vị thế dẫn đầu về công nghệ trên thị trường phần cứng AI đầy cạnh tranh.

Hiệu suất So sánh và Bối cảnh Lịch sử

Nền tảng Vera Rubin đại diện cho một sự tăng tốc phi thường về khả năng tính toán khi so sánh với các điểm chuẩn lịch sử. Huang lưu ý rằng Siêu chip mới cung cấp hiệu suất gấp khoảng 100 lần so với hệ thống DGX One của Nvidia từ chín năm trước—cũng là nền tảng được báo cáo là cung cấp sức mạnh cho các nỗ lực nghiên cứu ban đầu của OpenAI. So sánh này làm nổi bật sự tăng trưởng theo cấp số nhân về sức mạnh tính toán AI đã diễn ra trong vòng một thập kỷ, thay đổi cơ bản những gì có thể trong nghiên cứu và triển khai trí tuệ nhân tạo. Bước nhảy vọt về hiệu suất cho phép các lớp mô hình và ứng dụng AI mới mà trước đây bị giới hạn bởi các hạn chế về tính toán.

So sánh hiệu năng:

  • Nhiều hơn 60 lần số lượng transistor so với GPU gaming RTX 5090 (dự kiến)
  • Nhiều hơn 100 lần sức mạnh tính toán AI so với hệ thống DGX Spark
  • Nhanh hơn 100 lần so với DGX One từ 9 năm trước
  • Sử dụng công nghệ quy trình sản xuất N3 của TSMC

Hàm ý Tương lai và Vị thế Thị trường

Với Siêu chip Vera Rubin, Nvidia tiếp tục đẩy xa ranh giới của những gì có thể trong điện toán AI chuyên biệt. Các lựa chọn kiến trúc của nền tảng—đặc biệt là CPU Vera tùy chỉnh dựa trên Arm với hỗ trợ đa luồng—gợi ý các hướng đi tiềm năng trong tương lai cho chiến lược bộ xử lý rộng hơn của Nvidia. Việc tích hợp tài nguyên CPU và GPU trên một bo mạch duy nhất phản ánh xu hướng chuyển dịch của ngành công nghiệp hướng tới các kiến trúc tính toán dị thể được tối ưu hóa cho các tác vụ AI. Khi các mô hình AI ngày càng trở nên phức tạp và đòi hỏi cao, các nền tảng như Vera Rubin sẽ trở thành cơ sở hạ tầng thiết yếu cho các nhà nghiên cứu và doanh nghiệp tìm cách khai thác các khả năng trí tuệ nhân tạo tiên tiến.