Nvidia đã đạt được một cột mốc quan trọng trong lộ trình máy tính thế hệ tiếp theo khi các nguyên mẫu nền tảng Rubin của công ty đã chính thức bước vào giai đoạn thử nghiệm chất lượng tại TSMC . Sự phát triển này không chỉ đơn thuần là một bản cập nhật sản phẩm thông thường, mà đánh dấu một sự chuyển đổi kiến trúc cơ bản có thể định hình lại bối cảnh của điện toán trí tuệ nhân tạo và cơ sở hạ tầng trung tâm dữ liệu siêu quy mô.
Lộ trình phát hành:
- Tình trạng hiện tại: Thử nghiệm đủ tiêu chuẩn nguyên mẫu tại TSMC
- Dòng Rubin : Dự kiến ra mắt thị trường ~2026
- Rubin Ultra : Dự kiến phát hành ~2027
- Lưu ý: Lộ trình có thể thay đổi tùy thuộc vào năng suất sản xuất và sự sẵn sàng của nhà máy sản xuất
Cuộc cách mạng kiến trúc toàn nền tảng
Nền tảng Rubin giới thiệu bước đột phá đầu tiên của Nvidia vào công nghệ phân vùng chiplet, một sự thay đổi chiến lược khỏi thiết kế chip nguyên khối truyền thống. Cuộc đại tu toàn diện này bao gồm sáu thành phần riêng biệt: một CPU chuyên dụng, nhiều biến thể GPU , một switch NVLink mở rộng để tăng cường thông lượng dữ liệu, chip mạng, switch, và một bộ xử lý photonics silicon được thiết kế để tối ưu hóa kết nối quy mô rack và liên kết quang học ngoài chip. Nền tảng này sẽ sử dụng quy trình chế tạo N3P tiên tiến của TSMC kết hợp với công nghệ đóng gói CoWoS-L , đại diện cho một bước nhảy vọt đáng kể trong độ tinh vi của sản xuất.
Các thành phần của nền tảng Rubin:
- CPU chuyên dụng ( Vera Rubin CPU )
- Nhiều biến thể GPU
- Bộ chuyển mạch scale-up NVLink
- Chip mạng
- Thành phần chuyển mạch
- Bộ xử lý silicon photonics
Cải tiến bộ nhớ và hiệu suất
Trung tâm của kiến trúc Rubin là việc chuyển đổi sang các stack bộ nhớ HBM4 thế hệ tiếp theo, có thiết kế base die tùy chỉnh được thiết kế để duy trì các yêu cầu băng thông cao hơn và đáp ứng các khối lượng công việc tính toán ngày càng khắt khe. Bản thân các compute die vật lý sẽ lớn hơn đáng kể so với các sản phẩm thế hệ hiện tại, cho phép khả năng xử lý lớn hơn. Thử nghiệm xác thực sớm đã được tiến hành, tập trung vào tối ưu hóa hiệu suất nhiệt, hiệu quả tiêu thụ điện năng và độ tin cậy của kết nối.
Thông số kỹ thuật:
- Quy trình sản xuất: Công nghệ chế tạo TSMC N3P
- Đóng gói: Công nghệ CoWoS-L
- Bộ nhớ: Các stack bộ nhớ HBM4 với base die tùy chỉnh
- Kiến trúc: Thiết kế phân vùng chiplet (lần đầu tiên của Nvidia)
- Compute Dies: Lớn hơn thế hệ hiện tại
Quan hệ đối tác chiến lược với TSMC được củng cố
Trong chuyến thăm gần đây của CEO Jensen Huang tới Đài Loan , vị giám đốc điều hành đã nhấn mạnh tầm quan trọng thiết yếu của quan hệ đối tác giữa Nvidia và TSMC , thậm chí còn gợi ý rằng các nhà đầu tư mua cổ phiếu TSMC sẽ là một quyết định thông minh. Huang đã cá nhân cảm ơn các đội ngũ vận hành TSMC vì sự cống hiến của họ cho dự án, làm nổi bật tính chất hợp tác trong việc phát triển các giải pháp máy tính tiên tiến này. Mối quan hệ đã phát triển để định vị Nvidia là khách hàng lớn nhất của TSMC , với cả hai công ty đều đầu tư mạnh mẽ vào sự thành công của các nền tảng điện toán AI tương lai.
Chuyển đổi hệ sinh thái phần mềm
Ngoài các đổi mới phần cứng, Nvidia đang triển khai các cập nhật toàn diện cho cơ sở hạ tầng phần mềm hỗ trợ, bao gồm các sửa đổi đáng kể đối với compiler và hệ thống runtime được thiết kế để khai thác hoàn toàn kiến trúc chiplet mới. Những cải tiến phần mềm này sẽ rất quan trọng đối với các nhà phát triển và doanh nghiệp muốn tối đa hóa lợi ích hiệu suất của nền tảng Rubin trên các ứng dụng AI và điện toán hiệu suất cao khác nhau.
Lịch trình thị trường và tác động ngành
Nvidia kỳ vọng dòng sản phẩm Rubin sẽ được giới thiệu ra thị trường vào khoảng năm 2026, với biến thể Rubin Ultra tiên tiến hơn dự kiến vào năm 2027. Các lịch trình này vẫn phụ thuộc vào năng suất sản xuất và sự sẵn sàng của cơ sở chế tạo. Việc ra mắt nền tảng này diễn ra vào thời điểm quan trọng khi các trung tâm dữ liệu siêu quy mô và khối lượng công việc AI đang đòi hỏi khả năng tính toán chưa từng có, với các nhà quan sát ngành mô tả môi trường hiện tại là yêu cầu các nhà máy token AI có khả năng hỗ trợ hàng triệu đơn vị xử lý hoạt động và các ứng dụng trí tuệ nhân tạo thế hệ tiếp theo.