Cuộc cách mạng trí tuệ nhân tạo đang biến đổi căn bản cả mô hình kinh doanh của Nvidia và hạ tầng cung cấp sức mạnh cho thế hệ máy tính tiếp theo. Trong khi công ty đã trở thành biểu tượng của các trung tâm dữ liệu AI, bộ phận gaming của họ bất ngờ mang lại hiệu suất phá kỷ lục, ngay cả khi những thay đổi rộng lớn trong ngành tiết lộ những thách thức hạ tầng khổng lồ mà việc triển khai AI quy mô lớn đang phải đối mặt.
![]() |
---|
Tổng quan về vai trò đang phát triển của Nvidia trong cơ sở hạ tầng AI và xu hướng hiệu suất gaming |
Bộ phận Gaming vượt kỳ vọng với tăng trưởng kỷ lục
Doanh thu gaming của Nvidia tăng vọt lên mức chưa từng có 3,8 tỷ đô la Mỹ trong Q1 FY26, đánh dấu mức tăng 42% so với cùng kỳ năm trước và tăng 48% so với quý trước đó. Đây là tốc độ tăng trưởng nhanh nhất mà phân khúc GPU gaming đã trải qua trong nhiều năm, vượt kỳ vọng của Wall Street hơn 30%. Sự tăng vọt này chủ yếu được cho là do việc triển khai nhanh chóng kiến trúc Blackwell của Nvidia, mà công ty tuyên bố mang lại cải thiện hiệu suất đáng kể khi kết hợp với công nghệ DLSS và Multi-Frame Generation.
Tuy nhiên, dữ liệu benchmark thực tế cho thấy rằng mức tăng hiệu suất thực sự khiêm tốn hơn so với những gì tài liệu marketing của Nvidia chỉ ra. Những con số doanh thu ấn tượng cũng có thể phản ánh một xu hướng bất ngờ khi các card RTX cao cấp dành cho người tiêu dùng đang được tái sử dụng cho các hoạt động AI quy mô nhỏ bởi các startup và nhà phát triển độc lập không thể tiếp cận phần cứng cấp doanh nghiệp.
Kết quả tài chính Q1 FY26 của Nvidia
- Doanh thu Gaming: 3,8 tỷ USD (+42% so với cùng kỳ năm trước, +48% so với quý trước)
- Tổng doanh thu: 44,1 tỷ USD
- Doanh thu Data Center: 39,1 tỷ USD (+73% so với cùng kỳ năm trước)
- Tỷ trọng Gaming trong tổng doanh thu: 8,5% (giảm từ 45% vào đầu năm 2022)
- Tổn thất liên quan đến Trung Quốc: 4,5 tỷ USD
- Dự kiến tác động doanh thu Q2: 8 tỷ USD
Hạ tầng AI trở thành động lực doanh thu chủ đạo
Mặc dù gaming có hiệu suất mạnh mẽ, nó hiện chỉ chiếm 8,5% tổng doanh thu của Nvidia, giảm mạnh từ 45% vào đầu năm 2022. Sự thay đổi này không phải do sự yếu kém của gaming mà là do sự tăng trưởng bùng nổ của nhu cầu hạ tầng AI. Tổng doanh thu của Nvidia đạt 44,1 tỷ đô la Mỹ trong quý, với 39,1 tỷ đô la Mỹ được tạo ra bởi phân khúc trung tâm dữ liệu - đại diện cho mức tăng trưởng gần 10 lần so với gaming trong hai năm qua.
Sự chuyển đổi này phản ánh tuyên bố của CEO Jensen Huang vào tháng 3 rằng Nvidia đã phát triển thành một nhà cung cấp hạ tầng AI. Tuy nhiên, quý này không thiếu thách thức, khi công ty phải đối mặt với khoản ghi giảm 4,5 tỷ đô la Mỹ do các hạn chế xuất khẩu của Mỹ đối với chip cao cấp sang Trung Quốc, với tác động doanh thu bổ sung 8 tỷ đô la Mỹ dự kiến trong Q2.
Nút thắt cổ chai mạng nổi lên như ràng buộc ẩn của AI
Khi các mô hình AI mở rộng hướng tới kiến trúc nghìn tỷ tham số, công nghệ kết nối mạng đã trở thành nút thắt cổ chai quan trọng hạn chế hiệu quả tính toán. Các trung tâm dữ liệu truyền thống đang trải qua nâng cấp toàn diện để hỗ trợ những gì các nhà phân tích ngành gọi là trung tâm tính toán thông minh mới, nơi băng thông mạng quyết định trực tiếp hiệu quả đào tạo cho các mô hình AI khổng lồ.
Thách thức xuất phát từ yêu cầu đào tạo song song phân tán. Khi các tham số mô hình vượt quá khả năng của một card đơn, hàng trăm GPU phải phối hợp thông qua trao đổi dữ liệu gradient tần số cao. Các chiến lược song song tensor đòi hỏi hàng trăm gigabyte mỗi giây băng thông, khiến các kết nối PCIe truyền thống trở nên lỗi thời.
Yêu Cầu Mở Rộng Quy Mô Mô Hình AI
- Tiêu Chuẩn Hiện Tại: Các mô hình có hàng tỷ tham số
- Mục Tiêu Tiếp Theo: Các mô hình có hàng nghìn tỷ tham số
- Phương Pháp Huấn Luyện: Phân tán song song trên hàng trăm GPU
- Điểm Nghẽn Quan Trọng: Băng thông kết nối mạng
- Tiến Hóa Cơ Sở Hạ Tầng: Trung tâm dữ liệu truyền thống → Trung tâm tính toán thông minh
Các giải pháp kết nối cạnh tranh định hình kiến trúc tương lai
Hai phương pháp chính đang nổi lên cho kết nối nội bộ nút. Công nghệ NVLink thế hệ thứ năm của Nvidia đạt băng thông 1.800 GB/s hỗ trợ giao tiếp liền mạch giữa 576 GPU thông qua chip NVSwitch, mặc dù nó vẫn là một hệ sinh thái độc quyền. Trong khi đó, các tiêu chuẩn mở như OAM và UBB, được thúc đẩy bởi Open Compute Project, định nghĩa các mô-đun gia tốc AI phổ quát và thông số kỹ thuật backplane hỗ trợ môi trường đa nhà cung cấp đồng thời giảm chi phí tích hợp.
Đối với giao tiếp giữa các nút, InfiniBand duy trì ưu thế kỹ thuật với mạng không mất mát gốc và độ trễ đầu cuối đến đầu cuối 2 micro giây hỗ trợ cụm 10.000 card, mặc dù với mức giá cao cấp. RoCEv2 cung cấp một giải pháp thay thế dựa trên Ethernet hiệu quả chi phí hơn với độ trễ 5 micro giây hỗ trợ cấu hình nghìn card, được hỗ trợ bởi các nhà cung cấp như Huawei và H3C, mặc dù nó gặp hạn chế hiệu suất ở quy mô cực lớn.
So sánh Hiệu suất Mạng Hạ tầng AI
Công nghệ | Băng thông | Độ trễ | Hỗ trợ Quy mô | Hệ sinh thái |
---|---|---|---|---|
NVLink Gen 5 | 1,800 GB/s | Cực thấp | 576 GPU | Độc quyền ( Nvidia ) |
InfiniBand | Cao | 2 micro giây | 10,000 card | Trưởng thành, đắt đỏ |
RoCEv2 | Trung bình | 5 micro giây | 1,000 card | Hiệu quả chi phí, mở |
Căng thẳng địa chính trị thúc đẩy cạnh tranh đổi mới
Huang thừa nhận rằng các nhà sản xuất chip Mỹ đã thực sự mất quyền tiếp cận thị trường AI của Trung Quốc do các hạn chế xuất khẩu, mặc dù các báo cáo cho thấy GPU vẫn tiếp tục đến tay khách hàng Trung Quốc thông qua các kênh gián tiếp. Quan trọng hơn, ông cảnh báo rằng kiểm soát xuất khẩu đang thúc đẩy đổi mới của Trung Quốc, với các đối thủ cạnh tranh trong nước phát triển kiến trúc cạnh tranh.
Một startup Trung Quốc được thành lập năm 2021 được báo cáo đang chuẩn bị sản xuất hàng loạt GPU dựa trên kiến trúc độc quyền, với hiệu suất được đồn đại sánh ngang RTX 4060 của Nvidia. Sự phát triển này nhấn mạnh cách các hạn chế địa chính trị đang thúc đẩy sự xuất hiện của các hệ sinh thái phần cứng AI thay thế, có khả năng phân mảnh thị trường toàn cầu mà Nvidia hiện đang thống trị.
Sự hội tụ của doanh thu gaming kỷ lục và thách thức chuyển đổi hạ tầng minh họa cách ảnh hưởng của AI mở rộng xa hơn các trung tâm dữ liệu, định hình lại toàn bộ chuỗi cung ứng công nghệ và bối cảnh cạnh tranh theo những cách sẽ xác định thập kỷ tiếp theo của sự phát triển máy tính.