Tập đoàn công nghệ Trung Quốc Huawei đã phá vỡ sự im lặng về kế hoạch silicon AI trong tương lai, tiết lộ lộ trình ba năm đầy tham vọng nhằm định vị công ty như một giải pháp thay thế nội địa nghiêm túc cho sự thống trị của NVIDIA trong lĩnh vực điện toán trí tuệ nhân tạo. Thông báo này được đưa ra tại Huawei Connect 2025 bởi chủ tịch luân phiên Xu Zhijun , đánh dấu chiến lược tầm xa chính thức đầu tiên cho dòng chip Ascend của công ty.
Công Nghệ HBM Tự Phát Triển Đầu Tiên Ra Mắt Năm 2026
Trọng tâm của lộ trình Huawei là Ascend 950PR , dự kiến phát hành vào quý 1 năm 2026. Chip này đại diện cho một cột mốc quan trọng khi là bộ xử lý đầu tiên của Huawei có công nghệ High Bandwidth Memory (HBM) hoàn toàn tự phát triển. 950PR sẽ tích hợp HiBL 1.0 HBM của Huawei , mang lại dung lượng 128GB với băng thông 1.6TB/s. Chip tập trung vào suy luận này nhắm vào hiệu suất prefill và đề xuất, cung cấp sức mạnh tính toán 1 PFLOPS FP8 và khả năng xử lý 2 PFLOPS FP4.
Các thế hệ công nghệ HBM tự phát triển của Huawei
HiBL 1.0 (Thế hệ đầu tiên)
- Dung lượng: 128GB
- Băng thông: 1.6TB/s
- Mục tiêu: Ascend 950PR
HiZQ 2.0 (Thế hệ thứ hai)
- Dung lượng: 144GB
- Băng thông: 4TB/s
- Mục tiêu: Ascend 950DT và các mẫu sau này
Phiên Bản Tập Trung Huấn Luyện Ra Mắt Cuối Năm 2026
Bổ sung cho 950PR , Huawei dự định ra mắt Ascend 950DT vào quý 4 năm 2026. Bộ xử lý hướng huấn luyện này sẽ có công nghệ HiZQ 2.0 HBM thế hệ thứ hai của công ty, tự hào với thông số kỹ thuật được nâng cao gồm dung lượng 144GB và băng thông 4TB/s. Hệ thống con bộ nhớ được cải tiến định vị 950DT như câu trả lời của Huawei cho các yêu cầu huấn luyện mô hình AI hiệu suất cao.
Lộ Trình Mở Rộng Đến Năm 2028 Với Mức Tăng Hiệu Suất Khổng Lồ
Nhìn xa hơn, Ascend 960 của Huawei dự kiến ra mắt vào quý 4 năm 2027, có những cải tiến đáng kể bao gồm băng thông kết nối 2.2TB/s, dung lượng bộ nhớ 288GB và băng thông bộ nhớ 9.6TB/s. Chip sẽ mang lại hiệu suất tính toán 2 PFLOPS FP8 và 4 PFLOPS FP4. Lộ trình đạt đỉnh với Ascend 970 vào năm 2028, hứa hẹn những nâng cấp còn đáng kể hơn về khả năng bộ nhớ và tính toán.
Thông số kỹ thuật lộ trình chip Huawei Ascend
Model | Ngày phát hành | Loại bộ nhớ | Dung lượng bộ nhớ | Băng thông bộ nhớ | Hiệu năng tính toán | Trọng tâm |
---|---|---|---|---|---|---|
Ascend 950PR | Q1 2026 | HiBL 1.0 HBM | 128GB | 1.6TB/s | 1 PFLOPS FP8, 2 PFLOPS FP4 | Suy luận |
Ascend 950DT | Q4 2026 | HiZQ 2.0 HBM | 144GB | 4TB/s | Chưa được chỉ định | Huấn luyện |
Ascend 960 | Q4 2027 | HiZQ 2.0 HBM | 288GB | 9.6TB/s | 2 PFLOPS FP8, 4 PFLOPS FP4 | AI tổng quát |
Ascend 970 | 2028 | Chưa được chỉ định | Chưa được chỉ định | Chưa được chỉ định | Chưa được chỉ định | AI tổng quát |
Thách Thức Sản Xuất và Thực Tế Thị Trường
Bất chấp những thông số kỹ thuật đầy tham vọng, Huawei đối mặt với những rào cản sản xuất đáng kể. Dưới các lệnh trừng phạt của Mỹ, công ty không thể tiếp cận các node tiên tiến của TSMC hoặc công nghệ đóng gói CoWoS mà NVIDIA dựa vào cho các GPU Hopper và Blackwell . Làm việc với các nhà đúc nội địa như SMIC có thể dẫn đến những hạn chế về năng suất và băng thông có thể ảnh hưởng đến hiệu suất thực tế.
Tham Vọng Quy Mô Gặp Thực Tế Phần Mềm
Cùng với lộ trình chip, Huawei tiết lộ kế hoạch cho các siêu node khổng lồ chứa hàng nghìn bộ xử lý Ascend . Các hệ thống Atlas 950 và 960 nhằm cạnh tranh với cấu hình GB200 NVL72 của NVIDIA , hỗ trợ lên đến 15.488 bộ tăng tốc Ascend trong một triển khai duy nhất. Tuy nhiên, việc sánh ngang hiệu suất của NVIDIA đòi hỏi nhiều hơn số lượng chip thô - nó đòi hỏi các ngăn xếp phần mềm được tối ưu hóa và công nghệ kết nối giữ cho các cụm lớn được sử dụng hiệu quả trên các khối lượng công việc AI phức tạp.
Lộ trình này xuất hiện khi chính phủ Trung Quốc thúc đẩy sản xuất silicon nội địa và cấm mua sắm các thành phần của NVIDIA . Trong khi các kế hoạch của Huawei thể hiện tham vọng kỹ thuật, thành công cuối cùng sẽ phụ thuộc vào việc cung cấp một nền tảng đầu cuối đến đầu cuối đã được chứng minh có thể sánh ngang hệ sinh thái của NVIDIA về hiệu quả huấn luyện và thông lượng mô hình.