AMD tiếp tục đối mặt với những thách thức đáng kể trong hệ sinh thái phần mềm bất chấp việc đạt được những bước tiến ấn tượng trong phát triển phần cứng AI. Trong khi công ty đã ra mắt các bộ tăng tốc MI300X mạnh mẽ và nền tảng ROCm 7 mới, phản hồi từ cộng đồng cho thấy các vấn đề hỗ trợ phần mềm dai dẳng có thể đang cản trở khả năng cạnh tranh hiệu quả của AMD với NVIDIA trên thị trường AI.
Thông số kỹ thuật chính của AMD MI300X:
- Lên đến 192GB bộ nhớ HBM3 (nhiều hơn bất kỳ bộ tăng tốc AI nào khác)
- Băng thông bộ nhớ lên đến 896 GB/s
- Tám chiplet tăng tốc dựa trên AMD CDNA 3
- Tuyên bố hiệu suất AI lên đến 8 lần so với MI250X
- Tuyên bố băng thông bộ nhớ lên đến 2 lần so với NVIDIA H100
- Thời điểm ra mắt: Quý 4 năm 2023
Hỗ trợ phần mềm vẫn thiếu ổn định
Vấn đề cốt lõi làm khó khăn tham vọng AI của AMD tập trung vào hiệu suất phần mềm không nhất quán. Nhiều nhà phát triển báo cáo rằng hỗ trợ ROCm thay đổi đáng kể tùy thuộc vào trường hợp sử dụng cụ thể, với một số ứng dụng hoạt động mượt mà trong khi những ứng dụng khác gặp phải các vấn đề nghiêm trọng. Sự không thể dự đoán này đã khiến nhiều người dùng từ bỏ các giải pháp AMD để chuyển sang hệ sinh thái CUDA đáng tin cậy hơn của NVIDIA, bất chấp những lợi ích hiệu suất tiềm năng từ phần cứng AMD.
Tình hình trở nên đáng lo ngại hơn khi xem xét hỗ trợ GPU tiêu dùng. AMD từ lâu đã cung cấp hỗ trợ đáng ngờ cho các card tiêu dùng của họ trong khối lượng công việc AI, tạo ra rào cản cho sinh viên, nhà nghiên cứu và các nhà phát triển nhỏ không thể chi trả phần cứng cấp trung tâm dữ liệu. Cách tiếp cận này tương phản rõ rệt với chiến lược của NVIDIA trong việc đảm bảo CUDA hoạt động trên toàn bộ dòng sản phẩm của họ.
Tính năng nền tảng ROCm 7:
- HIP để dễ dàng chuyển đổi từ CUDA
- Hỗ trợ Python và các công cụ mô hình hóa mới
- Bộ phần mềm Presidio với trình phân tích hiệu suất mô hình
- Bao gồm trình biên dịch và công cụ thời gian chạy
- Được thiết kế để chuyển đổi phần cứng AMD dễ dàng hơn
- Hỗ trợ GPU tiêu dùng được hứa hẹn cho các phiên bản tương lai
Vấn đề đường ống học thuật
Một điểm yếu quan trọng trong chiến lược của AMD dường như là sự tập trung hạn chế vào việc xây dựng cơ sở người dùng học thuật. Các trường đại học và viện nghiên cứu thường dựa vào phần cứng cũ hơn, giá cả phải chăng hơn, tạo ra cơ hội cho AMD thiết lập tầm ảnh hưởng trong số các chuyên gia AI tương lai. Tuy nhiên, việc công ty tập trung vào các giải pháp trung tâm dữ liệu cao cấp có nghĩa là họ đang bỏ lỡ cơ hội đưa công cụ của mình vào tay các sinh viên sau đại học, những người cuối cùng sẽ ảnh hưởng đến quyết định mua sắm doanh nghiệp.
Khoảng cách hệ sinh thái phần mềm mở rộng ra ngoài chức năng cơ bản. Nhiều thư viện AI tiên tiến và công cụ tối ưu hóa được phát triển trong môi trường học thuật và startup, nhưng những công cụ này thường ưu tiên hỗ trợ NVIDIA trước. Điều này tạo ra một chu kỳ mà AMD phải liên tục bắt kịp, triển khai hỗ trợ cho các đổi mới đã được thiết lập tốt trong hệ sinh thái CUDA.
Thành công trung tâm dữ liệu so với bỏ bê tiêu dùng
Thú vị là, AMD dường như hoạt động tốt hơn nhiều trong các triển khai trung tâm dữ liệu quy mô lớn nơi họ có thể cung cấp hỗ trợ kỹ thuật trực tiếp. Một số cài đặt siêu máy tính lớn sử dụng thành công các bộ tăng tốc AMD Instinct, cho thấy phần cứng và phần mềm có thể hoạt động hiệu quả khi có đủ tài nguyên dành cho triển khai và tối ưu hóa.
Bảng xếp hạng Top500 là một so sánh không liên quan; tất nhiên AMD sẽ cung cấp hỗ trợ trực tiếp cho các tổ chức đơn lẻ cung cấp cho họ hàng trăm triệu đô la và giúp làm cho sản phẩm của họ hoạt động chấp nhận được.
Sự chênh lệch này làm nổi bật một câu hỏi chiến lược cơ bản cho AMD. Trong khi tập trung vào khách hàng trung tâm dữ liệu có giá trị cao có thể có vẻ hợp lý về mặt tài chính trong ngắn hạn, nó có thể làm suy yếu phát triển hệ sinh thái dài hạn đòi hỏi việc áp dụng rộng rãi trên các phân khúc người dùng khác nhau.
Sự hiện diện của AMD trong siêu máy tính Top500:
- 4 trong số 10 hệ thống hàng đầu chạy trên card AMD Instinct (tháng 6 năm 2025)
- Hệ thống El Capitan : chi phí khoảng 700 triệu USD, hơn 50.000 GPU MI300
- AMD cho thấy hiệu suất mạnh mẽ trong các triển khai HPC quy mô lớn
- Tương phản với sự thống trị thị trường rộng lớn hơn của NVIDIA trong các hệ thống nhỏ hơn
Con đường phía trước
Thông báo gần đây của AMD về hỗ trợ ROCm ngày đầu cho GPU tiêu dùng mới cho thấy công ty có thể đang nhận ra những thách thức hệ sinh thái này. Tuy nhiên, xét đến lịch sử các vấn đề hỗ trợ phần mềm của AMD, nhiều người trong cộng đồng vẫn hoài nghi về việc liệu những lời hứa này có được thực hiện hiệu quả hay không.
Thành công của công ty trong các lĩnh vực khác, đặc biệt với CPU Ryzen và bộ xử lý EPYC, chứng minh họ có thể thực hiện tốt các thách thức kỹ thuật phức tạp. Câu hỏi vẫn còn là liệu AMD có thể áp dụng cùng mức độ tập trung và đầu tư này vào ngăn xếp phần mềm GPU của họ trước khi lợi thế của NVIDIA trở nên không thể vượt qua.
Hiện tại, các nhà phát triển và nhà nghiên cứu tiếp tục đối mặt với lựa chọn khó khăn giữa hiệu suất phần cứng có thể vượt trội của AMD và hệ sinh thái phần mềm trưởng thành, đáng tin cậy hơn của NVIDIA. Cho đến khi AMD có thể liên tục cung cấp chất lượng phần mềm trên toàn bộ dòng sản phẩm của họ, họ có thể gặp khó khăn trong việc giành được thị phần đáng kể trong lĩnh vực AI đang phát triển nhanh chóng.
Tham khảo: AMD's AI Future Is Back Scale Yellow