Bộ AI DGX Spark 4.000 USD của Nvidia Bị Báo Cáo Giảm Hiệu Suất Do Nhiệt, Chỉ Đạt Một Nửa Công Năng Hứa Hẹn

Nhóm biên tập BigGo
Bộ AI DGX Spark 4.000 USD của Nvidia Bị Báo Cáo Giảm Hiệu Suất Do Nhiệt, Chỉ Đạt Một Nửa Công Năng Hứa Hẹn

Việc ra mắt gần đây của DGX Spark từ Nvidia, một bộ công cụ phát triển AI thu nhỏ trị giá 4.000 USD, đã phải đối mặt với sự giám sát đáng kể sau những lo ngại về hiệu suất được các nhân vật nổi tiếng trong ngành đưa ra. Những người dùng đầu tiên, bao gồm lập trình viên huyền thoại John Carmack, đang báo cáo rằng thiết bị hoạt động kém hơn hẳn, được cho là do hiện tượng giảm xung nhịp vì nhiệt, phủ một bóng mờ lên khả năng và tiềm năng tương lai của nó như một bộ xử lý cho laptop.

Nvidia RTX 5070 Founders Edition, đại diện cho phần cứng AI của Nvidia đang đối mặt với sự giám sát về hiệu suất
Nvidia RTX 5070 Founders Edition, đại diện cho phần cứng AI của Nvidia đang đối mặt với sự giám sát về hiệu suất

Báo Cáo Hiệu Suất Nghiêm Trọng Từ John Carmack

John Carmack, nhà phát triển nổi tiếng đằng sau những tựa game huyền thoại như Doom và cựu Giám đốc Kỹ thuật của Oculus VR, đã công khai mô tả chi tiết các vấn đề hiệu suất đáng kể với thiết bị DGX Spark của mình. Trong một bài đăng trên mạng xã hội, Carmack tuyên bố rằng thiết bị dường như chỉ đạt mức tiêu thụ điện năng tối đa là 100 watt. Con số này cực kỳ thấp, chỉ bằng chưa đến một nửa mức định mức công suất 240 watt vốn được gán rộng rãi cho hệ thống. Hệ quả trực tiếp của việc hạn chế công suất này là một sự thiếu hụt hiệu suất đáng kể. Carmack ước tính rằng thiết bị chỉ đang cung cấp khoảng một nửa hiệu suất được công bố, một phép tính dựa trên việc chuyển đổi 1 petaflop tính toán FP4 thưa được Nvidia quảng cáo thành con số BF16 dày đặc.

Hiệu suất DGX Spark được báo cáo so với kỳ vọng

Chỉ số Được báo cáo bởi Carmack Kỳ vọng/Được trích dẫn rộng rãi
Công suất tiêu thụ ~100 W 240 W
Hiệu suất ~50% so với công bố 1 PF sparse FP4
Hoạt động nhiệt Nóng lên, khởi động lại tự động N/A
Tính ổn định hệ thống Gặp sự cố khi chạy tải liên tục Hoạt động ổn định

Quá Nhiệt và Sự Bất Ổn Định Của Hệ Thống

Ngoài những con số hiệu suất thô, DGX Spark được báo cáo là đang biểu hiện các vấn đề nhiệt nghiêm trọng ngay cả ở trạng thái công suất bị giảm. Carmack lưu ý rằng thiết bị trở nên khá nóng ngay cả ở mức độ này, và ông đã thấy các báo cáo về việc nó tự động khởi động lại trong quá trình chạy kéo dài. Điều này cho thấy thiết kế tản nhiệt của vỏ máy thu nhỏ là không đủ để xử lý lượng nhiệt sinh ra bởi siêu chip GB10, dẫn đến việc giảm xung nhịp để bảo vệ và, trong những trường hợp xấu nhất, là sự cố hệ thống hoàn toàn để ngăn ngừa hư hại. Những báo cáo này về sự bất ổn định được củng cố bởi các cuộc thảo luận ngày càng gia tăng trên diễn đàn dành cho nhà phát triển của Nvidia, nơi những người dùng sớm khác đang chia sẻ những trải nghiệm tương tự về sự cố GPU và tắt máy bất ngờ dưới tải tính toán kéo dài.

Cốt Lõi Của Tranh Cãi: Thông Số Kỹ Thuật So Với Thực Tế

Sự tranh cãi được thúc đẩy bởi một mức độ mơ hồ xung quanh thông số kỹ thuật chính thức của Nvidia. Trong khi Carmack và những người khác trích dẫn mức định mức 240 watt, một số bình luận viên trong ngành cho rằng con số chính thức có thể là 170 watt, với con số 240 watt có khả năng bắt nguồn từ công suất của bộ nguồn đi kèm. Hơn nữa, số liệu hiệu suất chủ chốt 1 petaflop của Nvidia là dành cho tính toán FP4 với độ thưa, một định dạng chính xác thấp chuyên biệt sử dụng gia tốc phần cứng chuyên dụng. Hiệu suất ở các định dạng được sử dụng phổ biến hơn cho huấn luyện AI, như BF16 hoặc FP8, đương nhiên là thấp hơn, nhưng khoảng cách mà người dùng trải nghiệm dường như rộng hơn nhiều so với dự kiến, chỉ ra một sự hạn chế về phần cứng hoặc phần sụn hơn là chỉ một sự hiểu lầm về bảng thông số kỹ thuật.

Hàm Ý Cho APU Laptop GB10/N1 Tương Lai

Các vấn đề về hiệu suất và nhiệt đang ảnh hưởng đến DGX Spark đã đặt ra những câu hỏi nghiêm túc về tương lai của công nghệ cốt lõi của nó. Siêu chip GB10 bên trong Spark được dự kiến sẽ được đổi tên thành N1 để sử dụng trong các thiết bị khác, đáng chú ý nhất là như một APU hiệu suất cao cho các laptop cao cấp. Nếu con chip này vật lộn với việc quản lý nhiệt bên trong một thùng máy desktop chuyên dụng, thì tính khả thi của nó trong vỏ máy mỏng và bị hạn chế về nhiệt của một chiếc laptop hiện đại hiện đang bị nghi ngờ. Được chế tạo trên quy trình N4 của TSMC, con chip tương đối lớn và ngốn điện cho các ứng dụng di động, khiến việc làm mát hiệu quả trở thành một thách thức tối quan trọng mà sự cố này gợi ý rằng có thể đã không được khắc phục hoàn toàn.

Thông số kỹ thuật chính của Nvidia DGX Spark

  • Chip lõi: Grace Blackwell GB10 Superchip
  • CPU: 20 nhân dựa trên kiến trúc Arm Nvidia Grace CPU
  • Bộ nhớ: 128GB LPDDR5X thống nhất
  • Băng thông bộ nhớ: 273 GB/s
  • Hiệu năng tính toán công bố: 1 Petaflop (FP4 với sparsity)
  • Giá: 4.000 USD
  • Kích thước: Mini-PC nhỏ gọn 150mm

Phản Ứng Của Ngành Và Các Động Thái Cạnh Tranh

Cuộc thảo luận được châm ngòi bởi bài đăng của Carmack đã không bị các đối thủ cạnh tranh của Nvidia bỏ qua. Trong một diễn biến đáng chú ý, các đại diện từ Framework và AMD đã trực tiếp tham gia vào cuộc trò chuyện. Framework đã đề nghị cung cấp cho Carmack một hệ thống phát triển được cung cấp sức mạnh bởi APU Strix Halo sắp ra mắt của AMD để so sánh. Một giám đốc điều hành của AMD, Anush Elangovan, đã khuếch đại thêm điều này bằng cách công khai tuyên bố họ sẽ sẵn sàng hỗ trợ việc khám phá nền tảng Strix Halo của Carmack. Phản hồi nhanh chóng này làm nổi bật áp lực cạnh tranh trong lĩnh vực phần cứng AI và trình bày một giải pháp thay thế tiềm năng cho các nhà phát triển đang thất vọng với hiệu suất ban đầu của DGX Spark.

Khởi Đầu Đầy Sóng Gió Cho Một Nền Tảng Đầy Hứa Hẹn

Tóm lại, Nvidia DGX Spark đang phải đối mặt với một thách thức đáng kể sau khi ra mắt. Sự kết hợp giữa các báo cáo trực tiếp từ những nhà phát triển có uy tín như John Carmack, bằng chứng về việc giảm xung nhịp vì nhiệt, và các trường hợp bất ổn định hệ thống đang nổi lên vẽ nên một bức tranh về một sản phẩm có lẽ đã bị đẩy vào một phạm vi nhiệt quá tham vọng. Mặc dù ý tưởng về một thiết bị cung cấp năng lực tính toán AI đáng kể trong dạng thức máy tính mini là hấp dẫn, nhưng việc thực thi của nó hiện đang bị bao phủ bởi một đám mây. Nvidia vẫn chưa công khai giải quyết những lo ngại ngày càng tăng này, và cách công ty phản hồi sẽ rất quan trọng để khôi phục niềm tin của các nhà phát triển, không chỉ vào DGX Spark, mà còn vào tương lai di động rộng hơn của kiến trúc GB10/N1 của họ.