Trong một bước đi mang tính bước ngoặt nhằm định nghĩa lại các biên giới của khoa học máy tính, Bộ Năng lượng Hoa Kỳ đã bước vào một quan hệ đối tác trị giá 1 tỷ đô la Mỹ với AMD để xây dựng hai siêu máy tính AI mạnh nhất thế giới. Sự hợp tác này, có sự tham gia của các gã khổng lồ công nghệ Hewlett Packard Enterprise và Oracle, nhằm mục đích tạo ra những công cụ chưa từng có để giải quyết một số thách thức phức tạp nhất của nhân loại, từ việc đạt được phản ứng tổng hợp hạt nhân thực tế đến phát triển các phương pháp điều trị ung thư tiên tiến. Sáng kiến này đại diện cho một bước tiến quan trọng trong chiến lược của chính phủ Hoa Kỳ nhằm duy trì vị thế dẫn đầu trong nghiên cứu điện toán hiệu năng cao và trí tuệ nhân tạo.
Quan hệ Đối tác Chiến lược và Mục tiêu
Mối quan hệ đối tác tập hợp các nguồn lực to lớn của Phòng thí nghiệm Quốc gia Oak Ridge thuộc Bộ Năng lượng với chuyên môn kỹ thuật của AMD, HPE và Oracle trong một thỏa thuận công-tư độc đáo. Theo thỏa thuận này, ORNL sẽ cung cấp cơ sở hạ tầng và năng lượng cần thiết để vận hành các hệ thống khổng lồ, trong khi các đối tác khu vực tư nhân sẽ cung cấp các thành phần phần cứng và phần mềm tiên tiến. Mô hình này tận dụng thế mạnh của cả hai khu vực, kết hợp sự giám sát của chính phủ và định hướng khoa học với khả năng đổi mới và sản xuất của tập đoàn. Sức mạnh tính toán thu được sẽ được chia sẻ giữa các đối tác, đẩy nhanh nghiên cứu đồng thời trên nhiều lĩnh vực khoa học khác nhau.
Đối Tác Dự Án và Vai Trò:
- U.S. Department of Energy/Oak Ridge National Laboratory: Cung cấp cơ sở hạ tầng và năng lượng, lưu trữ các hệ thống
- AMD: Cung cấp phần cứng máy tính chính (CPU và bộ gia tốc)
- Hewlett Packard Enterprise (HPE): Tích hợp hệ thống và cơ sở hạ tầng
- Oracle: Hỗ trợ phần cứng và phần mềm bổ sung
Giới thiệu Lux: Nhà máy AI Đầu tiên của Quốc gia cho Khoa học
Hệ thống đầu tiên trong số này, có tên là Lux, dự kiến sẽ đi vào hoạt động trong vòng sáu tháng, đại diện cho một triển khai cực kỳ nhanh chóng đối với một siêu máy tính có quy mô như vậy. Giám đốc điều hành AMD Lisa Su đã nêu bật lộ trình tăng tốc này như một thành tựu đáng kể của chính nó. Lux sẽ được cung cấp sức mạnh bởi bộ tăng tốc Instinct MI355X của AMD, mỗi bộ tiêu thụ một mức năng lượng ấn tượng lên đến 1400 watt. Giám đốc ORNL Stephen Streiffer dự đoán rằng Lux sẽ mang lại hiệu suất AI gấp ba lần so với các siêu máy tính hiện tại, định vị nó như những gì các đối tác mô tả là Nhà máy AI chuyên dụng đầu tiên của quốc gia cho khoa học, năng lượng và an ninh quốc gia. Kiến trúc chuyên biệt này được tối ưu hóa đặc biệt cho các khối lượng công việc tập trung vào dữ liệu và mô hình, cho phép các nhà nghiên cứu đào tạo, tinh chỉnh và triển khai các mô hình nền tảng AI ở quy mô chưa từng có.
Thông số kỹ thuật siêu máy tính:
| Hệ thống | Lộ trình thời gian | Phần cứng chính | Trọng tâm chính |
|---|---|---|---|
| Lux | Hoạt động vào đầu năm 2026 | Bộ gia tốc AMD Instinct MI355X (mỗi bộ 1400W) | Huấn luyện và suy luận AI, "Nhà máy AI" |
| Discovery | Giao hàng năm 2028, Hoạt động năm 2029 | AMD Instinct MI430 (1 CPU Epyc + 4 die MI430X-HPC) | Tính toán khoa học độ chính xác cao |
Discovery: Cỗ máy Tính toán Thế hệ Tiếp theo Đầy sức mạnh
Theo lịch trình giao hàng vào năm 2028 và dự kiến bắt đầu hoạt động vào năm 2029, siêu máy tính Discovery đại diện cho giai đoạn thứ hai của dự án đầy tham vọng này. Discovery sẽ sử dụng kiến trúc Instinct MI430 sắp tới của AMD, có thiết kế sáng tạo kết hợp một CPU Epyc với bốn chip MI430X-HPC. Hệ thống này xây dựng dựa trên nền tảng công nghệ được thiết lập bởi Frontier, một siêu máy tính khác chạy bằng AMD trước đây đặt tại ORNL từng giữ danh hiệu siêu máy tính nhanh nhất thế giới cho đến gần đây. Discovery sử dụng thứ mà AMD mô tả là thiết kế Bandwidth Everywhere, hứa hẹn những cải tiến đáng kể về cả hiệu suất và hiệu quả năng lượng so với các thế hệ trước, mang lại đầu ra tính toán nhiều hơn với chi phí vận hành tương tự.
Các Tuyên Bố Về Hiệu Suất Chính:
- Lux được dự kiến mang lại hiệu suất AI gấp 3 lần so với các siêu máy tính hiện tại
- Discovery hứa hẹn cải thiện hiệu suất và hiệu quả năng lượng so với siêu máy tính Frontier
- Lux được mô tả là triển khai siêu máy tính quy mô này nhanh nhất
Thông số Kỹ thuật và Đổi mới Kiến trúc
Hai hệ thống sử dụng các phương pháp tiếp cận kiến trúc khác nhau được điều chỉnh cho phù hợp với sứ mệnh khoa học cụ thể của chúng. Bộ tăng tốc MI355X của Lux được thiết kế cho các khối lượng công việc đào tạo và suy luận AI mạnh mẽ, trong khi các bộ phận MI430 của Discovery có hai biến thể chuyên biệt. MI430X-HPC tập trung vào hiệu suất FP32 và FP64 độ chính xác cao, rất quan trọng cho các mô phỏng khoa học truyền thống, trong khi biến thể MI450X ưu tiên các thao tác FP8 và FP16 được tối ưu hóa cho các ứng dụng AI và học máy. Cách tiếp cận theo hai hướng này cho phép các nhà nghiên cứu kết hợp nhu cầu tính toán của họ với phần cứng phù hợp nhất, cho dù họ đang chạy các mô phỏng vật lý chính xác hay đào tạo các mạng nơ-ron khổng lồ.
Các Ứng dụng Chuyển đổi trên Mọi Lĩnh vực Khoa học
Các ứng dụng tiềm năng của những nguồn tài nguyên tính toán này trải dài trên một loạt các thách thức khoa học phi thường. Bộ trưởng Năng lượng Chris Wright bày tỏ sự lạc quan đặc biệt về nghiên cứu năng lượng nhiệt hạch, tuyên bố rằng ông tin rằng những hệ thống này có thể giúp thiết lập các con đường thực tế để khai thác năng lượng nhiệt hạch trong vòng hai hoặc ba năm tới. Bên cạnh năng lượng, các siêu máy tính sẽ đẩy nhanh nghiên cứu trong lĩnh vực sinh học và y học, với dự đoán của Wright rằng ung thư có thể trở thành một căn bệnh có thể kiểm soát được trong vòng năm đến tám năm thông qua những tiến bộ được cho phép bởi sức mạnh tính toán này. Các ứng dụng bổ sung bao gồm thiết kế các lò phản ứng, pin, chất xúc tác, chất bán dẫn và vật liệu quan trọng thế hệ tiếp theo, cũng như giải quyết các thách thức an ninh quốc gia.
Bối cảnh Rộng lớn hơn và Hàm ý Chiến lược
Mối quan hệ đối tác này xuất hiện tại một thời điểm then chốt trong cuộc cạnh tranh công nghệ toàn cầu, đặc biệt là trong lĩnh vực trí tuệ nhân tạo và điện toán hiệu năng cao có tầm quan trọng chiến lược. Bằng cách hợp tác với các công ty công nghệ hàng đầu của Mỹ, Bộ Năng lượng nhằm mục đích duy trì vị thế dẫn đầu của Hoa Kỳ trong khoa học máy tính đồng thời đẩy nhanh các ứng dụng thực tế giải quyết các ưu tiên quốc gia. Dự án này cũng đại diện cho một cam kết quan trọng đối với Phòng thí nghiệm Quốc gia Oak Ridge, củng cố vị trí của nó như một trung tâm nghiên cứu máy tính hàng đầu. Khi các hệ thống này đi vào hoạt động, chúng được kỳ vọng sẽ không chỉ thúc đẩy kiến thức khoa học mà còn thúc đẩy sự đổi mới trong kiến trúc siêu máy tính có thể ảnh hưởng đến các hệ thống nghiên cứu và thương mại trong tương lai trên toàn thế giới.
Việc triển khai và vận hành thành công Lux và Discovery có thể thiết lập các tiêu chuẩn mới về cách các khu vực công và tư nhân hợp tác trong các dự án công nghệ quy mô lớn. Bên cạnh những đóng góp khoa học trực tiếp, các hệ thống này có thể giúp đào tạo một thế hệ nhà khoa học và kỹ sư máy tính mới trong khi phát triển các hệ sinh thái phần mềm và phươngmethodology sẽ mang lại lợi ích cho cộng đồng nghiên cứu rộng lớn hơn. Khi cuộc đua giành quyền tối cao trong tính toán ngày càng gay gắt trên toàn cầu, mối quan hệ đối tác này đại diện cho một khoản đầu tư đáng kể vào việc duy trì vị thế dẫn đầu của Mỹ trong cả khoa học cơ bản và các ứng dụng thực tế xuất phát từ nó.
