美國的超級計算機又有新看點了。
據(jù)報道,Microsoft 和 OpenAI 正在開發(fā)一個大型數(shù)據(jù)中心,以容納一臺擁有數(shù)百萬個GPU 的專注于AI的超級計算機。The Information報道稱,該項目的成本可能“超過1150億美元”,而目前在OpenAI內部被稱為“星際之門”(Stargate)的超級計算機將位于美國。
該報告稱,Microsoft將為數(shù)據(jù)中心買單,該數(shù)據(jù)中心可能比當今一些最大的運營中心“成本高出100倍”。Stargate將是兩家公司希望在未來6年內建立的一系列數(shù)據(jù)中心項目中最大的一個,高管們希望在2028年之前運行它。
報告稱,OpenAI和Microsoft正在分階段構建這些超級計算機,Stargate將是第5階段的系統(tǒng)。The Information的消息人士稱,第4階段的系統(tǒng)成本更低,最早可能在2026年啟動,并且可能希望在威斯康星州的Mt. Pleasant開始。該系統(tǒng)可能需要幾個Stargate,還需要足夠的電力供應(至少幾千兆瓦),以至于Microsoft和OpenAI正在考慮替代能源,例如核能。
消息人士表示,這種規(guī)模的數(shù)據(jù)中心將具有挑戰(zhàn)性,部分原因是現(xiàn)有設計需要“將比過去更多的GPU放入單個機架中,以提高芯片的效率和性能,這意味著還要設計新穎的方法來保持良好的散熱性能。
聽起來這些公司也有可能利用這個設計來擺脫對英偉達的依賴。該報告稱,OpenAI希望避免在Stargate中使用英偉達的InfiniBand電纜,盡管Microsoft在當前的項目中使用它們。OpenAI聲稱它寧愿使用以太網(wǎng)電纜。
很多事情仍有待確定,因此價格和計劃似乎都可能發(fā)生變化,目前尚不清楚何時會最終確定細節(jié)。該信息還指出,尚未確定這臺計算機將位于何處,以及它是將構建在單個數(shù)據(jù)中心還是“鄰近的多個數(shù)據(jù)中心”中。
今年早些時候,有報道稱,OpenAI首席執(zhí)行官山姆·阿爾特曼(Sam Altman)雄心勃勃地制造人工智能芯片,并希望籌集多達7萬億美元來建設晶圓廠來生產(chǎn)它們。去年,Microsoft 發(fā)布了專門用于 AI 項目的 128 核 Arm 數(shù)據(jù)中心 CPU 和 Maia 100 GPU。也有報道稱,Microsoft為人工智能數(shù)據(jù)中心開發(fā)自己的網(wǎng)絡設備。隨著人工智能的興起,英偉達的GPU需求量很大,因此,像Microsoft和OpenAI這樣的公司可能希望有一些其它選擇是有道理的。
“我們一直在規(guī)劃下一代基礎設施創(chuàng)新,以繼續(xù)推動人工智能的發(fā)展,”Microsoft首席通信官弗蘭克·肖(Frank Shaw)告訴The Information,但他沒有直接評論該超級計算機計劃。
Microsoft在與OpenAI的合作中投入了數(shù)十億美元,主要是以計算能力的形式運行其模型。如果Stargate或類似的東西成為現(xiàn)實,隨著投資的規(guī)模越來越大,而且越來越復雜,這種伙伴關系只會越來越深。
美國超算有哪些?
2023年11月,全球超級計算大會正式公布了第62期全球超級計算機TOP500排行榜,美國橡樹嶺國家實驗室的Frontier仍保持著第一名位置,中國的神威·太湖之光和天河二號A也進入了前十五,分別排名第11和第14。
排名第一的Frontier以1.194 EFlop/s的HPL性能繼續(xù)保持領先地位。其搭載了基于最新的HPE Cray EX235a架構的2GHz AMD EPYC 64C 處理器,共有8699904個CPU和GPU核心。此外,F(xiàn)rontier還具有高達52.59 GFlops/W的額定能效,并可借助于HPE的Slingshot 11網(wǎng)絡進行數(shù)據(jù)傳輸。
排名第二是美國阿貢國家實驗室的Aurora超級計算機,其以585.34 PFlop/s的HPL性能殺入榜單。需要指出的是,此次 Aurora 的數(shù)值是在當前未完全建成狀態(tài)下提交的,目前僅有計劃中最終規(guī)模的一半。根據(jù)規(guī)劃,Aurora 在建設完成后將配備21248個Intel Xeon Max系列CPU、63744個Intel Max系列GPU、20.42PB內存,峰值性能可達 2 EFlop / s,遠超 Frontier。
排名第三的是安裝于微軟美國Azure云中的Eagle,HPL性能為561.2 PFlop/s,這也是云服務廠商取得的最高排名。其基于英特爾至強鉑金8480C處理器和英偉達H100打造。
排名第四的是日本的富岳超級計算機,HPL分數(shù)為442.01 PFlop/s,基于富士通自研的基于Arm架構的 48 核處理器A64FX,總共裝有大約16萬個CPU芯片。
排名第五的是來自芬蘭卡亞尼歐洲高性能計算中心的超級計算機LUMI,HPL性能達379.07 PFlop/s,基于HPE Cray EX235a 架構,配備了2GHz AMD EPYC 64C 處理器和AMD Instinct MI250X GPU。
排名第六的是意大利 CINECA 的一個 EuroHPC 站點上的 Leonardo 系統(tǒng),HPL性能達 238.7 Pflop/s。它是一個 Atos BullSequana XH2000 系統(tǒng),處理器為Intel Xeon Platinum 8358 32C 2.6GHz,加速器為 NVIDIA A100 SXM4 40 GB,采用四軌 NVIDIA HDR100 Infiniband 作為互連。
排名全球第七是美國田納西州橡樹嶺國家實驗室(ORNL)的Summit超級計算機,由 IBM 打造,目前在 HPL 性能為 148.8 Pflop/s,擁有 4,356 個節(jié)點,每個節(jié)點配備兩個 POWER9 CPU(每個具有 22 個核心)和6個 NVIDIA Tesla V100 GPU(每個含有 80 個 SM),通過 Mellanox 雙軌 EDR InfiniBand 網(wǎng)絡保持連接。
第八名是西班牙 EuroHPC / 巴塞羅那超級計算中心最新安裝的 MareNostrum 5 ACC 超算系統(tǒng),這個 使用 Xeon Platinum 8460Y 處理器以及 NVIDIA H100 和 Infiniband NDR200,實現(xiàn)了 183.2 Pflop/s 的 HPL 性能。
排名第九的新 Eos 系統(tǒng)是英偉達打造的基于DGX SuperPOD 的系統(tǒng),配備Intel Xeon Platinum 8480C 處理器、NVIDIA H100 加速器和 Infiniband NDR400 的 NVIDIA DGX H100,實現(xiàn)了 121.4 Pflop/s 的性能。
排名第十的是美國加利福尼亞州勞倫斯利弗莫爾國家實驗室的 Sierra 系統(tǒng)。它的架構與排名第七的系統(tǒng) Summit 非常相似,由 4,320 個節(jié)點組成,每個節(jié)點配備兩個 POWER9 CPU 和四個 NVIDIA Tesla V100 GPU,可實現(xiàn) 94.6 Pflop/s 的性能。
此外,GREEN500 排名第一的位置仍然是美國紐約熨斗研究所的 Henri。該系統(tǒng)的能效等級為 65.40 GFlops / Watt,同時 HPL 得分為 2.88 PFlops / s。Henri 是一臺聯(lián)想 ThinkSystem SR670,配備 Intel Xeon Platinum 和 NVIDIA H100,共有 8,288 個核心,在 TOP500 排行榜上排名第 293 位。
-
處理器
+關注
關注
68文章
19896瀏覽量
235345 -
超級計算機
+關注
關注
2文章
472瀏覽量
42481 -
AI
+關注
關注
88文章
35167瀏覽量
280105
原文標題:AI巨頭籌劃價值1100多億美元的超級計算機項目
文章出處:【微信號:ICViews,微信公眾號:半導體產(chǎn)業(yè)縱橫】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
NVIDIA驅動的現(xiàn)代超級計算機如何突破速度極限并推動科學發(fā)展

Blue Lion超級計算機將在NVIDIA Vera Rubin上運行
NVIDIA技術賦能歐洲最快超級計算機JUPITER
NVIDIA助力全球最大量子研究超級計算機
Raspberry Pi 是單板計算機之王?

NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

NVIDIA推出個人AI超級計算機Project DIGITS
NVIDIA發(fā)布高性價比生成式AI超級計算機
云端超級計算機使用教程
量子計算機與普通計算機工作原理的區(qū)別

NVIDIA 以太網(wǎng)加速 xAI 構建的全球最大 AI 超級計算機

評論