Meta的AI超級(jí)計(jì)算機(jī)是迄今為止最大的NVIDIA DGX A100客戶系統(tǒng)。該系統(tǒng)將為Meta的AI研究人員提供5百億億次級(jí)AI計(jì)算性能,采用了最先進(jìn)的NVIDIA系統(tǒng)、InfiniBand網(wǎng)絡(luò)和軟件,實(shí)現(xiàn)了數(shù)千個(gè)GPU集群的系統(tǒng)優(yōu)化。
Meta Platforms非常認(rèn)可NVIDIA,為其有望成為有史以來(lái)最強(qiáng)大的研究系統(tǒng)選擇了NVIDIA的先進(jìn)技術(shù)。
于今日發(fā)布的AI研究超級(jí)集群(AI Research SuperCluster,縮寫RSC)已在訓(xùn)練新模型以推動(dòng)AI發(fā)展。
全面部署后,Meta的RSC預(yù)計(jì)將成為最大的NVIDIA DGX A100客戶系統(tǒng)。
Meta在一篇博客文章中表示:“我們希望RSC幫助我們建立全新的AI系統(tǒng),例如可以為多個(gè)不同語(yǔ)言的團(tuán)隊(duì)提供實(shí)時(shí)語(yǔ)音翻譯,使他們可以在研究項(xiàng)目上無(wú)縫協(xié)作,甚至一起玩AR游戲?!?/p>
訓(xùn)練最大的AI模型
當(dāng)RSC在今年晚些時(shí)候完全建成時(shí),Meta將用它來(lái)訓(xùn)練具有超過1萬(wàn)億個(gè)參數(shù)的AI模型。這將推動(dòng)自然語(yǔ)言處理等領(lǐng)域的發(fā)展,比如實(shí)時(shí)識(shí)別不法內(nèi)容等工作。
除了實(shí)現(xiàn)規(guī)模性能之外,Meta還將超高的可靠性、安全性、隱私性以及處理“各類AI模型”的靈活性作為RSC的關(guān)鍵指標(biāo)。
Meta的AI研究超級(jí)集群擁有數(shù)百個(gè)NVIDIA DGX系統(tǒng)并通過NVIDIA Quantum InfiniBand網(wǎng)絡(luò)相連接,助力Meta AI研究團(tuán)隊(duì)提高工作速率。
性能大揭秘
目前,此全新AI超級(jí)計(jì)算機(jī)已經(jīng)部署了760個(gè)NVIDIA DGX A100系統(tǒng)作為其計(jì)算節(jié)點(diǎn)。共有6080個(gè)NVIDIA A100 GPU,通過NVIDIA Quantum 200Gb/s InfiniBand網(wǎng)絡(luò)連接,可提供1895(千萬(wàn)億次)TF32計(jì)算性能。
盡管受到新冠疫情的影響,這樣一臺(tái)可運(yùn)行的AI超級(jí)計(jì)算機(jī)從想法到實(shí)現(xiàn),RSC僅用了18個(gè)月!“功臣”之一便是采用NVIDIA DGX A100技術(shù)作為基石。
Penguin Computing是NVIDIA合作伙伴網(wǎng)絡(luò)中負(fù)責(zé)RSC交付的合作伙伴。除了760個(gè)DGX A100系統(tǒng)和InfiniBand網(wǎng)絡(luò)之外,Penguin還為Meta提供管理服務(wù)和AI基礎(chǔ)架構(gòu)優(yōu)化,包括一個(gè)46PB高速緩存的Altus系統(tǒng)。
性能提升20倍
這是Meta第二次選擇NVIDIA技術(shù)作為其研究平臺(tái)的基礎(chǔ)。2017年,Meta打造了第一代AI研究基礎(chǔ)架構(gòu),配備了22000個(gè)NVIDIA V100 Tensor Core GPU,每日可處理35000項(xiàng)AI訓(xùn)練工作。
Meta的早期基準(zhǔn)測(cè)試顯示,RSC訓(xùn)練大型NLP模型的速度比之前的系統(tǒng)快3倍,運(yùn)行計(jì)算機(jī)視覺工作的速度比之前的系統(tǒng)快20倍。
在今年晚些時(shí)候的第二階段,RSC將擴(kuò)展至16000個(gè)GPU。Meta認(rèn)為屆時(shí)RSC將提供高達(dá)5百億億次級(jí)混合精度AI計(jì)算性能,并且Meta希望通過擴(kuò)展RSC的存儲(chǔ)系統(tǒng),以每秒16TB的速度提供高達(dá)1EB的數(shù)據(jù)。
可擴(kuò)展架構(gòu)
NVIDIA AI技術(shù)適用于任何規(guī)模的企業(yè)應(yīng)用。
NVIDIA DGX包含一個(gè)完整的NVIDIA AI軟件棧,可以輕松地從單個(gè)系統(tǒng)擴(kuò)展至完整的DGX SuperPOD,可以在本地或主機(jī)托管商處運(yùn)行??蛻粢嗫梢酝ㄟ^NVIDIA DGX Foundry租用DGX系統(tǒng)。
原文標(biāo)題:Meta與NVIDIA聯(lián)合打造大型AI研究超級(jí)計(jì)算機(jī)
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5496瀏覽量
109099 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7764瀏覽量
92688 -
AI
+關(guān)注
關(guān)注
89文章
38121瀏覽量
296685
原文標(biāo)題:Meta與NVIDIA聯(lián)合打造大型AI研究超級(jí)計(jì)算機(jī)
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA擴(kuò)大與微軟合作推動(dòng)AI超級(jí)工廠建設(shè)
NVIDIA在ISC 2025分享最新超級(jí)計(jì)算進(jìn)展
NVIDIA DGX Spark助力構(gòu)建自己的AI模型
NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能
是德科技與Heavy Reading合作發(fā)布2025年AI集群網(wǎng)絡(luò)報(bào)告
NVIDIA AI助力科學(xué)研究領(lǐng)域持續(xù)突破
NVIDIA助力AI超級(jí)計(jì)算機(jī)Isambard-AI投入使用
NVIDIA驅(qū)動(dòng)的現(xiàn)代超級(jí)計(jì)算機(jī)如何突破速度極限并推動(dòng)科學(xué)發(fā)展
NVIDIA助力全球最大量子研究超級(jí)計(jì)算機(jī)
NVIDIA GTC2025 亮點(diǎn) NVIDIA推出 DGX Spark個(gè)人AI計(jì)算機(jī)
NVIDIA 宣布推出 DGX Spark 個(gè)人 AI 計(jì)算機(jī)

Meta發(fā)布采用NVIDIA系統(tǒng)的AI研究超級(jí)集群
評(píng)論