chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

未來(lái)智算中心:從單數(shù)據(jù)中心到多數(shù)據(jù)中心AI訓(xùn)練集群的演變趨勢(shì)

SDNLAB ? 來(lái)源:SDNLAB ? 2024-11-13 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

去年以來(lái),以ChatGPT為代表的大模型迅速紅遍全球,展現(xiàn)出變革經(jīng)濟(jì)社會(huì)的巨大潛能。全球主流科技公司紛紛參與其中,推動(dòng)智能算力需求高速增長(zhǎng)。華為公司去年曾預(yù)測(cè),到2025年,智能算力需求將增長(zhǎng)100倍。

與之相呼應(yīng)的,是蓬勃興起的智算中心。從政策面看,我國(guó)2022年全面啟動(dòng)“東數(shù)西算”工程建設(shè),在京津冀、長(zhǎng)三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏建設(shè)8個(gè)國(guó)家算力樞紐,并規(guī)劃了10個(gè)國(guó)家數(shù)據(jù)中心集群。從產(chǎn)業(yè)來(lái)看,運(yùn)營(yíng)商資本開(kāi)支重心正在向算力偏移,并大規(guī)模采購(gòu)智算設(shè)備。

智算中心的未來(lái)將如何演變?構(gòu)建跨數(shù)據(jù)中心的AI訓(xùn)練集群是其中一個(gè)重要研究方向, “Region Scale Al”,已經(jīng)成為業(yè)界關(guān)注的熱點(diǎn)話(huà)題。

ODCC(開(kāi)放數(shù)據(jù)中心委員會(huì))攜手華為公司,在2024年3月28日召開(kāi)的ODCC春季全會(huì)-新技術(shù)與測(cè)試工作組會(huì)議上提出了“Region Scale AI”研究項(xiàng)目。華為2012網(wǎng)絡(luò)技術(shù)實(shí)驗(yàn)室專(zhuān)家李映輝做了《Region Scale AI 場(chǎng)景與挑戰(zhàn)》主題報(bào)告,介紹了AI大模型訓(xùn)練對(duì)算力需求不斷增加的背景下,多數(shù)據(jù)中心聯(lián)合訓(xùn)練的發(fā)展趨勢(shì)與業(yè)界實(shí)踐,深入分析了該場(chǎng)景下面臨的組網(wǎng)和通信挑戰(zhàn),通過(guò)現(xiàn)網(wǎng)實(shí)驗(yàn)數(shù)據(jù)初步論證了AI集群跨AZ、跨Region聯(lián)合訓(xùn)練的可行性,并給出了“Region Scale AI”研究項(xiàng)目的工作計(jì)劃。李映輝因?yàn)榇隧?xiàng)目立項(xiàng),榮獲ODCC2024年春季全會(huì)MVP演講嘉賓稱(chēng)號(hào)。

報(bào)告中,還介紹了該場(chǎng)景下的創(chuàng)新技術(shù)探索和研究工作,包括跨AZ的模型切分算法、集合通信算法,以及如何在長(zhǎng)距網(wǎng)絡(luò)上實(shí)現(xiàn)高吞吐傳輸、高性能加解密協(xié)議等等。同時(shí)指出,隨著AI模型的增大以及芯片算力的增強(qiáng),未來(lái)跨AZ訓(xùn)練對(duì)網(wǎng)絡(luò)帶寬的需求還會(huì)進(jìn)一步增長(zhǎng),需要進(jìn)一步考慮DCN和DCI網(wǎng)絡(luò)架構(gòu)的演進(jìn)。

單集群AI訓(xùn)練存在極限,跨DC AI訓(xùn)練成趨勢(shì)

業(yè)內(nèi)人士都能感受到AI大模型發(fā)展的加速度。主流科技公司正在盡可能快地開(kāi)發(fā)大模型并迭代新版本,以期在這個(gè)全新的產(chǎn)業(yè)中占據(jù)先機(jī)。大模型的訓(xùn)練參數(shù)在過(guò)去5年增長(zhǎng)百倍,已經(jīng)達(dá)到萬(wàn)億級(jí),預(yù)計(jì)未來(lái)5年參數(shù)將再增長(zhǎng)百倍,達(dá)到百萬(wàn)億量級(jí)!

智算能力也隨之快速升級(jí),目前單一數(shù)據(jù)中心已經(jīng)達(dá)到萬(wàn)卡集群規(guī)模,以盡力滿(mǎn)足幾乎永無(wú)止境的AI計(jì)算需求。公開(kāi)消息顯示,華為昇騰AI集群2023年升級(jí)為萬(wàn)卡AI集群;螞蟻基礎(chǔ)大模型已具備萬(wàn)卡AI集群;中國(guó)電信宣布推出了首個(gè)國(guó)產(chǎn)單池萬(wàn)卡液冷算力集群。

AI集群是通過(guò)將多個(gè)計(jì)算機(jī)節(jié)點(diǎn)連接起來(lái),形成協(xié)同工作的計(jì)算環(huán)境,從而為人工智能應(yīng)用提供強(qiáng)大的計(jì)算能力和數(shù)據(jù)處理能力。據(jù)了解,其技術(shù)門(mén)檻隨著訓(xùn)練量快速增長(zhǎng)而不斷抬高,絕非簡(jiǎn)單的算力設(shè)備堆砌。僅有少數(shù)幾家廠商能夠提供萬(wàn)卡AI集群,面對(duì)大模型參數(shù)的指數(shù)級(jí)增長(zhǎng),壓力巨大。

然而,任何具體事物都存在極限,算力集群同樣如此。單一AI集群不可能無(wú)限制擴(kuò)張,會(huì)受到電力供應(yīng)等因素影響,比如一些公司甚至考慮將數(shù)據(jù)中心建設(shè)在核電站附近。預(yù)計(jì)今后一個(gè)十萬(wàn)卡級(jí)別的AI集群,需要上百M(fèi)W的電力供應(yīng)??鐢?shù)據(jù)中心AI訓(xùn)練可以有效解決單集群供電不足問(wèn)題,引起業(yè)界廣泛關(guān)注。

此外,云計(jì)算有峰谷效應(yīng),單集群算力面臨部署碎片化問(wèn)題,難以承載云上大規(guī)模AI訓(xùn)練業(yè)務(wù),導(dǎo)致資源利用率下降。采用多個(gè)數(shù)據(jù)中心組成的跨AZ、跨Region AI訓(xùn)練集群,可有效支撐十萬(wàn)卡甚至百萬(wàn)卡級(jí)別的訓(xùn)練任務(wù),同時(shí)提高資源利用率,將是智算產(chǎn)業(yè)發(fā)展和探索的重要方向。

業(yè)界大型科技公司紛紛啟動(dòng)跨DC訓(xùn)練技術(shù)研究

面向云上AI資源碎片化問(wèn)題,微軟提出了“Singularity”框架,Planet-scale可搶占、可遷移、可彈性伸縮的AI任務(wù)調(diào)度。該框架可實(shí)現(xiàn)資源調(diào)度高彈性和可遷移性,增加云上AI資源利用率,但缺乏關(guān)注跨集群的訓(xùn)練性能。面向公有云AI訓(xùn)練網(wǎng)絡(luò)異構(gòu)問(wèn)題,AWS提出了MiCS方案,能夠充分利用異構(gòu)網(wǎng)絡(luò)帶寬,通過(guò)減少較慢鏈路上的網(wǎng)絡(luò)流量,攤銷(xiāo)昂貴的全局梯度同步開(kāi)銷(xiāo)。為了解決AI訓(xùn)練集群造價(jià)昂貴問(wèn)題,Meta提出去中心化異構(gòu)訓(xùn)練。利用分布式、異構(gòu)和低帶寬互聯(lián)的AI訓(xùn)練資源來(lái)訓(xùn)練基礎(chǔ)大模型,降低訓(xùn)練成本。

Region Scale AI研究計(jì)劃啟動(dòng),已制定進(jìn)度表

華為云技術(shù)專(zhuān)家楊永強(qiáng)近日在交流中向SDNLAB表示,數(shù)字經(jīng)濟(jì)是根本,東數(shù)西算是實(shí)施的第一步,華為云大力支持國(guó)家的東數(shù)西算戰(zhàn)略,積極布局Regionless等技術(shù)創(chuàng)新,其中東數(shù)西訓(xùn)自不必說(shuō),而跨AZ、跨Region、線(xiàn)上線(xiàn)下跨集群的AI訓(xùn)練等高階訴求也日益顯現(xiàn)。參數(shù)交換會(huì)大幅提升跨Region的數(shù)據(jù)流量,弱網(wǎng)長(zhǎng)距下的Regionless確定性高速傳輸需求迫切,有機(jī)會(huì)打造成東數(shù)西算的 “特高壓”。

“Region Scale AI研究”項(xiàng)目旨在通過(guò)跨數(shù)據(jù)中心聯(lián)合訓(xùn)練,突破單集群建設(shè)限制,靈活高效利用算力資源。未來(lái)幾個(gè)月,ODCC將與業(yè)界針對(duì)Region Scale AI面臨的技術(shù)挑戰(zhàn)展開(kāi)具體研究,探索技術(shù)方向,期望在年內(nèi)形成研究成果,并在9月份ODDC年度大會(huì)進(jìn)行成果發(fā)布。

0e147092-9063-11ef-a511-92fbcf53809c.png

數(shù)字經(jīng)濟(jì)時(shí)代,算力就是生產(chǎn)力。尤其是智能算力,在復(fù)雜的國(guó)際政經(jīng)形勢(shì)下,能否取得突破,關(guān)系到新型數(shù)字技術(shù)的產(chǎn)業(yè)競(jìng)爭(zhēng)力。ODCC跨AZ訓(xùn)練立項(xiàng)已經(jīng)走出了第一步,探索智算產(chǎn)業(yè)的發(fā)展路徑。未來(lái)華為公司會(huì)繼續(xù)在產(chǎn)業(yè)界開(kāi)展分布式AI訓(xùn)練的聯(lián)合創(chuàng)新、認(rèn)證測(cè)試、標(biāo)準(zhǔn)制定等系列工作,也愿意與業(yè)界伙伴一起,賦能我國(guó)數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)的高質(zhì)量發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    18

    文章

    5654

    瀏覽量

    75041
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39866

    瀏覽量

    301511

原文標(biāo)題:AI訓(xùn)練集群從單DC擴(kuò)展至多DC,智算中心的未來(lái)將如何演變?

文章出處:【微信號(hào):SDNLAB,微信公眾號(hào):SDNLAB】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    1分鐘帶你了解數(shù)據(jù)中心供電架構(gòu) #電子元器件 #數(shù)據(jù)中心 #供電架構(gòu)

    數(shù)據(jù)中心
    沛城芯動(dòng)力
    發(fā)布于 :2026年02月03日 15:39:04

    派恩杰SiC器件在數(shù)據(jù)中心中的應(yīng)用

    傳統(tǒng)互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)到人工智能數(shù)據(jù)中心(AIDC)的演進(jìn),本質(zhì)上是一場(chǎng)能源效率與力密度的極限競(jìng)賽。AI
    的頭像 發(fā)表于 12-24 15:47 ?2195次閱讀
    派恩杰SiC器件在<b class='flag-5'>數(shù)據(jù)中心</b>中的應(yīng)用

    AI數(shù)據(jù)中心供電系統(tǒng)的發(fā)展現(xiàn)狀和未來(lái)趨勢(shì)

    AI數(shù)據(jù)中心作為數(shù)字時(shí)代的核心基礎(chǔ)設(shè)施,承擔(dān)著海量數(shù)據(jù)的存儲(chǔ)、處理和傳輸任務(wù),而供電系統(tǒng)是其穩(wěn)定運(yùn)行的“生命線(xiàn)”。隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展,
    的頭像 發(fā)表于 09-24 17:07 ?3800次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>數(shù)據(jù)中心</b>供電系統(tǒng)的發(fā)展現(xiàn)狀和<b class='flag-5'>未來(lái)</b><b class='flag-5'>趨勢(shì)</b>

    華為星河AI數(shù)據(jù)中心網(wǎng)絡(luò)亮相ODCC 2025

    以“擁抱AI變革 點(diǎn)燃網(wǎng)引擎”為主題的2025開(kāi)放數(shù)據(jù)中心大會(huì)(以下簡(jiǎn)稱(chēng)“ODCC 2025”)在北京國(guó)際會(huì)議中心召開(kāi)。在這場(chǎng)匯集了數(shù)據(jù)中心
    的頭像 發(fā)表于 09-16 14:54 ?2656次閱讀
    華為星河<b class='flag-5'>AI</b>高<b class='flag-5'>算</b>效<b class='flag-5'>數(shù)據(jù)中心</b>網(wǎng)絡(luò)亮相ODCC 2025

    華為數(shù)字能源亮相2025開(kāi)放數(shù)據(jù)中心大會(huì)

    AI變革,點(diǎn)燃網(wǎng)引擎”為主題,云集全球數(shù)據(jù)中心領(lǐng)域權(quán)威專(zhuān)家、頭部企業(yè)代表、高校學(xué)者,聚焦電協(xié)同、液冷、邊緣計(jì)算等熱門(mén)話(huà)題,深度探討和分享智
    的頭像 發(fā)表于 09-11 13:50 ?1182次閱讀

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    引領(lǐng)AI時(shí)代網(wǎng)絡(luò)變革:睿海光電的核心競(jìng)爭(zhēng)力 在AI時(shí)代,數(shù)據(jù)中心正經(jīng)歷傳統(tǒng)架構(gòu)向AI工廠與AI
    發(fā)表于 08-13 19:01

    加速AI未來(lái),睿海光電800G OSFP光模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標(biāo)準(zhǔn)

    客戶(hù)的共同選擇 超中心應(yīng)用 :為某國(guó)家實(shí)驗(yàn)室提供800G OSFP SR8模塊,構(gòu)建E級(jí)超互聯(lián)網(wǎng)絡(luò) AI訓(xùn)練
    發(fā)表于 08-13 16:38

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?

    數(shù)據(jù)中心的整體可靠性。以下是其核心作用及具體應(yīng)用場(chǎng)景的詳細(xì)分析:一、性能優(yōu)化:突破帶寬瓶頸,提升計(jì)算效率 鏈路帶寬利用率分析 場(chǎng)景:在AI訓(xùn)練集群中,GPU通過(guò)PCIe與CPU交換
    發(fā)表于 07-29 15:02

    中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案

    同步模塊等。 2. 高校/科研機(jī)構(gòu)智能計(jì)算中心 應(yīng)用背景: 服務(wù)于AI訓(xùn)練、大數(shù)據(jù)建模與圖像處理的科研計(jì)算平臺(tái),要求高速網(wǎng)絡(luò)與大容量數(shù)據(jù)同步
    發(fā)表于 07-01 16:33

    利用NVIDIA技術(shù)構(gòu)建數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案

    全球領(lǐng)先的電子制造商正在利用 NVIDIA 技術(shù),構(gòu)建數(shù)據(jù)中心到邊緣的智慧醫(yī)院解決方案。
    的頭像 發(fā)表于 05-22 09:50 ?975次閱讀

    施耐德電氣發(fā)布數(shù)據(jù)中心高密度AI集群部署解決方案

    在人工智能(AI)驅(qū)動(dòng)的產(chǎn)業(yè)革命浪潮中,數(shù)據(jù)中心正迎來(lái)深刻變革。面對(duì)迅猛增長(zhǎng)的人工智能力需求,部署高密度AI集群已成為
    的頭像 發(fā)表于 04-19 16:54 ?1557次閱讀
    施耐德電氣發(fā)布<b class='flag-5'>數(shù)據(jù)中心</b>高密度<b class='flag-5'>AI</b><b class='flag-5'>集群</b>部署解決方案

    適用于數(shù)據(jù)中心AI時(shí)代的800G網(wǎng)絡(luò)

    隨著人工智能(AI)技術(shù)的迅猛發(fā)展,數(shù)據(jù)中心面臨著前所未有的計(jì)算和網(wǎng)絡(luò)壓力。大語(yǔ)言模型(LLM)訓(xùn)練到生成式AI應(yīng)用,海量
    發(fā)表于 03-25 17:35

    華為全新升級(jí)星河AI數(shù)據(jù)中心網(wǎng)絡(luò)

    在華為中國(guó)合作伙伴大會(huì)2025期間,以 “星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能”為主題的數(shù)據(jù)中心網(wǎng)絡(luò)分論壇圓滿(mǎn)落幕。本次論壇匯聚了來(lái)自全國(guó)的300多位客戶(hù)和伙伴,共同探討
    的頭像 發(fā)表于 03-24 14:46 ?1105次閱讀

    優(yōu)化800G數(shù)據(jù)中心:高速線(xiàn)纜、有源光纜和光纖跳線(xiàn)解決方案

    。通過(guò)綜合考慮帶寬、距離和成本等因素,可提高數(shù)據(jù)中心整體效率并實(shí)現(xiàn)未來(lái)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的升級(jí)和擴(kuò)展。如需了解更多定制化布線(xiàn)方案和專(zhuān)業(yè)建議,請(qǐng)?jiān)L問(wèn)飛速(FS),探索全面的布線(xiàn)產(chǎn)品和解決方案。
    發(fā)表于 03-24 14:20

    Cadence顛覆AI數(shù)據(jù)中心設(shè)計(jì)

    日前舉辦的英偉達(dá) GTC 2025 開(kāi)發(fā)者大會(huì)匯聚了眾多行業(yè)精英,共同探討人工智能的未來(lái)。而人工智能正在重塑全球數(shù)據(jù)中心的格局。據(jù)預(yù)測(cè),未來(lái)將有 1 萬(wàn)億美元用于 AI 驅(qū)動(dòng)的
    的頭像 發(fā)表于 03-21 15:43 ?1175次閱讀