chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為發(fā)布數(shù)據(jù)中心新型網(wǎng)絡架構UB-Mesh

晶芯觀察 ? 來源:電子發(fā)燒友 ? 作者:黃晶晶 ? 2025-09-07 06:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群



電子發(fā)燒友網(wǎng)綜合報道 在最近的Hot Chip2025大會上,華為進行了一場線上分享,提出了一種全新的AI數(shù)據(jù)中心網(wǎng)絡架構UB-Mesh。

隨著大語言模型(LLM)規(guī)模持續(xù)擴張,其訓練對計算算力與網(wǎng)絡帶寬的需求呈指數(shù)級增長。傳統(tǒng)數(shù)據(jù)中心多采用 Clos 架構,雖能提供對稱節(jié)點帶寬,卻因依賴大量高基數(shù)交換機與光模塊,存在成本高昂、可用性低等問題,難以滿足 LLM 訓練的大規(guī)模、高帶寬、低成本、高可用四大核心需求(R1-R4)。

那么UB-Mesh是通過分層本地化 nD-FullMesh 拓撲與多維度優(yōu)化,實現(xiàn)性能、成本與可用性的平衡。

UB-Mesh 的設計遵循三大核心原則:一是流量驅動拓撲(P1),利用 LLM 訓練中張量并行(TP)、序列并行(SP)占 97% 流量且集中于近距離節(jié)點的特性,構建分層網(wǎng)絡;二是拓撲感知計算通信(P2),將并行策略、路由等與拓撲深度協(xié)同,避免帶寬浪費;三是自愈容錯(P3),通過硬件備份與快速故障恢復,保障訓練連續(xù)性。

UB-Mesh的整體架構設計,展示了從2D-FullMesh(機柜內)到4D-FullMesh(Pod內)再到SuperPod的擴展方式。

在核心架構設計上,UB-Mesh 以nD-FullMesh 拓撲為基礎,通過 “維度遞推” 實現(xiàn)規(guī)?;瘮U展:從板級 1D 全連接(相鄰 NPU 直接互連),到機架級 2D 全連接(1D mesh 間互連),最終形成 Pod 級 4D-FullMesh(UB-Mesh-Pod),可支持 8K NPU 的高帶寬域。UB-Mesh-Pod是一個由1024個NPU組成的4D-FullMesh集群。該集群內部,每個機柜包含64個NPU,構成一個2D-FullMesh;16個這樣的機柜再構成一個2D-FullMesh,從而形成一個4D-FullMesh的Pod。

該拓撲以短距離電連接為主(占比 86.7%),大幅減少對高成本光模塊與交換機的依賴,同時通過靈活帶寬分配,為近距離通信(TP/SP)提供高帶寬,遠距離通信(數(shù)據(jù)并行 DP)分配低帶寬,精準匹配 LLM 流量特征。

硬件層面,UB-Mesh 通過統(tǒng)一總線(UB) 實現(xiàn)組件互連,替代傳統(tǒng)混合互連(PCIe/NVLink/IB),支持 Load/Store 等同步操作與 Read/Write 等異步操作,不僅簡化驅動設計,還實現(xiàn) IO 資源靈活分配與硬件資源池化(如 CPU、NPU、DDR 共享)。核心硬件包括支持 72 路 UB 通道的 NPU、32 路 UB 通道的 CPU,以及低基數(shù)交換機(LRS,用于機架內聚合)、高基數(shù)交換機(HRS,用于 Pod 間互連)。此外,架構采用 “64+1 備份設計”,每機架額外配置 1 個備用 NPU,節(jié)點故障時可通過 LRS 快速切換,僅增加少量延遲而不中斷訓練。

為解決架構落地挑戰(zhàn),UB-Mesh 提出多維度優(yōu)化機制。路由方面,創(chuàng)新全路徑路由(APR) ,結合源路由(8 字節(jié)緊湊頭實現(xiàn)路徑指示)、結構化尋址(按 Pod / 機架劃分地址段,減少路由表開銷)與拓撲感知無死鎖流控(TFC 算法,僅用 2 個虛擬通道實現(xiàn)無死鎖),充分利用多路徑帶寬,避免擁塞。故障恢復方面,采用 “直接通知” 機制,節(jié)點故障時直接向通信目標節(jié)點發(fā)送信息,相比傳統(tǒng)逐跳通知,大幅縮短收斂時間。通信優(yōu)化方面,針對 All-Reduce 設計多環(huán)算法,通過 idle 鏈路復用與流量分區(qū)提升帶寬利用率;針對 All-to-All 采用多路徑傳輸與分層廣播 / 歸約,適配 MoE 模型的專家并行需求。

實驗驗證顯示,UB-Mesh 相比傳統(tǒng) Clos 架構優(yōu)勢顯著:成本效率提升 2.04 倍,減少 98% 高基數(shù)交換機與 93% 光模塊使用,網(wǎng)絡基礎設施成本占比從 67% 降至 20%;可用性達 98.8%,較 Clos(91.6%)提升 7.2%,其 Mean Time Between Failure(MTBF)達 98.5 小時,是 Clos 的 7.14 倍;在 LLAMA-70B、GPT3-175B、MoE-10T 等模型訓練中,性能僅下降 7% 以內,且集群規(guī)模擴展至 64 倍時,線性度仍保持 95% 以上,可支持超大規(guī)模 LLM 訓練。

UB-Mesh架構通過其創(chuàng)新的nD-FullMesh拓撲、統(tǒng)一總線技術以及一系列系統(tǒng)級優(yōu)化,成功地解決了大規(guī)模LLM訓練所面臨的“通信墻”問題。它不僅在理論上證明了分層局部化網(wǎng)絡設計的優(yōu)越性,更在實踐中展示了其在成本、性能和可靠性方面的巨大優(yōu)勢。UB-Mesh為構建下一代超大規(guī)模、高性價比的AI計算集群提供了一個強有力的范例,預示著AI基礎設施設計的一次重要范式轉移。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    1分鐘帶你了解數(shù)據(jù)中心供電架構 #電子元器件 #數(shù)據(jù)中心 #供電架構

    數(shù)據(jù)中心
    沛城芯動力
    發(fā)布于 :2026年02月03日 15:39:04

    華為亮相2025亞洲數(shù)據(jù)中心展覽會

    在亞太地區(qū)規(guī)模最大的數(shù)據(jù)中心行業(yè)盛會——新加坡科技周「2025亞洲數(shù)據(jù)中心展覽會」上,華為數(shù)字能源于新加坡濱海灣金沙會展中心的參展活動圓滿收官。為期兩天的展會中,
    的頭像 發(fā)表于 10-14 15:03 ?920次閱讀

    華為面向拉美地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡方案

    華為數(shù)據(jù)通信創(chuàng)新峰會2025拉美站期間,以“星河AI數(shù)據(jù)中心網(wǎng)絡,賦AI時代新動能”為主題的分論壇上,華為面向拉美地區(qū)
    的頭像 發(fā)表于 08-11 10:42 ?2339次閱讀

    華為數(shù)據(jù)中心古井貢酒樣板點重磅發(fā)布

    以“安全可靠,醞建未來”為主題的華為數(shù)據(jù)中心古井貢酒樣板點發(fā)布會在亳州成功舉行。該樣板點使用華為智能微模塊和UPS5000-H解決方案,助力古井貢酒構建安全、高效、智能的現(xiàn)代化
    的頭像 發(fā)表于 08-01 14:27 ?1181次閱讀

    華為數(shù)據(jù)中心自動駕駛網(wǎng)絡通過EANTC歐洲高級網(wǎng)絡測試中心L4級自智網(wǎng)絡測評

    Networking Test Center,簡稱“EANTC”)發(fā)布華為數(shù)據(jù)中心自動駕駛網(wǎng)絡的自智網(wǎng)絡(Autonomous Netwo
    的頭像 發(fā)表于 06-22 10:50 ?2058次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>數(shù)據(jù)中心</b>自動駕駛<b class='flag-5'>網(wǎng)絡</b>通過EANTC歐洲高級<b class='flag-5'>網(wǎng)絡</b>測試<b class='flag-5'>中心</b>L4級自智<b class='flag-5'>網(wǎng)絡</b>測評

    華為面向亞太地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡方案

    華為數(shù)據(jù)通信創(chuàng)新峰會2025亞太站期間,以“星河AI數(shù)據(jù)中心網(wǎng)絡,賦AI時代新動能”為主題的分論壇上,華為面向亞太地區(qū)
    的頭像 發(fā)表于 06-11 11:11 ?1432次閱讀

    華為面向中東中亞地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡

    近日,在華為數(shù)據(jù)通信創(chuàng)新峰會2025中東中亞站期間,以“星河AI數(shù)據(jù)中心網(wǎng)絡,賦AI時代新動能”為主題的分論壇上,華為面向中東中亞地區(qū)
    的頭像 發(fā)表于 05-21 15:49 ?887次閱讀

    華為榮獲數(shù)據(jù)中心自智網(wǎng)絡基礎能力解決方案檢測證書

    2025年云網(wǎng)智聯(lián)大會首日,中國信息通信研究院(簡稱“信通院”)向華為技術有限公司(以下簡稱“華為”)等首批獲得《數(shù)據(jù)中心自智網(wǎng)絡基礎能力解決方案檢測證書》的企業(yè)正式頒發(fā)證書。此項認證
    的頭像 發(fā)表于 04-25 16:00 ?879次閱讀

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡

    和性能隔離能力,以保障不同用戶任務互不干擾。 分布式AI計算與網(wǎng)絡架構設計 分布式計算已成為AI訓練的主流方式,通過將工作負載分配到多個GPU節(jié)點并行處理,以加速模型訓練。這對數(shù)據(jù)中心
    發(fā)表于 03-25 17:35

    華為攜手中控技術打造全國數(shù)據(jù)中心網(wǎng)絡創(chuàng)新示范項目

    華為中國合作伙伴大會2025期間,華為與中控技術股份有限公司(以下簡稱“中控技術”)聯(lián)合發(fā)布星河AI數(shù)據(jù)中心網(wǎng)絡優(yōu)秀實踐樣板點。此次合作旨在
    的頭像 發(fā)表于 03-24 14:51 ?1060次閱讀

    華為全新升級星河AI數(shù)據(jù)中心網(wǎng)絡

    華為中國合作伙伴大會2025期間,以 “星河AI數(shù)據(jù)中心網(wǎng)絡,賦AI時代新動能”為主題的數(shù)據(jù)中心網(wǎng)絡分論壇圓滿落幕。本次論壇匯聚了來自全國
    的頭像 發(fā)表于 03-24 14:46 ?1105次閱讀

    優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案

    高速線纜支持熱插拔功能,具有低功耗和小彎曲半徑,便于靈活布線,可實現(xiàn)高穩(wěn)定性、低成本、節(jié)省空間和高散熱等優(yōu)勢,非常適合數(shù)據(jù)中心布線需求。這些高速線纜能夠與交換機、路由器和服務器無縫集成,確保網(wǎng)絡
    發(fā)表于 03-24 14:20

    華為攜手EANTC啟動數(shù)據(jù)中心網(wǎng)絡ADN分級測評認證

    近日,華為聯(lián)合EANTC(THE EUROPEAN ADVANCED NETWORKING TEST CENTER)正式啟動數(shù)據(jù)中心網(wǎng)絡ADN分級測評認證。
    的頭像 發(fā)表于 03-20 16:00 ?1364次閱讀

    華為繼續(xù)領跑中國數(shù)據(jù)中心交換機市場第一

    近日,全球領先的IT市場研究和咨詢公司IDC發(fā)布了最新的《中國以太網(wǎng)交換機市場跟蹤報告,2024Q4》。報告顯示,華為CloudEngine系列數(shù)據(jù)中心交換機在2024年全年以41.9%的份額,蟬聯(lián)
    的頭像 發(fā)表于 03-19 16:04 ?1593次閱讀

    華為發(fā)布新一代站點能源架構及AI數(shù)據(jù)中心建設理念

    西班牙巴塞羅那2025年3月13日?/美通社/ -- 在MWC25巴塞羅那期間舉辦的產品與解決方案發(fā)布會上,華為數(shù)據(jù)中心能源及關鍵供電產品線總裁何波發(fā)布新一代站點能源
    的頭像 發(fā)表于 03-13 15:38 ?839次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>發(fā)布</b>新一代站點能源<b class='flag-5'>架構</b>及AI<b class='flag-5'>數(shù)據(jù)中心</b>建設理念