chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

動(dòng)態(tài)感知+智能決策,一文解讀 AI 場(chǎng)景組網(wǎng)下的動(dòng)態(tài)智能選路技術(shù)

星融元Asterfusion ? 2025-06-20 15:01 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能AI),特別是大規(guī)模模型訓(xùn)練和推理,正以前所未有的方式重塑數(shù)據(jù)中心網(wǎng)絡(luò)。傳統(tǒng)的“盡力而為”網(wǎng)絡(luò)架構(gòu),在處理海量、突發(fā)的AI數(shù)據(jù)洪流時(shí)捉襟見(jiàn)肘。AI模型對(duì)網(wǎng)絡(luò)性能的嚴(yán)苛要求——高帶寬、低延遲、零丟包——迫使網(wǎng)絡(luò)必須進(jìn)行一場(chǎng)深刻的智能進(jìn)化,從被動(dòng)的基礎(chǔ)設(shè)施轉(zhuǎn)變?yōu)槔斫鈽I(yè)務(wù)、感知狀態(tài)、智能決策的“AI感知網(wǎng)絡(luò)”。

AI業(yè)務(wù)訴求:對(duì)傳統(tǒng)網(wǎng)絡(luò)架構(gòu)的挑戰(zhàn)

AI集群(如GPU/TPU服務(wù)器)間的通信呈現(xiàn)出典型的“大象流”特征,流量總量巨大、并發(fā)連接少、單條流帶寬極高(可達(dá)數(shù)百Gbps)。這與傳統(tǒng)數(shù)據(jù)中心中“數(shù)量多、帶寬小”的“老鼠流”模式截然不同。傳統(tǒng)均衡技術(shù)失效,逐流ECMP依賴Hash算法在少量大流上極易導(dǎo)致嚴(yán)重負(fù)載不均,特定路徑擁塞而其他路徑閑置。Flowlet 對(duì)路徑時(shí)延差異敏感,配置參數(shù)(如Gap值)難以適應(yīng)動(dòng)態(tài)變化的網(wǎng)絡(luò)環(huán)境,全局信息缺失導(dǎo)致效果打折。逐包ECMP亂序問(wèn)題嚴(yán)重,嚴(yán)重影響GPU計(jì)算效率。AI訓(xùn)練任務(wù)(如AllReduce)具有全局同步特性。任何一條關(guān)鍵路徑上的擁塞、丟包或高延遲,都會(huì)導(dǎo)致整個(gè)計(jì)算集群“空等”,顯著拖慢任務(wù)完成時(shí)間(Job Completion Time, JCT),直接影響業(yè)務(wù)效率和資源成本。

RoCE交換機(jī)(SONiC-Based)選用的動(dòng)態(tài)智能選路創(chuàng)新方案結(jié)合了逐流 ECMP 均衡和基于子流 flowlet 均衡提出動(dòng)態(tài)WCMP(Weighted Cost Multipath)和基于flowlet 的 ALB(Auto Load Balancing),下面將介紹具體相關(guān)技術(shù)。

網(wǎng)絡(luò)智能進(jìn)化:為AI而生的核心技術(shù)

網(wǎng)絡(luò)態(tài)勢(shì)實(shí)時(shí)感知:高精度測(cè)量的基石

  • ASIC硬件級(jí)統(tǒng)計(jì)(百毫秒級(jí)):? 直接讀取交換機(jī)芯片寄存器,獲取端口/隊(duì)列的帶寬利用率、緩存占用等關(guān)鍵指標(biāo),通過(guò)SONiC控制面以亞秒級(jí)精度匯聚分析。
wKgZPGhL1YWAdsMxAABivehbs5M780.png
  • 帶內(nèi)網(wǎng)絡(luò)遙測(cè)INT(納秒級(jí)):? 采用HDC(高延遲捕獲)技術(shù)。當(dāng)數(shù)據(jù)包在交換機(jī)內(nèi)部經(jīng)歷超過(guò)設(shè)定閾值的延遲時(shí),該數(shù)據(jù)包的前150字節(jié)及關(guān)鍵元數(shù)據(jù)(入口/出口端口、精確時(shí)延)會(huì)被復(fù)制并發(fā)送給分析器(如交換機(jī)CPU)。這提供了前所未有的微突發(fā)流量和隊(duì)列擁塞的洞察能力。
wKgZO2hL1hqAR6TSAAAtyi-_KRQ388.png

動(dòng)態(tài)智能選路技術(shù)在星融元交換機(jī)上開(kāi)啟 HDC 功能,并將 CPU 作為 HDC 的收集分析器,通過(guò)分析 HDC 報(bào)文實(shí)現(xiàn)高精度測(cè)量交換機(jī)轉(zhuǎn)發(fā)時(shí)延,并將時(shí)延信息作為路徑質(zhì)量評(píng)價(jià)因子,提高路徑質(zhì)量評(píng)價(jià)精度。

wKgZPGhL1nKAcNx4AABn9b6Zis0759.png

命令行配置 HDC 功能控制INT進(jìn)程運(yùn)行,之后通過(guò) socket 連接進(jìn)行收包循環(huán),將收取到的報(bào)文進(jìn)行解析并將關(guān)鍵信息(出入端口、轉(zhuǎn)發(fā)時(shí)延等)寫入數(shù)據(jù)庫(kù)。

全局路徑智能評(píng)估與同步

感知到的數(shù)據(jù)需要轉(zhuǎn)化為對(duì)整網(wǎng)路徑質(zhì)量的統(tǒng)一認(rèn)知。

  • BGP擴(kuò)展社區(qū)屬性傳遞路徑質(zhì)量:? 創(chuàng)新性地?cái)U(kuò)展BGP協(xié)議(數(shù)據(jù)中心廣泛部署的底層路由協(xié)議),定義新的Path Bandwidth Extended Community屬性。該屬性攜帶一個(gè)綜合評(píng)估路徑質(zhì)量的浮點(diǎn)數(shù)值(單位GB/s),通過(guò)BGP Update報(bào)文在整網(wǎng)擴(kuò)散。

路徑質(zhì)量同步算法邏輯如下圖所示:

wKgZPGhVBbmANW0nAABhhkxqwi8922.png

動(dòng)態(tài)智能選路技術(shù)將兩層 Leaf-Spine 組網(wǎng)中的交換機(jī)端口分為了三類:Leaf 上行口、Leaf 下行口和 Spine口,每種類型端口賦予不同的計(jì)算系數(shù),且每種端口的計(jì)算系數(shù)可配。

  • 異常路徑主動(dòng)剔除:? 設(shè)定質(zhì)量閾值。綜合質(zhì)量過(guò)低的路徑(如擁塞嚴(yán)重、時(shí)延過(guò)高)被判定為“異常路徑”并暫時(shí)剔除,避免其拖累整體性能,待其恢復(fù)后重新引入。
wKgZO2hVBdGAOq-kAABu32D086w993.png

智能負(fù)載決策與執(zhí)行:動(dòng)態(tài)WCMP + Flowlet ALB

基于實(shí)時(shí)感知的全局路徑視圖,執(zhí)行層實(shí)現(xiàn)精細(xì)化流量調(diào)度:

動(dòng)態(tài)WCMP(加權(quán)多路徑):?

  • 核心思想:? 不再是ECMP的“平均主義”,而是根據(jù)每條路徑的實(shí)時(shí)綜合質(zhì)量動(dòng)態(tài)計(jì)算權(quán)重(如質(zhì)量比38:80對(duì)應(yīng)權(quán)重比3:7)。
  • 效果:? 將流量按比例引導(dǎo)到當(dāng)前最優(yōu)的路徑上,最大化利用可用帶寬,避免擁塞熱點(diǎn)。權(quán)重隨網(wǎng)絡(luò)狀態(tài)變化而動(dòng)態(tài)調(diào)整。
wKgZO2hVBgKAXsAGAACAdxa2Oso511.png

基于Flowlet的自動(dòng)負(fù)載均衡(ALB):?

  • 作為ECMP的智能增強(qiáng)器:? 在ECMP選定的下一跳組內(nèi),ASIC芯片實(shí)時(shí)監(jiān)測(cè)組內(nèi)各出端口的瞬時(shí)負(fù)載和隊(duì)列時(shí)延。
  • 微秒級(jí)智能調(diào)度:? 當(dāng)一個(gè)Flowlet(具有自然間隙的數(shù)據(jù)包子流)到達(dá)時(shí),ALB將其動(dòng)態(tài)分配到組內(nèi)當(dāng)前負(fù)載最輕或時(shí)延最低的物理端口上。高負(fù)載/高時(shí)延端口會(huì)被臨時(shí)跳過(guò)。
  • 故障自愈:? 支持端口級(jí)Fail-over,鏈路故障時(shí)自動(dòng)觸發(fā)流量重分布。
wKgZPGhVBiSASY3eAAAxI2tEW_0441.png

多租戶支持:網(wǎng)絡(luò)虛擬化(VRF)

AI云平臺(tái)需要支持多租戶隔離。

  • VRF隔離:? 為不同用戶/租戶分配獨(dú)立VRF路由表。
  • 基于源IP的流量分類:? 利用ASIC的PRE-ACL能力,根據(jù)GPU網(wǎng)段源IP自動(dòng)將流量劃入對(duì)應(yīng)的租戶VRF進(jìn)行查表轉(zhuǎn)發(fā),確保租戶間嚴(yán)格隔離。
wKgZO2hVBkiAIVbnAACBZTbez4M451.png

智能網(wǎng)絡(luò)賦能AI業(yè)務(wù)場(chǎng)景

化解流量洪峰:動(dòng)態(tài)WCMP的威力

  • 場(chǎng)景:? 256 x 400G GPU集群,1:1收斂比Leaf-Spine架構(gòu)。Server1 GPU1 -> Server17 GPU1的大象流。
  • 傳統(tǒng)ECMP困境:? Hash沖突可能導(dǎo)致所有大象流涌向同一Spine,造成Leaf1上行口擁塞丟包,拖慢整個(gè)訓(xùn)練任務(wù)
wKgZPGhVBl6AC_tAAACvsFfQlc4650.png

動(dòng)態(tài)智能選路方案:?

  1. Server17 GPU1的BGP路由攜帶Leaf17->GPU1質(zhì)量宣告。
  2. Spine疊加自身->Leaf17質(zhì)量后宣告給Leaf1。
  3. Leaf1疊加自身->Spine質(zhì)量,匯總所有到GPU1路徑的質(zhì)量。
  4. Leaf1剔除劣質(zhì)路徑,基于剩余路徑質(zhì)量動(dòng)態(tài)計(jì)算WCMP權(quán)重(如3:7)。
  5. 流量按最優(yōu)比例分發(fā)到多條Spine路徑,避免單點(diǎn)擁塞,保障大象流順暢。

業(yè)務(wù)價(jià)值:? 防止關(guān)鍵路徑擁塞,穩(wěn)定JCT,提升GPU集群整體利用率。

Flowlet ALB優(yōu)化ECMP

  • 場(chǎng)景:? 在Leaf1到Spine的ECMP組內(nèi),某條鏈路突發(fā)微擁塞導(dǎo)致時(shí)延升高。
wKgZPGhVBrKAUtopAACy58Yo5oI449.png

Flowlet ALB作用?

  1. ASIC實(shí)時(shí)檢測(cè)到該出端口負(fù)載/時(shí)延超標(biāo)。
  2. 后續(xù)到達(dá)的Flowlet被自動(dòng)引導(dǎo)至組內(nèi)其他負(fù)載正常/時(shí)延低的端口。
  3. 擁塞端口被暫時(shí)“規(guī)避”,待其負(fù)載/時(shí)延恢復(fù)正常后,F(xiàn)lowlet將再次被分配至此端口。

業(yè)務(wù)價(jià)值:? 消除微突發(fā)導(dǎo)致的局部擁塞和抖動(dòng),優(yōu)化端到端時(shí)延,提升GPU計(jì)算效率。

AI時(shí)代的網(wǎng)絡(luò),已不再是簡(jiǎn)單的連通管道。星融元CX-N系列RoCE交換機(jī)所代表的動(dòng)態(tài)感知 + 智能決策(動(dòng)態(tài)WCMP) + 精準(zhǔn)執(zhí)行(Flowlet ALB) 架構(gòu),標(biāo)志著網(wǎng)絡(luò)向“AI感知網(wǎng)絡(luò)”的深刻進(jìn)化。這種進(jìn)化以保障AI業(yè)務(wù)性能為核心目標(biāo),通過(guò)實(shí)時(shí)感知網(wǎng)絡(luò)狀態(tài)、智能評(píng)估路徑質(zhì)量、動(dòng)態(tài)調(diào)整流量分布,有效化解了傳統(tǒng)網(wǎng)絡(luò)在AI負(fù)載下的性能瓶頸,為大規(guī)模AI訓(xùn)練和推理提供了穩(wěn)定、高效、無(wú)損的網(wǎng)絡(luò)基石,釋放AI的真正潛力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37050

    瀏覽量

    290153
  • 負(fù)載均衡
    +關(guān)注

    關(guān)注

    0

    文章

    128

    瀏覽量

    12784
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+具身智能芯片

    可以被稱為第人稱視角。 第人稱視角:指個(gè)實(shí)體本身在觀察或經(jīng)歷事物時(shí),所能夠看到或感知到的角度。 二、AI
    發(fā)表于 09-18 11:45

    AI 邊緣計(jì)算網(wǎng)關(guān):開(kāi)啟智能新時(shí)代的鑰匙?—龍興物聯(lián)

    順暢地通向云端,實(shí)現(xiàn)設(shè)備與云端之間高效的數(shù)據(jù)傳輸與交互。通過(guò)融合先進(jìn)的邊緣計(jì)算和人工智能技術(shù),AI 邊緣計(jì)算網(wǎng)關(guān)能夠在靠近數(shù)據(jù)源的網(wǎng)絡(luò)邊緣,對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)處理和精準(zhǔn)分析,進(jìn)而實(shí)現(xiàn)智能決策
    發(fā)表于 08-09 16:40

    AI智能體的技術(shù)應(yīng)用與未來(lái)圖景

    AI智能技術(shù)正經(jīng)歷從感知智能向認(rèn)知智能的范式躍遷。其技術(shù)
    的頭像 發(fā)表于 07-24 11:04 ?639次閱讀

    晶圓切割深度動(dòng)態(tài)補(bǔ)償?shù)?b class='flag-5'>智能決策模型與 TTV 預(yù)測(cè)控制

    摘要:本文針對(duì)超薄晶圓切割過(guò)程中 TTV 均勻性控制難題,研究晶圓切割深度動(dòng)態(tài)補(bǔ)償?shù)?b class='flag-5'>智能決策模型與 TTV 預(yù)測(cè)控制方法。分析影響切割深度與 TTV 的關(guān)鍵因素,闡述智能
    的頭像 發(fā)表于 07-23 09:54 ?291次閱讀
    晶圓切割深度<b class='flag-5'>動(dòng)態(tài)</b>補(bǔ)償?shù)?b class='flag-5'>智能</b><b class='flag-5'>決策</b>模型與 TTV 預(yù)測(cè)控制

    ALVA技術(shù)重塑工業(yè)智能感知決策邊界

    無(wú)論是西門子構(gòu)建的工業(yè) AI 交易中心,還是微軟推出的工廠運(yùn)營(yíng)智能體,其本質(zhì)都在驗(yàn)證個(gè)趨勢(shì)——工業(yè)智能體的核心競(jìng)爭(zhēng)力,正從單模型能力轉(zhuǎn)向
    的頭像 發(fā)表于 07-22 14:32 ?1213次閱讀

    HarmonyOS AI輔助編程工具(CodeGenie)代碼智能解讀

    本功能從DevEco CodeGenie 5.1.0 Beta版本開(kāi)始支持。 CodeGenie提供智能AI能力對(duì)框選的代碼片段進(jìn)行逐條解釋,總結(jié)代碼段含義,幫助開(kāi)發(fā)者提升閱讀代碼的速度和效率
    發(fā)表于 07-17 17:02

    信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    DeepSeek-R1:強(qiáng)大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開(kāi)發(fā)的新AI大模型。其核心優(yōu)勢(shì)
    發(fā)表于 07-16 15:29

    CES Asia 2025同期低空智能感知與空域管理技術(shù)論壇即將啟幕

    的最新進(jìn)展,探討如何打破系統(tǒng)間的壁壘,實(shí)現(xiàn)不同系統(tǒng)之間的信息共享與協(xié)同工作,為未來(lái)城市空中交通的大規(guī)模商業(yè)化運(yùn)營(yíng)奠定基礎(chǔ)。 人工智能技術(shù)的飛速發(fā)展,為空域動(dòng)態(tài)管理帶來(lái)了新的機(jī)遇。在這議題下,與會(huì)者將深入探討
    發(fā)表于 07-10 10:16

    CES Asia 2025聚焦低空智能感知與空域管理,論壇開(kāi)啟行業(yè)新征程

    ,為管制員提供決策支持。在本次論壇中,人工智能領(lǐng)域的專家和低空經(jīng)濟(jì)從業(yè)者將共同探討人工智能在空域動(dòng)態(tài)管理中的應(yīng)用場(chǎng)景
    發(fā)表于 07-10 09:57

    Path Bandwidth Extended Community:藏在BGP屬性里的智能路由革命

    傳統(tǒng)BGP協(xié)議雖能實(shí)現(xiàn)路由可達(dá)性,但缺乏對(duì)路徑質(zhì)量的動(dòng)態(tài)感知能力,導(dǎo)致流量分配不均、高延遲鏈未被規(guī)避等問(wèn)題。為提升網(wǎng)絡(luò)資源利用率,動(dòng)態(tài)智能
    的頭像 發(fā)表于 06-24 14:00 ?515次閱讀
    Path Bandwidth Extended Community:藏在BGP屬性里的<b class='flag-5'>智能</b>路由革命

    智算網(wǎng)絡(luò)路徑質(zhì)量三要素:帶寬/隊(duì)列/時(shí)延在智能中的協(xié)同優(yōu)化

    為了從根本上優(yōu)化AI流量的傳輸效率并最大化集群利用率,我們?cè)O(shè)計(jì)并實(shí)踐了基于多維度網(wǎng)絡(luò)狀態(tài)感知動(dòng)態(tài)智能
    的頭像 發(fā)表于 06-13 15:44 ?404次閱讀
    智算網(wǎng)絡(luò)路徑質(zhì)量三要素:帶寬/隊(duì)列/時(shí)延在<b class='flag-5'>智能</b><b class='flag-5'>選</b><b class='flag-5'>路</b>中的協(xié)同優(yōu)化

    高德發(fā)布AI導(dǎo)航智能體:高速駕車場(chǎng)景下可感知車道級(jí)交通流變化

    模塊構(gòu)建智能閉環(huán),集成多項(xiàng)高德核心技術(shù)。 官方表示,該智能體“更像經(jīng)驗(yàn)豐富的‘老司機(jī)’”,能實(shí)時(shí)感知路況、預(yù)判風(fēng)險(xiǎn)并主動(dòng)調(diào)整策略。據(jù)IT之家了解,以高速駕車
    的頭像 發(fā)表于 04-15 18:28 ?593次閱讀
    高德發(fā)布<b class='flag-5'>AI</b>導(dǎo)航<b class='flag-5'>智能</b>體:高速駕車<b class='flag-5'>場(chǎng)景</b>下可<b class='flag-5'>感知</b>車道級(jí)交通流變化

    智能家居Mesh組網(wǎng)方案:實(shí)現(xiàn)智能化生活的無(wú)縫連接NRF52832

    互聯(lián)成為了個(gè)迫切的問(wèn)題。 為了解決這問(wèn)題,迅通科技研發(fā)了智能家居 Mesh 組網(wǎng)方案,為傳統(tǒng)智能家居產(chǎn)品商提供了
    發(fā)表于 04-15 14:07

    AI賦能邊緣網(wǎng)關(guān):開(kāi)啟智能時(shí)代的新藍(lán)海

    在數(shù)字化轉(zhuǎn)型的浪潮中,AI與邊緣計(jì)算的結(jié)合正掀起場(chǎng)深刻的產(chǎn)業(yè)變革。邊緣網(wǎng)關(guān)作為連接物理世界與數(shù)字世界的橋梁,在AI技術(shù)的加持下,正從簡(jiǎn)單的數(shù)據(jù)采集傳輸節(jié)點(diǎn),進(jìn)化為具備
    發(fā)表于 02-15 11:41

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    Intelligence,EAI)是個(gè)集多學(xué)科技術(shù)與理論于體的研究領(lǐng)域,旨在探討智能如何在智能體與其環(huán)境的互動(dòng)中展現(xiàn)。 與傳統(tǒng)的人工
    發(fā)表于 12-20 19:17