chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA Spectrum-XGS以太網(wǎng)如何實(shí)現(xiàn)跨區(qū)域網(wǎng)絡(luò)擴(kuò)展

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2025-09-29 16:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI 技術(shù)日益復(fù)雜,訓(xùn)練與推理領(lǐng)域的新進(jìn)展對(duì)數(shù)據(jù)中心提出了更高的要求。隨著數(shù)據(jù)中心算力的迅速提升,數(shù)據(jù)中心基礎(chǔ)設(shè)施逐漸受到了和算法和模型無(wú)關(guān)的基礎(chǔ)物理?xiàng)l件的限制,如電力供應(yīng)、散熱能力以及空間限制等,制約了 AI 工廠的物理擴(kuò)展。為了持續(xù)增長(zhǎng),在構(gòu)建新的數(shù)據(jù)中心時(shí),需要考慮通過(guò)遠(yuǎn)程互連技術(shù)將這些計(jì)算資源池化在一起,實(shí)現(xiàn)協(xié)同服務(wù)于單一訓(xùn)練任務(wù)或分離式推理工作負(fù)載。

傳統(tǒng)上,當(dāng)采用基于通用商業(yè)芯片構(gòu)建的遠(yuǎn)程互連以太網(wǎng)來(lái)連接多個(gè)數(shù)據(jù)中心時(shí),首要目標(biāo)是確保數(shù)據(jù)能夠準(zhǔn)確送達(dá)目的地。由于傳輸距離較長(zhǎng),延遲較高,導(dǎo)致網(wǎng)絡(luò)擁塞的概率顯著增加,其后果可能很?chē)?yán)重。

為緩解這一挑戰(zhàn)并防止丟包,通用以太網(wǎng)供應(yīng)商采用了深度數(shù)據(jù)包緩存作為解決方案,以此來(lái)吸收網(wǎng)絡(luò)流量的大規(guī)模突發(fā),并已部署了這種方案。這種深度緩沖交換機(jī)雖適用于遠(yuǎn)程服務(wù)提供商和電信應(yīng)用,卻在 AI 應(yīng)用中出現(xiàn)了問(wèn)題。

特別是,基于深度緩沖交換機(jī)的高延遲是其天然的弊病,此外,當(dāng)緩沖被填滿時(shí),就必須進(jìn)行排空。對(duì)于 AI 工作負(fù)載而言,這種情況發(fā)生的不可預(yù)測(cè)性,會(huì)導(dǎo)致大量的網(wǎng)絡(luò)抖動(dòng)或數(shù)據(jù)傳輸波動(dòng)。高延遲和這種網(wǎng)絡(luò)突發(fā)流量吸收技術(shù)帶來(lái)的不確定性,會(huì)影響訓(xùn)練和分離式推理的性能,因?yàn)檫@些任務(wù)本質(zhì)上是同步的,需要網(wǎng)絡(luò)提供穩(wěn)定且可預(yù)期的傳輸表現(xiàn)。

本文介紹了面向跨區(qū)域網(wǎng)絡(luò)的NVIDIA Spectrum-XGS 以太網(wǎng)技術(shù)是如何實(shí)現(xiàn)不同數(shù)據(jù)中心之間的互連,并提供滿足 AI 應(yīng)用所需的高性能。

什么是跨區(qū)域網(wǎng)絡(luò)?

跨區(qū)域網(wǎng)絡(luò)是一種新型的 AI 計(jì)算網(wǎng)絡(luò)互連架構(gòu),可被視為一個(gè)新維度,獨(dú)立于現(xiàn)有的縱向擴(kuò)展和橫向擴(kuò)展網(wǎng)絡(luò)。借助于跨區(qū)域網(wǎng)絡(luò)的 Spectrum-XGS 以太網(wǎng),不同規(guī)模和不同距離的多個(gè)數(shù)據(jù)中心能夠被整合為一個(gè)統(tǒng)一的大型 AI 工廠,首次實(shí)現(xiàn)了在跨地域的多個(gè)獨(dú)立的數(shù)據(jù)中心之間運(yùn)行大規(guī)模單 AI 訓(xùn)練與推理任務(wù)所需的網(wǎng)絡(luò)高性能。

e796a41c-9ac0-11f0-8c8f-92fbcf53809c.jpg

圖 1. AI 所需的三種網(wǎng)絡(luò)類(lèi)型是縱向擴(kuò)展、橫向擴(kuò)展和跨區(qū)域擴(kuò)展

NVIDIA Spectrum-XGS 以太網(wǎng)如何實(shí)現(xiàn)跨區(qū)域網(wǎng)絡(luò)擴(kuò)展?

NVIDIA Spectrum-XGS 以太網(wǎng)是 NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺(tái)的一項(xiàng)新技術(shù)。它采用了同樣的 Spectrum-X 以太網(wǎng)交換機(jī)和 ConnectX-8 SuperNIC 硬件組合,以及和數(shù)據(jù)中心內(nèi)橫向擴(kuò)展網(wǎng)絡(luò)相同的軟件棧與通信庫(kù)。

借助 Spectrum-XGS 以太網(wǎng),AI 工廠之間可實(shí)現(xiàn)長(zhǎng)距離連接,如 500 米以上的連接,這意味著實(shí)現(xiàn)園區(qū)內(nèi)不同建筑之間的連接,或者跨越數(shù)十乃至數(shù)百英里,實(shí)現(xiàn)跨城市、跨州乃至跨國(guó)之間的連接。為了支持這種跨區(qū)域擴(kuò)展的連接需求,保障高效帶寬與性能隔離的算法也必須持續(xù)發(fā)展。

距離感知算法在跨區(qū)域網(wǎng)絡(luò)擴(kuò)展中的作用是什么?

長(zhǎng)距離傳輸數(shù)據(jù)面臨的主要挑戰(zhàn)之一是延遲的增加,即使數(shù)據(jù)以光的形式在光纖中傳播也是如此。數(shù)據(jù)在玻璃纖維中每傳輸 1 米需要 5 納秒,意味著每傳輸 1 公里需要 5 微秒。盡管這些數(shù)值看似微小,但在 GPU 之間的通信中,每微秒都至關(guān)重要。

Spectrum-XGS 以太網(wǎng)采用了改進(jìn)的基于遙測(cè)技術(shù)的擁塞控制與動(dòng)態(tài)路由算法,專(zhuān)門(mén)根據(jù)通信設(shè)備之間的距離進(jìn)行了優(yōu)化。在每次連接建立時(shí),網(wǎng)絡(luò)會(huì)知道相互連接的兩臺(tái)設(shè)備是在數(shù)據(jù)中心內(nèi),還是跨越數(shù)據(jù)中心。

這有助于交換機(jī)確定動(dòng)態(tài)路由負(fù)載均衡的最佳策略,并通知 SuperNIC 調(diào)整面向擁塞控制的數(shù)據(jù)注入速率。在網(wǎng)絡(luò)層面,這使得 Spectrum-XGS 以太網(wǎng)能夠高效處理通信,并避免額外延遲。

Spectrum-XGS 以太網(wǎng)技術(shù)在跨區(qū)域網(wǎng)絡(luò)方面具有多項(xiàng)顯著優(yōu)勢(shì),包括:

集成、統(tǒng)一的網(wǎng)絡(luò)架構(gòu):Spectrum-X 以太網(wǎng)橫向擴(kuò)展和 Spectrum-XGS 以太網(wǎng)跨區(qū)域擴(kuò)展均基于相同的硬件、軟件和通信庫(kù)??梢怨ぷ髫?fù)載和網(wǎng)絡(luò)操作的統(tǒng)一管理,這是通用以太網(wǎng)無(wú)法實(shí)現(xiàn)的。

基于遙測(cè)的端到端擁塞控制:統(tǒng)一架構(gòu)還支持全局網(wǎng)絡(luò)可視化。借助來(lái)自數(shù)據(jù)中心內(nèi)外網(wǎng)絡(luò)的全面遙測(cè)數(shù)據(jù),無(wú)需深度緩沖交換即可實(shí)現(xiàn)基于遙測(cè)的擁塞控制。

智能、自動(dòng)調(diào)節(jié)負(fù)載均衡:Spectrum-X 以太網(wǎng) AI 網(wǎng)絡(luò)具有距離感知和 NVIDIA 集合通信庫(kù)(NCCL)-感知功能,能夠感知和補(bǔ)償由位置而導(dǎo)致的不同網(wǎng)絡(luò)流量模式,并動(dòng)態(tài)調(diào)整臨界值和限制,以確保最高的網(wǎng)絡(luò)性能。

更大限度地降低跨區(qū)域工作負(fù)載的延遲: Spectrum-XGS 以太網(wǎng)專(zhuān)為提供可預(yù)測(cè)的結(jié)果而進(jìn)行了優(yōu)化,這使網(wǎng)絡(luò)能夠感知和補(bǔ)償遠(yuǎn)距離傳輸?shù)臄?shù)據(jù)流,最大限度地減少延遲損失,且不存在深度緩沖帶來(lái)的抖動(dòng)風(fēng)險(xiǎn)。

彈性跨區(qū)域擴(kuò)展能力:由于相同的硬件被用于橫向擴(kuò)展和跨區(qū)域擴(kuò)展,因此可以重新分配網(wǎng)絡(luò)資源以支持?jǐn)?shù)據(jù)中心內(nèi)或數(shù)據(jù)中心間的流量。通用的淺緩沖以太網(wǎng)交換機(jī)無(wú)法被用于遠(yuǎn)程連接。

NVIDIA Spectrum-XGS 以太網(wǎng)有哪些性能優(yōu)勢(shì)?

為展示 NVIDIA Spectrum-XGS 以太網(wǎng)對(duì)跨區(qū)域擴(kuò)展性能的影響,NVIDIA 工程師在相距 10 公里的多點(diǎn)之間運(yùn)行了 NCCL 測(cè)試,并將其結(jié)果與通用以太網(wǎng)進(jìn)行了對(duì)比。如圖 2 所示,性能優(yōu)勢(shì)十分顯著:

e7f5179a-9ac0-11f0-8c8f-92fbcf53809c.jpg

圖 2. 與通用以太網(wǎng)相比,NVIDIA Spectrum-XGS 以太網(wǎng)可將性能提升高達(dá) 1.9 倍

相較通用以太網(wǎng),NVIDIA Spectrum-XGS 以太網(wǎng)可提供高達(dá) 1.9 倍的 NCCL All-Reduce 帶寬,特別是對(duì)于大消息,性能提升尤為顯著,而這正是 AI 訓(xùn)練工作負(fù)載中的典型場(chǎng)景。NCCL 性能的提升有助于縮短 AI 應(yīng)用的任務(wù)完成時(shí)間。

跨區(qū)域網(wǎng)絡(luò)如何提高AI 工廠的投資回報(bào)率?

NVIDIA Spectrum-XGS 以太網(wǎng)增強(qiáng)了 AI 基礎(chǔ)設(shè)施的靈活性。該技術(shù)使數(shù)據(jù)中心能夠在任意距離下實(shí)現(xiàn)高效通信,且不犧牲性能,從而構(gòu)建出可在橫向擴(kuò)展架構(gòu)與跨區(qū)域網(wǎng)絡(luò)擴(kuò)展之間共享的通用平臺(tái)?;?Spectrum-XGS 以太網(wǎng)的多個(gè)以太網(wǎng)數(shù)據(jù)中心能夠被輕松整合為一個(gè)統(tǒng)一的整體,突破了地理位置的限制。

基于 Spectrum-XGS 構(gòu)建的以太網(wǎng)數(shù)據(jù)中心能夠被無(wú)縫整合為單一系統(tǒng)運(yùn)行,無(wú)論相距多遠(yuǎn)。這使得關(guān)鍵任務(wù)型 AI 基礎(chǔ)設(shè)施可以高效池化數(shù)據(jù)中心資源,持續(xù)為復(fù)雜 AI 工作負(fù)載提供價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    41

    文章

    5861

    瀏覽量

    178537
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5416

    瀏覽量

    74305
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    36955

    瀏覽量

    289732

原文標(biāo)題:如何利用跨區(qū)域網(wǎng)絡(luò)將分布式數(shù)據(jù)中心連接成大型 AI 工廠

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA Spectrum-X 以太網(wǎng)交換機(jī)助力 Meta 和 Oracle 加速網(wǎng)絡(luò)性能

    超大規(guī)模企業(yè)廣泛采用 NVIDIA 網(wǎng)絡(luò)解決方案,驅(qū)動(dòng)十億瓦級(jí)(Giga-Scale)高性能 AI 數(shù)據(jù)中心 Meta 推出基于 NVIDIA Spectrum
    的頭像 發(fā)表于 10-14 10:26 ?353次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum</b>-X <b class='flag-5'>以太網(wǎng)</b>交換機(jī)助力 Meta 和 Oracle 加速<b class='flag-5'>網(wǎng)絡(luò)</b>性能

    移植網(wǎng)絡(luò)PHY芯片驅(qū)動(dòng),如何融入 rt-thread 的網(wǎng)絡(luò)體系,并添加新的以太網(wǎng)類(lèi)型的報(bào)文?

    PHY 芯片最底層收發(fā)以太網(wǎng)報(bào)文,有可能組成 VLAN 網(wǎng)絡(luò)); 我要實(shí)現(xiàn)一個(gè)新的以太網(wǎng)類(lèi)型報(bào)文(HPGP報(bào)文,以太網(wǎng)報(bào)文類(lèi)型為 0x88
    發(fā)表于 09-22 06:11

    NVIDIA推出Spectrum-XGS以太網(wǎng)技術(shù)

    NVIDIA 今日宣布推出 NVIDIA Spectrum-XGS 以太網(wǎng)。這項(xiàng)跨區(qū)域擴(kuò)展(sc
    的頭像 發(fā)表于 08-27 12:51 ?946次閱讀

    以太網(wǎng)入門(mén):從零開(kāi)始,掌握以太網(wǎng)基礎(chǔ)知識(shí)!

    以太網(wǎng)作為現(xiàn)代通信技術(shù)的基石,其重要性不言而喻。無(wú)論是日常網(wǎng)絡(luò)應(yīng)用,還是AI對(duì)高速大帶寬網(wǎng)絡(luò)的需求,以太網(wǎng)都扮演著不可或缺的角色。本文將從零開(kāi)始,帶您了解
    的頭像 發(fā)表于 06-09 14:00 ?3986次閱讀
    <b class='flag-5'>以太網(wǎng)</b>入門(mén):從零開(kāi)始,掌握<b class='flag-5'>以太網(wǎng)</b>基礎(chǔ)知識(shí)!

    雙通道CAN轉(zhuǎn)以太網(wǎng)#CAN轉(zhuǎn)以太網(wǎng)#三格電子

    以太網(wǎng)
    三格電子科技
    發(fā)布于 :2025年05月12日 13:17:05

    NVIDIA推出全新硅光網(wǎng)絡(luò)交換機(jī)

    NVIDIA 今天推出了 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光網(wǎng)絡(luò)交換機(jī),使 AI 工廠能夠
    的頭像 發(fā)表于 03-20 14:52 ?714次閱讀

    廣成科技CAN轉(zhuǎn)以太網(wǎng)模塊的作用和應(yīng)用

    CAN轉(zhuǎn)以太網(wǎng)模塊是一類(lèi)能夠?qū)AN總線數(shù)據(jù)轉(zhuǎn)換為以太網(wǎng)數(shù)據(jù)的設(shè)備,通常用于實(shí)現(xiàn)CAN總線與以太網(wǎng)總線之間的互聯(lián)互通。在智能鎖柜和智能文件交換箱中,CAN轉(zhuǎn)
    的頭像 發(fā)表于 03-20 13:58 ?861次閱讀
    廣成科技CAN轉(zhuǎn)<b class='flag-5'>以太網(wǎng)</b>模塊的作用和應(yīng)用

    以太網(wǎng)與因特網(wǎng):不同的網(wǎng)絡(luò)技術(shù),共同的數(shù)字基礎(chǔ)

    以太網(wǎng)和因特網(wǎng)并不是對(duì)立的技術(shù),而是共同構(gòu)成了現(xiàn)代網(wǎng)絡(luò)生態(tài)的基礎(chǔ)。以太網(wǎng)提供了局部網(wǎng)絡(luò)的高效連接,而因特網(wǎng)則實(shí)現(xiàn)了全球范圍的互聯(lián)與信息共享。
    的頭像 發(fā)表于 01-07 09:38 ?1218次閱讀
    <b class='flag-5'>以太網(wǎng)</b>與因特網(wǎng):不同的<b class='flag-5'>網(wǎng)絡(luò)</b>技術(shù),共同的數(shù)字基礎(chǔ)

    TOSUN 車(chē)載以太網(wǎng)仿真測(cè)試解決方案

    ,并扮演著越來(lái)越重要的角色。本文主要介紹TSMaster中以太網(wǎng)的基本功能、車(chē)載以太網(wǎng)相關(guān)設(shè)備、以及基于TSMaster的車(chē)載以太網(wǎng)解決方案,幫助您實(shí)現(xiàn)車(chē)載
    的頭像 發(fā)表于 12-07 01:07 ?1262次閱讀
    TOSUN 車(chē)載<b class='flag-5'>以太網(wǎng)</b>仿真測(cè)試解決方案

    以太網(wǎng)和TCP/IP的關(guān)系解析

    在現(xiàn)代計(jì)算機(jī)網(wǎng)絡(luò)中,以太網(wǎng)和TCP/IP協(xié)議棧是構(gòu)建網(wǎng)絡(luò)通信的基礎(chǔ)。以太網(wǎng)定義了局域網(wǎng)(LAN)中的數(shù)據(jù)鏈路層和物理層的技術(shù)標(biāo)準(zhǔn),而TCP/
    的頭像 發(fā)表于 11-08 09:21 ?2957次閱讀

    以太網(wǎng)與光纖網(wǎng)絡(luò)的優(yōu)劣比較

    隨著信息技術(shù)的飛速發(fā)展,網(wǎng)絡(luò)技術(shù)已經(jīng)成為現(xiàn)代社會(huì)不可或缺的一部分。以太網(wǎng)和光纖網(wǎng)絡(luò)作為兩種主流的網(wǎng)絡(luò)技術(shù),它們?cè)诓煌膽?yīng)用場(chǎng)景中展現(xiàn)出各自的優(yōu)勢(shì)和局限性。
    的頭像 發(fā)表于 11-08 09:19 ?2452次閱讀

    以太網(wǎng)速率對(duì)網(wǎng)絡(luò)性能的影響

    以太網(wǎng)作為最廣泛使用的局域網(wǎng)技術(shù)之一,其速率的提高對(duì)網(wǎng)絡(luò)性能有著直接的影響。從最初的10Mbps發(fā)展到今天的100Gbps甚至更高,以太網(wǎng)速率的提升帶來(lái)了更快的數(shù)據(jù)傳輸速度和更高的網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-08 09:11 ?1625次閱讀

    以太網(wǎng)協(xié)議的種類(lèi)和特點(diǎn)

    (DIX Ethernet) 定義 :以太網(wǎng)II是由DEC、Intel和Xerox(DIX)聯(lián)合定義的,是最早的以太網(wǎng)標(biāo)準(zhǔn)。 特點(diǎn) :使用MAC地址進(jìn)行設(shè)備間的通信,幀結(jié)構(gòu)簡(jiǎn)單,易于實(shí)現(xiàn)。 1.2
    的頭像 發(fā)表于 11-08 09:10 ?4339次閱讀

    工業(yè)以太網(wǎng)的應(yīng)用場(chǎng)景分析

    隨著工業(yè)4.0和智能制造的興起,工業(yè)以太網(wǎng)作為連接工業(yè)設(shè)備、實(shí)現(xiàn)自動(dòng)化和智能化的關(guān)鍵技術(shù),其應(yīng)用場(chǎng)景日益廣泛。 工業(yè)以太網(wǎng)的特點(diǎn) 高可靠性 :工業(yè)以太網(wǎng)設(shè)備通常采用堅(jiān)固的外殼和接口,能
    的頭像 發(fā)表于 11-07 14:26 ?2480次閱讀

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)

    市的 Colossus 超級(jí)計(jì)算機(jī)集群達(dá)到了 10 萬(wàn)顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),該平臺(tái)
    發(fā)表于 10-30 09:33 ?480次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>以太網(wǎng)</b>加速 xAI 構(gòu)建的全球最大 AI 超級(jí)計(jì)算機(jī)