chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在ZTR無配置大規(guī)模中實現(xiàn)的縮放零接觸RoCE技術(shù)

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-14 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NVIDIA Zero Touch RoCE ( ZTR )使數(shù)據(jù)中心能夠無縫部署 聚合以太網(wǎng)上的 RDMA ( RoCE ) ,而無需任何特殊交換機配置。直到最近, ZTR 還僅適用于中小型數(shù)據(jù)中心。同時,大規(guī)模部署傳統(tǒng)上依賴于顯式擁塞通知( ECN )來啟用 RoCE 網(wǎng)絡(luò)傳輸,這需要交換機配置。

新的 NVIDIA 擁塞控制算法往返時間擁塞控制( RTTCC ) – 允許 ZTR 在不影響性能的情況下擴展到數(shù)千臺服務(wù)器。通過使用 ZTR 和 RTTCC ,數(shù)據(jù)中心運營商可以在無需任何交換機配置的情況下,享受部署和操作的便利性,以及大規(guī)模遠程直接內(nèi)存訪問( RDMA )的卓越性能。

這篇文章描述了以前在大規(guī)模和小型 RoCE 部署中推薦的 RoCE 擁塞控制。然后介紹了一種新的擁塞控制算法,該算法允許 ZTR 的無配置大規(guī)模實現(xiàn),其性能類似于支持 ECN 的 RoCE 。

具有數(shù)據(jù)中心量化擁塞通知的 RoCE 部署

在典型的基于 TCP 的環(huán)境中,分布式內(nèi)存請求需要許多步驟和 CPU 周期,這會對應(yīng)用程序性能產(chǎn)生負面影響。 RDMA 消除了服務(wù)器之間內(nèi)存數(shù)據(jù)傳輸?shù)乃?CPU 參與,大大加快了對存儲數(shù)據(jù)的訪問和應(yīng)用程序性能。

RoCE 在以太網(wǎng)環(huán)境中提供 RDMA ,這是數(shù)據(jù)中心的主要網(wǎng)絡(luò)結(jié)構(gòu)。以太網(wǎng)需要高級擁塞控制機制來支持 RDMA 網(wǎng)絡(luò)傳輸。數(shù)據(jù)中心量化擁塞通知( DCQCN )是一種擁塞控制算法,能夠響應(yīng)擁塞通知并動態(tài)調(diào)整流量傳輸速率。

DCQCN 的實現(xiàn)需要啟用顯式擁塞通知( ECN ),這需要配置網(wǎng)絡(luò)交換機。 ECN 將交換機配置為設(shè)置擁塞經(jīng)歷( CE )位,以指示即將發(fā)生的擁塞。

具有無功擁塞控制的零接觸 RoCE

NVIDIA 開發(fā)的 ZTR 技術(shù)允許 RoCE 部署,無需配置交換機基礎(chǔ)設(shè)施。 ZTR 根據(jù) InfiniBand Trade Association ( IBTA ) RDMA 標準構(gòu)建,完全符合 RoCE specifications ,支持 RoCE 的無縫部署。 ZTR 還擁有與傳統(tǒng)交換機啟用的 RoCE 相當?shù)男阅?,并且明顯優(yōu)于傳統(tǒng)的基于 TCP 的內(nèi)存訪問。此外,通過 ZTR , RoCE 網(wǎng)絡(luò)傳輸服務(wù)在普通 TCP / IP 環(huán)境中與非 RoCE 通信并行運行。

正如 NVIDIA 零接觸 RoCE 技術(shù)為 Microsoft Azure Stack HCI 實現(xiàn)了云經(jīng)濟 文章中所指出的,微軟已經(jīng)為其 Azure Stack HCI 平臺驗證了 ZTR ,該平臺通??蓴U展到幾十個節(jié)點。在這樣的環(huán)境中, ZTR 依賴于隱式丟包通知,這對于小規(guī)模部署來說已經(jīng)足夠了。通過添加新的基于往返計時器( RTT )的擁塞控制算法, ZTR 變得更加健壯和可擴展,而無需依賴丟包來通知服務(wù)器網(wǎng)絡(luò)擁塞。

引入往返時間擁塞控制

新的 NVIDIA 擁塞控制算法 RTTCC 主動監(jiān)控網(wǎng)絡(luò) RTT ,以便在丟棄數(shù)據(jù)包之前主動檢測并適應(yīng)擁塞的發(fā)生。 RTTCC 使用基于硬件的反饋環(huán)路實現(xiàn)動態(tài)擁塞控制,與基于軟件的擁塞控制算法相比,該反饋環(huán)路提供了顯著優(yōu)越的性能。 RTTCC 還支持更快的傳輸速率,可以在更大范圍內(nèi)部署 ZTR 。帶有 RTTCC 的 ZTR 現(xiàn)在作為測試版功能提供, GA 計劃在 2022 年下半年推出。

ZTR-RTTCC 的工作原理

ZTR-RTTCC 通過基于硬件 RTT 的擁塞控制算法擴展了 RoCE 網(wǎng)絡(luò)中的 DCQCN 。

圖 1 服務(wù)器之間的往返計時

定時數(shù)據(jù)包(上圖中的綠色網(wǎng)絡(luò)數(shù)據(jù)包)定期從啟動器發(fā)送到目標。立即返回定時數(shù)據(jù)包,從而能夠測量往返延遲。 RTTCC 測量數(shù)據(jù)包發(fā)送和啟動器接收數(shù)據(jù)包之間的時間間隔。差異(接收時間–發(fā)送時間)衡量往返延遲,這表明路徑擁塞。未壓縮流繼續(xù)傳輸數(shù)據(jù)包,以最佳利用可用網(wǎng)絡(luò)路徑帶寬。延遲增加的流意味著路徑擁塞, RTTCC 會對流量進行節(jié)流,以避免緩沖區(qū)溢出和數(shù)據(jù)包丟失。

隨著擁塞的減少或增加,網(wǎng)絡(luò)流量可以實時地向上或向下調(diào)整。主動監(jiān)控和應(yīng)對擁塞的能力對于使 ZTR 能夠主動管理擁塞至關(guān)重要。這種主動速率控制還可以減少數(shù)據(jù)包的重新傳輸,提高 RoCE 性能。使用 ZTR-RTTCC ,數(shù)據(jù)中心節(jié)點不會等待數(shù)據(jù)包丟失的通知;相反,它們主動識別擁塞 prior to 數(shù)據(jù)包丟失并作出相應(yīng)反應(yīng),通知啟動器調(diào)整傳輸速率。

如前所述, ZTR 的一個關(guān)鍵優(yōu)勢是能夠提供 RoCE 功能,同時在普通 TCP / IP 流量中與非 RoCE 通信同時運行。 ZTR 提供 RoCE 網(wǎng)絡(luò)功能的無縫部署。通過添加 RTTCC 主動監(jiān)控擁塞, ZTR 提供數(shù)據(jù)中心范圍內(nèi)的操作,無需交換機配置。請繼續(xù)閱讀,看看它的性能如何。

具有 RTTCC 性能的 ZTR

如圖 2 所示,當通過網(wǎng)絡(luò)結(jié)構(gòu)配置 ECN 和 PFC 時,帶有 RTTCC 的 ZTR 提供了與 RoCE 相當?shù)膽?yīng)用程序性能。這些測試是在最壞的多對一( in-cast )情況下進行的,以模擬擁擠條件下的吞吐量。

結(jié)果表明,具有 RTTCC 的 ZTR 不僅可以擴展到數(shù)千個節(jié)點,而且其性能與目前可用的最快 RoCE 解決方案相當。

在小規(guī)模( 256 個連接及以下)下,具有 RTTCC 的 ZTR 在啟用 ECN 擁塞控制(傳統(tǒng) RoCE )的 RoCE 的 99% 范圍內(nèi)執(zhí)行。

通過 16000 多個連接,具有 RTTCC 吞吐量的 ZTR 是傳統(tǒng) RoCE 吞吐量的 98% 。

帶有 RTTCC 的 ZTR 在不需要任何開關(guān)配置的情況下,提供了與傳統(tǒng) RoCE 幾乎相同的性能。

圖 2 連接不斷增加的應(yīng)用程序帶寬

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網(wǎng)絡(luò)接口卡安裝最新固件和工具,請執(zhí)行以下步驟。

配置 ZTR

要使用新的 RTTCC 算法配置 ZTR , 下載 并為 NVIDIA 網(wǎng)絡(luò)接口卡安裝最新固件和工具,請執(zhí)行以下步驟。

使用mlxconfig(持續(xù)配置)啟用可編程擁塞控制:

mlxconfig -d /dev/mst/mt4125_pciconf0 -y s
ROCE_CC_LEGACY_DCQCN=0

使用mlxfwreset重置設(shè)備或重新啟動主機:

mlxfwreset -d /dev/mst/mt4125_pciconf0 -l 3 -y r

完成這些步驟后,當 RDMA-CM 用于增強連接建立( ECE , MLNX _ OFED 版本 5.1 支持)時,將使用 ZTR-RTTCC 。

如果出現(xiàn)錯誤,無論 RDMA-CM 同步狀態(tài)如何,都可以強制使用 ZTR-RTTCC :

mlxreg -d /dev/mst/mt4125_pciconf0 --reg_id 0x506e --reg_len
0x40 --set "0x0.0:8=2,0x4.0:4=15" -y

總結(jié)

NVIDIA RTTCC 是 ZTR 的新?lián)砣刂扑惴?,在?shù)據(jù)中心范圍內(nèi)提供卓越的 RoCE 性能,無需對交換機基礎(chǔ)設(shè)施進行任何特殊配置。此增強功能使數(shù)據(jù)中心能夠在現(xiàn)有和新的數(shù)據(jù)中心基礎(chǔ)架構(gòu)中無縫實現(xiàn) RoCE ,并從即時的應(yīng)用程序性能改進中獲益。

關(guān)于作者

Aviv Barnea 是 NVIDIA 網(wǎng)絡(luò)軟件工程的高級主管。他監(jiān)督網(wǎng)絡(luò)適配器 RDMA 軟件和擁塞控制機制的開發(fā),實現(xiàn)高速、低延遲的數(shù)據(jù)中心連接。 Aviv 是 RDMA 和 RoCE 通信協(xié)議方面的專家,擁有該領(lǐng)域的多項專利,在推動 RDMA / RoCE 在業(yè)界的發(fā)展方面發(fā)揮了重要作用,在客戶和合作伙伴大規(guī)模部署加速網(wǎng)絡(luò)解決方案時與他們密切合作,并實現(xiàn)了無與倫比的性能和易用性。 Aviv 擁有特拉維夫大學(xué)工商管理碩士學(xué)位和理工學(xué)院物理與電氣工程學(xué)士學(xué)位。

Itay Ozery 是 NVIDIA 網(wǎng)絡(luò)產(chǎn)品營銷總監(jiān)。他為 Mellanox 的云網(wǎng)絡(luò)解決方案推動戰(zhàn)略性產(chǎn)品營銷和產(chǎn)品管理計劃。 Itay 在網(wǎng)絡(luò)安全領(lǐng)域領(lǐng)導(dǎo)了大規(guī)模的業(yè)務(wù)和項目,并與數(shù)據(jù)中心和電信服務(wù)提供商在 IT 系統(tǒng)和網(wǎng)絡(luò)工程領(lǐng)域擔任過多個職位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    9451

    瀏覽量

    156216
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5509

    瀏覽量

    109140
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RDMA設(shè)計5:RoCE V2 IP架構(gòu)

    數(shù)據(jù)傳輸;AXI-Lite 接口進行系統(tǒng)控制;AXI4 接口進行數(shù)據(jù)傳輸。IP內(nèi)部,根據(jù)功能劃分為系統(tǒng)控制模塊、融合以太網(wǎng)協(xié)議棧、以太網(wǎng)協(xié)議棧和 CMAC 集成塊。以下為各功能模塊的定義。 IP控制模塊是實現(xiàn)系統(tǒng)功能
    發(fā)表于 11-25 10:34

    如何實現(xiàn)高效的RoCE網(wǎng)卡狀態(tài)采集與監(jiān)控?

    當下大規(guī)模AI訓(xùn)練成為常態(tài),RoCEv2憑借高性能、低延遲與低CPU開銷的優(yōu)勢,已成為構(gòu)建智算中心的優(yōu)先選擇。然而,RoCE對網(wǎng)絡(luò)無損的嚴苛要求,配置不當會放大擁塞,如 PFC、ECN、Buffer滯留等引發(fā)的高延遲、性能下降等
    的頭像 發(fā)表于 10-29 11:54 ?937次閱讀
    如何<b class='flag-5'>實現(xiàn)</b>高效的<b class='flag-5'>RoCE</b>網(wǎng)卡狀態(tài)采集與監(jiān)控?

    如何實現(xiàn) RoCE 配置的自動同步(基礎(chǔ)篇) - DCBX協(xié)議

    DCBX(Data Center Bridging Exchange)協(xié)議是實現(xiàn)數(shù)據(jù)中心網(wǎng)絡(luò)自動化配置的核心技術(shù),能夠顯著降低運維負擔,減少因人工配置錯誤導(dǎo)致的網(wǎng)絡(luò)故障。DCBX 為
    的頭像 發(fā)表于 10-09 14:27 ?780次閱讀
    如何<b class='flag-5'>實現(xiàn)</b> <b class='flag-5'>RoCE</b> <b class='flag-5'>配置</b>的自動同步(基礎(chǔ)篇) - DCBX協(xié)議

    天合儲能聯(lián)合發(fā)布大規(guī)模儲能技術(shù)應(yīng)用及產(chǎn)業(yè)發(fā)展白皮書

    9月26日,2025 年大規(guī)模儲能技術(shù)創(chuàng)新與應(yīng)用研討會在華北電力大學(xué)成功舉辦。會上,天合儲能與華北電力大學(xué)聯(lián)合發(fā)布《大規(guī)模儲能技術(shù)應(yīng)用及產(chǎn)業(yè)發(fā)展白皮書》(以下簡稱《白皮書》), 聚焦儲
    的頭像 發(fā)表于 09-30 16:36 ?1580次閱讀

    TensorRT-LLM的大規(guī)模專家并行架構(gòu)設(shè)計

    之前文章已介紹引入大規(guī)模 EP 的初衷,本篇將繼續(xù)深入介紹 TensorRT-LLM 的大規(guī)模專家并行架構(gòu)設(shè)計與創(chuàng)新實現(xiàn)。
    的頭像 發(fā)表于 09-23 14:42 ?740次閱讀
    TensorRT-LLM的<b class='flag-5'>大規(guī)模</b>專家并行架構(gòu)設(shè)計

    Wolfspeed碳化硅技術(shù)實現(xiàn)大規(guī)模商用

    的專利申請量就增長了約 200%。Wolfspeed 強大的知識產(chǎn)權(quán)組合支撐著材料和器件方面的關(guān)鍵突破,這些突破使得碳化硅 (SiC) 技術(shù)得以實現(xiàn)大規(guī)模商用。
    的頭像 發(fā)表于 09-22 09:31 ?556次閱讀

    大規(guī)模專家并行模型TensorRT-LLM的設(shè)計

    DeepSeek-V3 / R1 等模型采用大規(guī)模細粒度混合專家模型 (MoE) 架構(gòu),大幅提升了開源模型的質(zhì)量。Llama 4 和 Qwen3 等新發(fā)布的開源模型的設(shè)計原則也采用了類似的大規(guī)模細粒度 MoE 架構(gòu)。但大規(guī)模 M
    的頭像 發(fā)表于 09-06 15:21 ?954次閱讀
    <b class='flag-5'>大規(guī)模</b>專家并行模型<b class='flag-5'>在</b>TensorRT-LLM的設(shè)計

    使用Ansible實現(xiàn)大規(guī)模集群自動化部署

    當你面對1000+服務(wù)器需要部署時,你還在一臺臺手工操作嗎?本文將揭秘如何用Ansible實現(xiàn)大規(guī)模集群的自動化部署,讓運維效率提升10倍!
    的頭像 發(fā)表于 08-27 14:41 ?551次閱讀

    復(fù)雜裝備研發(fā)設(shè)計利用數(shù)據(jù)實現(xiàn)大規(guī)模個性化定制

    復(fù)雜裝備研發(fā)設(shè)計,利用數(shù)據(jù)實現(xiàn)大規(guī)模個性化定制已成為提升企業(yè)競爭力、滿足多樣化市場需求的關(guān)鍵路徑。其核心在于通過數(shù)據(jù)驅(qū)動的個性化需求識別、模塊化設(shè)計、柔性生產(chǎn)、智能決策及閉環(huán)反饋,
    的頭像 發(fā)表于 08-06 17:17 ?558次閱讀

    從哈希極化到擁塞:主動路徑規(guī)劃在RoCE網(wǎng)絡(luò)的負載均衡實踐

    智算集群對網(wǎng)絡(luò)性能,特別是高吞吐、低延遲和無損特性有著嚴苛要求,RoCE因此被廣泛應(yīng)用。然而,主流Clos組網(wǎng)架構(gòu)下,傳統(tǒng)的ECMP路由機制存在天然的局限性,容易引發(fā)哈希極化問題,成為制約
    的頭像 發(fā)表于 07-21 17:27 ?1701次閱讀
    從哈希極化到<b class='flag-5'>零</b>擁塞:主動路徑規(guī)劃在<b class='flag-5'>RoCE</b>網(wǎng)絡(luò)<b class='flag-5'>中</b>的負載均衡實踐

    RDMA簡介3之四種子協(xié)議對比

    CPU卸載到RDMA網(wǎng)卡處理。僅需要使用普通以太網(wǎng)交換機和iWARP網(wǎng)卡即可實現(xiàn)路由。但在大規(guī)模部署時,由于TCP/IP協(xié)議點對點連接的特性,將會占用大量的內(nèi)存資源,對系統(tǒng)規(guī)格的要求更高在對比這四種
    發(fā)表于 06-04 16:05

    RDMA簡介1之RDMA開發(fā)必要性

    ,提供高通量、低延遲、遠距離的拷貝網(wǎng)絡(luò)數(shù)據(jù)傳輸?;谌诤弦蕴W(wǎng)的遠程直接內(nèi)存訪問(RoCE)提供了一種基于以太網(wǎng)的RDMA技術(shù)實現(xiàn)方法,相較于IB(InfiniBand)、互聯(lián)網(wǎng)廣域
    發(fā)表于 06-03 14:38

    算力革命:RoCE實測推理時延比InfiniBand低30%的底層邏輯

    AI 訓(xùn)練與推理的網(wǎng)絡(luò)效率瓶頸,助力數(shù)據(jù)中心高帶寬、低延遲、高可靠性的需求下實現(xiàn)算力資源的最優(yōu)配置。
    的頭像 發(fā)表于 05-28 14:08 ?1784次閱讀
    算力革命:<b class='flag-5'>RoCE</b>實測推理時延比InfiniBand低30%的底層邏輯

    廣和通助力昶氪科技實現(xiàn)智能割草機器人大規(guī)模商用

    近日,2025世界移動通信大會(MWC Barcelona 2025)期間,廣和通宣布:其為永強集團旗下昶氪科技提供的圍線式智能割草機器人解決方案已實現(xiàn)大規(guī)模量產(chǎn)商用,滿足歐洲等市
    的頭像 發(fā)表于 03-12 09:23 ?1085次閱讀

    AGV大規(guī)模定制化生產(chǎn)中的應(yīng)用

    AGV智能工廠大規(guī)模定制生產(chǎn)中發(fā)揮重要作用,通過不同形式滿足多樣化物料搬運需求,提高生產(chǎn)效率與靈活度,降低勞動力與成本,助力企業(yè)實現(xiàn)智能車間和工廠的升級改造。
    的頭像 發(fā)表于 02-13 18:09 ?735次閱讀
    AGV<b class='flag-5'>在</b><b class='flag-5'>大規(guī)模</b>定制化生產(chǎn)中的應(yīng)用