chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

光通信+分布式架構(gòu),突破傳統(tǒng)網(wǎng)絡(luò)架構(gòu)瓶頸

Hobby觀察 ? 來(lái)源:電子發(fā)燒友 ? 作者:綜合報(bào)道 ? 2025-06-20 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報(bào)道,隨著大語(yǔ)言模型(LLM)參數(shù)規(guī)模突破萬(wàn)億級(jí),傳統(tǒng)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)(如NVL、TPUv4、SiP-Ring)逐漸暴露出瓶頸。

傳統(tǒng)方案依賴(lài)昂貴的交換機(jī)(如NVIDIA的NVLink Switch)或光學(xué)電路(如TPUv4的OCS),其成本隨集群規(guī)模呈指數(shù)級(jí)增長(zhǎng)。例如,NVLink Switch單臺(tái)成本高達(dá)數(shù)萬(wàn)美元,且僅支持單節(jié)點(diǎn)級(jí)擴(kuò)展(如DGX H100集群最多8-GPU互聯(lián))。TPUv4雖采用光學(xué)環(huán)形網(wǎng)絡(luò),但其OCS交換機(jī)需定制化光纖布線,限制了跨Pod級(jí)擴(kuò)展能力。

由于拓?fù)湎拗疲瑔蝹€(gè)GPU故障可能引發(fā)級(jí)聯(lián)失效。以SiP-Ring為例,其靜態(tài)環(huán)形拓?fù)湟笏泄?jié)點(diǎn)嚴(yán)格同步,若某一節(jié)點(diǎn)故障,整個(gè)TP組需重新初始化,導(dǎo)致GPU浪費(fèi)率高達(dá)37%(TP-64場(chǎng)景)。NVL架構(gòu)中,單節(jié)點(diǎn)故障甚至?xí)袛嗳?a href="http://www.brongaenegriffin.com/v/tag/1301/" target="_blank">通信,迫使作業(yè)暫停重試。

跨ToR(Top of Rack)通信也成為網(wǎng)絡(luò)架構(gòu)的性能瓶頸。研究顯示,GPT-3訓(xùn)練任務(wù)中35%的通信流量為跨機(jī)架傳輸,導(dǎo)致網(wǎng)絡(luò)擁塞,帶寬利用率不足40%。傳統(tǒng)Fat-Tree拓?fù)潆m支持高帶寬,但其樹(shù)狀結(jié)構(gòu)易在核心層形成熱點(diǎn),限制了大規(guī)模并行效率。

為了解決這些問(wèn)題,最近,曦智科技聯(lián)合北京大學(xué)、階躍星辰的研究團(tuán)隊(duì)提出了一種以光交換(OCS)模組為中心的高帶寬域架構(gòu)InfiniteHBD。InfinitePOD通過(guò)無(wú)交換機(jī)架構(gòu)設(shè)計(jì) 、動(dòng)態(tài)拓?fù)渚幣?a href="http://www.brongaenegriffin.com/v/tag/2562/" target="_blank">算法和光通信技術(shù)優(yōu)化 ,系統(tǒng)性解決了現(xiàn)有的問(wèn)題。

InfinitePOD采用分布式節(jié)點(diǎn)直連網(wǎng)絡(luò),每個(gè)GPU節(jié)點(diǎn)配備QSFP-DD OCSTrx光模塊(51.2Tbps帶寬),通過(guò)預(yù)定義光纖鏈路實(shí)現(xiàn)跨ToR的3跳內(nèi)直連??梢允∪?zhuān)用交換機(jī),僅使用標(biāo)準(zhǔn)化光模塊,單節(jié)點(diǎn)互連成本下降60%。

同時(shí)物理層支持任意規(guī)模集群互聯(lián),實(shí)驗(yàn)驗(yàn)證可擴(kuò)展至65536 GPU,遠(yuǎn)超NVL(16384 GPU)和TPUv4(單Pod級(jí))。在拓?fù)潇`活性上,通過(guò)軟件動(dòng)態(tài)配置通信組,支持K-Hop Ring(環(huán)形)和K-Hop Line(線性)等拓?fù)洌m配TP、DP、PP等不同并行策略。

InfinitePOD采用了兩階段部署機(jī)制,首先是物理層預(yù)定義,在部署階段規(guī)劃節(jié)點(diǎn)間3跳光纖連接,形成Rail-Optimized拓?fù)?,減少跨機(jī)架流量;在運(yùn)行時(shí)動(dòng)態(tài)編排,基于圖切割算法(Graph Partitioning)和貪心策略,實(shí)時(shí)調(diào)整通信組拓?fù)洹?/p>

容錯(cuò)機(jī)制上,當(dāng)GPU故障時(shí),編排算法自動(dòng)重構(gòu)通信路徑,僅隔離故障節(jié)點(diǎn)而不影響全局。實(shí)驗(yàn)表明,在TP-64場(chǎng)景下,GPU浪費(fèi)率從NVL的24%降至11%,作業(yè)中斷概率降低72%。

在光通信技術(shù)上,InfinitePOD采用QSFP-DD OCSTrx光模塊,光模塊基于曦智科技硅光子技術(shù)的分布式光交換dOCS,將基于馬赫曾德(MZI,Mach-Zehnder Interferometer)交換矩陣的光交換芯片集成到商用QSFP-DD 800Gbps光電轉(zhuǎn)換模組中,大幅簡(jiǎn)化了器件結(jié)構(gòu)的同時(shí),有效提升了器件集成度,從而降低了成本和功耗,顯著提升了InfiniteHBD的性?xún)r(jià)比和系統(tǒng)可擴(kuò)展性。

同時(shí)采用Rail-Optimized拓?fù)洌槍?duì)機(jī)架間通信優(yōu)化,通過(guò)3跳內(nèi)光纖直連實(shí)現(xiàn)流量局部化 ,AllReduce帶寬利用率提升至77.26%,接近理論極限。

InfinitePOD的核心價(jià)值在于將光通信技術(shù)與分布式架構(gòu)深度融合 ,通過(guò)“硬件簡(jiǎn)化+軟件智能”的設(shè)計(jì)理念,重新定義了高帶寬數(shù)據(jù)中心網(wǎng)絡(luò)。盡管當(dāng)前方案仍需解決長(zhǎng)距離光信號(hào)衰減和模塊功耗問(wèn)題,但其開(kāi)創(chuàng)性的設(shè)計(jì)已為下一代數(shù)據(jù)中心網(wǎng)絡(luò)指明方向——去中心化、軟硬協(xié)同、極致擴(kuò)展 。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 光通信
    +關(guān)注

    關(guān)注

    20

    文章

    928

    瀏覽量

    34595
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    攜手共探無(wú)線光通信新未來(lái)!六博光電邀您相聚第六屆無(wú)線光通信理論與組網(wǎng)技術(shù)論壇

    通信技術(shù)飛速發(fā)展的今天,無(wú)線光通信憑借高速、大容量、低延遲和高安全性等顯著優(yōu)勢(shì),成為突破當(dāng)前通信網(wǎng)絡(luò)瓶頸、推動(dòng)
    的頭像 發(fā)表于 07-10 17:17 ?223次閱讀
    攜手共探無(wú)線<b class='flag-5'>光通信</b>新未來(lái)!六博光電邀您相聚第六屆無(wú)線<b class='flag-5'>光通信</b>理論與組網(wǎng)技術(shù)論壇

    突破精度極限,賦能光通信未來(lái)——武漢昊衡科技OLI光纖微裂紋檢測(cè)儀引領(lǐng)行業(yè)革新

    光通信網(wǎng)絡(luò)高速發(fā)展的今天,光纖及光器件的質(zhì)量直接決定了通信系統(tǒng)的穩(wěn)定性和傳輸效率。然而,傳統(tǒng)檢測(cè)技術(shù)受限于精度不足、效率低下等問(wèn)題,難以滿足日益嚴(yán)苛的行業(yè)需求。武漢昊衡科技有限公司憑借深厚的技術(shù)積累
    的頭像 發(fā)表于 06-05 17:31 ?1320次閱讀
    <b class='flag-5'>突破</b>精度極限,賦能<b class='flag-5'>光通信</b>未來(lái)——武漢昊衡科技OLI光纖微裂紋檢測(cè)儀引領(lǐng)行業(yè)革新

    六博光電船載激光通信系統(tǒng):開(kāi)啟水上高速通信新紀(jì)元

    在浩瀚水域中實(shí)現(xiàn)穩(wěn)定、高速的無(wú)線通信,一直是海洋監(jiān)測(cè)、應(yīng)急救援及水上作業(yè)領(lǐng)域的技術(shù)難點(diǎn)。傳統(tǒng)射頻通信易受干擾、帶寬有限,而衛(wèi)星通信則面臨高延遲、高成本的
    的頭像 發(fā)表于 04-01 09:15 ?533次閱讀
    六博光電船載激<b class='flag-5'>光通信</b>系統(tǒng):開(kāi)啟水上高速<b class='flag-5'>通信</b>新紀(jì)元

    六博光電支持OpenVLC推出高性?xún)r(jià)比可見(jiàn)光通信模組

    在科技飛速發(fā)展的今天,通信技術(shù)領(lǐng)域不斷涌現(xiàn)出創(chuàng)新成果??梢?jiàn)光通信(VisibleLightCommunication,VLC)作為一種極具潛力的新興通信技術(shù),正逐漸走進(jìn)人們的視野。六博光電致力于無(wú)線
    的頭像 發(fā)表于 03-14 09:52 ?595次閱讀
    六博光電支持OpenVLC推出高性?xún)r(jià)比可見(jiàn)<b class='flag-5'>光通信</b>模組

    光通信網(wǎng)絡(luò)故障排除技巧

    光通信網(wǎng)絡(luò)以其高速、大容量和抗干擾性在現(xiàn)代通信系統(tǒng)中占據(jù)著舉足輕重的地位。然而,隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大和復(fù)雜性的增加,故障排除成為了網(wǎng)絡(luò)維護(hù)中的一項(xiàng)重要任務(wù)。 1. 故障診斷的基本原則 在
    的頭像 發(fā)表于 01-23 09:42 ?799次閱讀

    光通信網(wǎng)絡(luò)的優(yōu)勢(shì)分析

    。光纖通信利用光信號(hào)傳輸信息,相較于傳統(tǒng)的電信號(hào),光信號(hào)在光纖中的傳輸速度更快,損耗更低。這使得光通信網(wǎng)絡(luò)能夠支持更高的數(shù)據(jù)傳輸速率,滿足現(xiàn)代高速互聯(lián)網(wǎng)、數(shù)據(jù)中心等應(yīng)用場(chǎng)景的需求。 2. 大容量傳輸
    的頭像 發(fā)表于 01-23 09:36 ?812次閱讀

    光通信與電通信的區(qū)別

    在現(xiàn)代通信技術(shù)中,光通信和電通信是兩種主要的通信方式。隨著科技的發(fā)展,這兩種技術(shù)在各自的領(lǐng)域內(nèi)都取得了顯著的進(jìn)步。 1. 傳輸介質(zhì) 光通信
    的頭像 發(fā)表于 01-23 09:35 ?1752次閱讀

    光通信在數(shù)據(jù)中心的應(yīng)用

    在數(shù)字化時(shí)代,數(shù)據(jù)中心作為信息處理和存儲(chǔ)的核心,承擔(dān)著海量數(shù)據(jù)的傳輸和處理任務(wù)。隨著云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的發(fā)展,數(shù)據(jù)中心的規(guī)模和復(fù)雜性不斷增加,對(duì)內(nèi)部通信網(wǎng)絡(luò)的性能要求也越來(lái)越高。光通信
    的頭像 發(fā)表于 01-23 09:33 ?765次閱讀

    基于ptp的分布式系統(tǒng)設(shè)計(jì)

    。 PTP概述 PTP是一種網(wǎng)絡(luò)時(shí)間同步協(xié)議,它允許網(wǎng)絡(luò)中的設(shè)備同步它們的時(shí)鐘。PTP基于IEEE 1588標(biāo)準(zhǔn),旨在提供亞微秒級(jí)別的時(shí)間同步精度。PTP通過(guò)在網(wǎng)絡(luò)中傳播時(shí)間信息,并使用這些信息來(lái)校正本地時(shí)鐘,從而實(shí)現(xiàn)精確的時(shí)間
    的頭像 發(fā)表于 12-29 10:09 ?566次閱讀

    分布式、域控及SOA架構(gòu)車(chē)身功能測(cè)試方案

    北匯信息推出分布式、域控以及SOA架構(gòu)的車(chē)身功能測(cè)試解決方案,支持在實(shí)驗(yàn)室環(huán)境下完成車(chē)身單部件、系統(tǒng)級(jí)功能自動(dòng)化測(cè)試,可以極大地提升車(chē)身功能的可靠性和穩(wěn)定性。
    的頭像 發(fā)表于 12-27 09:05 ?2702次閱讀
    <b class='flag-5'>分布式</b>、域控及SOA<b class='flag-5'>架構(gòu)</b>車(chē)身功能測(cè)試方案

    光通信芯片將迎來(lái)漲價(jià)潮

    隨著人工智能需求的急劇上升,美國(guó)網(wǎng)絡(luò)通信光通信芯片巨頭Marvell近期宣布,自2025年1月1日起,其全產(chǎn)品線將實(shí)施漲價(jià)。這一舉措標(biāo)志著在光通信領(lǐng)域的漲價(jià)浪潮中,Marvell率先邁出了步伐。
    的頭像 發(fā)表于 10-29 11:05 ?1224次閱讀

    光放大器與光通信的關(guān)系是什么

    光放大器與光通信之間存在著密不可分的關(guān)系,兩者共同構(gòu)成了現(xiàn)代光通信系統(tǒng)的核心組成部分。光放大器作為光通信系統(tǒng)中的關(guān)鍵器件,通過(guò)放大光信號(hào),解決了光信號(hào)在傳輸過(guò)程中的衰減問(wèn)題,從而極大地延長(zhǎng)了光信號(hào)
    的頭像 發(fā)表于 08-09 15:46 ?889次閱讀

    量子光通信的概念和原理

    量子光通信,作為量子通信領(lǐng)域的一個(gè)重要分支,是一種利用量子光學(xué)原理和量子力學(xué)特性進(jìn)行信息傳遞的先進(jìn)技術(shù)。它不僅繼承了光通信的高速、大容量?jī)?yōu)勢(shì),還融合了量子通信的高安全性和絕對(duì)保密性,成
    的頭像 發(fā)表于 08-09 14:22 ?2699次閱讀

    WDM系統(tǒng)和光通信有哪些區(qū)別

    WDM(Wavelength Division Multiplexing,波分復(fù)用)系統(tǒng)和光通信是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。光通信是一種利用光波作為載波進(jìn)行信息傳輸?shù)?b class='flag-5'>通信技術(shù),而WDM則是
    的頭像 發(fā)表于 08-09 14:18 ?1314次閱讀

    簡(jiǎn)述光通信的發(fā)展歷史

    光通信的發(fā)展歷史是一段充滿創(chuàng)新與突破的旅程,它極大地推動(dòng)了現(xiàn)代通信技術(shù)的進(jìn)步,為人類(lèi)社會(huì)帶來(lái)了前所未有的便捷與高效。以下是對(duì)光通信發(fā)展歷史的詳細(xì)介紹,分為幾個(gè)關(guān)鍵階段進(jìn)行闡述。
    的頭像 發(fā)表于 08-09 11:47 ?4255次閱讀