chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA如何優(yōu)化AI工廠的網(wǎng)絡(luò)可靠性與功耗

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-09-04 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著 AI 重新定義計算格局,網(wǎng)絡(luò)已成為構(gòu)建未來數(shù)據(jù)中心發(fā)展的關(guān)鍵支柱。大語言模型的訓(xùn)練性能不僅取決于計算資源,更受到底層網(wǎng)絡(luò)敏捷性、容量和智能程度的影響。行業(yè)正從傳統(tǒng)以 CPU 為中心的基礎(chǔ)架構(gòu),邁向緊耦合的、GPU 驅(qū)動和網(wǎng)絡(luò)定義的 AI 工廠。

NVIDIA 構(gòu)建了一套全面的網(wǎng)絡(luò)解決方案,以滿足現(xiàn)代大規(guī)模 AI 訓(xùn)練和推理對急速流量突發(fā)、高帶寬及低延遲的需求。該方案涵蓋Spectrum-X以太網(wǎng)、NVIDIA Quantum InfiniBand和BlueField平臺。通過將計算與通信一起進行編排,NVIDIA 的網(wǎng)絡(luò)產(chǎn)品組合為構(gòu)建可擴展、高效且高可靠的 AI 數(shù)據(jù)中心奠定了基礎(chǔ),成為了推動 AI 創(chuàng)新的中樞神經(jīng)系統(tǒng)。

在這篇博客中,我們將探討 NVIDIA 的網(wǎng)絡(luò)創(chuàng)新如何通過 CPO 技術(shù),為大型 AI 工廠帶來顯著的能效提升和更強的可靠性。

AI 工廠基礎(chǔ)設(shè)施傳統(tǒng)企業(yè)數(shù)據(jù)中心有何不同?

在傳統(tǒng)企業(yè)數(shù)據(jù)中心中,Tier 1 交換機通常部署在每個服務(wù)器機架內(nèi),通過銅纜直接連接服務(wù)器,從而降低功耗并簡化連接。這種架構(gòu)能夠有效滿足以 CPU 為中心的、網(wǎng)絡(luò)需求適中的工作負載。

相比之下,NVIDIA 開創(chuàng)的現(xiàn)代 AI 工廠配備了超高密的計算機架和數(shù)以千計的 GPU,能面向單一任務(wù)實現(xiàn)協(xié)同工作。這就需要在整個數(shù)據(jù)中心內(nèi)實現(xiàn)最高帶寬和最低的延遲,一種新的網(wǎng)絡(luò)拓撲結(jié)構(gòu)應(yīng)運而生——即將 Tier 1 交換機部署在獨立的機柜。這種布局顯著增加了服務(wù)器與交換機之間的距離,使得光纖網(wǎng)絡(luò)變得至關(guān)重要。由此帶來的結(jié)果是功耗和光學組件數(shù)量大幅上升,如今在網(wǎng)卡到交換機以及交換機到交換機的連接中,均需依賴光學組件來實現(xiàn)高效傳輸。

如圖 1 所示,這一演變體現(xiàn)了為滿足大規(guī)模 AI 工作負載對高帶寬和低延遲的需求,在網(wǎng)絡(luò)拓撲和技術(shù)層面所發(fā)生的重大變革,并從根本上重塑了數(shù)據(jù)中心的物理結(jié)構(gòu)與能耗特征。

圖 1:橫向擴展能力與 AI 密度取決于光纖連接

如何優(yōu)化 AI 工廠的網(wǎng)絡(luò)可靠性與功耗?

采用可插拔光模塊的傳統(tǒng)網(wǎng)絡(luò)交換機依賴于多個電接口。在這些架構(gòu)中,數(shù)據(jù)信號需經(jīng)過一條較長的電傳輸路徑:從交換機 ASIC 出發(fā),經(jīng) PCB、連接器,最終到達外部光收發(fā)器,之后才能轉(zhuǎn)換為光信號。如圖 2 所示,這種分段式傳輸在每秒 200Gb/s 的通道中可能帶來高達 22 dB 的電損耗。這顯著增加了對復(fù)雜數(shù)字信號處理以及多個有源組件的需求。

3deced24-87e5-11f0-8c8f-92fbcf53809c.jpg

圖 2:Spectrum-X Photonics 可將信號完整性提升 64 倍

采用可插拔光模塊的結(jié)果就是功耗更高(每個接口通常為 30W)、發(fā)熱量增加以及潛在故障點顯著增多。大量的獨立模塊和連接不僅推高了系統(tǒng)功耗和組件數(shù)量,還直接影響了鏈路的可靠性,隨著 AI 部署規(guī)模的不斷擴大,這些問題將帶來持續(xù)的運營挑戰(zhàn)。各組件的典型功耗如圖 3 所示。

3e4685be-87e5-11f0-8c8f-92fbcf53809c.jpg

圖 3:Spectrum-X Photonics 將功耗降低至 1/3.5

相比之下,采用 CPO 技術(shù)的交換機將電光轉(zhuǎn)換部分直接集成到交換機封裝中。光纖直接連接至和 ASIC 封裝在一起的光引擎,使電信號損耗降低至約 4 dB,全通道功耗降至 9W。通過簡化信號路徑并消除不需要的接口,該設(shè)計顯著提升了信號完整性、可靠性和能效,正是高密度、高性能 AI 數(shù)據(jù)中心所需的關(guān)鍵技術(shù)。

CPO 封裝為 AI 工廠帶來了哪些優(yōu)勢?

NVIDIA 推出基于 CPO 技術(shù)的系統(tǒng),正是為了應(yīng)對 AI 工廠前所未有的需求。通過將光引擎直接集成至交換機 ASIC,全新的 NVIDIA Quantum-X Photonics 和 Spectrum-X Photonics(如圖 4 所示)將取代傳統(tǒng)的可插拔光模塊。這一創(chuàng)新簡化了信號傳輸路徑,顯著提升了性能、能效和系統(tǒng)可靠性。新產(chǎn)品不僅在帶寬和端口密度方面創(chuàng)下新高,更從根本上重塑了 AI 數(shù)據(jù)中心的經(jīng)濟模型與物理架構(gòu)。

圖 4:集成共封裝的硅光引擎的 NVIDIA Photonics 交換 ASIC

Quantum-X Photonics如何引領(lǐng)下一代 InfiniBand 網(wǎng)絡(luò)的誕生

隨著 NVIDIA 推出 Quantum-X InfiniBand Photonics 平臺,NVIDIA 將 InfiniBand 交換技術(shù)提升至全新高度。該平臺具備以下功能:

交換容量達 115 Tb/s,支持 144 個端口,每個端口速率為 800 Gb/s。

借助第四代 NVIDIA SHARP 技術(shù),實現(xiàn)每秒 14.4 萬億次的網(wǎng)絡(luò)計算能力。

液冷技術(shù),實現(xiàn)卓越的散熱管理。

專用 InfiniBand 管理端口,支持強大的帶內(nèi)控制與監(jiān)測功能。

NVIDIA Quantum-X 采用集成硅光技術(shù),提供無與倫比的帶寬、超低延遲和卓越的運營可靠性。該 CPO 設(shè)計不僅降低了功耗、提升了可靠性,還能實現(xiàn)快速部署,充分滿足大規(guī)模代理式 AI 工作負載對互連的嚴苛需求。

Spectrum-X Photonics如何助力構(gòu)建大規(guī)模以太網(wǎng) AI 工廠

NVIDIA Spectrum-X Photonics 交換機將 CPO 技術(shù)革命拓展至以太網(wǎng)領(lǐng)域,專為生成式 AI 以及大規(guī)模大語言模型(LLM)的訓(xùn)練與推理任務(wù)而設(shè)計。全新的 Spectrum-X Photonics 產(chǎn)品包含兩款基于液冷機箱和 Spectrum-6 ASIC 的系統(tǒng):

Spectrum SN6810:具備 128 個 800 Gb/s 端口,總帶寬達 102.4 Tb/s。

Spectrum SN6800:具備 512 個 800 Gb/s 端口,總帶寬高達 409.6 Tb/s,性能卓越。

這兩個平臺均基于 NVIDIA 硅光技術(shù),大幅減少了離散組件和電接口的數(shù)量。與前代架構(gòu)相比,新架構(gòu)能效提升達 3.5 倍,同時通過減少整體易損光學元件數(shù)量,將系統(tǒng)可靠性提高了 10 倍。技術(shù)人員可享受更高的可維護性,而 AI 運營商則能將部署時間縮短至 1/ 1.3 (約 77%),并顯著縮短第一個 Token 的生成時間。

NVIDIA 的 CPO 技術(shù)組得益于強大的合作伙伴生態(tài)系統(tǒng)的支持。這種跨行業(yè)協(xié)作不僅保障了技術(shù)性能,更確保了全球大規(guī)模 AI 基礎(chǔ)設(shè)施部署所需的大規(guī)模量產(chǎn)能力與可靠性。

CPO 如何實現(xiàn)性能、功耗與可靠性的突破

CPO 的優(yōu)勢顯而易見:

3.5 倍能效提升:通過將光學器件直接集成到交換機 ASIC 封裝中和減少了可插拔光模塊,即使網(wǎng)絡(luò)密度大幅增加,每個端口的功耗也顯著降低。

可靠性提升 10 倍:通過減少有源器件和去除了易發(fā)生故障的光模塊,顯著提高了系統(tǒng)正常運行時間和運行可靠性。

將運營時間縮短至原來的 1/1.3 (約 77%):簡化的組裝與維護有助于加快 AI 工廠的部署,并實現(xiàn)快速擴展。

這些交換機系統(tǒng)具備業(yè)界領(lǐng)先的帶寬性能(高達 409.6 Tb/s,512 個端口,單端口速率達 800 Gb/s),并配備高效的液冷系統(tǒng),能夠應(yīng)對高密度、高功耗的運行環(huán)境。圖 5(下圖)展示了 NVIDIA Quantum-X Photonics Q3450 和 Spectrum-X Photonics 的兩種型號:單 ASIC 的 SN6810,以及集成光纖重組功能的四 ASIC 型號 SN6800。

這些產(chǎn)品共同推動了網(wǎng)絡(luò)架構(gòu)的轉(zhuǎn)型,有效滿足了 AI 工作負載對高帶寬和超低延遲的嚴苛需求。通過與先進的光學組件與強大的系統(tǒng)集成伙伴相結(jié)合,構(gòu)建出一個面向當前及未來擴展需求高度優(yōu)化的網(wǎng)絡(luò)架構(gòu)。隨著超大規(guī)模數(shù)據(jù)中心對快速部署和高可靠性的要求不斷提升,CPO 正從一項創(chuàng)新技術(shù)逐步轉(zhuǎn)變?yōu)椴豢苫蛉钡幕A(chǔ)設(shè)施。

圖 5:NVIDIA Quantum-X 與 Spectrum-X Photonics 交換機系統(tǒng)

如何開啟代理式 AI 的新時代

NVIDIA Quantum-X 和 Spectrum-X Photonics 交換機標志著網(wǎng)絡(luò)架構(gòu)向?qū)闈M足大規(guī)模 AI 嚴苛需求而設(shè)計的全新轉(zhuǎn)變。通過消除傳統(tǒng)的電和可插拔架構(gòu)帶來的瓶頸,CPO 系統(tǒng)能夠提供現(xiàn)代 AI 工廠所需的高性能、高能效與高可靠性。NVIDIA Quantum-X InfiniBand 交換機預(yù)計于 2026 年初上市,Spectrum-X 以太網(wǎng)交換機則將于 2026 年下半年推出。NVIDIA 正以此引領(lǐng)網(wǎng)絡(luò)革新,為代理式 AI 時代樹立優(yōu)化網(wǎng)絡(luò)的新標準。

敬請關(guān)注本博客的第二部分,我們將深入探討 NVIDIA Quantum-X Photonics 和 Spectrum-X Photonics 平臺的核心——硅光引擎的架構(gòu)與工作原理,揭示推動下一代光連接成為現(xiàn)實的關(guān)鍵創(chuàng)新與工程突破。從芯片集成的最新進展到新型調(diào)制技術(shù),下一篇文章將全面解析這些光電引擎在 AI 網(wǎng)絡(luò)領(lǐng)域中脫穎而出的技術(shù)優(yōu)勢。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    41

    文章

    5867

    瀏覽量

    178625
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5431

    瀏覽量

    108281
  • 交換機
    +關(guān)注

    關(guān)注

    23

    文章

    2843

    瀏覽量

    103309
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37050

    瀏覽量

    290147

原文標題:利用 CPO 技術(shù)擴展 AI 工廠,提高能效

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    選PCBA工廠只看設(shè)備?這些“軟實力”才是可靠性命門!

    一站式PCBA加工廠家今天為大家講講怎么判斷PCBA工廠可靠性?判斷PCBA工廠可靠性的四個關(guān)鍵方面。判斷PCBA
    的頭像 發(fā)表于 10-15 09:04 ?176次閱讀

    使用OpenUSD和SimReady資產(chǎn)構(gòu)建AI工廠

    適用于 AI 工廠數(shù)字孿生的 NVIDIA Omniverse Blueprint 已發(fā)布,現(xiàn)已支持 OpenUSD 模式。該藍圖采用新工具,可在電力、冷卻和網(wǎng)絡(luò)基礎(chǔ)設(shè)施等更多方面模擬
    的頭像 發(fā)表于 09-06 15:23 ?952次閱讀
    使用OpenUSD和SimReady資產(chǎn)構(gòu)建<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>

    可靠性設(shè)計的十個重點

    專注于光電半導(dǎo)體芯片與器件可靠性領(lǐng)域的科研檢測機構(gòu),能夠?qū)ED、激光器、功率器件等關(guān)鍵部件進行嚴格的檢測,致力于為客戶提供高質(zhì)量的測試服務(wù),為光電產(chǎn)品在各種高可靠性場景中的穩(wěn)定應(yīng)用提供堅實的質(zhì)量
    的頭像 發(fā)表于 08-01 22:55 ?571次閱讀
    <b class='flag-5'>可靠性</b>設(shè)計的十個重點

    太誘MLCC電容的可靠性如何?

    眾所周知,多層陶瓷電容器(MLCC)已成為消費電子、汽車電子、工業(yè)控制等領(lǐng)域的核心被動元件。太陽誘電(太誘)通過材料創(chuàng)新、工藝優(yōu)化與嚴苛測試體系,構(gòu)建了MLCC電容的可靠性護城河,其產(chǎn)品失效率長期
    的頭像 發(fā)表于 07-09 15:35 ?327次閱讀

    提供半導(dǎo)體工藝可靠性測試-WLR晶圓可靠性測試

    隨著半導(dǎo)體工藝復(fù)雜度提升,可靠性要求與測試成本及時間之間的矛盾日益凸顯。晶圓級可靠性(Wafer Level Reliability, WLR)技術(shù)通過直接在未封裝晶圓上施加加速應(yīng)力,實現(xiàn)快速
    發(fā)表于 05-07 20:34

    電機微機控制系統(tǒng)可靠性分析

    。純分享帖,需要者可點擊附件獲取完整資料~~~*附件:電機微機控制系統(tǒng)可靠性分析.pdf 【免責聲明】本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請第一時間告知,刪除內(nèi)容!
    發(fā)表于 04-29 16:14

    IGBT的應(yīng)用可靠性與失效分析

    包括器件固有可靠性和使用可靠性。固有可靠性問題包括安全工作區(qū)、閂鎖效應(yīng)、雪崩耐量、短路能力及功耗等,使用可靠性問題包括并聯(lián)均流、軟關(guān)斷、電磁
    的頭像 發(fā)表于 04-25 09:38 ?1827次閱讀
    IGBT的應(yīng)用<b class='flag-5'>可靠性</b>與失效分析

    可靠性測試結(jié)構(gòu)設(shè)計概述

    深入理解設(shè)計規(guī)則,設(shè)計者可在可靠性測試結(jié)構(gòu)優(yōu)化中兼顧性能、成本與質(zhì)量,推動半導(dǎo)體技術(shù)的持續(xù)創(chuàng)新。
    的頭像 發(fā)表于 04-11 14:59 ?878次閱讀
    <b class='flag-5'>可靠性</b>測試結(jié)構(gòu)設(shè)計概述

    電路可靠性設(shè)計與工程計算技能概述

    電路可靠性設(shè)計與工程計算通過系統(tǒng)學習電路可靠性設(shè)計與工程計算,工程師不僅能提高電路的可靠性和穩(wěn)定性,還能優(yōu)化產(chǎn)品設(shè)計過程,減少潛在的故障風險,從而提升產(chǎn)品的市場競爭力和消費者信任度。為
    的頭像 發(fā)表于 03-26 17:08 ?499次閱讀
    電路<b class='flag-5'>可靠性</b>設(shè)計與工程計算技能概述

    適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)

    )作為一家備受信賴的信息通信技術(shù)產(chǎn)品及解決方案提供商,提供高可靠性的800G光模塊和解決方案,為AI工廠AI云平臺提供高性能、低延遲且可擴展的網(wǎng)絡(luò)
    發(fā)表于 03-25 17:35

    英偉達GTC2025亮點:NVIDIA認證計劃擴展至企業(yè)存儲領(lǐng)域,加速AI工廠部署

    ,現(xiàn)在已將企業(yè)存儲納入其中,旨在通過加速計算、網(wǎng)絡(luò)、軟件和存儲,助力企業(yè)更高效地部署 AI 工廠。 在企業(yè)構(gòu)建 AI 工廠的過程中,獲取高質(zhì)
    的頭像 發(fā)表于 03-21 19:38 ?1482次閱讀

    一文讀懂芯片可靠性試驗項目

    驗證產(chǎn)品性能的重要手段,更是提高產(chǎn)品可靠性和市場競爭力的關(guān)鍵環(huán)節(jié)。通過對芯片進行嚴格的可靠性測試,可以提前發(fā)現(xiàn)潛在的故障模式和失效機制,從而為設(shè)計優(yōu)化和工藝改進提供
    的頭像 發(fā)表于 02-21 14:50 ?1377次閱讀
    一文讀懂芯片<b class='flag-5'>可靠性</b>試驗項目

    工業(yè)電源的可靠性和擁有成本優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《工業(yè)電源的可靠性和擁有成本優(yōu)化.pdf》資料免費下載
    發(fā)表于 01-24 13:57 ?0次下載
    工業(yè)電源的<b class='flag-5'>可靠性</b>和擁有成本<b class='flag-5'>優(yōu)化</b>

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    的“知識機器人”,提升全球數(shù)十億知識工作者的生產(chǎn)力。為了開發(fā) AI 智能體,企業(yè)需要解決信任、物理安全、網(wǎng)絡(luò)安全以及合規(guī)等關(guān)鍵問題。 全新 NVIDIA NIM
    發(fā)表于 01-17 16:29 ?238次閱讀

    季豐RA新添可靠性試驗設(shè)備恒溫恒濕箱

    隨著國內(nèi)半導(dǎo)體科技的不斷進步,各領(lǐng)域AI芯片產(chǎn)品的可靠性和耐用成為了市場競爭的關(guān)鍵因素之一。針對非密封芯片在潮濕環(huán)境中的可靠性評估試驗,
    的頭像 發(fā)表于 12-18 14:18 ?656次閱讀