chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)AI服務(wù)器NVLink版與PCIe版有何區(qū)別?又如何選擇呢?

智能計(jì)算芯世界 ? 來源:智能計(jì)算芯世界 ? 2024-03-19 11:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能領(lǐng)域,英偉達(dá)作為行業(yè)領(lǐng)軍者,推出了兩種主要的GPU版本供AI服務(wù)器選擇——NVLink版(實(shí)為SXM版)與PCIe版。這兩者有何本質(zhì)區(qū)別?又該如何根據(jù)應(yīng)用場(chǎng)景做出最佳選擇呢?讓我們深入探討一下。

** NVLink版的服務(wù)器**

SXM架構(gòu),全稱Socketed Multi-Chip Module,是英偉達(dá)專為實(shí)現(xiàn)GPU間超高速互連而研發(fā)的一種高帶寬插座式解決方案。這一獨(dú)特的設(shè)計(jì)使得GPU能夠無縫對(duì)接于英偉達(dá)自家的DGX和HGX系統(tǒng)。這些系統(tǒng)針對(duì)每一代英偉達(dá)GPU(包括最新款的H800、H100、A800、A100以及之前的P100、V100等型號(hào))配備了特定的SXM插座,確保GPU與系統(tǒng)之間實(shí)現(xiàn)最高效率的連接。舉例來說,一張展示8塊A100 SXM卡在浪潮NF5488A5 HGX系統(tǒng)上并行工作的圖片,直觀展示了這種強(qiáng)大的整合能力。

在HGX系統(tǒng)主板上,8個(gè)GPU通過NVLink技術(shù)進(jìn)行了緊密耦合,構(gòu)建出前所未有的高帶寬互聯(lián)網(wǎng)絡(luò)。具體來說,每一個(gè)H100 GPU會(huì)連接至4個(gè)NVLink交換芯片,從而實(shí)現(xiàn)GPU之間的驚人傳輸速度——高達(dá)900 GB/s的NVLink帶寬。此外,每個(gè)H100 SXM GPU還通過PCIe接口CPU相連,確保任意GPU產(chǎn)生的數(shù)據(jù)都能快速傳送到CPU進(jìn)行處理。

wKgZomX5BQCAAGCPAAaUZ9psNS4086.jpg

進(jìn)一步強(qiáng)化這種高性能互聯(lián)的是NVSwitch芯片,它把DGX和HGX系統(tǒng)板上的所有SXM版GPU串聯(lián)在一起,形成了一個(gè)高效的GPU數(shù)據(jù)交換網(wǎng)絡(luò)。未削減功能的A100 GPU可達(dá)到600GB/s的NVLink帶寬,而H100更是提升至900GB/s,即便是針對(duì)特定市場(chǎng)優(yōu)化過的A800、H800也能保持400GB/s的高速互連性能。

wKgZomX5BQGAcsa3AAFipZOOabM282.jpg

談及DGX和HGX的不同之處,NVIDIA DGX可視為出廠預(yù)裝且高度可擴(kuò)展的完整服務(wù)器解決方案,其在同等體積內(nèi)的性能表現(xiàn)堪稱業(yè)界翹楚。多臺(tái)NVIDIA DGX H800可通過NVSwitch系統(tǒng)輕松組合,形成包含32個(gè)乃至64個(gè)節(jié)點(diǎn)的超級(jí)集群SuperPod,足以應(yīng)對(duì)超大規(guī)模模型訓(xùn)練的嚴(yán)苛需求。而HGX則屬于原始設(shè)備制造商(OEM)定制整機(jī)方案。

** PCIe版的服務(wù)器**

相比于SXM版GPU的全域互聯(lián),PCIe版GPU的互聯(lián)方式更為傳統(tǒng)和受限。在這種架構(gòu)下,GPU僅僅通過NVLink Bridge與相鄰的GPU實(shí)現(xiàn)直接連接,如圖所示,GPU 1僅能直接連接至GPU 2,而非直接相連的GPU(如GPU 1與GPU 8)間的通信則必須通過較慢的PCIe通道來實(shí)現(xiàn),這過程中還需要借助CPU的協(xié)助。目前最先進(jìn)的PCIe標(biāo)準(zhǔn)提供的最大帶寬僅為128GB/s,遠(yuǎn)不及NVLink的超高帶寬。

wKgaomX5BQCAFaBNAAMHnYTn5TA366.jpg

然而,盡管在GPU間互聯(lián)帶寬上PCIe版稍遜一籌,但單就GPU卡本身的計(jì)算性能而言,PCIe版與SXM版并無顯著差異。對(duì)于那些并不極端依賴于GPU間高速互連的應(yīng)用場(chǎng)景,如中小型模型訓(xùn)練、推理應(yīng)用部署等,GPU間互聯(lián)帶寬的高低并不會(huì)顯著影響整體性能。

對(duì)比A100 PCIe與A100 SXM各項(xiàng)參數(shù)的圖表顯示兩者的計(jì)算核心性能并無太大差別。

wKgaomX5BQCAIuqBAAILd99fRPs781.jpg

** 該如何選擇?**

PCIe版GPU的優(yōu)勢(shì)主要體現(xiàn)在其出色的靈活性和適應(yīng)性。對(duì)于工作負(fù)載較小、追求GPU數(shù)量配置靈活性的用戶,PCIe版GPU無疑是個(gè)絕佳選擇。例如,某些GPU服務(wù)器僅需配備4張或者更少的GPU卡,此時(shí)采用PCIe版即可方便地實(shí)現(xiàn)服務(wù)器的小型化,可輕松嵌入1U或2U服務(wù)器機(jī)箱,同時(shí)降低了對(duì)數(shù)據(jù)中心機(jī)架空間的要求。

此外,在推理應(yīng)用部署環(huán)境中,我們經(jīng)常通過虛擬化技術(shù)將資源拆分和細(xì)粒度分配,實(shí)現(xiàn)CPU與GPU的一對(duì)一匹配。在這個(gè)場(chǎng)景下,PCIe版GPU因其較低的能耗(約300W/GPU)和普遍兼容性而受到青睞。而相比之下,SXM版GPU在HGX架構(gòu)中的功率消耗可能達(dá)到500W/GPU,雖然犧牲了一些能效比,卻換取了頂級(jí)的互聯(lián)性能優(yōu)勢(shì)。

綜上所述,NVLink版(SXM版)GPU與PCIe版GPU各自服務(wù)于不同的市場(chǎng)需求。對(duì)于對(duì)GPU間互連帶寬有著極高需求的大規(guī)模AI模型訓(xùn)練任務(wù),SXM版GPU憑借其無可匹敵的NVLink帶寬和極致性能,成為了理想的計(jì)算平臺(tái)。而對(duì)于那些重視靈活性、節(jié)約成本、注重適度性能和廣泛兼容性的用戶,則可以選擇PCIe版GPU,它尤其適合輕量級(jí)工作負(fù)載、有限GPU資源分配以及各類推理應(yīng)用部署場(chǎng)景。

企業(yè)在選購(gòu)英偉達(dá)AI服務(wù)器時(shí),務(wù)必充分考慮當(dāng)前業(yè)務(wù)需求、未來發(fā)展規(guī)劃以及成本效益,合理評(píng)估兩種GPU 服務(wù)器版本的優(yōu)劣,以便找到最適合自身需求的解決方案。最終的目標(biāo)是在保證計(jì)算效能的同時(shí),最大化投資回報(bào)率,并為未來的拓展留足空間。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5431

    瀏覽量

    108293
  • PCIe
    +關(guān)注

    關(guān)注

    16

    文章

    1403

    瀏覽量

    86957
  • 交換芯片
    +關(guān)注

    關(guān)注

    0

    文章

    90

    瀏覽量

    11476
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4017

    瀏覽量

    96833
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    306

    瀏覽量

    6325

原文標(biāo)題:英偉達(dá)AI服務(wù)器NVLink版與PCIe版的差異與選擇

文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPU猛獸襲來!HBM4、AI服務(wù)器徹底引爆!

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)日前,多家服務(wù)器廠商表示因AI服務(wù)器需求高漲拉高業(yè)績(jī)?cè)鲩L(zhǎng)。隨著AI服務(wù)器需求旺盛,以及
    的頭像 發(fā)表于 06-02 06:54 ?6241次閱讀

    輕量云服務(wù)器和云服務(wù)器區(qū)別:2025年終極選擇指南

    資源、穩(wěn)定計(jì)算性能及完整管理權(quán)限,支持垂直與水平擴(kuò)展,適合企業(yè)級(jí)應(yīng)用和高并發(fā)場(chǎng)景。選擇取決于業(yè)務(wù)需求:輕量服務(wù)器適用于成本敏感型場(chǎng)景,標(biāo)準(zhǔn)云服務(wù)器則為高性能、高穩(wěn)定性要求的業(yè)務(wù)提供保障。關(guān)鍵是根據(jù)實(shí)際負(fù)載和增長(zhǎng)預(yù)期合理選型,下文
    的頭像 發(fā)表于 09-01 13:58 ?525次閱讀
    輕量云<b class='flag-5'>服務(wù)器</b>和云<b class='flag-5'>服務(wù)器</b><b class='flag-5'>區(qū)別</b>:2025年終極<b class='flag-5'>選擇</b>指南

    繼HBM之后,英偉達(dá)帶火又一AI內(nèi)存模組!顛覆AI服務(wù)器與PC

    Attached Memory Module,即小型化壓縮附加內(nèi)存模組,是英偉達(dá)主導(dǎo)開發(fā)的一種新型內(nèi)存模塊,是適用于數(shù)據(jù)中心 AI 服務(wù)器的新型高
    的頭像 發(fā)表于 07-27 07:50 ?4115次閱讀

    AI服務(wù)器電源技術(shù)研討會(huì)部分演講嘉賓確認(rèn)

    AI服務(wù)器電源是2025-2026年AI硬件確定的增量,英偉達(dá)超級(jí)芯片GB200功率到2700W,是傳統(tǒng)
    的頭像 發(fā)表于 06-24 10:07 ?553次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>服務(wù)器</b>電源技術(shù)研討會(huì)部分演講嘉賓確認(rèn)

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    的我還沒接觸過大模型的內(nèi)容以及后期從事的視覺檢測(cè)分析技術(shù),再后來不論是自己的PC還是工作服務(wù)器,基本都是單旗艦卡,也沒過多接觸過NVlink技術(shù)(實(shí)際是后續(xù)都只在頂級(jí)卡上用NVlink,多卡組不起
    發(fā)表于 06-18 19:31

    總功率超198kW,AI服務(wù)器電源對(duì)元器件提出了哪些要求?

    芯片GB200功率到2700W,是傳統(tǒng)服務(wù)器電源的5-7倍,但其面臨的挑戰(zhàn)同樣不小。 超高功率需求與空間限制。 AI服務(wù)器(如搭載英偉達(dá)Bl
    的頭像 發(fā)表于 06-17 10:36 ?725次閱讀
    總功率超198kW,<b class='flag-5'>AI</b><b class='flag-5'>服務(wù)器</b>電源對(duì)元器件提出了哪些要求?

    服務(wù)器和獨(dú)立服務(wù)器區(qū)別在哪?一文讀懂如何選擇

    面對(duì)云服務(wù)器與獨(dú)立服務(wù)器選擇,許多人常因概念模糊而糾結(jié)。云服務(wù)器和獨(dú)立服務(wù)器區(qū)別在于資源分配
    的頭像 發(fā)表于 05-19 10:19 ?326次閱讀

    鴻海GB200 AI服務(wù)器順利完成英偉達(dá)交付目標(biāo)

    據(jù)臺(tái)媒報(bào)道,鴻海近期在AI服務(wù)器領(lǐng)域取得了顯著成果。為確保英偉達(dá)超級(jí)AI芯片GB200的出貨進(jìn)度,鴻海在中國(guó)臺(tái)灣和越南等地的廠區(qū)在農(nóng)歷新年期
    的頭像 發(fā)表于 02-06 17:59 ?1198次閱讀

    英偉達(dá)GB200 NVL72服務(wù)器出貨量調(diào)低

    近日,天風(fēng)國(guó)際證券分析師郭明錤發(fā)布報(bào)告指出,英偉達(dá)GB200 NVL72服務(wù)器的出貨量將低于預(yù)期。據(jù)悉,由于該服務(wù)器的組裝量產(chǎn)時(shí)間多次延期,導(dǎo)致今年的出貨量預(yù)估范圍調(diào)整至2.5萬(wàn)至3.
    的頭像 發(fā)表于 01-22 18:16 ?1184次閱讀

    英偉達(dá)GB300 AI服務(wù)器預(yù)計(jì)2025年Q2發(fā)布,強(qiáng)化水冷散熱需求

    近日,據(jù)供應(yīng)鏈最新消息,英偉達(dá)正緊鑼密鼓地設(shè)計(jì)其下一代GB300 AI服務(wù)器,并預(yù)計(jì)在2025年第二季度正式發(fā)布。隨后,該產(chǎn)品將在第三季度進(jìn)入試產(chǎn)階段,標(biāo)志著
    的頭像 發(fā)表于 01-06 10:19 ?1696次閱讀

    英偉達(dá)GB300 AI服務(wù)器訂單配置初定

    近日,據(jù)業(yè)界消息透露,英偉達(dá)已初步敲定了其下一代GB300 AI服務(wù)器產(chǎn)品線的訂單配置。預(yù)計(jì)英偉達(dá)
    的頭像 發(fā)表于 12-25 10:52 ?1485次閱讀

    英偉達(dá)CEO確認(rèn):液冷Grace Blackwell服務(wù)器無過熱問題

    近日,英偉達(dá)公司的首席執(zhí)行官(CEO)針對(duì)外界關(guān)注的液冷Grace Blackwell服務(wù)器過熱問題,發(fā)表了明確的看法。他強(qiáng)調(diào),采用液冷技術(shù)的Grace Blackwell服務(wù)器并不存
    的頭像 發(fā)表于 11-21 11:45 ?805次閱讀

    美國(guó)多IP服務(wù)器和美國(guó)多服務(wù)器什么區(qū)別

    美國(guó)多IP服務(wù)器和美國(guó)多服務(wù)器什么區(qū)別 美國(guó)多IP服務(wù)器和美國(guó)多服務(wù)器在概念、功能以及應(yīng)用場(chǎng)
    的頭像 發(fā)表于 11-11 10:22 ?1043次閱讀

    GPU服務(wù)器和傳統(tǒng)的服務(wù)器什么區(qū)別

    GPU服務(wù)器與傳統(tǒng)的服務(wù)器在多個(gè)方面存在顯著差異,主機(jī)推薦小編為您整理發(fā)布GPU服務(wù)器和傳統(tǒng)的服務(wù)器什么
    的頭像 發(fā)表于 11-07 11:05 ?997次閱讀

    英偉達(dá)地表最強(qiáng)AI芯片GB200 NVL72服務(wù)器遭搶購(gòu)

    10月28日,最新媒體報(bào)道顯示,配備有英偉達(dá)被譽(yù)為“地表最強(qiáng)AI芯片”的GB200的AI服務(wù)器已開始交付,微軟、Meta等行業(yè)巨頭正積極擴(kuò)大
    的頭像 發(fā)表于 10-29 10:42 ?1982次閱讀