chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

900GB/s,NVLink才是英偉達的互聯(lián)殺手锏

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2022-03-25 07:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)英偉達在GTC22上發(fā)布了全新的GraceSuperchip,該芯片中用到了NVLink-C2C技術(shù),而去年公開的GraceHopperSuperchip同樣用到了這一技術(shù)。根據(jù)英偉達超大規(guī)模計算部門副總裁IanBuck的說法,Chiplet和異構(gòu)計算已經(jīng)成了解決摩爾定律緩慢進展的兩大有效手段。而NVLink-C2C這一面向die和chip的互聯(lián)技術(shù),成了英偉達對愈發(fā)普及的Chiplet設(shè)計的回應(yīng)。

Superchip的互聯(lián)


也許在不少人看來的印象中,提到NVLink會想到下圖這個橋接多個高端顯卡或?qū)I(yè)顯卡的RTX NVLinkBridge,其實NVLink這一技術(shù)在服務(wù)器級別的GPU中反倒更為普遍。從P100的第一代NVLink,到V100的第二代NVLink,A100的第三代NVLink,最后再到如今H100的第四代NVLink。NVLink可以說是跟著GPU架構(gòu)一路推陳出新了,如今享受第四代NVLink性能的成了Hopper架構(gòu)的GPU。而在英偉達的SERDES和LINK技術(shù)發(fā)展下,NVLink也從PCB、MCM走向了硅中介層和晶圓,也因此有了NVLink-C2C。

RTX NVLinkBridge/ 英偉達


GraceSuperchip顯然用的是ARM NeoverseN2這一基于Armv9架構(gòu)的設(shè)計,但從芯片圖可以看出,單個GraceSuperchip芯片由兩個GraceCPU組成,才讓總核心數(shù)達到了144。而這兩個CPU組成的方式,正是NVLink-C2C這一互聯(lián)技術(shù)。我們在開頭已經(jīng)提到,去年公開的GraceHopperSuperchip同樣使用了這一互聯(lián)技術(shù),只不過當時單個GraceHopperSuperchip芯片中互聯(lián)的,是一個GraceCPU和一個HopperGPU。


NVLink-C2C為英偉達帶來的遠不止這樣一對一的互聯(lián)方案,而是一整套系統(tǒng)架構(gòu)上的創(chuàng)新。在NVLink-C2C的支持下,英偉達可以選擇一個GraceCPU,兩個HopperGPU的設(shè)計,或是兩個2個GraceCPU+2個HopperGPU,甚至是2個GraceCPU+8個HopperGPU。可以看出,NVLink-C2C為Grace和Hopper在數(shù)據(jù)中心和HPC應(yīng)用提供了極大的擴展性。

遠超PCIe5.0的性能

英偉達強調(diào),NVLink-C2C具有前所未有的性能,比如處理器與加速器之間900GB/s的高帶寬數(shù)據(jù)傳輸,以及快速同步和高頻率更新下的超低延遲,以及在先進封裝英偉達芯片下,能效比可以做到PCIe5.0的25倍,面積效率更是達到90倍。

H100 SXM5 GPU / 英偉達


NVLink-C2C900GB/s的帶寬確實優(yōu)秀,也與第四代NVLink的性能一致,但這并不代表只要用上NVLink就能獲得,我們從Hopper架構(gòu)的GPU H100的參數(shù)上也能窺見一二。要想獲得900GB/s的帶寬性能,必須用到SXM5的大功率卡,而不是PCIe5.0的卡,雖然前者的功耗是后者的兩倍,達到了可怕的700W,但PCIe5.0的H100在總體性能和帶寬上確實差SXM5一截。

兩者在PCIe5.0上的帶寬一致,都是128GB/s,但如果用上NVLink,PCIe5.0版本的H100只能達到600GB/s的帶寬,與第三代NVLink性能一致,只有SXM5版本下的NVLink才能達到滿血的900GB/s。


另外在第四代NVLink和第三代NVSwitch技術(shù)的組合下,英偉達推出了NVLinkSwitch這一方案,該系統(tǒng)最多支持到256個GPU,可實現(xiàn)57.6TB/s的總帶寬。NVLinkSwitch也是英偉達DGX H100 SuperPOD系統(tǒng)的關(guān)鍵技術(shù),英偉達甚至把自己收購的Mellanox旗下的InfiniBand節(jié)點互聯(lián)技術(shù)拿來對比。從上圖可以看出與基于A100+InfiniBand的SuperPOD系統(tǒng)相比,基于H100+NVLinkSwitch的SuperPOD系統(tǒng)在對分帶寬上是前者的9倍。

開放而不是獨占


其實NVLink的存在最初讓不少人覺得有些一家獨大的意思,畢竟最早NVLink僅僅只是用于多個英偉達GPU之間的互聯(lián),僅僅只是為自家的產(chǎn)品提供更多優(yōu)勢而已。而去年發(fā)布的GraceHopperSuperchip同樣用到了這一技術(shù),但這顆芯片卻是英偉達設(shè)計的ArmCPU和GPU的互聯(lián)。

這讓人不禁擔心,如果英偉達真的成功收購了Arm,會不會利用這一優(yōu)勢來全面壟斷數(shù)據(jù)中心和HPC市場。畢竟Arm自己給出的互聯(lián)方案CMN-700支持的是CCIX 2.0和CXL 2.0這兩大標準互聯(lián)協(xié)議,同時為第三方加速器提供PCIe5.0的連接。但就紙面參數(shù)給到的性能看來,NVLink這種專用方案似乎更加吃香一些。

不過Arm作為一家IP公司,目標自然是支持到多樣化的加速器,從而全面發(fā)展Arm的生態(tài)。此前Arm在接受電子發(fā)燒友網(wǎng)采訪時也表示,Arm期待給市場帶來更多的靈活性,支持更多像Grace這樣的系統(tǒng)。

NVLink-C2C示意圖 / 英偉達


好在英偉達似乎也不打算將NVLink-C2C獨占,而是宣布開放這一技術(shù),支持集成英偉達技術(shù)的芯片半定制,通過Chiplet技術(shù)充分利用自家的GPU、DPU、NIC、CPU和SoC產(chǎn)品,與客戶的IP進行NVLink-C2C互聯(lián)。

盡管收購失敗,英偉達與Arm的合作并沒有就此停止,英偉達也在GTC22上宣布繼續(xù)與Arm緊密合作,以支持并在未來改進Arm的AMBA CHI協(xié)議,加上對CXL的支持,從而與更多加速器和處理器做到互聯(lián)。

與此同時,在全行業(yè)群策群力,試圖打通生態(tài)的情況下,英偉達也并不打算將NVLink-C2C作為唯一的可選方案。所以除了NVLink-C2C外,集成了英偉達芯片的定制SoC也可選用前段時日公布的UCIe通用Chiplet互聯(lián)標準,所以不必將數(shù)據(jù)中心上的CPU、DPU和GPU一整套都換成英偉達旗下的產(chǎn)品,給到第三方服務(wù)器芯片、DPU和加速器一個機會。不過,考慮到這兩種互聯(lián)方式只能選其一,英偉達也強調(diào)了NVLink-C2C經(jīng)過優(yōu)化,擁有更低的延遲、更高的帶寬和更高的能效比,該如何選擇還是看廠商自己的考量了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    53866

    瀏覽量

    463166
  • 互聯(lián)技術(shù)
    +關(guān)注

    關(guān)注

    0

    文章

    13

    瀏覽量

    8490
  • 英偉達
    +關(guān)注

    關(guān)注

    23

    文章

    4068

    瀏覽量

    98463
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    市值近4萬億美元!英偉GB300服務(wù)器正式出貨

    突破 4 萬億美元市值,但 3.92 萬億美元已是有史以來全球科技公司的最高市值。有分析人士認為,英偉必將正式加冕為歷史上市值最高的公司。 ? 除了股市表現(xiàn)亮眼,英偉
    的頭像 發(fā)表于 07-06 05:28 ?6913次閱讀
    市值近4萬億美元!<b class='flag-5'>英偉</b><b class='flag-5'>達</b><b class='flag-5'>GB</b>300服務(wù)器正式出貨

    麥格納宣布擴大與英偉的戰(zhàn)略合作

    麥格納宣布擴大與英偉的戰(zhàn)略合作,為整車廠基于英偉DRIVE Hyperion平臺的項目落地提供支持。
    的頭像 發(fā)表于 01-09 12:59 ?259次閱讀

    英偉重磅出手!AI 推理存儲全面覺醒

    電子發(fā)燒友網(wǎng)報道(文/黃晶晶)近日,有消息稱,英偉將以大約200億美元收購人工智能芯片初創(chuàng)公司Groq,這將是英偉迄今為止規(guī)模最大的一筆收購。但
    的頭像 發(fā)表于 12-26 08:44 ?1w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>重磅出手!AI 推理存儲全面覺醒

    國家網(wǎng)信辦約談英偉

    用戶網(wǎng)絡(luò)安全、數(shù)據(jù)安全,依據(jù)《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個人信息保護法》有關(guān)規(guī)定,國家互聯(lián)網(wǎng)信息辦公室于2025年7月31日約談了英偉公司,要求英偉
    的頭像 發(fā)表于 07-31 13:56 ?2635次閱讀
    國家網(wǎng)信辦約談<b class='flag-5'>英偉</b><b class='flag-5'>達</b>

    瑞之辰傳感器:從“卡脖子”到“殺手锏”的技術(shù)突圍

    壓力傳感器的國產(chǎn)化替代,將這一“卡脖子”難題逐步轉(zhuǎn)變?yōu)樽陨淼募夹g(shù)“殺手锏”。破解“卡脖子”的技術(shù)密碼當動力電池安全監(jiān)測需要精度1%FS的微型壓力傳感器時,當工業(yè)自動化
    的頭像 發(fā)表于 07-01 17:06 ?1835次閱讀
    瑞之辰傳感器:從“卡脖子”到“<b class='flag-5'>殺手锏</b>”的技術(shù)突圍

    英偉預計向中國客戶交付 “第三代” 閹割芯片

    基于 GB202 GPU,采用 GDDR7 內(nèi)存,最大帶寬可達 800Gbps,適合小規(guī)模集群推理和小模型后訓練;B40/B30 芯片則保留了與 H20 相同的 NVLink 互聯(lián)功能,最大帶寬可達
    的頭像 發(fā)表于 06-21 00:03 ?3750次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    NVlink1.0——初代的堆疊技術(shù) 英偉2014發(fā)布了NVLink的首個版本——NVLink 1.0。在2016年發(fā)布的P100芯片
    發(fā)表于 06-18 19:31

    英偉臺北設(shè)辦事處!開放NVLink生態(tài),800GB桌面超算面世

    引擎Newton等產(chǎn)品,并分享了英偉在AI領(lǐng)域的最新進展,包括宣布在中國臺灣設(shè)立辦事處等。 在演講開場,黃仁勛分享了他對AI技術(shù)的期許,
    的頭像 發(fā)表于 05-20 09:11 ?6902次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>臺北設(shè)辦事處!開放<b class='flag-5'>NVLink</b>生態(tài),800<b class='flag-5'>GB</b>桌面超算面世

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一種關(guān)鍵的高速互連技術(shù),專為加速計算而設(shè)計,尤其是在多 GPU 系統(tǒng)以及 GPU 和支持 CPU 之間 ^1^。NVLink 的出現(xiàn)標志著傳統(tǒng)互連瓶頸的突破,凸顯
    的頭像 發(fā)表于 05-06 18:14 ?4825次閱讀

    新能源電網(wǎng)穩(wěn)壓神器ACR10R-E4S/CE

    新能源發(fā)電的"卡脖子"難題日益嚴峻,電網(wǎng)頻率劇烈波動,傳統(tǒng)監(jiān)測設(shè)備力不從心。ACR10R-E4S/CE智能電測設(shè)備以其快速響應(yīng)、亞赫茲精度和工業(yè)以太網(wǎng)直連三大殺手锏,重塑調(diào)頻游戲規(guī)則。
    的頭像 發(fā)表于 04-10 16:47 ?602次閱讀
    新能源電網(wǎng)穩(wěn)壓神器ACR10R-E4<b class='flag-5'>S</b>/CE

    新思科技攜手英偉加速芯片設(shè)計,提升芯片電子設(shè)計自動化效率

    解決方案在英偉 GPU和英偉 CUDA-X庫上所實現(xiàn)的加速 基于英偉
    發(fā)表于 03-19 17:59 ?460次閱讀

    英偉市值一夜蒸發(fā)近2萬億 英偉股價下跌超8%

    在美東時間周一,美股三大指數(shù)集體收跌,截至收盤,英偉股價下跌超8%,英偉市值一夜蒸發(fā)2650億美元(換算下來約合人民幣19345億元);目前英偉
    的頭像 發(fā)表于 03-04 10:19 ?1062次閱讀

    英偉GB300 NVL72加速研發(fā),AOS成關(guān)鍵DrMOS供應(yīng)商

    近日,英偉在高性能計算領(lǐng)域的研發(fā)步伐再次提速,其最新一代產(chǎn)品GB300 NVL72正加速推進。據(jù)天風證券分析師郭明錤于2月7日發(fā)布的博文透露,英偉
    的頭像 發(fā)表于 02-10 17:10 ?1414次閱讀

    鴻海GB200 AI服務(wù)器順利完成英偉交付目標

    據(jù)臺媒報道,鴻海近期在AI服務(wù)器領(lǐng)域取得了顯著成果。為確保英偉超級AI芯片GB200的出貨進度,鴻海在中國臺灣和越南等地的廠區(qū)在農(nóng)歷新年期間進行了大規(guī)模動員,總計投入超過5000人全力趕工。
    的頭像 發(fā)表于 02-06 17:59 ?1462次閱讀