chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大家都在爭相超過A100,無人對標(biāo)的Grace Hopper性能幾何?

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-09-06 01:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))作為英偉達(dá)CPUGPU技術(shù)開發(fā)上的集大成之作,Grace Hopper很大程度上象征著復(fù)雜計(jì)算領(lǐng)軍產(chǎn)品。盡管英偉達(dá)竭盡所能地去堆這一“超級芯片”的性能,但英偉達(dá)還是選擇將Grace Hopper(GH200)描述成了世界上最萬能的計(jì)算平臺,這也得益于它同時(shí)在AI計(jì)算和HPC計(jì)算領(lǐng)域展現(xiàn)的可怕性能。

AI計(jì)算性能

相信絕大多數(shù)人已經(jīng)從市場瘋搶A100、H100的現(xiàn)狀,對Hopper GPU(H100)的性能有了大致的了解,但Grace Hopper作為一個(gè)異構(gòu)計(jì)算平臺,在與傳統(tǒng)的x86 CPU與H100對比上,也有著不小的性能差距。

首要區(qū)別自然就是連接Grace CPU和Hopper GPU的NVLink-C2C,這一高帶寬低延遲的互聯(lián)技術(shù)可謂是目前唯一能發(fā)揮H100近乎全部實(shí)力的方案。支持最高144TB內(nèi)存的同時(shí),提供900GB/s的帶寬。

英偉達(dá)官方也對部分AI計(jì)算負(fù)載進(jìn)行了測試,在終端應(yīng)用上對比x86+Hopper與Grace Hopper的一體化方案有何異同。其性能差距可以說是巨大的,就拿最常見的大語言模型推理來說,GH200可以做到x86平臺的4.5倍性能表現(xiàn),而DLRM(深度學(xué)習(xí)推薦模型)訓(xùn)練與圖神經(jīng)網(wǎng)絡(luò)(GNN)訓(xùn)練的性能也可以分別達(dá)到3.5倍和1.9倍。

其實(shí)這里的差異還是體現(xiàn)在互聯(lián)方案的帶寬上,例如x86+Hopper的方案還是在使用PCIe方案,該方案在batch size較小時(shí)性能落后還不算明顯,一旦到了更大的batch size,PCIe的帶寬就成了瓶頸,而不斷以高帶寬輸送數(shù)據(jù)給H100的NVLink-C2C則可以實(shí)現(xiàn)比PCIe高出數(shù)倍的性能。

HPC計(jì)算性能

Grace Hopper的另一大應(yīng)用領(lǐng)域自然就是HPC了。HPC主要集中在一些科學(xué)、工程的復(fù)雜計(jì)算上,比如天氣預(yù)測、生命科學(xué)、流體力學(xué)等。然而與此同時(shí),不少商業(yè)相關(guān)的HPC計(jì)算也在進(jìn)一步推動(dòng)HPC的發(fā)展,甚至更早用上最新的芯片技術(shù),比如油藏模擬等。

著名油藏模擬軟件ECHELON的開發(fā)商Stone Ridge,在最近獲得了早期訪問權(quán),對英偉達(dá)的H100-PCIe、H100-NVL和Grace-Hopper來了場性能測試。早在Volta和Ampere架構(gòu)時(shí),Stone Ridge就對不同架構(gòu)的GPU進(jìn)行了測試,而如今的H100相較這些舊GPU已經(jīng)在CUDA核心、內(nèi)存容量和內(nèi)存帶寬上有了數(shù)倍的提升。

這些還只是表面上的變化,英偉達(dá)還引入了諸多架構(gòu)改進(jìn),提高了ML和HPC應(yīng)用程序的性能。而Grace Hopper相較傳統(tǒng)的x86+GPU方案就更具優(yōu)勢了,首先Grace本身就是一個(gè)強(qiáng)大的CPU,每個(gè)內(nèi)核都有四個(gè)128位適量單元,超高的內(nèi)存帶寬以及超大的L2+L3緩存。其次,NVLink的存在大大減少了CPU和GPU之間的通信時(shí)間。

wKgaomT2_uKAdLA8AAFQ5Yki0Qg725.png
不同架構(gòu)不同版本的英偉達(dá)GPU在ECHELON模型上的性能對比 / Stone Ridge


Stone Ridge選擇了不同細(xì)胞規(guī)模的模型,從83000個(gè)細(xì)胞到670萬個(gè)細(xì)胞,其中Grace Hopper都展現(xiàn)出了不俗的性能,最高可達(dá)Volta架構(gòu)的V100的5.7倍。值得一提的是,由于CPU采用了新的Arm架構(gòu),所以ECHELON必須重新編譯才能在系統(tǒng)上運(yùn)行,不過對于ECHELON來說,重新編譯并不要花太多力氣,他們在不修改代碼的情況就成功重編譯在GH200上正常運(yùn)行。如果對代碼進(jìn)行進(jìn)一步優(yōu)化的話,還有機(jī)會(huì)獲得更高的性能表現(xiàn)。如此高的性能提升,意味著油藏勘探模擬的時(shí)間可以被大幅縮短,從而加快油藏評估的速度。

結(jié)語

可以說無論是A100還是H100,都只是英偉達(dá)在AI與HPC戰(zhàn)線擴(kuò)大戰(zhàn)果的第一步棋,明年Q2交付到各大系統(tǒng)中的GH200才是最大的殺手锏,也很可能會(huì)成為更搶手的數(shù)據(jù)中心與超算中心硬件產(chǎn)品。這也恰好證明了英偉達(dá)給它的定位,世界上最萬能的計(jì)算平臺。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?

    大家都在用什么AI軟件?有沒有好用的免費(fèi)的AI軟件推薦一下?直接發(fā)個(gè)安裝包,謝謝。比如deepseek、Chatgpt、豆包、阿里AI、百度AI、騰訊AI,哪個(gè)能用、好用?沒找到安裝包,都是在線搜索?想要Windows版本和IOS版本或者安卓版本
    發(fā)表于 07-09 18:30

    NVIDIA技術(shù)賦能歐洲最快超級計(jì)算機(jī)JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計(jì)算機(jī)成為歐洲最快超級計(jì)算機(jī),其運(yùn)行 HPC 和 AI 工作負(fù)載的速度是第二名的兩倍以上。
    的頭像 發(fā)表于 06-12 15:33 ?507次閱讀

    NVIDIA Grace CPU C1獲得廣泛支持

    NVIDIA 在本周 COMPUTEX 上重點(diǎn)展示了其全新的 Grace CPU C1,并獲得多家主要原始設(shè)計(jì)制造商合作伙伴的大力支持。
    的頭像 發(fā)表于 05-22 10:01 ?296次閱讀

    SL9486A DCDC100V降壓恒壓芯片 優(yōu)勢替代兼容MP9486A 國產(chǎn)替代

    SL9486A100V耐壓降壓恒壓電源芯片,全面升級替代MP9486A的最佳方案 在高壓電源管理領(lǐng)域,SL9486A憑借其卓越的性能與兼容
    發(fā)表于 04-12 10:59

    精密幾何測量技術(shù)在電子芯片制造中的重要性

    精密幾何測量技術(shù)在電子芯片制造中具有極其重要的地位,主要體現(xiàn)在以下幾個(gè)方面:1、確保芯片性能-晶體管性能優(yōu)化:在芯片中,晶體管的尺寸和結(jié)構(gòu)對其性能至關(guān)重要。通過精密
    的頭像 發(fā)表于 02-28 14:23 ?449次閱讀
    精密<b class='flag-5'>幾何</b>測量技術(shù)在電子芯片制造中的重要性

    英偉達(dá)A100和H100比較

    英偉達(dá)A100和H100都是針對高性能計(jì)算和人工智能任務(wù)設(shè)計(jì)的GPU,但在性能和特性上存在顯著差異。以下是對這兩款GPU的比較: 1. 架構(gòu)與核心規(guī)格:
    的頭像 發(fā)表于 02-10 17:05 ?4456次閱讀
    英偉達(dá)<b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比較

    植保無人機(jī)電池性能測試方法

    隨著農(nóng)業(yè)現(xiàn)代化的不斷推進(jìn),植保無人機(jī)作為一種高效、精準(zhǔn)的農(nóng)業(yè)植保工具,正逐漸受到廣大農(nóng)戶和農(nóng)業(yè)企業(yè)的青睞。植保無人機(jī)的性能在很大程度上取決于其搭載的電池系統(tǒng),因此,對植保無人機(jī)電池進(jìn)行
    的頭像 發(fā)表于 01-08 09:26 ?996次閱讀
    植保<b class='flag-5'>無人</b>機(jī)電池<b class='flag-5'>性能</b>測試方法

    小軸距高性能!時(shí)代星光發(fā)布蜂鷹F1超高性價(jià)比單兵無人機(jī)

    隨著無人機(jī)產(chǎn)業(yè)的發(fā)展,無人機(jī)在各個(gè)行業(yè)、各個(gè)領(lǐng)域的應(yīng)用都在不斷深化。近日,時(shí)代星光科技發(fā)布了全新自研的高性能單兵無人機(jī)蜂鷹F1,以輕巧便攜、
    的頭像 發(fā)表于 12-24 15:01 ?937次閱讀
    小軸距高<b class='flag-5'>性能</b>!時(shí)代星光發(fā)布蜂鷹F1超高性價(jià)比單兵<b class='flag-5'>無人</b>機(jī)

    商超便利店配送“新寵”,九識無人車為100余家門店降本!

    被九識無人車而改變,負(fù)責(zé)人楊經(jīng)理的話語中透露出的對九識無人車的由衷認(rèn)可。目前,九識無人車的運(yùn)營服務(wù)已經(jīng)覆蓋了近十個(gè)省份,超過100家商超便利
    的頭像 發(fā)表于 12-17 14:21 ?853次閱讀
    商超便利店配送“新寵”,九識<b class='flag-5'>無人</b>車為<b class='flag-5'>100</b>余家門店降本!

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    GPGPU的靈活計(jì)算能力,經(jīng)歷了翻天覆地的變化。以三角形圖元為基礎(chǔ)的幾何處理階段,通過T&L(Transform and Lighting)單元完成頂點(diǎn)變換與光照計(jì)算;光柵化階段將3D
    發(fā)表于 11-24 17:12

    英偉達(dá)CEO確認(rèn):液冷Grace Blackwell服務(wù)器無過熱問題

    問題”。 這一表態(tài)無疑為市場注入了一劑強(qiáng)心針。隨著數(shù)據(jù)中心運(yùn)算需求的不斷增長,服務(wù)器的散熱問題日益凸顯,成為制約其性能發(fā)揮的關(guān)鍵因素之一。而英偉達(dá)作為全球領(lǐng)先的圖形處理器(GPU)制造商,其服務(wù)器產(chǎn)品的散熱性能自然備受矚目。 據(jù)悉,Gr
    的頭像 發(fā)表于 11-21 11:45 ?621次閱讀

    本期為大家帶來的是100W氮化鎵充電器詳細(xì)介紹拆解。

    本期為大家帶來的是100W氮化鎵充電器詳細(xì)介紹拆解。 這款充電器配備折疊插腳以及2C1A接口,兩個(gè)USB-C口均支持100W PD快充和PPS快充,USB-
    的頭像 發(fā)表于 11-11 14:59 ?2357次閱讀
    本期為<b class='flag-5'>大家</b>帶來的是<b class='flag-5'>100</b>W氮化鎵充電器詳細(xì)介紹拆解。

    軟銀升級人工智能計(jì)算平臺,安裝4000顆英偉達(dá)Hopper GPU

    達(dá)Ampere GPU。通過新增的4000顆Hopper GPU,該平臺的總計(jì)算性能已躍升至每秒約4.7百億億次。
    的頭像 發(fā)表于 11-04 16:18 ?879次閱讀

    寶礫微DC-DC升級壓電動(dòng)代步工具、無人機(jī)電源方案

    | |PL89021|5.0-100|1|降壓轉(zhuǎn)換器|ESOP8| 電動(dòng)車、無人機(jī)、電信系統(tǒng) | Pin兼容:LM5164/SQ27001FCC功能兼容:SY8501 | |PL89032|12-100
    發(fā)表于 09-11 10:25

    英偉達(dá)或取消B100轉(zhuǎn)用B200A代替

    今年3月份,英偉達(dá)在美國加利福尼亞州圣何塞會(huì)議中心召開的GTC 2024大會(huì)上推出了Blackwell架構(gòu)GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現(xiàn)行H100/H200,并有與Grace CPU協(xié)作的GB2
    的頭像 發(fā)表于 08-08 17:19 ?1017次閱讀