chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD正式發(fā)布了新一代Instinct MI100計算卡

lhl545545 ? 來源:快科技 ? 作者:上方文Q ? 2020-11-18 10:20 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

昨日晚間,AMD正式發(fā)布了新一代Instinct MI100計算卡,首次采用針對HPC高性能計算、AI人工智能全新設(shè)計的CDNA架構(gòu),和游戲向的RDNA架構(gòu)截然不同。

Instinct MI100計算卡采用臺積電7nm工藝制造,集成120個計算單元、7680個流處理器,核心頻率最高1502MHz,并專門加入了Matrix Core(矩陣核心),用于加速HPC、AI運算。

它整合封裝了32GB HBM2顯存,位寬4096-bit,頻率1.2GHz,帶寬1228.8GB/s,支持ECC。

該卡支持PCIe 4.0 x16,具備三條Infinity Fabric互連總線,峰值帶寬92GB/s,整卡熱設(shè)計功耗300W,雙8針輔助供電。

這塊卡的特殊之處還在于頂部設(shè)置了橋接金手指,通過橋接器可以將四塊卡綁定在一起,而搭配雙路的AMD霄龍?zhí)幚砥?,可以實現(xiàn)八卡并行。

類似之前的計算卡,甚至是R9 Fury X、Vega 64/56這樣的游戲卡,Instinct MI110也是將GPU芯片、HBM芯片整合封裝在了一起,不過如今的HBM2單顆容量已達8GB。

對比CDNA(上)、RDNA(下)架構(gòu)圖,可以發(fā)現(xiàn)二者整體框架有些相似之處,但各種單元模塊和布局已經(jīng)截然不同。

Infinity Fabric互連總線、顯存控制器、PCIe 4.0控制器、多媒體引擎、著色器引擎、ACE異步計算引擎等等都還在(當(dāng)然也不完全一樣了),而和圖形渲染輸出相關(guān)的都沒了,比如圖形指令處理器、幾何處理器、光柵器、顯示引擎、原語單元等等,同時增加了XGMI連接控制器用于多卡互連,一二級緩存也完全不同。

作為AMD GPU的最基本模塊,計算單元(CU)也完全不同了,現(xiàn)在叫做增強型計算單元(XCU),組成模塊包括調(diào)度器、分支與信息單元、12.8KB ECC標(biāo)量單元、512KB ECC標(biāo)量寄存器、矢量寄存器、矢量ALU操作單元、矩陣數(shù)據(jù)操作單元、四個矢量/矩陣SIMD單元、64KB ECC本地數(shù)據(jù)共享單元、載入/存儲單元、16KB ECC一級緩存等等。

顯然,這一些都是為計算服務(wù)的,而用于圖形的著色器、紋理相關(guān)單元自然都不見了,即便有些單元名字一樣,規(guī)格和作用也不同了。

計算性能方面,F(xiàn)MA64/FP64雙精度為11.5TFlops(每秒1.15億億次),F(xiàn)MA32/FP32單精度為23.1TFlops(每秒2.31億億次),F(xiàn)P32 Matrix單精度矩陣計算為46.1TFlops(每秒4.61億億次),F(xiàn)P16 Matrix半精度矩陣計算為184.6TFlops(每秒18.46億億次),Bfloat16浮點為92.3TFlops(每秒9.23億億次)。

這樣的一塊卡,已經(jīng)相當(dāng)于20年前的世界頂級超級計算機,而體積、功耗都不可同日而語。

對比NVIDIA安培架構(gòu)的最新計算卡A100,AMD也給出了一些對比數(shù)據(jù),F(xiàn)P32單精度性能領(lǐng)先18.5%,F(xiàn)P64雙精度性能領(lǐng)先18.6%,AI與機器學(xué)習(xí)性能更是領(lǐng)先兩倍多,而且功耗低了足足100W。

而對比上代產(chǎn)品MI50,新卡的FP64雙精度、FP32單精度性能均提升74%,F(xiàn)P32矩陣性能提升接近2.5倍,AI負(fù)載性能更是幾乎7倍的飛躍。

當(dāng)然,除了紙面計算性能優(yōu)秀,軟件開發(fā)也必須跟上,尤其是這種計算性的產(chǎn)品。NVIDIA在這方面要強得多,生態(tài)更加穩(wěn)固和豐富,AMD ROCm平臺正在奮起直追中。
責(zé)任編輯:pj

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5669

    瀏覽量

    139429
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39091

    瀏覽量

    299652
  • 人工智能
    +關(guān)注

    關(guān)注

    1814

    文章

    49961

    瀏覽量

    263627
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    福田歐曼銀河全新一代混動重正式發(fā)布

    2025年12月18日,在福田汽車新產(chǎn)品發(fā)布會上,歐曼銀河全新一代混動重正式發(fā)布。此次發(fā)布的混動產(chǎn)品,涵蓋歐曼銀河9/5M/3三款車型,其
    的頭像 發(fā)表于 12-25 16:24 ?666次閱讀

    福田汽車發(fā)布新一代產(chǎn)品Wonder Plus

    在11月9日舉行的福田汽車2026全球合作伙伴大會上,福田汽車正式面向全球市場發(fā)布新一代產(chǎn)品——Wonder Plus。面對全球不同末端配送市場的升級需求,以“超配”的產(chǎn)品理念
    的頭像 發(fā)表于 11-18 09:39 ?478次閱讀

    中科馭數(shù)亮相2025新一代計算產(chǎn)業(yè)大會

    經(jīng)濟時代計算產(chǎn)業(yè)的標(biāo)準(zhǔn)化建設(shè)與技術(shù)創(chuàng)新,不僅發(fā)布核心標(biāo)準(zhǔn)體系,更明確各關(guān)鍵領(lǐng)域的牽頭單位,為我國新一代計算產(chǎn)業(yè)高質(zhì)量發(fā)展奠定堅實基礎(chǔ)。
    的頭像 發(fā)表于 09-26 11:14 ?654次閱讀

    智算融合 標(biāo)準(zhǔn)筑基2025新一代計算產(chǎn)業(yè)大會順利召開

    日,新一代計算產(chǎn)業(yè)大會在北京順利召開。本次大會由中國電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會指導(dǎo),新一代計算標(biāo)準(zhǔn)工作委員會主辦,中科馭數(shù)、Intel、經(jīng)開區(qū)國家信創(chuàng)園共同承辦,
    的頭像 發(fā)表于 09-18 10:47 ?480次閱讀
    智算融合 標(biāo)準(zhǔn)筑基2025<b class='flag-5'>新一代</b><b class='flag-5'>計算</b>產(chǎn)業(yè)大會順利召開

    騰訊發(fā)布新一代智能駕駛地圖9.0

    9月16-17日,2025騰訊全球數(shù)字生態(tài)大會在深圳舉行。會議期間,騰訊正式發(fā)布新一代智能駕駛地圖9.0。
    的頭像 發(fā)表于 09-18 10:23 ?1425次閱讀

    新一代嵌入式開發(fā)平臺 AMD嵌入式軟件和工具2025.1版現(xiàn)已推出

    AMD 2025.1 版嵌入式軟件和工具是面向新一代嵌入式系統(tǒng)開發(fā)而打造的綜合平臺,全面加速概念構(gòu)想到部署落地。 2025.1 版嵌入式軟件和工具的新 增功能 AMD 嵌入式開發(fā)框架( EDF
    的頭像 發(fā)表于 08-20 09:15 ?3838次閱讀

    重磅!AMD將恢復(fù)向中國出口MI308芯片!

    出貨?!?此前美國政府針對Instinct MI308產(chǎn)品出貨至中國進行出口管制,該產(chǎn)品與英偉達H20樣禁止向中國銷售。 ? 如今,MI308也將恢復(fù)供貨,以滿足國內(nèi)AI基礎(chǔ)設(shè)施建設(shè)
    的頭像 發(fā)表于 07-15 20:52 ?3421次閱讀

    德州儀器與庫發(fā)布新一代工業(yè)機器人控制器

    在今年慕尼黑上海電子展期間,德州儀器 (TI) 與美的集團旗下庫(后簡稱“庫”)合作發(fā)布新一代工業(yè)機器人控制器 KR C5 micro
    的頭像 發(fā)表于 04-18 14:34 ?1417次閱讀

    曦智科技全球首發(fā)新一代光電混合計算

    2025年3月25日,曦智科技正式發(fā)布全新光電混合計算“曦智天樞”。曦智科技創(chuàng)始人兼首席執(zhí)行官沈亦晨博士在發(fā)布現(xiàn)場表示:“曦智天樞首次實現(xiàn)
    發(fā)表于 03-25 15:43 ?567次閱讀
    曦智科技全球首發(fā)<b class='flag-5'>新一代</b>光電混合<b class='flag-5'>計算</b><b class='flag-5'>卡</b>

    寶馬發(fā)布新一代智能電子電氣架構(gòu)

    高速數(shù)據(jù)傳輸,為車輛帶來數(shù)字化神經(jīng)系統(tǒng) 慕尼黑2025年3月13日?/美通社/ --?寶馬發(fā)布新一代智能電子電氣架構(gòu),該架構(gòu)是全球首個覆蓋全動力系統(tǒng)和全細(xì)分車型的架構(gòu),該架構(gòu)更智能、更強大、更高效。全新電子電氣架構(gòu)支持AI用戶體驗和場景,
    的頭像 發(fā)表于 03-13 15:42 ?651次閱讀

    新思科技推出基于AMD芯片的新一代原型驗證系統(tǒng)

    近日,新思科技宣布推出全新基于AMD Versal? Premium VP1902自適應(yīng)系統(tǒng)級芯片(SoC)的HAPS?原型驗證系統(tǒng),以此進步升級其硬件輔助驗證(HAV)產(chǎn)品組合。 此次推出的全新一代
    的頭像 發(fā)表于 02-19 17:12 ?1276次閱讀

    武漢昊衡科技發(fā)布新一代OFDR高性能分布式光纖傳感儀:突破100米測量距離與100Hz高頻采樣

    近日,中國武漢——國內(nèi)光學(xué)測量與傳感技術(shù)領(lǐng)軍企業(yè)武漢昊衡科技有限公司(以下簡稱“昊衡科技”)正式發(fā)布新一代OFDR(光頻域反射)高性能分布式光纖傳感儀。該產(chǎn)品在保持超高精度與分辨率的基礎(chǔ)上,實現(xiàn)
    的頭像 發(fā)表于 02-13 18:04 ?1212次閱讀
    武漢昊衡科技<b class='flag-5'>發(fā)布</b><b class='flag-5'>新一代</b>OFDR高性能分布式光纖傳感儀:突破<b class='flag-5'>100</b>米測量距離與<b class='flag-5'>100</b>Hz高頻采樣

    AMD將DeepSeek-V3模型集成至Instinct MI300X GPU

    AMD近日宣布項重要進展,成功將全新的DeepSeek-V3模型集成到其Instinct MI300X GPU上。這
    的頭像 發(fā)表于 02-06 09:41 ?869次閱讀

    消息稱AMD Instinct MI400 AI加速器將配備8個計算芯片

    對比,目前的 MI300 系列加速器中每個 AID 僅包含 2 個加速計算芯片 ,MI400 在芯片數(shù)量上實現(xiàn)翻倍。如此來,
    的頭像 發(fā)表于 02-05 15:07 ?1524次閱讀

    AMD集成DeepSeek-V3模型至Instinct MI300X GPU

    AMD近日宣布項重要的技術(shù)進展,即將全新的DeepSeek-V3模型成功集成到其旗艦級GPU產(chǎn)品——Instinct MI300X上。這
    的頭像 發(fā)表于 02-05 13:58 ?841次閱讀