昨日晚間,AMD正式發(fā)布了新一代Instinct MI100計(jì)算卡,首次采用針對HPC高性能計(jì)算、AI人工智能全新設(shè)計(jì)的CDNA架構(gòu),和游戲向的RDNA架構(gòu)截然不同。
Instinct MI100計(jì)算卡采用臺(tái)積電7nm工藝制造,集成120個(gè)計(jì)算單元、7680個(gè)流處理器,核心頻率最高1502MHz,并專門加入了Matrix Core(矩陣核心),用于加速HPC、AI運(yùn)算。
它整合封裝了32GB HBM2顯存,位寬4096-bit,頻率1.2GHz,帶寬1228.8GB/s,支持ECC。
該卡支持PCIe 4.0 x16,具備三條Infinity Fabric互連總線,峰值帶寬92GB/s,整卡熱設(shè)計(jì)功耗300W,雙8針輔助供電。
這塊卡的特殊之處還在于頂部設(shè)置了橋接金手指,通過橋接器可以將四塊卡綁定在一起,而搭配雙路的AMD霄龍?zhí)幚砥?,可以?shí)現(xiàn)八卡并行。
類似之前的計(jì)算卡,甚至是R9 Fury X、Vega 64/56這樣的游戲卡,Instinct MI110也是將GPU芯片、HBM芯片整合封裝在了一起,不過如今的HBM2單顆容量已達(dá)8GB。
對比CDNA(上)、RDNA(下)架構(gòu)圖,可以發(fā)現(xiàn)二者整體框架有些相似之處,但各種單元模塊和布局已經(jīng)截然不同。
Infinity Fabric互連總線、顯存控制器、PCIe 4.0控制器、多媒體引擎、著色器引擎、ACE異步計(jì)算引擎等等都還在(當(dāng)然也不完全一樣了),而和圖形渲染輸出相關(guān)的都沒了,比如圖形指令處理器、幾何處理器、光柵器、顯示引擎、原語單元等等,同時(shí)增加了XGMI連接控制器用于多卡互連,一二級(jí)緩存也完全不同。
作為AMD GPU的最基本模塊,計(jì)算單元(CU)也完全不同了,現(xiàn)在叫做增強(qiáng)型計(jì)算單元(XCU),組成模塊包括調(diào)度器、分支與信息單元、12.8KB ECC標(biāo)量單元、512KB ECC標(biāo)量寄存器、矢量寄存器、矢量ALU操作單元、矩陣數(shù)據(jù)操作單元、四個(gè)矢量/矩陣SIMD單元、64KB ECC本地?cái)?shù)據(jù)共享單元、載入/存儲(chǔ)單元、16KB ECC一級(jí)緩存等等。
顯然,這一些都是為計(jì)算服務(wù)的,而用于圖形的著色器、紋理相關(guān)單元自然都不見了,即便有些單元名字一樣,規(guī)格和作用也不同了。
計(jì)算性能方面,F(xiàn)MA64/FP64雙精度為11.5TFlops(每秒1.15億億次),F(xiàn)MA32/FP32單精度為23.1TFlops(每秒2.31億億次),F(xiàn)P32 Matrix單精度矩陣計(jì)算為46.1TFlops(每秒4.61億億次),F(xiàn)P16 Matrix半精度矩陣計(jì)算為184.6TFlops(每秒18.46億億次),Bfloat16浮點(diǎn)為92.3TFlops(每秒9.23億億次)。
這樣的一塊卡,已經(jīng)相當(dāng)于20年前的世界頂級(jí)超級(jí)計(jì)算機(jī),而體積、功耗都不可同日而語。
對比NVIDIA安培架構(gòu)的最新計(jì)算卡A100,AMD也給出了一些對比數(shù)據(jù),F(xiàn)P32單精度性能領(lǐng)先18.5%,F(xiàn)P64雙精度性能領(lǐng)先18.6%,AI與機(jī)器學(xué)習(xí)性能更是領(lǐng)先兩倍多,而且功耗低了足足100W。
而對比上代產(chǎn)品MI50,新卡的FP64雙精度、FP32單精度性能均提升74%,F(xiàn)P32矩陣性能提升接近2.5倍,AI負(fù)載性能更是幾乎7倍的飛躍。
當(dāng)然,除了紙面計(jì)算性能優(yōu)秀,軟件開發(fā)也必須跟上,尤其是這種計(jì)算性的產(chǎn)品。NVIDIA在這方面要強(qiáng)得多,生態(tài)更加穩(wěn)固和豐富,AMD ROCm平臺(tái)正在奮起直追中。
責(zé)任編輯:pj
-
amd
+關(guān)注
關(guān)注
25文章
5624瀏覽量
138408 -
AI
+關(guān)注
關(guān)注
88文章
37013瀏覽量
290046 -
人工智能
+關(guān)注
關(guān)注
1811文章
49498瀏覽量
258197
發(fā)布評(píng)論請先 登錄
中科馭數(shù)亮相2025新一代計(jì)算產(chǎn)業(yè)大會(huì)
騰訊發(fā)布全新一代智能駕駛地圖9.0
重磅!AMD將恢復(fù)向中國出口MI308芯片!
德州儀器與庫卡發(fā)布新一代工業(yè)機(jī)器人控制器
曦智科技全球首發(fā)新一代光電混合計(jì)算卡

評(píng)論