玛雅精品福利视频在线导航,无遮挡男女裸交

電子發(fā)燒友網(wǎng)報道（文/周凱揚）在不久前結(jié)束的 “加速數(shù)據(jù)中心”發(fā)布會上，AMD正式公開了下一代服務(wù)器CPU Milan-X和GPU加速卡Instinct MI200。這兩大產(chǎn)品系列不僅面向數(shù)據(jù)中心，也將面向一系列HPC和超算應(yīng)用，把通用計算和AI性能推向極致。Instinct MI200作為GPU加速卡，更是成為超級計算機百億億級（Exascale）的算力的基本構(gòu)成單元。

在市場合作上，AMD更是開始了新一輪的攻城略地，前不久剛和騰訊聯(lián)合發(fā)布了星星海服務(wù)器產(chǎn)品后，如今Azure等一眾公有云廠商也開始部署基于Milan-X的服務(wù)器，甚至將剛改名為Meta的Facebook也被拉攏至AMD陣營，宣布將在其數(shù)據(jù)中心部署AMD的服務(wù)器產(chǎn)品。

Milan-X：6nm的大緩存怪獸

繼上一代Milan處理器推出后不到一年，AMD就發(fā)布了該芯片的6nm改進版Milan-X。今年上半年通過融合Chiplet和Die堆疊兩大技術(shù)，在Ryzen桌面處理器上做了3D Chiplet架構(gòu)的演示。如今第三代Epyc處理器Milan-X，將成為首個使用該技術(shù)的服務(wù)器產(chǎn)品。通過在Chiplet上堆疊緩存，Milan-X的L3緩存是Milan的三倍，達到了可怕的768MB。

與英特爾一樣，AMD在正式發(fā)售前并沒有公布Milan-X的具體性能細(xì)節(jié)，而是通過合作伙伴的測試來展示了Milan-X在EDA和公有云應(yīng)用中表現(xiàn)。在新思的VCS功能驗證中，Milan-X在1小時內(nèi)完成了40.6項任務(wù)，而同樣核心數(shù)的Milan僅完成了24.4項。微軟在基于Milan-X的Azure服務(wù)器中進行了早期測試，無論是在航天模擬，還是在汽車碰撞測試建模中，Milan-X都做到了50%以上的性能提升。

除此之外，AMD CEO蘇資豐博士還透露了下一代5nm Epyc處理器Genoa的情報?；赯en 4架構(gòu)的Genoa將具備2倍的晶體管密度和2倍的能效，性能可以達到上一代的1.25倍以上。Genoa最高支持96個Zen 4核心，同時也將加入一系列新標(biāo)準(zhǔn)的支持，比如DDR5、PCIe 5.0和CXL。AMD還將推出基于5nm的Zen 4C核心的處理器Bergamo，專門針對要求多核多線程的云原生計算，最高核心數(shù)將達到128核，晚于Genoa發(fā)布。

Genoa計劃在2022年量產(chǎn)和發(fā)布，屆時很可能就是英特爾的Sapphire Rapids和AMD的Genoa在通用計算領(lǐng)域爭雄了。

Instinct MI200：GPU終于迎來MCM時代了？

除了Milan-X之外，發(fā)布會的最大亮點其實是全球首個MCM GPU，Instinct MI200。同樣基于臺積電的6nm工藝，Instinct MI200系列單芯片的晶體管數(shù)目達到580億，最高集成了220個計算單元。作為首個采用AMD CDNA2架構(gòu)的服務(wù)器GPU，Instinct MI200的目標(biāo)很明確，那就是將計算能力推向ExaScale級。

在CDN2架構(gòu)和第二代HPC&AI專用矩陣核心的支持下，Instinct MI200實現(xiàn)了遠超競品的性能表現(xiàn)。數(shù)據(jù)對比環(huán)節(jié)，AMD選擇拿Nvidia目前最強的A100加速卡開刀。MI250X的FP64向量計算能力達到47.9TF，F(xiàn)P64矩陣計算能力達到95.7TF，均為A100的4.9倍。而在AI領(lǐng)域常用的FP16和BF16矩陣計算中，MI250X的算力也達到了383TF，是A100的1.2倍。即便兩者都用上了HBM2E，MI200的內(nèi)存帶寬也達到了3.2TB/s，遠超A100的2TB/s。不過MI250X的功耗確實要高出不少，峰值狀態(tài)下的功耗可以達到560W，而A100的峰值功耗為300W。

與英特爾這種IDM廠商不同，AMD在封裝上基本吃透了與臺積電合作帶來的技術(shù)紅利，尤其是臺積電的3D Fabric封裝技術(shù)集合，而Instinct MI200則是這些技術(shù)的集大成之作。作為首個采用多Die設(shè)計的GPU，Instinct MI200選用了兩個SoC+8個HBM2E的方案，AMD在發(fā)布會上宣稱這一設(shè)計的實現(xiàn)要歸功于2.5D的Elevated Fanout Bridge（EFB）架構(gòu)。

從圖解上來看，AMD的EFB與臺積電的InFO-L 2.5D封裝技術(shù)可以說是從一個模子里刻出來的。在專門用于HBM集成的方案，目前可以做到這種規(guī)模的異構(gòu)似乎也只有臺積電的InFO-L和CoWoS-L，利用LSI（本地硅互聯(lián)）芯片，為SoC到SoC與SoC到HBM提供高布線密度的互聯(lián)。

其實英特爾也有類似的2.5D封裝方案EMIB，只不過該方案是在基板內(nèi)放入一個硅橋die。而反觀AMD的EFB和臺積電的LSI方案則是將其至于基板的模具中，模具內(nèi)分布著一系列銅柱。相較之下，EMIB雖然可以做到更低的寄生電感，卻也對于基板的加工提出了很高的要求，這也是為何只有英特爾這個基板大廠才使用EMIB的原因之一。不過隨著IDM 2..0模式的展開，英特爾也將公開提供自己的制程、IP和封裝技術(shù)，未來也許會有其他廠商的芯片開始用上EMIB。但目前來看，雖然增加了高度控制的挑戰(zhàn)，但為了使用標(biāo)準(zhǔn)的基板降低成本，EFB和LSI明顯是最優(yōu)解。

在外觀尺寸上，AMD選擇了OAM和PCIe兩種形式。OAM為開放計算項目（OCP）定下的通用加速器模組標(biāo)準(zhǔn)，對于想要規(guī)?；渴餑PU或其他加速器來說，OAM可以提供更大的帶寬。作為Facebook和微軟共同推行的公開標(biāo)準(zhǔn)，OAM已經(jīng)在服務(wù)器領(lǐng)域有了不小的規(guī)模，不僅是英特爾、AMD和英偉達這些半導(dǎo)體廠商，浪潮、聯(lián)想、百度和阿里巴巴等其他服務(wù)器與公有云廠商也開始支持這一標(biāo)準(zhǔn)。

目前OAM的MI250和MI250X已經(jīng)進入可交付階段，從今年第三季度起，AMD就已經(jīng)在為美國能源部的橡樹嶺國家實驗室持續(xù)交付MI250X GPU了，用于組成美國首個ExaScale級別的超級計算機Frontier。除了OAM模組外，AMD也將在不久提供PCIe版本的MI210，用于非密集運算的場景。

結(jié)語

隨著英特爾、三星和臺積電在2.5D/3D封裝技術(shù)上的逐漸成熟，服務(wù)器芯片將成為受益最大的產(chǎn)品，未來2+8甚至3+8的MCM GPU可能更加常見。英偉達、AMD與英特爾三家在服務(wù)器/數(shù)據(jù)中心市場上的動向，也側(cè)面體現(xiàn)了IDM與Fabless廠商之間在技術(shù)選擇上的差異。英特爾如果不能盡快在制程和封裝上超越臺積電這樣的晶圓代工廠，在服務(wù)器市場的優(yōu)勢可能會越來越小。

聲明：本文由電子發(fā)燒友原創(chuàng)，轉(zhuǎn)載請注明以上來源。如需入群交流，請?zhí)砑游⑿舉lecfans999，投稿爆料采訪需求，請發(fā)郵箱huangjingjing@elecfans.com。

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴