chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD兩大高性能 AI 芯片正式出貨,劍指英偉達(dá) H100

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2023-12-08 00:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)近日 AMD 舉辦了Advancing AI大會,除了發(fā)布全新的銳龍 8040系列 AI PC 芯片以外,也終于宣布了 MI300X GPU以及 MI300A APU這兩大 AI 計算重磅新品的出貨。

頂級 AI 計算 GPU MI300X

作為全新 CDNA3架構(gòu)打造的 AI 加速器,MI300X 的配置可謂豪華,8 組 XCD 共 304 個 CDNA 單元,加上帶寬高達(dá) 5.3TB/s 的 192GB顯存。相對上一代 MI250X 而言,計算單元多了接近 40%,內(nèi)存容量增至 1.5 倍,理論帶寬更是提升至 1.7 倍,同時引入了對 FP8和稀疏計算的支持。

AMD 也在實際用例上與英偉達(dá)的 H100 進(jìn)行了對比,在運行 1760億參數(shù)的 BLOOM 大語言模型推理時,其吞吐量可達(dá)后者的 1.6 倍。且單塊 MI300X就能運行像 Llama2 這樣 700 億參數(shù)的大模型,簡化了企業(yè)級 LLM 部署的同時,提供了極致的 TCO 性價比。

首個數(shù)據(jù)中心 APU 出爐

隨著英偉達(dá)開始針對數(shù)據(jù)中心推出 Grace Hopper Superchip 這樣的 CPU+GPU 打包方案,AMD 這個早在消費級產(chǎn)品上這么干的公司自然也察覺到了個中機(jī)遇。于是在本次大會上,AMD 終于宣布首個數(shù)據(jù)中心 APU,MI300A開始出貨。

在 3D 封裝技術(shù)和 AMD Infinity 架構(gòu)的支持下,MI300A將 CDNA 3架構(gòu)的 GPU 核心、Zen 4 架構(gòu)的 CPU 核心以及 128GB 的 HBM3 內(nèi)存集成在一起。同樣是與 MI250X相比,其在HPC和 AI 負(fù)載的 FP32計算上,能耗比近乎翻倍。

得益于統(tǒng)一的內(nèi)存和緩存,CPU、GPU 與 HBM 之間的數(shù)據(jù)傳輸延遲大大降低,且均可享受超大的帶寬,無論是在極限性能還是在功耗分配上,都能提供好于獨立方案的表現(xiàn)。

軟件同樣迎來大幅升級

而此次 Advancing AI大會上,AMD不僅對硬件進(jìn)行了更新,也對其軟件進(jìn)行了更新,RoCm 這一并行計算框架迎來了第六版,這一版本主要對 AMD 的 Instinct 系列 GPU在生成式 AI 的大語言模型上進(jìn)行了優(yōu)化。

作為 AMD 對英偉達(dá)的 CUDA 做出的對策方案,ROCm這幾年來已經(jīng)逐步完善,甚至可以說在開發(fā)支持程度上毫不遜色于 CUDA。此次更新不僅增加對新數(shù)據(jù)類型的支持,還引入了高級圖形和內(nèi)核優(yōu)化、庫優(yōu)化以及最先進(jìn)的注意力機(jī)制算法。以文本生成這一任務(wù)為例,與在 MI250 上運行的 ROCm 5 相比,性能提升顯著,總體延遲改善了 8 倍左右。

更重要的是,這次 OpenAI 也來摻了一腳,OpenAI 宣布他們會在 Triton 3.0 上加入對 AMD Instinct 的支持。Triton是一個類Python 的開源編程語言,允許開發(fā)者在沒有 CUDA 開發(fā)經(jīng)驗的情況下也能寫出高效的 GPU 代碼,可以視為 CUDA 的精簡版。而在最新的Triton 3.0,可以說 AMD 的Instinct硬件平臺獲得了開箱即用的支持。

其實這次合作早有預(yù)示,幾個月前Triton就開始合并 ROCm 的代碼,此前也宣布過增加AMD Instinct以及英特爾XPU 的支持。不過目前 Instinct平臺的ROCm 還是以 Linux 開發(fā)為重點,Radeon 平臺的ROCm 則主要集中在對 Windows 的支持上。

寫在最后

這次Advancing AI大會象征了 AMD 對 明年 AI 市場的野心,也難怪 AMD 會將今年數(shù)據(jù)中心 AI 芯片的市場規(guī)模從 6 月份的 300 億美元提高至 450 億美元。未來的MI300X很有可能成為英偉達(dá) H100 最強(qiáng)勁的對手,也有可能成為云服務(wù)廠商競相追逐的新計算卡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5586

    瀏覽量

    136332
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35109

    瀏覽量

    279603
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    性能狂飆!AMD新品叫板英偉達(dá)GB200,角逐5000億AI加速器賽道

    AMD線上會議截圖 本次大會上,蘇姿豐重點宣布了MI350 系列和 MI400 系列 AI 芯片的強(qiáng)大性能,她表示這些芯片將與
    的頭像 發(fā)表于 06-14 00:44 ?5587次閱讀
    <b class='flag-5'>性能</b>狂飆!<b class='flag-5'>AMD</b>新品叫板<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GB200,角逐5000億<b class='flag-5'>AI</b>加速器賽道

    AMD最強(qiáng)AI芯片性能強(qiáng)過英偉達(dá)H200,但市場仍不買賬,生態(tài)是最大短板?

    顯示,該芯片多項性能優(yōu)于英偉達(dá)H200。 ? 不過,對于AMD一系列的產(chǎn)品發(fā)布,市場方面似乎并不
    的頭像 發(fā)表于 10-14 01:32 ?4306次閱讀
    <b class='flag-5'>AMD</b>最強(qiáng)<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>,<b class='flag-5'>性能</b>強(qiáng)過<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b><b class='flag-5'>H</b>200,但市場仍不買賬,生態(tài)是最大短板?

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見故障有哪些?

    上漲,英偉達(dá)H100GPU憑借其強(qiáng)大的算力,成為AI訓(xùn)練、高性能計算領(lǐng)域的核心硬件。然而,隨著使用場景的復(fù)雜化,
    的頭像 發(fā)表于 05-05 09:03 ?966次閱讀
    GPU 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> GPU <b class='flag-5'>H100</b> 常見故障有哪些?

    特朗普要叫停英偉達(dá)對華特供版 英偉達(dá)H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉達(dá)公司為符合美國出口規(guī)定專門為中國市場開發(fā)的定制芯片,H20芯片
    的頭像 發(fā)表于 04-16 16:59 ?1310次閱讀

    英偉達(dá)A100H100比較

    英偉達(dá)A100H100都是針對高性能計算和人工智能任務(wù)設(shè)計的GPU,但在性能和特性上存在顯著差
    的頭像 發(fā)表于 02-10 17:05 ?4344次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>A<b class='flag-5'>100</b>和<b class='flag-5'>H100</b>比較

    英偉達(dá)H100芯片市場降溫

    隨著英偉達(dá)新一代AI芯片GB200需求的不斷攀升,其上一代明星產(chǎn)品H100芯片卻遭遇了市場的冷落
    的頭像 發(fā)表于 10-28 15:42 ?1611次閱讀

    AMD發(fā)布英偉達(dá)競品AI芯片,預(yù)期市場規(guī)模將大幅增長

    10月11日,AMD英偉達(dá)主導(dǎo)的AI算力市場中舉辦了一場人工智能主題發(fā)布會,推出了包括MI325X算力芯片在內(nèi)的一系列新品。然而,市場對此
    的頭像 發(fā)表于 10-11 16:25 ?1034次閱讀

    英偉達(dá)Blackwell芯片量產(chǎn)加速,Q4預(yù)計出貨達(dá)45萬片

    摩根士丹利最新發(fā)布的報告揭示了英偉達(dá)AI芯片領(lǐng)域的重大進(jìn)展,其最新力作Blackwell芯片已成功步入量產(chǎn)階段,預(yù)示著
    的頭像 發(fā)表于 09-27 15:02 ?1269次閱讀

    韓國AI芯片巨頭合并,英偉達(dá)龍頭地位

    韓國兩大AI芯片領(lǐng)域的初創(chuàng)企業(yè)——SK電信旗下的Sapeon Korea與KT投資的Rebellions,近日宣布了一項重大合并計劃,預(yù)計將于2024年底正式完成這一戰(zhàn)略整合。此次合并預(yù)計將為新成立
    的頭像 發(fā)表于 08-21 16:29 ?985次閱讀

    英偉達(dá)或取消B100轉(zhuǎn)用B200A代替

    今年3月份,英偉達(dá)在美國加利福尼亞州圣何塞會議中心召開的GTC 2024大會上推出了Blackwell架構(gòu)GPU。原定于今年底出貨的B100/B200被寄予厚望,將替代現(xiàn)行
    的頭像 發(fā)表于 08-08 17:19 ?997次閱讀

    英偉達(dá)AI芯片推遲出貨,股價跌破100美元

    英偉達(dá)與臺積電合作的下一代人工智能芯片Blackwell系列正面臨生產(chǎn)難題,原定的出貨計劃或?qū)⒋蠓七t。這款備受期待的芯片因設(shè)計問題,在臺積
    的頭像 發(fā)表于 08-08 15:47 ?919次閱讀

    AMD MI350挑戰(zhàn)英偉達(dá)Blackwell,AI投資持續(xù)強(qiáng)勁

    AMD首席執(zhí)行官蘇姿豐(Lisa Su)近日宣布,公司即將推出的MI350芯片將直接與英偉達(dá)的Blackwell架構(gòu)芯片展開激烈競爭,標(biāo)志著
    的頭像 發(fā)表于 08-05 11:27 ?919次閱讀

    英偉達(dá)TITAN AI顯卡曝光,性能狂超RTX 4090達(dá)63%!# 英偉達(dá)# 顯卡

    顯卡英偉達(dá)
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    英偉達(dá)帶領(lǐng)芯片股飆升 英偉達(dá)大漲4.76%

    1.08%,道指漲0.32%。 AI浪潮之下,業(yè)界預(yù)期正不斷加強(qiáng),在AI算力需求的邊際拉動下、疊加消費電子復(fù)蘇,新一輪終端AI上新,相關(guān)行業(yè)正迎來具備較強(qiáng)持續(xù)性的上行周期;英偉
    的頭像 發(fā)表于 07-23 16:26 ?626次閱讀

    英偉達(dá)AI芯片市場還能領(lǐng)先多久?

    7月22日,國際媒體傳來消息,英偉達(dá)在近年來興起的生成式人工智能浪潮中脫穎而出,其高性能計算芯片H100等廣受業(yè)界青睞,推動了公司營收與利
    的頭像 發(fā)表于 07-22 16:18 ?988次閱讀