chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD兩大高性能 AI 芯片正式出貨,劍指英偉達(dá) H100

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚 ? 2023-12-08 00:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/周凱揚)近日 AMD 舉辦了Advancing AI大會,除了發(fā)布全新的銳龍 8040系列 AI PC 芯片以外,也終于宣布了 MI300X GPU以及 MI300A APU這兩大 AI 計算重磅新品的出貨。

頂級 AI 計算 GPU MI300X

作為全新 CDNA3架構(gòu)打造的 AI 加速器,MI300X 的配置可謂豪華,8 組 XCD 共 304 個 CDNA 單元,加上帶寬高達(dá) 5.3TB/s 的 192GB顯存。相對上一代 MI250X 而言,計算單元多了接近 40%,內(nèi)存容量增至 1.5 倍,理論帶寬更是提升至 1.7 倍,同時引入了對 FP8和稀疏計算的支持。

AMD 也在實際用例上與英偉達(dá)的 H100 進行了對比,在運行 1760億參數(shù)的 BLOOM 大語言模型推理時,其吞吐量可達(dá)后者的 1.6 倍。且單塊 MI300X就能運行像 Llama2 這樣 700 億參數(shù)的大模型,簡化了企業(yè)級 LLM 部署的同時,提供了極致的 TCO 性價比。

首個數(shù)據(jù)中心 APU 出爐

隨著英偉達(dá)開始針對數(shù)據(jù)中心推出 Grace Hopper Superchip 這樣的 CPU+GPU 打包方案,AMD 這個早在消費級產(chǎn)品上這么干的公司自然也察覺到了個中機遇。于是在本次大會上,AMD 終于宣布首個數(shù)據(jù)中心 APU,MI300A開始出貨。

在 3D 封裝技術(shù)和 AMD Infinity 架構(gòu)的支持下,MI300A將 CDNA 3架構(gòu)的 GPU 核心、Zen 4 架構(gòu)的 CPU 核心以及 128GB 的 HBM3 內(nèi)存集成在一起。同樣是與 MI250X相比,其在HPC和 AI 負(fù)載的 FP32計算上,能耗比近乎翻倍。

得益于統(tǒng)一的內(nèi)存和緩存,CPU、GPU 與 HBM 之間的數(shù)據(jù)傳輸延遲大大降低,且均可享受超大的帶寬,無論是在極限性能還是在功耗分配上,都能提供好于獨立方案的表現(xiàn)。

軟件同樣迎來大幅升級

而此次 Advancing AI大會上,AMD不僅對硬件進行了更新,也對其軟件進行了更新,RoCm 這一并行計算框架迎來了第六版,這一版本主要對 AMD 的 Instinct 系列 GPU在生成式 AI 的大語言模型上進行了優(yōu)化。

作為 AMD 對英偉達(dá)的 CUDA 做出的對策方案,ROCm這幾年來已經(jīng)逐步完善,甚至可以說在開發(fā)支持程度上毫不遜色于 CUDA。此次更新不僅增加對新數(shù)據(jù)類型的支持,還引入了高級圖形和內(nèi)核優(yōu)化、庫優(yōu)化以及最先進的注意力機制算法。以文本生成這一任務(wù)為例,與在 MI250 上運行的 ROCm 5 相比,性能提升顯著,總體延遲改善了 8 倍左右。

更重要的是,這次 OpenAI 也來摻了一腳,OpenAI 宣布他們會在 Triton 3.0 上加入對 AMD Instinct 的支持。Triton是一個類Python 的開源編程語言,允許開發(fā)者在沒有 CUDA 開發(fā)經(jīng)驗的情況下也能寫出高效的 GPU 代碼,可以視為 CUDA 的精簡版。而在最新的Triton 3.0,可以說 AMD 的Instinct硬件平臺獲得了開箱即用的支持。

其實這次合作早有預(yù)示,幾個月前Triton就開始合并 ROCm 的代碼,此前也宣布過增加AMD Instinct以及英特爾XPU 的支持。不過目前 Instinct平臺的ROCm 還是以 Linux 開發(fā)為重點,Radeon 平臺的ROCm 則主要集中在對 Windows 的支持上。

寫在最后

這次Advancing AI大會象征了 AMD 對 明年 AI 市場的野心,也難怪 AMD 會將今年數(shù)據(jù)中心 AI 芯片的市場規(guī)模從 6 月份的 300 億美元提高至 450 億美元。未來的MI300X很有可能成為英偉達(dá) H100 最強勁的對手,也有可能成為云服務(wù)廠商競相追逐的新計算卡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5647

    瀏覽量

    139029
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38121

    瀏覽量

    296693
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    性能狂飆!AMD新品叫板英偉達(dá)GB200,角逐5000億AI加速器賽道

    AMD線上會議截圖 本次大會上,蘇姿豐重點宣布了MI350 系列和 MI400 系列 AI 芯片的強大性能,她表示這些芯片將與
    的頭像 發(fā)表于 06-14 00:44 ?6225次閱讀
    <b class='flag-5'>性能</b>狂飆!<b class='flag-5'>AMD</b>新品叫板<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GB200,角逐5000億<b class='flag-5'>AI</b>加速器賽道

    英偉達(dá) Q3 狂攬 308 億

    廠商季度合計 500 億美元資本支出中,約 30% 流向了英偉達(dá)。 新一代 Blackwell 芯片已全面投產(chǎn),Q3 交付 1.3 萬個 GPU 樣品,H200 GPU 理論
    的頭像 發(fā)表于 11-20 18:11 ?1060次閱讀

    英偉達(dá) H100 GPU 掉卡?做好這五點,讓算力穩(wěn)如泰山!

    H100服務(wù)器停工一天損失的算力成本可能比維修費還高。今天,我們給大家總結(jié)一套“防掉卡秘籍”,從日常管理到環(huán)境把控,手把手教你把掉卡風(fēng)險壓到最低。一、供電是“生命線”,這3點必須盯緊H100滿載功耗
    的頭像 發(fā)表于 09-05 11:03 ?716次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> <b class='flag-5'>H100</b> GPU 掉卡?做好這五點,讓算力穩(wěn)如泰山!

    英偉達(dá)被傳暫停生產(chǎn)H20芯片 外交部回應(yīng)

    韓國三星電子、美國安靠科技、富士康等關(guān)鍵零部件供應(yīng)商。 據(jù)悉,美國安靠科技(Amkor)負(fù)責(zé)H20芯片的封裝,而三星電子負(fù)責(zé)提供高帶寬的內(nèi)存芯片。 業(yè)界人士分析稱,一方面英偉
    的頭像 發(fā)表于 08-22 15:58 ?2574次閱讀

    外媒:英偉達(dá)正開發(fā)新款中國特供芯片B30A 或為旗艦AI芯品B300的閹割版

    我們看到英偉達(dá)的旗艦新品 B300備受關(guān)注;但是受限于美國實施出口限制措施,英偉達(dá)不會出貨,就像此前英偉
    的頭像 發(fā)表于 08-20 15:19 ?3119次閱讀
    外媒:<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>正開發(fā)新款中國特供<b class='flag-5'>芯片</b>B30A 或為旗艦<b class='flag-5'>AI</b>芯品B300的閹割版

    H20中國區(qū)賣爆!英偉達(dá)緊急向臺積電加訂30萬塊

    性能上相當(dāng)于英偉達(dá)另一款主流GPU芯片H100的20%左右。 ? 盡管如此,在美國解禁對H20
    的頭像 發(fā)表于 07-30 08:08 ?3007次閱讀

    中方回應(yīng)英偉達(dá)將對華銷售H20芯片 反對將科技和經(jīng)貿(mào)問題政治化

    對于英偉達(dá)將對華銷售H20芯片我們怎么回應(yīng)的?來看看外交部發(fā)言人的表述。 在15日的例行記者會上,有記者就英偉
    的頭像 發(fā)表于 07-15 16:22 ?2043次閱讀

    剛剛,英偉達(dá)任命位新首席研究科學(xué)家!95 后,本科均來自清華

    ABSTRACT摘要英偉達(dá)黃仁勛親自招攬位95后華人AI大牛加入英偉達(dá),為加速
    的頭像 發(fā)表于 07-01 18:06 ?1493次閱讀
    剛剛,<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>任命<b class='flag-5'>兩</b>位新首席研究科學(xué)家!95 后,本科均來自清華

    今日看點丨英偉達(dá)將為中國市場推出新AI芯片 售價大幅低于H20;中科曙光與海光信息宣布戰(zhàn)略重組

    1. 英偉達(dá)將為中國市場推出新AI 芯片 售價大幅低于H20 ? 近日,外媒報道稱,美國芯片巨頭
    發(fā)表于 05-26 11:06 ?1576次閱讀

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見故障有哪些?

    上漲,英偉達(dá)H100GPU憑借其強大的算力,成為AI訓(xùn)練、高性能計算領(lǐng)域的核心硬件。然而,隨著使用場景的復(fù)雜化,
    的頭像 發(fā)表于 05-05 09:03 ?2464次閱讀
    GPU 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> GPU <b class='flag-5'>H100</b> 常見故障有哪些?

    特朗普要叫停英偉達(dá)對華特供版 英偉達(dá)H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉達(dá)公司為符合美國出口規(guī)定專門為中國市場開發(fā)的定制芯片,H20芯片
    的頭像 發(fā)表于 04-16 16:59 ?1890次閱讀

    英偉達(dá)殺瘋了!Blackwell橫掃市場,AMD、英特爾加入降本浪潮

    。與此同時,隨著AI大模型的普及,高計算量需求和成本壓力也成為行業(yè)關(guān)注的焦點。如何在性能與成本之間找到平衡,成為整個AI芯片行業(yè)共同面臨的挑戰(zhàn)。AI
    的頭像 發(fā)表于 03-02 00:02 ?2416次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>殺瘋了!Blackwell橫掃市場,<b class='flag-5'>AMD</b>、英特爾加入降本浪潮

    英偉達(dá)A100H100比較

    英偉達(dá)A100H100都是針對高性能計算和人工智能任務(wù)設(shè)計的GPU,但在性能和特性上存在顯著差
    的頭像 發(fā)表于 02-10 17:05 ?1.1w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>A<b class='flag-5'>100</b>和<b class='flag-5'>H100</b>比較

    荷蘭與英偉達(dá)、AMD商討AI設(shè)施建設(shè)

    近日,荷蘭政府在其官方網(wǎng)站上發(fā)布消息稱,荷蘭經(jīng)濟事務(wù)大臣迪爾克·貝爾亞爾茨在訪問硅谷期間,與英偉達(dá)AMD兩大科技公司進行了深入的戰(zhàn)略討論。此次訪問時間為1月8日至1月9日,旨在探討如
    的頭像 發(fā)表于 01-13 10:06 ?697次閱讀

    英偉達(dá)收購AI初創(chuàng)公司Run:ai

    :ai作為一家專注于AI云計算軟件平臺開發(fā)的初創(chuàng)公司,其產(chǎn)品以高效利用高性能GPU資源為核心,致力于為用戶提供更快速、更便捷的機器學(xué)習(xí)加速方案。通過此次收購,英偉
    的頭像 發(fā)表于 12-31 10:46 ?866次閱讀