chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

全球GPU呈現(xiàn)“一超一強”競爭格局

智能計算芯世界 ? 來源:智能計算芯世界 ? 2023-08-14 11:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI 服務器發(fā)展迅速,GPU 環(huán)節(jié)被英偉達AMD 所占據(jù)。AIGC 的發(fā)展帶動AI 服務器迅速增長,TrendForce 集邦咨詢預計 23 年 AI 服務器出貨量約 120 萬臺,同比+38.4%,占整體服務器出貨量的比約為9%,2022~2026 年 AI 服務器出貨量 CAGR 將達 22%,而 AI 芯片 2023 年出貨量將成長 46%。GPU 作為數(shù)據(jù)并行處理的核心,是 AI 服務器的核心增量。

本文來自“行業(yè)專題:GPU龍頭產(chǎn)品迭代不斷,產(chǎn)業(yè)鏈各環(huán)節(jié)持續(xù)催化”,全球GPU呈現(xiàn)“一超一強”的競爭格局,根據(jù) IDC 數(shù)據(jù),2021 英偉達在企業(yè)級 GPU 市場中占比 91.4%,AMD 占比 8.5%。

587f6182-3a33-11ee-9e74-dac502259ad0.png

目前英偉達產(chǎn)品 DGX GH200 已發(fā)布,互連技術強大,算力進一步升級。5月 29 日,英偉達在其發(fā)布會上,正式發(fā)布最新的 GH200 Grace Hopper 超級芯片,以及擁有 256 個 GH200 超級芯片的 NVIDIA DGX GH200 超級計算機。

GH200超級芯片內(nèi)部集成了 Grace CPU 和 H100 GPU,晶體管數(shù)量達 2000 億個。其借助 NVIDIA NVLink-C2C 芯片互連,將英偉達 Grace CPU 與英偉達 H100 TensorCore GPU 整合。與 PCIe Gen5 技術相比,其 GPU 和 CPU 之間的帶寬將提高 7倍,并將互連功耗減少至 1/5 以下。同時,DGX GH200 的 AI 性能算力將達到1exaFLOPS。

58ae3d36-3a33-11ee-9e74-dac502259ad0.png

英偉達產(chǎn)品 DGX GH200 共享內(nèi)存大幅提升,突破內(nèi)存瓶頸。DGX GH200系統(tǒng)將 256 個 GH200 超級芯片與 144TB 的共享內(nèi)存進行連接,進一步提高系統(tǒng)協(xié)同性。與 DGX H100 相比,DGX GH200 的共享內(nèi)存提升約 230 倍。憑借強大的共享內(nèi)存,GH200 能夠顯著改善受 GPU 內(nèi)存大小瓶頸影響的 AI 和 HPC 應用程序的性能。而在具有 tb 級嵌入式表的深度學習推薦模型(DLRM)、tb 級圖神經(jīng)網(wǎng)絡訓練模型或大型數(shù)據(jù)分析工作負載中,使用 DGX GH200 可將速度提高4到7倍。

而 AMD 在美國時間 2023 年 6 月 13 日,推出其新款 AI 芯片 MI300 系列,兩款芯片分別為 MI300A 與 MI300X,分別集成 1460、1530 億個晶體管。MI300A內(nèi)含 13 個小芯片,總共集成 1460 億個晶體管,其內(nèi)部包含 24 個 Zen 4 CPU 核心、1 個 CDNA 3 圖形引擎和 128GB HBM3 內(nèi)存;而 MI300X 是針對大預言模型的優(yōu)化版本,其內(nèi)存達 192GB,內(nèi)存帶寬為 5.2TB/s,Infinity Fabric 帶寬為896GB/s,晶體管達 1530 億個。AMD 表示,與上代 MI 250 相比,MI300 的 AI性能和每瓦性能分別為 MI250 的 8 倍和 5 倍。

58d657bc-3a33-11ee-9e74-dac502259ad0.png

應用先進封裝 Chiplet 技術與 HBM3,工藝技術驅(qū)動產(chǎn)品升級。在以往 CPU、GPU 設計中,AMD 常利用其先進的封裝堆疊技術,集成多個小核心,從而實現(xiàn)整體性能的提升。根據(jù)芯智訊,MI300 由 13 個小芯片整合而成,其中其計算部分由 9 個基于臺積電 5nm 工藝制程的小芯片組成,這些小芯片包括了 CPU 和 GPU內(nèi)核。3D 堆疊設計極大提升了 MI 300 的性能與數(shù)據(jù)吞吐量。同時,MI300 兩側(cè)排列著 8 個合計 128GB 的 HBM3 芯片,滿足其海量且高速的數(shù)據(jù)存儲需求。

5917d570-3a33-11ee-9e74-dac502259ad0.png

AI 大模型等 AIGC 產(chǎn)業(yè)的升級離不開算力的底層支持,使得 GPU 等大算力芯片性能持續(xù)提升,帶來產(chǎn)業(yè)鏈各環(huán)節(jié)增量。以英偉達 DGX H100 為例,其在GPU、互連技術、智能網(wǎng)卡、內(nèi)存條、硬盤等結(jié)構(gòu)上均較普通服務器有較大提升,同時其 PCB 的面積需求量與性能要求亦高于普通服務器。

5980884a-3a33-11ee-9e74-dac502259ad0.png

(1)GPU:量價齊升,產(chǎn)業(yè)鏈最大增量。一般的普通服務器僅會配備單卡或雙卡,而 AI 服務器由于需要承擔大量的計算,一般配置四塊或以上的 GPU。且AI大模型在訓練與推理時的計算量巨大,中低端的GPU無法滿足其運算需求。如在英偉達 DGX H100 中,其配備 8 個 NVIDIA H100 GPU,總 GPU 顯存高達640GB;每個GPU配備18個NVIDIA NVLink,GPU之間的雙向帶寬高達900GB/s。若以每個 NVIDIA H100 GPU 單價 4 萬美元測算,DGX H100 的 GPU 價值量為32 萬美元,為 AI 服務器中的最大增量。

59d3954e-3a33-11ee-9e74-dac502259ad0.png

(2)硬盤:AI 服務器 NAND 數(shù)據(jù)存儲需求提升 3 倍。AI 服務器的高吞吐量及訓練模型的高參數(shù)量級亦推升 NAND 數(shù)據(jù)存儲需求。美光估計,AI 服務器中NAND 需求量是傳統(tǒng)服務器的 3 倍。一臺 DGX H100 中,SSD 的存儲容量達 30TB。

(3)內(nèi)存:AI 服務器 DRAM 數(shù)據(jù)存儲需求提升 8 倍,HBM 需求快速提升。以 HBM 為主要代表的存算一體芯片能夠通過 2.5D/3D 堆疊,將多個存儲芯片與處理器芯片封裝在一起,克服單一封裝內(nèi)帶寬的限制、增加帶寬、擴展內(nèi)存容量、并減少數(shù)據(jù)存儲的延遲。根據(jù)公眾號全球 SSD,三星 2021 年 2 月與 AMD 合作開發(fā) HBM-PIM,將內(nèi)存和 AI 處理器合而為一,在 CPU 和 GPU 安裝 HBM-PIM,顯著提高服務器運算速度。2023 年開年后,三星高帶寬存儲器(HBM)訂單快速增加。SK 海力士亦在 2021 年 10 月成功開發(fā)出 HBM3,并于 2022 年 6 月開始量產(chǎn),在 2022 年第三季度向英偉達進行供貨。同時,美光估計,AI 服務器中 DRAM需求量是傳統(tǒng)服務器的 8 倍。如在一臺 DGX H100 中,內(nèi)存容量達 2TB。

5a29d9c2-3a33-11ee-9e74-dac502259ad0.png

(4)PCB:AI 服務器 PCB 明確受益 AI 算力提升。目前普通服務器需要 6-16層板和封裝基板,而 AI 服務器等高端服務器主板層數(shù)則達 16 層以上,背板層數(shù)超過 20 層。且除 GPU 外,服務器中主板、電源背板、硬盤背板、網(wǎng)卡、Riser卡等核心部分均需使用 PCB 板進行數(shù)據(jù)傳輸。服務器出貨量的增加將推動 PCB需求量的提升。

5a6da7c4-3a33-11ee-9e74-dac502259ad0.png

(5)先進封裝:高制程芯片設計成本與制造成本均呈現(xiàn)指數(shù)型的增長趨勢,Chiplet 等先進封裝應運而生。隨著制程的提升,芯片成本的提升呈現(xiàn)指數(shù)型增長。以芯片設計為例,根據(jù) UCIE 白皮書,28nm 制程的芯片設計成本約 0.51 億美元,但當制程提升至 5nm 時,芯片設計成本則快速升至 5.42 億美元,成本提升近十倍,先進制程的推進速度愈加緩慢。因此在 HPC 高性能計算領域,Chiplet 的重要性持續(xù)提升。

5aa1ba5a-3a33-11ee-9e74-dac502259ad0.png

目前,以 CoWoS 為代表的高性能計算先進封裝產(chǎn)能緊缺,制約 GPU 產(chǎn)品出貨。英偉達 A100、H100 GPU 均采用臺積電 CoWoS 先進封裝工藝。而根據(jù)科創(chuàng)板日報與臺灣電子時報,英偉達將原定今年 Q4 的先進封裝 CoWoS 產(chǎn)能,改為 Q2-Q4 平均分配生產(chǎn),訂單生產(chǎn)時間較原計劃大大提前。目前,臺積電 CoWoS封測產(chǎn)能供不應求,部分訂單已外溢日月光、矽品與 Amkor、聯(lián)電等。以 CoWoS 為代表的先進封裝技術產(chǎn)能緊缺,已成為制約 GPU 生產(chǎn)的關鍵環(huán)節(jié)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5627

    瀏覽量

    138658
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5050

    瀏覽量

    134009
  • AI芯片
    +關注

    關注

    17

    文章

    2035

    瀏覽量

    36439

原文標題:全球GPU呈現(xiàn)“一超一強”競爭格局

文章出處:【微信號:AI_Architect,微信公眾號:智能計算芯世界】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    天合光能入選2025全球新能源企業(yè)500

    近日,“2025全球新能源企業(yè)500”榜單正式發(fā)布,天合光能憑借卓越的綜合實力和全球競爭力成功上榜,位列第22名。
    的頭像 發(fā)表于 10-13 14:18 ?545次閱讀

    德賽電池入選2025全球新能源企業(yè)500

    ,“2025全球新能源企業(yè)500”榜單權(quán)威發(fā)布,德賽電池憑借在新能源領域的卓越建樹及深遠影響力,實力躋身全球頂尖陣營,位居第108位,彰顯出雄厚的行業(yè)競爭力與品牌引領力。
    的頭像 發(fā)表于 10-11 16:16 ?454次閱讀

    海辰儲能入選2025全球新能源企業(yè)500榜單

    全球新能源500”榜單中,海辰儲能連續(xù)第三年榮登該榜單,彰顯企業(yè)在全球新能源格局中的領先地位與新周期下的強勁發(fā)展韌性。
    的頭像 發(fā)表于 09-29 16:39 ?601次閱讀

    標準更新頻率如何影響電能質(zhì)量在線監(jiān)測裝置的市場競爭格局

    LZ-DY-8三相電壓監(jiān)測儀 標準更新頻率通過 技術壁壘重構(gòu)、供應鏈洗牌、區(qū)域市場分化、國際競爭格局重塑 四大機制,深刻改變了電能質(zhì)量在線監(jiān)測裝置的市場競爭格局。以下結(jié)合行業(yè)實踐與數(shù)據(jù)
    的頭像 發(fā)表于 09-03 16:45 ?444次閱讀
    標準更新頻率如何影響電能質(zhì)量在線監(jiān)測裝置的市場<b class='flag-5'>競爭</b><b class='flag-5'>格局</b>?

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    圖??萍剂料?b class='flag-5'>全球閃存峰會,GPU RAID引領端到端存儲新格局

    南京?2025年7月7日?/美通社/ -- 2025年7月9日,全球領先以GPU-based的磁盤陣列存儲創(chuàng)新企業(yè)圖??萍迹℅raid Technology)將攜旗艦產(chǎn)品SupremeRAID
    的頭像 發(fā)表于 07-07 22:54 ?300次閱讀

    手表芯片多爭霸賽開啟!小米玄戒T1入局,格局生變?

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)當前,國內(nèi)可穿戴設備主控芯片市場呈現(xiàn)出“一超、梯度競爭”的競爭態(tài)勢,就在5月,小米重磅推出智能手表玄戒T1
    的頭像 發(fā)表于 05-29 01:05 ?1w次閱讀
    手表芯片多<b class='flag-5'>強</b>爭霸賽開啟!小米玄戒T1入局,<b class='flag-5'>格局</b>生變?

    競爭格局看 M12 航空插頭行業(yè)走向

    競爭格局審視,M12航空插頭行業(yè)未來將在技術創(chuàng)新的持續(xù)賦能下,不斷開拓新的應用領域,朝著更高性能、更小型化、更能適應復雜惡劣環(huán)境的方向穩(wěn)健前行。在此過程中,企業(yè)唯有持續(xù)提升自身核心競爭力,方能在激烈的市場
    的頭像 發(fā)表于 05-28 09:02 ?253次閱讀
    從<b class='flag-5'>競爭</b><b class='flag-5'>格局</b>看 M12 航空插頭行業(yè)走向

    中興通訊斬獲5G FWA CPE全球競爭力第

    近日,市場研究公司ABI Research發(fā)布了《5G FWA CPE供應商競爭力排名》報告,中興通訊憑借5G FWA CPE領先的技術創(chuàng)新能力和全球市場卓越的市場表現(xiàn)斬獲排名第,被評為整體領導者、頂級創(chuàng)新者和頂級實踐者,獲得
    的頭像 發(fā)表于 01-18 09:35 ?859次閱讀

    2024年GPU出貨量增長顯著,超越CPU

    近日,根據(jù)知名市場研究機構(gòu)Jon Peddie Research(JPR)最新發(fā)布的報告,2024年全球GPU(包括集成顯卡和獨立顯卡)市場呈現(xiàn)出強勁的增長態(tài)勢。報告顯示,該年度GPU
    的頭像 發(fā)表于 01-17 14:12 ?718次閱讀

    MR20抗干擾體式IO模塊的革新力量

    在快速發(fā)展的工業(yè)自動化領域,每次技術的飛躍都是對效率與穩(wěn)定性的極致追求。明達技術自主研發(fā)的抗干擾MR20體式IO模塊,以其卓越的性能、超高的集成度以及無與倫比的抗干擾能力,正逐步重塑工業(yè)控制系統(tǒng)的
    的頭像 發(fā)表于 01-02 17:31 ?630次閱讀
    MR20<b class='flag-5'>強</b>抗干擾<b class='flag-5'>一</b>體式IO模塊的革新力量

    新潔能榮獲2024年全球半導體企業(yè)綜合競爭力百

    近日,全球半導體市場峰會在上海成功召開。會上,世界集成電路協(xié)會發(fā)布了全球半導體企業(yè)綜合競爭力百報告,新潔能成功進入該榜單,也是唯進入該榜
    的頭像 發(fā)表于 12-14 15:15 ?2254次閱讀

    2024中國大模型,一超格局依舊

    AI之路,在于技術扎實,價值顯著
    的頭像 發(fā)表于 12-05 11:18 ?3232次閱讀
    2024中國大模型,<b class='flag-5'>一超</b>多<b class='flag-5'>強</b><b class='flag-5'>格局</b>依舊

    租用GPU服務器般多少錢

    租用GPU服務器的費用受到多種因素的影響,包括服務器配置、租用時長、服務提供商以及市場供需狀況等。下面,AI部落小編帶您了解租用GPU服務器的般多少錢。
    的頭像 發(fā)表于 11-25 10:28 ?1131次閱讀

    文看懂】大白話解釋“GPUGPU算力”

    隨著大模型的興起,“GPU算力”這個詞正頻繁出現(xiàn)在人工智能、游戲、圖形設計等工作場景中,什么是GPU,它與CPU的區(qū)別是什么?以及到底什么是GPU算力?本篇文章主要從以下5個角度,讓您全方位了解
    的頭像 發(fā)表于 10-29 08:05 ?3888次閱讀
    【<b class='flag-5'>一</b>文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>算力”