chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU微架構(gòu)及生態(tài)研究框架(2023)

架構(gòu)師技術(shù)聯(lián)盟 ? 來源:架構(gòu)師技術(shù)聯(lián)盟 ? 2023-07-09 10:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

GPU的核心競爭力在于架構(gòu)等因素決定的性能先進性和計算生態(tài)壁壘。國內(nèi)GPU廠商紛紛大力投入研發(fā)快速迭代架構(gòu),推動產(chǎn)業(yè)開放構(gòu)建自主生態(tài),加速追趕全球頭部企業(yè)。國產(chǎn)替代需求持續(xù)釋放疊加國際局勢不確定性加劇,AI&數(shù)據(jù)中心智能汽車、游戲等GPU需求有望高增,國產(chǎn)GPU迎來發(fā)展黃金期,我們看好國產(chǎn)GPU公司的發(fā)展與投資機遇。

第一,我們從性能和生態(tài)2個維度構(gòu)建了GPU完整的研究體系。1)性能:決定GPU是否“高效”,其中微架構(gòu)/制程是影響GPU性能的核心要素。2)生態(tài):CUDA構(gòu)筑通用計算堅固壁壘。

第二,提出在評估GPU性能的指標(biāo)的重要性上:微架構(gòu)、制程、流處理器數(shù)量、核心頻率對GPU性能影響較大。我們詳細梳理了GPU的微架構(gòu)、制程、顯存容量/位寬/帶寬/頻率、核心頻率等各類性能參數(shù)及重要性程度,并利用“核心數(shù)*核心頻率*2”公式對性能算力進行量化,揭示可用3DMark、MLPerf 等GPU軟件跑分進行相關(guān)性能測試評估。

第三,詳細拆解了NVIDIA Fermi和Hopper兩大典型微架構(gòu)的具體硬件實現(xiàn),在頂點處理、光柵化計算、紋理貼圖、像素處理的圖形渲染流水線上對Fermi架構(gòu)進行了拆分;在指令接收、調(diào)度、分配、計算執(zhí)行的通用計算流水線上對Hopper架構(gòu)進行了簡單易懂的描述,并指明更多、更專、更智能等未來架構(gòu)升級迭代的方向。

第四,明晰了生態(tài)是構(gòu)建通用計算壁壘的基石。提出GPU研發(fā)難度在圖形渲染硬件和通用計算軟件生態(tài)層面,在IP、軟件棧方面研發(fā)門檻較高,需要較長的積累,先發(fā)者優(yōu)勢明顯。CUDA生態(tài)從2006年推出至今,經(jīng)過不斷發(fā)展完善,幾乎已在行業(yè)生態(tài)內(nèi)處于壟斷地位。

第五,深度復(fù)盤Nvidia/AMD(ATI)的產(chǎn)品迭代和競爭發(fā)展史,通過對NVIDIA長期保持領(lǐng)先和AMD(ATI)反超進行總結(jié)得出結(jié)論:架構(gòu)創(chuàng)新升級和新興領(lǐng)域前瞻探索是領(lǐng)跑GPU行業(yè)的關(guān)鍵。

第六,梳理和測算了國內(nèi)GPU在AI&數(shù)據(jù)中心、智能汽車、游戲行業(yè)的市場空間和發(fā)展趨勢。

以下為報告原文,節(jié)選部分內(nèi)容,更多內(nèi)容請參看原報告“GPU研究框架(2023)”,以及“服務(wù)器基礎(chǔ)知識全解(終極版)-182頁PPT”,“服務(wù)器基礎(chǔ)知識全解(終極版)-182頁PDF”。


607bd42c-1ded-11ee-962d-dac502259ad0.png

60c56b32-1ded-11ee-962d-dac502259ad0.png

61e55220-1ded-11ee-962d-dac502259ad0.png

625485e6-1ded-11ee-962d-dac502259ad0.png

62aef526-1ded-11ee-962d-dac502259ad0.png

62d046cc-1ded-11ee-962d-dac502259ad0.png

6329c7e2-1ded-11ee-962d-dac502259ad0.png

63b6c840-1ded-11ee-962d-dac502259ad0.png

641ce6e8-1ded-11ee-962d-dac502259ad0.png

646b5800-1ded-11ee-962d-dac502259ad0.png

64e791ea-1ded-11ee-962d-dac502259ad0.png

6504cbde-1ded-11ee-962d-dac502259ad0.png

65379a5a-1ded-11ee-962d-dac502259ad0.png

656cbc4e-1ded-11ee-962d-dac502259ad0.png

65bd848a-1ded-11ee-962d-dac502259ad0.png

66344444-1ded-11ee-962d-dac502259ad0.png

66acc202-1ded-11ee-962d-dac502259ad0.png

6716a546-1ded-11ee-962d-dac502259ad0.png

6744b7ba-1ded-11ee-962d-dac502259ad0.png

67a659a2-1ded-11ee-962d-dac502259ad0.png

67dee434-1ded-11ee-962d-dac502259ad0.png

680e5462-1ded-11ee-962d-dac502259ad0.png

6874b6b2-1ded-11ee-962d-dac502259ad0.png

690c3212-1ded-11ee-962d-dac502259ad0.png

69814a48-1ded-11ee-962d-dac502259ad0.png

69de2628-1ded-11ee-962d-dac502259ad0.png

6a1329cc-1ded-11ee-962d-dac502259ad0.png

6a7a779e-1ded-11ee-962d-dac502259ad0.png

6b03de8a-1ded-11ee-962d-dac502259ad0.png

6b43685c-1ded-11ee-962d-dac502259ad0.png

6b7dced4-1ded-11ee-962d-dac502259ad0.png

6bc97780-1ded-11ee-962d-dac502259ad0.png

6c2c9a90-1ded-11ee-962d-dac502259ad0.png

6c6d063e-1ded-11ee-962d-dac502259ad0.png

6c89631a-1ded-11ee-962d-dac502259ad0.png

6cc9e322-1ded-11ee-962d-dac502259ad0.png

6d04e76a-1ded-11ee-962d-dac502259ad0.png

6d721326-1ded-11ee-962d-dac502259ad0.png

6de6331e-1ded-11ee-962d-dac502259ad0.png

6e1d5308-1ded-11ee-962d-dac502259ad0.png

6e4ec212-1ded-11ee-962d-dac502259ad0.png

6e983dc0-1ded-11ee-962d-dac502259ad0.png

6eff89d0-1ded-11ee-962d-dac502259ad0.png

6f720e38-1ded-11ee-962d-dac502259ad0.png

6fa62a38-1ded-11ee-962d-dac502259ad0.png

6fe7effe-1ded-11ee-962d-dac502259ad0.png

702e26f4-1ded-11ee-962d-dac502259ad0.png

7058dfca-1ded-11ee-962d-dac502259ad0.png

70d5eff6-1ded-11ee-962d-dac502259ad0.png

70fd79cc-1ded-11ee-962d-dac502259ad0.png

以上內(nèi)容節(jié)選部分內(nèi)容,更多內(nèi)容請參看原報告“GPU研究框架(2023)”,以及“服務(wù)器基礎(chǔ)知識全解(終極版)-182頁PPT”,“服務(wù)器基礎(chǔ)知識全解(終極版)-182頁PDF”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5035

    瀏覽量

    133696
  • 智能汽車
    +關(guān)注

    關(guān)注

    30

    文章

    3190

    瀏覽量

    108961
  • 微架構(gòu)
    +關(guān)注

    關(guān)注

    0

    文章

    22

    瀏覽量

    7281

原文標(biāo)題:GPU微架構(gòu)及生態(tài)研究框架(2023)

文章出處:【微信號:架構(gòu)師技術(shù)聯(lián)盟,微信公眾號:架構(gòu)師技術(shù)聯(lián)盟】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何看懂GPU架構(gòu)?一分鐘帶你了解GPU參數(shù)指標(biāo)

    GPU架構(gòu)參數(shù)如CUDA核心數(shù)、顯存帶寬、TensorTFLOPS、互聯(lián)方式等,并非“冰冷的數(shù)字”,而是直接關(guān)系設(shè)備能否滿足需求、如何發(fā)揮最大價值、是否避免資源浪費等問題的核心要素。本篇文章將全面
    的頭像 發(fā)表于 10-09 09:28 ?111次閱讀
    如何看懂<b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)指標(biāo)

    景嘉JM1100生態(tài)合作推介會長沙站圓滿結(jié)束

    近日,以 “自主創(chuàng)芯 生態(tài)共建” 為主題的景嘉JM1100 生態(tài)合作推介會(長沙站)圓滿結(jié)束。本次推介會匯聚了產(chǎn)業(yè)鏈各級領(lǐng)導(dǎo)、知名學(xué)者以及上下游企業(yè)代表,大家圍繞景嘉自主全新一代
    的頭像 發(fā)表于 09-16 17:53 ?1022次閱讀

    適應(yīng)邊緣AI全新時代的GPU架構(gòu)

    電子發(fā)燒友網(wǎng)站提供《適應(yīng)邊緣AI全新時代的GPU架構(gòu).pdf》資料免費下載
    發(fā)表于 09-15 16:42 ?19次下載

    【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」閱讀體驗】+NVlink技術(shù)從應(yīng)用到原理

    前言 【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」書中的芯片知識是比較接近當(dāng)前的頂尖芯片水平的,同時包含了芯片架構(gòu)的基礎(chǔ)知識,但該部分知識比較晦澀難懂,或許是由于我一
    發(fā)表于 06-18 19:31

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應(yīng)用于人工智能、科學(xué)計算
    的頭像 發(fā)表于 05-30 10:36 ?849次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構(gòu)</b>深度解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場設(shè)計的圖形處理器(GPU)IP 核,憑借其異構(gòu)計算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,
    的頭像 發(fā)表于 05-29 10:12 ?2274次閱讀

    iTOP-3588S開發(fā)板四核心架構(gòu)GPU內(nèi)置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    性能強 iTOP-3588S開發(fā)板采用瑞芯RK3588S處理器,是全新一代AloT高端應(yīng)用芯片,搭載八核64位CPU,四核Cortex-A76和四核Cortex-A55架構(gòu)主頻高達2.4GHZ
    發(fā)表于 05-15 10:36

    iTOP-3588開發(fā)板采用瑞芯RK3588處理器四核心架構(gòu)GPU內(nèi)置獨立NPU強大的視頻編解碼

    架構(gòu),主頻高達2.4GHz。 四核心架構(gòu)GPU 集成Mali G610 MP4四核GPU、支持OpenGLES 1.1.2.0、 3.2, OpenCL 2.2和Vulkan1.2。帶
    發(fā)表于 04-09 16:09

    微服務(wù)器架構(gòu)幾種典型的基礎(chǔ)框架,你了解嗎?

    SpringCloud、Dubbo、Dropwizard、Akka等是常見微服務(wù)框架。SpringCloud基于SpringBoot,生態(tài)豐富;Dropwizard輕量且繼承SpringBoot優(yōu)點
    的頭像 發(fā)表于 03-04 11:05 ?658次閱讀

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計算性能和廣泛的應(yīng)用領(lǐng)域,吸引了業(yè)界的廣泛關(guān)注。 Vitality
    的頭像 發(fā)表于 12-24 10:55 ?1173次閱讀

    華為推動中國人工智能框架生態(tài)高速發(fā)展

    近日,昇思人工智能框架峰會在北京中關(guān)村國際創(chuàng)新中心召開,本次大會以“創(chuàng)新源動力,框架新選擇”為主題,由昇思MindSpore開源社區(qū)、中國人工智能學(xué)會及AITISA聯(lián)合主辦,旨在匯聚AI產(chǎn)業(yè)界、學(xué)術(shù)界力量,共建人工智能框架開源
    的頭像 發(fā)表于 12-17 11:06 ?1018次閱讀

    《算力芯片 高性能 CPUGPUNPU 架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù),這讓我對GPU架構(gòu)和張量運算充滿好奇。閱讀《算力芯片》第7-9章,讓我對這些關(guān)鍵技術(shù)有了全新認識。 GPU架構(gòu)從早期的固定功能流
    發(fā)表于 11-24 17:12

    GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計

    眾所周知,在大型模型訓(xùn)練中,通常采用每臺服務(wù)器配備多個GPU的集群架構(gòu)。在上一篇文章《高性能GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)(上篇)》中,我們對GPU
    的頭像 發(fā)表于 11-05 16:20 ?1729次閱讀
    <b class='flag-5'>GPU</b>服務(wù)器AI網(wǎng)絡(luò)<b class='flag-5'>架構(gòu)</b>設(shè)計

    【「算力芯片 | 高性能 CPU/GPU/NPU 架構(gòu)分析」閱讀體驗】--了解算力芯片GPU

    每個CUDA單元在 OpenCL 編程框架中都有對應(yīng)的單元。 倒金字塔結(jié)構(gòu)GPU存儲體系 共享內(nèi)存是開發(fā)者可配置的編程資源,使用門檻較高,編程上需要更多的人工顯式處理。 在并行計算架構(gòu)中,線程
    發(fā)表于 11-03 12:55

    《算力芯片 高性能 CPUGPUNPU 架構(gòu)分析》第二篇閱讀心得:芯片拓撲學(xué):并行擴展與CPU設(shè)計的巨頭對決

    更是達到了令人驚嘆的6GFLOPS/W。 3 處理器性能的未來與思考 隨著閱讀深入,我發(fā)現(xiàn)這兩章內(nèi)容與前4章的CPU架構(gòu)知識自然銜接,又為后續(xù)GPU和NPU架構(gòu)的學(xué)習(xí)搭建了認知
    發(fā)表于 10-29 01:48