chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ARM Mali GPU 深度解讀

eeDesigner ? 2025-05-29 10:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ARM Mali GPU 深度解讀

ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動(dòng)設(shè)備 GPU 市場(chǎng)的核心力量。以下從技術(shù)演進(jìn)、架構(gòu)特性、產(chǎn)品布局及生態(tài)戰(zhàn)略等維度展開(kāi)分析:


一、架構(gòu)演進(jìn):從 Utgard 到 Valhall

Mali GPU 的架構(gòu)迭代以 ?北歐神話元素命名,技術(shù)特性與性能提升同步推進(jìn):

?Utgard 架構(gòu)(2007-2012)??:

  • 代表型號(hào):Mali-200、Mali-400 MP
  • 特性:基于 ?分離式頂點(diǎn)與片段著色器,僅支持 OpenGL ES 2.0 及以下標(biāo)準(zhǔn),適用于早期智能手機(jī)嵌入式設(shè)備。例如 Mali-400 MP 支持 4 核擴(kuò)展,像素填充率達(dá) 275M/秒(65nm 工藝)。
  • 局限:能效比低,多核擴(kuò)展能力有限,無(wú)法滿足復(fù)雜 3D 渲染需求。

?Midgard 架構(gòu)(2013-2018)??:

  • 代表型號(hào):Mali-T760、Mali-T880
  • 突破:
    • ?統(tǒng)一著色器架構(gòu)?:支持 OpenGL ES 3.0/3.1 和 OpenCL 1.2,實(shí)現(xiàn) GPU 通用計(jì)算(GPGPU)。
    • ?多核擴(kuò)展?:?jiǎn)涡酒罡咧С?16 核(如 Mali-T760MP16),三角形輸出率提升至 30M/秒,并首次引入 ?DirectX 11 支持?(如 Mali-T760)。
  • 應(yīng)用:三星 Exynos 8890(T880)、聯(lián)發(fā)科 Helio P10(T860)等中高端芯片。

?Bifrost 架構(gòu)(2016-2020)??:

  • 代表型號(hào):Mali-G71、G72、G76
  • 創(chuàng)新:
    • ?標(biāo)量執(zhí)行單元?:將向量拆解為標(biāo)量處理,提升 16/8bit 低精度計(jì)算效率,支持 ?AI 推理加速?(如 int8 dot 指令優(yōu)化神經(jīng)網(wǎng)絡(luò))。
    • ?動(dòng)態(tài)電源管理?:能效較 Midgard 提升 30%,如 Mali-G76 在三星 Exynos 9820 中實(shí)現(xiàn) 1.4 倍性能提升。

?Valhall 架構(gòu)(2019-至今)??:

  • 代表型號(hào):Mali-G77、G78、G710
  • 技術(shù)飛躍:
    • ?超標(biāo)量設(shè)計(jì)?:16-wide warp 并行計(jì)算,ALU 單元密度翻倍,支持 ?可變速率著色(VRS)?? 和光線追蹤。
    • ?AI 與圖形協(xié)同?:Mali-G77 的機(jī)器學(xué)習(xí)性能較前代提升 60%,支持本地運(yùn)行 ?100 億參數(shù)模型?(如端側(cè) Stable Diffusion)。
  • 旗艦應(yīng)用:華為麒麟 960(G71)、聯(lián)發(fā)科天璣 2000(G710)。

二、核心特性:性能與能效的平衡

Mali GPU 的技術(shù)優(yōu)勢(shì)體現(xiàn)在 ?異構(gòu)計(jì)算? 與 ?標(biāo)準(zhǔn)化支持?:

?圖形渲染能力?:

  • ?Tile-Based Rendering?:分塊渲染減少內(nèi)存帶寬消耗,支持 8K 實(shí)時(shí)渲染與光線追蹤(如 Mali-G710 集成 ASR 超分技術(shù))。
  • ?API 兼容性?:覆蓋 OpenGL ES 3.2、Vulkan 1.3、OpenCL 2.0 及 DirectX 12,適配多平臺(tái)開(kāi)發(fā)需求。

?AI 與通用計(jì)算?:

  • ?NPU 協(xié)同?:Ethos-U NPU 與 GPU 共享內(nèi)存,支持 Transformer 等大模型推理(如 Mali-G710 提供 8 TOPS 算力)。
  • ?低精度優(yōu)化?:BF16/INT8 量化加速,單位功耗下 MLPerf 性能提升 8 倍。

?能效創(chuàng)新?:

  • ?動(dòng)態(tài)調(diào)頻(DVFS)??:每核獨(dú)立電源管理,功耗較 x86 GPU 降低 40%(如 Mali-G710 無(wú)風(fēng)扇設(shè)計(jì)覆蓋 80% 輕薄本市場(chǎng))。
  • ?Chiplet 封裝?:基于 Arm CSA 標(biāo)準(zhǔn)支持多晶?;ミB,提升擴(kuò)展靈活性(如 Socionext 2nm 工藝芯粒方案)。

三、產(chǎn)品線布局:全場(chǎng)景覆蓋

Mali GPU 按性能劃分為四大系列,適配不同市場(chǎng)需求:

?高端旗艦(V/Valhall 系列)??:

  • Mali-G710:16 核設(shè)計(jì),支持 4K 120Hz 顯示與 AI 超分,應(yīng)用于旗艦手機(jī)(如三星 Galaxy S25)和 AI PC。
  • Mali-G78:24 核配置,3DMark Wild Life 跑分超 8500 分,媲美蘋果 M1 GPU。

?中端主流(Bifrost 系列)??:

  • Mali-G57:8 核設(shè)計(jì),主打千元機(jī)市場(chǎng)(如 Redmi Note 系列),支持 Vulkan 1.1 和 OpenCL 1.2。
  • Mali-G68:6 核精簡(jiǎn)版,適配平板和車載娛樂(lè)系統(tǒng)。

?入門級(jí)(Midgard 系列)??:

?定制化方案?:

  • ?Mali Nano?:針對(duì)教育終端和工控設(shè)備推出子平臺(tái),支持 300 美元以下設(shè)備本地化 AI 功能。

四、生態(tài)戰(zhàn)略:軟硬協(xié)同與開(kāi)發(fā)者支持

ARM 通過(guò) ?工具鏈優(yōu)化? 和 ?生態(tài)聯(lián)盟? 鞏固市場(chǎng)地位:

?開(kāi)發(fā)工具鏈?:

  • ?KleidiAI?:集成 TensorFlow Lite、PyTorch,模型部署時(shí)間縮短 50%(如阿里倚天 710 部署 Llama3 效率提升 1.9 倍)。
  • ?Mali 調(diào)試套件?:支持 OpenGL ES 仿真器和 Vulkan 性能分析,覆蓋 2200 萬(wàn)開(kāi)發(fā)者。

?合作伙伴網(wǎng)絡(luò)?:

  • ?芯片廠商?:聯(lián)發(fā)科(天璣系列)、三星(Exynos)、華為(麒麟)均采用 Mali 公版架構(gòu)。
  • ?云服務(wù)商?:騰訊云、AWS 推出基于 Mali 的 GPU 實(shí)例(如 Graviton3 推理能效提升 60%)。

?標(biāo)準(zhǔn)化認(rèn)證?:


五、挑戰(zhàn)與未來(lái)方向

盡管 Mali 占據(jù)安卓 GPU 市場(chǎng) 30% 份額,但仍面臨競(jìng)爭(zhēng)與技術(shù)挑戰(zhàn):

?市場(chǎng)壓力?:

  • ?x86 生態(tài)壁壘?:PC 領(lǐng)域 AMD/Intel 加速布局混合架構(gòu),2025 年 Arm PC 份額僅 13%。
  • ?競(jìng)品追趕?:高通 Adreno 740 光追性能反超,蘋果 M2 GPU 能效優(yōu)勢(shì)顯著。

?技術(shù)突破方向?:

  • ?光線追蹤普及?:Valhall 架構(gòu)需進(jìn)一步優(yōu)化實(shí)時(shí)光追效率,追趕 NVIDIA DLSS 3.0。
  • ?端云協(xié)同計(jì)算?:通過(guò) CoreLink CI-700 互連技術(shù)實(shí)現(xiàn)“端-邊-云”一體化(如騰訊云 Mali 邊緣節(jié)點(diǎn))。

?長(zhǎng)期愿景?:

  • ARM 目標(biāo) 2030 年賦能 ?50 億臺(tái)智能設(shè)備,成為 AIoT 與 6G 網(wǎng)絡(luò)的算力底座。

總結(jié)

ARM Mali 通過(guò)持續(xù)架構(gòu)迭代(Utgard → Valhall)和生態(tài)整合,已成為移動(dòng) GPU 領(lǐng)域的核心力量。其技術(shù)特性與 ?異構(gòu)計(jì)算能效優(yōu)化? 的深度結(jié)合,使其在智能手機(jī)、AI PC 及邊緣計(jì)算場(chǎng)景中展現(xiàn)出強(qiáng)大競(jìng)爭(zhēng)力。未來(lái),隨著 Chiplet 技術(shù)和光線追蹤的進(jìn)一步成熟,Mali 或?qū)⒃诟咝阅苡?jì)算市場(chǎng)開(kāi)辟新戰(zhàn)場(chǎng),推動(dòng)“端側(cè)智能普惠化”進(jìn)程。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9349

    瀏覽量

    377398
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4943

    瀏覽量

    131209
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    瑞薩365 深度解讀

    技術(shù)架構(gòu)、核心功能、行業(yè)影響及未來(lái)展望四個(gè)維度進(jìn)行深度解讀: 一、技術(shù)架構(gòu):融合硬件與設(shè)計(jì)軟件的跨領(lǐng)域協(xié)作平臺(tái) 瑞薩365基于Altium 365云平臺(tái)構(gòu)建,整合了瑞薩的半導(dǎo)體產(chǎn)品組合與Altium的設(shè)計(jì)工具鏈,形成從芯片選型到系統(tǒng)部署的全流程數(shù)字環(huán)境。其核心架構(gòu)圍繞 五
    的頭像 發(fā)表于 06-06 09:58 ?827次閱讀
    瑞薩365 <b class='flag-5'>深度</b><b class='flag-5'>解讀</b>

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能、科學(xué)計(jì)算
    的頭像 發(fā)表于 05-30 10:36 ?368次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)<b class='flag-5'>深度</b>解析

    Arm 公司面向 PC 市場(chǎng)的 ?Arm Niva? 深度解讀

    面向 PC 市場(chǎng)的 ? Arm Niva ? 深度解讀 ? Arm Niva ? 是 Arm 公司為 PC 市場(chǎng)推出的核心計(jì)算平臺(tái),屬于其“
    的頭像 發(fā)表于 05-29 09:56 ?677次閱讀

    Arm 公司面向移動(dòng)端市場(chǎng)的 ?Arm Lumex? 深度解讀

    面向移動(dòng)端市場(chǎng)的 ? Arm Lumex ? 深度解讀 ? Arm Lumex ? 是 Arm 公司面向移動(dòng)設(shè)備市場(chǎng)推出的新一代計(jì)算平臺(tái),隸
    的頭像 發(fā)表于 05-29 09:54 ?1095次閱讀

    Arm 公司面向汽車市場(chǎng)的 ?Arm Zena? 深度解讀

    面向汽車市場(chǎng)的 ? Arm Zena ? 深度解讀 Arm Zena 是 Arm 公司面向智能汽車領(lǐng)域推出的核心計(jì)算平臺(tái),屬于其“平臺(tái)優(yōu)先”
    的頭像 發(fā)表于 05-29 09:51 ?1355次閱讀

    瑞芯微米爾RK3562國(guó)產(chǎn)核心板,ARM中量級(jí)多面手

    網(wǎng)關(guān)、邊緣計(jì)算等領(lǐng)域提供了高性價(jià)比的解決方案。 核心板基于 RK3562 或RK3562J處理器,采用四核ARM Cortex-A53架構(gòu),主頻高達(dá)2GHz,集成Mali-G52 GPU,支持4K視頻解碼
    發(fā)表于 02-28 15:32

    NVIDIA GPU助力科研人員探索外星世界

    NVIDIA GPU 驅(qū)動(dòng)的深度學(xué)習(xí)在短短幾秒內(nèi)解讀出了卡西尼號(hào)土星探測(cè)器多年來(lái)收集的海量數(shù)據(jù),為科研人員探索外星世界提供了更加智能的方式。
    的頭像 發(fā)表于 02-27 10:37 ?565次閱讀

    深度解讀 30KPA64A 單向 TVS:64V 擊穿機(jī)制與高效防護(hù)策略

    深度解讀 30KPA64A 單向 TVS:64V 擊穿機(jī)制與高效防護(hù)策略
    的頭像 發(fā)表于 02-24 13:52 ?344次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>解讀</b> 30KPA64A 單向 TVS:64V 擊穿機(jī)制與高效防護(hù)策略

    深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異

    ,一個(gè)新的競(jìng)爭(zhēng)力量——LPU(Language Processing Unit,語(yǔ)言處理單元)已悄然登場(chǎng),LPU專注于解決自然語(yǔ)言處理(NLP)任務(wù)中的順序性問(wèn)題,是構(gòu)建AI應(yīng)用不可或缺的一環(huán)。 本文旨在探討深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異,并深入分析它們的架構(gòu)
    的頭像 發(fā)表于 12-09 11:01 ?3359次閱讀
    <b class='flag-5'>深度</b>學(xué)習(xí)工作負(fù)載中<b class='flag-5'>GPU</b>與LPU的主要差異

    GPU深度學(xué)習(xí)中的應(yīng)用 GPUs在圖形設(shè)計(jì)中的作用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心部分,已經(jīng)成為推動(dòng)技術(shù)進(jìn)步的重要力量。GPU(圖形處理單元)在深度學(xué)習(xí)中扮演著至關(guān)重要的角色,其強(qiáng)大的并行處理能力使得訓(xùn)練復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型成為可能
    的頭像 發(fā)表于 11-19 10:55 ?1615次閱讀

    4G模組加解密藝術(shù):通用函數(shù)的深度解讀

    今天是對(duì)加解密通用函數(shù)的深度解讀,我將詳細(xì)講解,建議收藏,不可錯(cuò)過(guò)。
    的頭像 發(fā)表于 11-12 09:58 ?624次閱讀
    4G模組加解密藝術(shù):通用函數(shù)的<b class='flag-5'>深度</b><b class='flag-5'>解讀</b>

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識(shí)別 圖像識(shí)別是深度學(xué)習(xí)的核心應(yīng)用領(lǐng)域之一,
    的頭像 發(fā)表于 10-27 11:13 ?1352次閱讀

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強(qiáng)大的并行計(jì)算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?608次閱讀

    ARM進(jìn)軍GPU領(lǐng)域,挑戰(zhàn)英偉達(dá)與英特爾

    英國(guó)芯片設(shè)計(jì)巨頭ARM正悄然在以色列拉阿納納的研發(fā)中心布局其GPU(圖形處理器)戰(zhàn)略,意圖在全球圖形處理市場(chǎng)與英偉達(dá)和英特爾等業(yè)界巨頭一較高下。據(jù)悉,ARM已在該開(kāi)發(fā)中心組建了一支由約100名精英芯片與軟件工程師構(gòu)成的全球圖形處
    的頭像 發(fā)表于 08-21 10:19 ?830次閱讀

    深度解讀 VCXO VG7050CDN:可變晶體振蕩器的卓越之選

    深度解讀 VCXO VG7050CDN:可變晶體振蕩器的卓越之選
    的頭像 發(fā)表于 07-24 10:58 ?687次閱讀