ARM Mali GPU 深度解讀
ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動(dòng)設(shè)備 GPU 市場(chǎng)的核心力量。以下從技術(shù)演進(jìn)、架構(gòu)特性、產(chǎn)品布局及生態(tài)戰(zhàn)略等維度展開(kāi)分析:
一、架構(gòu)演進(jìn):從 Utgard 到 Valhall
Mali GPU 的架構(gòu)迭代以 ?北歐神話元素命名,技術(shù)特性與性能提升同步推進(jìn):
?Utgard 架構(gòu)(2007-2012)??:
- 代表型號(hào):Mali-200、Mali-400 MP
- 特性:基于 ?分離式頂點(diǎn)與片段著色器,僅支持 OpenGL ES 2.0 及以下標(biāo)準(zhǔn),適用于早期智能手機(jī)和嵌入式設(shè)備。例如 Mali-400 MP 支持 4 核擴(kuò)展,像素填充率達(dá) 275M/秒(65nm 工藝)。
- 局限:能效比低,多核擴(kuò)展能力有限,無(wú)法滿足復(fù)雜 3D 渲染需求。
?Midgard 架構(gòu)(2013-2018)??:
- 代表型號(hào):Mali-T760、Mali-T880
-
突破:
- ?統(tǒng)一著色器架構(gòu)?:支持 OpenGL ES 3.0/3.1 和 OpenCL 1.2,實(shí)現(xiàn) GPU 通用計(jì)算(GPGPU)。
- ?多核擴(kuò)展?:?jiǎn)涡酒罡咧С?16 核(如 Mali-T760MP16),三角形輸出率提升至 30M/秒,并首次引入 ?DirectX 11 支持?(如 Mali-T760)。
- 應(yīng)用:三星 Exynos 8890(T880)、聯(lián)發(fā)科 Helio P10(T860)等中高端芯片。
?Bifrost 架構(gòu)(2016-2020)??:
- 代表型號(hào):Mali-G71、G72、G76
-
創(chuàng)新:
- ?標(biāo)量執(zhí)行單元?:將向量拆解為標(biāo)量處理,提升 16/8bit 低精度計(jì)算效率,支持 ?AI 推理加速?(如 int8 dot 指令優(yōu)化神經(jīng)網(wǎng)絡(luò))。
- ?動(dòng)態(tài)電源管理?:能效較 Midgard 提升 30%,如 Mali-G76 在三星 Exynos 9820 中實(shí)現(xiàn) 1.4 倍性能提升。
?Valhall 架構(gòu)(2019-至今)??:
- 代表型號(hào):Mali-G77、G78、G710
-
技術(shù)飛躍:
- ?超標(biāo)量設(shè)計(jì)?:16-wide warp 并行計(jì)算,ALU 單元密度翻倍,支持 ?可變速率著色(VRS)?? 和光線追蹤。
- ?AI 與圖形協(xié)同?:Mali-G77 的機(jī)器學(xué)習(xí)性能較前代提升 60%,支持本地運(yùn)行 ?100 億參數(shù)模型?(如端側(cè) Stable Diffusion)。
- 旗艦應(yīng)用:華為麒麟 960(G71)、聯(lián)發(fā)科天璣 2000(G710)。
二、核心特性:性能與能效的平衡
Mali GPU 的技術(shù)優(yōu)勢(shì)體現(xiàn)在 ?異構(gòu)計(jì)算? 與 ?標(biāo)準(zhǔn)化支持?:
?圖形渲染能力?:
- ?Tile-Based Rendering?:分塊渲染減少內(nèi)存帶寬消耗,支持 8K 實(shí)時(shí)渲染與光線追蹤(如 Mali-G710 集成 ASR 超分技術(shù))。
- ?API 兼容性?:覆蓋 OpenGL ES 3.2、Vulkan 1.3、OpenCL 2.0 及 DirectX 12,適配多平臺(tái)開(kāi)發(fā)需求。
?AI 與通用計(jì)算?:
- ?NPU 協(xié)同?:Ethos-U NPU 與 GPU 共享內(nèi)存,支持 Transformer 等大模型推理(如 Mali-G710 提供 8 TOPS 算力)。
- ?低精度優(yōu)化?:BF16/INT8 量化加速,單位功耗下 MLPerf 性能提升 8 倍。
?能效創(chuàng)新?:
- ?動(dòng)態(tài)調(diào)頻(DVFS)??:每核獨(dú)立電源管理,功耗較 x86 GPU 降低 40%(如 Mali-G710 無(wú)風(fēng)扇設(shè)計(jì)覆蓋 80% 輕薄本市場(chǎng))。
- ?Chiplet 封裝?:基于 Arm CSA 標(biāo)準(zhǔn)支持多晶?;ミB,提升擴(kuò)展靈活性(如 Socionext 2nm 工藝芯粒方案)。
三、產(chǎn)品線布局:全場(chǎng)景覆蓋
Mali GPU 按性能劃分為四大系列,適配不同市場(chǎng)需求:
?高端旗艦(V/Valhall 系列)??:
- Mali-G710:16 核設(shè)計(jì),支持 4K 120Hz 顯示與 AI 超分,應(yīng)用于旗艦手機(jī)(如三星 Galaxy S25)和 AI PC。
- Mali-G78:24 核配置,3DMark Wild Life 跑分超 8500 分,媲美蘋果 M1 GPU。
?中端主流(Bifrost 系列)??:
- Mali-G57:8 核設(shè)計(jì),主打千元機(jī)市場(chǎng)(如 Redmi Note 系列),支持 Vulkan 1.1 和 OpenCL 1.2。
- Mali-G68:6 核精簡(jiǎn)版,適配平板和車載娛樂(lè)系統(tǒng)。
?入門級(jí)(Midgard 系列)??:
- Mali-T720:?jiǎn)魏思軜?gòu),用于智能電視和低端物聯(lián)網(wǎng)設(shè)備(如小米電視 6A)。
?定制化方案?:
- ?Mali Nano?:針對(duì)教育終端和工控設(shè)備推出子平臺(tái),支持 300 美元以下設(shè)備本地化 AI 功能。
四、生態(tài)戰(zhàn)略:軟硬協(xié)同與開(kāi)發(fā)者支持
ARM 通過(guò) ?工具鏈優(yōu)化? 和 ?生態(tài)聯(lián)盟? 鞏固市場(chǎng)地位:
?開(kāi)發(fā)工具鏈?:
- ?KleidiAI?:集成 TensorFlow Lite、PyTorch,模型部署時(shí)間縮短 50%(如阿里倚天 710 部署 Llama3 效率提升 1.9 倍)。
- ?Mali 調(diào)試套件?:支持 OpenGL ES 仿真器和 Vulkan 性能分析,覆蓋 2200 萬(wàn)開(kāi)發(fā)者。
?合作伙伴網(wǎng)絡(luò)?:
- ?芯片廠商?:聯(lián)發(fā)科(天璣系列)、三星(Exynos)、華為(麒麟)均采用 Mali 公版架構(gòu)。
- ?云服務(wù)商?:騰訊云、AWS 推出基于 Mali 的 GPU 實(shí)例(如 Graviton3 推理能效提升 60%)。
?標(biāo)準(zhǔn)化認(rèn)證?:
五、挑戰(zhàn)與未來(lái)方向
盡管 Mali 占據(jù)安卓 GPU 市場(chǎng) 30% 份額,但仍面臨競(jìng)爭(zhēng)與技術(shù)挑戰(zhàn):
?市場(chǎng)壓力?:
- ?x86 生態(tài)壁壘?:PC 領(lǐng)域 AMD/Intel 加速布局混合架構(gòu),2025 年 Arm PC 份額僅 13%。
- ?競(jìng)品追趕?:高通 Adreno 740 光追性能反超,蘋果 M2 GPU 能效優(yōu)勢(shì)顯著。
?技術(shù)突破方向?:
- ?光線追蹤普及?:Valhall 架構(gòu)需進(jìn)一步優(yōu)化實(shí)時(shí)光追效率,追趕 NVIDIA DLSS 3.0。
- ?端云協(xié)同計(jì)算?:通過(guò) CoreLink CI-700 互連技術(shù)實(shí)現(xiàn)“端-邊-云”一體化(如騰訊云 Mali 邊緣節(jié)點(diǎn))。
?長(zhǎng)期愿景?:
- ARM 目標(biāo) 2030 年賦能 ?50 億臺(tái)智能設(shè)備,成為 AIoT 與 6G 網(wǎng)絡(luò)的算力底座。
總結(jié)
ARM Mali 通過(guò)持續(xù)架構(gòu)迭代(Utgard → Valhall)和生態(tài)整合,已成為移動(dòng) GPU 領(lǐng)域的核心力量。其技術(shù)特性與 ?異構(gòu)計(jì)算、能效優(yōu)化? 的深度結(jié)合,使其在智能手機(jī)、AI PC 及邊緣計(jì)算場(chǎng)景中展現(xiàn)出強(qiáng)大競(jìng)爭(zhēng)力。未來(lái),隨著 Chiplet 技術(shù)和光線追蹤的進(jìn)一步成熟,Mali 或?qū)⒃诟咝阅苡?jì)算市場(chǎng)開(kāi)辟新戰(zhàn)場(chǎng),推動(dòng)“端側(cè)智能普惠化”進(jìn)程。
-
ARM
+關(guān)注
關(guān)注
134文章
9349瀏覽量
377398 -
gpu
+關(guān)注
關(guān)注
28文章
4943瀏覽量
131209
發(fā)布評(píng)論請(qǐng)先 登錄
瑞薩365 深度解讀

GPU架構(gòu)深度解析

Arm 公司面向 PC 市場(chǎng)的 ?Arm Niva? 深度解讀
Arm 公司面向移動(dòng)端市場(chǎng)的 ?Arm Lumex? 深度解讀
Arm 公司面向汽車市場(chǎng)的 ?Arm Zena? 深度解讀
瑞芯微米爾RK3562國(guó)產(chǎn)核心板,ARM中量級(jí)多面手
NVIDIA GPU助力科研人員探索外星世界
深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異

評(píng)論