ARM Mali GPU 深度解讀
ARM Mali 是 Arm 公司面向移動(dòng)設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場(chǎng)設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動(dòng)設(shè)備 GPU 市場(chǎng)的核心力量。以下從技術(shù)演進(jìn)、架構(gòu)特性、產(chǎn)品布局及生態(tài)戰(zhàn)略等維度展開(kāi)分析:
一、架構(gòu)演進(jìn):從 Utgard 到 Valhall
Mali GPU 的架構(gòu)迭代以 ?北歐神話元素命名,技術(shù)特性與性能提升同步推進(jìn):
?Utgard 架構(gòu)(2007-2012)??:
- 代表型號(hào):Mali-200、Mali-400 MP
- 特性:基于 ?分離式頂點(diǎn)與片段著色器,僅支持 OpenGL ES 2.0 及以下標(biāo)準(zhǔn),適用于早期智能手機(jī)和嵌入式設(shè)備。例如 Mali-400 MP 支持 4 核擴(kuò)展,像素填充率達(dá) 275M/秒(65nm 工藝)。
- 局限:能效比低,多核擴(kuò)展能力有限,無(wú)法滿足復(fù)雜 3D 渲染需求。
?Midgard 架構(gòu)(2013-2018)??:
- 代表型號(hào):Mali-T760、Mali-T880
-
突破:
- ?統(tǒng)一著色器架構(gòu)?:支持 OpenGL ES 3.0/3.1 和 OpenCL 1.2,實(shí)現(xiàn) GPU 通用計(jì)算(GPGPU)。
- ?多核擴(kuò)展?:?jiǎn)涡酒罡咧С?16 核(如 Mali-T760MP16),三角形輸出率提升至 30M/秒,并首次引入 ?DirectX 11 支持?(如 Mali-T760)。
- 應(yīng)用:三星 Exynos 8890(T880)、聯(lián)發(fā)科 Helio P10(T860)等中高端芯片。
?Bifrost 架構(gòu)(2016-2020)??:
- 代表型號(hào):Mali-G71、G72、G76
-
創(chuàng)新:
- ?標(biāo)量執(zhí)行單元?:將向量拆解為標(biāo)量處理,提升 16/8bit 低精度計(jì)算效率,支持 ?AI 推理加速?(如 int8 dot 指令優(yōu)化神經(jīng)網(wǎng)絡(luò))。
- ?動(dòng)態(tài)電源管理?:能效較 Midgard 提升 30%,如 Mali-G76 在三星 Exynos 9820 中實(shí)現(xiàn) 1.4 倍性能提升。
?Valhall 架構(gòu)(2019-至今)??:
- 代表型號(hào):Mali-G77、G78、G710
-
技術(shù)飛躍:
- ?超標(biāo)量設(shè)計(jì)?:16-wide warp 并行計(jì)算,ALU 單元密度翻倍,支持 ?可變速率著色(VRS)?? 和光線追蹤。
- ?AI 與圖形協(xié)同?:Mali-G77 的機(jī)器學(xué)習(xí)性能較前代提升 60%,支持本地運(yùn)行 ?100 億參數(shù)模型?(如端側(cè) Stable Diffusion)。
- 旗艦應(yīng)用:華為麒麟 960(G71)、聯(lián)發(fā)科天璣 2000(G710)。
二、核心特性:性能與能效的平衡
Mali GPU 的技術(shù)優(yōu)勢(shì)體現(xiàn)在 ?異構(gòu)計(jì)算? 與 ?標(biāo)準(zhǔn)化支持?:
?圖形渲染能力?:
- ?Tile-Based Rendering?:分塊渲染減少內(nèi)存帶寬消耗,支持 8K 實(shí)時(shí)渲染與光線追蹤(如 Mali-G710 集成 ASR 超分技術(shù))。
- ?API 兼容性?:覆蓋 OpenGL ES 3.2、Vulkan 1.3、OpenCL 2.0 及 DirectX 12,適配多平臺(tái)開(kāi)發(fā)需求。
?AI 與通用計(jì)算?:
- ?NPU 協(xié)同?:Ethos-U NPU 與 GPU 共享內(nèi)存,支持 Transformer 等大模型推理(如 Mali-G710 提供 8 TOPS 算力)。
- ?低精度優(yōu)化?:BF16/INT8 量化加速,單位功耗下 MLPerf 性能提升 8 倍。
?能效創(chuàng)新?:
- ?動(dòng)態(tài)調(diào)頻(DVFS)??:每核獨(dú)立電源管理,功耗較 x86 GPU 降低 40%(如 Mali-G710 無(wú)風(fēng)扇設(shè)計(jì)覆蓋 80% 輕薄本市場(chǎng))。
- ?Chiplet 封裝?:基于 Arm CSA 標(biāo)準(zhǔn)支持多晶粒互連,提升擴(kuò)展靈活性(如 Socionext 2nm 工藝芯粒方案)。
三、產(chǎn)品線布局:全場(chǎng)景覆蓋
Mali GPU 按性能劃分為四大系列,適配不同市場(chǎng)需求:
?高端旗艦(V/Valhall 系列)??:
- Mali-G710:16 核設(shè)計(jì),支持 4K 120Hz 顯示與 AI 超分,應(yīng)用于旗艦手機(jī)(如三星 Galaxy S25)和 AI PC。
- Mali-G78:24 核配置,3DMark Wild Life 跑分超 8500 分,媲美蘋(píng)果 M1 GPU。
?中端主流(Bifrost 系列)??:
- Mali-G57:8 核設(shè)計(jì),主打千元機(jī)市場(chǎng)(如 Redmi Note 系列),支持 Vulkan 1.1 和 OpenCL 1.2。
- Mali-G68:6 核精簡(jiǎn)版,適配平板和車(chē)載娛樂(lè)系統(tǒng)。
?入門(mén)級(jí)(Midgard 系列)??:
- Mali-T720:?jiǎn)魏思軜?gòu),用于智能電視和低端物聯(lián)網(wǎng)設(shè)備(如小米電視 6A)。
?定制化方案?:
- ?Mali Nano?:針對(duì)教育終端和工控設(shè)備推出子平臺(tái),支持 300 美元以下設(shè)備本地化 AI 功能。
四、生態(tài)戰(zhàn)略:軟硬協(xié)同與開(kāi)發(fā)者支持
ARM 通過(guò) ?工具鏈優(yōu)化? 和 ?生態(tài)聯(lián)盟? 鞏固市場(chǎng)地位:
?開(kāi)發(fā)工具鏈?:
- ?KleidiAI?:集成 TensorFlow Lite、PyTorch,模型部署時(shí)間縮短 50%(如阿里倚天 710 部署 Llama3 效率提升 1.9 倍)。
- ?Mali 調(diào)試套件?:支持 OpenGL ES 仿真器和 Vulkan 性能分析,覆蓋 2200 萬(wàn)開(kāi)發(fā)者。
?合作伙伴網(wǎng)絡(luò)?:
- ?芯片廠商?:聯(lián)發(fā)科(天璣系列)、三星(Exynos)、華為(麒麟)均采用 Mali 公版架構(gòu)。
- ?云服務(wù)商?:騰訊云、AWS 推出基于 Mali 的 GPU 實(shí)例(如 Graviton3 推理能效提升 60%)。
?標(biāo)準(zhǔn)化認(rèn)證?:
五、挑戰(zhàn)與未來(lái)方向
盡管 Mali 占據(jù)安卓 GPU 市場(chǎng) 30% 份額,但仍面臨競(jìng)爭(zhēng)與技術(shù)挑戰(zhàn):
?市場(chǎng)壓力?:
- ?x86 生態(tài)壁壘?:PC 領(lǐng)域 AMD/Intel 加速布局混合架構(gòu),2025 年 Arm PC 份額僅 13%。
- ?競(jìng)品追趕?:高通 Adreno 740 光追性能反超,蘋(píng)果 M2 GPU 能效優(yōu)勢(shì)顯著。
?技術(shù)突破方向?:
- ?光線追蹤普及?:Valhall 架構(gòu)需進(jìn)一步優(yōu)化實(shí)時(shí)光追效率,追趕 NVIDIA DLSS 3.0。
- ?端云協(xié)同計(jì)算?:通過(guò) CoreLink CI-700 互連技術(shù)實(shí)現(xiàn)“端-邊-云”一體化(如騰訊云 Mali 邊緣節(jié)點(diǎn))。
?長(zhǎng)期愿景?:
- ARM 目標(biāo) 2030 年賦能 ?50 億臺(tái)智能設(shè)備,成為 AIoT 與 6G 網(wǎng)絡(luò)的算力底座。
總結(jié)
ARM Mali 通過(guò)持續(xù)架構(gòu)迭代(Utgard → Valhall)和生態(tài)整合,已成為移動(dòng) GPU 領(lǐng)域的核心力量。其技術(shù)特性與 ?異構(gòu)計(jì)算、能效優(yōu)化? 的深度結(jié)合,使其在智能手機(jī)、AI PC 及邊緣計(jì)算場(chǎng)景中展現(xiàn)出強(qiáng)大競(jìng)爭(zhēng)力。未來(lái),隨著 Chiplet 技術(shù)和光線追蹤的進(jìn)一步成熟,Mali 或?qū)⒃诟咝阅苡?jì)算市場(chǎng)開(kāi)辟新戰(zhàn)場(chǎng),推動(dòng)“端側(cè)智能普惠化”進(jìn)程。
-
ARM
+關(guān)注
關(guān)注
135文章
9444瀏覽量
385447 -
gpu
+關(guān)注
關(guān)注
28文章
5035瀏覽量
133679
發(fā)布評(píng)論請(qǐng)先 登錄
Arm助力MediaTek天璣9500重塑旗艦體驗(yàn)
瑞薩365 深度解讀

GPU架構(gòu)深度解析

Arm 公司面向 PC 市場(chǎng)的 ?Arm Niva? 深度解讀
Arm 公司面向移動(dòng)端市場(chǎng)的 ?Arm Lumex? 深度解讀
Arm 公司面向汽車(chē)市場(chǎng)的 ?Arm Zena? 深度解讀
瑞芯微米爾RK3562國(guó)產(chǎn)核心板,ARM中量級(jí)多面手
NVIDIA GPU助力科研人員探索外星世界
深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異

評(píng)論