ARM在中國的分支“安謀中國”此前雖然陷入了尷尬的人事動亂,但在技術和產品層面,ARM中國還是很有兩把刷子的,這幾年也結出了累累碩果。
昨天,ARM中國正式發(fā)布了“周易”Z2 AIPU,一顆針對深度學習而自主研發(fā)的創(chuàng)新性AI專用處理器(AI Processing Unit)。
它的單核算力最高可達4TOPS(每秒4萬億次計算),相比上代“周易”Z1 AIPU提升了一倍,同時可擴展至最多32個核心,從而能在單個SoC中實現(xiàn)128TOPS的強大算力。
2018年11月,ARM中國發(fā)布了名為“周易”的人工智能平臺,“周易”Z1 AIPU也是ARM中國合資公司成立后第一款正式對外發(fā)布的本土研發(fā)IP產品。
該平臺得到了很多中國客戶的信賴,多家廠商等已經完成相關產品研發(fā)和流片,比如全志科技的R329 AI語音專用芯片。
“周易”Z2 AIPU延用了此前的架構,并在微架構上進行優(yōu)化,芯片面積減少30%,運行部分神經網(wǎng)絡模型時,相同算力配置下的性能提升可達100%,效率翻了一番。
內存子系統(tǒng)也進行了優(yōu)化,并升級了高級帶寬節(jié)省技術(ABST),除了上代已有的權重壓縮(weight compression),還新增加了feature map壓縮技術。
它提供三種配置,分別是:4TOPS算力的Z2-1104、2TOPS算力的Z2-1002、1TOPS算力的Z2-0901。目前,LAC版本開發(fā)已完成,所有配置的EAC版本將在年底前向中國客戶提供。
“周易”Z2 AIPU主要面向中高端安防、智能座艙和ADAS、邊緣服務器等應用場景,客戶芯片預計2021年面世。
“周易”AIPU針對人工智能計算定義了一套新的適用于AI算法的指令集,通過指令驅動向量處理單元、固定AI算法處理單元,從而完成各種復雜網(wǎng)絡的組合的操作,支持各種AI計算,并具有很好的安全性。
它既有完全的可編程性,同時又有固定AI算力單元的高效率性,構成了相對平衡的平臺型AI解決方案,還有仿真器、編譯器、調試器等全套開發(fā)工具,支持ARM NN、安卓NN等流行接口,TensorFlow、ONNX等主流AI框架,以及合作伙伴的自有OS、Runtime框架。
責編AJX
-
處理器
+關注
關注
68文章
19896瀏覽量
235228 -
ARM
+關注
關注
134文章
9353瀏覽量
377564 -
AI
+關注
關注
88文章
35164瀏覽量
279947 -
深度學習
+關注
關注
73文章
5561瀏覽量
122794
發(fā)布評論請先 登錄
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)
“周易”NPU處理器成功運行DeepSeek-R1模型
恩智浦i.MX 94應用處理器如何變革工業(yè)和汽車連接
恩智浦發(fā)布i.MX 94系列應用處理器
NPU與傳統(tǒng)處理器的區(qū)別是什么
TAS5720MEVM Z1/Z2/C11/C12是如何計算得出的?
如何學習ARM?
針對TI汽車處理器新的SAFERTOS庫評估包

ARM處理器的尋址方式
ARM處理器的寄存器組織及功能
ARM處理器和CISC處理器的區(qū)別
ARM處理器的結構和特點
ARM處理器概述和發(fā)展歷程
OMAP5912應用處理器數(shù)據(jù)表

評論