chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構,性能提升四倍

花茶晶晶 ? 來源:電子發(fā)燒友 ? 作者:黃晶晶 ? 2024-04-16 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網報道(文/黃晶晶)在嵌入式領域,邊緣與端側AI推理需求不斷增長,Arm既有Helium 技術使 CPU 能夠執(zhí)行更多計算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器,以滿足更高性能和更復雜的 AI 工作負載。Ethos-U NPU系列是業(yè)界首款 AI 微加速器,英飛凌、恩智浦半導體、奇景光電 (Himax)、Alif Semiconductor 和 Synaptics 等領先企業(yè)均已推出搭載 Ethos-U 的量產芯片。最近,Arm發(fā)布Arm Ethos-U85 AI加速器,這款加速器在性能、算力、應用場景方面進一步拓展,著眼于未來幾年的邊緣AI的應用所需。

全新Arm Ethos-U85 AI加速器

與上一代產品相比,Ethos-U85 性能提升四倍,能效提高 20%,它支持MAC 單元從 128 個擴展到 2048 個(在 1GHz 時,算力實現 4 TOPs)。Ethos-U85 提供了相同的一致工具鏈,實現無縫的開發(fā)者體驗。全新 Ethos-U85 NPU 支持TensorFlow Lite 和 PyTorch 等 AI 框架。Ethos-U85可滿足于智能家居、零售、工業(yè)等新興的邊緣 AI 場景對更高性能計算的需求。

wKgZomYclwuAXCUGAAKIwINsqQs457.png
圖:Arm Ethos-U85 提供卓越的神經網絡加速功能


Ethos-U85支持Transformer 架構和卷積神經網絡 (CNN) 以實現 AI 推理。Arm 物聯網事業(yè)部業(yè)務拓展副總裁馬健Chloe Ma分析,Ethos-U85 不僅僅提供卷積神經網絡 (CNN) 所需的權重矩陣乘的運算,還支持矩陣相乘,這是 Transformer 架構網絡的一個基本組成部分。Ethos-U85 增加對Transformer 架構網絡的支持,這是優(yōu)化大模型邊緣落地微調時間、提升模型泛化的一個關鍵特性。

馬健表示:“基于 Transformer 的模型具有優(yōu)異的泛化功能,它將更快地驅動新 AI 應用的發(fā)展。Transformer 在視覺和生成式 AI 用例中,比如視頻理解、圖文結合,圖像增強與生成、圖像分類和目標檢測等方面都極有價值。Transformer 架構網絡的注意力機制容易利用并行計算來實現,提高硬件使用效率,使得這些模型能夠部署在計算資源有限的邊緣設備上。開發(fā)者可以通過選用針對 Transformer 架構網絡優(yōu)化的設計,發(fā)掘邊緣 AI 的新機遇,使這些應用享有更快的推理、更優(yōu)化的模型性能和可擴展性?!?br />
Ethos-U85 不僅支持低功耗MCU的AI加速。在高性能邊緣計算系統(tǒng)中,Ethos-U85與Armv9 Cortex-A CPU相結合,為基于應用處理器智能物聯網平臺上運行的AI任務實現加速。這將使 Ethos-U85 能夠在工業(yè)機器視覺、邊緣網關、可穿戴設備和消費類機器人等應用中,帶來高效能的邊緣推理。

全新Arm Corstone-320智能物聯網參考設計平臺

Corstone-320 包含了 Cortex-M 系列最高性能的嵌入式處理器 Cortex-M85,Ethos-U85 NPU AI 加速器以及Arm Mali-C55 ISP等,以實現為視覺應用優(yōu)化的低功耗系統(tǒng)。與此前推出的Arm物聯網參考設計一致,Corstone-320 不僅僅提供芯片計算子系統(tǒng) IP 組合,還附帶了軟件、AI 模型庫和開發(fā)工具,以實現軟件的復用,同時也利用了 Arm 強大的生態(tài)系統(tǒng)。它還附帶了仿真 Corstone-320 完整系統(tǒng)的 Arm 虛擬硬件,以及單獨的 CPU 和 NPU 的固定虛擬平臺 (FVP) 模型,以簡化開發(fā)并加速產品設計,支持軟硬件并行協同開發(fā)。這種提供邊緣 AI 和智能物聯網計算子系統(tǒng)全套軟硬件和工具鏈的方法,使得合作伙伴能夠在一系列性能點上快速開發(fā),并聚焦于打造差異化價值。

wKgZomYclyuAcbh3AAE7eIyZSLw925.png
圖:Arm 助力加速邊緣 AI 設備部署進程


馬健介紹,全新的參考設計是針對實際工作負載開發(fā)的,參考用例包括部署在智能家居中的電池供電攝像系統(tǒng),以及在工業(yè)和零售系統(tǒng)中的低幀率網絡攝像頭。同時,Corstone-320 參考設計提供了有安全保證的軟硬件組合,使得在此參考設計基礎上開發(fā)的合作伙伴們能夠順利地通過 PSA Certified Level 2 認證,實現對區(qū)域和全球安全標準的合規(guī)。總之,通過 Corstone-320 預先集成、預先驗證的參考設計模版,Arm 能幫助合作伙伴減少邊緣智能芯片開發(fā)的成本和時間。

基于 Arm 平臺的 AI 軟件生態(tài)系統(tǒng)

“只有 Arm 計算平臺才能提供 AI 從云到端、現代敏捷開發(fā)和部署流程中所需的特性和功能,實現基于量產驗證的一致架構,并采用統(tǒng)一工具鏈完成AI 轉型?!瘪R健說道。實際上,一致性的工具鏈和平臺對于開發(fā)者而言非常重要,尤其是面對物聯網碎片化,加上AI功能引入的復雜性,如果缺少一個良好的生態(tài)、工具支持,將耗費開發(fā)者大量的開發(fā)時間。

隨著邊緣 AI 的持續(xù)擴展,簡單易用才更適于普及推廣,因此物聯網生態(tài)鏈上下游的芯片與系統(tǒng)供應商、算法軟件開發(fā)者與集成商們匯聚在Arm計算平臺。目前,包括開發(fā)者、數據科學家、學術界在內的 AI 研究開發(fā)社區(qū),不僅持續(xù)受益于 Arm 生態(tài)系統(tǒng)與合作伙伴提供的豐富信息與知識,也圍繞 Arm 計算平臺構建日益增長的軟件和工具生態(tài)系統(tǒng),以及開源軟件庫和 AI 框架,以更簡化的開發(fā)流程,擴展邊緣 AI 的部署。

wKgZomYclzqAGsH9AAFhwlxkXtU102.png
圖:基于 Arm 平臺的 AI 軟件生態(tài)系統(tǒng)

馬健舉例說:“大家熟知的 PyTorch 開源 ML 框架,廣泛用于構建和訓練神經網絡模型,而我們也很高興看到 PyTorch 基金會投資邊緣 AI,發(fā)布針對移動和邊緣設備推理工具包 ExecuTorch,提供了輕量級運行時 (Runtime) 和算子注冊表,覆蓋了PyTorch生態(tài)系統(tǒng)中的各類模型。此外,由于 Arm 特有的 IP 授權許可模式和開放生態(tài),OEM 和 ODM 可以有多種基于 Arm 架構和計算平臺的芯片與模組選擇,更靈活地開發(fā)適于最終應用的系統(tǒng)方案?!?br />
小結:

隨著邊緣 AI 的持續(xù)發(fā)展,Arm 始終處于推動市場和技術進步的核心地位,從 Cortex-M 嵌入式處理器的 Helium 矢量增強指令集,到 Cortex-A 應用處理器的 SVE、SVE2、SME 對矢量和矩陣運算的優(yōu)化,再到 Ethos-U AI 加速器,Arm 不斷豐富產品線并拉高性能。

馬健表示,Arm 不會止步于此。隨著大模型持續(xù)通過量化、剪枝和聚類技術來縮減優(yōu)化模型,使大模型適于在邊緣和超級終端設備部署,Arm認為大小模型云邊端結合成為未來 AI 產品的重要發(fā)展趨勢,也是 AI 應用賦能行業(yè)發(fā)展的重要方向。而 Arm 已經為此做好準備,來挑戰(zhàn)物聯網與大模型、多模態(tài) AI 結合的性能與效率極限。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9450

    瀏覽量

    385739
  • AI
    AI
    +關注

    關注

    88

    文章

    37028

    瀏覽量

    290081
  • AI加速器
    +關注

    關注

    1

    文章

    73

    瀏覽量

    9311
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    BPI-AIM7 RK3588 AI與 Nvidia Jetson Nano 生態(tài)系統(tǒng)兼容的低功耗 AI 模塊

    RK3588 提供支持,其性能優(yōu)于 Jetson Nano: 更快的 CPU,性能提升四倍 充足的 LPDDR4X 內存,比 Jetson
    發(fā)表于 10-11 09:08

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現深度學習AI芯片的創(chuàng)新方法與架構

    乘法的新型架構 基于Transformer模型的高性能FPGA加速器。 4.2基于常微分方程的加速 5、基于ASIC的大模型計算 5.1 S
    發(fā)表于 09-12 17:30

    Arm神經技術是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經加速器的技術,移動設備上實現PC級別的AI圖形性能

    Arm 神經技術是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經加速器的技術,首次在移動設備上實現 PC 級別的 AI 圖形性能,為未來的端側
    的頭像 發(fā)表于 08-14 17:59 ?2349次閱讀

    Alif Semiconductor發(fā)布支持生成AI的MCU基準測試結果,鞏固其在邊緣AI領域的領先地位

    ·?Ensemble E4/E6/E8 MCU和融合處理搭載領先的邊緣AI加速器——Arm Ethos
    的頭像 發(fā)表于 08-13 15:39 ?2.2w次閱讀
    Alif Semiconductor發(fā)布<b class='flag-5'>支持</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的MCU基準測試結果,鞏固其在<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>領域的領先地位

    Synaptics發(fā)布高性能AI MCU,推動邊緣計算新突破

    新突思科技發(fā)布SR系列高性能自適應微控制(MCU),基于Astra?原生AI平臺,專為邊緣AI情境感知設計。該系列
    的頭像 發(fā)表于 04-23 10:00 ?886次閱讀
    Synaptics發(fā)布高<b class='flag-5'>性能</b><b class='flag-5'>AI</b> MCU,<b class='flag-5'>推動</b><b class='flag-5'>邊緣</b>計算新突破

    RK3588核心板在邊緣AI計算中的顛覆性優(yōu)勢與場景落地

    與低功耗。相比傳統(tǒng)核A72方案(如RK3399),單線程性能提升80%,多線程任務處理能力翻倍。 6TOPS獨立NPU: 支持INT8/INT16混合精度計算,可直接部署YOLOv
    發(fā)表于 04-15 10:48

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手

    AI巨頭強強聯手,勢必為智能體化AI體驗時代按下超級加速鍵。 AI終端的下一步是“普適智能”,而不是“極限性能”。聯發(fā)科憑借天璣9400+強
    發(fā)表于 04-13 19:52

    全新STM32MP257開發(fā)板震撼發(fā)布!異核架構x接口豐富x邊緣AI,助力ARM嵌入工業(yè)4.0應用!

    全新STM32MP257開發(fā)板震撼發(fā)布!異核架構x接口豐富x邊緣AI,助力ARM嵌入工業(yè)4.0
    發(fā)表于 04-12 12:04

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計算與嵌入開發(fā)

    低功耗特性。搭載 Renesas 獨有的 DRP-AI 加速器,支持 15 Sparse TOPS的 AI 計算能力,使其在計算機視覺、邊緣
    發(fā)表于 03-19 17:54

    Banana Pi 與瑞薩電子攜手共同推動開源創(chuàng)新:BPI-AI2N

    ?-M33(200MHz),并集成 Renesas 獨有的 DRP-AI 加速器,支持 15 Sparse TOPS AI 計算能力,專為計算機視覺、
    發(fā)表于 03-12 09:43

    Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能效與先進 AI 能力賦能物聯網革新

    架構的超高能效 CPU——Arm Cortex-A320 以及對 Transformer 網絡具有原生支持Ethos-U85
    的頭像 發(fā)表于 03-06 11:43 ?1616次閱讀
    <b class='flag-5'>Arm</b> 推出 Armv9 <b class='flag-5'>邊緣</b> <b class='flag-5'>AI</b> 計算平臺,以超高能效與先進 <b class='flag-5'>AI</b> 能力賦能物聯網革新

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    。? AI加速器的開發(fā):FPGA被廣泛用于開發(fā)專為AI算法優(yōu)化的加速器,例如深度學習推理加速器。這種定制化的硬件設計能夠顯著
    發(fā)表于 03-03 11:21

    Arm推出全球首個Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺以 Cortex-A320 CPU 和 Ethos-U85 NPU 為核心,專為物聯網應用優(yōu)化,支持運行超 10 億參數的端側
    的頭像 發(fā)表于 02-27 17:08 ?1087次閱讀

    AI賦能邊緣網關:開啟智能時代的新藍海

    。這一變革不僅帶來了技術架構的革新,更為產業(yè)發(fā)展開辟了新的增長空間。 傳統(tǒng)邊緣網關受限于計算能力和算法支持,往往只能完成數據采集和簡單處理,大量原始數據需要回傳云端處理,導致響應延遲和帶寬壓力。
    發(fā)表于 02-15 11:41

    聚云科技榮獲亞馬遜云科技生成AI能力認證 助力企業(yè)加速生成AI應用落地

    、數據處理、模型調優(yōu)到應用集成與部署等方面,助力企業(yè)加速生成AI應用落地。此外,聚云科技還基于亞馬遜云科技打造RAGPro企業(yè)知識庫、
    發(fā)表于 02-14 13:41 ?241次閱讀