chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在Arm Ethos-U85上使用ExecuTorch

Arm社區(qū) ? 來源:Arm社區(qū) ? 2025-02-14 14:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 工程部應(yīng)用機器學(xué)習(xí)總監(jiān) Robert Elliott、Arm 工程部首席工程師 Fredrik Knutsson、Arm 物聯(lián)網(wǎng)事業(yè)部技術(shù)管理總監(jiān) Mark Quartermain

在快速發(fā)展的機器學(xué)習(xí)領(lǐng)域,PyTorch 憑借其靈活性和全面的生態(tài)系統(tǒng),已成為模型開發(fā)的熱門框架。Arm 與 Meta 合作在 ExecuTorch 中引入了對 Arm 平臺的支持,進一步簡化了模型算法開發(fā)過程,實現(xiàn)無縫在邊緣側(cè)設(shè)備上部署 PyTorch 模型。

ExecuTorch 對 Ethos-U85 的支持

高性能的 Arm Ethos-U85 NPU 可滿足在邊緣側(cè)日益增長的運行先進人工智能 (AI) 推理工作負(fù)載的需求,包括諸如大語言模型等基于 Transformer 的網(wǎng)絡(luò)。Arm 針對 Ethos-U 提供參考設(shè)計,如 Arm Corstone-320 物聯(lián)網(wǎng)參考設(shè)計平臺,以加速和簡化芯片開發(fā)周期。參考設(shè)計平臺中包含固定虛擬平臺 (FVP) 等許多項目,F(xiàn)VP 可仿真整個系統(tǒng),為 Ethos-U85 平臺上進行前沿的嵌入式軟件開發(fā)和神經(jīng)網(wǎng)絡(luò)部署提供支持。

Arm 通過在 Ethos-U85 上支持 ExecuTorch 測試版,為開發(fā)者構(gòu)建物聯(lián)網(wǎng)邊緣側(cè)應(yīng)用提供了更多支持。開發(fā)者可以借助 ExecuTorch,高效地部署原生開發(fā)的 PyTorch 模型,基于 Arm 平臺構(gòu)建出智能且響應(yīng)迅速的物聯(lián)網(wǎng)解決方案。

隨著該軟件包的推出,想要創(chuàng)建邊緣側(cè) AI 應(yīng)用的開發(fā)者能夠在平臺上市前數(shù)月就開始模型和應(yīng)用的軟件開發(fā)工作。

在 Ethos-U85 上開始使用 ExecuTorch

ExecuTorch GitHub 公共代碼倉庫中提供了完整的開發(fā)環(huán)境。其中包含一個集成且經(jīng)過測試的開發(fā)流程和所有必要組件。

三個簡單的步驟如下所示:

設(shè)置 ExecuTorch

https://pytorch.org/executorch/main/getting-started-setup.html

設(shè)置 Arm Build 環(huán)境

https://pytorch.org/executorch/main/executorch-arm-delegate-tutorial.html

在 arm_executor_runner 上編譯并運行模型

https://pytorch.org/executorch/main/executorch-arm-delegate-tutorial.html#delegated-quantized-workflow

之后就可以在此流程的基礎(chǔ)上編譯和運行模型,從 Ethos-U85 驅(qū)動程序采集周期數(shù)信息等運行時行為。

為了讓最終用戶更輕松地完成此過程,Arm 還向 ExecuTorch 代碼倉庫貢獻了腳本:

設(shè)置 ExecuTorch

setup.sh:下載必要的軟件

https://github.com/pytorch/executorch/blob/main/examples/arm/setup.sh

run.sh:在 Corstone-320 FVP 上編譯并運行模型

https://github.com/pytorch/executorch/blob/main/examples/arm/run.sh

要構(gòu)建其他模型,可使用提前編譯器腳本 aot_arm_compiler.py,它能將 PyTorch 項目代碼 (nn.module) 轉(zhuǎn)換為 ExecuTorch 項目代碼(.pte flatbuffer 文件)。

腳本鏈接:

https://github.com/pytorch/executorch/blob/main/examples/arm/aot_arm_compiler.py

要編寫使用 ExecuTorch 的自定義應(yīng)用,可以按照示例 executor_runner 應(yīng)用中的應(yīng)用流程進行操作。

示例 executor_runner 應(yīng)用鏈接:

https://github.com/pytorch/executorch/tree/main/examples/arm/executor_runner

隨著陸續(xù)支持更多算子,我們將能夠支持更多的 PyTorch 模型。后續(xù)添加的更多功能,將通過 pytorch.org 上的 Ethos-U 教程材料進行演示。

Ethos-U 教程:

https://pytorch.org/executorch/main/index.html

部署流程的詳細(xì)工作原理

利用 ExecuTorch 的可擴展性和 Arm 的張量算子集架構(gòu) (TOSA) 的特性,Arm 在 ExecuTorch 中實現(xiàn)了 Ethos-U 支持。Ethos-U 編譯器 Vela 已通過 TOSA 前端得到增強,可以為 Ethos-U 系列中的所有產(chǎn)品編譯模型。

為了將這些組件整合為一個連貫的工作流程,需要遵循以下步驟:

將 PyTorch 模型轉(zhuǎn)換為可部署的 ExecuTorch 程序(AOT 流程)

將 ExecuTorch 程序編譯為可執(zhí)行文件,以便部署在 Corstone-320 上(運行時流程)

ExecuTorch 的 AOT 流程

此過程首先使用 PyTorch 的dynamo export 功能,將 PyTorch 模型轉(zhuǎn)換為量化的 TOSA 表示。然后,就能利用 Vela 編譯 TOSA 前端生成一組 Ethos-U 機器指令(稱為命令流)。接著,命令流被捆綁到 Executorch 程序中,由 flatbuffer 文件 (.pte) 表示。該文件中包含了 ExecuTorch 運行時使用 Ethos-U 硬件執(zhí)行推理所需的所有內(nèi)容。

c5bf9cb4-ea89-11ef-9310-92fbcf53809c.jpg

ExecuTorch 運行時流程

ExecuTorch 運行時以 C/C++ 編寫,可支持多種后端。Arm 對 ExecuTorch 運行時進行了擴展,以包含對 Ethos-U 設(shè)備驅(qū)動程序的支持。按照此流程操作,將生成一個獨立的經(jīng)過編譯的可執(zhí)行文件。在 Corstone-320 FVP 上部署可執(zhí)行文件非常簡單,只需要在調(diào)用 FVP 時使用適當(dāng)?shù)臉?biāo)志即可。

c5d19e00-ea89-11ef-9310-92fbcf53809c.jpg

Ethos-U85 和 Corstone-320

Ethos-U 系列 NPU 為邊緣側(cè) AI 提供高性能、高能效的解決方案。Ethos-U55(同樣受 ExecuTorch 支持)廣泛應(yīng)用于眾多 Arm Cortex-M 異構(gòu)系統(tǒng),而 Ethos-U65 則將 Ethos-U 系列的適用性擴展到基于 Cortex-A 的系統(tǒng),并提升了性能。

Ethos-U85 進一步擴展了 Ethos-U 產(chǎn)品線,支持當(dāng)前以及未來更多使用 Transformer 神經(jīng)網(wǎng)絡(luò)架構(gòu)的邊緣側(cè)工作負(fù)載。與前代產(chǎn)品相比,Ethos-U85 的性能提升了四倍,能效提高了 20%,在主流神經(jīng)網(wǎng)絡(luò)上的利用率高達 85%。

Ethos-U85 的顯著特性包括:

配置范圍從 128 到 2048 MAC/周期,在 1GHz 下可提供高達 4 TOP/s 的性能。

兼容基于 Cortex-A 和 Cortex-M 的系統(tǒng)。

通過支持 TOSA,對主要的神經(jīng)網(wǎng)絡(luò)提供原生支持。

可對主要的神經(jīng)網(wǎng)絡(luò)進行全面硬件加速。

完整列表請參閱 Ethos-U85 技術(shù)概述

https://developer.arm.com/documentation/102684/0000

未來規(guī)劃

Arm 會陸續(xù)增加新的算子支持,擴展 ExecuTorch 核心 ATen 算子的覆蓋范圍,并支持更多模型在 Ethos-U 上運行。Arm 將持續(xù)專注于提高性能,以確保模型在 Ethos-U 上高效運行。

ExecuTorch 委托框架支持將 Ethos-U 不支持的算子回調(diào)到 CPU 上運行,使用參考內(nèi)核執(zhí)行。Arm 致力于使用 CMSIS-NN 在 Cortex-M CPU 上實現(xiàn)卓越性能,為回調(diào)算子提供更好的支持,并確保在沒有 Ethos-U 功能的設(shè)備上也能實現(xiàn)良好性能。

上述的軟件包和 Corstone-320 FVP 是 Arm 在簡化應(yīng)用開發(fā)道路上邁出的又一步,歡迎各位開發(fā)者繼續(xù)探索代碼和構(gòu)建過程,并向 Arm 提供反饋意見。同時,Arm 也致力于支持更多特性和模型,并盡可能充分發(fā)揮硬件性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9353

    瀏覽量

    377577
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    279979
  • 開發(fā)環(huán)境
    +關(guān)注

    關(guān)注

    1

    文章

    242

    瀏覽量

    17124
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134622

原文標(biāo)題:三步輕松上手!在 Arm Ethos-U85 上使用 ExecuTorch

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    何在STM32實現(xiàn)USB主機讀寫U盤文件

    在項目應(yīng)用中,經(jīng)常會有對外交換數(shù)據(jù)的需求。USB接口讀寫U盤無疑是一種頗為方便的選擇。在這一篇中,我們就來討論如何在STM32實現(xiàn)USB主機讀寫U盤文件的方法。
    的頭像 發(fā)表于 12-13 17:20 ?1.6w次閱讀
    如<b class='flag-5'>何在</b>STM32<b class='flag-5'>上</b>實現(xiàn)USB主機讀寫<b class='flag-5'>U</b>盤文件

    Arm推動生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    等領(lǐng)先企業(yè)均已推出搭載 Ethos-U 的量產(chǎn)芯片。最近,Arm發(fā)布Arm Ethos-U85 AI加速器,這款加速器在性能、算力、應(yīng)用場景方面進一步拓展,著
    的頭像 發(fā)表于 04-16 09:10 ?5315次閱讀
    <b class='flag-5'>Arm</b>推動生成式AI落地邊緣!全新<b class='flag-5'>Ethos-U85</b> AI加速器支持Transformer 架構(gòu),性能提升四倍

    介紹一種Arm ML嵌入式評估套件

    是一個開源 Python 工具,可將 TFLite NN 模型編譯為可在包含 Arm Ethos-U NPU 的嵌入式系統(tǒng)運行的優(yōu)化版本。您可以通過運行 $pip install
    發(fā)表于 08-12 15:35

    Arm Ethos-U NPU應(yīng)用程序開發(fā)概述

    到嵌入式系統(tǒng)中,并使用兩個Arm連接到嵌入式或外部存儲器AMBA 5 AXI接口,M0和M1。 ?為了優(yōu)化Ethos-U NPU的性能,AXI接口M0應(yīng)連接到高速、低延遲存儲器,如SRAM。內(nèi)存用于
    發(fā)表于 08-02 06:37

    Arm Ethos-U NPU處理器入門指南

    感謝您使用Arm Ethos-U NPU處理器系列。為您提供最好的使用Arm Ethos-U NPU開發(fā)機器學(xué)習(xí)(ML)應(yīng)用程序的經(jīng)驗設(shè)計我們的工具,使軟件工程變得簡單高效。此外,
    發(fā)表于 08-08 06:17

    ARM正式發(fā)布了針對物聯(lián)網(wǎng)設(shè)備的AI芯片設(shè)計——Cortex-M55

    此外ARM還發(fā)布了一款神經(jīng)處理單元Ethos-U55,Ethos-U55 NPU旨在加快機器學(xué)習(xí),而U55的設(shè)計將更加精簡,且只能與較新的Cortex-M處理器(如M55、M33、M7
    的頭像 發(fā)表于 02-13 07:35 ?3508次閱讀

    Arm推出新一代Ethos-U AI加速器及全新物聯(lián)網(wǎng)參考設(shè)計平臺

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)今日宣布推出 Arm Ethos-U85 神經(jīng)網(wǎng)絡(luò)處理器 (NPU),是
    的頭像 發(fā)表于 04-09 17:02 ?1237次閱讀
    <b class='flag-5'>Arm</b>推出新一代<b class='flag-5'>Ethos-U</b> AI加速器及全新物聯(lián)網(wǎng)參考設(shè)計平臺

    Arm Ethos-U85:滿足物聯(lián)網(wǎng)面向AI時代的高性能需求

    隨著人工智能 (AI) 不斷對我們的日常生活產(chǎn)生越來越大的影響,其推理任務(wù)也逐漸從云端遷移到邊緣側(cè)和端側(cè)。
    的頭像 發(fā)表于 04-09 17:04 ?1777次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>:滿足物聯(lián)網(wǎng)面向AI時代的高性能需求

    Arm發(fā)布第三代NPU,適用于工業(yè)自動化等場景,性能提升四倍

    Ethos-U85 在能源效率上相比前作提高了 20%,且可兼容常用神經(jīng)網(wǎng)絡(luò)以達 85% 的利用率。其設(shè)計適配基于 Arm Cortex-M / A 處理器內(nèi)核的系統(tǒng),對內(nèi)存延遲有較強適應(yīng)性。
    的頭像 發(fā)表于 04-12 16:13 ?1276次閱讀

    Arm推第三代邊緣AI加速器:Arm Ethos-U85

    除了Ethos-U85之外,Arm還推出了全新的物聯(lián)網(wǎng)參考設(shè)計平臺Corstone-320。該平臺將Arm最高性能的Cortex-M85 CPU、Mali-C55圖像信號處理器和
    發(fā)表于 04-16 11:09 ?992次閱讀
    <b class='flag-5'>Arm</b>推第三代邊緣AI加速器:<b class='flag-5'>Arm</b> <b class='flag-5'>Ethos-U85</b>

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國產(chǎn)CPU市場

    Arm發(fā)布的新一代Ethos-U AI加速器確實在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?1178次閱讀

    何在DRA821U使用Linux實現(xiàn)快速引導(dǎo)

    電子發(fā)燒友網(wǎng)站提供《如何在DRA821U使用Linux實現(xiàn)快速引導(dǎo).pdf》資料免費下載
    發(fā)表于 09-03 10:11 ?0次下載
    如<b class='flag-5'>何在</b>DRA821<b class='flag-5'>U</b><b class='flag-5'>上</b>使用Linux實現(xiàn)快速引導(dǎo)

    ArmExecuTorch合作加速端側(cè)生成式AI實現(xiàn)

    Arm 正在與 Meta 公司的 PyTorch 團隊攜手合作,共同推進新的 ExecuTorch 測試版 (Beta) 上線,旨在為全球數(shù)十億邊緣側(cè)設(shè)備和數(shù)百萬開發(fā)者提供人工智能 (AI) 和機器學(xué)習(xí) (ML) 功能,進而確保 AI 真正的潛力能被最廣泛的設(shè)備和開發(fā)者所
    的頭像 發(fā)表于 11-15 11:30 ?795次閱讀

    基于Arm Ethos-U85 NPU部署小語言模型

    隨著人工智能 (AI) 的演進,人們對使用小語言模型 (SLM) 在嵌入式設(shè)備執(zhí)行 AI 工作負(fù)載的興趣愈發(fā)高漲。
    的頭像 發(fā)表于 01-20 09:53 ?552次閱讀

    Arm推出全球首個Armv9邊緣AI計算平臺

    全球首個 Armv9 邊緣 AI 計算平臺以 Cortex-A320 CPU 和 Ethos-U85 NPU 為核心,專為物聯(lián)網(wǎng)應(yīng)用優(yōu)化,支持運行超 10 億參數(shù)的端側(cè) AI 模型,已獲得包括亞馬遜云科技 (AWS)、西門子和瑞薩電子等在內(nèi)的多家行業(yè)領(lǐng)先企業(yè)的支持。
    的頭像 發(fā)表于 02-27 17:08 ?888次閱讀