chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在開發(fā)平臺上使用VITIS AI加速AI應(yīng)用

星星科技指導(dǎo)員 ? 來源:嵌入式計算設(shè)計 ? 作者:Vaibhav Kothari ? 2022-07-01 14:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

VITIS 是一個用于開發(fā)軟件和硬件的統(tǒng)一軟件平臺,使用 Vivado 和其他用于 Xilinx FPGA SoC 平臺(如 ZynqMP UltraScale+ 和 Alveo 卡)的組件。VITIS SDK 的關(guān)鍵組件 VITIS AI 運行時 (VART) 為在邊緣和云上部署終端 ML/AI 應(yīng)用程序提供了統(tǒng)一的接口。

機器學(xué)習(xí)中的推理是計算密集型的,需要高內(nèi)存帶寬和高性能計算,以滿足各種終端應(yīng)用程序的低延遲和高吞吐量要求。

Vitis AI 工作流程

Xilinx Vitis AI 提供了一個工作流,可使用簡單的流程在 Xilinx 深度學(xué)習(xí)處理單元 (DPU) 上部署深度學(xué)習(xí)推理應(yīng)用程序:

poYBAGK-kzmASgm-AAFdYdCFZ3o399.png

深度處理單元 (DPU) 是一種可配置的計算引擎,針對深度學(xué)習(xí)推理應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了優(yōu)化,并置于可編程邏輯 (PL) 中。DPU 包含高效且可擴(kuò)展的 IP 內(nèi)核,可進(jìn)行定制以滿足許多不同應(yīng)用的需求。DPU 定義自己的指令集,Vitis AI 編譯器生成指令。

VITIS AI 編譯器以優(yōu)化的方式調(diào)度指令以獲得可能的最大性能。

在 Xilinx ZynqMP UltraScale+ SoC 平臺上運行任何 AI 應(yīng)用程序的典型工作流程包括以下內(nèi)容:

模型量化

模型編譯

模型優(yōu)化(可選)

構(gòu)建 DPU 可執(zhí)行文件

構(gòu)建軟件應(yīng)用程序

集成 VITIS AI 統(tǒng)一 API

編譯和鏈接混合 DPU 應(yīng)用程序

在 FPGA 上部署混合 DPU 可執(zhí)行文件

人工智能量化器

AI Quantizer 是一種用于量化過程的壓縮工具,通過將 32 位浮點權(quán)重和激活轉(zhuǎn)換為定點 INT8。它可以在不丟失模型準(zhǔn)確信息的情況下降低計算復(fù)雜度。定點模型需要更少的內(nèi)存,因此比浮點實現(xiàn)提供更快的執(zhí)行和更高的功率效率。

pYYBAGK-k0OAcg51AAEUfHmRVjg505.png

人工智能編譯

AI 編譯器將網(wǎng)絡(luò)模型映射到高效的指令集和數(shù)據(jù)流。編譯器的輸入是量化的 8 位神經(jīng)網(wǎng)絡(luò),輸出是 DPU 內(nèi)核 - 可執(zhí)行文件將在 DPU 上運行。在這里,不支持的層需要部署在 CPU 中,或者可以自定義模型來替換和刪除那些不支持的操作。它還執(zhí)行復(fù)雜的優(yōu)化,例如層融合、指令調(diào)度和片上存儲器的重用。

一旦我們能夠執(zhí)行 DPU,我們需要使用 Vitis AI 統(tǒng)一 API 來初始化數(shù)據(jù)結(jié)構(gòu),初始化 DPU,在 CPU 上實現(xiàn) DPU 不支持的層,并在 CPU 上添加預(yù)處理和后處理PL/PS 的需求基礎(chǔ)。

poYBAGK-k0uAGNFoAAD_TpKOAM8422.png

人工智能優(yōu)化器

借助其模型壓縮技術(shù),AI Optimizer 可以將模型復(fù)雜度降低 5-50 倍,而對準(zhǔn)確性的影響最小。這種深度壓縮將推理性能提升到一個新的水平。我們可以實現(xiàn)所需的稀疏性并將運行時間減少 2.5 倍。

poYBAGK-k2CAB9qAAAGTFkNeeA4679.png

人工智能分析器

AI Profiler 可以幫助分析推理找到導(dǎo)致端到端管道瓶頸的警告。分析器為設(shè)計人員提供了 DPU/CPU/內(nèi)存的通用時間線。此過程不會更改任何代碼,并且可以跟蹤功能并進(jìn)行分析。

poYBAGK-k2eAHrZEAAKq6M1K_js563.png

人工智能運行時

VITIS AI 運行時 (VART) 允許應(yīng)用程序使用統(tǒng)一的高級運行時 API 進(jìn)行邊緣和云部署,使其無縫且高效。一些關(guān)鍵功能包括:

異步作業(yè)提交

異步作業(yè)收集

C++Python 實現(xiàn)

多線程和多進(jìn)程執(zhí)行

Vitis AI 還提供 DSight、DExplorer、DDump 和 DLet 等,用于執(zhí)行各種任務(wù)。

DSight & DExplorer

DPU IP 為特定內(nèi)核提供了多種配置,以根據(jù)網(wǎng)絡(luò)模型進(jìn)行選擇。DSight 告訴我們每個 DPU 核心的百分比利用率。它還提供了調(diào)度程序的效率,以便我們可以調(diào)整用戶線程。還可以查看每一層和每個 DPU 節(jié)點的性能數(shù)據(jù),例如 MOPS、運行時間和內(nèi)存帶寬。

Softnautics選擇賽靈思 ZynqMP UltraScale+ 平臺進(jìn)行高性能和計算部署。它提供最佳的應(yīng)用程序處理、高度可配置的 FPGA 加速功能和 VITIS SDK,以加速高性能 ML/AI 推理。我們針對的此類應(yīng)用之一是用于 Covid-19 篩查的面罩檢測。其目的是為戴口罩的人的 Covid-19 篩查部署多流推理,并根據(jù)各國政府對 Covid-19 預(yù)防措施指南的要求,實時識別違規(guī)行為。

pYYBAGK-k3GAIfo6AADA8d6GKDw058.png

我們準(zhǔn)備了一個數(shù)據(jù)集并選擇了預(yù)訓(xùn)練的權(quán)重來設(shè)計一個用于掩碼檢測和篩選的模型。我們通過 TensorFlow 框架訓(xùn)練和修剪我們的自定義模型。這是面部檢測和面具檢測的兩階段部署。如此獲得的訓(xùn)練模型通過前面章節(jié)中介紹的 VITIS AI 工作流程傳遞。與 CPU 相比,我們觀察到推理時間的 10 倍速度。Xilinx 提供了不同的調(diào)試工具和實用程序,它們在初始開發(fā)和部署期間非常有用。在我們最初的部署階段,我們沒有檢測到掩碼和非掩碼類別。我們嘗試將基于 PC 的推理輸出與名為 Dexplorer 的調(diào)試實用程序之一的輸出相匹配。但是,調(diào)試模式和根本原因?qū)е聠栴}進(jìn)一步調(diào)試。在運行量化器時,我們可以使用更大的校準(zhǔn)圖像、迭代和檢測來調(diào)整輸出,視頻輸入的準(zhǔn)確率約為 96%。我們還嘗試使用 AI 分析器識別管道中的瓶頸,然后采取糾正措施以通過各種方式消除瓶頸,例如使用 HLS 加速來計算后處理中的瓶頸。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11229

    瀏覽量

    223221
  • Xilinx
    +關(guān)注

    關(guān)注

    73

    文章

    2195

    瀏覽量

    130129
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38413

    瀏覽量

    297697
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 嵌入式與 AI 領(lǐng)域落地

    (ADAS); 嵌入式平臺AI 與機器學(xué)習(xí)加速器; 工業(yè)物聯(lián)網(wǎng)與自動化系統(tǒng)(開放標(biāo)準(zhǔn)架構(gòu)的優(yōu)勢能充分發(fā)揮)。 對咱們開發(fā)者來說,這波合作最大的好處就是能拿到集成式解決方案,不僅能縮
    發(fā)表于 12-18 12:01

    AMD Vitis AI 5.1測試版現(xiàn)已開放下載

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元( NPU )的支持。Vitis A
    的頭像 發(fā)表于 11-08 09:24 ?1045次閱讀

    AMD Vitis AI 5.1測試版發(fā)布

    AMD Vitis AI 5.1全新發(fā)布——新增了對 AMD Versal AI Edge 系列神經(jīng)網(wǎng)絡(luò)處理單元 (NPU) 的支持。Vitis A
    的頭像 發(fā)表于 10-31 12:46 ?548次閱讀

    OpenAI開源模型登陸IBM watsonx.ai開發(fā)平臺

    OpenAI 已向公眾發(fā)布了兩款 AI 模型,允許開發(fā)者和企業(yè)可自由下載、運行并進(jìn)行定制。其中一款模型現(xiàn)已部署 IBM watsonx.ai 開發(fā)
    的頭像 發(fā)表于 08-26 15:36 ?806次閱讀

    2.0.0版本的ST Edge AI Corelinux平臺上可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運行報錯,缺少文件,為什么?

    2.0.0版本的ST Edge AI Core工具linux平臺上應(yīng)該是可以把量化后的onnx模型轉(zhuǎn)換為.nb,但是運行報錯,缺少文件。
    發(fā)表于 06-17 06:29

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    儲備。然后介紹AI Agen的主流平臺,接著說明了扣子平臺開發(fā)AI Agent的流程和策略,然后對其插件、工作流、圖像流、知識庫等功能模塊進(jìn)
    發(fā)表于 05-14 19:51

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+初品Agent

    及企業(yè)的價值、開發(fā)Agent所需要掌握的基礎(chǔ)知識等。 工具篇,其涉及的內(nèi)容有: Agent開發(fā)平臺的演進(jìn)、國內(nèi)的主流開發(fā)
    發(fā)表于 04-22 11:51

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    基石。 Neuron Studio打造全流程一站式開發(fā)體驗,為AI應(yīng)用開發(fā)按下加速AI 應(yīng)用的開發(fā)
    發(fā)表于 04-13 19:52

    Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發(fā)

    RZ/V2N——近期嵌入式世界2025上新發(fā)布,為 AI 計算、嵌入式系統(tǒng)及工自動化提供強大支持。這款全新的計算平臺旨在滿足開發(fā)者和企業(yè)用戶對高性能、低功耗和靈活擴(kuò)展的需求。 [](
    發(fā)表于 03-19 17:54

    AI Agent 應(yīng)用與項目實戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    學(xué)習(xí)、自然語言處理(NLP)、計算機視覺(CV)等先進(jìn)技術(shù)提供的強大的數(shù)據(jù)處理和分析能力。 視頻應(yīng)用開發(fā)中,AI Agent可以用于視頻內(nèi)容分析、推薦、編輯等。 下面跟隨作者的指導(dǎo),使用語聚
    發(fā)表于 03-05 19:52

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    。? AI加速器的開發(fā):FPGA被廣泛用于開發(fā)專為AI算法優(yōu)化的加速器,例如深度學(xué)習(xí)推理
    發(fā)表于 03-03 11:21

    AI Agent應(yīng)用與項目實戰(zhàn)》閱讀體驗--跟著迪哥學(xué)Agent

    感謝電子發(fā)燒友的這次活動,讓我有幸抽中了《AI Agent應(yīng)用與項目實戰(zhàn)》(以下簡稱《Agent》)這本書的贈送。 收到書本之后我就迫不及待地學(xué)習(xí)書本中的知識。如果說依靠各種平臺上的文章了解關(guān)于AI
    發(fā)表于 03-02 12:28

    AI開發(fā)平臺模型怎么用

    AI開發(fā)平臺極大地簡化了AI應(yīng)用的開發(fā)流程,從環(huán)境搭建、模型訓(xùn)練到部署集成,每一步都提供了豐富的工具和資源。那么,
    的頭像 發(fā)表于 02-11 09:53 ?651次閱讀

    AI開發(fā)平臺如何賦能開發(fā)

    當(dāng)下,AI開發(fā)平臺通過提供豐富的工具集、優(yōu)化的開發(fā)環(huán)境以及高效的部署能力,極大地降低了AI應(yīng)用的開發(fā)
    的頭像 發(fā)表于 01-17 14:47 ?772次閱讀

    NVIDIA發(fā)布Cosmos平臺,加速物理AI開發(fā)

    )和機器人等物理AI系統(tǒng)的快速發(fā)展。 Cosmos平臺的核心在于其強大的生成式世界基礎(chǔ)模型,能夠模擬和預(yù)測復(fù)雜環(huán)境中的各種物理現(xiàn)象。結(jié)合高級tokenizer,Cosmos能夠高效地處理和分析大量數(shù)據(jù),為物理AI系統(tǒng)的決策提供有
    的頭像 發(fā)表于 01-13 11:06 ?1075次閱讀