chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AUTO插件和自動批處理的最佳實踐

OpenCV學堂 ? 來源:英特爾物聯(lián)網(wǎng) ? 作者:英特爾物聯(lián)網(wǎng) ? 2022-06-24 10:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1.1 概述

OpenVINO 2022.1是自O(shè)penVINO工具套件2018年首次發(fā)布以來最大的更新之一,參見《OpenVINO 迎來迄今為止最重大更新,2022.1新特性搶先看!》。在眾多新特性中,AUTO插件和自動批處理(Automatic-Batching)是最重要的新特性之一,它幫助開發(fā)者無需復雜的編程即可提高推理計算的性能和效率。

1.1.1 什么是AUTO插件?

AUTO插件1 ,全稱叫自動設(shè)備選擇(Automatic device selection),它是一個構(gòu)建在CPU/GPU插件之上的虛擬插件,如圖1-1所示。在OpenVINO 文檔中,“設(shè)備(device)”是指用于推理計算的 Intel 處理器,它可以是受支持的CPU、GPU、VPU(視覺處理單元)或 GNA(高斯神經(jīng)加速器協(xié)處理器)或這些設(shè)備的組合3 。

e09633e0-f301-11ec-ba43-dac502259ad0.png

圖1-1 OpenVINO Runtime支持的設(shè)備插件3

AUTO插件好處有:

■ 首先檢測運行時平臺上所有可用的計算設(shè)備,然后選擇最佳的一個計算設(shè)備進行推理計算,并根據(jù)深度學習模型和所選設(shè)備的特性以最佳配置使用它。

■使 GPU 實現(xiàn)更快的首次推理延遲:GPU 插件需要在開始推理之前在運行時進行在線模型編譯——可能需要 10 秒左右才能完成,具體取決于平臺性能和模型的復雜性。當選擇獨立或集成GPU時,“AUTO”插件開始會首先利用CPU進行推理,以隱藏此GPU模型編譯時間。

■使用簡單,開發(fā)者只需將compile_model()方法的device_name參數(shù)指定為“AUTO”即可,如圖1-2所示。

e0bb1fca-f301-11ec-ba43-dac502259ad0.png

圖1-2 指定AUTO插件

1.1.2 什么是自動批處理?

自動批處理(Automatic Batching)2 ,又叫自動批處理執(zhí)行(Automatic Batching Execution),是OpenVINO Runtime支持的設(shè)備之一,如圖1-1所示。

一般來說,批尺寸(batch size) 越大的推理計算,推理效率和吞吐量就越好。自動批處理執(zhí)行將用戶程序發(fā)出的多個異步推理請求組合起來,將它們視為多批次推理請求,并將批推理結(jié)果拆解后,返回給各推理請求。

自動批處理無需開發(fā)者手動指定。當compile_model()方法的config參數(shù)設(shè)置為{“PERFORMANCE_HINT”: ”THROUGHPUT”}時,OpenVINO Runtime會自動啟動自動批處理執(zhí)行,如圖1-3所示,讓開發(fā)人員以最少的編碼工作即可享受計算設(shè)備利用率和吞吐量的提高。

e0d5d298-f301-11ec-ba43-dac502259ad0.png

圖1-3 自動啟動自動批處理執(zhí)行

1.2 動手學AUTO插件的特性

讀書是學習,實踐也是學習,而且是更有效的學習。本文提供了完整的實驗代碼,供讀者一邊動手實踐,一邊學習總結(jié)。

Github地址: https://github.com/yas-sim/openvino-auto-feature-visualization

1.2.1 搭建實驗環(huán)境

第一步,克隆代碼倉到本地。

git clone https://github.com/yas-sim/openvino-auto-feature-visualization.git

第二步,在openvino-auto-feature-visualization路徑執(zhí)行:

python -m pip install --upgrade pip

pip install -r requirements.txt

第三步,下載模型并完成轉(zhuǎn)換

omz_downloader --list models.txt

omz_converter --list models.txt

到此,實驗環(huán)境搭建完畢。實驗程序的所有配置和設(shè)置參數(shù)都硬編碼在源代碼中,您需要手動修改源代碼以更改測試配置,如圖1-4所示。

e0f240a4-f301-11ec-ba43-dac502259ad0.png

圖1-4 手動修改源代碼中的配置

1.2.2 AUTO插件自動切換計算設(shè)備

GPU插件需要在 GPU 上開始推理之前將IR模型編譯為 OpenCL 模型。這個模型編譯過程可能需要很長時間,例如 10 秒,會延遲應(yīng)用程序開始推理,使得應(yīng)用程序啟動時的用戶體驗不好。

為了隱藏這種 GPU 模型編譯延遲,AUTO插件將在 GPU 模型編譯進行時使用CPU執(zhí)行推理任務(wù);當GPU模型編譯完成后,AUTO插件會自動將推理計算設(shè)備從CPU切換到GPU,如圖1-5所示。

e108dbac-f301-11ec-ba43-dac502259ad0.png

圖1-5 AUTO插件自動切換計算設(shè)備

1.2.3 動手觀察自動切換計算設(shè)備的行為

AUTO插件會依據(jù)設(shè)備優(yōu)先級1 : dGPU > iGPU > VPU > CPU, 來選擇最佳計算設(shè)備。當自動插件選擇 GPU 作為最佳設(shè)備時,會發(fā)生推理設(shè)備切換,以隱藏首次推理延遲。

請注意,設(shè)備切換前后的推理延遲不同;此外,推理延遲故障可能發(fā)生在設(shè)備切換的那一刻,如圖1-6所示。

請如圖1-6所示,設(shè)置auto-test-latency-graph.py配置參數(shù)為:

cfg['PERFORMANCE_HINT'] = ['THROUGHPUT', 'LATENCY'][0]

并運行命令:

python auto-test-latency-graph.py

同時打開Windows任務(wù)管理器,觀察CPU和iGPU的利用率。

e11adb04-f301-11ec-ba43-dac502259ad0.png

圖1-6 config={“PERFORMANE_HINT”:”THROUGPUT”}的執(zhí)行行為

1.2.4 PERFORMANCE_HINT設(shè)置

如1.1.2節(jié)所述,AUTO插件的執(zhí)行行為取決于compile_model()方法的config參數(shù)的PERFORMANCE_HINT設(shè)置,如表1-1所示:

表1-1 PERFORMANCE_HINT設(shè)置

e13ce636-f301-11ec-ba43-dac502259ad0.png

設(shè)置auto-test-latency-graph.py配置參數(shù)為:

cfg['PERFORMANCE_HINT'] = ['THROUGHPUT', 'LATENCY'][1]

并運行命令:

python auto-test-latency-graph.py

同時打開Windows任務(wù)管理器,觀察CPU和iGPU的利用率,運行結(jié)果如圖1-7所示。

e15161e2-f301-11ec-ba43-dac502259ad0.png

圖1-7 config={“PERFORMANE_HINT”:”LATENCY”}的執(zhí)行行為

通過實驗,我們可以發(fā)現(xiàn),根據(jù)不同的config參數(shù)設(shè)置,使得AUTO插件可以工作在不同的模式下:

■ 在Latency模式,不會自動啟動Auto Batching,執(zhí)行設(shè)備切換后,GPU上的推理延遲很小,且不會抖動。

■在THROUGHPUT模式,自動啟動Auto Batching,執(zhí)行設(shè)備切換后,GPU上的推理延遲較大,而且會抖動。

接下來,本文將討論Auto Batching對推理計算行為的影響。

1.3 動手學Auto Batching的特性

如1.1.2節(jié)所述,自動批處理執(zhí)行將用戶程序發(fā)出的多個異步推理請求組合起來,將它們視為多批次推理請求,并將批推理結(jié)果拆解后,返回給各推理請求,如圖1-8所示。

e193fda4-f301-11ec-ba43-dac502259ad0.png

圖1-8 Auto Batching的執(zhí)行過程

Auto Batching在收集到指定數(shù)量的異步推理請求或計時器超時(默認超時=1,000 毫秒)時啟動批推理計算(batch-inference),如圖1-9所示。

e1a10cf6-f301-11ec-ba43-dac502259ad0.png

圖1-9 啟動批推理計算

1.3.1 Auto Batching被禁止時

Auto Batching被禁止時,所有推理請求都是單獨被處理的。

請配置并運行auto-test.py。

Device: AUTO

Config: {'PERFORMANCE_HINT': 'LATENCY'}

niter: 20 , interval: 30 ms

OPTIMAL_NUMBER_OF_INFER_REQUESTS 1

Number of infer requests: 1

運行結(jié)果如圖1-10所示,可見每一個推理請求是被單獨處理的。

e1af22f0-f301-11ec-ba43-dac502259ad0.png

圖1-10 Auto Batching被禁止時的運行結(jié)果

1.3.2 Auto Batching被使能時

Auto Batching被使能時,異步推理請求將作為多批次推理請求進行綁定和處理。推理完成后,結(jié)果將分發(fā)給各個異步推理請求并返回。需要注意的是:批推理計算不保證異步推理請求的推理順序。

請配置并運行auto-test.py。

Device: GPU

Config: {'CACHE_DIR': './cache', 'PERFORMANCE_HINT': 'THROUGHPUT', 'ALLOW_AUTO_BATCHING': 'YES'}

niter: 200 , interval: 30 ms

OPTIMAL_NUMBER_OF_INFER_REQUESTS 64

Number of infer requests: 16

運行結(jié)果如圖1-11所示,可見每16個推理請求被組合成一個批次進行批推理計算,推理計算順序不被保證。

e1bf0756-f301-11ec-ba43-dac502259ad0.png

圖1-11 Auto Batching被使能時的運行結(jié)果

1.3.3 Auto Batching會導致推理延遲變長

由于較長的默認超時設(shè)置(默認timeout = 1,000ms),在低推理請求頻率情況下可能會引入較長的推理延遲。

由于Auto Batching將等待指定數(shù)量的推理請求進入或超時計時器超時,在低推理頻率的情況下,它無法在指定的超時時間內(nèi)收集足夠的推理請求來啟動批推理計算,因此,提交的推理請求將被推遲,直到計時器超時,這將引入大于timeout設(shè)置的推理延遲。

為解決上述問題,用戶可以通過 AUTO_BATCH_TIMEOUT 配置參數(shù)指定超時時間,以盡量減少此影響。

請使用AutoBatching的默認timeout,運行auto-test.py。

Device: GPU

Config: {'CACHE_DIR': './cache', 'PERFORMANCE_HINT': 'THROUGHPUT'}

niter: 20, interval: 300 ms

OPTIMAL_NUMBER_OF_INFER_REQUESTS 64

Number of infer requests: 64

運行結(jié)果如圖1-12所示,由于每次都無法在timeout時間內(nèi)收集到指定數(shù)量的推理請求,由此導致推理請求的延遲很高。

e1dc4758-f301-11ec-ba43-dac502259ad0.png

圖1-12 timeout=1000ms運行結(jié)果

請配置AutoBatching的timeout=100ms,然后運行auto-test.py。

Device: GPU

Config: {'CACHE_DIR': './cache', 'PERFORMANCE_HINT': 'THROUGHPUT', 'AUTO_BATCH_TIMEOUT': '100'}

niter: 20 , interval: 300 ms

OPTIMAL_NUMBER_OF_INFER_REQUESTS 64

Number of infer requests: 16

e1f47f08-f301-11ec-ba43-dac502259ad0.png

圖1-13 timeout=100ms運行結(jié)果

運行結(jié)果如圖1-13所示, timeout=100ms時間內(nèi),僅能收集到一個推理請求。

1.3.4 Auto Batching最佳實踐

綜上所述,Auto Batching的最佳編程實踐:

■ 要記住,默認情況下Auto Batching不會啟用。

■只有在以下情況時,Auto Batching才啟用:

{'PERFORMANCE_HINT': 'THROUGHPUT', 'ALLOW_AUTO_BATCHING': 'YES'}

■如果您的應(yīng)用程序能夠以高頻率連續(xù)提交推理請求,請使用自動批處理。

■警告:如果您的應(yīng)用間歇性地提交推理請求,則最后一個推理請求可能會出現(xiàn)意外的長延遲。

■如果推理節(jié)奏或頻率較低,即推理頻率遠低于AUTO_BATCH_TIMEOUT(默認為 1,000 毫秒),請勿開啟自動批處理。

■您可以使用AUTO_BATCH_TIMEOUT 參數(shù)更改自動批處理的超時設(shè)置,以最大限度地減少不需要的長延遲,參數(shù)值的單位是“ms”。

■如果您知道工作負載的最佳批處理大小,請使用PERFORMANCE_HINT_NUM_REQUESTS 指定適當?shù)呐幚頂?shù)量,即 {'PERFORMANCE_HINT_NUM_REQUESTS':'4'}。同時,以GPU為例,AUTO插件會在后臺根據(jù)可以使用的內(nèi)存,模型精度等計算出最佳批處理大小。

1.4 總結(jié)

本節(jié)給出AUTO 插件和Auto Batching的快速小結(jié),如表1-2所示。

表1-2 AUTO插件和自動批處理執(zhí)行快速小結(jié)表

e205742a-f301-11ec-ba43-dac502259ad0.png

本文GitHub源代碼鏈接:https://github.com/yas-sim/openvino-auto-feature-visualization

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Auto
    +關(guān)注

    關(guān)注

    0

    文章

    43

    瀏覽量

    15666
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5586

    瀏覽量

    123639

原文標題:OpenVINO? 2022.1中AUTO插件和自動批處理的最佳實踐 | 開發(fā)者實戰(zhàn)

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    生產(chǎn)環(huán)境中Kubernetes容器安全的最佳實踐

    隨著容器化技術(shù)的快速發(fā)展,Kubernetes已成為企業(yè)級容器編排的首選平臺。然而,在享受Kubernetes帶來的便利性和可擴展性的同時,安全問題也日益凸顯。本文將從運維工程師的角度,深入探討生產(chǎn)環(huán)境中Kubernetes容器安全的最佳實踐。
    的頭像 發(fā)表于 07-14 11:09 ?344次閱讀

    天馬榮獲新財富雜志“2024 ESG最佳實踐獎”

    天馬可持續(xù)發(fā)展?ESG表現(xiàn)再獲認可,上榜2024年新財富雜志最佳上市公司評選“ESG最佳實踐榜單”。
    的頭像 發(fā)表于 05-21 14:43 ?602次閱讀

    華為ADN L4解決方案斬獲FutureNet World 2025自智網(wǎng)絡(luò)最佳實踐

    ,共論未來網(wǎng)絡(luò)轉(zhuǎn)型之路。隨著自智網(wǎng)絡(luò)近年來在通信產(chǎn)業(yè)熱度的持續(xù)上升,本次大會首次設(shè)立“自智網(wǎng)絡(luò)最佳實踐獎”,華為以自動駕駛網(wǎng)絡(luò)(ADN)L4解決方案突出的技術(shù)創(chuàng)新和前沿實踐成果,成為首
    的頭像 發(fā)表于 05-09 19:47 ?1130次閱讀
    華為ADN L4解決方案斬獲FutureNet World 2025自智網(wǎng)絡(luò)<b class='flag-5'>最佳</b><b class='flag-5'>實踐</b>獎

    如何糾正install_prerequisites.bat批處理文件腳本中的路徑,以便在Windows? 10中正確執(zhí)行?

    執(zhí)行 install_prerequisites.bat 批處理文件,但收到錯誤: install_prerequisites。。moutilsextract_release_version.py\') 此時出乎意料。
    發(fā)表于 03-05 10:29

    環(huán)球儀器Omni插件機的三大功能

    Omni 插件機采用四部采用了 AI 及 AOI 視覺算法的上視攝像頭,同時拍照與定位,節(jié)省拍照移動時間,并采用算法實現(xiàn)最佳路徑規(guī)劃,達到快速插件。
    的頭像 發(fā)表于 02-25 11:45 ?895次閱讀
    環(huán)球儀器Omni<b class='flag-5'>插件</b>機的三大功能

    松下MPS媒體制作平臺 第十一篇:深入探索自動跟蹤插件(第二部分)

    MPS媒體制作平臺 第十一篇:自動跟蹤插件(第二部分) Auto Tracking(自動跟蹤)插件是一款基于人體檢測和面部識別的高精度跟蹤技
    的頭像 發(fā)表于 02-19 10:31 ?729次閱讀
    松下MPS媒體制作平臺 第十一篇:深入探索<b class='flag-5'>自動</b>跟蹤<b class='flag-5'>插件</b>(第二部分)

    松下MPS媒體制作平臺之自動跟蹤插件(第一部分)

    ? 歡迎大家觀看松下操作教程 MPS媒體制作平臺 第十篇:Auto Tracking(自動跟蹤)插件 Auto Tracking(自動跟蹤)
    的頭像 發(fā)表于 02-08 11:15 ?887次閱讀
    松下MPS媒體制作平臺之<b class='flag-5'>自動</b>跟蹤<b class='flag-5'>插件</b>(第一部分)

    hyper v 虛擬化,Hyper-V 虛擬化:Hyper-V虛擬化的最佳實踐

    :Hyper-V虛擬化的最佳實踐。 ? ?在當今的IT環(huán)境中,Hyper-V虛擬化技術(shù)被廣泛應(yīng)用于企業(yè)級和數(shù)據(jù)中心環(huán)境中,以實現(xiàn)資源的高效利用和靈活管理。為了確保Hyper-V虛擬化環(huán)境的高效運行,優(yōu)化虛擬機的性能至關(guān)重要。本文將結(jié)合最新的
    的頭像 發(fā)表于 02-07 10:24 ?830次閱讀
    hyper v 虛擬化,Hyper-V 虛擬化:Hyper-V虛擬化的<b class='flag-5'>最佳</b><b class='flag-5'>實踐</b>

    兆芯最佳實踐應(yīng)用場景解決方案發(fā)布

    《兆芯最佳實踐應(yīng)用場景解決方案》現(xiàn)已正式發(fā)布,掃描下方二維碼或點擊閱讀原文即可獲取下載。
    的頭像 發(fā)表于 01-13 14:45 ?759次閱讀

    立訊精密入選2024可持續(xù)發(fā)展最佳實踐案例

    近日,由中國上市公司協(xié)會(以下簡稱中上協(xié))主辦的2024上市公司可持續(xù)發(fā)展大會在京召開。會上,中上協(xié)發(fā)布了2024上市公司可持續(xù)發(fā)展最佳及優(yōu)秀實踐案例。立訊精密憑借“立志高遠 訊航可持續(xù)高質(zhì)量發(fā)展”的卓越實踐,從596篇投稿中脫
    的頭像 發(fā)表于 11-28 13:50 ?876次閱讀

    4G模組之UDP應(yīng)用的最佳實踐!

    今天說的是4G模組之UDP應(yīng)用,展示最佳實踐,送你參考。
    的頭像 發(fā)表于 11-08 09:24 ?1466次閱讀
    4G模組之UDP應(yīng)用的<b class='flag-5'>最佳</b><b class='flag-5'>實踐</b>!

    MES系統(tǒng)的最佳實踐案例

    效率、降低成本、保證產(chǎn)品質(zhì)量。 MES系統(tǒng)的最佳實踐案例 引言 在當今競爭激烈的制造業(yè)環(huán)境中,企業(yè)必須不斷尋求創(chuàng)新和改進的方法來保持競爭力。MES系統(tǒng)作為一種關(guān)鍵的信息技術(shù)工具,已經(jīng)被廣泛應(yīng)用于各種制造行業(yè),以實現(xiàn)生產(chǎn)過程的優(yōu)化和管理。本文將探討MES系統(tǒng)的
    的頭像 發(fā)表于 10-27 09:33 ?3335次閱讀

    愛芯元速榮膺最佳技術(shù)實踐應(yīng)用獎

    愛芯元智車載事業(yè)部(品牌“愛芯元速”)憑借在車載芯片領(lǐng)域的創(chuàng)新技術(shù)研發(fā)實力以及在推動量產(chǎn)上車方面的卓越成績收獲本屆“金輯獎”的“2024最佳技術(shù)實踐應(yīng)用獎”。
    的頭像 發(fā)表于 10-25 11:39 ?857次閱讀

    邊緣計算架構(gòu)設(shè)計最佳實踐

    邊緣計算架構(gòu)設(shè)計最佳實踐涉及多個方面,以下是一些關(guān)鍵要素和最佳實踐建議: 一、核心組件與架構(gòu)設(shè)計 邊緣設(shè)備與網(wǎng)關(guān) 邊緣設(shè)備 :包括各種嵌入式設(shè)備、傳感器、智能手機、智能攝像頭等,負責采
    的頭像 發(fā)表于 10-24 14:17 ?1446次閱讀

    云計算平臺的最佳實踐

    云計算平臺的最佳實踐涉及多個方面,以確保高效、安全、可擴展和成本優(yōu)化的云環(huán)境。以下是一些關(guān)鍵的最佳實踐: 一、云成本優(yōu)化 詳細分析云使用情況 :通過細致的監(jiān)控和分析,識別低ROI(投資
    的頭像 發(fā)表于 10-24 09:17 ?992次閱讀