chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

看過來,RK3576 NPU方案你用對(duì)了嗎?

米爾電子 ? 2026-01-22 08:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文基于米爾MYD-LR3576開發(fā)板,詳細(xì)記錄了如何利用500萬像素USB攝像頭實(shí)現(xiàn)640×640分辨率的YOLO5s目標(biāo)檢測(cè),并將結(jié)果實(shí)時(shí)輸出至1080P屏幕的全流程。通過系統(tǒng)級(jí)的軟硬件協(xié)同優(yōu)化,最終將端到端延遲控制在40ms以內(nèi),實(shí)現(xiàn)了 20FPS的穩(wěn)定實(shí)時(shí)檢測(cè)性能。文章重點(diǎn)剖析了攝像頭特性分析、顯示通路選擇、RGA硬件加速、RKNN NPU集成等關(guān)鍵技術(shù)環(huán)節(jié),為嵌入式AI視覺系統(tǒng)的開發(fā)與調(diào)優(yōu)提供了一套完整的思路與實(shí)踐方案。

PART 01


系統(tǒng)架構(gòu)與性能目標(biāo)
1.1 硬件平臺(tái)

  • 主控芯片Rockchip RK3576(四核A72+四核A53,6TOPS NPU,RGA,GPU,VPU)
  • 攝像頭:500萬像素USB攝像頭(支持MJPEG/YUYV格式)
  • 顯示器:4K HDMI顯示屏(通過Weston桌面環(huán)境顯示)
  • 開發(fā)板:米爾MYD-LR3576

b1374e96-f725-11f0-8ce9-92fbcf53809c.png米爾基于RK3576核心板開發(fā)板1.2 軟件平臺(tái)使用米爾官方V2.0.0 SDK提供的buildroot鏡像,內(nèi)核版本為6.1.118。系統(tǒng)信息如下:

root@myd-lr3576-buildroot:/# uname -aLinuxmyd-lr3576-buildroot6.1.118#1SMP Fri Sep2602:34:15UTC2025aarch64 GNU/Linux


1.3 性能目標(biāo)

  • 實(shí)時(shí)性:完成從攝像頭采集→NPU推理→屏幕顯示的完整流程,耗時(shí)不超過攝像頭一幀的時(shí)間。
  • 輸入/輸出:盡可能提高攝像頭采集幀率,并在顯示端支持更高的輸出分辨率。
  • 功能:實(shí)現(xiàn)YOLO5s目標(biāo)檢測(cè),并在視頻畫面中實(shí)時(shí)繪制檢測(cè)框。

PART 02


數(shù)據(jù)處理流程與優(yōu)化實(shí)踐
攝像頭數(shù)據(jù)需要經(jīng)歷哪些過程才能到顯示端輸出,參考下圖

b148f9b6-f725-11f0-8ce9-92fbcf53809c.png


2.1 CPU處理方案及其瓶頸

b1533cdc-f725-11f0-8ce9-92fbcf53809c.png

如果把攝像頭數(shù)據(jù)直接顯示到屏幕上,先了解清楚它們輸入輸出關(guān)系。攝像頭輸出可以用v4l2-ctl -D -d /dev/videoxx --list-formats-extDisplay輸出可用用cat /sys/kernel/debug/dri/0/state查看

b16043dc-f725-11f0-8ce9-92fbcf53809c.png

根據(jù)實(shí)時(shí)性來說,需要選擇最高fps分辨率對(duì)應(yīng)輸出,這里選擇640x480 20fps,那么它需要把YUYV格式替換成RGBA8888才能顯示。顯示大小不超過屏幕最大分辨率3840x2160即可。CPU處理是如下過程

b16e02b0-f725-11f0-8ce9-92fbcf53809c.png

若要將攝像頭采集的YUYV格式數(shù)據(jù)直接顯示到屏幕,需先轉(zhuǎn)換為RGBA8888格式。在CPU上進(jìn)行格式轉(zhuǎn)換與縮放的性能如下(輸入為640×480 YUYV):

b17788e4-f725-11f0-8ce9-92fbcf53809c.png

可見,CPU在處理1080P分辨率時(shí)已接近能力上限,更高分辨率則無法滿足實(shí)時(shí)性要求。2.2 引入RGA進(jìn)行硬件加速RGA作為RK3576 2D處理芯片模塊,它的作用是對(duì)圖片做旋轉(zhuǎn),縮放,旋轉(zhuǎn),鏡像以及格式轉(zhuǎn)換。根據(jù)手冊(cè)信息,它能處理數(shù)據(jù)的性能是物理地址>DMA>虛擬地址。那么用RGA來替換CPU的格式轉(zhuǎn)換和縮放。

b18400ba-f725-11f0-8ce9-92fbcf53809c.png

RGA是一次進(jìn)行轉(zhuǎn)換和縮放,下面是對(duì)比CPU運(yùn)算的對(duì)比圖使用RGA替代CPU進(jìn)行格式轉(zhuǎn)換與縮放后,性能對(duì)比如下:

b18ceb30-f725-11f0-8ce9-92fbcf53809c.png

RGA的引入帶來了數(shù)量級(jí)的性能提升,尤其是DMA模式,大幅降低了處理延遲。2.3 GPU直接顯示方案調(diào)試階段常使用OpenCV的imshow顯示圖像,但其依賴CPU參與,無法滿足實(shí)時(shí)性要求。系統(tǒng)實(shí)際采用DRM顯示框架與Weston桌面環(huán)境,因此我們選用Wayland-client方案進(jìn)行直接顯示,實(shí)現(xiàn)GPU直顯。

b19b2eca-f725-11f0-8ce9-92fbcf53809c.png


不同輸入模式下的顯示耗時(shí)對(duì)比:

b1a4ca52-f725-11f0-8ce9-92fbcf53809c.png

2.4 NPU推理流程與耗時(shí)分析

b1af80be-f725-11f0-8ce9-92fbcf53809c.png

通用模型,通過rknn-toolkit2轉(zhuǎn)換成rknn后就可以通過RKNN API來調(diào)用和推導(dǎo)。使用rknn_model_zoo yolo5模型進(jìn)行轉(zhuǎn)換后生成模型,yolov5s-640-640.rknn和coco80labels_list.txt,以及一些調(diào)用參考代碼。它的輸入必須是640x640RGB格式。rknn推理虛擬地址關(guān)鍵步驟如下:

b1bb2c48-f725-11f0-8ce9-92fbcf53809c.png

實(shí)際測(cè)試后rknn_run這個(gè)階段大概耗時(shí)26~31ms之間rknnoutputsget獲取數(shù)據(jù)后即可進(jìn)行內(nèi)部處理,檢測(cè)出目標(biāo),坐標(biāo),信心指數(shù),根據(jù)實(shí)際需求繪制在屏幕上,這一步可以多進(jìn)程異步處理,不算在串行時(shí)間內(nèi),筆者測(cè)試大概會(huì)多花8ms左右。

b1c3c9e8-f725-11f0-8ce9-92fbcf53809c.png

因此總計(jì)一下攝像頭實(shí)時(shí)采集NPU推理到顯示整個(gè)過程耗時(shí)情況

b1cef5ac-f725-11f0-8ce9-92fbcf53809c.png

結(jié)論:NPU推理階段(T2)仍是系統(tǒng)的主要耗時(shí)環(huán)節(jié)。但通過DMA+RGA+直接顯示的優(yōu)化組合,系統(tǒng)整體延遲大幅降低,且在高分辨率輸出下仍能保持穩(wěn)定的幀率。

2.5 多攝像頭系統(tǒng)資源占用分析

  • 虛擬內(nèi)存方案

1個(gè)攝像頭

b1d9de9a-f725-11f0-8ce9-92fbcf53809c.png

b1e6fc06-f725-11f0-8ce9-92fbcf53809c.png

b1f40392-f725-11f0-8ce9-92fbcf53809c.png

4個(gè)攝像頭

b1fd2832-f725-11f0-8ce9-92fbcf53809c.png

b2077292-f725-11f0-8ce9-92fbcf53809c.png

  • Dma方案

1路攝像頭輸出

b2133122-f725-11f0-8ce9-92fbcf53809c.png

2路攝像頭輸入

b21de810-f725-11f0-8ce9-92fbcf53809c.png

PART 03


總結(jié)
在嵌入式AI視覺系統(tǒng)中,NPU的算力是決定性能上限的關(guān)鍵因素。然而,要達(dá)到這一上限,必須構(gòu)建高效的數(shù)據(jù)流水線。本文實(shí)踐表明,通過RGA硬件加速、DMA零拷貝數(shù)據(jù)傳輸以及GPU直接顯示的協(xié)同優(yōu)化,能夠徹底釋放 RK3576平臺(tái)的異構(gòu)計(jì)算潛力,將端到端延遲控制在數(shù)十毫秒內(nèi),實(shí)現(xiàn)高清、實(shí)時(shí)的目標(biāo)檢測(cè)應(yīng)用。這一優(yōu)化思路同樣適用于其他具備類似硬件加速單元的嵌入式AI平臺(tái)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開發(fā)板
    +關(guān)注

    關(guān)注

    26

    文章

    6211

    瀏覽量

    115864
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    369

    瀏覽量

    20937
  • 米爾電子
    +關(guān)注

    關(guān)注

    2

    文章

    185

    瀏覽量

    1033
  • rk3576
    +關(guān)注

    關(guān)注

    1

    文章

    245

    瀏覽量

    1431
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【米爾RK3576開發(fā)板評(píng)測(cè)】+項(xiàng)目名稱值得購(gòu)買的米爾RK3576開發(fā)板

    /H.265視頻的4K30Hz的編碼。 支持MPEG視頻4K30Hz的編解碼。 支持三屏異顯。 而RK3576最大的亮點(diǎn)是帶有6TOP/s的NPU,經(jīng)過不少網(wǎng)友的測(cè)試,這個(gè)瑞芯微的NPU還是挺給力
    發(fā)表于 01-08 22:59

    探索 RK3576 方案:卓越性能與靈活框架,誠(chéng)邀開發(fā)定制合作!

    各位技術(shù)愛好者、行業(yè)同仁們,今天要給大家重磅介紹一款極具潛力的芯片方案——RK3576,同時(shí)我們公司基于此芯片開發(fā)的主板更是有著出色表現(xiàn),以下會(huì)為大家詳細(xì)展開。Block Diagram
    發(fā)表于 02-05 15:21

    RK3576 vs RK3588:為何越來越多的開發(fā)者轉(zhuǎn)向RK3576?

    、商顯設(shè)備)。 RK3588 的 8K@60fps 更適合超高清視頻處理(如高端電視盒子、AI 視覺設(shè)備)。 RK3576 存儲(chǔ)選擇更靈活,可搭配低成本方案(如 SPI NAND),而 RK
    發(fā)表于 05-30 08:46

    Mpp支持RK3576

    想問下,https://github.com/rockchip-linux/mpp這里面支持RK3576么,看介紹沒有提到說支持RK3576 目前是買了個(gè)rk3576的機(jī)頂盒,搭載了安卓14,想做安卓視頻硬解。
    發(fā)表于 06-13 15:35

    【作品合集】米爾RK3576開發(fā)板測(cè)評(píng)

    米爾RK3576開發(fā)板測(cè)評(píng)作品合集 產(chǎn)品介紹: RK3576 是瑞芯微一款面向AI市場(chǎng)推出的高性能處理器,它配備了四核Cortex-A72和四 核Cortex-A53 的 CPU,集成了6TOPS
    發(fā)表于 09-11 10:19

    基于米爾RK3576的環(huán)視實(shí)時(shí)性方案解析

    潛力,但其執(zhí)行的穩(wěn)定性是當(dāng)前能否商用的關(guān)鍵挑戰(zhàn)。方案潛力與價(jià)值: 一旦GPU性能穩(wěn)定,RK3576憑借其異構(gòu)計(jì)算架構(gòu)(CPU+GPU+NPU),能夠在一幀時(shí)間內(nèi)不僅完成環(huán)視合成,更能集成復(fù)雜的AI感知與預(yù)警功能。這使其從一個(gè)單純
    發(fā)表于 11-28 16:57

    【招聘】復(fù)工了嗎?有職位需求的看過來

    【招聘】復(fù)工了嗎?有職位需求的看過來! 1.數(shù)字設(shè)計(jì)經(jīng)理 天津/上海 2.數(shù)字設(shè)計(jì)/驗(yàn)證工程師 天津/上海 3.射頻/模擬設(shè)計(jì):上海/深圳/南京 另:【急招】駐場(chǎng)測(cè)試工程師:寧波/無錫 有興趣請(qǐng)直接發(fā)簡(jiǎn)歷到j(luò)ia_jessi
    發(fā)表于 02-10 13:58

    RK3576開發(fā)板NPU激發(fā)無限創(chuàng)新!體驗(yàn)6TOPS強(qiáng)勁性能的奇妙之旅

    npu sdk。 作為瑞芯微8nm高性能AIOT平臺(tái),RK3576/RK3588 NPU性能可謂十分強(qiáng)大,6TOPS設(shè)計(jì)能夠?qū)崿F(xiàn)高效的神經(jīng)網(wǎng)絡(luò)推理計(jì)算。這使得
    的頭像 發(fā)表于 05-24 10:01 ?3471次閱讀
    <b class='flag-5'>RK3576</b>開發(fā)板<b class='flag-5'>NPU</b>激發(fā)無限創(chuàng)新!體驗(yàn)6TOPS強(qiáng)勁性能的奇妙之旅

    RK3576單板發(fā)布倒計(jì)時(shí):RK3399與RK3576對(duì)比

    好多人說RK3576RK3399的升級(jí)版,某種程度上也可以這么說,RK3576在強(qiáng)大的多媒體功能的基礎(chǔ)上,性能和接口都進(jìn)行了升級(jí) 一、工藝 性能 rk3576采用 Rockchip
    的頭像 發(fā)表于 12-03 16:59 ?2341次閱讀
    <b class='flag-5'>RK3576</b>單板發(fā)布倒計(jì)時(shí):<b class='flag-5'>RK</b>3399與<b class='flag-5'>RK3576</b>對(duì)比

    RK3588與RK3576區(qū)別解析

    ;RK3588是四核A76@2.4GHz + 四核A55@1.8GHz。 NPU:均內(nèi)置 6TOPS NPU,但RK3588數(shù)據(jù)類型支持更豐富。 GPU:
    的頭像 發(fā)表于 12-17 14:03 ?3778次閱讀
    <b class='flag-5'>RK</b>3588與<b class='flag-5'>RK3576</b>區(qū)別解析

    NPU性能深度評(píng)測(cè):瑞芯微RK3588、RK3576、RK3568、RK3562

    隨著AI技術(shù)不斷發(fā)展,越來越多的嵌入式設(shè)備開始集成NPU(神經(jīng)網(wǎng)絡(luò)處理單元),以實(shí)現(xiàn)更高效的AI推理。作為國(guó)產(chǎn)芯片廠商的佼佼者,瑞芯微推出的RK3588、RK3576、RK3568、
    的頭像 發(fā)表于 04-03 11:17 ?6723次閱讀
    <b class='flag-5'>NPU</b>性能深度評(píng)測(cè):瑞芯微<b class='flag-5'>RK</b>3588、<b class='flag-5'>RK3576</b>、<b class='flag-5'>RK</b>3568、<b class='flag-5'>RK</b>3562

    迅為RK3576開發(fā)板NPU例程測(cè)試-rknn-toolkit2環(huán)境搭建和使用

    迅為RK3576開發(fā)板NPU例程測(cè)試-rknn-toolkit2環(huán)境搭建和使用
    的頭像 發(fā)表于 06-17 13:46 ?1501次閱讀
    迅為<b class='flag-5'>RK3576</b>開發(fā)板<b class='flag-5'>NPU</b>例程測(cè)試-rknn-toolkit2環(huán)境搭建和使用

    迅為高情性6TOPS算力的RK3576開發(fā)板NPU rknn-model-zoo例程演示

    迅為RK3576開發(fā)板NPU rknn-model-zoo例程演示
    的頭像 發(fā)表于 07-01 14:54 ?1558次閱讀
    迅為高情性6TOPS算力的<b class='flag-5'>RK3576</b>開發(fā)板<b class='flag-5'>NPU</b> rknn-model-zoo例程演示

    瑞芯微RK3576RK3576S有什么區(qū)別,性能參數(shù)配置與型號(hào)差異解析

    、物聯(lián)網(wǎng)等商用AIoT領(lǐng)域。(瑞芯微RK3576RK3576S芯片框圖)觸覺智能作為專業(yè)的瑞芯微方案商,基于RK3576芯片平臺(tái)推出了核心板、開發(fā)板、行業(yè)主板等
    的頭像 發(fā)表于 08-14 23:57 ?2123次閱讀
    瑞芯微<b class='flag-5'>RK3576</b>與<b class='flag-5'>RK3576</b>S有什么區(qū)別,性能參數(shù)配置與型號(hào)差異解析

    迅為如何在RK3576上部署YOLOv5;基于RK3576構(gòu)建智能門禁系統(tǒng)

    迅為如何在RK3576開發(fā)板上部署YOLOv5;基于RK3576構(gòu)建智能門禁系統(tǒng)
    的頭像 發(fā)表于 11-25 14:06 ?1643次閱讀
    迅為如何在<b class='flag-5'>RK3576</b>上部署YOLOv5;基于<b class='flag-5'>RK3576</b>構(gòu)建智能門禁系統(tǒng)