chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenCV中支持的非分類與檢測視覺模型

OpenCV學(xué)堂 ? 來源:OpenCV學(xué)堂 ? 作者:OpenCV學(xué)堂 ? 2022-08-19 09:10 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

引言 ·

前面給大家分別匯總了OpenCV中支持的圖像分類與對象檢測模型,視覺視覺任務(wù)除了分類與檢測還有很多其他任務(wù),這里我們就來OpenCV中支持的非分類與檢測的視覺模型匯總一下。注意一點,匯總支持的模型都是OpenCV4.4 Github上已經(jīng)提供的,事實上除了官方的提供的模型,讀者還可以自己探索更多非官方模型支持。這里的匯總模型主要來自O(shè)penCV社區(qū)官方測試過的。

語義分割網(wǎng)絡(luò)

OpenCV4 DNN支持的語義分割網(wǎng)絡(luò)FCN與ENet、ResNet101_DUC_HDC等三個語義分割模型。

FCN

其中FCN主要是基于VGG16~VGG19作為基礎(chǔ)網(wǎng)絡(luò),速度很慢,該網(wǎng)絡(luò)是在2015年時候提出,是早期很典型的圖像語義分割網(wǎng)絡(luò),不是一個對稱的卷積反卷積分割網(wǎng)絡(luò),在編碼階段網(wǎng)絡(luò)過長,解碼網(wǎng)絡(luò)很少,結(jié)果堪憂!網(wǎng)絡(luò)結(jié)構(gòu)如下:

c95bf7f8-1f09-11ed-ba43-dac502259ad0.png

c97b257e-1f09-11ed-ba43-dac502259ad0.png

分別支持不同分辨率的上采樣。

ENet

ENet是一種實時語義分割網(wǎng)絡(luò),在2016年提出的,關(guān)于ENet語義分割網(wǎng)絡(luò),我其實之前寫過一篇文章,詳細(xì)介紹過,這里就不再啰嗦了,直接看這個鏈接即可:

詳解ENet | CPU可以實時的道路分割網(wǎng)絡(luò)

論文下載地址:

https://arxiv.org/pdf/1606.02147.pdf

ResNet101_DUC_HDC

該模型在編碼網(wǎng)絡(luò)中基于殘差網(wǎng)絡(luò)與混合空洞卷積(HDC-Hybrid Dilated Convolution),在解碼階段采用密集上采樣卷積(DUC-Dense Upsampling Convolution),最終實現(xiàn)了像素級別的圖像語義分割網(wǎng)絡(luò)。網(wǎng)絡(luò)模型結(jié)構(gòu)如下:

c9bc0e90-1f09-11ed-ba43-dac502259ad0.png

該論文在2017發(fā)表,論文地址如下:

https://arxiv.org/pdf/1702.08502.pdf

姿態(tài)評估

OpenCV DNN支持的姿態(tài)評估是基于OpenPose網(wǎng)絡(luò)實現(xiàn)的身體與手部姿態(tài)評估,OpenPose是一個開源的姿態(tài)評估項目支持2D與3D模型的姿態(tài)評估,提供了C++/Python的API調(diào)用接口。模型可以從它github地址獲得

https://github.com/CMU-Perceptual-Computing-Lab/openpose

相關(guān)的模型主要來自它們的系列論文, 姿態(tài)評估的基本原理與流程如下:

c9cd63f2-1f09-11ed-ba43-dac502259ad0.png

c9dd5f82-1f09-11ed-ba43-dac502259ad0.png

完整的姿態(tài)評估流程入上圖,首先預(yù)測熱圖與PAF,然后進(jìn)行匹配與解析,最終得到輸出的姿態(tài)評估結(jié)果。相關(guān)的論文地址如下

https://arxiv.org/pdf/1812.08008v2.pdfhttps://arxiv.org/pdf/1611.08050.pdf

圖像處理

OpenCV中圖像處理網(wǎng)絡(luò)支持圖像色彩遷移、圖像風(fēng)格遷移、邊緣檢測。

色彩遷移:

其中灰度圖像轉(zhuǎn)換彩色圖像的模型結(jié)構(gòu)如下:

c9fa8ada-1f09-11ed-ba43-dac502259ad0.png

其中有個重要的輸入特征點是要把RGB彩色圖像轉(zhuǎn)換為LAB通道圖像,然后對AB輸入,最后結(jié)果重新加上L分量。代碼在這里

http://richzhang.github.io/colorization/

風(fēng)格遷移

風(fēng)格遷移網(wǎng)絡(luò)主要是來自于2016李飛飛等提出感知損失的圖像風(fēng)格遷移與超分辨率論文實現(xiàn)的,網(wǎng)絡(luò)結(jié)構(gòu)如下:

ca265912-1f09-11ed-ba43-dac502259ad0.png

github地址如下:

https://github.com/jcjohnson/fast-neural-style

邊緣檢測

OpenCV中傳統(tǒng)的圖像邊緣檢測算法Canny,現(xiàn)在OpenCV支持基于深度學(xué)習(xí)的邊緣檢測算法HED,它與Canny算法的邊緣提取效果對比如下:

ca4e0f02-1f09-11ed-ba43-dac502259ad0.png

該論文是在2015年提出的,模型結(jié)構(gòu)如下:

ca6403b6-1f09-11ed-ba43-dac502259ad0.png

作者選擇了VGGNet作為特征提取與基礎(chǔ)網(wǎng)絡(luò)。

論文地址:

https://arxiv.org/pdf/1504.06375.pdf

人臉識別

人臉識別來自O(shè)penFace,OpenFace是一種典型的移動端實時的人臉識別模型,跟它相似的還有LightCNN模型。OpenFace是基于facenet的Inception網(wǎng)絡(luò)作為backbone網(wǎng)絡(luò)訓(xùn)練生存的torch網(wǎng)絡(luò)模型,然后基于SVM實現(xiàn)了分類推理,完整的OpenFace項目結(jié)構(gòu)如下:

ca78d03e-1f09-11ed-ba43-dac502259ad0.png

其中預(yù)處理階段的人臉對齊示意圖如下:

caa247e8-1f09-11ed-ba43-dac502259ad0.png

關(guān)于FaceNet的人臉識別論文

https://arxiv.org/pdf/1503.03832.pdf

OpenCV DNN支持的8位的量化之后的人臉識別模型,最終輸出的向量是128維的,模型下載可以從Github地址:

https://github.com/cmusatyalab/openface

場景文字檢測

場景文字檢測來自2017年曠視科技提出的EAST場景文字檢測模型,相關(guān)的模型結(jié)構(gòu)如下:

cacdf406-1f09-11ed-ba43-dac502259ad0.png

最終輸出的文本區(qū)域解析后處理如下:

cadb25ea-1f09-11ed-ba43-dac502259ad0.png

最常見的是解析位RBOX,即帶角度的旋轉(zhuǎn)矩形(最小外接矩形)。

最后總結(jié)一下,上述網(wǎng)絡(luò)均支持在OpenCV4.4版本上直接推理運行,或者自定義數(shù)據(jù)學(xué)習(xí)之后的在OpenCV4 DNN部署,推理調(diào)用。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼
    +關(guān)注

    關(guān)注

    6

    文章

    982

    瀏覽量

    56440
  • 視覺模型
    +關(guān)注

    關(guān)注

    0

    文章

    8

    瀏覽量

    7015
  • OpenCV
    +關(guān)注

    關(guān)注

    33

    文章

    650

    瀏覽量

    43979

原文標(biāo)題:匯總 | OpenCV4中的非典型深度學(xué)習(xí)模型

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    機器視覺雙雄YOLO 和 OpenCV 到底有啥區(qū)別?別再傻傻分不清!

    如何在深圳市鋇錸技術(shù)有限公司的AI邊緣計算產(chǎn)品中結(jié)合,實現(xiàn)真正的“視覺智能”。 一、前言:為什么總有人把YOLO和OpenCV搞混? 在AI視覺項目中,你可能聽過這樣的討論:“要做人臉檢測
    的頭像 發(fā)表于 10-14 16:00 ?60次閱讀
    機器<b class='flag-5'>視覺</b>雙雄YOLO 和 <b class='flag-5'>OpenCV</b> 到底有啥區(qū)別?別再傻傻分不清!

    【Milk-V Duo S 開發(fā)板免費體驗】SDK編譯、人臉檢測、OpenCV測試

    【Milk-V Duo S 開發(fā)板免費體驗】SDK編譯、人臉檢測、OpenCV測試 本文介紹了 Milk-V Duo S 開發(fā)板實現(xiàn) Buildroot SDK 鏡像編譯、基于 TDL 模型的人
    發(fā)表于 07-11 13:48

    基于LockAI視覺識別模塊:手寫數(shù)字識別

    前準(zhǔn)備 **請確保你已經(jīng)下載了 **凌智視覺模塊手寫數(shù)字分類模型 5.2 運行過程 在凌智視覺模塊輸入以下命令: chmod 777 Test-DigitHandRecog # 調(diào)用攝
    發(fā)表于 06-30 16:45

    基于LockAI視覺識別模塊:C++目標(biāo)檢測

    是基于百度飛槳深度學(xué)習(xí)框架開發(fā)的一個高效的目標(biāo)檢測庫,支持多種先進(jìn)的目標(biāo)檢測模型,如 YOLO 系列、SSD、Faster R-CNN、Mask R-CNN 等。它提供了簡單易用的接
    發(fā)表于 06-06 14:43

    快速部署!米爾全志T527開發(fā)板的OpenCV行人檢測方案指南

    本文將介紹基于米爾電子MYD-LT527開發(fā)板(米爾基于全志T527開發(fā)板)的OpenCV行人檢測方案測試。摘自優(yōu)秀創(chuàng)作者-小火苗 一、軟件環(huán)境安裝1.在全志T527開發(fā)板安裝OpenCV
    發(fā)表于 04-11 18:14

    ?VLM(視覺語言模型)?詳細(xì)解析

    視覺語言模型(Visual Language Model, VLM)是一種結(jié)合視覺(圖像/視頻)和語言(文本)處理能力的多模態(tài)人工智能模型,能夠理解并生成與
    的頭像 發(fā)表于 03-17 15:32 ?6733次閱讀
    ?VLM(<b class='flag-5'>視覺</b>語言<b class='flag-5'>模型</b>)?詳細(xì)解析

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺支持

    對計算機視覺支持,擴大了當(dāng)前對音頻、雷達(dá)和其他時間序列信號數(shù)據(jù)的支持范圍。在增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺
    的頭像 發(fā)表于 03-11 15:11 ?565次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO<b class='flag-5'>模型</b>增加對計算機<b class='flag-5'>視覺</b>的<b class='flag-5'>支持</b>

    使用OpenVINO?模型OpenCV進(jìn)行人臉檢測檢測到多張人臉時,伺服電機和步入器電機都發(fā)生移動是為什么?

    使用OpenVINO?模型OpenCV* 進(jìn)行人臉檢測。 使用 cv2.矩形 函數(shù),能夠獲取檢測到的面部的坐標(biāo)。 檢測到多張人臉時,多
    發(fā)表于 03-07 06:35

    OpenVINO? Toolkit中如何保持模型稀疏性?

    OpenVINO? Toolkit 中支持的優(yōu)化方法,保持模型稀疏性。
    發(fā)表于 03-06 06:47

    LabVIEW使用Vision視覺進(jìn)行硬幣分類計數(shù)

    LabVIEW使用Vision視覺進(jìn)行硬幣分類計數(shù),有償,帶價加q:3430396759
    發(fā)表于 12-29 20:20

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測模型

    ,目標(biāo)物體周圍復(fù)雜的背景信息可能會干擾分類結(jié)果,使得分類器難以專注于真正重要的區(qū)域。 在深入探討了圖像分類任務(wù)及其面臨的挑戰(zhàn)之后,我們現(xiàn)在將目光轉(zhuǎn)向一個更為復(fù)雜的計算機視覺問題——目標(biāo)
    發(fā)表于 12-19 14:33

    AI模型部署邊緣設(shè)備的奇妙之旅:如何在邊緣端部署OpenCV

    識別、分類、跟蹤、場景重建等。這可能涉及到機器學(xué)習(xí)和深度學(xué)習(xí)模型的應(yīng)用。 簡而言之,圖像處理是計算機視覺的基礎(chǔ),提供了必要的工具和技術(shù)來預(yù)處理和優(yōu)化圖像數(shù)據(jù);而計算機視覺則是在此基礎(chǔ)之
    發(fā)表于 12-14 09:31

    【AI實戰(zhàn)項目】基于OpenCV的“顏色識別項目”完整操作過程

    適用于哪些場景,然后通過Python編寫代碼來實現(xiàn)這些算法,并應(yīng)用于實際項目中,實現(xiàn)圖像的檢測、識別、分類、定位、測量等目標(biāo)。華清遠(yuǎn)見【python+OpenCV
    的頭像 發(fā)表于 12-09 16:42 ?1746次閱讀
    【AI實戰(zhàn)項目】基于<b class='flag-5'>OpenCV</b>的“顏色識別項目”完整操作過程

    如何用OpenCV的相機捕捉視頻進(jìn)行人臉檢測--基于米爾NXP i.MX93開發(fā)板

    的是Haar特征人臉檢測,此外OpenCV中還集成了深度學(xué)習(xí)方法來實現(xiàn)人臉檢測。 【參考資料】 使用OpenCV工具包成功實現(xiàn)人臉檢測與人
    發(fā)表于 11-15 17:58

    超聲應(yīng)用中支持多個AFE高輸出電流的精密求和電路

    電子發(fā)燒友網(wǎng)站提供《超聲應(yīng)用中支持多個AFE高輸出電流的精密求和電路.pdf》資料免費下載
    發(fā)表于 10-25 09:21 ?0次下載
    超聲應(yīng)用<b class='flag-5'>中支持</b>多個AFE高輸出電流的精密求和電路