計(jì)算機(jī)視覺是指:讓機(jī)器通過數(shù)字圖像或視頻等視覺信息來模擬人類視覺的過程,以達(dá)到對(duì)物體的理解、識(shí)別、分類、跟蹤、重建等目的的技術(shù)。它是人工智能領(lǐng)域中的一個(gè)分支,涉及圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等多個(gè)領(lǐng)域。
隨著人工智能和機(jī)器學(xué)習(xí)算法進(jìn)入了與產(chǎn)業(yè)深度融合的階段,機(jī)器視覺技術(shù)已廣泛應(yīng)用于人臉識(shí)別、自動(dòng)駕駛、無人機(jī)、醫(yī)學(xué)影像分析、工業(yè)生產(chǎn)等場景,主要運(yùn)用到以下六大主流機(jī)器視覺技術(shù),一起來了解一下~
01 圖像分類
圖像分類是根據(jù)各自在圖像信息中所反映的不同特征,把不同類別的目標(biāo)區(qū)分開來的圖像處理方法。它利用計(jì)算機(jī)對(duì)圖像進(jìn)行定量分析,把圖像或圖像中的每個(gè)像元或區(qū)域劃歸為若干個(gè)類別中的某一種,以代替人的視覺判讀。
常用方法:基于色彩特征的索引技術(shù)、基于紋理的圖像分類技術(shù)、基于形狀的圖像分類技術(shù)、基于空間關(guān)系的圖像分類技術(shù)等。
主要應(yīng)用:場景分類、物體識(shí)別、圖像標(biāo)注、醫(yī)學(xué)圖像、工業(yè)檢測和安防監(jiān)控等。
02 目標(biāo)檢測
目標(biāo)檢測是指在圖像或視頻中,識(shí)別出目標(biāo)物體所在的位置,并標(biāo)注出其所屬的類別的任務(wù)。相比于圖像分類任務(wù),目標(biāo)檢測需要對(duì)目標(biāo)的位置和數(shù)量進(jìn)行準(zhǔn)確的識(shí)別,因此其難度更大,但也更加實(shí)用。在實(shí)際應(yīng)用中,可以根據(jù)具體場景和需求,選擇不同的模型和算法來實(shí)現(xiàn)追蹤、識(shí)別和分析等目標(biāo)檢測任務(wù)。
常用模型:
①Faster R-CNN:是一種基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測模型,它通過在區(qū)域提議網(wǎng)絡(luò)(Region Proposal Network, RPN)中引入錨點(diǎn)來提高檢測速度,同時(shí)采用了RoI Pooling層來實(shí)現(xiàn)不同大小的目標(biāo)檢測。
②YOLO(You Only Look Once):是一種基于單階段目標(biāo)檢測算法的模型,它將目標(biāo)檢測任務(wù)轉(zhuǎn)化為一個(gè)回歸問題,通過卷積神經(jīng)網(wǎng)絡(luò)預(yù)測目標(biāo)的類別和位置。
③SSD(Single Shot MultiBox Detector):也是一種基于單階段目標(biāo)檢測算法的模型,通過在每個(gè)特征層上應(yīng)用不同大小和形狀的先驗(yàn)框,從而實(shí)現(xiàn)對(duì)不同尺度目標(biāo)的檢測。
主要應(yīng)用:
①智能安防:監(jiān)控場景中的人員和車輛,實(shí)現(xiàn)目標(biāo)追蹤和識(shí)別。
②自動(dòng)駕駛:通過識(shí)別道路標(biāo)志、交通信號(hào)燈、行人和其他車輛等來實(shí)現(xiàn)自主駕駛。
③無人機(jī):對(duì)無人機(jī)飛行區(qū)域中的目標(biāo)進(jìn)行識(shí)別和跟蹤,以實(shí)現(xiàn)智能控制和導(dǎo)航。
④工業(yè)制造:在生產(chǎn)過程中對(duì)產(chǎn)品進(jìn)行檢測和分類,提高生產(chǎn)效率和質(zhì)量。
⑤醫(yī)療診斷:通過對(duì)醫(yī)學(xué)圖像中的腫瘤等異常進(jìn)行識(shí)別和定位,輔助醫(yī)生進(jìn)行診斷和治療。
尤其是適用于邊緣端的智能應(yīng)用,比如在英碼科技的場景化解決方案中,主要通過邊緣計(jì)算盒子,結(jié)合機(jī)器視覺、大數(shù)據(jù)等技術(shù)實(shí)現(xiàn)長尾場景的實(shí)時(shí)感知、目標(biāo)識(shí)別、監(jiān)測、預(yù)警等智能應(yīng)用,助力交通、校園、工地、化工園區(qū)等領(lǐng)域?qū)崿F(xiàn)智慧化升級(jí),達(dá)到降本增效的目的。
03 目標(biāo)跟蹤
目標(biāo)跟蹤是指在視頻序列中,對(duì)于已知的初始目標(biāo),在后續(xù)幀中通過對(duì)目標(biāo)的特征提取和跟蹤算法進(jìn)行處理,實(shí)現(xiàn)對(duì)目標(biāo)位置、形態(tài)等信息的實(shí)時(shí)跟蹤。
常用方法:
①基于相關(guān)濾波的跟蹤方法:將目標(biāo)與模板進(jìn)行相關(guān)性計(jì)算,計(jì)算得到的結(jié)果可以表示目標(biāo)在當(dāng)前幀的位置。
②基于粒子濾波的跟蹤方法:通過在目標(biāo)周圍隨機(jī)生成多個(gè)粒子,然后根據(jù)目標(biāo)的運(yùn)動(dòng)模型,對(duì)這些粒子進(jìn)行預(yù)測,再用觀測信息對(duì)預(yù)測的粒子進(jìn)行權(quán)重更新,最終選擇權(quán)重最高的粒子來表示目標(biāo)的位置。
③基于深度學(xué)習(xí)的跟蹤方法:使用深度學(xué)習(xí)算法對(duì)目標(biāo)進(jìn)行特征提取和表示,然后根據(jù)目標(biāo)在前一幀的位置和特征,對(duì)目標(biāo)在當(dāng)前幀的位置進(jìn)行預(yù)測。常用的深度學(xué)習(xí)跟蹤算法包括循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)等。
主要應(yīng)用:目標(biāo)跟蹤技術(shù)適用于視頻監(jiān)控、無人駕駛、智能交通等領(lǐng)域,可以用于目標(biāo)的實(shí)時(shí)跟蹤和識(shí)別,實(shí)現(xiàn)自動(dòng)化控制和智能化分析。
04 語義分割
語義分割旨在將輸入圖像中的每個(gè)像素標(biāo)記為屬于哪個(gè)語義類別。與目標(biāo)檢測和圖像分類不同,語義分割不僅可以識(shí)別圖像中的物體,還可以為每個(gè)像素分配標(biāo)簽,從而提供更詳細(xì)和準(zhǔn)確的圖像理解。
常用模型:FCN(Fully Convolutional Network)、U-Net、DeepLab等。近年來還涌現(xiàn)出了許多基于深度學(xué)習(xí)的新型語義分割模型,如PSPNet、DeepLab V3+等,它們?cè)诰群托实确矫娑加兴岣摺?/p>
主要應(yīng)用:語義分割適用于需要對(duì)圖像進(jìn)行精細(xì)分割和像素級(jí)分類的場景,例如自動(dòng)駕駛中的道路分割、醫(yī)學(xué)圖像中的病變分割、地理信息系統(tǒng)中的土地分類等。
05 實(shí)例分割
實(shí)例分割是結(jié)合目標(biāo)檢測和語義分割的一個(gè)更高層級(jí)的任務(wù)。實(shí)例分割是計(jì)算機(jī)視覺中的一項(xiàng)任務(wù),旨在同時(shí)檢測圖像中的物體,并將每個(gè)物體分割成精確的像素級(jí)別的區(qū)域。與語義分割不同,實(shí)例分割不僅可以分割出不同類別的物體,還可以將它們分割成獨(dú)立的、像素級(jí)別的區(qū)域。
常用模型:Mask R-CNN、FCIS(Fully Convolutional Instance-aware Semantic Segmentation)、SOLO(Segmenting Objects by Locations)等。
主要應(yīng)用:實(shí)例分割適用于需要對(duì)圖像進(jìn)行精細(xì)分割并區(qū)分不同物體的場景,例如自動(dòng)駕駛中的行人和車輛分割、醫(yī)學(xué)圖像中的器官分割、遙感圖像中的建筑物分割等。
結(jié)語
上述這 5 種關(guān)鍵的機(jī)器視覺技術(shù)可以協(xié)助計(jì)算機(jī)從單個(gè)或一系列圖像中提取、分析和理解有用的信息,賦能千行百業(yè)實(shí)現(xiàn)AI應(yīng)用,構(gòu)建更智能、美好的視界。
審核編輯 黃宇
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103427 -
機(jī)器視覺
+關(guān)注
關(guān)注
163文章
4532瀏覽量
122793 -
AI
+關(guān)注
關(guān)注
88文章
34998瀏覽量
278685
發(fā)布評(píng)論請(qǐng)先 登錄
EtherCAT科普系列(8):EtherCAT技術(shù)在機(jī)器視覺領(lǐng)域的應(yīng)用

電機(jī)系統(tǒng)節(jié)能關(guān)鍵技術(shù)及展望
淺談華為通信大模型的關(guān)鍵技術(shù)
Arm帶你了解2025年及未來在不同技術(shù)市場的關(guān)鍵技術(shù)方向
鴻道Intewell工業(yè)操作系統(tǒng),三大關(guān)鍵技術(shù),領(lǐng)跑行業(yè)前沿
機(jī)器視覺技術(shù):照亮工業(yè)4.0未來征途,報(bào)名火熱進(jìn)行中

云計(jì)算HPC軟件關(guān)鍵技術(shù)
江智公司持續(xù)沉淀增強(qiáng)機(jī)器人產(chǎn)業(yè)關(guān)鍵技術(shù)核心競爭力

5G-A家庭隨身網(wǎng)絡(luò)場景及關(guān)鍵技術(shù)專題報(bào)告發(fā)布
華為發(fā)布兩大關(guān)鍵創(chuàng)新技術(shù)方向
焊接機(jī)器人智能化的關(guān)鍵技術(shù)有哪些

評(píng)論