chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何實(shí)現(xiàn)遙感圖像等超大尺寸圖像快速識(shí)別

OpenCV學(xué)堂 ? 來(lái)源:OpenCV學(xué)堂 ? 作者:OpenCV學(xué)堂 ? 2022-07-14 09:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一般情況下,遙感目標(biāo)檢測(cè)中,遙感圖像的圖片尺寸都會(huì)很大,且圖像中元素極為復(fù)雜,近期開(kāi)賽的亞馬遜科技AI For Good - 2022 遙感光學(xué)影像目標(biāo)檢測(cè)挑戰(zhàn)賽】也不例外,動(dòng)輒超過(guò)10000 x 10000的衛(wèi)星遙感圖像讓許多選手感到頭疼。同時(shí)遙感影像中目標(biāo)尺寸差別大、小而密集、角度各異也導(dǎo)致常見(jiàn)的CV框架難以實(shí)現(xiàn)快速精準(zhǔn)的目標(biāo)識(shí)別。所以,如何實(shí)現(xiàn)遙感圖像等超大尺寸圖像快速識(shí)別?

目前比較成熟的衛(wèi)星圖像識(shí)別算法并不少,但大多依托于強(qiáng)大的計(jì)算資源,為了用有限的計(jì)算資源實(shí)現(xiàn)大尺寸圖像識(shí)別,我們找到了一個(gè)可行的開(kāi)源框架,給大尺寸圖像識(shí)別提供了不錯(cuò)的思路。

YOLT 是一個(gè)基于YOLO v2的衛(wèi)星圖像識(shí)別開(kāi)源算法,核心思路是:

1. 通過(guò)圖片裁切和圖像網(wǎng)絡(luò)重構(gòu)解決圖像尺寸問(wèn)題;

2. 通過(guò)“上采樣”提升小而聚集的目標(biāo)的檢測(cè)精度;

3. 通過(guò)將不同尺寸模型融合,提升整體檢測(cè)精度。

YOLT項(xiàng)目地址:GitHub - avanetten/yolt: You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery

YOLO是經(jīng)典的圖像識(shí)別算法,YOLT在YOLO的基礎(chǔ)上針對(duì)衛(wèi)星圖像特有的問(wèn)題提出了特定的解決思路。詳細(xì)思路參見(jiàn)論文「You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery」(GitHub項(xiàng)目中附有論文鏈接)。

e58432fc-0310-11ed-ba43-dac502259ad0.png

▲左側(cè)為常見(jiàn)問(wèn)題,右側(cè)為解決辦法

1. 針對(duì)物體尺寸不規(guī)則、方向多樣的問(wèn)題,YOLT對(duì)衛(wèi)星圖像數(shù)據(jù)進(jìn)行尺寸變換與旋轉(zhuǎn)等數(shù)據(jù)增強(qiáng)的處理。

2. 針對(duì)目標(biāo)尺寸過(guò)小并聚集的問(wèn)題,YOLT框架主要采用3種方式進(jìn)行處理:

(1) 修改圖像網(wǎng)絡(luò)結(jié)構(gòu),將YOLO v2框架中的stride由32改為16,有利于檢測(cè)出大小在32 x 32以下的目標(biāo)

(2) 對(duì)圖像進(jìn)行上采樣,完成圖片的“解壓縮”操作,即把原先的圖片放大,以便檢測(cè)小而密集的物體

(3) 將不同尺寸的檢測(cè)模型進(jìn)行融合,即Ensemble操作,由于不同目標(biāo)的尺寸差異可能較大,如海港與船只、機(jī)場(chǎng)與飛機(jī),Ensemble操作能夠提升大尺寸差異下的識(shí)別精度。

針對(duì)衛(wèi)星圖像尺寸過(guò)大的問(wèn)題,YOLT采用切塊的方式,將原始圖像切割成小塊后輸入模型進(jìn)行訓(xùn)練,并結(jié)合2-(3)進(jìn)行模型融合。

e5b76f8c-0310-11ed-ba43-dac502259ad0.png

▲ YOLT的網(wǎng)絡(luò)結(jié)構(gòu),輸出特征尺寸多為26 x 26,可以提升檢測(cè)精度

應(yīng)用實(shí)例

從下面的檢測(cè)實(shí)例中,我們可以看到Y(jié)OLT是如何工作的:

首先,開(kāi)發(fā)團(tuán)隊(duì)將一張衛(wèi)星圖片調(diào)整至416 x 416大?。ㄈ缟献螅?,發(fā)現(xiàn)無(wú)法檢測(cè)出車(chē)輛目標(biāo);而從原圖中切割出416 x 416的區(qū)域(稱其為Chips)則可以實(shí)現(xiàn)部分車(chē)輛目標(biāo)的檢測(cè)。

順著這個(gè)思路,開(kāi)發(fā)團(tuán)隊(duì)采用劃窗方式將原始圖像切割為許多chips,并使相鄰chips之間有一定重合(如上圖),以確保圖像檢測(cè)的完整性。再利用NMS算法將重復(fù)檢測(cè)過(guò)濾,最后將各塊的檢測(cè)結(jié)果進(jìn)行融合,即可得出最后的結(jié)果。

▲ 檢測(cè)實(shí)例:采用YOLT v4識(shí)別機(jī)場(chǎng)中的飛機(jī)

YOLT的思路不止可以應(yīng)用于衛(wèi)星圖像識(shí)別,同樣可以在目標(biāo)尺寸小且密集的其他類圖像識(shí)別問(wèn)題中發(fā)揮作用。

對(duì)本次亞馬遜【AI For Good - 2022 遙感光學(xué)影像目標(biāo)檢測(cè)挑戰(zhàn)賽】的選手而言,YOLT的解決思路能夠幫助大家越過(guò)圖片尺寸過(guò)大的第一道坎。

原文標(biāo)題:如何實(shí)現(xiàn)超大尺寸圖像快速識(shí)別

文章出處:【微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 衛(wèi)星
    +關(guān)注

    關(guān)注

    18

    文章

    1803

    瀏覽量

    69259
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3611

    瀏覽量

    51428
  • 遙感圖像
    +關(guān)注

    關(guān)注

    0

    文章

    40

    瀏覽量

    10687

原文標(biāo)題:如何實(shí)現(xiàn)超大尺寸圖像快速識(shí)別

文章出處:【微信號(hào):CVSCHOOL,微信公眾號(hào):OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    多光譜圖像技術(shù)在苗期作物與雜草識(shí)別中的研究進(jìn)展

    、勞動(dòng)強(qiáng)度大、完全依賴人工主體的經(jīng)驗(yàn)與知識(shí),在大面積雜草苗情觀測(cè)上,人工識(shí)別是無(wú)能為力的。遙感識(shí)別法則克服了人工監(jiān)測(cè)的諸多弊端,可以在短時(shí)間內(nèi)獲得作物大范圍的圖像,自動(dòng)
    的頭像 發(fā)表于 06-10 18:13 ?207次閱讀

    基于LockAI視覺(jué)識(shí)別模塊:C++使用圖像的統(tǒng)計(jì)信息

    圖像處理中,統(tǒng)計(jì)信息可以幫助我們了解圖像的特性,例如區(qū)域內(nèi)的像素分布、顏色轉(zhuǎn)換以及特定區(qū)域的分析。本文將介紹基于LockAI視覺(jué)識(shí)別模塊如何提取興趣區(qū)域(ROI)、轉(zhuǎn)換顏色通道、計(jì)算均值和標(biāo)準(zhǔn)差
    發(fā)表于 05-08 10:31

    基于LockAI視覺(jué)識(shí)別模塊:C++使用圖像的統(tǒng)計(jì)信息

    圖像處理中,統(tǒng)計(jì)信息可以幫助我們了解圖像的特性,例如區(qū)域內(nèi)的像素分布、顏色轉(zhuǎn)換以及特定區(qū)域的分析。本文將介紹基于LockAI視覺(jué)識(shí)別模塊如何提取興趣區(qū)域(ROI)、轉(zhuǎn)換顏色通道、計(jì)算均值和標(biāo)準(zhǔn)差,以及查找最小值和最大值,并通過(guò)
    的頭像 發(fā)表于 05-08 10:09 ?444次閱讀
    基于LockAI視覺(jué)<b class='flag-5'>識(shí)別</b>模塊:C++使用<b class='flag-5'>圖像</b>的統(tǒng)計(jì)信息

    基于LockAI視覺(jué)識(shí)別模塊:C++圖像的基本運(yùn)算

    ::Mat) 返回值: 結(jié)果儲(chǔ)存在dst中 2.7.5 復(fù)雜的圖像邏輯運(yùn)算 如果需要實(shí)現(xiàn)復(fù)雜的邏輯運(yùn)算(如NAND、NOR、NXOR),可以通過(guò)組合上述基本函數(shù)來(lái)完成。例如: **NAND 與非
    發(fā)表于 05-06 16:56

    基于LockAI視覺(jué)識(shí)別模塊:C++圖像的基本運(yùn)算

    圖像處理中,理解圖像的基本操作是掌握計(jì)算機(jī)視覺(jué)技術(shù)的關(guān)鍵。本文章將介紹基于LockAI視覺(jué)識(shí)別模塊下OpenCV中圖像的基本運(yùn)算方法,包括像素操作、邏輯運(yùn)算和差值運(yùn)算,并通過(guò)一個(gè)綜合
    的頭像 發(fā)表于 05-06 16:20 ?419次閱讀
    基于LockAI視覺(jué)<b class='flag-5'>識(shí)別</b>模塊:C++<b class='flag-5'>圖像</b>的基本運(yùn)算

    基于LockAI視覺(jué)識(shí)別模塊:C++圖像采集例程

    本文主要演示如何使用LockAI視覺(jué)識(shí)別模塊進(jìn)行視頻流的讀取,同時(shí)使用Edit模塊進(jìn)行圖像傳輸?;A(chǔ)知識(shí)講解1.1OpenCV簡(jiǎn)介OpenCV(OpenSourceComputerVisionLibra
    的頭像 發(fā)表于 04-30 18:23 ?438次閱讀
    基于LockAI視覺(jué)<b class='flag-5'>識(shí)別</b>模塊:C++<b class='flag-5'>圖像</b>采集例程

    手持終端集裝箱識(shí)別系統(tǒng)的圖像識(shí)別技術(shù)

    在港口、碼頭、物流園區(qū)場(chǎng)景中,集裝箱的高效管理一直是行業(yè)智能化升級(jí)的核心需求?;谙冗M(jìn)的OCR(光學(xué)字符識(shí)別)與AI技術(shù),手持終端集裝箱識(shí)別系統(tǒng)實(shí)現(xiàn)了從大型設(shè)備到移動(dòng)終端的全場(chǎng)景箱號(hào)
    的頭像 發(fā)表于 04-03 10:49 ?469次閱讀

    圖像采集卡:現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

    在現(xiàn)代科技快速發(fā)展的背景下,圖像處理技術(shù)已成為信息技術(shù)領(lǐng)域不可或缺的一部分。圖像采集卡,作為連接計(jì)算機(jī)與各種圖像采集設(shè)備的重要硬件組件,扮演著至關(guān)重要的角色。它不僅涉及
    的頭像 發(fā)表于 02-20 10:42 ?722次閱讀
    <b class='flag-5'>圖像</b>采集卡:現(xiàn)代<b class='flag-5'>圖像</b>處理技術(shù)的關(guān)鍵組件

    圖像尺寸測(cè)量?jī)?yōu)勢(shì):數(shù)量識(shí)別

    普密斯圖像尺寸測(cè)量?jī)x運(yùn)用了先進(jìn)的光學(xué)成像與圖像處理技術(shù),這一技術(shù)是其實(shí)現(xiàn)高效精準(zhǔn)測(cè)量的核心。當(dāng)面對(duì)多個(gè)電子產(chǎn)品同時(shí)測(cè)量時(shí),測(cè)量?jī)x的高分辨率鏡頭能迅速捕捉產(chǎn)品的清晰
    的頭像 發(fā)表于 01-17 15:13 ?657次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>尺寸</b>測(cè)量?jī)?yōu)勢(shì):數(shù)量<b class='flag-5'>識(shí)別</b>

    高精度圖像尺寸測(cè)量?jī)x優(yōu)勢(shì)

    高精度圖像尺寸測(cè)量?jī)x憑借其超高的測(cè)量精度、非接觸式測(cè)量?jī)?yōu)勢(shì)、強(qiáng)大的多功能測(cè)量能力、高效的測(cè)量速度以及廣泛的應(yīng)用領(lǐng)域,成為電子制造行業(yè)提升產(chǎn)品質(zhì)量和生產(chǎn)效率的有力工具。
    的頭像 發(fā)表于 01-13 11:32 ?915次閱讀
    高精度<b class='flag-5'>圖像</b><b class='flag-5'>尺寸</b>測(cè)量?jī)x優(yōu)勢(shì)

    圖像尺寸測(cè)量?jī)x在人造骨骼尺寸測(cè)量中的創(chuàng)新應(yīng)用

    圖像尺寸測(cè)量?jī)x的出現(xiàn)為人造骨骼尺寸測(cè)量帶來(lái)了革命性的突破。它依托先進(jìn)的光學(xué)成像技術(shù)與精密的算法軟件,能夠快速、精準(zhǔn)地測(cè)量人造骨骼的平面尺寸。
    的頭像 發(fā)表于 12-27 11:13 ?906次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>尺寸</b>測(cè)量?jī)x在人造骨骼<b class='flag-5'>尺寸</b>測(cè)量中的創(chuàng)新應(yīng)用

    基于FPGA實(shí)現(xiàn)圖像直方圖設(shè)計(jì)

    直方圖統(tǒng)計(jì)的原理 直方圖統(tǒng)計(jì)從數(shù)學(xué)上來(lái)說(shuō),是對(duì)圖像中的像素點(diǎn)進(jìn)行統(tǒng)計(jì)。圖像直方圖統(tǒng)計(jì)常用于統(tǒng)計(jì)灰度圖像,表示圖像中各個(gè)灰度級(jí)出現(xiàn)的次數(shù)或者概率。統(tǒng)計(jì)直方圖的
    的頭像 發(fā)表于 12-24 10:24 ?1048次閱讀
    基于FPGA<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>圖像</b>直方圖設(shè)計(jì)

    使用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分類的步驟

    (例如,高分辨率、不同光照條件)。 2. 數(shù)據(jù)收集 獲取數(shù)據(jù)集 :收集或購(gòu)買(mǎi)一個(gè)包含你想要分類的圖像的數(shù)據(jù)集。 數(shù)據(jù)標(biāo)注 :確保所有圖像都被正確標(biāo)注,這對(duì)于監(jiān)督學(xué)習(xí)是必要的。 3. 數(shù)據(jù)預(yù)處理
    的頭像 發(fā)表于 11-15 15:01 ?1137次閱讀

    AI圖像識(shí)別攝像機(jī)

    ?AI圖像識(shí)別攝像機(jī)是一種集成了先進(jìn)算法和深度學(xué)習(xí)模型的智能監(jiān)控設(shè)備。這些攝像機(jī)不僅能夠捕捉視頻畫(huà)面,還能實(shí)時(shí)分析和處理所拍攝的內(nèi)容,從而實(shí)現(xiàn)對(duì)特定對(duì)象、場(chǎng)景或行
    的頭像 發(fā)表于 11-08 10:38 ?1153次閱讀
    AI<b class='flag-5'>圖像識(shí)別</b>攝像機(jī)

    AI大模型在圖像識(shí)別中的優(yōu)勢(shì)

    AI大模型在圖像識(shí)別中展現(xiàn)出了顯著的優(yōu)勢(shì),這些優(yōu)勢(shì)主要源于其強(qiáng)大的計(jì)算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對(duì)AI大模型在圖像識(shí)別中優(yōu)勢(shì)的介紹: 一、高效性與準(zhǔn)確性 處理速度 :AI
    的頭像 發(fā)表于 10-23 15:01 ?2946次閱讀