久久久久久亚洲精品无码,在线播放自偷自拍,欧美体内she精视频在线观看

導(dǎo)讀

本文介紹了一些小目標(biāo)物體檢測(cè)的方法和思路。

在深度學(xué)習(xí)目標(biāo)檢測(cè)中，特別是人臉檢測(cè)中，由于分辨率低、圖像模糊、信息少、噪聲多，小目標(biāo)和小人臉的檢測(cè)一直是一個(gè)實(shí)用和常見的難點(diǎn)問題。然而，在過去幾年的發(fā)展中，也出現(xiàn)了一些提高小目標(biāo)檢測(cè)性能的解決方案。本文將對(duì)這些方法進(jìn)行分析、整理和總結(jié)。

圖像金字塔和多尺度滑動(dòng)窗口檢測(cè)

一開始，在深學(xué)習(xí)方法成為流行之前，對(duì)于不同尺度的目標(biāo)，通常是從原始圖像開始，使用不同的分辨率構(gòu)建圖像金字塔，然后使用分類器對(duì)金字塔的每一層進(jìn)行滑動(dòng)窗口的目標(biāo)檢測(cè)。

在著名的人臉檢測(cè)器MTCNN中，使用圖像金字塔法檢測(cè)不同分辨率的人臉目標(biāo)。然而，這種方法通常是緩慢的，雖然構(gòu)建圖像金字塔可以使用卷積核分離加速或簡(jiǎn)單粗暴地縮放，但仍需要做多個(gè)特征提取，后來有人借其想法想出一個(gè)特征金字塔網(wǎng)絡(luò)FPN，在不同層融合特征，只需要一次正向計(jì)算，不需要縮放圖片。它也被應(yīng)用于小目標(biāo)檢測(cè)，這將在后面的文章中討論。

簡(jiǎn)單，粗暴和可靠的數(shù)據(jù)增強(qiáng)

通過增加訓(xùn)練集中小目標(biāo)樣本的種類和數(shù)量，也可以提高小目標(biāo)檢測(cè)的性能。有兩種簡(jiǎn)單而粗糙的方法：

針對(duì)COCO數(shù)據(jù)集中含有小目標(biāo)的圖片數(shù)量較少的問題，使用過采樣策略：

不同采樣比的實(shí)驗(yàn)。我們觀察到，不管檢測(cè)小目標(biāo)的比率是多少，過采樣都有幫助。這個(gè)比例使我們能夠在大小物體之間做出權(quán)衡。

針對(duì)同一張圖片中小目標(biāo)數(shù)量少的問題，使用分割mask切出小目標(biāo)圖像，然后使用復(fù)制和粘貼方法(當(dāng)然，再加一些旋轉(zhuǎn)和縮放)。

通過復(fù)制粘貼小目標(biāo)來實(shí)現(xiàn)人工增強(qiáng)的例子。正如我們?cè)谶@些例子中所觀察到的，粘貼在同一幅圖像上可以獲得正確的小目標(biāo)的周圍環(huán)境。

在Anchor策略方法中，如果同一幅圖中有更多的小目標(biāo)，則會(huì)匹配更多的正樣本。

與ground truth物體相匹配的不同尺度anchor示意圖，小的目標(biāo)匹配到更少的anchor。為了克服這一問題，我們提出通過復(fù)制粘貼小目標(biāo)來人工增強(qiáng)圖像，使訓(xùn)練過程中有更多的anchor與小目標(biāo)匹配。

特征融合FPN

不同階段的特征圖對(duì)應(yīng)不同的感受野，其所表達(dá)的信息抽象程度也不同。

淺層特征圖感受野小，更適合檢測(cè)小目標(biāo)，深層特征圖較大，更適合檢測(cè)大目標(biāo)。因此，有人提出將不同階段的特征映射整合在一起來提高目標(biāo)檢測(cè)性能，稱之為特征金字塔網(wǎng)絡(luò)FPN。

(a)利用圖像金字塔建立特征金字塔。特征的計(jì)算是在每個(gè)圖像的尺度上獨(dú)立進(jìn)行的，這是很緩慢的。(b)最近的檢測(cè)系統(tǒng)選擇只使用單一尺度的特征以更快地檢測(cè)。另一種選擇是重用由ConvNet計(jì)算出的金字塔特征層次結(jié)構(gòu)，就好像它是一個(gè)特征圖金字塔。(d)我們提出的特征金字塔網(wǎng)絡(luò)(FPN)與(b)和一樣快，但更準(zhǔn)確。在這個(gè)圖中，特征圖用藍(lán)色輪廓線表示，較粗的輪廓線表示語義上較強(qiáng)的特征。

由于可以通過融合不同分辨率的特征圖來提高特征的豐富度和信息含量來檢測(cè)不同大小的目標(biāo)，自然會(huì)有人進(jìn)一步猜測(cè)，如果只檢測(cè)高分辨率的特征圖(淺層特征)來檢測(cè)小人臉，使用中分辨率特征圖(中間特征)來檢測(cè)大的臉。

SSH的網(wǎng)絡(luò)結(jié)構(gòu)

合適的訓(xùn)練方法SNIP, SNIPER, SAN

在機(jī)器學(xué)習(xí)中有一點(diǎn)很重要，模型預(yù)訓(xùn)練的分布應(yīng)該盡可能接近測(cè)試輸入的分布。因此，在大分辨率(如常見的224 x 224)下訓(xùn)練的模型不適合檢測(cè)小分辨率的圖像，然后放大并輸入到模型中。

如果輸入的是小分辨率的圖像，則在小分辨率的圖像上訓(xùn)練模型，如果沒有，則應(yīng)該先用大分辨率的圖片訓(xùn)練模型，然后再用小分辨率的圖片進(jìn)行微調(diào)，最壞的情況是直接使用大分辨率的圖像來預(yù)測(cè)小分辨率的圖像(通過上采樣放大)。

因此，在實(shí)際應(yīng)用中，對(duì)輸入圖像進(jìn)行放大并進(jìn)行高速率的圖像預(yù)訓(xùn)練，然后對(duì)小圖像進(jìn)行微調(diào)比針對(duì)小目標(biāo)訓(xùn)練分類器效果更好。

所有的圖都報(bào)告了ImageNet分類數(shù)據(jù)集驗(yàn)證集的準(zhǔn)確性。我們對(duì)48、64、80等分辨率的圖像進(jìn)行上采樣，在圖(a)中繪制出預(yù)訓(xùn)練的ResNet-101分類器的Top-1精度。圖(b、c)分別為原始圖像分辨率為48,96像素時(shí)不同cnn的結(jié)果。

更密集的Anchor采樣和匹配策略S3FD, FaceBoxes

如前面的數(shù)據(jù)增強(qiáng)部分所述，將一個(gè)小目標(biāo)復(fù)制到圖片中的多個(gè)位置，可以增加小目標(biāo)匹配的anchor數(shù)量，增加小目標(biāo)的訓(xùn)練權(quán)重，減少網(wǎng)絡(luò)對(duì)大目標(biāo)的偏置。同樣，在逆向思維中，如果數(shù)據(jù)集已經(jīng)確定，我們也可以增加負(fù)責(zé)小目標(biāo)的anchor的設(shè)置策略，使訓(xùn)練過程中對(duì)小目標(biāo)的學(xué)習(xí)更加充分。

例如，在FaceBoxes中，其中一個(gè)貢獻(xiàn)是anchor策略。

Anchor變的密集例子。為了清晰起見，我們只對(duì)一個(gè)感受野中心(即中央黑色網(wǎng)格)密集化錨點(diǎn)，并只給對(duì)角錨點(diǎn)上色。

Anchor密集化策略，使不同類型的anchor在圖像上具有相同的密度，顯著提高小人臉的召回率。

總結(jié)

本文較詳細(xì)地總結(jié)了一般目標(biāo)檢測(cè)和特殊人臉檢測(cè)中常見的小目標(biāo)檢測(cè)解決方案。

英文原文：https://medium.datadriveninvestor.com/how-to-deal-with-small-objects-in-object-detection-44d28d136cbc

來源：AI公園

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

噪聲

噪聲

+關(guān)注

關(guān)注
13

文章
1156

瀏覽量
49210
分辨率

分辨率

+關(guān)注

關(guān)注
2

文章
1127

瀏覽量
43345
人臉檢測(cè)

人臉檢測(cè)

+關(guān)注

關(guān)注
0

文章
88

瀏覽量
17245

原文標(biāo)題：在目標(biāo)檢測(cè)中如何解決小目標(biāo)的問題？

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

解析在目標(biāo)檢測(cè)中怎么解決小目標(biāo)的問題？

評(píng)論