chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于并行附加特征提取網(wǎng)絡(luò)的SSD地面小目標檢測模型

li1234567890123 ? 來源:li1234567890123 ? 作者:li1234567890123 ? 2022-02-17 16:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

基于并行附加特征提取網(wǎng)絡(luò)的SSD地面小目標檢測模型

來源:《電子學(xué)報》 ,作者李寶奇等
摘 要: 針對SSD原始附加特征提取網(wǎng)絡(luò)(Original Additional Feature Extraction Network,OAFEN)中stride操作造成圖像小目標信息丟失和串聯(lián)結(jié)構(gòu)產(chǎn)生的多尺度特征之間冗余度較大的問題,提出了一種計算量小、感受野大的深度可分離空洞卷積(Depthwise Separable Dilated Convolution,DSDC),并利用DSDC設(shè)計了一個包含三個獨立子網(wǎng)絡(luò)的并行附加特征提取網(wǎng)絡(luò)(Parallel Additional Feature Extraction Network,PAFEN).PAFEN上路用兩個DSDC提取尺寸為19*19和3*3的特征圖;中路用一個DSDC提取尺寸為10*10的特征圖;下路用兩個DSDC提取尺寸為5*5和1*1的特征圖.實驗結(jié)果表明,在SSD框架內(nèi),PAFEN在mAP和檢測時間等方面均優(yōu)于OAFEN,適用于地面小目標的檢測任務(wù).

關(guān)鍵詞: 目標檢測;SSD;深度可分離卷積;空洞卷積;深度可分離空洞卷積;并行附加特征提取網(wǎng)絡(luò)

1 引言
地面目標檢測在無人機導(dǎo)航、搜索、精確打擊和毀傷后評估中發(fā)揮著重要作用[1~3].考慮飛行安全和飛行距離,無人機通常會在較遠距離獲取地面目標圖像,由此造成的結(jié)果是圖像內(nèi)目標像素比較小,這會進一步增加目標檢測的難度[4].

通過將深度學(xué)習(xí)[5~7]模型 CNN(Convolutional Neural Networks)[8~10]嵌入到目標檢測模型之中,目標檢測精度在過去幾年中不斷提高,結(jié)合CNN的目標檢測算法可分為基于候選區(qū)域和基于回歸兩類.Girshick等[11]第一個將CNN用于目標檢測,并提出R-CNN(Regionbased Convolutional Neural Networks)模型.R-CNN使用區(qū)域建議方法從輸入圖像中生成2000個候選區(qū)域,并將所有的候選區(qū)域縮放到固定尺寸.然后,使用CNN在這些候選區(qū)域上提取特征.在CNN的最后一個特征層加入兩個全連接層(SVM和回歸層).由于SVM和回歸層是分開訓(xùn)練,R-CNN很難優(yōu)化而且占用內(nèi)存空間非常大.Girshick 等[12]又提出 Fast R-CNN 模型.Fast RCNN首先在圖像中提取感興趣區(qū)域 (Regions of Interest,RoI);然后對每幅圖像只做一次卷積處理,在最后一個卷積層輸出的特征圖上對每個RoI進行映射,并送入RoI池化層把各尺寸的特征圖統(tǒng)一到相同的大?。?3];最后利用 Softmax Loss和 Smooth L1 Loss對分類概率和邊框回歸聯(lián)合訓(xùn)練.聯(lián)合訓(xùn)練省去了特征存儲,提高了空間和時間利用率.然而,提取感興趣區(qū)域占用了整個檢測過程的大部分時間.Ren等[14]提出了目標檢測模型Faster R-CNN.與Fast R-CNN相比,F(xiàn)aster RCNN利用RPN(Region Proposal Network)在CNN最后一個連接層中自行產(chǎn)生建議框,因此建議框生成網(wǎng)絡(luò)和目標檢測網(wǎng)絡(luò)共享卷積網(wǎng)絡(luò).同時建議框數(shù)目從原有的約2000個減少為300個,重要的是建議框的質(zhì)量也有本質(zhì)的提高,但Faster R-CNN檢測的速度依然有待提高.

基于區(qū)域建議的目標檢測方法不能利用局部目標在整幅圖像中的空間信息,所以一些研究者開展了無區(qū)域建議的目標檢測研究,主要采用回歸的思想.Redmon等[15]提出了一種無區(qū)域建議的目標檢測模型,稱為YOLO(You Only Look Once).YOLO通過采用空間限制,減少了對同一目標的重復(fù)檢測,大大提高了效率,能夠達到實時的效果.但是YOLO的檢測精度不如Faster R-CNN.針對 YOLO 存在的不足,Liu等[16]提出 SSD(Single Shot Detector)模型.SSD模型主要由四部分組成:基礎(chǔ)網(wǎng)絡(luò)VGG-16(Visual Geometry Group),附加特征提取層部分,default boxes生成部分和卷積預(yù)測部分.SSD通過融合六個尺度的特征來提高目標檢測的精度.原始附加特征提取網(wǎng)絡(luò)從基礎(chǔ)網(wǎng)絡(luò)特征層conv4_3(38*38)開始,然后通過在標準卷積層中使用stride操作依次生成 fc7(19*19)、conv6_2(10*10)、conv7_2(5*5)、conv8_2(3*3)和conv9_2(1*1)五個尺度的特征圖.stride操作會造成圖像目標信息的丟失[17~19],尤其是圖像中的小目標.原始附加特征提取網(wǎng)絡(luò)中六個尺度的特征圖采用串聯(lián)結(jié)構(gòu)生成,彼此之間具有很高的冗余度,特征圖之間冗余度較高不利于圖像小目標的精準定位.為了提高SSD對小目標的檢測精度,Cao等[20]提出 FFSSD(Feature-Fused SSD)模型.FFSSD 利用Feature Fusion Module對VGG-16中conv5_3進行2倍上采樣操作,并與conv4_3融合來提高小尺寸目標的檢測精度.Fu等[21]提出 DSSD(Deconvolutional Single Shot Detector)模型.DSSD基礎(chǔ)網(wǎng)絡(luò)為特征提取能力更強的Resnet-101,并利用Deconvolution Module擴展低維度信息的上下文信息來提高小尺度目標的檢測精度.FFSSD和DSSD都是通過整合更多尺度上的語義特征來提高模型對小目標的檢測精度,但是這些方法,在提高對于目標物體特別時小物體識別效果的同時由于加入了額外的層,也增大了計算量,影響了檢測的實時性.Zhou 等[22]提出了 STDN(Scale-Transferrable Object Detection)模型.STDN基礎(chǔ)網(wǎng)絡(luò)為 DenseNet-169,并通過Scale-Transfer層實現(xiàn)了在幾乎不增加參數(shù)量和計算量的前提下生成大尺寸的特征層來提高模型對小目標的檢測精度.由于Scale-Transfer層是一個轉(zhuǎn)換操作,因此基本不會引入額外的參數(shù)量和計算量.為了提高SSD的檢測速度,Howard等[23]提出了輕量化的卷積神經(jīng)網(wǎng)絡(luò)MobileNet.MobileNet用深度可分離卷積(Depthwise Separable Convolution,DSC)替換標準卷積來減少模型的參數(shù)和計算量,它在不影響目標檢測精度的條件下能極大地提高SSD的檢測速度.

除了上述針對SSD的改進方法外,還有一些其它提高小目標檢測精度的研究工作,例如設(shè)計專用的目標檢測的骨干網(wǎng)絡(luò)[24],優(yōu)化檢測模型訓(xùn)練過程[25],IoU閾值動態(tài)設(shè)計[26]和生成高分辨率小目標特征[27]等.特別是文獻[27],Li等提出了一種基于PGAN(Perceptual Generative Adversarial Networks)的小目標檢測方法.PGAN通過訓(xùn)練條件生成網(wǎng)絡(luò)使小目標的特征表示與大目標特征表示類似,并利用一個新的感知分類器來監(jiān)督小目標特征的生成從而更精確地檢測小目標.

針對上述改進方法不能兼顧小目標檢測精度和速度的問題,本文提出了一種計算量小,覆蓋范圍大的卷積單元-深度可分離空洞卷積(Depthwise Separable Dilated Convolution,DSDC),并利用 DSDC設(shè)計了一種包含三個子網(wǎng)絡(luò)的并行附加特征提取層網(wǎng)絡(luò)(Parallel Additional Feature Extraction Network,PAFEN),同時通過優(yōu)化DSDC空洞率(Dilation Rate)的選取來改善 PAFEN的性能,最后在SSD框架內(nèi)通過結(jié)合MobileNet(基礎(chǔ)網(wǎng)絡(luò))和PAFEN(特征提取網(wǎng)絡(luò))實現(xiàn)對地面小目標的快速、準確的檢測.

2 基于并行附加特征提取網(wǎng)絡(luò)的SSD小目標檢測模型
本文通過改進附加特征提取網(wǎng)絡(luò)來提高SSD對地面小目標的檢測精度和速度.在新的附加特征提取網(wǎng)絡(luò)中,深度可分離空洞卷積作為網(wǎng)絡(luò)基本單元(深度可分離空洞卷積摒棄了stride操作,它通過通道分解和卷積核空洞化來減少計算量和增大感受野);三個獨立子網(wǎng)絡(luò)結(jié)構(gòu)替代原來的單網(wǎng)絡(luò)串聯(lián)結(jié)構(gòu)以增加多尺度特征圖的多樣性,并為與conv4(在MobileNet中與VGG-16中conv4_3對應(yīng)的層為conv4)直接相連的三個多尺度特征fc7、conv6_2和conv7_2設(shè)計convex空洞率策略來增加上下兩個子網(wǎng)絡(luò)的信息以改善新附加特征提取網(wǎng)絡(luò)的性能.

2.1 深度可分離空洞卷積單元
深度可分離卷積通過將標準卷積分解成深度卷積和點卷積來大幅降低模型的參數(shù),重要的是卷積層的特征提取能力基本不受影響.但為了生成尺寸更小的特征圖,深度可分離卷積只能通過增加卷積核尺寸或stride操作實現(xiàn),過大尺寸的卷積核會大幅增加模型參數(shù),而stride操作會造成圖像小目標信息的丟失.深度可分離空洞卷積是在深度可分離卷積的基礎(chǔ)上,通過對深度卷積空洞化實現(xiàn).空洞化是向標準卷積中引入了一個稱作空洞率的新參數(shù)[17],并利用擴張率控制卷積核處理數(shù)據(jù)時各值的間距,從而在計算量相當?shù)臈l件下實現(xiàn)卷積層感受野的增大.深度可分離空洞卷積與深度可分離卷積相比具有更大的感受野,與空洞卷積相比具有更小的計算量.深度可分離空洞卷積(DSDC)、深度可分離卷積(DSC)和標準卷積之間的關(guān)系如圖1所示.

對于M個尺寸為DF*DF的輸入特征圖F,經(jīng)尺寸為DK*DK的卷積核操作后,輸出N個尺寸為DG*DG的特征圖G,其中DF是輸入的特征圖的寬度和高度,M是輸入通道數(shù),DG是輸出特征圖的寬度和高度,N是輸出通道數(shù).標準卷積、深度可分離卷積和深度可分離空洞卷積的計算分解過程如圖2所示.

圖片

圖片

標準卷積生成特征圖G的計算成本為:

圖片

深度可分離卷積生成特征圖G的計算成本為:

圖片

深度可分離空洞卷積生成特征圖G的計算成本為:

圖片

深度可分離卷積和深度可分離空洞卷積與標準卷積的計算成本比值均為:

圖片

但在相同計算量的條件下,深度可分離空洞卷積的覆蓋范圍更大.深度可分離空洞卷積實際空洞濾波器(RDF)尺寸與空洞率之間的關(guān)系如下:

圖片

其中K rdf為該層RDF尺寸,DK為該層卷積核尺寸,R為該層空洞率大小.例如,一個卷積核尺寸為3*3,空洞率R=2的空洞卷積層,RDF的實際覆蓋范圍為5*5,即K rdf=5.同時可以通過進一步增大空洞率R來擴大卷積層的感受野.

2.2 基于并行附加特征提取網(wǎng)絡(luò)的SSD小目標檢測模型設(shè)計
附加特征提取網(wǎng)絡(luò)并行化設(shè)計是由conv4直接生成剩余的多尺度特征圖,每個子網(wǎng)絡(luò)之間保持獨立,生成的多尺度特征圖之間的冗余度也相對較小[23].考慮conv7_2(5*5)、conv8_2(3*3)和 conv9_2(1*1)三個尺度的特征圖尺寸比較接近,因此將剩余的五個尺度特征圖設(shè)計為三個獨立的子網(wǎng)絡(luò)結(jié)構(gòu),即conv4與fc7、conv6_2和conv7_2直接相連接,同時將 conv8_2和conv9_2分配到上路和下路兩個子網(wǎng)絡(luò)有助于提升fc7和conv7_2特征圖的質(zhì)量,也可以避免與conv7_2特征尺度上的重復(fù).基于MobileNet和PAFEN的SSD地面小目標檢測模型結(jié)構(gòu)如圖3所示,記作MPSDD.

圖片

地面小目標圖像首先進入SSD基礎(chǔ)網(wǎng)絡(luò)部分,其中基礎(chǔ)網(wǎng)絡(luò)為MobileNet被截斷至conv4的部分網(wǎng)絡(luò),并將conv4作為PAFEN的第一個特征層;PAFEN由conv4生成三個獨立的子網(wǎng)絡(luò):上路子網(wǎng)絡(luò)、中路子網(wǎng)絡(luò)和下路子網(wǎng)絡(luò).上路子網(wǎng)絡(luò)由conv4(38*38)生成fc7(19*19)和conv8_2(3*3)兩個尺度的特征圖;中路子網(wǎng)絡(luò)由 conv4(38*38)生成conv6_2(10*10)一個尺度的特征圖;下路子網(wǎng)絡(luò)由conv4(38*38)生成conv7_2(5*5)和conv9_2(1*1)兩個尺度的特征圖.default boxes生成部分根據(jù)預(yù)先定義的scales和aspect ratios從上述六個尺度的特征層中提取數(shù)量和大小不同的default boxes;卷積預(yù)測部分則是對default boxes內(nèi)目標的類型和位置進行判斷.

利用深度可分離空洞卷積構(gòu)建PAFEN需要首先解決網(wǎng)格問題[17~19],網(wǎng)格問題就是空洞卷積網(wǎng)絡(luò)每一層實際感受野疊加操作后無法實現(xiàn)對輸入圖像的完全覆蓋,因此會造成信息的丟失.文獻[17]和文獻[19]針對并行和串行空洞卷積網(wǎng)絡(luò)分別提出了卷積核尺寸固定下的空洞率選取準則.考慮PAFEN并非嚴格意義上的串聯(lián)或并聯(lián)結(jié)構(gòu),同時PAFEN主要是為了提取圖像小目標特征,因此文獻[17]和文獻[19]中的空洞率選取策略并不適用PAFEN中深度可分離空洞卷積空洞率的設(shè)計.為了更好地提取圖像小目標特征,PAFEN中使用的空洞率數(shù)值整體相對較?。瑫r,由于PAFEN上路和下路子網(wǎng)絡(luò)均包含兩個DSDC,因此fc7和conv7_2使用更小的空洞率有利于提高兩個子網(wǎng)絡(luò)特征圖的質(zhì)量.PAFEN中五個深度可分離空洞卷積層的參數(shù)設(shè)置如表1所示.

為了嚴格保證PAFEN與OAFEN中多尺度特征圖尺寸完全一致,需要對部分DSDC進行填充,例如fc7、conv6_2和 conv9_2.

表1 并行附加特征提取網(wǎng)絡(luò)參數(shù)設(shè)置

圖片

3 仿真試驗
為了驗證PAFEN的有效性以及特征層組合方式和DSDC空洞率選取對PAFEN性能的影響,實驗以mAP、平均檢測時間和參數(shù)大小作為模型定量評價指標.設(shè)計實驗 1,以 MOSSD[23](基礎(chǔ)網(wǎng)絡(luò)為 MobileNet,特征提取網(wǎng)絡(luò)為OAFEN)為參考,比較分析Faster-RCNN[14]、SSD[16]、FFSSD[20]、DSSD[21]與本文地面小目標檢測方法MPSSD(基礎(chǔ)網(wǎng)絡(luò)為MobileNet,特征提取網(wǎng)絡(luò)為PAFEN)之間的性能差異.設(shè)計實驗2,以附加特征提取網(wǎng)絡(luò)中不同尺度的特征圖為研究對象,比較分析特征圖不同的組合方式對PAFEN性能的影響.設(shè)計實驗3,以深度可分離空洞卷積的空洞率為研究對象,比較分析不同的空洞率選取方式對PAFEN性能的影響.SSD、FFSSD、DSSD、MOSSD 和 MPSSD 由 Caffe工具箱設(shè)計,采用 GPU(Titan X)計算方式[28],其中檢測時間為模型檢測100幅圖像的平均前向時間,參數(shù)大小指模型(.caffemodel文件)的實際大?。瓼aster-RCNN實驗?zāi)P陀?a href="http://www.brongaenegriffin.com/tags/tensorflow/" target="_blank">TensorFlow工具箱設(shè)計,同樣采用GPU(Titan X)計算方式,平均檢測時間為模型檢測完整測試數(shù)據(jù)集的平均時間,參數(shù)大小指模型(.ckpt文件)的實際大?。?/p>

3.1 實驗數(shù)據(jù)集
為了更好地檢驗基于PAFEN的SSD模型(MPSSD)對圖像小目標的檢測性能,我們建立了一個地面小目標數(shù)據(jù)集:SGT-DET.SGT-DET包括四種地面目標:軍用卡車、直升機、導(dǎo)彈和坦克,共計3350幅圖像,其中2410幅用于模型訓(xùn)練,940幅圖像用于模型測試,如表2所示.

表2 地面小目標數(shù)據(jù)集組成

圖片

地面小目標是一個相對的概念,其中“小”指的是圖像中目標的像素比值小,SGT-DET圖像中四個地面小目標的像素比均小于0.05.

3.2 實驗1:目標檢測算法的性能比較
本實驗比較分析 Faster-RCNN、SSD、FFSSD、DSSD、MOSSD與本文地面小目標檢測方法MPSSD在數(shù)據(jù)集SGT-DET上的性能差異.Faster-RCNN的基礎(chǔ)網(wǎng)絡(luò)為VGG-16,特征提取網(wǎng)絡(luò)為 RPN;SSD的基礎(chǔ)網(wǎng)絡(luò)為VGG-16,特征提取網(wǎng)絡(luò)為OAFEN;FFSSD的基礎(chǔ)網(wǎng)絡(luò)為VGG-16,特征提取網(wǎng)絡(luò)為 Feature Fusion Module;DSSD的基礎(chǔ)網(wǎng)絡(luò)為ResNet101,特征提取網(wǎng)絡(luò)為Deconvolution Module;MOSSD的基礎(chǔ)網(wǎng)絡(luò)為MobileNet,特征提取網(wǎng)絡(luò)為OAFEN;MPSSD的基礎(chǔ)網(wǎng)絡(luò)為MobileNet,特征提取網(wǎng)絡(luò)為PAFEN,其中PAFEN包含三個獨立的子網(wǎng)絡(luò),其中fc7,conv6_2和conv7_2三個卷積層的卷積核,空洞率和填充為[8,3,1]、[7,5,1]和[12,3,0].分別記錄檢測模型在迭代30000次時對 SGTDET測試數(shù)據(jù)集的mAP數(shù)值、平均檢測時間和參數(shù)大?。?/p>

從表3可以發(fā)現(xiàn),F(xiàn)aster-RCNN的檢測精度最高為97.6%,MPSSD的檢測時間最短為7.18ms,MPSSD的參數(shù)大小最少為7.9MB.FFSSD、DSSD和SSD的實驗結(jié)果表明增加特征提取網(wǎng)絡(luò)的層數(shù)(增加contextual information)能夠改善SSD對小目標檢測的精度,但不可避免地會增加計算量和模型參數(shù).MOSSD和SSD的實驗結(jié)果表明利用MobileNet替換VGG-16在減少模型參數(shù)和降低檢測時間方面帶來的效果是明顯的,但也存在檢測精度上的下降.MPSSD和MOSSD的實驗結(jié)果表明PAFEN在三種定量評價指標中明顯優(yōu)于OAFEN,在地面小目標的檢測任務(wù)中,PAFEN比OAFEN精度更高,速度更快.綜合考慮檢測精度(mAP)、平均檢測時間(Times)和參數(shù)大小(Parameters)三個因素,MPSSD優(yōu)于其它檢測模型,更適合無人機遠距離地面實時檢測任務(wù).

為了更直觀的說明MPSSD對地面小目標的檢測效果,通過Juyter notebook利用訓(xùn)練30000次的MPSSD模型分別對4種地面小目標圖像進行檢測,檢測結(jié)果如圖4所示.從圖4可以看出,MPSSD模型對四種地面小目標能實現(xiàn)準確檢測.

表3 目標檢測模型性能比較

圖片

圖片

3.3 實驗2:子網(wǎng)絡(luò)數(shù)量對PAFEN性能的影響
本實驗比較不同數(shù)量子網(wǎng)絡(luò)對PAFEN性能的影響.實驗以包含三個子網(wǎng)絡(luò)的 PAFEN為參考,記PAFEN-3;設(shè)計包含一個子網(wǎng)絡(luò)的PAFEN-1和包含五個子網(wǎng)絡(luò)的PAFEN-5.PAFEN-1可解釋為OAFEN的深度可分離空洞化,其中 fc7、conv6_2、conv7_2、conv8_2和conv9_2五個卷積層的卷積核、空洞率和填充為[8,3,1]、[4,3,0]、[4,3,2]、[3,2,1]和[3,2,1].PAFEN-5為包含五個獨立子網(wǎng)絡(luò)的并行附加特征提取網(wǎng)絡(luò),即fc7、conv6_2、conv7_2、conv8_2 和 conv9_2 直接與 conv4相連,其中五個卷積層的卷積核、空洞率和填充為[8,3,1]、[8,4,0]、[8,5,1]、[8,5,0]和[8,6,3].記錄模型迭代30000次時模型對SGT-DET測試數(shù)據(jù)集的mAP數(shù)值、平均檢測時間和參數(shù)大?。?/p>

從表4可以看出,隨著PAFEN子網(wǎng)絡(luò)數(shù)量的增加,模型的檢測時間和參數(shù)都存在一定的增加,其中PAFEN-3比 PAFEN-1時間增加 0.09ms、參數(shù)增加0.4MB,PAFEN-5比PAFEN-1時間增加0.24ms,參數(shù)增加1.4MB.但檢測精度并沒有隨著子網(wǎng)絡(luò)數(shù)量的增加而改善,PAFEN-5的mAP比PAFEN-3低3.3%.綜合考慮檢測精度、平均檢測時間和參數(shù)大小三個評價指標,將PAFEN設(shè)計成三個子網(wǎng)絡(luò)效果最好.

***網(wǎng)絡(luò)數(shù)量對PAFEN性能的影響

圖片

3.4 實驗3:空洞率選取對PAFEN性能的影響
fc7、conv6_2、conv7_2 與 conv4 直接相連,這三個卷積層對PAFEN的性能影響最大,因此本實驗主要分析和比較fc7、conv6_2、conv7_2三個卷積層空洞率選取對PAFEN性能的影響.實驗設(shè)計四種形式的空洞率策略:rise、decline、uniformity和 convex,其中 convex 為 PAFEN采用的策略.rise、decline和uniformity三種策略的空洞率分別為[3,5,7]、[7,5,3]和[5,5,5].記錄模型迭代30000次時對SGT-DET測試數(shù)據(jù)集的mAP數(shù)值、平均檢測時間和參數(shù)大?。?/p>

從表5可以看出,四種空洞率策略下模型的檢測時間和參數(shù)大小基本相同.rise、decline、uniformity三種策略下模型的mAP數(shù)值也保持在同一水平,但convex策略下模型的mAP數(shù)值高于其他三種策略,比rise高2.7%,比decline高2.6%,比uniformity高2.3%.換句話說,為包含更多層的子網(wǎng)絡(luò)的初始層設(shè)置較低的空洞率有助于提升PAFEN的性能.

表5 空洞率選取對PAFEN性能的影響

圖片

3.5 討論
實驗從mAP、平均檢測時間和參數(shù)大小三個方面比較了本文小目標檢測方法MPSSD與經(jīng)典算法(Faster-RCNN和SSD)和最新算法(FFSSD和DSSD)性能上的差異,也進一步分析了子網(wǎng)絡(luò)的數(shù)量和空洞率的選取如何影響PAFEN的性能.本文地面小目標檢測模型MPSSD的基礎(chǔ)網(wǎng)絡(luò)為 MobileNet,特征提取網(wǎng)絡(luò)為PAFEN.PAFEN利用計算量小、感受野大的深度可分離空洞卷積單元組建附加特征提取網(wǎng)絡(luò)能消除stride操作造成圖像中小目標信息丟失的問題.PAFEN采用三個獨立的子網(wǎng)絡(luò)結(jié)構(gòu),使其能從conv4生成三組尺度獨立的特征圖,減少多尺度特征圖之間的冗余度,提高目標檢測的精度.但并非子網(wǎng)絡(luò)的數(shù)量越多越好,例如PAFEN-5的檢測精度低于 PAFEN-3.在 PAFEN-5中,conv4(38*38)直接生成conv8_2(3*3)或conv9_2(1*1),由于兩個子網(wǎng)絡(luò)尺度之間跨度較大(38-3或38-1),在一定程度上會影響conv8_2(3*3)和conv9_2(1*1)兩個尺度特征圖的質(zhì)量.同時,PAFEN-5用五個獨立的子網(wǎng)絡(luò)生成五個尺度的特征圖,特征圖之間的獨立性能為目標檢測提供更豐富的選擇,但過于獨立的特征會影響圖像目標的定位.因此,PAFEN需要兼顧特征圖的質(zhì)量和特征圖的多樣性.PAFEN使用convex空洞率策略獲得了最高的檢測精度,事實上,四種空洞率策略下PAFEN的檢測精度均高于OAFEN.在convex策略中,上路和下路網(wǎng)絡(luò)初始特征層使用較小空洞率能從conv4中獲取更多的信息,增強conv8_2和conv9_2兩個尺度特征圖的質(zhì)量,進而提高模型的檢測精度.

Faster-RCNN和SSD是經(jīng)典目標檢測算法的代表,F(xiàn)aster-RCN側(cè)重于目標檢測精度,而SSD側(cè)重于目標檢測速度,實驗1的結(jié)果也驗證了這一觀點.MOSSD用MobileNet替換基礎(chǔ)網(wǎng)絡(luò)VGG-16來進一步提高SSD的檢測速度.對于本文的SGT-DET數(shù)據(jù)集,MOSSD比SSD檢測精度低3.5%,精度下降的幅度還是比較大,這也間接表明MobileNet作為小目標檢測模型的基礎(chǔ)網(wǎng)絡(luò)還存在改進的空間.FFSSD和DSSD是針對小目標檢測任務(wù)提出改進模型:FFSSD通過引入conv5_3的信息;DSSD通過融合特征提取網(wǎng)絡(luò)反卷積變化后的特征.雖然FFSSD和DSSD在一定程度上提升了小目標檢測的精度,但卻增加了計算量.對于無人機遠距離目標檢測任務(wù)而言,除了滿足檢測精度要求外,圖像的實時檢測是另外一個重要的指標.MPSSD在減少模型參數(shù)和計算量的前提下,提升了對地面小目標的檢測速度.

4 結(jié)論
地面小目標檢測任務(wù)具有重要的理論研究和實際應(yīng)用價值.在SSD檢測模型框架內(nèi),本文提出了一種并行附加特征提取網(wǎng)絡(luò)PAFEN.PAFEN有效提升SSD對地面小目標檢測精度和速度,并經(jīng)理論分析和仿真實驗證明了PAFEN的有效性.

對于基于SSD的地面小目標檢測任務(wù),改進基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)和default box生成策略同樣能提升SSD模型的性能.下一步的研究重點包括:(1)研究適合小目標特征提取的基礎(chǔ)網(wǎng)絡(luò);(2)研究適合捕獲小目標特征的default box生成策略.

審核編輯:符乾江

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 目標檢測
    +關(guān)注

    關(guān)注

    0

    文章

    233

    瀏覽量

    16414
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8546

    瀏覽量

    136522
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    9050

    瀏覽量

    143396
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    高性能網(wǎng)絡(luò)存儲設(shè)計:NVMe-oF IP的實現(xiàn)探討

    延伸到網(wǎng)絡(luò)中。 該IP系統(tǒng)架構(gòu)如下: 它具有如下特點: ① 動態(tài)隊列綁定(DynamicQueue Binding)機制 系統(tǒng)針對 NVMe SSD 的多隊列并行特性,設(shè)計了 負載感知的動態(tài)隊列綁定策略
    發(fā)表于 12-19 18:45

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗

    , batch_size=512, epochs=20)總結(jié) 這個核心算法中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過程,是用來對MNIST手寫數(shù)字圖像進行分類的。模型將圖像作為輸入,通過卷積和池化層提取圖像的
    發(fā)表于 10-22 07:03

    淘寶圖片搜索接口開發(fā)實戰(zhàn):從 CNN 特征提取到商品匹配(附避坑手冊 + 可復(fù)用代碼)

    本文詳解淘寶圖片搜索接口開發(fā)全流程,涵蓋CNN特征提取、商品匹配、參數(shù)配置及400/429等高頻報錯解決方案,附合規(guī)避坑指南與可復(fù)用代碼,助你高效實現(xiàn)圖像搜商品功能。
    的頭像 發(fā)表于 10-21 10:03 ?389次閱讀

    1688 多模態(tài)搜索從 0 到 1:逆向接口解析與 CLIP 特征匹配實踐

    本文分享基于CLIP模型與逆向工程實現(xiàn)1688圖片搜同款的實戰(zhàn)方案。通過抓包分析破解接口簽名,結(jié)合CLIP多模態(tài)特征提取與Faiss向量檢索,提升搜索準確率至91%,單次響應(yīng)低于80ms,日均選品效率提升4倍,全程合規(guī)可復(fù)現(xiàn)。
    的頭像 發(fā)表于 10-17 10:00 ?327次閱讀

    大電流起弧過程中電弧聲壓/超聲波信號的特征提取與故障診斷

    接觸不良、絕緣破損、元件老化等故障時,電弧的燃燒狀態(tài)會發(fā)生改變,相應(yīng)的聲壓超聲波信號也會出現(xiàn)異常變化。因此,通過提取這些信號中的關(guān)鍵特征,并結(jié)合特征變化規(guī)律進行分析,就能實現(xiàn)對大電流起弧過程中故障的精準診
    的頭像 發(fā)表于 09-29 09:27 ?395次閱讀
    大電流起弧過程中電弧聲壓/超聲波信號的<b class='flag-5'>特征提取</b>與故障診斷

    廣和通發(fā)布端側(cè)目標檢測模型FiboDet

    為提升端側(cè)設(shè)備視覺感知與決策能力,廣和通全自研端側(cè)目標檢測模型FiboDet應(yīng)運而生。該模型基于廣和通在邊緣計算與人工智能領(lǐng)域的深度積累,面向工業(yè)、交通、零售等多個行業(yè)提供高性能、低功
    的頭像 發(fā)表于 09-26 13:39 ?1516次閱讀

    AIcube1.4目標檢測模型導(dǎo)入yolotxt格式數(shù)據(jù)集后一直顯示數(shù)據(jù)正在解析,為什么?

    AIcube1.4目標檢測模型導(dǎo)入yolotxt格式數(shù)據(jù)集后一直顯示數(shù)據(jù)正在解析 數(shù)據(jù)有問題,把數(shù)據(jù)情況說的詳細點
    發(fā)表于 08-13 07:16

    【VisionFive 2單板計算機試用體驗】在 VisionFive 2 上為目標檢測準備軟件環(huán)境并運行 MobileNet-SSD 模型

    目標: 本教程將實現(xiàn)在 StarFive VisionFive 2 開發(fā)板上為目標檢測應(yīng)用準備所需軟件環(huán)境,并最終運行一個基于 MobileNet-SSD
    發(fā)表于 07-10 19:51

    基于FPGA的SSD目標檢測算法設(shè)計

    隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)正被逐步應(yīng)用于智能安防、自動駕駛、醫(yī)療等各行各業(yè)。目標識別作為人工智能的一項重要應(yīng)用也擁有著巨大的前景,隨著深度學(xué)習(xí)的普及和框架的成熟,卷積神經(jīng)網(wǎng)絡(luò)模型的識
    的頭像 發(fā)表于 07-10 11:12 ?2404次閱讀
    基于FPGA的<b class='flag-5'>SSD</b><b class='flag-5'>目標</b><b class='flag-5'>檢測</b>算法設(shè)計

    基于LockAI視覺識別模塊:C++目標檢測

    是基于百度飛槳深度學(xué)習(xí)框架開發(fā)的一個高效的目標檢測庫,支持多種先進的目標檢測模型,如 YOLO 系列、
    發(fā)表于 06-06 14:43

    概倫電子標準單元庫特征化解決方案NanoCell介紹

    標準單元庫包括電路設(shè)計、版圖設(shè)計和特征提取,它對芯片設(shè)計至關(guān)重要。其中標準單元庫的特征提取需要大量仿真、模型提取和驗證,在標準單元庫開發(fā)中
    的頭像 發(fā)表于 04-16 09:49 ?912次閱讀
    概倫電子標準單元庫<b class='flag-5'>特征</b>化解決方案NanoCell介紹

    概倫電子目標驅(qū)動模型提取自動化平臺SDEP介紹

    SDEP是一款具有創(chuàng)新性的半導(dǎo)體器件SPICE模型提取自動化平臺,平臺內(nèi)配備功能強大、內(nèi)容豐富的API,支持用戶根據(jù)模型經(jīng)驗和實際需要搭建可重復(fù)使用與不斷優(yōu)化的模型
    的頭像 發(fā)表于 04-16 09:30 ?765次閱讀
    概倫電子<b class='flag-5'>目標</b>驅(qū)動<b class='flag-5'>模型</b><b class='flag-5'>提取</b>自動化平臺SDEP介紹

    明遠智睿SSD2351核心板助力智能監(jiān)控系統(tǒng)升級

    2351核心板能夠在短時間內(nèi)完成大量人臉圖像的特征提取和比對工作,識別準確率高達99%以上,大大提高了安檢效率和安全性。 此外,SSD2351核心板豐富的其他接口也為智能監(jiān)控系統(tǒng)的擴展提供了便利。I2C接口可
    發(fā)表于 04-14 18:28

    給個思路也可以(不知道這個無線通信模塊怎么實現(xiàn))

    有償定做一個智能考勤機 要求:(1)指紋模塊:采集指紋圖像和傳輸指紋信息,對指紋圖像進行預(yù)處理,消除噪聲干擾,還原圖像的真實特征信息。完成特征提取為指紋特征匹配提供依據(jù),并與指紋數(shù)據(jù)庫中的指紋進行
    發(fā)表于 03-21 16:50

    SSD300模型轉(zhuǎn)換為IR時收到錯誤的原因?

    SSD300 模型轉(zhuǎn)換為 IR 時收到錯誤: [ FRAMEWORK ERROR ] Model Optimizer is not able to parse /OpenVINO
    發(fā)表于 03-07 07:58