訓練一個高準確率的檢測模型需要大量精細標注的圖片數(shù)據(jù),其成本很高。本文提出了一種弱監(jiān)督協(xié)同學習框架,僅使用粗略標簽的圖片訓練目標檢測模型,測試結果顯示其定位精確率和檢測準確率均顯著優(yōu)于目前最先進的方法。
目標檢測是機器視覺的基本問題,在視頻監(jiān)控、無人駕駛等場景都有廣泛應用。隨著深度學習的興起,近年來涌現(xiàn)了大量優(yōu)秀的目標檢測模型。然而,訓練一個高準確率的檢測模型需要大量的以包圍框形式精細標注的圖片數(shù)據(jù)作為模型監(jiān)督條件,需要花費大量的人力物力。
同時,我們可以從互聯(lián)網(wǎng)輕松獲取海量粗標注的圖片,如利用Flickr的標簽。因此,研究如何在弱監(jiān)督條件下,即僅提供粗略圖片類別標注,訓練目標檢測模型,具有重要的意義。已有學者探索了基于多示例學習構建弱監(jiān)督條件下的目標檢測模型學習方法,但是模型的精確度仍然難以令人滿意。
論文:Collaborative Learning for Weakly Supervised Object Detection

論文鏈接:https://arxiv.org/abs/1802.03531
本論文提出了一種弱監(jiān)督協(xié)同學習(WSCL)的框架,將弱監(jiān)督學習網(wǎng)絡和強監(jiān)督學習網(wǎng)絡連接成為一個整體網(wǎng)絡,通過一致性損失約束強監(jiān)督和弱監(jiān)督學習網(wǎng)絡具有相似的預測結果,通過強監(jiān)督和弱監(jiān)督學習網(wǎng)絡間部分特征共享保證兩個網(wǎng)絡在感知水平上的一致性,從而實現(xiàn)強監(jiān)督和弱監(jiān)督學習網(wǎng)絡的協(xié)同增強學習。弱監(jiān)督協(xié)同學習框架結構如下圖所示:

弱監(jiān)督協(xié)同學習框架(以目標檢測為例)
基于上述弱監(jiān)督協(xié)同學習框架,論文設計了一個端到端的弱監(jiān)督協(xié)同檢測網(wǎng)絡(WSCDN),弱監(jiān)督和強監(jiān)督的檢測模塊分別采用了目前最優(yōu)秀WSDDN和RCNN網(wǎng)絡結構。其網(wǎng)絡結構如下圖所示。

弱監(jiān)督協(xié)同目標檢測學習模型
在每次學習迭代中,整個目標檢測網(wǎng)絡只將圖像級標簽作為弱監(jiān)督,并且通過預測一致性損失并行優(yōu)化強監(jiān)督和弱監(jiān)督檢測網(wǎng)絡。
下圖是WSCDN訓練時,強監(jiān)督和弱監(jiān)督檢測網(wǎng)絡準確率的變化曲線。

可以看出,在訓練的初始階段,弱監(jiān)督檢測網(wǎng)絡準確率高于強監(jiān)督檢測網(wǎng)絡。隨著協(xié)同訓練輪次的增多,兩者的準確率均逐漸上升,但強監(jiān)督檢測網(wǎng)絡提升的速度更快,并很快超越弱監(jiān)督檢測網(wǎng)絡。在整個訓練過程中,兩類檢測網(wǎng)絡相互協(xié)同,達到了共同提高的效果。
我們比較了弱監(jiān)督協(xié)同檢測網(wǎng)絡與其他相關弱監(jiān)督檢測方法在PASCAL VOC 2007測試圖片上的效果(見下圖)。其中,IW是單獨訓練得到的弱監(jiān)督檢測模型,CSS是分開迭代訓練得到的強監(jiān)督檢測模型,CLW和CLS分別是通過弱監(jiān)督協(xié)同檢測網(wǎng)絡得到的強監(jiān)督和弱監(jiān)督檢測網(wǎng)絡??梢钥闯觯覀兊膹姳O(jiān)督檢測網(wǎng)絡明顯優(yōu)于其他檢測器網(wǎng)絡,表現(xiàn)在可以得到更全面和更緊湊的包圍框預測。
我們用PASCAL VOC 2007和PASCAL VOC 2012數(shù)據(jù)集進行了測試。結果表明,弱監(jiān)督協(xié)同檢測網(wǎng)絡的定位精確率以及檢測準確率均顯著優(yōu)于目前最先進的方法。
弱監(jiān)督協(xié)同檢測網(wǎng)絡與其他目前最先進的方法在PASCAL VOC 2007 測試數(shù)據(jù)集上檢測精確度的比較(AP) (%)

弱監(jiān)督協(xié)同檢測網(wǎng)絡與其他目前最先進的方法在PASCAL VOC 2007 trainval set 上定位精確度的比較(CorLoc) (%)

弱監(jiān)督協(xié)同檢測網(wǎng)絡與其他目前最先進的方法在PASCAL VOC 2012 測試數(shù)據(jù)集上檢測精確度的比較(AP) (%)

弱監(jiān)督協(xié)同檢測網(wǎng)絡與其他目前最先進的方法在PASCAL VOC 2012 trainval set 上定位精確度的比較(CorLoc) (%)

-
互聯(lián)網(wǎng)
+關注
關注
55文章
11319瀏覽量
108799 -
網(wǎng)絡
+關注
關注
14文章
8125瀏覽量
93023 -
無人駕駛
+關注
關注
99文章
4251瀏覽量
125985
原文標題:IJCAI Oral:弱監(jiān)督實現(xiàn)精確目標檢測,上交大提出協(xié)同學習框架
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
使用MATLAB進行無監(jiān)督學習
深非監(jiān)督學習-Hierarchical clustering 層次聚類python的實現(xiàn)
如何用卷積神經(jīng)網(wǎng)絡方法去解決機器監(jiān)督學習下面的分類問題?
基于半監(jiān)督學習框架的識別算法
你想要的機器學習課程筆記在這:主要討論監(jiān)督學習和無監(jiān)督學習
如何用Python進行無監(jiān)督學習
機器學習算法中有監(jiān)督和無監(jiān)督學習的區(qū)別
最基礎的半監(jiān)督學習
半監(jiān)督學習最基礎的3個概念
為什么半監(jiān)督學習是機器學習的未來?
半監(jiān)督學習:比監(jiān)督學習做的更好
深度學習:基于語境的文本分類弱監(jiān)督學習
機器學習中的無監(jiān)督學習應用在哪些領域
自監(jiān)督學習的一些思考
融合零樣本學習和小樣本學習的弱監(jiān)督學習方法綜述

實現(xiàn)強監(jiān)督和弱監(jiān)督學習網(wǎng)絡的協(xié)同增強學習
評論