chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

百度視覺團隊在全球最大規(guī)模目標檢測競賽,中國團隊從全球450多支參賽隊伍中脫穎而出

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-09-14 08:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在Google主辦的最大規(guī)模開放圖像目標檢測競賽中,中國團隊再次獲得冠軍。獲獎技術采用了FPN,cascade-rcnn等最新的檢測算法,并面向復雜實際場景數據集對算法進行了改進,模型性能實現了大幅提升。

眼睛是人類接觸外部世界的第一感官,對于機器而言,計算機視覺技術就是它們的“眼睛”。近日,百度視覺團隊在全球最大規(guī)模目標檢測競賽Google AI Open Images-Object Detection Track中從全球450多支參賽隊伍中脫穎而出,獲得世界第一,并在ECCV 2018上進行分享。

Google AI Open Images-Object Detection Track是大規(guī)模目標檢測任務的權威挑戰(zhàn)賽事,由Google AI Research舉辦,賽事遵循 PASCAL VOC、ImageNet和COCO等賽事傳統(tǒng),但數據規(guī)模遠大于這些賽事。

Open Images V4數據集

據介紹,大賽采用Google今年5月份發(fā)布的Open Images V4數據集作為訓練數據集,包含超過170萬的圖片數據,500個類別以及超過1200萬物體框,數據沒有完全精細標注,屬于弱監(jiān)督任務,框選類別數目不均衡且有非常廣泛的類別分布,這更符合實際情況,也意味著參加競賽的團隊需要考慮到類別的分布,而不能統(tǒng)一對所有類別做處理,因此更具挑戰(zhàn)性。這項賽事有助于復雜模型的研究,同時對評估不同檢測模型的性能有積極的促進作用。下圖為Open Image V4 與 MS COCO 和 ImageNet 檢測任務數據對比情況。

Open Image V4 與 MS COCO及ImageNet 檢測數據對比情況

與傳統(tǒng)的檢測數據集合相比,該賽事除了數據規(guī)模大、更真實之外,還存在一系列的挑戰(zhàn)。具體來說,主要集中在以下三個方面:

數據分布不均衡:最少的類別框選只有14個,而最多的類別框選超過了140w,數據分布嚴重不均衡。

類別框數量分布

漏標框:很多圖片存在只標注主體類別,其他小物體或者非目標物體沒有標注出來。

漏標注圖片舉例

尺度變化大:大部分物體框只占整個圖片的0.1以下,而有些框選卻占了整個圖片區(qū)域。如圖所示,Open Image V4集合存在更多的小物體,參賽者也會在檢測數據中遇到更大的挑戰(zhàn)。

框尺度大小分布對比

解決方案

在比賽過程中百度視覺團隊采用了不同復雜度、不同骨架網絡進行模型的訓練,并對這些模型進行融合。從整體方案框架來看,可分為Fast R-CNN和Faster R-CNN兩種不同的訓練模式。Fast R-CNN版本是該團隊研發(fā)的一套PaddlePaddle版本,在此基礎上Faster R-CNN加入了 FPN、Deformable、Cascade等最新的檢測算法,模型性能實現了大幅度的提升。

整體方案框架流程圖

骨架網絡為ResNet-101 的Fast R-CNN,模型收斂后可以達到0.481,在測試階段加入Soft NMS以及 Multi-Scale Testing策略,可以達到0.508。研究人員也嘗試了其他骨架網絡(dpn98,Inception-v4,Se-ResNext101),并把不同骨架網絡的檢測算法融合到一起,最終mAP可以達到0.546。在Proposal采樣階段,團隊使用在不同位置進行不同尺度的候選框生成,然后對這些框選進行分類以及調整他們的位置。

Faster R-CNN: 采用這種框架可以達到略高于Fast R-CNN,mAP為0.495。在測試階段使用Soft NMS以及 Multi-Scale Testing策略后,性能達到0.525。

Deformable Convolutional Networks使用Soft NMS以及 Multi-Scale Testing策略前后,性能分別達到0.528及0.559。

Deformable Cascade R-CNN : 使用Soft NMS以及 Multi-Scale Testing策略前后,性能分別可以達到0.581和0.590.

簡言之,在Fast R-CNN框架下,該團隊采用了不同的骨架網絡進行訓練,而在Faster R-CNN框架下只使用了ResNet101這種骨架網絡進行訓練。在訓練過程中,還通過不同的策略有效解決了各種技術問題。詳情如下:

動態(tài)采樣

Google Open Images V4 數據集大概有170w圖片,1220w框選,500個類別信息。最大的類別框選超過了140w,最小的類別只有14個框選,如果簡單使用所有的圖片及框選,需要幾十天才能進行模型訓練,而且很難訓練出來一個無偏的模型。因此,需要在訓練過程中進行動態(tài)采樣,如果樣本數量多則減少采樣概率,而樣本數量少則增加采樣概率。研究人員分別進行全集數據訓練、固定框選子集訓練、動態(tài)采樣模型訓練三種策略進行。

全集數據訓練:按照主辦方提供數據進行訓練,mAP達到0.50。

固定框選子集訓練:線下固定對每個類別最多選擇1000個框,mAP達到0.53。

動態(tài)采樣模型訓練:對每個GPU、每個Epoch采用線上動態(tài)采樣,每次采集的數據都不同,輪數達到一定數目后,整個全集的數據都能參與整體訓練。最后mAp達到0.56。

動態(tài)采樣策略

FPN

基于訓練數據集的分析,研究人員發(fā)現其中500個類別的尺度有很大的差異。因此他們將FPN引入到檢測模型中,即利用多尺度多層次金字塔結構構建特征金字塔網絡。在實驗中,他們以ResNet101作為骨干網絡,在不同階段的最后一層添加了自頂向下的側連接。自頂向下的過程是向上采樣進行的,水平連接是將上采樣的結果與自底向上生成的相同大小的feature map合并。融合后,對每個融合結果進行3*3卷積以消除上采樣的混疊效應。值得注意的是,FPN應該嵌入到RPN網絡中,以生成不同的尺度特征并整合為RPN網絡的輸入。最終,引入FPN后的mAP可達到0.528。

Deformable Convolution Networks

該團隊采用可變形卷積神經網絡增強了CNNs的建模能力??勺冃尉矸e網絡的思想是在不需要額外監(jiān)督的情況下,通過對目標任務的學習,在空間采樣點上增加額外的偏移量模塊。同時將可變形卷積網絡應用于以ResNet101作為骨架網絡的Faster R-CNN架構,并在ResNet101的res5a、5b、5c層之后應用可變形卷積層,并將ROI Pooling層改進為可變形位置敏感ROI Pooling層??勺冃尉矸e網絡的mAP性能為0.552。

Cascade R-CNN

比賽中,該團隊使用級聯的R-CNN來訓練檢測模型。除訓練基本模型外,還使用包含五個尺度特征金字塔網絡(FPN)和3個尺度anchors的RPN網絡。此外,他們還訓練了一個針對全類模型中表現最差的150類的小類模型,并對這150類的模型別進行評估。得出的結論是,500類模型的MAP為0.477,而用150類單模型訓練結果替換500類的后150類的結果,則模型的MAP提升為0.498。使用以上方法進行訓練的單尺度模型的性能為0.573。

Testing Tricks

在后處理階段,團隊使Soft NMS和多尺度測試的方法。用Soft NMS的方法代替NMS后,在不同模型上有0.5-1.3點的改進,而Multi-Scale Testing在不同模型上則有0.6-2個點的提升。

模型融合

對于每個模型,該團隊在NMS后預測邊界框。來自不同模型的預測框則使用一個改進版的NMS進行合并,具體如下:

給每個模型一個0~1之間的標量權重。所有的權重總和為1;

從每個模型得到邊界框的置信分數乘以它對應的權重;

合并從所有模型得到的預測框并使用NMS,此外,除此之外,研究人員采用不同模型的分數疊加的方式代替只保留最高分模型,在這個步驟中IOU閾值為0.5。

其實,不論是在學術圈還是工業(yè)界,大規(guī)模目標檢測都是計算機視覺極為重要的基礎技術。通過這一技術,軟硬件應用產品可以深度定位圖片中的物體位置以及類別,并用于新零售、通用多物品識別等場景。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 百度
    +關注

    關注

    9

    文章

    2379

    瀏覽量

    95050
  • 計算機視覺
    +關注

    關注

    9

    文章

    1715

    瀏覽量

    47666

原文標題:【ECCV 2018】谷歌AI超大規(guī)模圖像競賽,中國團隊獲目標檢測冠軍

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    長城汽車斬獲2025年中國青年科技創(chuàng)新“揭榜掛帥”擂臺賽一等獎

    動力電池安全預警與健康管理領域的突破性技術成果,全國參賽隊伍脫穎而出,成功斬獲青年科技人
    的頭像 發(fā)表于 12-18 13:54 ?412次閱讀

    優(yōu)秀作品專訪|把“國產芯”情懷寫進團隊DNA:2025嵌賽FPGA競賽紫光同創(chuàng)杯全國總決賽“最佳工程獎”作品展示

    ”共吸引926學生隊伍報名參賽,同比增長50%,成功登頂參賽隊伍第一寶座!作為紫光同創(chuàng)高校生態(tài)合作伙伴,小眼睛科技連續(xù)4年為賽事提供全程技術支持和指導服務,助力高
    的頭像 發(fā)表于 12-08 08:03 ?719次閱讀
    優(yōu)秀作品專訪|把“國產芯”情懷寫進<b class='flag-5'>團隊</b>DNA:2025嵌賽FPGA<b class='flag-5'>競賽</b>紫光同創(chuàng)杯全國總決賽“最佳工程獎”作品展示

    openDACS 2025 開源EDA與芯片賽項 賽題七:基于大模型的生成式原理圖設計

    參賽隊伍需要選擇不同類型的案例來驗證所設計的系統(tǒng)的效果。案例類型的劃分標準由參賽隊伍自定,但需闡述劃分標準的合理性 案例的復雜:某些PCB設計具有復雜的外圍電路和較大規(guī)模的元器件數
    發(fā)表于 11-13 11:49

    TI杯2025年全國大學生電子設計競賽總測評圓滿落幕

    ,最終共產生 404 全國一等獎隊伍、1150 全國二等獎隊伍。其中,由郭蘭鑫、武文琦和王昊三位本科生組成的江南大學參賽隊,憑借“簡易自
    的頭像 發(fā)表于 11-04 09:53 ?1043次閱讀

    利用NVIDIA DOCA GPUNetIO技術提升MoE模型推理性能

    第三屆 NVIDIA DPU 中國黑客松競賽,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。 23
    的頭像 發(fā)表于 09-23 15:25 ?1071次閱讀

    基于NVIDIA BlueField DPU的5G UPF數據面加速方案

    第三屆 NVIDIA DPU 黑客松競賽,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。 23
    的頭像 發(fā)表于 09-04 11:26 ?1270次閱讀

    NVIDIA助力Axio團隊打造全新DPU數據面開發(fā)框架

    第三屆 NVIDIA DPU 黑客松競賽,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。 23
    的頭像 發(fā)表于 08-30 15:58 ?1520次閱讀

    第九屆集創(chuàng)賽龍芯職業(yè)技能杯圓滿收官

    第九屆全國大學生集成電路創(chuàng)新創(chuàng)業(yè)大賽(集創(chuàng)賽)——龍芯職業(yè)技能杯于近日圓滿收官。本屆賽事吸引了來自28所高校的59精英隊伍同臺競技,參賽規(guī)模突破200人。經過激烈角逐,最終6
    的頭像 發(fā)表于 08-28 15:02 ?1209次閱讀

    第六屆TE Connectivity AI Cup全球競賽圓滿收官

    近日,全球行業(yè)技術領先企業(yè)TE Connectivity(以下簡稱“TE”)主辦的第六屆TE AI Cup全球競賽
    的頭像 發(fā)表于 08-25 14:13 ?0次閱讀

    40個項目脫穎而出!2025英特爾人工智能大賽圓滿收官,下一個AI應用浪潮開啟

    8月16日,2025英特爾人工智能創(chuàng)新大賽決賽暨頒獎典禮深圳舉行。英特爾副總裁、中國軟件技術事業(yè)部總經理李映表示:“此次大賽,來自全國2817年青隊伍
    的頭像 發(fā)表于 08-22 10:56 ?7714次閱讀
    40個項目<b class='flag-5'>脫穎而出</b>!2025英特爾人工智能大賽圓滿收官,下一個AI應用浪潮開啟

    利用NVIDIA DPU重塑網絡安全格局

    第三屆 NVIDIA DPU 黑客松競賽,我們見證了開發(fā)者與 NVIDIA 網絡技術的深度碰撞。 23
    的頭像 發(fā)表于 08-20 14:31 ?1424次閱讀

    2025中國大學生工程實踐與創(chuàng)新能力大賽即將舉辦

    備受矚目的 2025 年中國大學生工程實踐與創(chuàng)新能力大賽國賽已進入倒計時階段,經過各省級選拔賽的激烈比拼與層層篩選,眾多優(yōu)秀參賽隊伍脫穎而出,成功晉級全國決賽。這些精英團隊將于 8 月
    的頭像 發(fā)表于 08-07 09:10 ?1650次閱讀

    中國兩大高校團隊斬獲第六屆TE Connectivity AI Cup全球競賽桂冠

    中國上海,2025年8月4日 ——近日,全球行業(yè)技術領先企業(yè)TE Connectivity(以下簡稱“TE”)主辦的第六屆TE AI Cup全球
    的頭像 發(fā)表于 08-05 15:03 ?1094次閱讀
    <b class='flag-5'>中國</b>兩大高校<b class='flag-5'>團隊</b>斬獲第六屆TE Connectivity AI Cup<b class='flag-5'>全球</b><b class='flag-5'>競賽</b>桂冠

    斬獲國家級獎項!拓維信息助力廣東聯通打造全棧信創(chuàng)辦公解決方案

    近日,2025數字中國創(chuàng)新大賽信創(chuàng)賽道華南賽區(qū)獲獎名單出爐,由拓維信息與廣東聯通聯合打造的《全面“信創(chuàng)化、智能化、移動化”數智辦公解決方案》憑借卓越的技術前瞻性與場景落地能力,
    的頭像 發(fā)表于 05-21 19:51 ?1425次閱讀
    斬獲國家級獎項!拓維信息助力廣東聯通打造全棧信創(chuàng)辦公解決方案

    2025集創(chuàng)賽紫光同創(chuàng)杯賽直播預告|提供400套板卡支持,參賽隊伍速來申請!

    B站直播鏈接:https://live.bilibili.com/22034884本次紫光同創(chuàng)杯將提供400套板卡的支持參賽隊伍可以自行選擇借用或租用一、板卡借用紫光同創(chuàng)將提供250套盤古
    的頭像 發(fā)表于 04-14 09:53 ?1308次閱讀
    2025集創(chuàng)賽紫光同創(chuàng)杯賽直播預告|提供400套板卡支持,<b class='flag-5'>參賽隊伍</b>速來申請!