chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CVPR 2019競賽第一解決方案分享

DPVg_AI_era ? 來源:lq ? 2019-06-23 07:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CVPR 2019細粒度圖像分類workshop的挑戰(zhàn)賽公布了最終結(jié)果:中國團隊DeepBlueAI獲得冠軍。本文帶來冠軍團隊解決方案的技術(shù)分享。

近日,在Kaggle上舉辦的CVPR 2019 Cassava Disease Classification挑戰(zhàn)賽公布了最終結(jié)果,國內(nèi)團隊 DeepBlueAI 獲得冠軍。

國際計算機視覺與模式識別會議(CVPR)是IEEE一年一度的學術(shù)性會議,CVPR是世界頂級的計算機視覺會議之一,會議的主要內(nèi)容是計算機視覺與模式識別技術(shù)。CVPR 2019 在洛杉磯長灘舉行,F(xiàn)GVC6 Workshop也將作為 CVPR 2019 的一部分如期召開。FGVC6 Workshop 共有十個挑戰(zhàn)賽,每個都代表了細粒度視覺分類在某個細分領(lǐng)域的挑戰(zhàn)。

FGVC全稱為Fine-Grained Visual Categorization,細粒度圖像分類,即區(qū)分不同的動物和植物、汽車和摩托車模型、建筑風格等,是機器視覺社區(qū)剛剛開始解決的最有趣和最有用的開放問題之一。細粒度圖像分類在于基本的分類識別(對象識別)和個體識別(人臉識別,生物識別)之間的連續(xù)性。相似的類別之間的視覺區(qū)別通常非常小,因此很難用當今的通用識別算法來解決。

今年是FGVC舉辦的第六屆比賽,往屆比較著名的比賽諸如iNaturalist和iMaterialist,前者側(cè)重于區(qū)分自然界不同的生物,后者則是側(cè)重于區(qū)分不同的人造物體。

不同于傳統(tǒng)的廣義上的分類任務(wù),F(xiàn)GVC的挑戰(zhàn)致力于子類別的劃分,需要分類的對象之間更加相似,例如區(qū)分不同的鳥類、不同的植物、不同的日用品等。

賽題介紹

Cassava Disease Classification挑戰(zhàn)賽是一個根據(jù)木薯的葉子區(qū)分不同種類的木薯疾病的任務(wù)。Cassava 譯為木薯,是非洲第二大碳水化合物供應(yīng)者,因為其能夠承受惡劣的環(huán)境。因此木薯是小農(nóng)種植的一種關(guān)鍵的糧食安全作物,在撒哈拉以南非洲,至少80%的小農(nóng)家庭種植木薯,而病毒性疾病是低產(chǎn)量的主要來源。

在這次比賽中,主辦方引入一個包含5種類別的木薯葉疾病的數(shù)據(jù)集,該數(shù)據(jù)集源于在烏干達定期調(diào)查中收集到的9436標記圖像,主要從農(nóng)民在自家田地里拍攝的圖片,然后由國家作物資源研究所(NaCRRI)與Makarere大學的人工智能實驗室共同對圖像進行標注。

數(shù)據(jù)集包括木薯植株的葉子圖像,9,436張帶注釋的圖像和12,595張未標記的圖像。參與者可以選擇使用未標記的圖像作為額外的訓練數(shù)據(jù)。目標是學習一個模型,使用訓練數(shù)據(jù)中的圖像將給定的圖像分類為這4個疾病類別或健康葉子的類別。

團隊成績

題目特點以及常用方法

細粒度圖像分類 (Fine-grained imagecategorization), 又被稱作子類別圖像分類 (Sub-category recognition)。其目的是對屬于同一基礎(chǔ)類別的圖像進行更加細致的子類劃分, 但由于子類別間細微的類間差異以及較大的類內(nèi)差異, 更傳統(tǒng)的圖像分類任務(wù)相比, 細粒度圖像分類難度明顯要大很多。從下圖中的木薯的葉子可以看出,不同的葉子病變情況長相非常相似,此外同一類別由于姿態(tài),背景以及拍攝角度的不同,存在較大的類內(nèi)差異。

細粒度圖像分類的常用方法可以分為兩種,分別是基于強監(jiān)督信息的方法和僅使用弱監(jiān)督信息的方法。前者需要使用對象的邊界框和局部標注信息,后者僅使用類別標簽,Cassava Disease Classification是一種弱監(jiān)督信息的細粒度識別,一般采用預訓練模型finetune,并結(jié)合訓練技巧對模型精調(diào)。

實驗模型:SENet、ResNet、DenseNet

ResNet是CNN歷史上一個里程碑事件,模型深度達到了152層,這和之前CNN的層數(shù)完全不在一個量級上。ResNet中的identity的這條線類似一條電路上的短路(shortcuts,skip connection),使得模型學習更加容易,深層可以直接得到淺層的網(wǎng)絡(luò)特征。

DenseNet的原理不同于ResNet通過加深網(wǎng)絡(luò)層數(shù)以及Inception通過加寬網(wǎng)絡(luò)寬度來提高模型識別能力,而是利用特征重用和類似ResNet的Bypass的方式,減少了網(wǎng)絡(luò)參數(shù)和緩解了梯度消失的問題。

SENet提出了Sequeeze and Excitation block,該模塊于傳統(tǒng)網(wǎng)絡(luò)的最大區(qū)別在于其側(cè)重于構(gòu)建通道之間的依賴關(guān)系,利用global average pooling來Sequeeze特征圖,并用Excitation對前者進行非線性變換,最后再疊加到輸入特征上。可以自適應(yīng)的校準通道的相應(yīng)特征,并且該模塊可以嵌入到現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)中,實現(xiàn)精度的提升。

模型訓練與評測

原圖 VerticalFlip HorizontalFlip RandomRotateRandomCrop

RandomErasing

CutOut

由于訓練集樣本過少,對比分析后對輸入數(shù)據(jù)采取 VerticalFlip,HorizontalFilp 、RandomRotate和RandomCrop的增強操作。此外,還使用了RandomErasing和Cutout,方法會在原圖隨機選擇一些矩形區(qū)域,改變該區(qū)域的像素值,通過這些數(shù)據(jù)增強的方式,訓練集的圖片會被不同程度的遮擋,這樣可以進一步降低過擬合的風險并提高模型的魯棒性。

同樣的,為了增強模型的魯棒性減少過擬合,本次比賽我們利用5-fold crossvalidation,交叉驗證有效利用了有限的數(shù)據(jù),并且評估結(jié)果能夠盡可能接近模型在測試集上的表現(xiàn)。用crossvalidation之后,SE_ResNeXt50測試集準確率提升0.01016,ResNet34測試集準確率提升0.01142。

這次比賽中,我們還使用了Mixup和label smoothing的訓練策略。Mixup顧名思義就是將兩張圖片按一定比例融合起來作為輸入,計算loss時,針對兩張圖片的標簽分別計算,然后按比例加權(quán)求和。Mixup是一種抑制過擬合的策略,通過增加了一些數(shù)據(jù)上的擾動,從而提升了模型的泛化能力。

實驗證明,該方式能將Top1準確率提高近一個百分點。對于分類問題,常規(guī)做法時將類別換成one-hot vector。由于標簽是類別的one-hot vector,這樣做易導致過擬合使得模型泛化能力下降;同時這種做法會將所屬類別和非所屬類別之間的差距盡可能大,因此很難調(diào)優(yōu)模型。

為此,可以用label smoothing對標簽進行平滑處理,軟化one-hot類型標簽,使得計算損失函數(shù)時能有效抑制過擬合現(xiàn)象。

訓練以Adam為optimiser,學習率的設(shè)置為階梯狀,共四個取值,[3e-4, 1e-4,1e-5, 1e-6],設(shè)置patience為4來衰減學習率,即模型連續(xù)4個epoch在驗證集上效果沒有提升則衰減學習率,訓練總的epcoh在20次左右。本實驗使用的GPU為4卡2080Ti,并行訓練一個模型,batchsize通常設(shè)為32,較大的模型根據(jù)實際情況適當減小。

模型在預測時采用了數(shù)據(jù)增強的方式Test time augmentation(TTA),即將樣本圖像進行多個不同的變換獲得多個不同的預測結(jié)果,再將預測結(jié)果進行平均,提高精度。本次任務(wù)利用3*TTA,包括 RandomCrop, RandomCrop+HorizontalFlip 和RandomCrop+VerticalFlip 。

模型集成是算法比賽中常用的提高模型精度方法,本次比賽我們訓練了大量在ImageNet上表現(xiàn)優(yōu)良的模型,其中表現(xiàn)較好的模型如下表所示、在采取多種融合方式之后,最終發(fā)現(xiàn)SE_ResNeXt50、SE_ResNeXt101、SENet154以及DenseNet201按照歸一化后權(quán)重的融合效果最好,在測試集上的準確率達到了0.92516。

模型 測試集準確率
SE_ResNeXt50 0.92251
SE_ResNeXt101 0.92384
SENet154 0.92384
DenseNet201 0.91721
MobileNetV2 0.91601
ResNet152 0.91710
SE_ResNeXt50+SE_ResNeXt101+SENet154+DenseNet201 0.92516

本次比賽主辦方提供了12595張未帶label的額外數(shù)據(jù)集,為了充分利用該數(shù)據(jù)集,利用在測試集表現(xiàn)最好的融合模型給這些數(shù)據(jù)集貼上偽標簽。然后利用訓練集和偽標簽數(shù)據(jù)集訓練模型,為了防止模型在偽標簽上過擬合,我們對偽標簽采取了一定的篩選操作。

采取的思路是:用多個不同概率閾值的過濾所得到的偽標簽進行線下實驗,看哪個閾值下的數(shù)據(jù)在線下的表現(xiàn)最好,就用通過該閾值篩選過濾出的數(shù)據(jù),最終以0.95的閾值篩選出一半的數(shù)據(jù)作為添加到訓練集的偽標簽數(shù)據(jù)。

實驗證明這種半監(jiān)督的學習方法具有更強的泛化能力。

模型 測試集準確率
(public leaderboard)
Private leaderboard
SE_ResNeXt50 0.92251 0.93012
SE_ResNeXt50 with pseudo data 0.92195 0.93512
SE_ResNeXt101 0.92384 0.93134
SE_ResNeXt101 with pseudo data 0.92202 0.93409
SENet154 0.92384 0.93054
SE_ResNeXt154 with pseudo data 0.92283 0.93428
SE_ResNeXt50+SE_ResNeXt101+
SENet154+DenseNet201
0.92516 0.93727
SE_ResNeXt50+SE_ResNeXt101+
SENet154+DenseNet201
with pseudo data
0.92516 0.93860

進一步工作

針對細粒度圖像分類,MSRA有一個結(jié)論:分析該問題時圖像的形態(tài)、輪廓特征原沒細節(jié)紋理特征重要,而傳統(tǒng)的CNN模型都是在構(gòu)建輪廓特征,因此在構(gòu)建神經(jīng)網(wǎng)絡(luò)時,應(yīng)該更加精確地找到圖像中最有區(qū)分度的子區(qū)域,然后再對這些區(qū)域采用高分辨率、精細化特征的方法,這樣可以進一步提高細粒度圖像分類的準確率。

另外對數(shù)據(jù)本身我們可能需要做更多的工作,在任務(wù)初期沒有做足夠的探索性數(shù)據(jù)分析,例如數(shù)據(jù)的分布、類型、輸入圖像的尺寸等都是影響結(jié)果的因素,因此數(shù)據(jù)分析也是后面的一個嘗試點。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1094

    瀏覽量

    42004
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49497

    瀏覽量

    258189
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1713

    瀏覽量

    47325

原文標題:CVPR 2019細粒度圖像分類競賽中國團隊DeepBlueAI獲冠軍 | 技術(shù)干貨分享

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    無人超市解決方案 智慧新零售解決方案

    通過閱讀本篇文章,你將了解到:1.為什么需要無人超市解決方案?2.無人超市是什么?3.無人超市的常見應(yīng)用場景4.無人超市解決方案的功能有哪些?5.無人超市的最佳實踐案例、為什么需要無人超市
    的頭像 發(fā)表于 08-22 10:22 ?553次閱讀
    無人超市<b class='flag-5'>解決方案</b> 智慧新零售<b class='flag-5'>解決方案</b>

    地平線H-RDT模型斬獲CVPR 2025大賽冠軍

    近日,在計算機視覺與模式識別領(lǐng)域頂級會議CVPR 2025舉辦的RoboTwin雙臂機器人競賽中,地平線機器人實驗室與清華大學計算機系朱軍團隊聯(lián)合提出的H-RDT憑強大性能和領(lǐng)先成功率,舉斬獲真機賽冠軍(
    的頭像 發(fā)表于 08-21 10:02 ?320次閱讀
    地平線H-RDT模型斬獲<b class='flag-5'>CVPR</b> 2025大賽冠軍

    首屆“天馬杯”ICDT車載顯示創(chuàng)新競賽圓滿落幕

    前沿技術(shù),發(fā)揮個人科研興趣和創(chuàng)新能力,提出具備實際應(yīng)用價值的解決方案。作為項全國性賽事,競賽不僅為高校學生提供豐富產(chǎn)業(yè)應(yīng)用知識、培養(yǎng)實踐能力的平臺,更致力于推動顯示技術(shù)的創(chuàng)新發(fā)展與應(yīng)用。
    的頭像 發(fā)表于 08-19 09:55 ?686次閱讀

    華為成為5G RAN解決方案領(lǐng)域的唯領(lǐng)導者

    近日,全球權(quán)威咨詢機構(gòu)GlobalData發(fā)布了2025年《5G RAN競爭力評估報告》(以下簡稱《報告》)。華為憑借領(lǐng)先的解決方案和成熟商用案例已連續(xù)7年蟬聯(lián)第一,并以5G-A和AI融合解決方案持續(xù)擴大領(lǐng)先優(yōu)勢,成為本年度唯
    的頭像 發(fā)表于 08-15 09:29 ?2566次閱讀
    華為成為5G RAN<b class='flag-5'>解決方案</b>領(lǐng)域的唯<b class='flag-5'>一</b>領(lǐng)導者

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?841次閱讀

    潤和軟件穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一

    ”)憑借自身卓越的技術(shù)實力和創(chuàng)新能力,連續(xù)五年穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一名;在細分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場持續(xù)保持第一名,數(shù)字銀行解決方
    的頭像 發(fā)表于 07-14 17:36 ?953次閱讀

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    近日,在計算機視覺領(lǐng)域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?1309次閱讀
    傳音多媒體團隊攬獲<b class='flag-5'>CVPR</b> NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    如何在ctd解決方案中使用FRS (ccg2,3)?

    的話,你能否給我舉個來自 ctd us 解決方案代碼的示例,這是 ctd 解決方案的示例代碼? 如果那不起作用,除了圖片的設(shè)置之外我還需要留點什么嗎? 上面的代碼說,frs_enable 將在初始協(xié)商后應(yīng)用,所以我
    發(fā)表于 05-27 07:56

    挑戰(zhàn)具身機器人協(xié)同操作新高度!地瓜機器人邀你共戰(zhàn)CVPR 2025雙臂協(xié)作機器人競賽

    ,本屆會議聚焦“生成式人工智能時代的多智能體具身系統(tǒng)”,深入探討人工智能技術(shù)的前沿發(fā)展與應(yīng)用。作為CVPR協(xié)作智能workshop的核心賽事之,RoboTwin雙臂
    的頭像 發(fā)表于 04-11 05:30 ?1013次閱讀
    挑戰(zhàn)具身機器人協(xié)同操作新高度!地瓜機器人邀你共戰(zhàn)<b class='flag-5'>CVPR</b> 2025雙臂協(xié)作機器人<b class='flag-5'>競賽</b>

    解決方案】安科瑞智慧用電產(chǎn)品解決方案介紹

    解決方案】安科瑞智慧用電產(chǎn)品解決方案介紹
    的頭像 發(fā)表于 02-19 08:42 ?750次閱讀
    【<b class='flag-5'>解決方案</b>】安科瑞智慧用電產(chǎn)品<b class='flag-5'>解決方案</b>介紹

    電摩電機控制器解決方案

    請問各位大佬,哪些途徑可以買到解決方案?或者哪位大佬有成熟的電摩電機控制器解決方案,可以聯(lián)系我,有使用需求。
    發(fā)表于 02-12 15:43

    【藍橋杯物聯(lián)網(wǎng)STM32WLE5】第一競賽規(guī)則及說明

    第一節(jié)組別說明1.具有正式全日制學籍并且符合相關(guān)科目報名要求的研究生、本科及高職高專學生(以報名時狀態(tài)為準),以個人為單位進行比賽。該科目設(shè)大學組。2.每位選手配備名指導教師,每名選手的指導教師
    的頭像 發(fā)表于 12-18 21:03 ?1551次閱讀
    【藍橋杯物聯(lián)網(wǎng)STM32WLE5】<b class='flag-5'>第一</b>章 <b class='flag-5'>競賽</b>規(guī)則及說明

    解決方案】智慧用電解決方案

    解決方案】智慧用電解決方案
    的頭像 發(fā)表于 11-11 01:00 ?549次閱讀
    【<b class='flag-5'>解決方案</b>】智慧用電<b class='flag-5'>解決方案</b>

    解決方案 | 基于TSMaster的平板電腦解決方案

    Tosun基于TSMaster的平板電腦解決方案基于TSMaster的平板電腦是款集成了TSMaster軟件平臺和多種總線分析硬件工具的綜合產(chǎn)品,旨在充分發(fā)揮同星自主研發(fā)的技術(shù)優(yōu)勢,解決實車路試
    的頭像 發(fā)表于 11-10 01:02 ?1153次閱讀
    <b class='flag-5'>解決方案</b> | 基于TSMaster的平板電腦<b class='flag-5'>解決方案</b>

    智慧公交是什么?文帶你詳解智慧公交的解決方案!

    智慧公交是什么?文帶你詳解智慧公交的解決方案!
    的頭像 發(fā)表于 11-05 12:26 ?1267次閱讀
    智慧公交是什么?<b class='flag-5'>一</b>文帶你詳解智慧公交的<b class='flag-5'>解決方案</b>!