chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MS-DETR和其他SOTA方法的對(duì)比

3D視覺工坊 ? 來源:3D視覺工坊 ? 2024-01-23 14:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 寫在前面

目標(biāo)檢測(cè)到底是DETR好還是YOLO好?感覺也沒有一個(gè)明確的答案,YOLO在不停的平衡精度和效率,DETR也在不停的提高實(shí)時(shí)性。今天筆者為大家推薦一篇最新的DETR開源工作MS-DETR,通過一對(duì)一監(jiān)督和一對(duì)多監(jiān)督相結(jié)合的方式,提高DETR的訓(xùn)練效率。

下面一起來閱讀一下這項(xiàng)工作

2. 摘要

DETR通過迭代地生成基于圖像特征的多個(gè)候選目標(biāo),并為每個(gè)真值目標(biāo)提升一個(gè)候選目標(biāo),從而實(shí)現(xiàn)端到端的目標(biāo)檢測(cè)。原始DETR中采用一對(duì)一監(jiān)督的傳統(tǒng)訓(xùn)練過程缺乏對(duì)目標(biāo)檢測(cè)候選的直接監(jiān)督。

我們旨在通過一對(duì)一監(jiān)督和一對(duì)多監(jiān)督相結(jié)合的方式,對(duì)候選生成過程進(jìn)行明確監(jiān)督,從而提高DETR的訓(xùn)練效率。我們的方法,即MS - DETR,簡單,并且對(duì)用于推理的主解碼器的對(duì)象查詢進(jìn)行一對(duì)多的監(jiān)督。與現(xiàn)有的一對(duì)多監(jiān)督的DETR變體(如Group DETR和Hybrid DETR )相比,我們的方法不需要額外的解碼器分支或?qū)ο蟛樵?。在我們的方法中,主解碼器的對(duì)象查詢直接受益于一對(duì)多的監(jiān)督,因此在對(duì)象候選預(yù)測(cè)方面具有優(yōu)勢(shì)。實(shí)驗(yàn)結(jié)果表明,我們的方法優(yōu)于相關(guān)DETR變體,如DN - DETR、Hybrid DETR和Group DETR,與相關(guān)DETR變體的結(jié)合進(jìn)一步提高了性能。

3. 效果展示

這篇文章的思想就是使用一對(duì)一監(jiān)督和一對(duì)多監(jiān)督相結(jié)合的混合監(jiān)督?;旌媳O(jiān)督會(huì)產(chǎn)生更好的檢測(cè)候選。Top:box真值。Middle:與基線匹配的前20個(gè)查詢的候選框。Bottom:使用MS - DETR從前20個(gè)查詢中選出候選框??梢钥闯觯琈S - DETR比基線產(chǎn)生了更好的檢測(cè)候選。

4. 具體原理是什么?

混合監(jiān)督會(huì)產(chǎn)生比基線更低的一對(duì)一損失。x軸對(duì)應(yīng)epoch,y軸對(duì)應(yīng)一對(duì)一監(jiān)督的訓(xùn)練損失。虛線和實(shí)線分別對(duì)應(yīng)于Deformable DETR基線和MS - DETR的損失曲線。

f7538902-b164-11ee-8b88-92fbcf53809c.jpg

不同架構(gòu)的差異。( a )原始DETR:采用一對(duì)一監(jiān)督的方式對(duì)其進(jìn)行訓(xùn)練。( b ) MS -- DETR:通過混合一對(duì)一和一對(duì)多監(jiān)督的方式進(jìn)行訓(xùn)練。這兩種監(jiān)督都施加在初級(jí)解碼器上。( c ) DETR組和DN - DETR組。引入了額外的并行譯碼器,并對(duì)額外的譯碼器進(jìn)行一對(duì)一的監(jiān)督。DETR和DN - DETR可能會(huì)使用更多的額外解碼器。(d) 混合DETR:增加了一個(gè)額外的并行譯碼器,并對(duì)額外的譯碼器施加一對(duì)多的監(jiān)督。

f75ce43e-b164-11ee-8b88-92fbcf53809c.jpg

MS-DETR的具體實(shí)現(xiàn)。( a )對(duì)每個(gè)解碼器層的輸出對(duì)象查詢進(jìn)行一對(duì)一和一對(duì)多的監(jiān)督。( b )對(duì)每個(gè)稍作修改的解碼器層的輸出對(duì)象查詢進(jìn)行兩次監(jiān)督:首先執(zhí)行交叉注意力,然后執(zhí)行自注意力。( c )和( d )對(duì)內(nèi)部對(duì)象查詢進(jìn)行一對(duì)多監(jiān)督。cls11和box11是一對(duì)一監(jiān)督的class和box預(yù)測(cè)子,cls1m和box1m是一對(duì)多監(jiān)督的class和box預(yù)測(cè)子。

f7832108-b164-11ee-8b88-92fbcf53809c.jpg

5. 和其他SOTA方法的對(duì)比

MS - DETR與一對(duì)多( O2M )監(jiān)督的其他方法在不同基線上的比較。MS - DETR一致地改進(jìn)了各種流行的DETR基線。

f789fa50-b164-11ee-8b88-92fbcf53809c.jpg

與其他方法相結(jié)合的對(duì)比, MS - DETR是現(xiàn)有O2M方法的一種補(bǔ)充方法。

f7968252-b164-11ee-8b88-92fbcf53809c.jpg

6. 總結(jié)

這篇文章在原有一對(duì)一監(jiān)督的基礎(chǔ)上增加了一對(duì)多的監(jiān)督,用于DETR訓(xùn)練。主要特點(diǎn)是顯式地監(jiān)督了對(duì)象查詢。MS-DETR是對(duì)相關(guān)方法的補(bǔ)充,這些方法主要是修改交叉注意力結(jié)構(gòu)或使用額外的查詢或額外的解碼器來學(xué)習(xí)解碼器權(quán)重。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1176

    瀏覽量

    41998
  • 目標(biāo)檢測(cè)
    +關(guān)注

    關(guān)注

    0

    文章

    225

    瀏覽量

    16021

原文標(biāo)題:MS-DETR:全面提升目標(biāo)檢測(cè)的效率和精度!

文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    旋變位置不變的情況下,當(dāng)使能SOTA功能與關(guān)閉SOTA功能時(shí),APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,為什么?

    旋變位置不變的情況下,當(dāng)使能SOTA功能與關(guān)閉SOTA功能時(shí),APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,用示波器采的輸入到MCU端的差分電壓是一樣的,難道是SOTA使能后影響了MCU芯片內(nèi)部的等效阻抗嗎,有專家
    發(fā)表于 05-17 08:13

    NB81是否支持OneNet SOTA功能?應(yīng)該如何激活SOTA

    NB81是否支持OneNet SOTA功能? 可以支持,應(yīng)該如何激活SOTA?
    發(fā)表于 06-04 06:14

    使用OpenVINO?進(jìn)行優(yōu)化后,為什么DETR模型在不同的硬件上測(cè)試時(shí)顯示不同的結(jié)果?

    通過模型優(yōu)化優(yōu)化了 DETR 模型。 在 SPR 計(jì)算機(jī)上使用優(yōu)化模型(DETR 模型)運(yùn)行了benchmark_app,并節(jié)省了延遲和吞吐量。 在 Icelake 機(jī)器上運(yùn)行了相同的benchmark_app和模型,并節(jié)省了延遲和吞吐量。 兩種結(jié)果均顯示出顯著差異
    發(fā)表于 03-05 10:27

    SOTA的定義是什么?常規(guī)的實(shí)現(xiàn)方式有哪些

    1.SOTA的定義SOTA即軟件在線升級(jí)(Software updates Over The Air),是指在不連接燒寫器的情況下,通過CAN、UART或其它通訊方式,實(shí)現(xiàn)應(yīng)用程序的更新。在進(jìn)行
    發(fā)表于 02-14 06:14

    實(shí)體關(guān)系聯(lián)合抽取取得SOTA的三種方法

    2020實(shí)體關(guān)系聯(lián)合抽取一片紅海,各種SOTA方法你方唱罷我方登場(chǎng),在一些數(shù)據(jù)集上也是不斷刷出新高度,為信息抽取領(lǐng)域帶來了新思路,推動(dòng)了信息抽取領(lǐng)域的發(fā)展。本文梳理了實(shí)體關(guān)系聯(lián)合抽取取得SOTA
    的頭像 發(fā)表于 02-10 17:08 ?1.3w次閱讀
    實(shí)體關(guān)系聯(lián)合抽取取得<b class='flag-5'>SOTA</b>的三種<b class='flag-5'>方法</b>

    SOTA機(jī)制詳解

    1.SOTA的定義SOTA即軟件在線升級(jí)(Software updates Over The Air),是指在不連接燒寫器的情況下,通過CAN、UART或其它通訊方式,實(shí)現(xiàn)應(yīng)用程序的更新。在進(jìn)行
    發(fā)表于 12-09 15:06 ?10次下載
    <b class='flag-5'>SOTA</b>機(jī)制詳解

    介紹RT-DETR兩種風(fēng)格的onnx格式和推理方式

    RT-DETR是由百度近期推出的DETR-liked目標(biāo)檢測(cè)器,該檢測(cè)器由HGNetv2、混合編碼器和帶有輔助預(yù)測(cè)頭的Transformer編碼器組成
    的頭像 發(fā)表于 05-17 17:46 ?4472次閱讀
    介紹RT-<b class='flag-5'>DETR</b>兩種風(fēng)格的onnx格式和推理方式

    Focus-DETR:30%Token就能實(shí)現(xiàn)SOTA性能,效率倍增

    目前 DETR 類模型已經(jīng)成為了目標(biāo)檢測(cè)的一個(gè)主流范式。但 DETR 算法模型復(fù)雜度高,推理速度低,嚴(yán)重影響了高準(zhǔn)確度目標(biāo)檢測(cè)模型在端側(cè)設(shè)備的部署,加大了學(xué)術(shù)研究和產(chǎn)業(yè)應(yīng)用之間的鴻溝。
    的頭像 發(fā)表于 08-02 15:12 ?1337次閱讀
    Focus-<b class='flag-5'>DETR</b>:30%Token就能實(shí)現(xiàn)<b class='flag-5'>SOTA</b>性能,效率倍增

    一種新型的DETR輕量化模型Focus-DETR

    作者對(duì)多個(gè) DETR 類檢測(cè)器的 GFLOPs 和時(shí)延進(jìn)行了對(duì)比分析,如圖 1 所示。從圖中發(fā)現(xiàn),在 Deformable-DETR 和 DINO 中,encoder 的計(jì)算量分別是 decoder
    的頭像 發(fā)表于 08-02 15:34 ?1121次閱讀
    一種新型的<b class='flag-5'>DETR</b>輕量化模型Focus-<b class='flag-5'>DETR</b>

    人工智能SOTA什么意思

    中,SOTA通常用于描述當(dāng)前最先進(jìn)的算法或者模型在一個(gè)特定數(shù)據(jù)集上的表現(xiàn)。 SOTA是一個(gè)極其重要的標(biāo)準(zhǔn),因?yàn)樗梢院饬垦芯咳藛T的技術(shù)水平,并且可以用于比較不同算法的性能優(yōu)劣。SOTA是數(shù)據(jù)科學(xué)家們努力工作的目標(biāo)之一,通過不斷地
    的頭像 發(fā)表于 08-22 16:45 ?2.2w次閱讀

    DETR架構(gòu)的內(nèi)部工作方式分析

    這是一個(gè)Facebook的目標(biāo)檢測(cè)Transformer (DETR)的完整指南。 ? 介紹 DEtection TRansformer (DETR)是Facebook研究團(tuán)隊(duì)巧妙地利
    的頭像 發(fā)表于 08-30 10:53 ?1345次閱讀
    <b class='flag-5'>DETR</b>架構(gòu)的內(nèi)部工作方式分析

    基于OpenVINO Python API部署RT-DETR模型

    RT-DETR 是在 DETR 模型基礎(chǔ)上進(jìn)行改進(jìn)的,一種基于 DETR 架構(gòu)的實(shí)時(shí)端到端檢測(cè)器,它通過使用一系列新的技術(shù)和算法,實(shí)現(xiàn)了更高效的訓(xùn)練和推理,我們將在 Python、C++、C# 三個(gè)
    的頭像 發(fā)表于 10-20 11:15 ?1622次閱讀
    基于OpenVINO Python API部署RT-<b class='flag-5'>DETR</b>模型

    第一個(gè)基于DETR的高質(zhì)量通用目標(biāo)檢測(cè)方法

    現(xiàn)有的DETR系列模型在非COCO數(shù)據(jù)集上表現(xiàn)較差,且預(yù)測(cè)框不夠準(zhǔn)確。其主要原因是:DETR在檢測(cè)頭中用全局交叉注意力替換了原來的卷積,刪除了以中心為中心的先驗(yàn)知識(shí);另一方面,DETR僅依賴分類分?jǐn)?shù)評(píng)分查詢提議,忽略了定位質(zhì)量。
    的頭像 發(fā)表于 11-01 16:12 ?1113次閱讀
    第一個(gè)基于<b class='flag-5'>DETR</b>的高質(zhì)量通用目標(biāo)檢測(cè)<b class='flag-5'>方法</b>

    基于OpenVINO C++ API部署RT-DETR模型

    RT-DETR 是在 DETR 模型基礎(chǔ)上進(jìn)行改進(jìn)的,一種基于 DETR 架構(gòu)的實(shí)時(shí)端到端檢測(cè)器,它通過使用一系列新的技術(shù)和算法,實(shí)現(xiàn)了更高效的訓(xùn)練和推理,在前文我們發(fā)表了《基于 OpenVINO
    的頭像 發(fā)表于 11-03 14:30 ?1600次閱讀
    基于OpenVINO C++ API部署RT-<b class='flag-5'>DETR</b>模型

    基于OpenVINO C# API部署RT-DETR模型

    在 C# 環(huán)境下使用該模型應(yīng)用到工業(yè)檢測(cè)中,因此在本文中,我們將向大家展示使用 OpenVINO Csharp API 部署 RT-DETR 模型,并對(duì)比不同編程平臺(tái)下模型部署的速度。
    的頭像 發(fā)表于 11-10 16:59 ?1208次閱讀
    基于OpenVINO C# API部署RT-<b class='flag-5'>DETR</b>模型