chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

電子工程師 ? 來源:fqj ? 2019-05-09 17:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來自北京大學(xué)、清華大學(xué)和微軟亞洲研究院的研究人員提出一種新的、更精細(xì)的對(duì)象表示方法RepPoints,拋棄了流行的邊界框表示,結(jié)果與最先進(jìn)的基于 anchor 的檢測(cè)方法同樣有效。

目標(biāo)檢測(cè)是計(jì)算機(jī)視覺中最基本的任務(wù)之一,也是許多視覺應(yīng)用的關(guān)鍵組成部分,包括實(shí)例分割、人體姿態(tài)分析、視覺推理等。

目標(biāo)檢測(cè)的目的是在圖像中定位目標(biāo),并提供目標(biāo)的類別標(biāo)簽。

近年來,隨著深度神經(jīng)網(wǎng)絡(luò)的快速發(fā)展,目標(biāo)檢測(cè)問題也取得了長(zhǎng)足的進(jìn)展。

當(dāng)前先進(jìn)的目標(biāo)檢測(cè)器很大程度上依賴于矩形邊界框來表示不同識(shí)別階段的對(duì)象,如 anchors、proposals 以及最終的預(yù)測(cè)。

邊界框使用方便,但它只提供目標(biāo)的粗略定位,導(dǎo)致對(duì)目標(biāo)特征的提取也相當(dāng)粗略。

近日,來自北京大學(xué)、清華大學(xué)和微軟亞洲研究院的楊澤、王立威、Shaohui Liu 等人在他們的最新論文中,提出了一種新的、更精細(xì)的對(duì)象表示方法 ——RepPoints (representative points),這是一組對(duì)定位和識(shí)別都很有用的樣本點(diǎn) (sample points)。

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

給定訓(xùn)練的 ground truth 定位和識(shí)別目標(biāo),RepPoints 學(xué)會(huì)自動(dòng)以限制目標(biāo)的空間范圍的方式來排列自己,并表示在語義上重要的局部區(qū)域。此外,RepPoints 不需要使用 anchor 來對(duì)邊界框的空間進(jìn)行采樣。

作者展示了一個(gè)基于 RepPoints 的、anchor-free 的目標(biāo)檢測(cè)器,不需要多尺度訓(xùn)練和測(cè)試就可以實(shí)現(xiàn),而且與最先進(jìn)的基于 anchor 的檢測(cè)方法同樣有效,在 COCO test-dev 檢測(cè)基準(zhǔn)上達(dá)到了42.8 AP 和 65.0 AP??。

拋棄邊界框,更細(xì)粒度的目標(biāo)表示RepPoints

在目標(biāo)檢測(cè)過程中,邊界框是處理的基本元素。邊界框描述了目標(biāo)檢測(cè)器各階段的目標(biāo)位置。

雖然邊界框便于計(jì)算,但它們僅提供目標(biāo)的粗略定位,并不完全擬合對(duì)象的形狀和姿態(tài)。因此,從邊界框的規(guī)則單元格中提取的特征可能會(huì)受到包含少量語義信息的背景內(nèi)容或無信息的前景區(qū)域的嚴(yán)重影響。這可能導(dǎo)致特征質(zhì)量降低,從而降低了目標(biāo)檢測(cè)的分類性能。

本文提出一種新的表示方法,稱為 RepPoints,它提供了更細(xì)粒度的定位和更方便的分類。

如圖 1 所示,RepPoints 是一組點(diǎn),學(xué)習(xí)自適應(yīng)地將自己置于目標(biāo)之上,其方式限定了目標(biāo)的空間范圍,并表示語義上重要的局部區(qū)域。

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

圖 1:RepPoints 是一種新的目標(biāo)檢測(cè)表示方法

RepPoints 的訓(xùn)練由目標(biāo)定位和識(shí)別目標(biāo)共同驅(qū)動(dòng),因此,RepPoints 與 ground-truth 的邊界框緊密相關(guān),并引導(dǎo)檢測(cè)器正確地分類目標(biāo)。

這種自適應(yīng)、可微的表示可以在現(xiàn)代目標(biāo)檢測(cè)器的不同階段連貫地使用,并且不需要使用 anchors 來對(duì)邊界框空間進(jìn)行采樣。

RepPoints 不同于用于目標(biāo)檢測(cè)現(xiàn)有的非矩形表示,它們都是以自底向上的方式構(gòu)建的。這些自底向上的表示方法會(huì)識(shí)別單個(gè)的點(diǎn) (例如,邊界框角或?qū)ο蟮哪┒?。此外,它們的表示要么像邊界框那樣仍然是軸對(duì)齊的,要么需要 ground truth 對(duì)象掩碼作為額外的監(jiān)督。

相反,RepPoints 是通過自頂向下的方式從輸入圖像 / 對(duì)象特征中學(xué)習(xí)的,允許端到端訓(xùn)練和生成細(xì)粒度的定位,而無需額外的監(jiān)督。

為了證明 RepPoints 表示的強(qiáng)大能力,我們提出了一種基于可變形 ConvNets 框架的實(shí)現(xiàn),該框架在保證特征提取方便的同時(shí),提供了適合指導(dǎo)自適應(yīng)采樣的識(shí)別反饋。

我們發(fā)現(xiàn),這個(gè)無 anchor 的檢測(cè)系統(tǒng)在對(duì)目標(biāo)進(jìn)行精確定位的同時(shí),具有較強(qiáng)的分類能力。在沒有多尺度訓(xùn)練和測(cè)試的情況下,我們的檢測(cè)器在 COCO 基準(zhǔn)上實(shí)現(xiàn)了 42.8 AP 和 65.0 AP?? 的精度,不僅超過了所有現(xiàn)有的 anchor-free 檢測(cè)器,而且性能與最先進(jìn)的 anchor-based 的基線模型相當(dāng)。

RepPoints vs 邊界框

本節(jié)將描述 RepPoints,以及它與邊界框的區(qū)別。

邊界框表示

邊界框是一個(gè) 4-d 表示,編碼目標(biāo)的空間位置,即 B = (x, y, w, h), x, y 表示中心點(diǎn),w, h 表示寬度和高度。

由于其使用簡(jiǎn)單方便,現(xiàn)代目標(biāo)檢測(cè)器嚴(yán)重依賴于邊界框來表示檢測(cè) pipeline 中各個(gè)階段的對(duì)象。

性能最優(yōu)的目標(biāo)檢測(cè)器通常遵循一個(gè) multi-stage 的識(shí)別范式,其中目標(biāo)定位是逐步細(xì)化的。其中,目標(biāo)表示的角色如下:

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

RepPoints

如前所述,4-d 邊界框是目標(biāo)位置的一個(gè)粗略表示。邊界框表示只考慮目標(biāo)的矩形空間范圍,不考慮形狀、姿態(tài)和語義上重要的局部區(qū)域的位置,這些可用于更好的定位和更好的目標(biāo)特征提取。

為了克服上述限制,RepPoints 轉(zhuǎn)而對(duì)一組自適應(yīng)樣本點(diǎn)進(jìn)行建模:

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

其中 n 為表示中使用的樣本點(diǎn)的總數(shù)。在這項(xiàng)工作中,n 默認(rèn)設(shè)置為 9。

Learning RepPoints

RepPoints 的學(xué)習(xí)是由目標(biāo)定位損失和目標(biāo)識(shí)別損失共同驅(qū)動(dòng)的。為了計(jì)算目標(biāo)定位損失,我們首先用一個(gè)轉(zhuǎn)換函數(shù) T 將 RepPoints 轉(zhuǎn)換為偽框 (pseudo box)。然后,計(jì)算轉(zhuǎn)換后的偽框與 ground truth 邊界框之間的差異。

圖 3 顯示,當(dāng)訓(xùn)練由目標(biāo)定位損失和目標(biāo)識(shí)別損失組合驅(qū)動(dòng)時(shí),目標(biāo)的極值點(diǎn)和語義關(guān)鍵點(diǎn)可以自動(dòng)學(xué)習(xí)。

圖 3: 學(xué)習(xí)的 RepPoints 的可視化和來自 COCO minival set 的幾個(gè)例子的檢測(cè)結(jié)果。通常,學(xué)習(xí)的 RepPoints 位于目標(biāo)的端點(diǎn)或語義關(guān)鍵點(diǎn)上。

RPDet: 無需 Anchor 的目標(biāo)檢測(cè)器

我們?cè)O(shè)計(jì)了一種不使用 anchor 的對(duì)象檢測(cè)器,它利用 RepPoints 代替邊界框作為基本表示。

目標(biāo)表示的演化過程如下:

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

RepPoints Detector (RPDet) 由兩個(gè)基于可變形卷積的識(shí)別階段構(gòu)成,如圖 2 所示。

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

圖 2:RPDet (RepPoints detector) 的概覽,以特征金字塔網(wǎng)絡(luò) (FPN) 為主干

可變形卷積與 RepPoints 很好地結(jié)合在一起,因?yàn)樗木矸e是在一組不規(guī)則分布的采樣點(diǎn)上計(jì)算的,反之,它的識(shí)別反饋可以指導(dǎo)訓(xùn)練這些點(diǎn)的定位。

實(shí)驗(yàn)和結(jié)果

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

表 1:目標(biāo)檢測(cè)中 RepPoints 與邊界框表示的比較。除了處理給定的目標(biāo)表示之外,網(wǎng)絡(luò)結(jié)構(gòu)是相同的。

從表 1 可以看出,將目標(biāo)表示從邊界框變?yōu)?RepPoints,可以帶來一定程度的性能提升,如使用 ResNet-50 作為主干網(wǎng)絡(luò)時(shí)提升了 2.1 mAP,使用 ResNet-101 時(shí)提升了 2.0 mAP。這表明相對(duì)于邊界框,RepPoints 表示在對(duì)象檢測(cè)方面具有優(yōu)勢(shì)。

RepPoints 比邊界框更好用的目標(biāo)檢測(cè)方法

表 7:將所提出的 RPDet 與 COCO test-dev 上最先進(jìn)的檢測(cè)器進(jìn)行比較。

如表 7 所示,在沒有 multi-scale 訓(xùn)練和測(cè)試的情況下,所提出的框架使用 ResNet-101-DCN 主干網(wǎng)絡(luò)實(shí)現(xiàn)了 42.8 AP,與基于 anchor 的 Cascade R-CNN 方法相當(dāng),性能優(yōu)于現(xiàn)有的所有不采用 anchor 的檢測(cè)器。此外,RPDet 獲得了 65.0 的 AP??,大大超過了所有基線。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:北大、清華、微軟聯(lián)合提出RepPoints,比邊界框更好用的目標(biāo)檢測(cè)方法

文章出處:【微信號(hào):aicapital,微信公眾號(hào):全球人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    單板挑戰(zhàn)4路YOLOv8!米爾瑞芯微RK3576開發(fā)板性能實(shí)測(cè)

    也有很多尾綴,用一個(gè)表簡(jiǎn)單列一下它們分別代表什么意思:表1-1.按任務(wù)類型區(qū)分后綴全稱任務(wù)輸出典型應(yīng)用 -detDetection目標(biāo)檢測(cè)邊界 (BBox)+類別和置信度找出圖像中所
    發(fā)表于 09-12 17:52

    3D 線激光輪廓測(cè)量?jī)x在手機(jī)中檢測(cè)的應(yīng)用:細(xì)節(jié)深化與技術(shù)解析

    手機(jī)中作為連接屏幕、電池與后殼的核心結(jié)構(gòu)件,其幾何精度與表面質(zhì)量直接決定整機(jī)裝配良率與使用體驗(yàn)。光子精密GL-8000系列3D 線激光輪廓測(cè)量?jī)x憑借非接觸式、高精度的檢測(cè)優(yōu)勢(shì),不僅能實(shí)現(xiàn)平面度、段
    的頭像 發(fā)表于 09-11 16:15 ?1251次閱讀
    3D 線激光輪廓測(cè)量?jī)x在手機(jī)中<b class='flag-5'>框</b><b class='flag-5'>檢測(cè)</b>的應(yīng)用:細(xì)節(jié)深化與技術(shù)解析

    YOLOv8水果檢測(cè)示例代碼換成640輸入圖像出現(xiàn)目標(biāo)繪制錯(cuò)誤的原因 ?

    \",中的best.kmodel替換為640輸入圖像,model_input_size=[640,640],就會(huì)出現(xiàn)目標(biāo)檢測(cè)目標(biāo)位置混亂,目標(biāo)
    發(fā)表于 06-18 06:37

    基于LockAI視覺識(shí)別模塊:C++目標(biāo)檢測(cè)

    檢測(cè)是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)關(guān)鍵任務(wù),它不僅需要識(shí)別圖像中存在哪些對(duì)象,還需要定位這些對(duì)象的位置。具體來說,目標(biāo)檢測(cè)算法會(huì)輸出每個(gè)檢測(cè)到的對(duì)象的邊界
    發(fā)表于 06-06 14:43

    基于LockAI視覺識(shí)別模塊:C++目標(biāo)檢測(cè)

    本文檔基于瑞芯微RV1106的LockAI凌智視覺識(shí)別模塊,通過C++語言做的目標(biāo)檢測(cè)實(shí)驗(yàn)。本文檔展示了如何使用lockzhiner_vision_module::PaddleDet類進(jìn)行目標(biāo)
    的頭像 發(fā)表于 06-06 13:56 ?439次閱讀
    基于LockAI視覺識(shí)別模塊:C++<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>

    手機(jī)中氣密性檢測(cè)儀的使用方法

    在手機(jī)制造過程中,確保手機(jī)中的氣密性至關(guān)重要,這直接關(guān)系到手機(jī)的防水、防塵性能以及整體質(zhì)量。以下是手機(jī)中氣密性檢測(cè)儀的具體使用方法。檢測(cè)
    的頭像 發(fā)表于 05-27 13:50 ?605次閱讀
    手機(jī)中<b class='flag-5'>框</b>氣密性<b class='flag-5'>檢測(cè)</b>儀的使用<b class='flag-5'>方法</b>

    阿童木雙張檢測(cè)器好不好用?用數(shù)據(jù)和場(chǎng)景說話

    在工業(yè)生產(chǎn)中,雙張疊料檢測(cè)是保障產(chǎn)線穩(wěn)定與產(chǎn)品質(zhì)量的關(guān)鍵環(huán)節(jié)。阿童木雙張檢測(cè)器憑借技術(shù)創(chuàng)新和行業(yè)落地經(jīng)驗(yàn),成為眾多企業(yè)的選擇。但它究竟“好不好用”?本文將從性能表現(xiàn)、場(chǎng)景適配、用戶反饋三大維度展開
    的頭像 發(fā)表于 05-22 11:39 ?461次閱讀
    阿童木雙張<b class='flag-5'>檢測(cè)</b>器好不<b class='flag-5'>好用</b>?用數(shù)據(jù)和場(chǎng)景說話

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類、obb

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類、obb、pose深度學(xué)習(xí),支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發(fā)表于 03-31 16:28

    軒轅智駕紅外目標(biāo)檢測(cè)算法在汽車領(lǐng)域的應(yīng)用

    在 AI 技術(shù)蓬勃發(fā)展的當(dāng)下,目標(biāo)檢測(cè)算法取得了重大突破,其中紅外目標(biāo)檢測(cè)算法更是在汽車行業(yè)掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗(yàn)與產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 03-27 15:55 ?617次閱讀

    在自定義檢測(cè)應(yīng)用程序中創(chuàng)建綁定時(shí)協(xié)調(diào)錯(cuò)誤怎么解決?

    * image.shape[1]), image.shape[1] - 10)) ymax = int(min((ymax * image.shape[0]), image.shape[0] - 10)) 獲得正確的邊界坐標(biāo)。
    發(fā)表于 03-06 07:41

    請(qǐng)問如何從YOLOv8輸出張量結(jié)果中獲取邊界?

    ;) open(\"zebra.jpeg\", \"rb\") as f: img = f.read() 獲得以下輸出結(jié)果: (1, 84, 8400) 無法將輸出結(jié)果轉(zhuǎn)換為邊界
    發(fā)表于 03-06 06:58

    物聯(lián)網(wǎng)單燈控制器:路燈單燈控制更智能,更好用

    物聯(lián)網(wǎng)單燈控制器:路燈單燈控制更智能,更好用
    的頭像 發(fā)表于 01-15 16:17 ?845次閱讀
    物聯(lián)網(wǎng)單燈控制器:路燈單燈控制更智能,<b class='flag-5'>更好用</b>

    探索對(duì)抗訓(xùn)練的概率分布偏差:DPA雙概率對(duì)齊的通用域自適的目標(biāo)檢測(cè)方法

    檢測(cè)目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺領(lǐng)域的核心任務(wù),在閉集場(chǎng)景中已經(jīng)取得了顯著的進(jìn)展。然而,現(xiàn)有的方法通常假設(shè)類別集合是固定的,并依賴于大量的標(biāo)注數(shù)據(jù),這導(dǎo)致它們?cè)谔幚砜缬驍?shù)據(jù)時(shí),特別是在源
    的頭像 發(fā)表于 01-15 13:45 ?1002次閱讀
    探索對(duì)抗訓(xùn)練的概率分布偏差:DPA雙概率對(duì)齊的通用域自適的<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b><b class='flag-5'>方法</b>

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    挑戰(zhàn)的方法。 2 目標(biāo)檢測(cè)模型介紹 在目標(biāo)檢測(cè)的任務(wù)中,有著許許多多的模型,如 Picodet、Faster R-CNN、YOLO、SSD等
    發(fā)表于 12-19 14:33

    在樹莓派上部署YOLOv5進(jìn)行動(dòng)物目標(biāo)檢測(cè)的完整流程

    目標(biāo)檢測(cè)在計(jì)算機(jī)視覺領(lǐng)域中具有重要意義。YOLOv5(You Only Look One-level)是目標(biāo)檢測(cè)算法中的一種代表性方法,以其
    的頭像 發(fā)表于 11-11 10:38 ?4419次閱讀
    在樹莓派上部署YOLOv5進(jìn)行動(dòng)物<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>的完整流程