chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里達(dá)摩院提出MogFace:人臉檢測新工作

CVer ? 來源:CVer ? 作者:CVer ? 2022-11-29 15:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

一、開源

77fd25c0-6f37-11ed-8abf-dac502259ad0.png

MogFace: Towards a Deeper Appreciation on Face Detection

1. 論文鏈接:

https://openaccess.thecvf.com/content/CVPR2022/papers/Liu_MogFace_Towards_a_Deeper_Appreciation_on_Face_Detection_CVPR_2022_paper.pdf

2. 代碼模型:

https://modelscope.cn/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

3. 可玩應(yīng)用:

https://modelscope.cn/studios/baigui/face_album/summary

二、背景

人臉檢測算法是在一幅圖片或者視頻序列中檢測出來人臉的位置,給出人臉的具體坐標(biāo),一般是矩形坐標(biāo)。它是人臉關(guān)鍵點(diǎn)、屬性、編輯、風(fēng)格化、識別等模塊的基礎(chǔ)。本文通過實(shí)驗(yàn)觀察發(fā)現(xiàn),對應(yīng)設(shè)計(jì)出如下三個模塊構(gòu)建出一個高性能的人臉檢測器MogFace:1.)動態(tài)標(biāo)簽分配策略(dynamic label assignment),2.)誤檢上下文相關(guān)性分析(FP context analysis),3.)金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)。該方法的模型在WIDER FACE榜單上取得了截止目前將近兩年的六項(xiàng)第一。

三、觀察

1.1 動態(tài)標(biāo)簽分配策略(dynamic label assignment)

為每個anchor點(diǎn)定義cls和reg目標(biāo)是訓(xùn)練檢測器的必要過程,在人臉檢測中這個過程稱之為標(biāo)簽分配(Label Assignment)。最近,標(biāo)簽分配吸引了諸多研究人員的注意,在人臉檢測及通用物體檢測領(lǐng)域提出了一系列方法,例如:OTA、PAA,ATSS以及HAMBox。如示例圖(a),標(biāo)簽分配過程依賴4個元素。分別是:1.)offline information: a.)IoU (anchor與ground-truth框的IoU) , b.)CPD (anchor與ground-truth中心點(diǎn)的距離) ,2.)online information: a.)PCS (cls分支對anchor的前景分類概率值) ,b.)PLC (reg分支對anchor的預(yù)測坐標(biāo)值)。

781a5fd2-6f37-11ed-8abf-dac502259ad0.png

但是,目前的標(biāo)簽分配方法存在三個問題。1.)若只用offline information做靜態(tài)標(biāo)簽分配,那么會有很多具備更強(qiáng)回歸能力的negative anchor無法被有效利用起來,會導(dǎo)致標(biāo)簽分配策略欠飽和。2.)若過度信任online information動態(tài)調(diào)整正負(fù)anchor時(如OTA和Hambox),由于online information屬于預(yù)測信息可信度不高,會導(dǎo)致標(biāo)簽分配策略錯誤多, 極端情況下會陷入trivial 的分配結(jié)果。3.) 若引入大量超參 (K in ATSS, alpha in OTA)做標(biāo)簽分配,則當(dāng)數(shù)據(jù)集分布發(fā)生變化時,需要大量的調(diào)參時間。

1.2 誤檢上下文相關(guān)性分析(FP context analysis)

在實(shí)際應(yīng)用中,人臉檢測器并不會十分care AP的指標(biāo),而對誤檢(false positive [FP])的數(shù)量十分敏感。針對這個問題,目前的做法是收集大量帶有FP的圖片去fine-tune或者from scratch訓(xùn)練檢測器,來幫助檢測器了解更多范式的FP,但是我們發(fā)現(xiàn)有些頻繁出現(xiàn)在訓(xùn)練集中的的FP在這種策略下無法有效解決。這篇文章,我們發(fā)現(xiàn)了一個有趣的現(xiàn)象:對于同一個FP,當(dāng)它的context發(fā)生變化時,對于同一個檢測器來說它可能就不是FP了。如下圖(c),最左面的圖片里日歷是FP,剩余兩張日歷都不是FP。

783f0d50-6f37-11ed-8abf-dac502259ad0.png

1.3 金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)

scale-level 數(shù)據(jù)增強(qiáng)策略常常作通用物體檢測以及人臉檢測中解決scale variance主要手段。如圖(b)所示,相對于COCO,人臉檢測數(shù)據(jù)集Wider Face 中人臉的尺度分布更為嚴(yán)峻。為此,我們分提出了一個新的問題,如何合理的分配ground-truth 在不同pyramidlayer上的分布?即檢測器的性能與每個pyramidlayer匹配ground-truth的個數(shù)之間的關(guān)系是什么?是否越多越好?通過嚴(yán)格的對比實(shí)驗(yàn)我們發(fā)現(xiàn):“對于所有的pyramid layer來說,并不是這個pyramid layer匹配到越多的ground-truth就越好”。這說明要挖掘每一個pyramidlayer的最好性能,需要控制在這個pyramidlayer上的ground-truth分配的比例。

785e88d8-6f37-11ed-8abf-dac502259ad0.png

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

針對上述“動態(tài)標(biāo)簽分配策略(dynamic label assignment)”觀察分析,本文提出了在里面一種自適應(yīng)的在線增量錨挖掘策略(Ali-AMS),它基于standard anchor matching 策略,并進(jìn)一步adaptive 幫助outlier face匹配anchor。如下:

7880139a-6f37-11ed-8abf-dac502259ad0.png

2.2 Hierachical Context-Aware Module (HCAM)

基于上述“誤檢上下文相關(guān)性分析(FP context analysis)”觀察分析,發(fā)現(xiàn)“對于同一個FP,當(dāng)它的context發(fā)生變化時,對于同一個檢測器來說他可能就不是FP了”,我們進(jìn)一步提出了一個two-step的模塊來顯示的encode context 信息來幫助區(qū)分FP和TP,顯著減少了FP的數(shù)量。

7895de46-6f37-11ed-8abf-dac502259ad0.png

2.3 Selective Scale Enhancement Strategy (SSE)

基于上述的“金字塔層級監(jiān)督信號分配(pyramid layer level GT assignment)”觀察分析,發(fā)現(xiàn)“對于所有的pyramid layer來說,并不是這個pyramid layer匹配到越多的ground-truth就越好”,我們提出通過控制pyramid layer 匹配的ground-truth的數(shù)量來最大化pyramid layer 的性能。

78b71a5c-6f37-11ed-8abf-dac502259ad0.png

五、實(shí)驗(yàn)

3.1 Ablation Study

78d401a8-6f37-11ed-8abf-dac502259ad0.png

3.2 Comparison with sota

79003fac-6f37-11ed-8abf-dac502259ad0.png

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 模塊
    +關(guān)注

    關(guān)注

    7

    文章

    2823

    瀏覽量

    52899
  • 檢測器
    +關(guān)注

    關(guān)注

    1

    文章

    926

    瀏覽量

    49697
  • 檢測算法
    +關(guān)注

    關(guān)注

    0

    文章

    122

    瀏覽量

    25670

原文標(biāo)題:WIDER FACE六項(xiàng)第一!阿里達(dá)摩院提出MogFace:人臉檢測新工作 | CVPR 2022

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    廣電計(jì)量兩大創(chuàng)新工作室喜獲佳績

    近日,廣州市總工會公布了2025年廣州市勞模和工匠人才創(chuàng)新工作室(含女職工創(chuàng)新工作室)支持建設(shè)對象及優(yōu)秀等次名單。廣電計(jì)量兩大創(chuàng)新工作室喜獲佳績。其中,“陸裕東工匠人才創(chuàng)新工作室”被確
    的頭像 發(fā)表于 12-12 11:14 ?441次閱讀

    新思科技HAPS-200助力阿里巴巴達(dá)摩加速玄鐵C930開發(fā)驗(yàn)證

    在AI驅(qū)動的時代,驗(yàn)證不僅僅是功能正確,更要確保性能、功耗和軟件兼容性。HAPS-200的引入,助力達(dá)摩玄鐵團(tuán)隊(duì)能夠在設(shè)計(jì)早期完成系統(tǒng)級驗(yàn)證,顯著縮短上市時間,降低風(fēng)險(xiǎn),并推動RISC-V生態(tài)加速成熟,開啟RISC-V高性能新時代。
    的頭像 發(fā)表于 11-18 11:12 ?631次閱讀

    RISC-V創(chuàng)新中心與達(dá)摩合作簽約

    10月30日,RISC-V創(chuàng)新中心與達(dá)摩合作簽約暨創(chuàng)新發(fā)展交流會在蘇州市集成電路創(chuàng)新中心隆重舉行,來自全國各地的重點(diǎn)企業(yè)、科研機(jī)構(gòu)、行業(yè)協(xié)會、投資機(jī)構(gòu)等代表出席活動,共話RISC-V產(chǎn)業(yè)創(chuàng)新發(fā)展新圖景。
    的頭像 發(fā)表于 11-03 15:43 ?534次閱讀

    基于級聯(lián)分類器的人臉檢測基本原理

    本次分享的內(nèi)容是基于級聯(lián)分類器的人臉檢測基本原理 1) 人臉檢測概述 關(guān)于人臉檢測算法,目前
    發(fā)表于 10-30 06:14

    【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】人臉檢測

    【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】人臉檢測 本文介紹了 Milk-V Duo S 開發(fā)板結(jié)合 OV5647 攝像頭模塊,實(shí)現(xiàn)人臉檢測的項(xiàng)目設(shè)計(jì)。 準(zhǔn)備
    發(fā)表于 07-27 16:53

    阿里巴巴達(dá)摩劉志偉:QEMU RISC-V 的進(jìn)展、特性與未來規(guī)劃

    2025 年 7 月 18 日,在第五屆(2025)RISC-V 中國峰會的軟件與生態(tài)系統(tǒng)分論壇上,阿里巴巴達(dá)摩 RISC-V 及生態(tài)部技術(shù)專家劉志偉帶來了關(guān)于 QEMU RISC-V 的報(bào)告
    發(fā)表于 07-18 11:20 ?5470次閱讀
    <b class='flag-5'>阿里</b>巴巴<b class='flag-5'>達(dá)摩</b><b class='flag-5'>院</b>劉志偉:QEMU RISC-V 的進(jìn)展、特性與未來規(guī)劃

    【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】人臉檢測測試(視頻)

    https://bbs.elecfans.com/jishu_2494616_1_1.html我們編譯了人臉檢測的應(yīng)用,現(xiàn)在攝像頭到了, 我們就進(jìn)行實(shí)際測試。 視頻見https
    發(fā)表于 07-11 22:33

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實(shí)現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,
    的頭像 發(fā)表于 04-21 17:59 ?882次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實(shí)現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,
    的頭像 發(fā)表于 04-21 14:00 ?13次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案

    在RV1126開發(fā)板上實(shí)現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。 方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像,
    的頭像 發(fā)表于 04-21 10:21 ?99次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案

    在RV1126上實(shí)現(xiàn)人臉檢測:在圖像中找出人臉,以及每張人臉的landmarks位置。方案設(shè)計(jì)邏輯流程圖,方案代碼分為分為兩個業(yè)務(wù)流程,主體代碼負(fù)責(zé)抓取、合成圖像, 算法代碼負(fù)責(zé)
    的頭像 發(fā)表于 04-18 16:47 ?277次閱讀
    基于RV1126開發(fā)板實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    RV1126 實(shí)現(xiàn)人臉檢測方案

    基于RV1126開發(fā)板實(shí)現(xiàn)人臉檢測方案,充分體現(xiàn)了電子方面的實(shí)踐經(jīng)驗(yàn)和目標(biāo)檢測技術(shù)。
    的頭像 發(fā)表于 04-14 09:25 ?707次閱讀
    RV1126 實(shí)現(xiàn)<b class='flag-5'>人臉</b><b class='flag-5'>檢測</b>方案

    普華基礎(chǔ)軟件蒞臨阿里巴巴達(dá)摩調(diào)研交流

    近日, 普華基礎(chǔ)軟件股份有限公司(以下簡稱普華基礎(chǔ)軟件)董事、總經(jīng)理劉宏倩一行前往阿里巴巴達(dá)摩(杭州)科技有限公司(以下簡稱達(dá)摩)調(diào)研交
    的頭像 發(fā)表于 04-08 10:10 ?971次閱讀

    使用OpenVINO?模型的OpenCV進(jìn)行人臉檢測,檢測到多張人臉時,伺服電機(jī)和步入器電機(jī)都發(fā)生移動是為什么?

    使用OpenVINO?模型的 OpenCV* 進(jìn)行人臉檢測。 使用 cv2.矩形 函數(shù),能夠獲取檢測到的面部的坐標(biāo)。 檢測到多張人臉時,多
    發(fā)表于 03-07 06:35

    在Raspberry Pi 4上為OpenVINO? 2021.4.2安裝DL工作臺,加載人臉檢測-0200模型時遇到錯誤怎么解決?

    在 Raspberry Pi* 4 上為 OpenVINO? 2021.4.2 安裝的 DL 工作臺 加載人臉檢測-0200 模型時遇到錯誤: Unknown model format
    發(fā)表于 03-05 07:57