chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

目標(biāo)檢測(cè)的后處理:NMS vs WBF

Dbwd_Imgtec ? 來(lái)源:未知 ? 2023-07-26 10:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Ching (Chingis)編譯ronghuaiyang來(lái)源:AI公園

導(dǎo)讀

對(duì)目標(biāo)檢測(cè)后處理中的NMS和WBF的解釋和對(duì)比。目前,計(jì)算機(jī)視覺(jué)在許多地方都有重要的應(yīng)用,例如自動(dòng)駕駛汽車(chē)、監(jiān)控系統(tǒng)和圖像識(shí)別。計(jì)算機(jī)視覺(jué)的主要挑戰(zhàn)之一是目標(biāo)檢測(cè),它涉及識(shí)別和定位圖像和視頻中的目標(biāo)。為了提高目標(biāo)檢測(cè)系統(tǒng)的性能,研究人員和從業(yè)者開(kāi)發(fā)了各種技術(shù),例如模型集成和測(cè)試時(shí)增強(qiáng)(TTA)。

模型集成是組合多個(gè)模型的預(yù)測(cè)以提高系統(tǒng)整體性能的過(guò)程。這可以通過(guò)對(duì)多個(gè)模型的預(yù)測(cè)求平均值,或使用更復(fù)雜的方法(如加權(quán)框融合 (WBF))來(lái)組合預(yù)測(cè)來(lái)完成。集成方法可以通過(guò)減少過(guò)擬合的影響并提高系統(tǒng)的魯棒性來(lái)顯著提高目標(biāo)檢測(cè)系統(tǒng)的性能。

測(cè)試時(shí)增強(qiáng) (TTA) 是另一種用于提高目標(biāo)檢測(cè)系統(tǒng)性能的技術(shù)。它在測(cè)試期間將各種數(shù)據(jù)增強(qiáng)技術(shù)(例如旋轉(zhuǎn)、縮放和翻轉(zhuǎn))應(yīng)用于輸入圖像。這可以通過(guò)使系統(tǒng)對(duì)輸入數(shù)據(jù)的微小變化更加不變來(lái)幫助提高系統(tǒng)的魯棒性。TTA還可以通過(guò)提供額外的數(shù)據(jù)供檢測(cè)器學(xué)習(xí)來(lái)幫助提高系統(tǒng)的性能。

在本文中,我們將探索和比較非最大抑制 (NMS) 和加權(quán)框融合 (WBF) 以提高目標(biāo)檢測(cè)系統(tǒng)的性能。
非最大值抑制

非極大值抑制 (NMS) 是一種后處理技術(shù),用于去除目標(biāo)檢測(cè)器生成的重疊框。它常用于計(jì)算機(jī)視覺(jué)中的目標(biāo)檢測(cè)任務(wù),例如人臉檢測(cè)、目標(biāo)跟蹤以及圖像和視頻中的目標(biāo)檢測(cè)。

NMS 背后的基本思想是選擇置信度得分最高的框,然后刪除與其顯著重疊的其他框。重復(fù)此過(guò)程,直到考慮了所有框。這有助于減少目標(biāo)檢測(cè)中的誤報(bào)數(shù)量,因?yàn)槟繕?biāo)檢測(cè)器通常會(huì)生成對(duì)同一目標(biāo)的多次檢測(cè)。

計(jì)算兩個(gè)邊界框之間重疊的最常見(jiàn)方法是使用交并比 (IoU) 指標(biāo)。

IoU(A,B) = (A ∩ B) / (A ∪ B)

其中 A 和 B 是邊界框的面積,A ∩ B 是它們相交的面積。通常,為 IoU 度量設(shè)置一個(gè)閾值,任何 IoU 大于該閾值的邊界框都被認(rèn)為是重復(fù)檢測(cè)并被刪除。


加權(quán)框融合

加權(quán)框融合(WBF)是一種提高目標(biāo)檢測(cè)系統(tǒng)性能的強(qiáng)大技術(shù)。它是一種將多個(gè)邊界框或感興趣區(qū)域 (ROI) 的結(jié)果組合成一個(gè)更準(zhǔn)確、更穩(wěn)定的結(jié)果的方法。當(dāng)使用多個(gè)模型或算法來(lái)檢測(cè)圖像或視頻中的目標(biāo)并且需要組合結(jié)果以提高整體性能時(shí),該技術(shù)特別有用。

從本質(zhì)上講,WBF 是一種通過(guò)根據(jù)各種標(biāo)準(zhǔn)為每個(gè)邊界框分配權(quán)重來(lái)組合多個(gè)目標(biāo)檢測(cè)器結(jié)果的方法。然后使用這些權(quán)重將邊界框組合成一個(gè)更穩(wěn)健的結(jié)果。

WBF算法的工作步驟如下:

  1. 每個(gè)模型的每個(gè)預(yù)測(cè)框(或通過(guò) TTA 獲得的預(yù)測(cè))都會(huì)添加到單個(gè)列表 B 中,然后按置信度分?jǐn)?shù) C 的降序排序。
  2. 分別為框組和融合框?qū)嵗碌目樟斜?L 和 F。因此,列表L中的每個(gè)元素都是由于重疊而形成的一組框,而F中的每個(gè)位置僅包含一個(gè)框,即融合框。
  3. 在一個(gè)循環(huán)中迭代 B 中的預(yù)測(cè)框,并檢查列表 F 中的匹配框(IoU > THR)。
  4. 如果未找到匹配項(xiàng),則將 B 中的框添加到列表 L 和 F 的末尾作為新條目;繼續(xù)進(jìn)行 B 中的下一個(gè)框。
  5. 如果找到匹配,則將此框添加到列表L中與F中的匹配框?qū)?yīng)的位置處。
  6. 使用框組 L[pos]中的所有內(nèi)容重新計(jì)算 F[pos]中的框坐標(biāo)和置信度得分。將置信度得分設(shè)置為 L[pos]中所有框的平均置信度。融合框的坐標(biāo)是形成它的框的坐標(biāo)的加權(quán)和,其中權(quán)重是對(duì)應(yīng)框的置信度分?jǐn)?shù)。最終 ROI = Σ (權(quán)重 i * ROIi) / Σ 權(quán)重 i。其中 ROIi 是第 i 個(gè)邊界框,weighti 是分配給該邊界框的權(quán)重,并且對(duì)正在考慮進(jìn)行融合的所有邊界框進(jìn)行求和。最終的 ROI 是計(jì)算得出的組合邊界框。
  7. 最后,重新調(diào)整 F 列表中的置信度分?jǐn)?shù):將其乘以組中的框數(shù)(定義為下面的 T),然后除以模型數(shù) N。如果組中的框數(shù)量較少,則可能意味著只有少數(shù)模型可以預(yù)測(cè)它。因此,我們需要降低此類(lèi)情況的置信度分?jǐn)?shù)。
wKgZomToHbyAffQ2AAAVTLBpKgk243.png

WBF 可以成為提高目標(biāo)檢測(cè)系統(tǒng)性能的強(qiáng)大工具,并且越來(lái)越多地被廣泛應(yīng)用于自動(dòng)駕駛汽車(chē)、監(jiān)控系統(tǒng)和計(jì)算機(jī)視覺(jué)的許多其他領(lǐng)域。通過(guò)集成WBF技術(shù),目標(biāo)檢測(cè)系統(tǒng)可以變得更加魯棒和準(zhǔn)確,并且即使在存在噪聲和遮擋的情況下也可以表現(xiàn)得更好。


NMS vs WBFwKgZomToHbyADrUgAAC6PcAkzSs236.png加權(quán)框融合(WBF)和非極大值抑制(NMS)都是用于提高目標(biāo)檢測(cè)系統(tǒng)性能的技術(shù)。然而,它們的使用方式不同,并且具有不同的權(quán)衡。NMS 是一種后處理技術(shù),用于刪除目標(biāo)檢測(cè)器生成的重疊邊界框。它的工作原理是選擇置信度得分最高的邊界框,然后刪除與其顯著重疊的任何其他邊界框。重復(fù)此過(guò)程,直到考慮了所有邊界框。NMS 是一種簡(jiǎn)單、快速且有效的方法,可減少目標(biāo)檢測(cè)中的誤報(bào)數(shù)量。

另一方面,WBF 是一種用于組合多個(gè)邊界框(或感興趣區(qū)域)的技術(shù),以產(chǎn)生更準(zhǔn)確和穩(wěn)定的結(jié)果。它通常用于使用多個(gè)模型或算法來(lái)檢測(cè)圖像或視頻中的對(duì)象,并且需要組合結(jié)果以提高整體性能的情況。WBF 的工作原理是根據(jù)檢測(cè)置信度、與其他邊界框的重疊或其他標(biāo)準(zhǔn)等因素為每個(gè)邊界框分配權(quán)重。然后使用這些權(quán)重將邊界框組合成一個(gè)更穩(wěn)健的結(jié)果。


實(shí)驗(yàn)評(píng)估2個(gè)不同模型的集成wKgZomToHbyAYfNSAADgRfdAtv8570.png表 1 顯示了兩個(gè)模型的 MS COCO 驗(yàn)證集的結(jié)果。使用四種不同的技術(shù)組合預(yù)測(cè):NMS、Soft NMS、NMW 和 WBF。我們看到,在不同的設(shè)置下,WBF 方法明顯優(yōu)于其他方法,帶來(lái)了更大的改進(jìn)。測(cè)試時(shí)增強(qiáng)集成wKgZomToHbyALNiKAAB8aWbTHI4275.png

在上表中我們看到作者還提供了通過(guò) TTA 組合預(yù)測(cè)的實(shí)驗(yàn)。他們使用在 COCO 數(shù)據(jù)集上訓(xùn)練的 EfficientNetB7 模型。對(duì)于 TTA,他們只采用水平翻轉(zhuǎn)。同樣,我們看到 WBF 的性能明顯優(yōu)于 NMS、Soft-NMS 和 NMW 等其他方法。


最后使用加權(quán)框融合 (WBF) 的動(dòng)機(jī)是通過(guò)將多個(gè)邊界框或感興趣區(qū)域 (ROI) 的結(jié)果組合成一個(gè)更準(zhǔn)確和穩(wěn)定的結(jié)果來(lái)提高目標(biāo)檢測(cè)系統(tǒng)的性能。這在使用多個(gè)模型或算法來(lái)檢測(cè)圖像或視頻中的目標(biāo)并且需要組合結(jié)果以提高整體性能的情況下特別有用。使用 WBF 有益的原因有以下幾個(gè):
  • 魯棒性:物體檢測(cè)器可能會(huì)受到雜波、遮擋和背景噪聲等因素的影響。WBF可以通過(guò)結(jié)合多個(gè)檢測(cè)器的結(jié)果來(lái)幫助提高物體檢測(cè)系統(tǒng)的魯棒性,從而可以減少這些因素的影響。
  • 準(zhǔn)確性:WBF 可以通過(guò)組合同一物體的多次檢測(cè)來(lái)幫助提高物體檢測(cè)系統(tǒng)的準(zhǔn)確性。這在圖像或視頻中目標(biāo)部分被遮擋或僅部分可見(jiàn)的情況下特別有用。
  • 穩(wěn)定性:WBF 可以通過(guò)減少誤報(bào)和漏報(bào)的影響來(lái)幫助提高目標(biāo)檢測(cè)系統(tǒng)的穩(wěn)定性。這在感興趣的物體很小或難以檢測(cè)的情況下特別有用。
  • 靈活性:WBF可以與非極大值抑制(NMS)等其他技術(shù)結(jié)合使用,以進(jìn)一步提高目標(biāo)檢測(cè)系統(tǒng)的性能。

英文原文:https://medium.com/deem-blogs/object-detection-explained-nms-vs-wbf-4526d58e7e34

END

歡迎加入Imagination GPU人工智能交流2群

wKgZomToHbyAIsRuAABN8aBfIqc747.jpg

入群請(qǐng)加小編微信:eetrend89

(添加請(qǐng)備注公司名和職稱(chēng))

推薦閱讀 對(duì)話Imagination中國(guó)區(qū)董事長(zhǎng):以GPU為支點(diǎn)加強(qiáng)軟硬件協(xié)同,助力數(shù)字化轉(zhuǎn)型 下載白皮書(shū) | 通過(guò)Photon架構(gòu)創(chuàng)建身臨其境的圖形體驗(yàn)

Imagination Technologies是一家總部位于英國(guó)的公司,致力于研發(fā)芯片和軟件知識(shí)產(chǎn)權(quán)(IP),基于Imagination IP的產(chǎn)品已在全球數(shù)十億人的電話、汽車(chē)、家庭和工作 場(chǎng)所中使用。獲取更多物聯(lián)網(wǎng)、智能穿戴、通信汽車(chē)電子、圖形圖像開(kāi)發(fā)等前沿技術(shù)信息,歡迎關(guān)注 Imagination Tech!


原文標(biāo)題:目標(biāo)檢測(cè)的后處理:NMS vs WBF

文章出處:【微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • imagination
    +關(guān)注

    關(guān)注

    1

    文章

    611

    瀏覽量

    62964

原文標(biāo)題:目標(biāo)檢測(cè)的后處理:NMS vs WBF

文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【產(chǎn)品介紹】Altair HyperView用于仿真和CAE分析的后處理和數(shù)據(jù)可視化

    AltairHyperView通過(guò)用于仿真和CAE分析的高級(jí)后處理和數(shù)據(jù)可視化解鎖工程洞察力AltairHyperView是用于高保真后處理的CAE分析軟件。HyperView專(zhuān)為工程師打造,可促進(jìn)
    的頭像 發(fā)表于 09-19 17:02 ?319次閱讀
    【產(chǎn)品介紹】Altair HyperView用于仿真和CAE分析的<b class='flag-5'>后處理</b>和數(shù)據(jù)可視化

    【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】AI 算法模型(人臉檢測(cè)、軀干檢測(cè)、車(chē)牌識(shí)別)

    self.nms_threshold = nms_threshold# NMS(非極大值抑制)閾值 self.anchors = anchors# 錨點(diǎn)數(shù)據(jù),用于目標(biāo)
    發(fā)表于 07-05 00:52

    【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】03 攝像頭調(diào)用+AI人臉檢測(cè)

    進(jìn)行人臉檢測(cè),并在屏幕上實(shí)時(shí)標(biāo)注檢測(cè)結(jié)果。 整個(gè)流程包括: 攝像頭圖像采集; 圖像預(yù)處理(padding、resize); 人臉檢測(cè)模型推理; 后處
    發(fā)表于 07-01 22:43

    【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】人臉檢測(cè)、手勢(shì)識(shí)別、車(chē)牌識(shí)別

    =confidence_threshold # nms閾值 self.nms_threshold=nms_threshold # 錨框,目標(biāo)檢測(cè)
    發(fā)表于 06-30 20:44

    【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】人體關(guān)鍵點(diǎn)檢測(cè)

    ]]) # 自定義當(dāng)前任務(wù)的后處理 def postprocess(self,results): with ScopedTiming(\"postprocess\"
    發(fā)表于 06-28 13:18

    YOLOv8水果檢測(cè)示例代碼換成640輸入圖像出現(xiàn)目標(biāo)框繪制錯(cuò)誤的原因 ?

    \",中的best.kmodel替換為640輸入圖像,model_input_size=[640,640],就會(huì)出現(xiàn)目標(biāo)檢測(cè)目標(biāo)框位置混亂,目標(biāo)框的位置完全是錯(cuò)的,但是
    發(fā)表于 06-18 06:37

    基于LockAI視覺(jué)識(shí)別模塊:C++目標(biāo)檢測(cè)

    (float score_threshold = 0.5, float nms_threshold = 0.3); 作用: 設(shè)置目標(biāo)檢測(cè)的置信度閾值和NMS閾值。 參數(shù): scor
    發(fā)表于 06-06 14:43

    基于LockAI視覺(jué)識(shí)別模塊:C++目標(biāo)檢測(cè)

    本文檔基于瑞芯微RV1106的LockAI凌智視覺(jué)識(shí)別模塊,通過(guò)C++語(yǔ)言做的目標(biāo)檢測(cè)實(shí)驗(yàn)。本文檔展示了如何使用lockzhiner_vision_module::PaddleDet類(lèi)進(jìn)行目標(biāo)
    的頭像 發(fā)表于 06-06 13:56 ?456次閱讀
    基于LockAI視覺(jué)識(shí)別模塊:C++<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>

    COMSOL Multiphysics V4.x操作手冊(cè)叢書(shū)后處理用戶(hù)指南

    電子發(fā)燒友網(wǎng)站提供《COMSOL Multiphysics V4.x操作手冊(cè)叢書(shū)后處理用戶(hù)指南.pdf》資料免費(fèi)下載
    發(fā)表于 04-22 15:36 ?0次下載

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類(lèi)、obb

    labview調(diào)用yolo目標(biāo)檢測(cè)、分割、分類(lèi)、obb、pose深度學(xué)習(xí),支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發(fā)表于 03-31 16:28

    軒轅智駕紅外目標(biāo)檢測(cè)算法在汽車(chē)領(lǐng)域的應(yīng)用

    在 AI 技術(shù)蓬勃發(fā)展的當(dāng)下,目標(biāo)檢測(cè)算法取得了重大突破,其中紅外目標(biāo)檢測(cè)算法更是在汽車(chē)行業(yè)掀起了波瀾壯闊的變革,從根本上重塑著汽車(chē)的安全性能、駕駛體驗(yàn)與產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 03-27 15:55 ?625次閱讀

    K230運(yùn)行報(bào)錯(cuò)ValueError: array is too big,為什么?

    : 照著它給的解決方案加了一個(gè)判斷條件, 雖然報(bào)錯(cuò)解決了, 但是又出現(xiàn)了畫(huà)面左上角一直會(huì)繪制目標(biāo)框,然后想正常檢測(cè)目標(biāo)又不會(huì)繪制出目標(biāo)框的問(wèn)題。 實(shí)際效果圖片: 軟硬件版本信息 實(shí)
    發(fā)表于 02-08 08:52

    AI模型部署邊緣設(shè)備的奇妙之旅:目標(biāo)檢測(cè)模型

    里面包含什么類(lèi)別的目標(biāo)。 (2)定位-Location:解決“在哪里?”的問(wèn)題,即定位出這個(gè)目標(biāo)的的位置。 (3)檢測(cè)-Detection:解決“在哪里?是什么?”的問(wèn)題,即定位出這個(gè)目標(biāo)
    發(fā)表于 12-19 14:33

    YOLOv10自定義目標(biāo)檢測(cè)之理論+實(shí)踐

    概述 YOLOv10 是由清華大學(xué)研究人員利用 Ultralytics Python 軟件包開(kāi)發(fā)的,它通過(guò)改進(jìn)模型架構(gòu)并消除非極大值抑制(NMS)提供了一種新穎的實(shí)時(shí)目標(biāo)檢測(cè)方法。這些優(yōu)化使得模型在
    的頭像 發(fā)表于 11-16 10:23 ?2698次閱讀
    YOLOv10自定義<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>之理論+實(shí)踐

    YOLOv10:引領(lǐng)無(wú)NMS實(shí)時(shí)目標(biāo)檢測(cè)的新紀(jì)元

    。 YOLO(You Only Look Once)系列一直是實(shí)時(shí)目標(biāo)檢測(cè)的基準(zhǔn),成功平衡了計(jì)算成本和檢測(cè)性能。盡管在架構(gòu)設(shè)計(jì)和優(yōu)化策略方面取得了進(jìn)展,但對(duì)非最大值抑制(NMS
    的頭像 發(fā)表于 11-13 17:12 ?2267次閱讀
    YOLOv10:引領(lǐng)無(wú)<b class='flag-5'>NMS</b>實(shí)時(shí)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>的新紀(jì)元