chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

目標檢測的后處理:NMS vs WBF

穎脈Imgtec ? 2023-07-31 23:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Ching (Chingis)編譯:ronghuaiyang來源:AI公園

導讀

對目標檢測后處理中的NMS和WBF的解釋和對比。目前,計算機視覺在許多地方都有重要的應用,例如自動駕駛汽車、監(jiān)控系統(tǒng)和圖像識別。計算機視覺的主要挑戰(zhàn)之一是目標檢測,它涉及識別和定位圖像和視頻中的目標。為了提高目標檢測系統(tǒng)的性能,研究人員和從業(yè)者開發(fā)了各種技術,例如模型集成和測試時增強(TTA)。

模型集成是組合多個模型的預測以提高系統(tǒng)整體性能的過程。這可以通過對多個模型的預測求平均值,或使用更復雜的方法(如加權框融合 (WBF))來組合預測來完成。集成方法可以通過減少過擬合的影響并提高系統(tǒng)的魯棒性來顯著提高目標檢測系統(tǒng)的性能。

測試時增強 (TTA) 是另一種用于提高目標檢測系統(tǒng)性能的技術。它在測試期間將各種數(shù)據(jù)增強技術(例如旋轉、縮放和翻轉)應用于輸入圖像。這可以通過使系統(tǒng)對輸入數(shù)據(jù)的微小變化更加不變來幫助提高系統(tǒng)的魯棒性。TTA還可以通過提供額外的數(shù)據(jù)供檢測器學習來幫助提高系統(tǒng)的性能。

在本文中,我們將探索和比較非最大抑制 (NMS) 和加權框融合 (WBF) 以提高目標檢測系統(tǒng)的性能。


非最大值抑制

非極大值抑制 (NMS) 是一種后處理技術,用于去除目標檢測器生成的重疊框。它常用于計算機視覺中的目標檢測任務,例如人臉檢測、目標跟蹤以及圖像和視頻中的目標檢測。

NMS 背后的基本思想是選擇置信度得分最高的框,然后刪除與其顯著重疊的其他框。重復此過程,直到考慮了所有框。這有助于減少目標檢測中的誤報數(shù)量,因為目標檢測器通常會生成對同一目標的多次檢測。

計算兩個邊界框之間重疊的最常見方法是使用交并比 (IoU) 指標。

IoU(A,B) = (A ∩ B) / (A ∪ B)

其中 A 和 B 是邊界框的面積,A ∩ B 是它們相交的面積。通常,為 IoU 度量設置一個閾值,任何 IoU 大于該閾值的邊界框都被認為是重復檢測并被刪除。


加權框融合

加權框融合(WBF)是一種提高目標檢測系統(tǒng)性能的強大技術。它是一種將多個邊界框或感興趣區(qū)域 (ROI) 的結果組合成一個更準確、更穩(wěn)定的結果的方法。當使用多個模型或算法來檢測圖像或視頻中的目標并且需要組合結果以提高整體性能時,該技術特別有用。

從本質上講,WBF 是一種通過根據(jù)各種標準為每個邊界框分配權重來組合多個目標檢測器結果的方法。然后使用這些權重將邊界框組合成一個更穩(wěn)健的結果。

WBF算法的工作步驟如下:

  1. 每個模型的每個預測框(或通過 TTA 獲得的預測)都會添加到單個列表 B 中,然后按置信度分數(shù) C 的降序排序。
  2. 分別為框組和融合框實例化新的空列表 L 和 F。因此,列表L中的每個元素都是由于重疊而形成的一組框,而F中的每個位置僅包含一個框,即融合框。
  3. 在一個循環(huán)中迭代 B 中的預測框,并檢查列表 F 中的匹配框(IoU > THR)。
  4. 如果未找到匹配項,則將 B 中的框添加到列表 L 和 F 的末尾作為新條目;繼續(xù)進行 B 中的下一個框。
  5. 如果找到匹配,則將此框添加到列表L中與F中的匹配框對應的位置處。
  6. 使用框組 L[pos]中的所有內(nèi)容重新計算 F[pos]中的框坐標和置信度得分。將置信度得分設置為 L[pos]中所有框的平均置信度。融合框的坐標是形成它的框的坐標的加權和,其中權重是對應框的置信度分數(shù)。最終 ROI = Σ (權重 i * ROIi) / Σ 權重 i。其中 ROIi 是第 i 個邊界框,weighti 是分配給該邊界框的權重,并且對正在考慮進行融合的所有邊界框進行求和。最終的 ROI 是計算得出的組合邊界框。
  7. 最后,重新調(diào)整 F 列表中的置信度分數(shù):將其乘以組中的框數(shù)(定義為下面的 T),然后除以模型數(shù) N。如果組中的框數(shù)量較少,則可能意味著只有少數(shù)模型可以預測它。因此,我們需要降低此類情況的置信度分數(shù)。

1b724aa4-2fb9-11ee-bbcf-dac502259ad0.png

WBF 可以成為提高目標檢測系統(tǒng)性能的強大工具,并且越來越多地被廣泛應用于自動駕駛汽車、監(jiān)控系統(tǒng)和計算機視覺的許多其他領域。通過集成WBF技術,目標檢測系統(tǒng)可以變得更加魯棒和準確,并且即使在存在噪聲和遮擋的情況下也可以表現(xiàn)得更好。


NMS vs WBF1b7efa38-2fb9-11ee-bbcf-dac502259ad0.png加權框融合(WBF)和非極大值抑制(NMS)都是用于提高目標檢測系統(tǒng)性能的技術。然而,它們的使用方式不同,并且具有不同的權衡。NMS 是一種后處理技術,用于刪除目標檢測器生成的重疊邊界框。它的工作原理是選擇置信度得分最高的邊界框,然后刪除與其顯著重疊的任何其他邊界框。重復此過程,直到考慮了所有邊界框。NMS 是一種簡單、快速且有效的方法,可減少目標檢測中的誤報數(shù)量。

另一方面,WBF 是一種用于組合多個邊界框(或感興趣區(qū)域)的技術,以產(chǎn)生更準確和穩(wěn)定的結果。它通常用于使用多個模型或算法來檢測圖像或視頻中的對象,并且需要組合結果以提高整體性能的情況。WBF 的工作原理是根據(jù)檢測置信度、與其他邊界框的重疊或其他標準等因素為每個邊界框分配權重。然后使用這些權重將邊界框組合成一個更穩(wěn)健的結果。


實驗評估2個不同模型的集成1b8c9364-2fb9-11ee-bbcf-dac502259ad0.png表 1 顯示了兩個模型的 MS COCO 驗證集的結果。使用四種不同的技術組合預測:NMS、Soft NMS、NMW 和 WBF。我們看到,在不同的設置下,WBF 方法明顯優(yōu)于其他方法,帶來了更大的改進。測試時增強集成1bac2206-2fb9-11ee-bbcf-dac502259ad0.png

在上表中我們看到作者還提供了通過 TTA 組合預測的實驗。他們使用在 COCO 數(shù)據(jù)集上訓練的 EfficientNetB7 模型。對于 TTA,他們只采用水平翻轉。同樣,我們看到 WBF 的性能明顯優(yōu)于 NMS、Soft-NMS 和 NMW 等其他方法。


最后使用加權框融合 (WBF) 的動機是通過將多個邊界框或感興趣區(qū)域 (ROI) 的結果組合成一個更準確和穩(wěn)定的結果來提高目標檢測系統(tǒng)的性能。這在使用多個模型或算法來檢測圖像或視頻中的目標并且需要組合結果以提高整體性能的情況下特別有用。使用 WBF 有益的原因有以下幾個:

  • 魯棒性:物體檢測器可能會受到雜波、遮擋和背景噪聲等因素的影響。WBF可以通過結合多個檢測器的結果來幫助提高物體檢測系統(tǒng)的魯棒性,從而可以減少這些因素的影響。
  • 準確性:WBF 可以通過組合同一物體的多次檢測來幫助提高物體檢測系統(tǒng)的準確性。這在圖像或視頻中目標部分被遮擋或僅部分可見的情況下特別有用。
  • 穩(wěn)定性:WBF 可以通過減少誤報和漏報的影響來幫助提高目標檢測系統(tǒng)的穩(wěn)定性。這在感興趣的物體很小或難以檢測的情況下特別有用。

靈活性:WBF可以與非極大值抑制(NMS)等其他技術結合使用,以進一步提高目標檢測系統(tǒng)的性能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 測試
    +關注

    關注

    9

    文章

    6116

    瀏覽量

    131042
  • 檢測
    +關注

    關注

    5

    文章

    4824

    瀏覽量

    93917
  • AI
    AI
    +關注

    關注

    91

    文章

    39117

    瀏覽量

    299700
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于iTOP-3568核心板的YOLO目標檢測全棧解決方案

    在智能制造、智慧安防、智能交通等領域,實時、精準的目標檢測技術正成為行業(yè)智能化轉型的核心需求。然而,傳統(tǒng)方案面臨云端延遲高、網(wǎng)絡依賴強、成本居高不下等挑戰(zhàn)?,F(xiàn)在,基于瑞芯微RK3568處理器的iTOP-3568開發(fā)板,為您帶來實
    的頭像 發(fā)表于 01-21 16:44 ?644次閱讀
    基于iTOP-3568核心板的YOLO<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>全棧解決方案

    技術探討:超聲切割在3D打印后處理中的應用價值

    ,是很多用戶和廠商關心的問題。一、傳統(tǒng)方法與超聲技術的對比過去,大家常用美工刀、鑷子等傳統(tǒng)工具進行后處理。這種方法很依賴操作者的經(jīng)驗和手感,一不小心就可能劃傷模型
    的頭像 發(fā)表于 12-20 16:18 ?174次閱讀
    技術探討:超聲切割在3D打印<b class='flag-5'>后處理</b>中的應用價值

    智銳通 CDM-2U01,為內(nèi)窺鏡 AI 后處理打造專屬硬件平臺

    智銳通 CDM-2U01,以精準設計回應醫(yī)療場景挑戰(zhàn),為內(nèi)窺鏡 AI 后處理系統(tǒng)提供穩(wěn)定、高效、可嵌入的硬件支撐
    的頭像 發(fā)表于 10-24 17:55 ?2359次閱讀
    智銳通 CDM-2U01,為內(nèi)窺鏡 AI <b class='flag-5'>后處理</b>打造專屬硬件平臺

    【產(chǎn)品介紹】Altair HyperView用于仿真和CAE分析的后處理和數(shù)據(jù)可視化

    AltairHyperView通過用于仿真和CAE分析的高級后處理和數(shù)據(jù)可視化解鎖工程洞察力AltairHyperView是用于高保真后處理的CAE分析軟件。HyperView專為工程師打造,可促進
    的頭像 發(fā)表于 09-19 17:02 ?735次閱讀
    【產(chǎn)品介紹】Altair HyperView用于仿真和CAE分析的<b class='flag-5'>后處理</b>和數(shù)據(jù)可視化

    【BPI-CanMV-K230D-Zero開發(fā)板體驗】AI 算法模型(人臉檢測、軀干檢測、車牌識別)

    self.nms_threshold = nms_threshold# NMS(非極大值抑制)閾值 self.anchors = anchors# 錨點數(shù)據(jù),用于目標
    發(fā)表于 07-05 00:52

    【BPI-CanMV-K230D-Zero開發(fā)板體驗】03 攝像頭調(diào)用+AI人臉檢測

    進行人臉檢測,并在屏幕上實時標注檢測結果。 整個流程包括: 攝像頭圖像采集; 圖像預處理(padding、resize); 人臉檢測模型推理; 后處
    發(fā)表于 07-01 22:43

    【BPI-CanMV-K230D-Zero開發(fā)板體驗】人臉檢測、手勢識別、車牌識別

    =confidence_threshold # nms閾值 self.nms_threshold=nms_threshold # 錨框,目標檢測
    發(fā)表于 06-30 20:44

    【BPI-CanMV-K230D-Zero開發(fā)板體驗】人體關鍵點檢測

    ]]) # 自定義當前任務的后處理 def postprocess(self,results): with ScopedTiming(\"postprocess\"
    發(fā)表于 06-28 13:18

    YOLOv8水果檢測示例代碼換成640輸入圖像出現(xiàn)目標框繪制錯誤的原因 ?

    \",中的best.kmodel替換為640輸入圖像,model_input_size=[640,640],就會出現(xiàn)目標檢測目標框位置混亂,目標框的位置完全是錯的,但是
    發(fā)表于 06-18 06:37

    基于LockAI視覺識別模塊:C++目標檢測

    (float score_threshold = 0.5, float nms_threshold = 0.3); 作用: 設置目標檢測的置信度閾值和NMS閾值。 參數(shù): scor
    發(fā)表于 06-06 14:43

    基于LockAI視覺識別模塊:C++目標檢測

    本文檔基于瑞芯微RV1106的LockAI凌智視覺識別模塊,通過C++語言做的目標檢測實驗。本文檔展示了如何使用lockzhiner_vision_module::PaddleDet類進行目標
    的頭像 發(fā)表于 06-06 13:56 ?730次閱讀
    基于LockAI視覺識別模塊:C++<b class='flag-5'>目標</b><b class='flag-5'>檢測</b>

    COMSOL Multiphysics V4.x操作手冊叢書后處理用戶指南

    電子發(fā)燒友網(wǎng)站提供《COMSOL Multiphysics V4.x操作手冊叢書后處理用戶指南.pdf》資料免費下載
    發(fā)表于 04-22 15:36 ?1次下載

    labview調(diào)用yolo目標檢測、分割、分類、obb

    labview調(diào)用yolo目標檢測、分割、分類、obb、pose深度學習,支持CPU和GPU推理,32/64位labview均可使用。 (yolov5~yolov12)
    發(fā)表于 03-31 16:28

    軒轅智駕紅外目標檢測算法在汽車領域的應用

    在 AI 技術蓬勃發(fā)展的當下,目標檢測算法取得了重大突破,其中紅外目標檢測算法更是在汽車行業(yè)掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗與產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 03-27 15:55 ?859次閱讀

    K230運行報錯ValueError: array is too big,為什么?

    : 照著它給的解決方案加了一個判斷條件, 雖然報錯解決了, 但是又出現(xiàn)了畫面左上角一直會繪制目標框,然后想正常檢測目標又不會繪制出目標框的問題。 實際效果圖片: 軟硬件版本信息 實
    發(fā)表于 02-08 08:52