chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于PyTorch的物體檢測(cè)包圍框數(shù)據(jù)增強(qiáng)包

新機(jī)器視覺 ? 來(lái)源:AI公園 ? 作者:Harpal Sahota ? 2021-07-01 09:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Harpal Sahota

編譯:ronghuaiyang

導(dǎo)讀

實(shí)現(xiàn)了Google Research,Brain Team中的增強(qiáng)策略。

像許多神經(jīng)網(wǎng)絡(luò)模型一樣,目標(biāo)檢測(cè)模型在訓(xùn)練大量數(shù)據(jù)時(shí)效果最好。通常情況下,可用的數(shù)據(jù)有限,世界各地的許多研究人員正在研究增強(qiáng)策略,以增加可用的數(shù)據(jù)量。谷歌的大腦團(tuán)隊(duì)進(jìn)行了一項(xiàng)這樣的研究,并發(fā)表在了一篇論文中,名為L(zhǎng)earning Data Augmentation Strategies for Object Detection。在這篇論文中,作者確定了一組增強(qiáng)稱為策略,它對(duì)目標(biāo)檢測(cè)問(wèn)題表現(xiàn)良好。該策略通過(guò)增強(qiáng)搜索獲得,提高了通用模型的性能。

作者將增強(qiáng)策略定義為一組子策略。在模型進(jìn)行訓(xùn)練時(shí),隨機(jī)選擇其中一個(gè)子策略用于增強(qiáng)圖像。在每個(gè)子策略中都有要依次應(yīng)用于圖像的增強(qiáng)。每個(gè)轉(zhuǎn)換也有兩個(gè)超參數(shù):概率和幅度。概率表示該增強(qiáng)將被應(yīng)用的可能性,而幅度表示該增強(qiáng)的程度。下面的代碼顯示了本文中使用的策略:

policy = [

[(‘TranslateX_BBox’, 0.6, 4), (‘Equalize’, 0.8, 10)],

[(‘TranslateY_Only_BBoxes’, 0.2, 2), (‘Cutout’, 0.8, 8)],

[(‘Sharpness’, 0.0, 8), (‘ShearX_BBox’, 0.4, 0)],

[(‘ShearY_BBox’, 1.0, 2), (‘TranslateY_Only_BBoxes’, 0.6, 6)],

[(‘Rotate_BBox’, 0.6, 10), (‘Color’, 1.0, 6)],

在這個(gè)策略中有5個(gè)子策略,如果我們?nèi)〉谝粋€(gè)子策略,它就包含了TranslateX_BBox和Equalize增強(qiáng)。TranslateX_BBox操作在x軸上轉(zhuǎn)換圖像的幅度為4。在本例中,大小并不直接轉(zhuǎn)換為像素,而是根據(jù)大小縮放為像素值。該增強(qiáng)的概率也為0.6,這意味著如果該增強(qiáng)被選中,則應(yīng)用該增強(qiáng)的概率為60%。

隨著每個(gè)增強(qiáng)都有一個(gè)相關(guān)的概率,引入了一個(gè)隨機(jī)的概念,給訓(xùn)練增加了一定程度的隨機(jī)性。總的來(lái)說(shuō),Brain Team已經(jīng)提出了4個(gè)策略: v0, v1, v2和v3。本文中顯示了v0策略,其他三個(gè)策略包含更多的子策略,這些子策略具有幾種不同的轉(zhuǎn)換。總的來(lái)說(shuō),增加分為三類,作者定義為:

顏色操作: 扭曲顏色通道,不影響邊界框的位置。

幾何操作:幾何扭曲圖像,這相應(yīng)地改變了邊界框的位置和大小。

包圍框操作:只會(huì)扭曲包圍框中包含的像素內(nèi)容。

BBAug

那么BBAug)在這方面有什么貢獻(xiàn)呢?BBAug是一個(gè)python包,它實(shí)現(xiàn)了谷歌Brain Team的所有策略。這個(gè)包是一個(gè)包裝器,可以更容易地使用這些策略。實(shí)際的擴(kuò)展是由優(yōu)秀的imgaug包完成的。

上面顯示的策略應(yīng)用于一個(gè)示例圖像,如下所示。每一行是一個(gè)不同的子策略,每一列是該子策略的不同運(yùn)行。

正如你所看到的,在子策略的運(yùn)行之間有一定程度的變化,因此給訓(xùn)練增加了一定程度的隨機(jī)性。這只是BBAug實(shí)施的4個(gè)策略之一。要查看所有4個(gè)策略的完整可視化,請(qǐng)查看包的GitHub頁(yè)面:https://github.com/harpalsahota/bbaug。

該包還提供了一些有用的功能,比如定制策略的可能性,以及位于圖像外部的邊界框,如果它們部分位于圖像外部,則會(huì)被自動(dòng)刪除或剪切。例如,在下面的圖像中,應(yīng)用了平移增強(qiáng),將邊界框部分推到圖像外部。你可以看到新的邊界框已經(jīng)縮小以適應(yīng)這一點(diǎn)。

也可以創(chuàng)建只影響邊界框區(qū)域的增強(qiáng)。在下圖中,solarisaugmentation只應(yīng)用于邊界框區(qū)域:

用隨機(jī)策略增加單個(gè)圖像有多容易?就像這樣簡(jiǎn)單:

from bbaug import policies

# select policy v0 set

aug_policy = policies.policies_v0()

# instantiate the policy container with the selected policy set

policy_container = policies.PolicyContainer(aug_policy)

# select a random policy from the policy set

random_policy = policy_container.select_random_policy()

# Apply the augmentation. Returns the augmented image and bounding boxes.

# Image is a numpy array of the image

# Bounding boxes is a list of list of bounding boxes in pixels (int)。

# e.g. [[x_min, y_min, x_man, y_max], [x_min, y_min, x_man, y_max]]

# Labels are the class labels for the bounding boxes as an iterable of ints e.g. [1,0]

img_aug, bbs_aug = policy_container.apply_augmentation(random_policy, image, bounding_boxes, labels)

# image_aug: numpy array of the augmented image

# bbs_aug: numpy array of augmneted bounding boxes in format: [[label, x_min, y_min, x_man, y_max],。。。]

總結(jié)

該包實(shí)現(xiàn)了谷歌Brain Team推導(dǎo)出的增強(qiáng)策略。目前,已經(jīng)實(shí)現(xiàn)了所有4個(gè)策略,該包還附帶了notebooks,以幫助用戶將這些策略集成到他們的PyTorch訓(xùn)練pipeline中。

英文原文:https://towardsdatascience.com/bbaug-a-package-for-bounding-box-augmentation-in-pytorch-e9b9fbf1504b

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103581
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    809

    瀏覽量

    13952

原文標(biāo)題:BBAug: 一個(gè)用于PyTorch的物體檢測(cè)包圍框數(shù)據(jù)增強(qiáng)包

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【嘉楠堪智K230開發(fā)板試用體驗(yàn)】01 Studio K230開發(fā)板Test2——手掌,手勢(shì)檢測(cè),字符檢測(cè)

    理解: 它不僅能檢測(cè)圖像內(nèi)容,更能進(jìn)行精確的識(shí)別和定位。例如: 人臉檢測(cè)與定位(位置和尺寸)。 物體檢測(cè)、識(shí)別(分類)、定位(位置和尺寸)。 高性能: 其計(jì)算能力顯著提升,官方數(shù)據(jù)顯示
    發(fā)表于 07-10 09:45

    【HarmonyOS 5】VisionKit人臉活體檢測(cè)詳解

    【HarmonyOS 5】VisionKit人臉活體檢測(cè)詳解 ##鴻蒙開發(fā)能力 ##HarmonyOS SDK應(yīng)用服務(wù)##鴻蒙金融類應(yīng)用 (金融理財(cái)# 一、VisionKit人臉活體檢測(cè)
    的頭像 發(fā)表于 06-21 11:52 ?288次閱讀
    【HarmonyOS 5】VisionKit人臉活<b class='flag-5'>體檢測(cè)</b>詳解

    手機(jī)中氣密性檢測(cè)儀的使用方法

    在手機(jī)制造過(guò)程中,確保手機(jī)中的氣密性至關(guān)重要,這直接關(guān)系到手機(jī)的防水、防塵性能以及整體質(zhì)量。以下是手機(jī)中氣密性檢測(cè)儀的具體使用方法。檢測(cè)前準(zhǔn)備:首先,要確保手機(jī)中
    的頭像 發(fā)表于 05-27 13:50 ?280次閱讀
    手機(jī)中<b class='flag-5'>框</b>氣密性<b class='flag-5'>檢測(cè)</b>儀的使用方法

    云南恩田有毒有害氣體檢測(cè)系統(tǒng)# 的安全#隧道施工#有毒有害氣體檢測(cè)

    體檢測(cè)
    恩田智能設(shè)備
    發(fā)布于 :2025年05月15日 15:06:40

    便攜式+多功能+可定制!工廠直發(fā),重新定義氣體檢測(cè)效率

    體檢測(cè)
    奕帆科技
    發(fā)布于 :2025年04月25日 15:05:25

    體檢漏儀如何操作?注意事項(xiàng)有哪些?

    體檢漏儀 ,從名稱上就能看出,這是一種用于檢測(cè)氣體泄漏情況的專業(yè)設(shè)備,在工業(yè)、環(huán)保等領(lǐng)域中有著廣泛的應(yīng)用潛力。那么,氣體檢漏儀如何操作?注意事項(xiàng)有哪些?為方便大家了解,下面就讓小編來(lái)為大家簡(jiǎn)單介紹
    發(fā)表于 03-12 15:08

    要設(shè)計(jì)CH氣體檢測(cè)設(shè)備應(yīng)用的激光源波長(zhǎng)為3370nm,請(qǐng)問(wèn)DMD微鏡的反射波長(zhǎng)是多少?

    請(qǐng)問(wèn):我現(xiàn)在要設(shè)計(jì)CH氣體檢測(cè)設(shè)備應(yīng)用的激光源波長(zhǎng)為3370nm,請(qǐng)問(wèn)貴司的DMD微鏡的反射波長(zhǎng)是多少?我們的要求能滿足嗎?
    發(fā)表于 02-24 08:08

    【米爾RK3576開發(fā)板評(píng)測(cè)】+項(xiàng)目名稱RetinaFace人臉檢測(cè)

    一、簡(jiǎn)介 Pytorch_Retinaface?是一個(gè)基于PyTorch框架實(shí)現(xiàn)的人臉檢測(cè)算法,它能夠快速而準(zhǔn)確地檢測(cè)出圖像中的人臉,并提供豐富的特征信息。該算法的核心思想是使用多尺度
    發(fā)表于 02-15 13:28

    《DNK210使用指南 -CanMV版 V1.0》第四十一章 YOLO2物體檢測(cè)實(shí)驗(yàn)

    第四十一章 YOLO2物體檢測(cè)實(shí)驗(yàn) 在上一章節(jié)中,介紹了利用maix.KPU模塊實(shí)現(xiàn)YOLO2的人手檢測(cè),本章將繼續(xù)介紹利用maix.KPU模塊實(shí)現(xiàn)YOLO2的物體檢測(cè)。通過(guò)本章的學(xué)習(xí),讀者將學(xué)習(xí)到
    發(fā)表于 11-14 09:22

    PyTorch 數(shù)據(jù)加載與處理方法

    PyTorch 是一個(gè)流行的開源機(jī)器學(xué)習(xí)庫(kù),它提供了強(qiáng)大的工具來(lái)構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型。在構(gòu)建模型之前,一個(gè)重要的步驟是加載和處理數(shù)據(jù)。 1. PyTorch 數(shù)據(jù)加載基礎(chǔ) 在
    的頭像 發(fā)表于 11-05 17:37 ?928次閱讀

    在目標(biāo)檢測(cè)中大物體的重要性

    導(dǎo)讀實(shí)驗(yàn)表明,對(duì)大型物體賦予更大的權(quán)重可以提高所有尺寸物體檢測(cè)分?jǐn)?shù),從而整體提升目標(biāo)檢測(cè)器的性能(在COCOval2017數(shù)據(jù)集上使用In
    的頭像 發(fā)表于 10-09 08:05 ?813次閱讀
    在目標(biāo)<b class='flag-5'>檢測(cè)</b>中大<b class='flag-5'>物體</b>的重要性

    安帕爾:可燃?xì)?b class='flag-5'>體檢測(cè)儀怎么樣選擇

    安帕爾:可燃?xì)?b class='flag-5'>體檢測(cè)儀怎么樣選擇 可燃?xì)?b class='flag-5'>體檢測(cè)儀怎么樣選擇?下面安帕爾給大家介紹下 一要看可燃?xì)?b class='flag-5'>體檢測(cè)儀是否具有穩(wěn)定性。這個(gè)是必須要考慮的因素,零點(diǎn)偏移和全幅偏移的數(shù)值越小越好,所有的氣體檢測(cè)
    的頭像 發(fā)表于 08-16 10:16 ?546次閱讀

    pytorch怎么在pycharm中運(yùn)行

    第一部分:PyTorch和PyCharm的安裝 1.1 安裝PyTorch PyTorch是一個(gè)開源的機(jī)器學(xué)習(xí)庫(kù),用于構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。要在PyCharm中使用PyTorch,首先需
    的頭像 發(fā)表于 08-01 16:22 ?2521次閱讀

    pytorch環(huán)境搭建詳細(xì)步驟

    了conda、Python等180多個(gè)科學(xué)及其依賴項(xiàng),非常適合用于科學(xué)計(jì)算(數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)應(yīng)用、大數(shù)據(jù)處理
    的頭像 發(fā)表于 08-01 15:38 ?1861次閱讀

    低功耗藍(lán)牙模塊+氣體檢測(cè)儀藍(lán)牙方案介紹

    在工業(yè)安全領(lǐng)域,氣體檢測(cè)儀是保障工作場(chǎng)所安全的關(guān)鍵設(shè)備之一。氣體檢測(cè)儀藍(lán)牙模組方案的出現(xiàn),使得氣體檢測(cè)數(shù)據(jù)可以通過(guò)藍(lán)牙技術(shù)傳輸?shù)街悄苁謾C(jī)、平板電腦等移動(dòng)設(shè)備上,實(shí)現(xiàn)遠(yuǎn)程監(jiān)測(cè)與管理。工作
    的頭像 發(fā)表于 07-17 16:59 ?723次閱讀
    低功耗藍(lán)牙模塊+氣<b class='flag-5'>體檢測(cè)</b>儀藍(lán)牙方案介紹