chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基本圖像處理技術(shù)的數(shù)據(jù)增強(qiáng)方法介紹

新機(jī)器視覺(jué) ? 來(lái)源:計(jì)算機(jī)視覺(jué)研究院 ? 作者:Edison_G ? 2022-11-23 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

數(shù)據(jù)增強(qiáng)(DA)是訓(xùn)練先進(jìn)的AI算法模型的必要技術(shù),不過(guò)并不是所有的數(shù)據(jù)增強(qiáng)都能提升模型精度,在今天的分享中,從數(shù)據(jù)增強(qiáng)的角度,對(duì)于多種增強(qiáng)方式的效果進(jìn)行了驗(yàn)證測(cè)試,希望對(duì)大家有幫助!

一、前言&簡(jiǎn)要

為了緩解上述問(wèn)題,有研究者提出了一種簡(jiǎn)單而高效的方法,稱(chēng)為保持增強(qiáng)(KeepAugment),以提高增強(qiáng)圖像的保真度。其主要思想是首先使用顯著性map來(lái)檢測(cè)原始圖像上的重要區(qū)域,然后在增強(qiáng)過(guò)程中保留這些信息區(qū)域。這種信息保護(hù)策略使我們能夠生成更忠實(shí)的訓(xùn)練示例。

在實(shí)驗(yàn)上,也證明了該方法在一些現(xiàn)有的技術(shù)數(shù)據(jù)增強(qiáng)方案上有了顯著的改進(jìn),例如:自動(dòng)增強(qiáng)、裁剪、隨機(jī)擦除,在圖像分類(lèi)、半監(jiān)督圖像分類(lèi)、多視點(diǎn)多攝像機(jī)跟蹤和目標(biāo)檢測(cè)等方面取得了很好的效果。

二、知識(shí)回顧

首先我們回一下什么叫“數(shù)據(jù)增強(qiáng)”?數(shù)據(jù)增強(qiáng)(Data Augmentation)是一種通過(guò)讓有限的數(shù)據(jù)產(chǎn)生更多的等價(jià)數(shù)據(jù)來(lái)人工擴(kuò)展訓(xùn)練數(shù)據(jù)集的技術(shù)。它是克服訓(xùn)練數(shù)據(jù)不足的有效手段,目前在深度學(xué)習(xí)的各個(gè)領(lǐng)域中應(yīng)用廣泛。但是由于生成的數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的差異,也不可避免地帶來(lái)了噪聲問(wèn)題。

為什么需要數(shù)據(jù)增強(qiáng)?

深度神經(jīng)網(wǎng)絡(luò)在許多任務(wù)中表現(xiàn)良好,但這些網(wǎng)絡(luò)通常需要大量數(shù)據(jù)才能避免過(guò)度擬合。遺憾的是,許多場(chǎng)景無(wú)法獲得大量數(shù)據(jù),例如醫(yī)學(xué)圖像分析。數(shù)據(jù)增強(qiáng)技術(shù)的存在是為了解決這個(gè)問(wèn)題,這是針對(duì)有限數(shù)據(jù)問(wèn)題的解決方案。數(shù)據(jù)增強(qiáng)一套技術(shù),可提高訓(xùn)練數(shù)據(jù)集的大小和質(zhì)量,以便您可以使用它們來(lái)構(gòu)建更好的深度學(xué)習(xí)模型。在計(jì)算視覺(jué)領(lǐng)域,生成增強(qiáng)圖像相對(duì)容易。即使引入噪聲或裁剪圖像的一部分,模型仍可以對(duì)圖像進(jìn)行分類(lèi),數(shù)據(jù)增強(qiáng)有一系列簡(jiǎn)單有效的方法可供選擇,有一些機(jī)器學(xué)習(xí)庫(kù)來(lái)進(jìn)行計(jì)算視覺(jué)領(lǐng)域的數(shù)據(jù)增強(qiáng),比如:imgaug (https://github.com/aleju/imgaug)它封裝了很多數(shù)據(jù)增強(qiáng)算法,給開(kāi)發(fā)者提供了方便。

計(jì)算視覺(jué)數(shù)據(jù)增強(qiáng)

計(jì)算視覺(jué)領(lǐng)域的數(shù)據(jù)增強(qiáng)算法大致可以分為兩類(lèi):第一類(lèi)是基于基本圖像處理技術(shù)技術(shù)的數(shù)據(jù)增強(qiáng),第二個(gè)類(lèi)別是基于深度學(xué)習(xí)的數(shù)據(jù)增強(qiáng)算法。下面先介紹基于基本圖像處理技術(shù)的數(shù)據(jù)增強(qiáng)方法:

1、flipping翻轉(zhuǎn) 一般都是水平方向翻轉(zhuǎn)而少用垂直方向,即鏡像變換。圖像數(shù)據(jù)集上證實(shí)有用(CIFAR-10,ImageNet等),但無(wú)法應(yīng)用在文本識(shí)別數(shù)據(jù)集(MNIST,SVHN等)

2、color space色彩空間 簡(jiǎn)單做法是隔離單個(gè)色彩通道,例如R,G或B,此外可以通過(guò)簡(jiǎn)單的矩陣運(yùn)算以增加或減少圖像的亮度。更高級(jí)的做法從顏色直方圖著手,更改這些直方圖中的強(qiáng)度值(想到了圖像處理中的直方圖均衡)。

3、cropping裁剪 分統(tǒng)一裁剪和隨機(jī)裁剪。統(tǒng)一裁剪將不同尺寸的圖像裁剪至設(shè)定大小,隨機(jī)裁剪類(lèi)似translation,不同之處在于translation保留原圖尺寸而裁剪會(huì)降低尺寸。裁剪要注意不要丟失重要信息以至于改變圖像標(biāo)簽。

4、rotation旋轉(zhuǎn) 要注意旋轉(zhuǎn)度數(shù)。以MNIST為例,輕微旋轉(zhuǎn)(例如1°-20°)可能有用,再往后增加時(shí)數(shù)據(jù)標(biāo)簽可能不再保留。

5、translation位置變換 向左,向右,向上或向下移動(dòng)圖像可能是非常有用的轉(zhuǎn)換,以避免數(shù)據(jù)中的位置偏差。例如人臉識(shí)別數(shù)據(jù)集中人臉基本位于圖像正中,位置變換可以增強(qiáng)模型泛化能力。

6、noise injection添加噪聲 添加高斯分布的隨機(jī)矩陣 7、color space transformations色彩空間增強(qiáng) 照明偏差是圖像識(shí)別問(wèn)題中最常見(jiàn)的挑戰(zhàn)之一,因此色彩空間轉(zhuǎn)換(也稱(chēng)為光度轉(zhuǎn)換)的比較直觀有效。 ①遍歷圖像以恒定值減少或增加像素值(過(guò)亮或過(guò)暗) ②拼接出(splice out)各個(gè)RGB顏色矩陣 ③將像素值限制為某個(gè)最小值或最大值 ④操作色彩直方圖以改變圖像色彩空間特征 注意將彩色圖轉(zhuǎn)換黑白雖然簡(jiǎn)化了這些操作,但精度會(huì)降低 geometric versus photometric transformations幾何與光度轉(zhuǎn)換

1、kernel flters內(nèi)核過(guò)濾器 平滑和銳化,即圖像處理中用卷積核滑過(guò)整幅圖像的操作。這一點(diǎn)尚未開(kāi)發(fā),它和CNN中卷積機(jī)制非常相似(就一樣啊),因此可以通過(guò)調(diào)整網(wǎng)絡(luò)參數(shù)更好地改善網(wǎng)絡(luò),而不需要額外進(jìn)行這樣的數(shù)據(jù)增強(qiáng)操作。

2、mixing images圖像混合 做法是通過(guò)平均圖像像素值將圖像混合在一起:

51130fb6-6a45-11ed-8abf-dac502259ad0.jpg

mixing images 研究發(fā)現(xiàn)是當(dāng)混合來(lái)自整個(gè)訓(xùn)練集的圖像而不是僅來(lái)自同一類(lèi)別的實(shí)例的圖像時(shí),可以獲得更好的結(jié)果。其它一些做法: ①一種非線(xiàn)性方法將圖像組合成新的訓(xùn)練實(shí)例:

512a9492-6a45-11ed-8abf-dac502259ad0.jpg

非線(xiàn)性方法 ②另一方法是隨機(jī)裁剪圖像并將裁剪后的圖像連接在一起以形成新圖像:

514b3274-6a45-11ed-8abf-dac502259ad0.jpg

隨機(jī)裁剪再拼接 這類(lèi)方法從人的視角看毫無(wú)意義,但確實(shí)提升了精度。可能解釋是數(shù)據(jù)集大小的增加導(dǎo)致了諸如線(xiàn)和邊之類(lèi)的低級(jí)特征的更可靠表示。 3、random erasing隨機(jī)擦除 這一點(diǎn)受到dropout正規(guī)化的啟發(fā),隨機(jī)擦除迫使模型學(xué)習(xí)有關(guān)圖像的更多描述性特征,從而防止過(guò)擬合某個(gè)特定視覺(jué)特征。隨機(jī)擦除的好處在于可以確保網(wǎng)絡(luò)關(guān)注整個(gè)圖像,而不只是其中的一部分。最后隨機(jī)擦除的一個(gè)缺點(diǎn)是不一定會(huì)保留標(biāo)簽(例如文本8->6)。

516a1504-6a45-11ed-8abf-dac502259ad0.jpg

三、新方法

新方法控制數(shù)據(jù)增強(qiáng)的保真度,從而減少有害的錯(cuò)誤信息。研究者的想法是通過(guò)顯著性映射測(cè)量圖像中矩形區(qū)域的重要性,并確保數(shù)據(jù)增強(qiáng)后始終呈現(xiàn)得分最高的區(qū)域:對(duì)于裁剪,通過(guò)避免切割重要區(qū)域(見(jiàn)下圖a5和b5);對(duì)于圖像級(jí)轉(zhuǎn)換,通過(guò)將重要區(qū)域粘貼到轉(zhuǎn)換圖像頂部(參見(jiàn)下圖a6和b6)。

517e008c-6a45-11ed-8abf-dac502259ad0.png

51a5b636-6a45-11ed-8abf-dac502259ad0.png

Eq2:

51b99070-6a45-11ed-8abf-dac502259ad0.png

Eq3:

51ca5f5e-6a45-11ed-8abf-dac502259ad0.png

51d8f6ae-6a45-11ed-8abf-dac502259ad0.png

51ec5e42-6a45-11ed-8abf-dac502259ad0.png

四、實(shí)驗(yàn)

521c0688-6a45-11ed-8abf-dac502259ad0.png

522987f4-6a45-11ed-8abf-dac502259ad0.png

523a09bc-6a45-11ed-8abf-dac502259ad0.png

52594250-6a45-11ed-8abf-dac502259ad0.png

526a106c-6a45-11ed-8abf-dac502259ad0.png

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4824

    瀏覽量

    106712
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    37974

    瀏覽量

    295810

原文標(biāo)題:檢測(cè)&分類(lèi)訓(xùn)練技巧,不是所有的數(shù)據(jù)增強(qiáng),都可以提升算法精度!

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    用于高速成像,科學(xué)和太陽(yáng)蛋白紫外線(xiàn)應(yīng)用的圖像增強(qiáng)器解決方案

    圖像增強(qiáng)器用于增強(qiáng)低照度圖像,直至單光子的檢測(cè)和成像。Photonis 是 Exosens 的一部分,為科學(xué)應(yīng)用 (IIT) 提供各種圖像
    的頭像 發(fā)表于 11-19 07:36 ?28次閱讀
    用于高速成像,科學(xué)和太陽(yáng)蛋白紫外線(xiàn)應(yīng)用的<b class='flag-5'>圖像</b><b class='flag-5'>增強(qiáng)</b>器解決方案

    圖像采集卡:機(jī)器視覺(jué)時(shí)代的圖像數(shù)據(jù)核心樞紐

    一、圖像采集卡的技術(shù)本質(zhì):從信號(hào)到數(shù)據(jù)的“轉(zhuǎn)換器”與“傳輸通道”圖像采集卡(ImageCaptureCard)是機(jī)器視覺(jué)系統(tǒng)的核心硬件組件,本質(zhì)是通過(guò)專(zhuān)用芯片(如FPGA、ASIC)實(shí)
    的頭像 發(fā)表于 11-12 15:15 ?248次閱讀
    <b class='flag-5'>圖像</b>采集卡:機(jī)器視覺(jué)時(shí)代的<b class='flag-5'>圖像</b><b class='flag-5'>數(shù)據(jù)</b>核心樞紐

    數(shù)據(jù)預(yù)處理軟核加速模塊設(shè)計(jì)

    ,如果用ARM處理器或上位機(jī)來(lái)實(shí)現(xiàn)這個(gè)過(guò)程會(huì)十分耗時(shí),利用FPGA的并行處理技術(shù)可以輕易實(shí)現(xiàn)這個(gè)功能,整理后的數(shù)據(jù)傳輸形式會(huì)為之后的設(shè)計(jì)產(chǎn)生便利。模塊用了20塊片內(nèi)雙口RAM來(lái)實(shí)現(xiàn)
    發(fā)表于 10-29 08:09

    基于FPGA的CLAHE圖像增強(qiáng)算法設(shè)計(jì)

    CLAHE圖像增強(qiáng)算法又稱(chēng)為對(duì)比度有限的自適應(yīng)直方圖均衡算法,其算法原理是通過(guò)有限的調(diào)整圖像局部對(duì)比度來(lái)增強(qiáng)有效信號(hào)和抑制噪聲信號(hào)。
    的頭像 發(fā)表于 10-15 10:14 ?362次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b><b class='flag-5'>增強(qiáng)</b>算法設(shè)計(jì)

    Photonis圖像增強(qiáng)器:技術(shù)原理、核心優(yōu)勢(shì)與應(yīng)用領(lǐng)域

    Photonis是一家全球領(lǐng)先的光電傳感器與夜視技術(shù)制造商,總部位于荷蘭,專(zhuān)注于高性能圖像增強(qiáng)器、光電倍增管(PMT)和微通道板(MCP)的研發(fā)與生產(chǎn)。其產(chǎn)品廣泛應(yīng)用于科研、醫(yī)療和工業(yè)領(lǐng)域,尤其在低
    的頭像 發(fā)表于 10-10 09:28 ?259次閱讀
    Photonis<b class='flag-5'>圖像</b><b class='flag-5'>增強(qiáng)</b>器:<b class='flag-5'>技術(shù)</b>原理、核心優(yōu)勢(shì)與應(yīng)用領(lǐng)域

    Photonis 科學(xué)圖像增強(qiáng)介紹

    對(duì)于尋求先進(jìn)圖像增強(qiáng)技術(shù)增強(qiáng)相機(jī)制造商,Photonis 提供具有無(wú)與倫比規(guī)格的科學(xué)級(jí)圖像增強(qiáng)
    的頭像 發(fā)表于 09-19 09:20 ?214次閱讀
    Photonis 科學(xué)<b class='flag-5'>圖像</b><b class='flag-5'>增強(qiáng)</b>器<b class='flag-5'>介紹</b>

    FPGA 加持,友思特圖像采集卡高速預(yù)處理助力視覺(jué)系統(tǒng)運(yùn)行提速增效

    圖像預(yù)處理圖像處理關(guān)鍵環(huán)節(jié),可優(yōu)化數(shù)據(jù)傳輸、減輕主機(jī)負(fù)擔(dān),其算法可在FPGA等硬件上執(zhí)行。友思特FPGA
    的頭像 發(fā)表于 08-13 17:41 ?758次閱讀
    FPGA 加持,友思特<b class='flag-5'>圖像</b>采集卡高速預(yù)<b class='flag-5'>處理</b>助力視覺(jué)系統(tǒng)運(yùn)行提速增效

    龍門(mén)吊箱號(hào)識(shí)別系統(tǒng)的圖像處理技術(shù)解析

    識(shí)別系統(tǒng)應(yīng)運(yùn)而生,成為提升龍門(mén)吊作業(yè)自動(dòng)化水平的重要解決方案。 核心技術(shù)圖像處理與深度學(xué)習(xí)的融合 1. 高精度圖像采集 系統(tǒng)采用工業(yè)級(jí)高清攝像機(jī),具備寬動(dòng)態(tài)范圍(HDR)和低照度
    的頭像 發(fā)表于 03-25 10:25 ?555次閱讀

    基于嵌入式人工智能的高速圖像處理的微處理器RZ/A2M數(shù)據(jù)手冊(cè)

    RZ/A2M MPU設(shè)計(jì)用于需要高速e-AI圖像處理的智能電器,網(wǎng)絡(luò)攝像機(jī),服務(wù)機(jī)器人,掃描儀產(chǎn)品和工業(yè)機(jī)械。它采用獨(dú)特的圖像識(shí)別和機(jī)器視覺(jué)混合方法,結(jié)合了專(zhuān)有的DRP
    的頭像 發(fā)表于 03-11 15:54 ?824次閱讀
    基于嵌入式人工智能的高速<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的微<b class='flag-5'>處理</b>器RZ/A2M<b class='flag-5'>數(shù)據(jù)</b>手冊(cè)

    圖像采集卡:現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

    在現(xiàn)代科技快速發(fā)展的背景下,圖像處理技術(shù)已成為信息技術(shù)領(lǐng)域不可或缺的一部分。圖像采集卡,作為連接計(jì)算機(jī)與各種
    的頭像 發(fā)表于 02-20 10:42 ?884次閱讀
    <b class='flag-5'>圖像</b>采集卡:現(xiàn)代<b class='flag-5'>圖像</b><b class='flag-5'>處理</b><b class='flag-5'>技術(shù)</b>的關(guān)鍵組件

    FPGA上的圖像處理算法集成與優(yōu)化

    本文詳細(xì)介紹了多種圖像處理技術(shù),包括RG/GB單通道提取、亮度和對(duì)比度調(diào)整、圖像反轉(zhuǎn)、均值濾波、高斯濾波、
    的頭像 發(fā)表于 02-14 13:46 ?1125次閱讀
    FPGA上的<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>算法集成與優(yōu)化

    FPGA圖像處理基礎(chǔ)----實(shí)現(xiàn)緩存卷積窗口

    素行進(jìn)行緩存與變換。由于在圖像處理過(guò)程中,經(jīng)常會(huì)使用到卷積,因此需要對(duì)圖像進(jìn)行開(kāi)窗,然后將開(kāi)窗得到的局部圖像與卷積核進(jìn)行卷積,從而完成處理。
    的頭像 發(fā)表于 02-07 10:43 ?1395次閱讀
    FPGA<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>基礎(chǔ)----實(shí)現(xiàn)緩存卷積窗口

    DFT在圖像處理中的作用 DFT在音頻信號(hào)處理中的應(yīng)用

    處理中的幾個(gè)主要作用: 頻域?yàn)V波 :DFT允許我們分析圖像的頻率成分,從而可以設(shè)計(jì)濾波器來(lái)增強(qiáng)或抑制特定頻率的信號(hào),例如低通濾波器可以減少圖像噪聲,而高通濾波器可以
    的頭像 發(fā)表于 12-20 09:18 ?1820次閱讀

    傅立葉變換在圖像處理中的作用

    傅里葉變換在圖像處理中發(fā)揮著至關(guān)重要的作用。以下是傅里葉變換在圖像處理中的幾個(gè)主要作用: 一、圖像增強(qiáng)
    的頭像 發(fā)表于 12-06 16:55 ?3043次閱讀

    百問(wèn)FB顯示開(kāi)發(fā)圖像處理 - PNG圖像處理

    2.3 PNG圖像處理 2.3.1 PNG文件格式和libpng編譯 ?跟JPEG文件格式一樣,PNG也是一種使用了算法壓縮后的圖像格式,與JPEG不同,PNG使用從LZ77派生的無(wú)損數(shù)據(jù)
    發(fā)表于 12-02 09:25