chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

理解如何處理計算機視覺和深度學習中的圖像數(shù)據(jù)

QQ475400555 ? 來源:機器視覺沙龍 ? 2023-04-26 11:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

包括了適用于傳統(tǒng)圖像的數(shù)據(jù)處理和深度學習的數(shù)據(jù)處理。

介紹:

在過去幾年從事多個計算機視覺和深度學習項目之后,我在這個博客中收集了關(guān)于如何處理圖像數(shù)據(jù)的想法。對數(shù)據(jù)進行預處理基本上要比直接將其輸入深度學習模型更好。有時,甚至可能不需要深度學習模型,經(jīng)過一些處理后一個簡單的分類器可能就足夠了。

最大化信號并最小化圖像中的噪聲使得手頭的問題更容易處理。在構(gòu)建計算機視覺系統(tǒng)時,應(yīng)考慮使用濾波器來增強特征并使圖像對光照、顏色變化等更加穩(wěn)健。

考慮到這一點,讓我們探索一些可以幫助解決經(jīng)典計算機視覺或基于圖像的深度學習問題的方法。相關(guān)的代碼倉庫:https://github.com/bikramb98/image_processing。

1. 先簡單再深入:

在應(yīng)用最新和最好的深度學習解決問題之前,請嘗試經(jīng)典的計算機視覺技術(shù)。特別是在數(shù)據(jù)可能稀缺的情況下,就像許多現(xiàn)實世界的問題一樣。

檢查計算圖像像素的統(tǒng)計值(例如均值、峰度、標準差)是否會導致不同類別的統(tǒng)計值不同。然后可以在這些值上訓練一個簡單的分類器,例如 SVM、KNN,以在不同的類之間進行分類。

2. 增加圖像信噪比:

在將它們輸入深度學習模型之前,檢查預處理技術(shù)是否增強了圖像的主要特征并提高了信噪比。這將有助于模型獲得更好的準確性。

使用閾值處理等技術(shù)、腐蝕和膨脹等噪聲消除技術(shù)、高斯模糊(平滑邊緣)和中值模糊(消除椒鹽噪聲)等模糊技術(shù)。

對于不同的問題,不同的運算可能在不同的順序下有用。

通常的做法是多次使用特定運算符,如果可以增強特征,那就在幾個步驟之后再次應(yīng)用。

找到濾波器、閾值等不同kernel大小的最佳組合(其組合可能達到數(shù)百萬?。梢援a(chǎn)生產(chǎn)生最佳效果的圖像,可以通過構(gòu)建交互式滑塊來幫助找到這些值的理想范圍。

3. 直方圖均衡

增強圖像特征的另一種方法是使用直方圖均衡化。直方圖均衡化提高了圖像的對比度。直方圖均衡化的目的是使出現(xiàn)頻率最高的像素值均勻分布。

讓我們看看下面的例子。

d4926f48-e3e5-11ed-ab56-dac502259ad0.jpg

可以看出,上圖的對比度非常低。在這種情況下,重要的是要提高對比度,使圖像的特征更清晰可見。OpenCV 提供了兩種這樣做的技術(shù) —— 直方圖均衡化和對比度受限自適應(yīng)直方圖均衡化 (CLAHE)。

應(yīng)用直方圖均衡化,圖像的對比度確實有所提高。但是,它也會增加圖像中的噪點,如下圖中間所示。

這就是CLAHE 的用武之地。使用這種方法,圖像被分成 m x n 網(wǎng)格,然后將直方圖均衡應(yīng)用于每個網(wǎng)格。可以使用交互式滑塊找到理想的對比度閾值和網(wǎng)格大小,如下所示。

d4b804a6-e3e5-11ed-ab56-dac502259ad0.png

用于查找最佳閾值和圖塊大小值的交互式滑塊

d4db6edc-e3e5-11ed-ab56-dac502259ad0.png

從左到右:原始圖像、直方圖均衡圖像、CLAHE 后圖像

4. 圖像的顏色空間變換:

將圖像轉(zhuǎn)換到不同的顏色空間,例如 HSV,通常可以提供更好的信息來分割目標,用于目標跟蹤等情況。通常,RGB 顏色空間對陰影、光照的輕微變化(影響目標的顏色)不穩(wěn)健。對于使用經(jīng)典計算機視覺進行目標跟蹤等任務(wù),由于上述原因,在稍有不同的環(huán)境中使用時,RGB 空間中經(jīng)過調(diào)試的mask通常會失敗。此外,一旦將圖像轉(zhuǎn)換為不同的空間(例如 HSV),分離通道通常有助于分割感興趣的區(qū)域并消除噪聲。如下圖所示,一旦將圖像轉(zhuǎn)換為 HSV 空間并拆分通道,就可以更輕松地去除陰影并分割網(wǎng)球。

d4e5b428-e3e5-11ed-ab56-dac502259ad0.png

不同的顏色空間(RGB、HSV)及其分量拆分

5. 歸一化圖像:

如果將圖像輸入深度學習模型,則必須使用批歸一化等技術(shù)對圖像進行歸一化,這將有助于標準化網(wǎng)絡(luò)的輸入。這將有助于網(wǎng)絡(luò)學習得更快、更穩(wěn)定。批量歸一化有時也會減少泛化誤差。

6. 進行有意義的增強:

在增強圖像時,確保應(yīng)用的增強技術(shù)保留圖像的類別并且類似于現(xiàn)實世界中遇到的數(shù)據(jù)。例如,對狗的圖像應(yīng)用裁剪增強可能會導致增強后的圖像不像狗。在某些目標使用旋轉(zhuǎn)和翻轉(zhuǎn)進行增強的情況下也是如此。在增強時更改圖像屬性(例如顏色)時要非常小心。此外,請確保擴充數(shù)據(jù)不會更改圖像的標簽

始終檢查增強圖像是否有意義并反映現(xiàn)實世界。

d50d026c-e3e5-11ed-ab56-dac502259ad0.png

隨機裁剪等增強如何導致數(shù)據(jù)損壞的示例

7. 訓練集和驗證集的數(shù)據(jù)泄露:

確保相同的圖像(比如原始圖像和增強圖像)不在訓練集和驗證集中同時出現(xiàn)是很重要的。這通常發(fā)生在訓練驗證集拆分之前就執(zhí)行數(shù)據(jù)增強。忽略這一點可能會導致給出錯誤的模型指標,因為它會在訓練期間從非常相似的圖像中學習,這些圖像也存在于驗證集中。

8. 在測試集合驗證集上需要包括所有類別:

確保測試集和驗證集包含所有標簽樣本。這樣模型指標反映的才是模型的真實表現(xiàn)。

以其中一個標簽的樣本數(shù)量明顯較少的情況為例。執(zhí)行隨機訓練集測試集拆分可能會導致更少標簽的類根本不會出現(xiàn)在驗證/測試集中。當訓練好的模型被測試時,它不會在那個特定的類上被測試,模型指標也不會反映其性能的真實表現(xiàn)。

9. 后處理完整性檢查:

模型訓練好之后,執(zhí)行一些完整性檢查也很重要:

確保在多類分類器的情況下所有類的輸出總和為 1。

確保在測試或部署模型時也應(yīng)用訓練期間應(yīng)用于圖像的預處理。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1708

    瀏覽量

    46774
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122793

原文標題:理解如何處理計算機視覺和深度學習中的圖像數(shù)據(jù)

文章出處:【微信號:機器視覺沙龍,微信公眾號:機器視覺沙龍】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    計算機視覺/深度學習領(lǐng)域常用數(shù)據(jù)集匯總

    、定位、檢測等研究工作大多基于此數(shù)據(jù)集展開。Imagenet數(shù)據(jù)集文檔詳細,有專門的團隊維護,使用非常方便,在計算機視覺領(lǐng)域研究論文中應(yīng)用非常廣,幾乎成為了目前
    發(fā)表于 08-29 10:36

    請問計算機視覺深度學習要看什么書?

    計算機視覺深度學習,看這本書就夠了
    發(fā)表于 05-21 12:43

    深度學習與傳統(tǒng)計算機視覺簡介

    文章目錄1 簡介1.1 深度學習與傳統(tǒng)計算機視覺1.2 性能考量1.3 社區(qū)支持2 結(jié)論3 參考在計算機
    發(fā)表于 12-23 06:17

    深度學習是否會取代傳統(tǒng)的計算機視覺?

    理解傳統(tǒng)的計算機視覺實際上真的有助于你更好的使用深度學習。例如,計算機
    的頭像 發(fā)表于 04-02 10:37 ?6441次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>是否會取代傳統(tǒng)的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>?

    深度學習計算機視覺上的四大應(yīng)用

    計算機視覺中比較成功的深度學習的應(yīng)用,包括人臉識別,圖像問答,物體檢測,物體跟蹤。
    的頭像 發(fā)表于 08-24 16:16 ?5255次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學習</b>在<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>上的四大應(yīng)用

    如何快速學習計算機視覺圖像的分類

    前言:計算機視覺是一門將圖像和視頻轉(zhuǎn)換成機器可理解信號的學科,有了這些信號,程序員可以基于這種高階進一步控制機器的行為。在計算機
    發(fā)表于 12-04 22:10 ?8次下載
    如何快速<b class='flag-5'>學習</b><b class='flag-5'>計算機</b><b class='flag-5'>視覺</b><b class='flag-5'>圖像</b>的分類

    深度學習圖像分割的方法和應(yīng)用

    分析和分類以及機器人和自動駕駛車輛的圖像處理等應(yīng)用上。 許多計算機視覺任務(wù)需要對圖像進行智能分割,以理解
    的頭像 發(fā)表于 11-27 10:29 ?3564次閱讀

    用于計算機視覺訓練的圖像數(shù)據(jù)

    ? 計算機視覺使計算機能夠理解圖像和視頻的內(nèi)容。計算機視覺
    的頭像 發(fā)表于 12-31 09:33 ?2638次閱讀

    用于計算機視覺訓練的圖像數(shù)據(jù)

    計算機視覺使計算機能夠理解圖像和視頻的內(nèi)容。計算機視覺
    的頭像 發(fā)表于 02-12 16:13 ?1630次閱讀

    機器學習計算機視覺的前20個圖像數(shù)據(jù)

    計算機視覺使計算機能夠理解圖像和視頻的內(nèi)容。計算機視覺
    發(fā)表于 01-28 07:40 ?5次下載
    機器<b class='flag-5'>學習</b>和<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的前20個<b class='flag-5'>圖像</b><b class='flag-5'>數(shù)據(jù)</b>集

    計算機視覺的九種深度學習技術(shù)

    計算機視覺仍有許多具有挑戰(zhàn)性的問題需要解決。然而,深度學習方法正在針對某些特定問題取得最新成果。 在最基本的問題上,最有趣的不僅僅是
    發(fā)表于 08-21 09:56 ?974次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b><b class='flag-5'>中</b>的九種<b class='flag-5'>深度</b><b class='flag-5'>學習</b>技術(shù)

    計算機視覺:AI如何識別與理解圖像

    計算機視覺是人工智能領(lǐng)域的一個重要分支,它致力于讓機器能夠像人類一樣理解和解釋圖像。隨著深度學習
    的頭像 發(fā)表于 01-12 08:27 ?2089次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>:AI如何識別與<b class='flag-5'>理解</b><b class='flag-5'>圖像</b>

    計算機視覺的主要研究方向

    計算機視覺(Computer Vision, CV)作為人工智能領(lǐng)域的一個重要分支,致力于使計算機能夠像人眼一樣理解和解釋圖像和視頻
    的頭像 發(fā)表于 06-06 17:17 ?1844次閱讀

    深度學習計算機視覺領(lǐng)域的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學習作為其中的核心技術(shù)之一,已經(jīng)在計算機視覺領(lǐng)域取得了顯著的成果。計算機
    的頭像 發(fā)表于 07-01 11:38 ?1788次閱讀

    計算機視覺圖像處理的區(qū)別和聯(lián)系

    數(shù)據(jù)的過程。計算機視覺的目標是使計算機能夠像人類一樣“看到”和理解圖像或視頻內(nèi)容。 1.2
    的頭像 發(fā)表于 07-09 09:16 ?2252次閱讀