影音先锋色制服丝袜无码,极品女神魔鬼身材正在播放,欧美精品爽一夜在线观看

在圖像和物體識別方面，計算機表現(xiàn)優(yōu)于人類。

像Google和Microsoft這樣的大公司在圖像識別方面已經(jīng)超越了人類基準[1，2]。平均而言，人類大約有5％的時間在圖像識別任務(wù)上犯了錯誤。截至2015年，微軟的圖像識別軟件的錯誤率達到4.94％，與此同時，谷歌宣布其軟件的錯誤率降低到4.8％[3]

這是怎么做到的？

這可以通過在包含數(shù)百個對象類別、數(shù)百萬個訓練樣本的ImageNet數(shù)據(jù)集上訓練深度卷積神經(jīng)網(wǎng)絡(luò)來實現(xiàn)[1]。

百萬訓練數(shù)據(jù)！

例如，要教計算機從多個角度識別出一只貓貓，可能需要成千上萬張涵蓋不同角度的照片。

成功訓練計算機視覺任務(wù)的深層卷積神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)。這是因為這些神經(jīng)網(wǎng)絡(luò)具有多個隱藏的處理層，并且隨著層數(shù)的增加，需要學習的樣本數(shù)也隨之增加。如果沒有足夠的訓練數(shù)據(jù)，則該模型往往會很好地學習訓練數(shù)據(jù)，這稱為過度擬合。如果模型過擬合，則其泛化能力很差，因此對未見的數(shù)據(jù)的表現(xiàn)很差。

但是，如果沒有大量的訓練數(shù)據(jù)怎么辦？

對于我們手頭的所有圖像識別任務(wù)，并不是都會擁有數(shù)百萬個訓練樣本。對于某些任務(wù)，收集成千上萬個樣本圖像甚至是一個挑戰(zhàn)。對于醫(yī)學圖像而言通常是這種情況，例如用于乳房癌檢測和定位的乳房X線照相術(shù)，用于肺癌檢測的胸部X射線或用于定位腦腫瘤的MRI掃描。

這可以歸結(jié)為一個問題：當我們只有有限的數(shù)據(jù)時，我們?nèi)绾斡柧毮軌蚝芎玫赝瓿蛇@些任務(wù)的模型？

使用數(shù)據(jù)增強（data augmentation)生成更多訓練數(shù)據(jù)

當我們只有少量圖像數(shù)據(jù)用于訓練深度卷積神經(jīng)網(wǎng)絡(luò)時，我們可以使用數(shù)據(jù)增強技術(shù)從已經(jīng)擁有的圖像數(shù)據(jù)中生成更多訓練數(shù)據(jù)。

數(shù)據(jù)增強是一種為原始圖像生成多個圖像的技術(shù)。有幾種不同的數(shù)據(jù)增強技術(shù)，Mikolajczyk和Grochowski在他們的論文中[4]將這些技術(shù)分為兩個子類別：使用基本圖像處理的數(shù)據(jù)增強和使用深度學習方法的數(shù)據(jù)增強。

幾何變換

諸如翻轉(zhuǎn)(Flip)，裁剪(Crop)，旋轉(zhuǎn)(Rotation)和移位(Translation)之類的幾何變換是一些常用的數(shù)據(jù)增強技術(shù)。我們將在本文中簡要討論它們。

翻轉(zhuǎn)

翻轉(zhuǎn)是取任意給定圖像的鏡像。它是最簡單的增強技術(shù)之一。圖像可以水平或垂直翻轉(zhuǎn)。但是，水平翻轉(zhuǎn)在這兩者之間更為常見。

裁剪

裁剪是一種數(shù)據(jù)增強技術(shù)，用于通過裁剪邊界像素來減小原始圖像的大小。裁剪時不會保留空間尺寸。在這種類型的數(shù)據(jù)增強中，不能保證轉(zhuǎn)換后的圖像與原始圖像屬于相同的輸出標簽。

在上面的圖像中，通過從左右方向裁剪像素，從原始圖像生成了四個圖像。裁剪圖像的尺寸從256x256減小到227x277。

旋轉(zhuǎn)

圖像可以在軸上向左或向右旋轉(zhuǎn)1到359度。1到20度之間的旋轉(zhuǎn)稱為輕微旋轉(zhuǎn)，并且是用于增強原始圖像的有用技術(shù)。隨著旋轉(zhuǎn)度的增加，轉(zhuǎn)換后的數(shù)據(jù)可能無法保留其原始標簽。

移位

翻譯是一種將圖像向左，向右，向上或向下平移的技術(shù)。這是一種非常有用的轉(zhuǎn)換技術(shù)，可以避免數(shù)據(jù)中的位置偏差。移位圖像時，剩余空間將被填充為0，255或被隨機噪聲填充，從而保留了圖像的原始大小。

基于GAN的數(shù)據(jù)增強

生成對抗網(wǎng)絡(luò)（GAN）也稱為GAN，是一種生成建模技術(shù)，其中可以從數(shù)據(jù)集中創(chuàng)建人工實例，從而保留原始集的相似特征[9]。

GAN由兩個相互競爭的人工神經(jīng)網(wǎng)絡(luò)（ANN）組成，即生成器 generator 與判別器 discriminator。生成器創(chuàng)建新的數(shù)據(jù)實例，而判別器則評估它們的真實性[10]。

這是由GAN生成的人臉圖像，這是在人臉上訓練出來的。請注意，這些是合成的面孔，而不是真實的人。

這些是一些數(shù)據(jù)增強技術(shù)，通常用于從有限的數(shù)據(jù)集中生成更多數(shù)據(jù)，從而可以訓練出更有效的卷積神經(jīng)網(wǎng)絡(luò)。

Olaf和他的團隊在訓練數(shù)據(jù)有限的情況下，利用在圖像上的平移、旋轉(zhuǎn)和隨機彈性變換等數(shù)據(jù)增強技術(shù)訓練U-net體系結(jié)構(gòu)模型，并在2015年ISBI細胞追蹤挑戰(zhàn)中以較大優(yōu)勢獲得這些類別的冠軍。

因此，下次在訓練卷積神經(jīng)網(wǎng)絡(luò)時，請使用這些技術(shù)來創(chuàng)建更多數(shù)據(jù)。

你平時使用了哪些數(shù)據(jù)增強技術(shù)？在下面評論分享的想法。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

計算機

計算機

+關(guān)注

關(guān)注
19

文章
7806

瀏覽量
93185
圖像識別

圖像識別

+關(guān)注

關(guān)注
9

文章
533

瀏覽量
40051

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

沒有大量訓練數(shù)據(jù)時怎么生成更多的數(shù)據(jù)

評論