圖像分割是根據(jù)圖像內(nèi)容對(duì)指定區(qū)域進(jìn)行標(biāo)記的計(jì)算機(jī)視覺任務(wù),簡(jiǎn)言之就是“這張圖片里有什么,其在圖片中的位置是什么?”本文聚焦于語義分割任務(wù),即在分割圖中將同一類別的不同實(shí)例視為同一對(duì)象。
更具體地講,語義圖像分割的目標(biāo)在于標(biāo)記圖片中每一個(gè)像素,并將每一個(gè)像素與其表示的類別對(duì)應(yīng)起來。因?yàn)闀?huì)預(yù)測(cè)圖像中的每一個(gè)像素,所以一般將這樣的任務(wù)稱為密集預(yù)測(cè)。
語義分割的例子,目標(biāo)是預(yù)測(cè)圖像中每一個(gè)像素的類別標(biāo)簽。
當(dāng)我們有越來越多要用機(jī)器執(zhí)行的任務(wù)時(shí),為這些機(jī)器配備必需的感知器是很重要的。
自動(dòng)駕駛中實(shí)時(shí)語義分割道路場(chǎng)景
還有一點(diǎn)要注意的是我們不會(huì)分割同一類別的實(shí)例,只需要關(guān)注每一個(gè)像素的類別。換句話講,如果在輸入圖像中有兩個(gè)目標(biāo)屬于同一類,分割映射不會(huì)將其分為單獨(dú)的兩個(gè)目標(biāo)。
相對(duì)地,實(shí)例分割模型是另一種不同的模型,該模型可以區(qū)分同一類的不同目標(biāo)。
任務(wù)表征
簡(jiǎn)單地說,我們的目標(biāo)是要用 RGB 圖(高 x 寬 x3)或灰度圖(高 x 寬 x1)為輸入,并輸出一個(gè)分割圖,在分割圖中每個(gè)像素都包括一個(gè)用整數(shù)表示的類別標(biāo)簽(高 x 寬 x1)。
注意:為了視覺上的理解簡(jiǎn)單起見,我標(biāo)記的是分辨率比較低的預(yù)測(cè)圖。事實(shí)上,分割標(biāo)簽的分辨率是和原始輸入圖的分辨率相對(duì)應(yīng)的。
與我們處理標(biāo)準(zhǔn)分類值的方法相似,我們通過獨(dú)熱編碼類別標(biāo)簽的方法創(chuàng)建目標(biāo)——本質(zhì)上講是要為每一個(gè)可能的類創(chuàng)建一個(gè)輸出通道。
然后我們可以利用每一個(gè)像素位深向量的 argmax 函數(shù)將預(yù)測(cè)值分解為分割映射(如上圖所示)。
也可以通過將目標(biāo)重疊在輸入圖像上來對(duì)目標(biāo)進(jìn)行觀察。
建立網(wǎng)絡(luò)架構(gòu)
針對(duì)這項(xiàng)任務(wù)簡(jiǎn)單地構(gòu)建神經(jīng)網(wǎng)絡(luò)架構(gòu)的方法是簡(jiǎn)單地堆疊大量卷積層(用 same 填充保留維度)后輸出最終的分割映射。通過特征圖的接連轉(zhuǎn)換,直接從輸入圖像學(xué)到了相對(duì)應(yīng)的分割映射;然而,在整個(gè)網(wǎng)絡(luò)中要保留完整分辨率的計(jì)算成本是很高的。
回顧深度卷積網(wǎng)絡(luò),前期的卷積層更傾向于學(xué)習(xí)低級(jí)概念,而后期的卷積層則會(huì)產(chǎn)生更高級(jí)(且專一)的特征圖。為了保持表達(dá)性,一般而言,當(dāng)我們到達(dá)更深層的網(wǎng)絡(luò)時(shí),需要增加特征圖(通道)的數(shù)量。
對(duì)圖像分類任務(wù)而言,這不一定會(huì)造成什么問題,因?yàn)閷?duì)這個(gè)任務(wù)而言,我們只需要關(guān)注圖像里面有什么(而不是目標(biāo)類別對(duì)象的位置)。因此,我們可以通過池化或逐步卷積(即壓縮空間分辨率)定期對(duì)特征圖進(jìn)行下采樣以緩和計(jì)算壓力。
常用的圖像分割模型的方法遵循編碼器/解碼器結(jié)構(gòu),在這個(gè)結(jié)構(gòu)中,我們對(duì)輸入的空間分辨率下采樣,產(chǎn)生分辨率更低的特征圖,通過學(xué)習(xí)這些特征圖可以更高效地分辨類別,還可以將這些特征表征上采樣至完整分辨率的分割圖。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4827瀏覽量
106797 -
計(jì)算機(jī)
+關(guān)注
關(guān)注
19文章
7764瀏覽量
92682
發(fā)布評(píng)論請(qǐng)先 登錄
卷積神經(jīng)網(wǎng)絡(luò)一維卷積的處理過程
卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用
聚焦語義分割任務(wù),如何用卷積神經(jīng)網(wǎng)絡(luò)處理語義圖像分割?
分析總結(jié)基于深度神經(jīng)網(wǎng)絡(luò)的圖像語義分割方法
基于深度神經(jīng)網(wǎng)絡(luò)的圖像語義分割方法

如何用卷積神經(jīng)網(wǎng)絡(luò)處理語義圖像分割
評(píng)論