圖像分割是計算計視覺研究中的經(jīng)典難題,已成為圖像理解領(lǐng)域關(guān)注的一個熱點(diǎn),
圖像分割作為圖像技術(shù)領(lǐng)域的一個經(jīng)典難題,自上世紀(jì)七十年代以來吸引了眾多研究人員的研究熱情并為之付出了巨大努力,提出了很多圖像分割算法。這些分割算法分割性能的優(yōu)劣,是用相關(guān)圖像分割質(zhì)量測度來進(jìn)行評價的。但由于對算法分割是否成功的客觀判定標(biāo)準(zhǔn)至今未得到解決,因此圖像分割算法分割質(zhì)量得評價成為一項(xiàng)頗具研究意義的課題。有關(guān)圖像分割評價的方法已有少數(shù)的初步探討,但目前仍未有很好的歸納和整理。這不僅和圖像分割技術(shù)的研究應(yīng)用現(xiàn)狀不相稱,也不利于圖像分割技術(shù)的發(fā)展。
圖像分割是圖像分析的第一步,是計算機(jī)視覺的基礎(chǔ),是圖像理解的重要組成部分,同時也是圖像處理中最困難的問題之一。所謂圖像分割是指根據(jù)灰度、彩色、空間紋理、幾何形狀等特征把圖像劃分成若干個互不相交的區(qū)域,使得這些特征在同一區(qū)域內(nèi)表現(xiàn)出一致性或相似性,而在不同區(qū)域間表現(xiàn)出明顯的不同。簡單的說就是在一副圖像中,把目標(biāo)從背景中分離出來。對于灰度圖像來說,區(qū)域內(nèi)部的像素一般具有灰度相似性,而在區(qū)域的邊界上一般具有灰度不連續(xù)性。 關(guān)于圖像分割技術(shù),由于問題本身的重要性和困難性,從20世紀(jì)70年代起圖像分割問題就吸引了很多研究人員為之付出了巨大的努力。雖然到目前為止,還不存在一個通用的完美的圖像分割的方法,但是對于圖像分割的一般性規(guī)律則基本上已經(jīng)達(dá)成的共識,已經(jīng)產(chǎn)生了相當(dāng)多的研究成果和方法。
圖像分割是指將圖像中感興趣區(qū)域(ROI)的邊界找到,使得邊界內(nèi)部和外部的像素分別具備相似的特征(強(qiáng)度、紋理等)。醫(yī)學(xué)圖像分割是對醫(yī)學(xué)圖像進(jìn)行其他后續(xù)處理的基礎(chǔ)。對圖像中目標(biāo)區(qū)域的準(zhǔn)確分割對于計算機(jī)輔助診斷、制訂手術(shù)計劃、目標(biāo)3維重建以及放射性治療評價等都具有重要意義。近幾十年來,隨著醫(yī)學(xué)成像設(shè)備的不斷完善,醫(yī)學(xué)圖像的分割算法也層出不窮,但是很少能夠在臨床上得到廣泛應(yīng)用。用一個全面的醫(yī)學(xué)圖像數(shù)據(jù)集合來客觀評價醫(yī)學(xué)圖像分割算法是將該算法向臨床應(yīng)用推進(jìn)的關(guān)鍵一步
傳統(tǒng)的圖像分割方法
基于閥值的圖像分割方法
閥值分割法是一種傳統(tǒng)的圖像分割方法,因其實(shí)現(xiàn)簡單、計算量小、性能較穩(wěn)定而成為圖像分割中最基本和應(yīng)用最廣泛的分割技術(shù)。閥值分割法的基本原理是通過設(shè)定不同的特征閥值,把圖像像素點(diǎn)分為具有不同灰度級的目標(biāo)區(qū)域和背景區(qū)域的若干類。它特別適用于目標(biāo)和背景占據(jù)不同灰度級范圍的圖,目前在圖像處理領(lǐng)域被廣泛應(yīng)用,其中閥值的選取是圖像閥值分割中的關(guān)鍵技術(shù)。
灰度閥值分割方法是一種最常用的并行區(qū)域技術(shù),是圖像分割中應(yīng)用數(shù)量最多的一類。圖像若只用目標(biāo)和背景兩大類,那么只需要選取一個閥值,此分割方法稱為單閥值分割。單閥值分割實(shí)際上是輸入圖像f到輸出圖像g的如下變換:

在上述表達(dá)式中,T為閥值,對于目標(biāo)物體的圖像元素g(i,j)=1,對于背景的圖像元素g(i,j)=0。但是如果圖像中有多個目標(biāo)需要提取,單一的閥值分割就會出錯。就需要選取多個閥值將每個目標(biāo)分割開,這種分割方法稱為多閥值分割。
閥值分割的結(jié)果取決于閥值的選擇。由此可見,閥值分割算法的關(guān)鍵是確定閥值。閥值確定后,將閥值與像素點(diǎn)的灰度值比較以及對各像素的分割并行地進(jìn)行。常用的閥值選擇方法有利用圖像灰度直方圖的峰谷法、最小誤差法、基于過渡區(qū)法、利用像素點(diǎn)空間位置信息的變化閥值法、結(jié)合連通信息的閥值方法、最大相關(guān)性原則選擇閥值和最大熵原則自動閥值法。
圖1是利用單閥值方法和局部閥值方法對細(xì)胞圖像分隔的結(jié)果,結(jié)果表明,在很多情況下,目標(biāo)物體和背景的對比度在圖像的不同位置并不是一樣的,這是如果用一個統(tǒng)一的單閥值將目標(biāo)與背景分開,效果是不理想的。如果根據(jù)圖像的局部特征分別用不同的閥值對圖像進(jìn)行分割,即局部閥值分割,則效果要比單閥值分割要好得多。

閥值分割方法的優(yōu)點(diǎn)是圖像分割的速度快,計算簡單,效率較高。但是這種方法只考慮像素點(diǎn)灰度值本身的特征,一般不考慮空間特征,因此對噪聲比較敏感。雖然目前出現(xiàn)了各種基于閥值分割的改進(jìn)算法,圖像分割的效果有所改進(jìn),但在閥值的設(shè)置上還是沒有很好的解決方法,若將智能遺傳算法應(yīng)用在閥值篩選上,選取能最優(yōu)分割圖像的閥值,這可能是基于閥值分割的圖像分割法的發(fā)展趨勢。
基于區(qū)域的圖像分割方法
基于區(qū)域的分割方法是以直接尋找區(qū)域?yàn)榛A(chǔ)的分割技術(shù),具體算法有區(qū)域生長和區(qū)域分離與合并算法。基于區(qū)域提取方法有兩種基本形式:一種是區(qū)域生長,從單個像素出發(fā),逐步合并以形成所需要的分割區(qū)域;另一種是從全局出發(fā),逐步切割至所需的分割區(qū)域。
區(qū)域生長
區(qū)域生長是串行區(qū)域技術(shù),其分割過程后續(xù)步驟的處理要根據(jù)前面步驟的結(jié)果進(jìn)行判斷而確定。常見的區(qū)域生長算法包括:同倫的區(qū)域生長方式、對稱區(qū)域生長方式和模糊連接度方法與區(qū)域生長相結(jié)合等算法。
區(qū)域生長的基本思想是將具有相似性質(zhì)的像素集合起來構(gòu)成區(qū)域。具體是先對每個需要分割的區(qū)域找一個種子像素點(diǎn)作為生長的起點(diǎn),然后將種子像素周圍領(lǐng)域中與種子像素有相同或相似性質(zhì)的像素合并到種子像素所在的區(qū)域中。將這些新像素當(dāng)作新的種子像素繼續(xù)進(jìn)行上面的過程,直到再沒有滿足條件的像素可被包括進(jìn)來。這樣一個區(qū)域就長成了。
區(qū)域生長的優(yōu)點(diǎn)是計算簡單,對于較均勻的連通目標(biāo)有較好的分割效果。它的缺點(diǎn)是需要人為的選取種子,對噪聲較敏感,可能會導(dǎo)致區(qū)域內(nèi)有空洞。另外它是一種串行算法,當(dāng)目標(biāo)較大時分割速度較慢,因此在算法設(shè)計時應(yīng)盡量提高運(yùn)行效率。
區(qū)域分裂合并
區(qū)域生長是從某個或者某些像素點(diǎn)出發(fā),最后得到整個區(qū)域,進(jìn)而實(shí)現(xiàn)目標(biāo)的提取。而分裂合并可以說是區(qū)域生長的逆過程。它是從整個圖像出發(fā),不斷分裂得到各個子區(qū)域,然后再把前景區(qū)域合并,得到前景目標(biāo),繼而實(shí)現(xiàn)目標(biāo)的提取。分裂合并的假設(shè)是對于一幅圖像,前景區(qū)域是由一些相互連通的像素組成的,因此如果把一幅圖像分裂到像素級,那么就可以判定該像素是否為前景像素。當(dāng)所有像素點(diǎn)或者子區(qū)域完成判斷以后,把前景區(qū)域或者像素合并就可以得到前景目標(biāo)。
四叉樹分解法就是一種典型的區(qū)域分裂合并法。對Lena圖的分割效果如圖2所示。設(shè)R代表整個正方形圖像區(qū)域,P代表邏輯謂詞?;痉至押喜⑺惴ú襟E如下:
?。?)對于任一區(qū)域,如果H(Ri)=FALSE就將其分裂成不重疊的四等分;
(2)對相鄰的兩個區(qū)域Ri和Rj,它們也可以大小不同(即不在同一層),如果條件H(RiURj)=TURE滿足,就將它們合并起來;
?。?)如果進(jìn)一步的分裂或合并都不可能,則結(jié)束。 分裂合并法的關(guān)鍵是分裂合并準(zhǔn)則的設(shè)計。這種方法對復(fù)雜圖像的分割效果較好,但算法較復(fù)雜,計算量大,分裂還可能破壞區(qū)域的邊界。
在實(shí)際應(yīng)用中,通常是將區(qū)域生長算法和區(qū)域分裂合并算法這兩種基本形式結(jié)合使用。該類算法對某些復(fù)雜物體定義的復(fù)雜場景的分割或者對某些自然景物的分割等類似先驗(yàn)知識不足的圖像分割,效果較為理想。
基于邊緣檢測的圖像分割方法
基于邊緣檢測的分割方法試圖通過檢測包含不同區(qū)域的邊緣來解決分割問題,它可以說是人們研究的最多的方法之一。通常不同的區(qū)域之間的邊緣上像素灰度值的變化往往比較劇烈,這是邊緣檢測方法得以實(shí)現(xiàn)的主要假設(shè)之一。邊緣檢測方法一般利用圖像一階導(dǎo)數(shù)的極大值或二階導(dǎo)數(shù)的過零點(diǎn)信息來提供判斷邊緣點(diǎn)的基本依據(jù)。
邊緣檢測技術(shù)通??梢园凑仗幚淼募夹g(shù)分為串行邊緣檢測和并行邊緣檢測。串行邊緣檢測是要想確定當(dāng)前像素點(diǎn)是否屬于檢測邊緣上的一點(diǎn),取決于先前像素的驗(yàn)證結(jié)果。并行邊緣檢測是一個像素點(diǎn)是否屬于檢測邊緣上的一點(diǎn)取決于當(dāng)前正在檢測的像素點(diǎn)以及與該像素點(diǎn)的一些相鄰像素點(diǎn)。
最簡單的邊緣檢測方法是并行微分算子法,它利用相鄰區(qū)域的像素值不連續(xù)的性質(zhì),采用一階或二階導(dǎo)數(shù)來檢測邊緣點(diǎn)。近年來還提出了基于曲面擬合的方法、基于邊界曲線擬合的方法、基于反應(yīng)-擴(kuò)散方程的方法、串行邊界查找、基于變形模型的方法。
常用的一階導(dǎo)數(shù)算子有梯度算子、Prewitt算子和Sobel算子。二階導(dǎo)數(shù)算子有Laplacian算子、Kirsch算子和Wallis算子。
圖3是分別用Sobel、LoG和Canny算子對Lena圖做的邊緣檢測。有圖3可以看出,Canny算子的分割效果比Sobel和LoG算子的好。

雖然邊緣檢測的優(yōu)點(diǎn)是邊緣定位準(zhǔn)確、運(yùn)算速度快,但它有兩大難點(diǎn)限制了其在圖像分割中的應(yīng)用,即:a不能保證邊緣的連續(xù)性和封閉性;b在高細(xì)節(jié)區(qū)存在大量的碎邊緣,難以形成一個大區(qū)域,但是又不宜將高細(xì)節(jié)區(qū)分為小碎片。由于上述兩個難點(diǎn),因此無論采用什么方法,單獨(dú)的邊緣檢測只能產(chǎn)生邊緣點(diǎn),而不是完整意義上的圖像分割過程。這也就是說,邊緣點(diǎn)信息需要后續(xù)處理或與其它相關(guān)算法相結(jié)合,才能完成分割任務(wù)。常用的方法是邊緣生長技術(shù)最大程度的保證邊緣的封閉性,或用有向勢能函數(shù)(DPF)將有缺口的兩邊緣強(qiáng)制連接,得到封閉邊緣圖。
在未來的研究中,用于提取初始邊緣點(diǎn)的自適應(yīng)閥值選取、用于圖像的層次分割的更大區(qū)域的選取以及如何確認(rèn)重要邊緣以去除假邊緣將變得非常重要。
結(jié)合特定工具的圖像分割算法
基于小波分析和小波變換的圖像分割方法
小波變換是近年來得到廣泛應(yīng)用的數(shù)學(xué)工具,它在時域和頻域都具有良好的局部化性質(zhì),能將時域和頻域統(tǒng)一于一體來研究信號。而且小波變換具有多尺度特性,能夠在不同尺度上對信號進(jìn)行分析,因此在圖像分割方面得到了應(yīng)用。
二進(jìn)小波變換具有檢測二元函數(shù)的局部突變能力,因此可作為圖像邊緣檢測工具。圖像的邊緣出現(xiàn)在圖像局部灰度不連續(xù)處,對應(yīng)于二進(jìn)小波變換的模極大值點(diǎn)。通過檢測小波變換模極大值點(diǎn)可以確定圖像的邊緣小波變換位于各個尺度上,而每個尺度上的小波變換都能提供一定的邊緣信息,因此可進(jìn)行多尺度邊緣檢測來得到比較理想的圖像邊緣。圖4是運(yùn)用小波變換方法對圖像進(jìn)行的有效分割。

另外,將小波方法與其他方法結(jié)合起來處理圖像分割也得到廣泛研究。文獻(xiàn)[8]提出把Hilbert圖像掃描方法和小波變換相結(jié)合,獲得了連續(xù)光滑的閥值曲線,從而建立了一種局部自適應(yīng)閥值法進(jìn)行圖像分割。
基于馬兒可夫隨機(jī)場模型的圖像分割方法
馬兒可夫隨機(jī)場(Markov Random Field)方法建立在馬爾可夫模型和Bayes理論基礎(chǔ)上,根據(jù)統(tǒng)計決策和估計理論中的最優(yōu)化準(zhǔn)則確定分割問題的目標(biāo)函數(shù),求解滿足這些約束條件下的最大可能分布,從而將分割問題轉(zhuǎn)化為優(yōu)化問題。MRF最重要的一個特點(diǎn)是,圖像中每個點(diǎn)的取值由其領(lǐng)域像素決定,其本質(zhì)上是一種基于局部區(qū)域的分割方法。
如果我們把圖像理解為定義在矩形點(diǎn)陣上的隨即過程,則Markov性很好的描述了各個像素之間的空間依賴性,即一個像素可以由它周圍的像素確定。而事實(shí)表明,圖像像素的這種空間相關(guān)性總是存在的。因此可以使用馬爾可夫隨機(jī)場對圖像進(jìn)行建模。文獻(xiàn)[9]討論了基于馬爾可夫隨機(jī)場的圖像分割方法,建立了相應(yīng)的基于馬爾可夫隨機(jī)場的圖像分割模型,以實(shí)現(xiàn)復(fù)雜遙感圖像的快速分割,并由此將圖像分割問題轉(zhuǎn)化為圖像標(biāo)記問題,進(jìn)而轉(zhuǎn)化成求解圖像的最大后驗(yàn)概率估計的問題。利用此方法得到的效果圖如圖5、6所示:

基于遺傳算法的圖像分割方法
遺傳算法(Genetic Algorithms,簡稱GA)是1973年由美國教授Holland提出的,是一種借鑒生物界自然選擇和自然遺傳機(jī)制的隨機(jī)化搜索算法。是仿生學(xué)在數(shù)學(xué)領(lǐng)域的應(yīng)用。其基本思想是,模擬由一些基因串控制的生物群體的進(jìn)化過程,把該過程的原理應(yīng)用到搜索算法中,以提高尋優(yōu)的速度和質(zhì)量。此算法的搜索過程不直接作用在變量上,而是在參數(shù)集進(jìn)行了編碼的個體,這使得遺傳算法可直接對結(jié)構(gòu)對象(圖像)進(jìn)行操作。整個搜索過程是從一組解迭代到另一組解,采用同時處理群體中多個個體的方法,降低了陷入局部最優(yōu)解的可能性,并易于并行化。搜索過程采用概率的變遷規(guī)則來指導(dǎo)搜索方向,而不采用確定性搜索規(guī)則,而且對搜索空間沒有任何特殊要求(如連通性、凸性等),只利用適應(yīng)性信息,不需要導(dǎo)數(shù)等其他輔助信息,適應(yīng)范圍廣。
遺傳算法擅長于全局搜索,但局部搜索能力不足,所以常把遺傳算法和其他算法結(jié)合起來應(yīng)用。將遺傳算法運(yùn)用到圖像處理主要是考慮到遺傳算法具有與問題領(lǐng)域無關(guān)且快速隨機(jī)的搜索能力。其搜索從群體出發(fā),具有潛在的并行性,可以進(jìn)行多個個體的同時比較,能有效的加快圖像處理的速度。但是遺傳算法也有其缺點(diǎn):搜索所使用的評價函數(shù)的設(shè)計、初始種群的選擇有一定的依賴性等。要是能夠結(jié)合一些啟發(fā)算法進(jìn)行改進(jìn)且遺傳算法的并行機(jī)制的潛力得到充分的利用,這是當(dāng)前遺傳算法在圖像處理中的一個研究熱點(diǎn)。
基于人工智能的圖像分割方法
基于人工神經(jīng)網(wǎng)絡(luò)的圖像分割方法
在20世紀(jì)80年代后期,在圖像處理、模式識別和計算機(jī)視覺的主流領(lǐng)域,受到人工智能發(fā)展的影響,出現(xiàn)了將更高層次的推理機(jī)制用于識別系統(tǒng)的做法,于是出現(xiàn)了基于人工神經(jīng)網(wǎng)絡(luò)模型(Artificial Neural Networks, ANN)的圖像分割方法。人工神經(jīng)網(wǎng)絡(luò)是由大規(guī)模神經(jīng)元互聯(lián)組成的高度非線性動力系統(tǒng),是在認(rèn)識、理解人腦組織機(jī)構(gòu)和運(yùn)行機(jī)制的基礎(chǔ)上模擬其結(jié)構(gòu)和智能行為的一種工程系統(tǒng)。
基于神經(jīng)網(wǎng)絡(luò)分割的基本思想是:通過訓(xùn)練多層感知機(jī)來得到線性決策函數(shù),然后用決策函數(shù)對像素進(jìn)行分類來達(dá)到分割的目的。近幾年神經(jīng)網(wǎng)絡(luò)在圖像分割中的應(yīng)用按照處理數(shù)據(jù)類型大致上可以分為兩類:一類是基于像素數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法;另一類是基于特征數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)算法也即特征空間的聚類分割方法。基于像素數(shù)據(jù)分割的神經(jīng)網(wǎng)絡(luò)算法用高維的原始圖像數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本,比起基于特征數(shù)據(jù)的算法能夠提供更多的圖像信息,但是各個像素是獨(dú)立處理的,缺乏一定的拓?fù)浣Y(jié)構(gòu)而且數(shù)據(jù)量大,計算速度非常慢,不適合實(shí)時數(shù)據(jù)處理。目前有很多神經(jīng)網(wǎng)絡(luò)算法是基于像素進(jìn)行圖像分割的,如Hopfield神經(jīng)網(wǎng)絡(luò)、細(xì)胞神經(jīng)網(wǎng)絡(luò)、概率自適應(yīng)神經(jīng)網(wǎng)絡(luò)等。
隨著技術(shù)的不斷發(fā)展,第三代脈沖耦合網(wǎng)絡(luò)PCNN的研究,為圖像分割提供了新的處理模式,它能克服圖像中物體灰度范圍值有較大重疊的不利影響,達(dá)到較好的分割效果。
基于聚類的分割方法
對灰度圖像和彩色圖像中的相似灰度或色度合并的方法稱之為聚類,通過聚類將圖像表示為不同區(qū)域即所謂的聚類分割方法。此方法的實(shí)質(zhì)是將圖像分割問題轉(zhuǎn)化為模式識別的聚類分析,如k均值、參數(shù)密度估計、非參數(shù)密度估計等方法都能用于圖像分割。實(shí)際中受到普遍歡迎的是基于目標(biāo)函數(shù)的模糊C-均值算法(Fuzzy C-Means),簡稱FCM。由Bezdek于1981年提出,利用初始化方法確定聚類中心、聚類數(shù),通過不斷迭代循環(huán),調(diào)整和優(yōu)化聚類中心,最終使類內(nèi)方差達(dá)到最小,從而實(shí)現(xiàn)聚類。
目前常用的還有基于支持向量機(jī)聚類、基于遺傳算法聚類等以及與其他算法相結(jié)合的聚類方法。
基于主動輪廓模型的分割方法
主動輪廓模型(active contours)是圖像分割的一種重要方法,具有統(tǒng)一的開放式的描述形式,為圖像分割技術(shù)的研究和創(chuàng)新提供了理想的框架。在實(shí)現(xiàn)主動輪廓模型時,可以靈活的選擇約束力、初始輪廓和作用域等,以得到更佳的分割效果,所以主動輪廓模型方法受到越來越多的關(guān)注。
該方法是在給定圖像中利用曲線演化來檢測目標(biāo)的一類方法,基于此可以得到精確的邊緣信息。其基本思想是,先定義初始曲線C,然后根據(jù)圖像數(shù)據(jù)得到能量函數(shù),通過最小化能量函數(shù)來引發(fā)曲線變化,使其向目標(biāo)邊緣逐漸逼近,最終找到目標(biāo)邊緣。這種動態(tài)逼近方法所求得的邊緣曲線具有封閉、光滑等優(yōu)點(diǎn)。
傳統(tǒng)的主動輪廓模型大致分為參數(shù)主動輪廓模型和幾何主動輪廓模型。參數(shù)主動輪廓模型將曲線或曲面的形變以參數(shù)化形式表達(dá),Kass等人提出了經(jīng)典的參數(shù)活動輪廓模型即“Snake”模型[10],其中Snake定義為能量極小化的樣條曲線,它在來自曲線自身的內(nèi)力和來自圖像數(shù)據(jù)的外力的共同作用下移動到感興趣的邊緣,內(nèi)力用于約束曲線形狀,而外力則引導(dǎo)曲線到特征此邊緣。參數(shù)主動輪廓模型的特點(diǎn)是將初始曲線置于目標(biāo)區(qū)域附近,無需人為設(shè)定曲線的的演化是收縮或膨脹,其優(yōu)點(diǎn)是能夠與模型直接進(jìn)行交互,且模型表達(dá)緊湊,實(shí)現(xiàn)速度快;其缺點(diǎn)是難以處理模型拓?fù)浣Y(jié)構(gòu)的變化。比如曲線的合并或分裂等。而使用水平集(level set)的幾何活動輪廓方法恰好解決了這一問題。文獻(xiàn)[11]針對Snake模型在弱邊緣處容易溢出等不足,通過引入?yún)^(qū)域信息、粒子群優(yōu)化算法等優(yōu)化特性和良好的數(shù)值穩(wěn)定性來對Snake模型的分割結(jié)果進(jìn)行優(yōu)化。
圖像分割的系統(tǒng)研究
根據(jù)已有的研究成果和最近的研究趨勢來看,對圖像分割的研究其實(shí)應(yīng)該包括如圖 2.1所示的三個層次:關(guān)于圖像分割算法的研究、關(guān)于圖像分割算法性能的研究、關(guān)于圖像分割算法性能研究的研究。關(guān)于圖像分割算法的研究是對分割算法思想進(jìn)行研究,即對圖像進(jìn)行分割的技術(shù)的研究。關(guān)于圖像分割算法的性能的研究是對分割算法的評價方法進(jìn)行研究,研究內(nèi)容主要是對圖像分割技術(shù)的性能進(jìn)行刻畫和比較,從而幫助更好的把握分割算法的特點(diǎn)和優(yōu)點(diǎn),目前已得到廣泛重視但并未獲得可喜的研究成果。關(guān)于圖像分割算法性能研究的研究是對分割評價方法和評價所使用的相關(guān)準(zhǔn)則測度進(jìn)行系統(tǒng)研究,從而保證能選取恰當(dāng)?shù)脑u價方法和評價測度來正確評估相應(yīng)的分割技術(shù),也就是對分割評價方法的評價。研究圖像分割評價方法是為了更好的研究圖像分割技術(shù)本身,而對圖像分割評價的研究則是為了進(jìn)一步的研究分割評價方法,以便對分割技術(shù)本身起到引導(dǎo)和督促作用,從而從更深層次上實(shí)現(xiàn)對分割算法的指導(dǎo)作用。三者從“上”到“下”在不同層面上實(shí)現(xiàn)了一體式促進(jìn)圖像分割技術(shù)發(fā)展的目標(biāo)。

據(jù)統(tǒng)計,多年來學(xué)術(shù)界研究熱點(diǎn)和重點(diǎn)集中在最低層次;對第二個層次,研究投入的精力相對要少很多,但也已取得少數(shù)研究成果;至于第三個層次,目前國內(nèi)外對圖像分割算法的評價方法和評價測度的系統(tǒng)研究十分缺乏。事實(shí)上,甚至與第二層次對分割評價的研究相比,這方面的研究和發(fā)表的文獻(xiàn)都非常少??傮w說來,在圖像分割系統(tǒng)研究的三個層次都有許多有待深入的地方。對圖像分割技術(shù)本身進(jìn)行比較理論和精確的研究仍有待提高,對分割技術(shù)的評價仍很缺乏,而對評價方法的研究幾乎為零。
圖像分割主觀評價
圖像分割主觀評價方法就是以人類視覺效果作為評判標(biāo)準(zhǔn),讓觀察者根據(jù)事先規(guī)定的應(yīng)用要求或者自身經(jīng)驗(yàn)、興趣、愛好,對測試圖像的分割質(zhì)量進(jìn)行評價,并以給出質(zhì)量分?jǐn)?shù)的形式完成評價工作的。評價過程中要求有多位觀察者參與,綜合考慮所有觀察者的觀察結(jié)果,作為圖像分割結(jié)果圖像的最終質(zhì)量分?jǐn)?shù),最常用的綜合處理方法是平均主觀分?jǐn)?shù)法。
準(zhǔn)備工作
?、?觀察者的選擇
為使主觀評價結(jié)果具有統(tǒng)計意義,參與評價的觀察者有以下幾點(diǎn)要求:首先是人數(shù),要求不少于 20 名。其次是代表人群,要求觀察者應(yīng)分別選自兩個不同背景的人群:一種是從未從事過圖像、視頻、計算機(jī)視覺等領(lǐng)域工作的、未經(jīng)過訓(xùn)練的“外行”觀察者;另一種是專門從事圖像相關(guān)技術(shù)研究的,受過專門訓(xùn)練的“內(nèi)行”觀察者,他們能用挑剔的眼光注意到圖像分割圖像的關(guān)鍵和細(xì)微變化,對圖像分割質(zhì)量提出嚴(yán)格的判斷。最后是對候選人生理特性的要求,無論是“內(nèi)行”觀察者和“外行”觀察者,都應(yīng)有各年齡層次和性別的代表人物。條件允許的話,還應(yīng)有來自不同地域和種族的代表人物。
?、?評價尺度的選擇
主觀質(zhì)量評價的尺度隨著觀察者對圖像技術(shù)的熟悉程度不同而加以選擇。一般來講,普通觀察者(“外行”)多憑借直觀映像判斷分割質(zhì)量,因此多采用質(zhì)尺度,而對圖像專業(yè)人員(“內(nèi)行”)多憑借其對圖像內(nèi)容的理解而挑剔性地評價分割圖像的質(zhì)量,因此多采用干擾評價尺度。
主觀評價法
?、?絕對評價
絕對評價是由觀察者們根據(jù)事先規(guī)定的應(yīng)用要求或者自身經(jīng)驗(yàn)、興趣、愛好,對測試圖像按視覺效果進(jìn)行評價,并選擇觀察結(jié)果的平均質(zhì)量作為該分割結(jié)果圖像的最終質(zhì)量。這雖是一項(xiàng)費(fèi)時費(fèi)力的步驟,但在嚴(yán)格的實(shí)驗(yàn)條件下可從一定程度上減小評價過程的主觀隨意性。具體實(shí)施過程和步驟可參考聯(lián)合國國際電信聯(lián)盟ITU(International Telecommunication Union)倡導(dǎo)的視頻圖像質(zhì)量評價指南。
除了上述獨(dú)立的評價方式(stand-alone)外,還可采取有對比的方式(subjective comparable)進(jìn)行主觀評價。以提供的標(biāo)準(zhǔn)圖像為據(jù),觀察者逐個對比和分析算法分割的結(jié)果圖像中的區(qū)域與標(biāo)準(zhǔn)分割結(jié)果圖像的目標(biāo)區(qū)域,整合為對整幅算法分割結(jié)果圖像的全局感觀映像,進(jìn)而給出最終質(zhì)量分?jǐn)?shù)。必須指出的是,這種有對比的主觀評價方式雖然還未正式提出,但已經(jīng)常被某些組織或個人使用。觀察者對分割圖像質(zhì)量的優(yōu)劣用數(shù)字打分,通常有 5 個圖像級別,如表 2.1所示。

② 相對評價
相對評價是由觀察者將分割相同原始圖像而得的一批圖像從好到壞進(jìn)行質(zhì)量排序,通常有 7 個圖像級別,如表 2.2所示。

?、?平均主觀評價
如果m 為評價圖像質(zhì)量的級別 m=1,2,。。。,M , Sm為m 級圖像質(zhì)量的得分,Hm為判定圖像屬于m級的觀察者人數(shù),則被觀察的分割結(jié)果圖像總得分為:

圖像分割客觀評價
從 2.2 節(jié)敘述可知,在實(shí)際應(yīng)用中,主觀評價方法的評價結(jié)果因人而異,無法用數(shù)學(xué)模型對圖像分割的質(zhì)量進(jìn)行定量描述,且過于費(fèi)時費(fèi)力,因而其應(yīng)用受到很大限制,在某些場合甚至無能為力。相反,借助理論分析及科學(xué)計算對算法進(jìn)行客觀性能評價的方法,擺脫人為主觀因素對評價過程的束縛,評價結(jié)果客觀、穩(wěn)定,是一類可靠的分割評價方法。注意,主觀評價只能對分割結(jié)果進(jìn)行評判,因此,必須將分割算法在計算機(jī)上進(jìn)行實(shí)際分割獲得分割圖像才能實(shí)現(xiàn)對分割算法的性能評價??陀^評價方法不但可以對分割結(jié)果進(jìn)行評判,還可以不借助計算機(jī)而直接對算法進(jìn)行分析和評判。因此研究一種在一定程度上能替代主觀評價,并能實(shí)現(xiàn)定量測定圖像分割質(zhì)量的客觀方法具有重要的意義,并必將成為圖像分割評價方法研究的必然趨勢。
客觀評價法研究內(nèi)容及評價準(zhǔn)則
圖像分割客觀評價主要有兩方面的研究內(nèi)容:
一是對特定的圖像分割算法進(jìn)行研究,通過對該算法在不同應(yīng)用情況、不同參數(shù)組合情況以及輸入圖像的類型、內(nèi)容、復(fù)雜度等不同時所表現(xiàn)出的性能進(jìn)行評估,掌握如何選擇及修正算法參數(shù),以恰當(dāng)?shù)貞?yīng)對不同的應(yīng)用場景,稱為性能刻畫。通常包含兩種形式的性能刻畫方法,分別是充分性性能刻畫和診斷性性能刻畫。充分性性能刻畫著重對分割算法的適用領(lǐng)域的研究,診斷性性能刻畫重點(diǎn)在對分割算法有效性的研究。以存在標(biāo)準(zhǔn)參考圖像為前提,后者通過計算算法處理的結(jié)果圖像與標(biāo)準(zhǔn)參考圖像的相似性,完成對分割算法某次分割結(jié)果質(zhì)量的評價,即部分有效性評價。分割算法全局有效性評價則是以統(tǒng)計該算法在包含大量數(shù)據(jù)的圖像數(shù)據(jù)庫中能取得較好分割質(zhì)量的圖像的比率為依據(jù)的,整個過程步驟如圖 2.2 所示。

二是分析比較多個算法在相同應(yīng)用情況下的分割性能,比較各算法的優(yōu)劣,并進(jìn)行排序以便在給定情況下選擇合適的分割算法或者改進(jìn)現(xiàn)有算法來滿足應(yīng)用要求,稱為性能比較。
這兩方面內(nèi)容是相互影響和關(guān)聯(lián)的。性能刻畫使得對算法的研究和理解更為全面和深刻,性能比較使得對算法的刻畫更具目的性。為達(dá)到分割評價的目的,對進(jìn)行分割評價的研究方法有以下幾點(diǎn)基本要求:
通用:分割評價的方法必須對各種類型的分割算法都能進(jìn)行準(zhǔn)確而客觀地評價,適用不同應(yīng)用領(lǐng)域的各種情況;
客觀:分割評價的方法必須擺脫對人為因素的依賴性,進(jìn)行客觀真實(shí)地評價;
定量:分割評價的方法必須能以量化的形式給出直觀的評價結(jié)果,方便不同的評價結(jié)果進(jìn)行比較;
典型:分割評價時采用的輸入圖像必須能代表真實(shí)世界里各種應(yīng)用場景的特點(diǎn),使評價結(jié)果具有較好的可移植性。
不管是對算法進(jìn)行理論分析還是設(shè)計實(shí)驗(yàn)進(jìn)行評價,都需要一定的評價準(zhǔn)則做指導(dǎo),也稱評價指標(biāo)或測度。事實(shí)上,對任何技術(shù)進(jìn)行評價都要采用有效的評價方法和客觀的評價指標(biāo)。因?yàn)樵u價方法的性能主要取決于所采用的評價準(zhǔn)則,在圖像分割技術(shù)的評價中,性能評判準(zhǔn)則可以說是最重要的因素,因此對各種評價準(zhǔn)則的分析、比較和討論成為分割評價方法研究的重點(diǎn)。一方面,理論上分析算法思想、特點(diǎn),需要刻畫算法某方面的特性,而這些特性是否得到滿足牽涉到評價準(zhǔn)則;另一方面,通過實(shí)驗(yàn)的方法評價算法特性及分割質(zhì)量,需要將待評估算法在計算機(jī)上實(shí)現(xiàn)對輸入圖像的分割,對分割結(jié)果進(jìn)行客觀定量地評價,進(jìn)而決定分割算法的性能,在缺乏評價準(zhǔn)則的情況下該過程中仍無法開展??梢?,在分割評價過程中所依據(jù)的評價準(zhǔn)則(指標(biāo)),在整個性能評判過程中起著關(guān)鍵性的作用,具有重要的研究意義。
一個好的分割評價準(zhǔn)則應(yīng)該滿足如下四個要求:
非退化性(Nondegeneracy):也稱為普適性,即對各種類型的輸入圖像的分割結(jié)果進(jìn)行評價都能給出恰當(dāng)?shù)慕Y(jié)論,避免對某種分割結(jié)果分辨不清給出錯誤評價結(jié)論的問題。例如,每個像素獨(dú)立成一個區(qū)域(原始圖像)或者所有像素劃分到一個區(qū)域(將原始圖像作為一個區(qū)域)的極端分割情況,評價準(zhǔn)則應(yīng)給出的判斷結(jié)果是“最差等級”。
數(shù)據(jù)無假設(shè)(No assumptions about data generation):即對評價對象(分割算法及其分割的圖像數(shù)據(jù))不做任何人為假設(shè)。
自適應(yīng)判別精細(xì)劃分(Adaptive accommodation of refinement):假設(shè)對某幅原始圖像有兩種不同的分割結(jié)果圖像S1 和S2 , S1的每個區(qū)域或者與S2的對應(yīng)區(qū)域重疊,或者與S2的多個區(qū)域的并集重疊,即S2是S1的細(xì)分結(jié)果,則稱 S2是S1的一種精細(xì)劃分。不同的人由于各自的視覺習(xí)慣或者對事物的理解不同,對S1的精細(xì)劃分的認(rèn)識也不同,也就是說可能有多種精細(xì)劃分結(jié)果同時存在,但都認(rèn)為是可取的、正確的,如圖 2.3所示。對這類精細(xì)劃分結(jié)果,評價準(zhǔn)則要能準(zhǔn)確識別并判定二者的分割效果一致

可比性(Comparable scores):即評價結(jié)果必須用數(shù)字等形式量化表示,以便在不同評價結(jié)果間進(jìn)行比較和評估。
圖像分割評價準(zhǔn)則切入點(diǎn)不同,原理不同,各有所長。根據(jù)評價過程所采用的方式不同,有實(shí)驗(yàn)性的準(zhǔn)則,用于評價分割算法的分割結(jié)果圖像,亦即借助實(shí)驗(yàn)結(jié)果去評判分割算法的性能;也有分析性的準(zhǔn)則,用于直接分析分割算法的性能。因此,這些評價準(zhǔn)則可分成分析的和實(shí)驗(yàn)的兩大類。而且,這些準(zhǔn)則中有些只可以定性的評價分割算法性能,也就是說分割算法的性能的評價結(jié)果以定性的方式表達(dá);有些又可以定量地評判分割算法的性能,亦即以定量的方式表達(dá)和刻畫算法的性能及分割結(jié)果的質(zhì)量。因此,根據(jù)評價準(zhǔn)則的自身特性,以及最終表達(dá)形式的不同,又可將這些準(zhǔn)則分成定量準(zhǔn)則和定性準(zhǔn)則兩大類。綜合上面兩種關(guān)于分割評價的準(zhǔn)則的分類,除了一些特殊的評價準(zhǔn)則以外,多數(shù)的評價準(zhǔn)則均可劃分到以下四類,如表 2.3所示。

從分割評價方法的使用結(jié)果來看,對所評價的算法利用分析性的準(zhǔn)則進(jìn)行評價相比利用實(shí)驗(yàn)性的準(zhǔn)則進(jìn)行評價,它不要求將待測算法在計算機(jī)上實(shí)現(xiàn)實(shí)地分割獲得分割圖像,因此評價結(jié)果不會受到不同安排的評價實(shí)驗(yàn)帶來的影響。另外,采用定量性的評價準(zhǔn)則可獲得比定性性的準(zhǔn)則更豐富更精確的信息,更容易獲得較為直觀的評價結(jié)果。由此可知,評價準(zhǔn)則具備不同的用途與特點(diǎn),需要對他們有一個全面的了解和掌握,才能因地制宜選擇合適的評價方法評價待研究的算法。
展望
隨著圖像分割技術(shù)在諸多工業(yè)領(lǐng)域的廣泛應(yīng)用以及理論研究的不斷發(fā)展,對其分割性能和分割效果的評估已成為一項(xiàng)很有意義而又亟待解決的研究課題。有監(jiān)督的評價方法雖能獲得較為準(zhǔn)確和可靠的評價結(jié)果,但是評價過程嚴(yán)重依賴標(biāo)準(zhǔn)分割圖像,但實(shí)際應(yīng)用中獲取標(biāo)準(zhǔn)參考圖像并不容易,甚至不可能;無監(jiān)督評價方法雖無需標(biāo)準(zhǔn)分割,但目前為止都是低級的基于圖像特征的數(shù)據(jù)驅(qū)動的評價方法,又難以同時具備準(zhǔn)確性和通用性等特點(diǎn)。因此,能利用圖像的高級信息如語義信息來進(jìn)行算法的性能評價應(yīng)是未來發(fā)展的趨勢。例如圖像骨架,是對圖像內(nèi)容的綜合描述,因此結(jié)合骨架信息的評價方法有望獲得對分割結(jié)果圖像的準(zhǔn)確理解。另外,如果能將期望達(dá)到的分割效果結(jié)合到評價過程中,這樣一來,評價方法最大限度地代表了人類主觀意愿,因此其評價結(jié)果將更為準(zhǔn)確和可靠。
電子發(fā)燒友App




















評論