人臉檢測(cè)是一個(gè)非常復(fù)雜的模式,人臉面部特征提取及識(shí)別成為當(dāng)前計(jì)算機(jī)圖像處理相關(guān)學(xué)科的一個(gè)極具挑戰(zhàn)的課題。而基于Carvelet變換的人臉特征提取及識(shí)別的意義在于Curvelet繼承了小波分析優(yōu)良的空域和頻域局部特性,是又一個(gè)新的圖像多尺度兒何分析工其,其相對(duì)于小波的優(yōu)勢(shì)在于更加適合描述圖像的幾何特征,因此也更適合人臉特征提取及識(shí)別分析。。
人臉識(shí)別的研究是模式識(shí)別和人工智能領(lǐng)域的重要課題,有著十分廣泛的應(yīng)用前景近年來(lái),特征提取作為人臉識(shí)別系統(tǒng)的關(guān)鍵環(huán)節(jié)得到了廣泛和深入的研究。人臉是一個(gè)高維的視覺(jué)模式,一幅100X 100的灰度圖像就有80000bit的數(shù)據(jù),直接對(duì)人臉圖像進(jìn)行識(shí)別分類(lèi),計(jì)算最很大,影響識(shí)別速度。因此,需要提取人臉圖像的主要特征。通常對(duì)人臉特征提取有兩方面要求:一是提取的特征應(yīng)具有很好的人臉表征能力、較強(qiáng)的鑒別力和區(qū)分度; “是提取的特征要處于低維空間,這樣可去除特征間的相關(guān)性,有利于分類(lèi)器的設(shè)計(jì)。目前,人臉特征提取的方法主要有: 主成分分析法(principal componentanalysis,PCA )線(xiàn)性判別分析法(linear discriminantanalysis,LDA)奇異值分解法(singular value decom-position,SVD)等,PCA與LDA是基J信號(hào)2 階統(tǒng)計(jì)特征的分析方法,不能從高階上消除數(shù)據(jù)齊成分之間的相關(guān)性。采用SVD方法對(duì)整幅人臉進(jìn)行處理會(huì)丟失 一些特征信息,導(dǎo)致識(shí)別率較低。
近年來(lái),隨著小波理論的逐漸成熟,小波分析作為種數(shù)學(xué)理論和方法在人臉識(shí)別領(lǐng)域引起越米越多的關(guān)注和重視,原因在于小波變換具有良好的時(shí)頻局部化能力,能逐步聚焦到分析對(duì)象的任何細(xì)節(jié),有效地描述人臉局部信息。但小波變換反映的是信號(hào)的點(diǎn)奇異性,其基是各向同性(isotropy)的,無(wú)法精確地表達(dá)圖像中邊緣的方向,也無(wú)法實(shí)現(xiàn)對(duì)圖像的稀疏表示。因此對(duì)于人臉圖像中重要的面部輪廓及五官的曲線(xiàn)信息,小波則難以表達(dá)其特征,從而影響識(shí)別的精度。
Curvelet變換正是為了克服小波的這一局限性而產(chǎn)生的。與小波變換不同,除了尺度和位移參量外,Curvelet還增加了 一個(gè)方向參量,使之具有更好的方向辨識(shí)能力。因此,Curvelet對(duì)圖像的邊緣,如曲線(xiàn)、直線(xiàn)等幾何特征的表達(dá)更加優(yōu)于小波,使用Curvelet變換提取人臉特征是 一條更有效的途徑.2005年CandesEJ等對(duì)第1代Curvelet算法進(jìn)行改進(jìn),提出了更簡(jiǎn)單、更便于理解的快速Curvelet變換算法,即第2 代Curvelet變換,大大降低了數(shù)據(jù)的冗余度。
本文提出一種基于第2 代Curvelet變換人臉特征Curvelet分解后的低頻系數(shù)能提取與識(shí)別的新方法,夠很好地壓縮和表征人臉的基本特征,且對(duì)表情變化不敏感; 高頻系數(shù)則反映了人臉圖像的面部輪廓及五官曲線(xiàn)信息。將低頻數(shù)據(jù)進(jìn)一步壓縮并計(jì)算高頻各子帶Curvelet能量特征作為表征人臉的特征向量。對(duì)Yale人臉庫(kù)以及Orl人臉庫(kù)數(shù)據(jù)的仿真實(shí)驗(yàn)結(jié)果表明,該算法提取的特征向最維數(shù)較少、識(shí)別速度快,具有較高的識(shí)別率,且對(duì)人臉光照、姿態(tài)和表情變化均具有良好的魯棒性。
第2 代Curv elet 變換理論
Curvelet變換是一種新的圖像多尺度幾何分析工具,其構(gòu)造思想是通過(guò)足夠小的分塊將曲線(xiàn)近似為直線(xiàn)來(lái)看待。第2代Curvelet變換在第1代Curvelet的基礎(chǔ)上進(jìn)行了改進(jìn),實(shí)現(xiàn)過(guò)程無(wú)需用到Ridgelet,大大降低了數(shù)據(jù)的幾余度,提高了運(yùn)算速度。在頻域中,Curvelet基支撐區(qū)間表現(xiàn)為“楔形”,如圖1陰影部分所示。這種“楔形”支撐區(qū)間實(shí)際上是“方向性”的一種體現(xiàn),因此稱(chēng)這種基具有“各向異性”,在楔形分塊中,只有當(dāng)通近基與奇異性特征重疊,即其方向與奇異性特征的幾何形狀匹配時(shí),才具有較大的Curvelet系數(shù)
可以看出,Curvelet變換較小波變換有更好的逼近能力,能夠?qū)D像邊緣進(jìn)行最佳稀疏表示,即圖像的邊緣,如曲線(xiàn)。直線(xiàn)特征用較少的Curvelet變換系數(shù)表示,克服了小波變換傳播重要特征到多個(gè)尺度上的缺點(diǎn),變換后能量更加集中,更利于提取和分析圖像的重要特征。
基于Curvelet變換的人臉特征提取與識(shí)別算法
人臉圖像的特征提取是人臉識(shí)別過(guò)程中至關(guān)重要的一個(gè)環(huán)節(jié),其目標(biāo)是用最少的特征量來(lái)表征人臉,并要求特征量最大程度地保持不同人臉的可區(qū)分能力。
第2 代Curvelet人臉圖像分解
對(duì)人臉圖像進(jìn)行第2 代Curvelet分解,得到一個(gè)低頻子帶系數(shù)和各尺度各方向的高頻子帶系數(shù)。低頻系數(shù)能很好地表征人臉圖像的基本特征,其子帶的行、列分別為
實(shí)驗(yàn)證明,這樣得到的Curvelet分解層數(shù)大小可以較好地滿(mǎn)足特征提取的需要。從式(3)可以看出,分解后的低頻子帶數(shù)據(jù)量明顯壓縮。假設(shè)對(duì)于112 X 92 的圖像,通過(guò)式(4)計(jì)算得到的Curvelet分解層數(shù)為4,則低頻系數(shù)大小為19 X 15.
高頻系數(shù)反映圖像各個(gè)方向的細(xì)節(jié)、紋理等重要信息。理論上,設(shè)定每層方向數(shù)為8 的倍數(shù),一般第1層取16,第2層為32,圖2即為Curvelet分解示意圖,圖2(a)為原始人臉圖像,圖2(b)為Curvelet分解后的低頻子帶圖像,圖2(c)為第2層16個(gè)方向的高頻子帶圖像。
人臉特征提取
Curvelet分解后圖像的大部分能量集中在低頻子帶中,如果將其直接作為特征向量,數(shù)據(jù)量仍然較大,不利于后續(xù)分類(lèi)器的識(shí)別。為了進(jìn)一步減少數(shù)據(jù)量、降低特征維數(shù),需要對(duì)低頻子帶進(jìn)行爪縮。爪縮方法就是依次提取低頻子帶中2 X 2 窗山的系數(shù)平均值作為新子帶中對(duì)應(yīng)的一個(gè)系數(shù)值。低頻子帶圖像及壓縮后的圖像顯示如圖3 所示。若原始低頻圖像大小為19 x 15,則壓縮為9 x 7 (63維),數(shù)據(jù)進(jìn)一步樂(lè)縮到1,/4.這樣一方面可以降低計(jì)算和空間存儲(chǔ)代價(jià),另一方面可以提高容錯(cuò)性。為了在一定程度上降低光照的影響,需將處理后的數(shù)據(jù)進(jìn)行歸一化處理。
高頻系數(shù)包含人臉的邊緣及細(xì)節(jié)信息,足人臉坡具識(shí)別效率的特征之一。在實(shí)驗(yàn)中選取了Curvelet能最特征作為人臉的特征向錄,因?yàn)樗梢苑从橙四槇D像的邊緣及輪廓信息在不同位置、不同方向、同分辨半下的分布情況,從而能很好地刻畫(huà)人臉的輪廓特征。其定義為
人臉識(shí)別
提取人臉圖像的特征向量后,需要設(shè)計(jì)一個(gè)好的分類(lèi)器進(jìn)行識(shí)別。建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的SVM技術(shù)在處理小樣本、非線(xiàn)性、高維數(shù)問(wèn)題時(shí)有很人的優(yōu)勢(shì),泛化能力強(qiáng),可以很好地解決人臉識(shí)別這類(lèi)小樣本問(wèn)題。它首先通過(guò)構(gòu)造最優(yōu)超平面,使分類(lèi)誤差達(dá)到最小,再通過(guò)適當(dāng)核函數(shù)(kernel function)的非線(xiàn)性變換將輸入空間變換到一個(gè)高維空間,最后在這個(gè)新空間求坡優(yōu)分類(lèi)面。
訓(xùn)練階段主要步驟為: 對(duì)訓(xùn)練集中人臉圖像進(jìn)行Curvelet 分解,得到一個(gè)87維的人臉特征向錄,建立人臉特征向量訓(xùn)練集,由人臉特征向量訓(xùn)練集建立SVM分類(lèi)模型。
對(duì)要識(shí)別的人臉圖像進(jìn)行識(shí)別階段主要步驟為:Curvelet分解,提取人臉特征向量,將該向星送入SVM模型進(jìn)行分類(lèi)與識(shí)別。
實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證算法的有效性,本文對(duì)Orl 標(biāo)準(zhǔn)人臉庫(kù)和Yale標(biāo)準(zhǔn)人臉庫(kù)進(jìn)行人臉特征提取與識(shí)別.Orl人臉庫(kù)有40個(gè)人,每人10幅共400幅人臉圖像,每幅圖像均為112 X 92的灰度圖像,具備不同的光照、表情、發(fā)型和有無(wú)眼鏡等,并且人臉有一定的側(cè)轉(zhuǎn)角度.Yale庫(kù)給出15 人,每人11幅共165幅人臉圖像,每幅圖像均為100X 100的灰度圖像,圖像背景復(fù)雜,且光照條件、人的臉部表情和姿態(tài)也有著很大程度的變化。圖5給出了部分Orl與Yale人臉庫(kù)圖像。
實(shí)驗(yàn)采用Pentium 43.0 GHz,512 MB內(nèi)存的計(jì)算機(jī)。為了驗(yàn)證算法的快速性以及對(duì)樣本隨機(jī)選取的魯棒性,首先在Or1人臉庫(kù)中每人隨機(jī)選取6 幅圖像用于訓(xùn)練,其余的用于測(cè)試; 在Yale岸中每人隨機(jī)選取7 幅圖像用于訓(xùn)練,其余用于測(cè)試,并將本文算法與小波方法11的人臉識(shí)別結(jié)果進(jìn)行比較。表1給出了兩種方法在Orl與Yale人臉庫(kù)的識(shí)別率與識(shí)別速度的對(duì)比情況。(注: 訓(xùn)練樣本是隨機(jī)選取的,表中的識(shí)別率均為10次隨機(jī)實(shí)驗(yàn)正確率的平均值。)
由表1可以看出,本文算法在Orl人臉數(shù)據(jù)庫(kù)上,識(shí)別的正確率達(dá)到98.8%; 在Yale人臉數(shù)據(jù)庫(kù)上,識(shí)別的正確率為95.2%.相比小波方法,本文算法具有較高的識(shí)別率,且特征維數(shù)少,識(shí)別速度快。對(duì)于表情、光照較為復(fù)雜的Yale人臉數(shù)據(jù)庫(kù),圖6 則更為直觀地展示了兩種方法在不同訓(xùn)練樣本下的識(shí)別率數(shù)據(jù)變化曲線(xiàn)??梢钥闯?,在樣本數(shù)目較少的情況下,本文算法識(shí)別率相比小波大約平均提高5%,說(shuō)明該方法具有良好的適應(yīng)性.
評(píng)論