1、靜止圖像壓縮編碼簡介
靜止的、不變的、稱為靜止圖像,一般從設(shè)備屏幕上看長時間保持不變。被攝事務(wù)一般是靜止或者某一特定時刻保持靜止的。按照應(yīng)用場景的不同,傳輸文件、模型、圖片等靜止圖像時常用靜止圖像傳輸;現(xiàn)場實(shí)時監(jiān)控則常用凝固圖像傳輸。
要求如下:
?、偾逦龋簣D像清晰度更高,從而滿足人眼對觀察圖像細(xì)節(jié)的要求,而不是利用通常電影的原理。
?、陲@示方式:逐漸浮現(xiàn)。即先傳模糊的整體圖像,再逐漸傳輸顯示細(xì)節(jié),從而使觀看者不用等待太久時間,適應(yīng)窄帶傳輸?shù)膱鼍啊?/p>
③抗干擾:在較長傳輸過程中,編碼方法要有較強(qiáng)的抗干擾噪聲能力,防止圖像呈現(xiàn)在終端上時質(zhì)量低下。
以下為對靜態(tài)圖像編碼技術(shù)的介紹:
①預(yù)測編碼:由相鄰像素間相關(guān)性出發(fā),通過前面像素值預(yù)測當(dāng)前像素值,并經(jīng)過實(shí)際數(shù)據(jù)的運(yùn)算得到預(yù)測誤差,而該誤差通常接近實(shí)際值。因此對預(yù)測誤差直接進(jìn)行單符號的熵編碼或?qū)︻A(yù)測誤差進(jìn)行量化再進(jìn)行熵編碼是更高效率的計(jì)算方法,最主要的算法則是簡稱為DPCM的差分脈沖編碼。
②變換編碼:是目前幾乎所有的圖像、視頻和視頻等的壓縮標(biāo)準(zhǔn)的核心編碼算法。而新近發(fā)展的更多圖像壓縮技術(shù)中,該編碼也是核心的基礎(chǔ)算法,在實(shí)際中得到廣泛應(yīng)用。
JPEG是“Join Photographic Expert Group”的首字母簡寫,可將每24比特的單彩色像素圖像壓縮至2比特,而保持較高的圖像質(zhì)量。其定義的編碼系統(tǒng)主要有以下三種:a DCT有損編碼基本系統(tǒng),大部分壓縮應(yīng)用場景下均采用該系統(tǒng)。b可擴(kuò)展編碼系統(tǒng):用于高壓縮、高精度、漸進(jìn)重建應(yīng)用。c無損系統(tǒng):應(yīng)用于無失真場合。
JPEG標(biāo)準(zhǔn)一般用于自然景象、連續(xù)色調(diào)數(shù)字圖像編、解碼。
簡單歸納為:兩種工作方式(順序方式、漸進(jìn)方式)、三種級別(基本系統(tǒng)、擴(kuò)展系統(tǒng)、無失真系統(tǒng))。
順序方式:將圖像的行和列分割成四方小塊,從左到右、由上而下逐行逐列對所有的小塊進(jìn)行編碼運(yùn)算。并且解碼時也按編碼順序逐塊解碼。這兩個過程均一次完成。
漸進(jìn)方式:整個圖像需要經(jīng)過多次編碼運(yùn)算才能完成,初次編碼時質(zhì)量低于最終要求的質(zhì)量。逐次編碼,質(zhì)量逐次提升。解碼時首先解碼出較低質(zhì)量全幅圖像,增加附加信息后再次解碼,重復(fù)若干次,最終得到滿足質(zhì)量要求。解碼過程可隨時終止。
基本系統(tǒng):以離散余弦變換為核心,以順序工作為方式,用于一般精度。按照要求,每個壓縮編碼器均實(shí)現(xiàn)了基本算法功能。
擴(kuò)展系統(tǒng):在若干方面增強(qiáng)并減少一些限制條件后就成為“擴(kuò)展系統(tǒng)”。
無失真系統(tǒng):以DPCM技術(shù)為基礎(chǔ),壓縮比較低,但是能實(shí)現(xiàn)壓縮時不失真。
JPEG標(biāo)準(zhǔn)是多年來圖像壓縮編碼的研究成果。雖然DCT是它的核心,但它同時也采用了DPCM、自適應(yīng)量化、游程編碼、可變長熵編碼等多種技術(shù),所以應(yīng)該說是一種混合算法。
被譽(yù)為數(shù)學(xué)顯微鏡的小波變換是從傅里葉變換和加窗傅里葉變換發(fā)展而來的。小波變換引入伸縮參數(shù),實(shí)現(xiàn)了時域-頻域局域化分析,從而可以對圖像的任何局部區(qū)域進(jìn)行多分辨率分析。由于小波變換有高頻的方向選擇性,與人眼的視覺特性相吻合,人眼最重要的視覺特性是視覺掩蓋效應(yīng),即不變和有的區(qū)域很容易被遺忘,而對突變和極不規(guī)則變化的區(qū)域感興趣。采用嵌入式零樹小波編碼及算法,通的區(qū)域和不感興趣區(qū)域分別進(jìn)行編碼,可以達(dá)到充分利用信道資源和存儲空間、提高感興趣區(qū)域的圖的。

2、視覺掩蓋效應(yīng)
在大多數(shù)應(yīng)用場合,最終的圖像總是由人眼來觀測的,但是人類的視覺系統(tǒng)并不完美。通過對人眼的觀察與研究發(fā)現(xiàn),視覺掩蓋效應(yīng)可以用于改善圖像信息的處理。
視覺選擇性與客體的特性有關(guān),人眼對空間頻率接近于零的平滑區(qū)域和空間頻率相似紋理區(qū)域有很大的鈍性,所以不變與規(guī)則變化的場景很容易在人的意識中被遺忘,人類視覺通常只對突變和極不規(guī)則變化的區(qū)域感興趣。這種與生俱來的選擇性使視覺只限定在有限的目標(biāo)上。
2.1 靜態(tài)對比靈敏度
人眼主觀上可辨別的最小亮度差別所需要的最小光強(qiáng)差值稱為亮度的辨別閥值。也就是說,當(dāng)刺激光強(qiáng)I增大時,最初感覺不出,直到I變化到I+ΔI時人眼就感覺到亮度有變化了。人眼對亮度光強(qiáng)變化的響應(yīng)是非線性的,比值ΔI/I稱為對比靈敏度。在相當(dāng)寬的光強(qiáng)范圍內(nèi),ΔI/I保持常數(shù)為0.02,但在I很低或很高時不是常數(shù)。如果有背景,則對比靈敏度不僅與目標(biāo)物的光強(qiáng)度I有關(guān),而且與背景亮度I。有關(guān)。圖1給出了有背景和無背景時人眼的靜態(tài)對比靈敏度曲線。

此外,人眼的對比靈敏度還與刺激的空間變化周期(空間變化周期是指刺激的明暗不變,只改變明暗的空間間隔)有關(guān)。如果亮度固定在一定水平下,則對比靈敏度與光刺激的空間變化周期之間的關(guān)系如圖2所示。這一關(guān)系通常被稱為人眼的調(diào)制傳遞函數(shù)。圖2中還給出了等亮度的色差信號Y-R和Y-B的對比靈敏度曲線。由圖1和圖2可得到以下結(jié)論:
(1)恢復(fù)圖像的誤差如果低于對比靈敏度,則不會被人眼覺察。
?。?)高頻部分在相同的靈敏度閾值下,色差信號Y-R的空間頻率只有亮度Y的一半,Y-B則為Y的1/4,通常表示色差信號所需的像素比亮度要少得多。
?。?)在相同的靈敏度閾值下,斜向柵格的空間頻率只有正常柵格的0.7,因此按斜向柵格對圖像數(shù)據(jù)采樣所需的頻率較低。

?。?)高頻端的靈敏度要小于低頻端,因此對這些部分的量化誤差可大一些。
2.2 具有感興趣區(qū)域的人眼視覺特性
人們在觀察和理解圖像時常常不自覺地對其中某些區(qū)域產(chǎn)生興趣,把這些區(qū)域稱為視覺感興趣區(qū)域。整幅圖像的主觀視覺質(zhì)量取決于感興趣區(qū)域的視覺質(zhì)量,而不感興趣區(qū)域的降質(zhì)常常不易被人覺察,對整幅圖像視覺質(zhì)量的影響較小。例如對一副人像照片,反映一個人主要特征的是面部信息,在進(jìn)行圖像壓縮時,人的面部信息與其它不重要的信息不必采用相同的壓縮比。顯然,感興趣區(qū)域的視覺特性也是一種視覺掩蓋效應(yīng)。
3、 嵌入式零樹小波編碼及算法
3.1 EZW編碼
一幅圖像經(jīng)過三級小波分解后形成十個子帶,如圖3所示。小波系數(shù)的分布特點(diǎn)是越往低頻子帶,系數(shù)值越大,包含的圖像信息越多。如圖3中的LL3子帶,越是高頻子帶,系數(shù)值越小,包含的圖像信息越小。在系數(shù)數(shù)值相同時,低頻子帶反映圖像的低頻信息,對視覺比較重要;而高頻子帶反映圖像的高頻信息,對視覺不太重要。應(yīng)選擇先傳輸較低頻系數(shù)的重要比特,后傳輸較高頻系數(shù)的重要比特。正是由于小波系數(shù)具有的這些特點(diǎn),它非常適合于嵌入式編碼算法。

嵌入式零樹小波編碼EZW(Embedded Zerotree Wavelet)方法是對整幅圖像進(jìn)行同一級別編碼的方法,圖像中的重要區(qū)域(感興趣區(qū)域)與背景區(qū)域(非感興趣區(qū)域)具有同樣的編碼級數(shù)。EZW編碼算是一個簡單而有效的圖像編碼算法,這種算法得到的比特流中的比特按其重要性排序。使用這種算法,編碼者能夠在任一點(diǎn)結(jié)束編碼,允許精確到任一個目標(biāo)比特率或目標(biāo)失真率。
3.2EZW算法
EZW算法利用小波系數(shù)的特點(diǎn)較好地實(shí)現(xiàn)了圖像編碼的嵌入功能,為了改善小波系數(shù)重要圖的壓縮,定義了一個零數(shù)的數(shù)據(jù)結(jié)構(gòu),即一個小波系數(shù)χ。對于一個給定的門限T,如果|χ| 則稱小波系數(shù)|?是不重要的一個小波系數(shù)在一個粗尺度上,關(guān)于給定的門限是不重要的,且之后在較細(xì)的尺度上,對同樣空間位置中的所有小波系數(shù)關(guān)于給定的門限T也是不重要的,則稱小波系數(shù)形成了一個零數(shù)。這時,在粗尺度上的那個小波系母代小波系數(shù),它是樹根,在較細(xì)尺度相應(yīng)位置上的小波系數(shù)稱為了代小波系數(shù)。如果一個小波系數(shù)不重要的,但它的子代小波系數(shù)中關(guān)于門限T是重要的系數(shù),則稱這個小波系數(shù)是孤立零。因此,小波系情況:零數(shù)根(ZTR)、孤立零。因此,小波系數(shù)有三種情況:零數(shù)根(ZTR)、孤立零(IZ)、重要系然,為了編碼的需要還可把重要系數(shù)分為正重要系數(shù)(POS)和負(fù)重要系(NEG)。
對于一個圖像的數(shù)據(jù)流,圖4給出了一個系數(shù)編碼的流程圖。
4、具有感興趣區(qū)域的靜止圖像壓縮編碼算法研究
4.1 EZW_ROI編碼算法
為了提高感興趣區(qū)域的圖像質(zhì)量,在信道資源和存儲空間有限的條件下,提出感興趣區(qū)域的零樹編碼算法EZW_ROI(Embedded Zerotree Wavelet with Region of interests),它對感興趣區(qū)域圖像和背景圖像采用不同的壓縮步驟,使感興趣區(qū)域內(nèi)的圖像比背景圖像具有更好的圖像質(zhì)量。
對感興趣區(qū)域內(nèi)外的圖像采用不同的零數(shù)小波編碼。整個編碼算法分三步進(jìn)行:
?。?)確定感興趣區(qū)域:人像照片可以把感興趣區(qū)域確定為面部區(qū)域。在視頻監(jiān)視系統(tǒng)中,可以把監(jiān)視環(huán)境中的重要場景設(shè)為感興趣區(qū)域。
(2)對低頻子帶中感興趣區(qū)域內(nèi)的系數(shù)進(jìn)行編碼:即對感興趣區(qū)域內(nèi)的圖像進(jìn)行編碼,系數(shù)采用EZW算法的零樹結(jié)構(gòu),按照EZW算法的思想進(jìn)行零樹掃描和編碼。
(3)對低頻子帶中不在感興趣區(qū)域內(nèi)的系數(shù)進(jìn)行編碼:即對背景區(qū)域的圖像進(jìn)行編碼,系數(shù)的編碼不用EZW算法的零樹結(jié)構(gòu),只對背景區(qū)域的低頻信息進(jìn)行編碼。

4.2 EZW_ROI解碼算法
對編碼圖像進(jìn)行解碼時,與編碼過程相反,也分三步進(jìn)行:
?。?)對低頻子帶中的感興趣區(qū)域內(nèi)圖像進(jìn)行與EZW算法同樣的零樹編碼。
(2)對低頻子帶中的感興趣區(qū)域外圖像進(jìn)行簡單的位解碼。
?。?)消除邊緣效應(yīng):在以上兩步的基礎(chǔ)上,對感興趣區(qū)域的四周做3%26;#215;3的均值濾波,以消除感興趣區(qū)域邊緣的影響,使得感興趣區(qū)域外的圖像在視覺上差別變?nèi)酢?/p>

5、應(yīng)用實(shí)例
在研究中采用了一幅標(biāo)準(zhǔn)的8bpp的灰度人像,首先,確定感興趣區(qū)域?yàn)槿讼竦拿娌?,對原始圖像進(jìn)行四級的小波分解,小波變換采用S+P變換;最后對圖像進(jìn)行32倍壓縮,即壓縮后的比特率為0.25bpp。用EZW算法和EZW_ROI算法恢復(fù)的圖像如圖7所示。在信道資源和存儲空間有限的條件下,為了提高感興趣區(qū)域的圖像質(zhì)量,采用具有感興趣區(qū)域的圖像壓縮方式,對感興趣區(qū)域背景圖像采用不同的壓縮步驟,使圖像中的重要信息盡可能少損失。試驗(yàn)證明,在高壓縮比的情況下,EZW_ROI算法的重建圖像比EZW算法的重建圖像具有更好的視覺效果。
電子發(fā)燒友App











評論