第五章圖像編碼與壓縮_第1頁
第五章圖像編碼與壓縮_第2頁
第五章圖像編碼與壓縮_第3頁
第五章圖像編碼與壓縮_第4頁
第五章圖像編碼與壓縮_第5頁
已閱讀5頁,還剩245頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數字圖像處理DigitalImageProcessing河北大學數學與計算機學院馬潁麗MaYingliCMCHBU第五章圖像編碼與壓縮5.1概述5.2統計編碼5.3預測編碼5.4變換編碼5.5二值圖像編碼5.6新型的圖像壓縮編碼方法5.7圖像壓縮編碼標準MaYingliCMCHBU知識要點信息論中的有關概念信息,信息量,信息熵,冗余度編碼方法統計編碼預測編碼變換編碼混合編碼靜態圖像壓縮標準JPEG、JBIG、JPEG2000等MaYingliCMCHBU5.1概述數據編碼的目的各異信息保密信息的壓縮存儲與傳輸等數碼相機—圖像編碼與壓縮技術成功的范例。本章主要介紹靜態圖像壓縮編碼的原理、應用及有關的國際標準。MaYingliCMCHBUMaYingliCMCHBU5.1.1數據壓縮的基本概念數據壓縮以較少的數據量表示信源以原始形式所代表的信息目的在于節省存儲空間、傳輸時間、信號頻帶或發送能量等。MaYingliCMCHBU信源編碼的基本概念

圖像數據壓縮的目的是在滿足一定圖像質量條件下,用盡可能少的比特數來表示原始圖像,以提高圖像傳輸的效率和減少圖像存儲的容量,在信息論中稱為信源編碼。MaYingliCMCHBUMaYingliCMCHBU圖5.1數據壓縮系統組成圖

MaYingliCMCHBU數字通信系統模型信源信源編碼信道編碼調制傳輸信道噪聲解調信道解碼信源解碼信宿MaYingliCMCHBU壓縮檢、糾錯MaYingliCMCHBU熵(Entropy)代表信源所含的平均信息量。若信源編碼的熵大于信源的實際熵,則信源中的數據一定存在冗余度。冗余數據的去除不會減少信息量。信息量與數據量的關系可由下式表示

I

D

du

(5.1)MaYingliCMCHBU5.1.2圖像編碼壓縮的必要性圖像信號的數據量V(volume)(byte,B)

:

V

w·h·d/8

(5.2)w、h、d分別表示圖像數據量(字節,byte,B)、圖像寬度width(像素數,pel)、圖像高度height(像素數,pel)、圖像深度depth(位,bit)。圖像的尺寸為:w·h。MaYingliCMCHBUMaYingliCMCHBU典型圖像的數據量

圖像種類圖像參數數據量二值傳真圖像A4(210297mm)大小、172823762色分辨率501KB灰度圖像512512,8bit灰度等級256KBVGA圖像640480256色300KBCIF視頻圖像352288256色,亮度取樣率為3MHz,亮度和兩色差按4∶1∶1取樣,亮色量化位數共12bit,幀頻29.97,按1s計算4.3MBHDTV亮度信號1280720,量化位數為8bit,幀頻30Hz,按1s計算52.7MBMaYingliCMCHBU5.1.3圖像編碼壓縮的可能性一般圖像中存在著以下數據冗余因素:

編碼冗余像素間的相關性形成的冗余視覺特性和顯示設備引起的冗余MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU5.1.4圖像編碼壓縮的技術指標常用的圖像壓縮技術指標:

圖像熵與平均碼長(Entropyandaveragecodelenthgh)圖像冗余度與編碼效率(Codingefficiency)壓縮比(Compressionratio)客觀評價SNR

主觀評價MaYingliCMCHBU

1、

熵:信源的平均信息量

設圖像像素灰度級表為s={s1,s2,…,sq},其概率分布為P(s)={p(s1),p(s2),…,p(sq)},則信源的熵為MaYingliCMCHBUs作為灰度,共q級,出現概率均等時,p(si)=1/q,

當灰度只有兩級時,即si=0,1,且0出現概率為p1,1出現概率為p2=1-p1,其熵MaYingliCMCHBU

當p1=1/2,p2=1-p1=1/2時,H(s)=1為最大值。如圖所示。MaYingliCMCHBU熵的性質:(1)熵是一個非負數,即總有H(s)≥0。(2)當其中一個符號sj的出現概率p(sj)=1時,其余符號si(i≠j)的出現概率p(si)=0,H(s)=0。(3)當各個si出現的概率相同時,則有最大平均信息量為log2q。(4)熵值總有H(s)≤log2q。MaYingliCMCHBU2、平均碼長:碼字長度的數學期望3、冗余度定義為:MaYingliCMCHBU4、編碼效率定義為:

冗余度接近于0,或編碼效率接近于1的編碼稱為高效碼。MaYingliCMCHBU5、壓縮比:若原始圖象的平均比特率為n,編碼后的平均比特率為nd,則壓縮比C定義為:MaYingliCMCHBU

6、客觀評價—信噪比SNR定義為:MaYingliCMCHBU表5.1圖像質量的主觀評價等級Score評價Notes5優秀圖像質量非常好4良好圖像質量高,有很小的干擾但不影響觀看3中等圖像質量可接受,但有一些干擾,對觀看稍有妨礙2差圖像質量差,對觀看有妨礙1很差,劣圖像質量很差,無法觀看7、主觀評價:MaYingliCMCHBU圖像編碼主、客觀評價的內在關系圖像類型高分辨率廣播電視普通數字廣播電視數據庫圖像會議電視傳輸數碼率客觀評價SNR主觀評價74Mb/s≧48dB≧4.5分34Mb/s≧43dB≧4.0分識別圖像≧36dB≧3.0分64kb/s≧30dB≧2.5分壓縮后圖像MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU5.1.5數據壓縮方法的分類1.無損壓縮(LosslessCompression):Huffman編碼Shannon編碼游程編碼算術編碼輪廓編碼MaYingliCMCHBU2、有損壓縮(LossyCompression)預測編碼變換編碼混合編碼現代壓縮編碼方法:分形編碼模型基(Model-based)編碼MaYingliCMCHBU圖像編碼/壓縮主要分無損圖像壓縮和有損圖像壓縮兩大塊,按其發展歷程可分為:第一代壓縮編碼

八十年代以前,主要是根據傳統的信源編碼方法。第二代壓縮編碼

八十年代以后,突破信源編碼理論,結合分形、模型基、神經網絡、小波變換等數學工具,充分利用視覺系統生理心理特性和圖像信源的各種特性。圖像壓縮方法的分類MaYingliCMCHBU像素編碼變換編碼預測編碼位平面編碼增量調制熵編碼算術編碼DCT變換DPCM調制第一代壓縮編碼其他編碼行程編碼MaYingliCMCHBU子帶編碼模型編碼分層編碼分型編碼第二代壓縮編碼MaYingliCMCHBU預測編碼混合編碼變換編碼……DFT、DCT變換ADPCMDPCM調制……KLT、WHT、SLT、WT變換數據壓縮其他編碼增量調制無損壓縮有損壓縮統計編碼Huffman、Shannon編碼算術編碼行程編碼輪廓編碼MaYingliCMCHBU5.2統計編碼統計編碼根據信源的概率分布特性,分配具有惟一可譯性的可變長碼字,降低平均碼字長度,以提高信息的傳輸速度,節省存儲空間。基本原理在信號概率分布情況已知的基礎上,概率大的信號對應的碼字短,概率小的信號對應的碼字長,這樣就降低了平均碼字長度。MaYingliCMCHBU可變碼長最佳編碼定理在變長編碼中,如果碼字長度嚴格按照信號中符號出現概率大小的相反順序排列,則平均碼字長度一定小于其他符號順序排列方式的平均碼字長度。MaYingliCMCHBU英文字母出現相對頻率字母ABCDEFGHIJKLM百分比8.21.52.84.312.72.22.06.17.00.20.84.02.4字母NOPQRSTUVWXYZ百分比6.77.51.90.16.06.39.12.81.02.40.22.00.1MaYingliCMCHBU英文字母出現相對頻率MaYingliCMCHBU國際莫爾斯電碼符號SymbolABCDEFGHIJKLMCode.--…-.-.-.....-.--.…....----.-.-..--SymbolNOPQRSTUVWXYZCode-.---.--.--.-.-.…-..-…-.---..--.----..Symbol0123456789Code-----.----..---…--….-…..-….--...---..----.Symbol.,?:;-/“Code.-.-.---..--..--..---…-.-.-.-…--..-..-..-.MaYingliCMCHBU5.2.1Huffman編碼1.前綴碼(PrefixCode)一組唯一可譯碼的任一個碼字都只與一種信號存在對應關系。為保證唯一可譯碼,任一碼字都不能是其他碼字的前綴。例:f(i)={0,10,110,111}MaYingliCMCHBU5.2.1Huffman編碼1.前綴碼(PrefixCode)4層樹形結構的編碼情況MaYingliCMCHBUf(i)={0,10,110,111}為其子樹。MaYingliCMCHBU2.Huffman編碼算法:①將圖像的灰度等級按概率大小進行升/降序排序。②在灰度級集合中取兩個最小概率相加,合成一個概率。③新合成的概率與其他的概率成員組成新的概率集合。④在新的概率集合中,仍然按照步驟②~③的規則,直至新的概率集合中只有一個概率為1的成員。這樣的歸并過程可以用二叉樹描述。⑤從根節點按前綴碼的編碼規則進行二進制編碼。MaYingliCMCHBUMaYingliCMCHBU

信號源s={s1,s2,s3,s4,s5,s6},其概率分布為p1=0.4p2=0.3p3=0.1p4=0.1p5=0.06p6=0.04,求最佳Huffman碼。例方法:將信源符號按出現概率從大到小排成一列,然后把最末兩個符號的概率相加,合成一個概率。MaYingliCMCHBU把這個符號的概率與其余符號的概率按從大到小排列,然后再把最末兩個符號的概率加起來,合成一個概率。重復上述做法,直到最后剩下兩個概率為止。從最后一步剩下的兩個概率開始逐步向前進行編碼。每步只需對兩個分支各賦予一個二進制碼,如對概率大的賦予碼元0,對概率小的賦予碼元1。MaYingliCMCHBUHuffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04MaYingliCMCHBUHuffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.4Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S1=1Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S2=00Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S3=011Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S4=0100Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S5=01010Huffman編碼MaYingliCMCHBU例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S6=01011Huffman編碼MaYingliCMCHBU編碼結果例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04代碼10001101000101001011碼長123455MaYingliCMCHBU1001S1S2111000S5S4S3S6編碼效率:MaYingliCMCHBU【例5.1】第1行和第2行列舉了一個信源的統計特性結果如第三行所示符號集{xi}x1

x2

x3

x4

x5

x6

概率分布{pi}0.400.200.120.110.090.08Huffman編碼101000000101100111MaYingliCMCHBUHuffman編碼示意圖上圖所示為建立碼的過程下圖所示為從根開始,經各中間節點到葉節點的路徑采用二進制編碼的情況MaYingliCMCHBU【例】MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU3.Huffman編碼的性能優點:實現Huffman編碼的基礎是統計源數據集中各信號的概率分布。Huffman編碼在無失真的編碼方法中效率優于其他編碼方法,是一種最佳變長碼,其平均碼長接近于熵值。缺點:當信源數據成分復雜時,龐大的信源集致使Huffman碼表較大,碼表生成的計算量增加,編譯碼速度相應變慢不等長編碼致使硬件譯碼電路實現困難。上述原因致使Huffman編碼的實際應用受到限制。MaYingliCMCHBU4.圖像的Huffman編譯碼系統MaYingliCMCHBUClaudeElwoodShannon

(1916–2001)ClaudeElwoodShannon(April30,1916–February24,2001)wasanAmerican

mathematician,electronicengineer,andcryptographerknownas"ThefatherofInformationTheory".MaYingliCMCHBU5.2.2Shannon編碼與Fano編碼5.2.2Shannon編碼與Fano編碼1.Shannon提出了將信源符號依其概率降序排列,用符號序列累積概率的二進制表示作為對信源的唯一可譯編碼。其應用于圖像編碼的步驟如下:(1)將N個灰度級xi按其概率遞減進行排列。(2)求概率分布pi的第i個灰度級的二進制位數ni。

(5.10)

(3)計算與pi相對應的累積概率Pi,把與Pi相對應的二進碼和接下去與pk(k>i)相應的碼相比較,前面的ni位至少有一位以上的數字是不同的。MaYingliCMCHBU【例5.2】由表5.3計算該信源的Shannon編碼平均碼字長度為2.92,較Huffman編碼為長。MaYingliCMCHBU2.Fano編碼步驟(1)將圖像灰度級xi其概率大小按遞減順序進行排序。(2)將xi分成兩組,使每組的概率和盡量接近。給第一組灰度級分配代碼“0”,第二組分配代碼“1”。(3)若每組還是由兩個或以上的灰度級組成,重復上述步驟,直至每組只有一個灰度級為止。MaYingliCMCHBU【例5.3】圖5.6以表5.3的信源為例說明Fano編碼。MaYingliCMCHBU5.2.3算術編碼MaYingliCMCHBUMaYingliCMCHBU5.2.3算術編碼在信源各符號概率接近的條件下,算術編碼是一種優于Huffman編碼的方法。【例】根據信源的概率分布進行算術編碼。已知信源的概率分布為求二進制序列01011的編碼。MaYingliCMCHBU解:步驟如下:(1)二進制信源只有x1=0和x2=1兩種符號,相應的概率為pc=2/5,pe=1-pc=3/5(2)設s為區域左端起始位置,e為區域右端終止位置,l為子區的長度,則符號“0”的子區為[0,2/5),子區長度為2/5;符號“1”的子區為[2/5,1],子區長度為3/5。舉例2MaYingliCMCHBU(3)隨著序列符號的出現,子區按下列公式減少長度:新子區左端=前子區左端+當前子區左端×前子區長度新子區長度=前子區長度×當前子區長度設初始子區為[0,1],步序為step,則編碼過程參見實例。可見,最后子區左端起始位置MaYingliCMCHBU最后子區長度最后子區右端終止位置編碼結果為子區起始位置與終止位置之中點

=0.0011。所以,二進序列的算術編碼為0011。MaYingliCMCHBU算術編碼算法的計算步驟實例stepx

s

l

1002/5210+(2/5)×(2/5)=4/25(2/5)×(3/5)=6/25302/5+0×6/25=4/25(6/25)×(2/5)=12/125414/25+(2/5)×(12/125)=124/625(12/125)×(3/5)=36/62551124/625+(2/5)×(36/625)=692/3125(36/625)×(3/5)=108/625MaYingliCMCHBU舉例2MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU算術編碼的過程:MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU算術編碼與Huffman編碼的比較:MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU5.3預測編碼預測編碼的基本思想:在某種模型的指導下,根據過去的樣本序列推測當前的信號樣本值,然后用實際值與預測值之間的誤差值進行編碼。如果模型與實際情況符合得比較好且信號序列的相關性較強,則誤差信號的幅度將遠遠小于樣本信號。MaYingliCMCHBUMaYingliCMCHBU圖像差值幅度的概率分布MaYingliCMCHBU5.3.1預測編碼基本原理對實際值與預測值之間的誤差值進行編碼差分脈沖編碼調制DifferentialPulseCodeModulationDPCMMaYingliCMCHBU圖5.8DPCM系統的組成

MaYingliCMCHBU5.3.2線性自適應預測編碼假設經掃描后的圖像信號x(t)是一個均值為零、方差為的平穩隨機過程。線性預測就是選擇ai(i

1,2,…,N

1)使預測值

并且使差值en的均方值為最小。預測信號的均方誤差(MSE)定義為

E{en}=E{(xn

-x′n)2} MaYingliCMCHBU設計最佳預測的系數ai,采用MMSE最小均方誤差準則。可以令定義xi和xj的自相關函數

R(i,j)=E{xi,xj}寫成矩陣形式為Yule-Walker方程組

若R(i)已知,該方程組可以用遞推算法來求解ai。MaYingliCMCHBU通過分析可以得出以下結論:圖像的相關性越強,壓縮效果越好。當某個階數已使E{eN,eN1}0時,即使再增加預測點數,壓縮效果也不可能繼續提高。若{xi}是平穩m階Markov過程序列,則m階線性預測器就是在MMSE意義下的最佳預測器。MaYingliCMCHBU圖5.9當前像素與鄰近像素的位置關系MaYingliCMCHBU常用預測器方案前值預測:用x0同一行的最近鄰近像素來預測

=x0一維預測:如上圖中的x1、x5。二維預測:如上圖中的x1、x2、x3、x4、x5、x6、x7等。三維預測MaYingliCMCHBU5.3.3自適應預測編碼自適應預測預測參數根據信號的統計特性來確定,以達到最佳預測預測編碼的優點直觀快捷、便于實現預測編碼的缺點壓縮比不夠高MaYingliCMCHBU5.4變換編碼5.4.1變換編碼的基本原理

通過數學變換可以改變信號能量的分布,從而壓縮信息量。以傅里葉變換的概念說明合理的變換可以改變信號能量分布的基本原理。MaYingliCMCHBU變換可以改變信號能量的分布(MaYingliCMCHBU5.4.2變換編碼的系統結構圖5.10變換編碼系統正交變換量化編碼傳輸/儲存解碼反交換圖像輸入圖像輸出MaYingliCMCHBU5.4.3變換編碼的實現在變換編碼中有以下幾個問題值得注意:圖像變換方法的選取子圖像大小的選取常用的圖像編碼方法區域編碼閾值編碼混合編碼MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU變換編碼MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU幀內混合編碼原理圖變換編碼變換編碼變換編碼預測編碼信道傳輸/存儲預測編碼反變換

f(1,n)F(1,n)e(1,n)e‘(1,n)f(2,n)F(2,n)e(2,n)e‘(2,n)f(M,n)F(M,n)e(M,n)e‘(M,n)f‘(1,n)f‘(2,n)f‘(M,n)…….……..……………………….MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBUDCT變換:正變換:逆變換:其中:MaYingliCMCHBUMaYingliCMCHBUHuffman:42bits;

編碼效率32.8%Huffman:16bits;編碼效率:12.5%例:原圖像為:DCT變換除以量化系數,取整MaYingliCMCHBUMaYingliCMCHBUDCT變換編碼實例原圖解壓圖MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU5.4.4整數小波變換與圖像壓縮量化器的設計是決定圖像保真度的關鍵環節,而傳統的DCT和經典小波變換在圖像變換后會產生浮點數,因而必須對變換后的數據進行量化處理,這樣就產生不同程度的失真。新一代的整數小波變換(又叫第二代小波變換)采用提升方法能夠實現整數變換,因而能夠實現圖像的無損壓縮,顯然它是一種很適合于醫學等圖像的壓縮方法。

新的靜態圖像壓縮標準JPEG2000中采用了基于提升方法的整數小波變換。MaYingliCMCHBU提升方法構造小波分為分裂、預測和更新3個步驟。1.分裂(split)將一原始信號序列sj按偶數和奇數序號分成兩個較小的、互不相交的小波子集sj-1和dj-1:2.預測(predict)由于數據間存在相關性,因而可以定義一個預測算子P,用P(sj-1)來預測

dj-1.。這樣可用相鄰的偶數序列來預測奇數序列。用dj-1與P(sj-1)的差值代替dj-1,則數據量要比原始dj-1要小得多。3.更新(update)上述兩個過程一般不能保持原圖像中的某些整體性質(如亮度),為此我們要構造一個U算子去更新s,使之保持原有數據集的某些特性。MaYingliCMCHBU5.5二值圖像編碼只有“白”(用“0”表示)和“黑”(用“1”表示)兩個灰度級稱之為二值圖像(binaryimage)。二值圖像通常是由人為產生的,如由文字組成的文檔文件、表格、工程圖紙、地圖等。一幅二維圖像按位平面進行分解可以得到若干個二值圖像,因而二值圖像的編碼方法為逐進編碼模式奠定了基礎。MaYingliCMCHBU5.5.1跳躍空白編碼(skipblankcoding)將圖像的每一條掃描線分成若干等長的段,每段有m個像素,一般m=8~12。這些掃描線段的組成可能出現二類情況:(1)全是“0”像素。這種線段稱為“空白塊(blank)”,常表示二值圖像的背景成分。編碼時“空白塊”用碼字“0”表示。(2)全是“1”像素或由“0”、“1”像素混合而成。編碼時,這種線段用“1”加直接編碼表示。MaYingliCMCHBU上述方法很容易推廣的在二維情形中。將圖像劃分為若干個子圖像。當子圖像像素全為0時,編碼為“0”;否則,子圖像的編碼首位為“1”,其余碼位(codeposition)采用像素的直接編碼表示。MaYingliCMCHBU5.5.2游程長度編碼RLC(RunLengthCoding)一種簡單的無損編碼技術,它改變連續出現相同字符的表達方式,以降低碼長。傳真的二值圖像中,連“0”或連“1”總是成串出現,稱為“白游程”和“黑游程”。非二值的相同連續數據串,同樣簡化為兩個符號:一個符號代表數據,第二個代表串長。游程長度編碼一般不直接單獨使用,通常配合其他編碼方式使用來提高壓縮效果。MaYingliCMCHBU二維行程編碼要解決的核心問題是:

將二維排列的像素,采用某種方式轉化成一維排列的方式。之后按照一維行程編碼方式進行編碼。(a)(b)兩種典型的二維行程編碼的排列方式MaYingliCMCHBU如果按照行掃描的順序排列的話,數據分布為:行程編碼為:(3,130),(1,129),(1,134),(1,133),(1,129),(4,130),(1,129),(1,134),(1,133),(5,130),(1,129),(2,132),(2,130),(1,129),(2,130),(1,129),(2,130),(2,129),(1,127),(1,128),(1,127),(1,129),(1,131),(1,129),(1,131),(1,130),(1,127),(1,128),(1,127),(1,128),(1,127),(1,128),(2,132),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,127),(1,125),(2,128),(1,126),(1,130),(2,131)數據量為:46*(3+8)=506(bit)(98.83%)數據量:64*8=512(bit)【例】MaYingliCMCHBU如果按照列掃描的順序排列的話,數據分布為:行程編碼為:數據量為:42*(3+8)=462(bit)(92.03%)(3,130),(1,129),(2,127),(1,125),(1,127),(4,130),(2,128),(1,126),(1,125),(4,130),(2,127),(1,129),(1,128),(5,129),(1,128),(1,129),(1,128),(2,134),(1,132),(1,130),(1,131),(2,127),(1,126),(2,133),(1,132),(1,130),(1,129),(1,128),(1,129),(1,130),(1,129),(2,130),(1,129),(1,131),(1,132),(1,133),(1,131),(3,130),(1,129),(1,130),(2,132),(1,131)MaYingliCMCHBU如果按照方式(a)掃描的順序排列的話,數據分布為:行程編碼為:數據量為:43*(3+8)=473(bit)(94.22%)(7,130),(2,130),(4,129),(2,130),(1,129);(1,127),(1,128),(1,127),(1,129),(1,131),(1,130),(1,132),(2,134),(2,133),(1,132),(1,130),(1,129),(1,128),(1,127),(1,128),(1,127),(1,128),(1,127),(1,125),(1,126),(2,129),(1,127),(1,129),(1,133),(1,132),(1,131),(1,129),(2,130),(1,129),(3,130),(1,129),(1,130),(2,132),(2,131),(1,130),(1,126),(2,128),(2,127)MaYingliCMCHBUMaYingliCMCHBUMaYingliCMCHBU該壓縮算法常用于二值圖像編碼中,如位平面編碼(bit-planecoding)MaYingliCMCHBUMaYingliCMCHBU5.6新型的圖像壓縮編碼方法經典的編碼方法利用去除圖像數據的相關性等方法對圖像進行壓縮,其壓縮效果受到一定的限制。模型編碼利用對圖像建模的方法對圖像參數進行估計。由于參數的數據量遠遠少于圖像的數據量,因而用模型編碼對壓縮數據量極其有效。常見的模型編碼有:分形編碼(fractalcoding)自適應網格編碼(self-adaptivemeshcoding)MaYingliCMCHBU5.6.1分形(fractal)的基本概念與經典的編碼方法相比,分形編碼在思路上有新的突破,其壓縮比高出一般編碼方法2~3個數量級。壓縮過程時間長但解壓縮速度快的特點將使其在大數據量、高質量的多媒體應用、高速網絡等場合中發揮重要的角色。分形的基本思想來源于數學上對客觀世界一些現象的自相似性描述。分形是一種由許多與全局相似的局部所構成的形體。對于集合A,如果描述其中的點需要d個坐標,則稱該集合A是d維的,即dim(A)=d

(5.37)在分形幾何學中,d可以擴展為分數,這時d稱為分維。MaYingliCMCHBU5.6.2分形壓縮的基本方法分形壓縮將圖像分解成若干子圖像,利用圖像的仿射變換可以尋找出子圖像間的自相似性。仿射變換是指對子圖像進行旋轉、伸縮、位移變換。仿射變換的特性有:(1)仿射變換的逆變換也是仿射變換。(2)仿射變換是線性變換。(3)兩平行線經過仿射變換后仍然是平行線,所以平行四邊形經仿射變換后變成另外一個平行四邊形。(4)可以通過變換參數求解變換后平面圖形的面積與原平面圖形面積的比值。(5)選擇合適的參數,仿射變換為相似變換。MaYingliCMCHBU通過用數據量極小的系數代替數據量較大的實際像素值而將圖像表示成壓縮形式。目前采用全自動的分形壓縮,對灰度圖像一般可以達到4:1~100:1,對彩色圖像壓縮比還可以更高些。壓縮時間較慢,而解壓縮時間極快。用戶常常關心的是解壓縮時間,因而分形壓縮的這種不對稱性對使用數據的用戶是很有用的。如果采用這種技術制作VCD、DVD將使其具有廣泛的市場前景。分形壓縮的另一個特點是壓縮特性與分辨率無關利用分形壓縮的圖像可以按不同分辨率實現無級縮放而計算量相同。MaYingliCMCHBUMaYingliCMCHBU5.7圖像壓縮編碼標準在靜態圖像壓縮編碼標準中,比較著名的有JPEG、JBIG等標準。視頻可看成是一幅幅不同但相關的靜態圖像的時間序列。靜態圖像的壓縮技術和標準可以直接應用于視頻的單幀圖像。介紹:適用于靜態圖像的JPEG標準和JBIG標準新的JPEG2000壓縮國際標準MaYingliCMCHBU5.7.1彩色與灰度圖像壓縮標準JPEG1.JPEG算法與系統JPEG基本系統JPEG擴展系統信息保持壓縮系統MaYingliCMCHBU2.JPEG基本系統每個單獨的彩色圖像分量的編碼算法:①將量化精度為8位的待壓縮圖像分成若干個88樣值子塊,做基于88子塊的DCT。②根據最佳視覺特性構造量化表,設計自適應量化器并對DCT的頻率系數進行量化。③為了增加連續的0系數的個數,對量化后的系數進行Z字形重排。④用Huffman碼作變字長熵編碼器對量化系數進行編碼,進一步壓縮數據量。MaYingliCMCHBUJPEG編/解碼器算法框圖MaYingliCMCHBU上述算法的幾點說明(1)彩色空間轉換問題(2)量化

—最佳的亮度量化表和色度量化表。(3)Z字形重排(4)DCT系數的編碼(5)JPEG位數據流MaYingliCMCHBU亮度量化表1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399MaYingliCMCHBU色度量化表17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999MaYingliCMCHBUDCT系數的Z字形排列MaYingliCMCHBU3.JPEG的視頻應用與硬件實現盡管JPEG標準是基于彩色靜止圖像壓縮而提出的,但對于壓縮視頻的幀內圖像也十分有效。每秒可處理2700萬個像素的單片JPEG編/解碼器芯片,已能實時處理常規電視圖像。M-JPEG(Motion-JPEG)技術即運動靜止圖像壓縮技術。這種技術廣泛應用于可精確到幀編輯和多層圖像處理的非線性編輯領域。M-JPEG的壓縮和解壓縮是對稱的,可由相同的硬件和軟件實現。MaYingliCMCHBU5.7.2二值圖像壓縮標準JBIG1980年CCITTT.4建議文件傳真三類機(G3)的一維編碼標準MH,作為二維編碼標準的改進相對元地址指定編碼(MR)。1994年CCITTT.6建議的作為四類傳真機(G4)標準編碼方案:二次改進Huffman編碼(MMR)。二值圖像通過MH,MR和MMR等典型的編碼方法已在傳真機等圖像通信中得到廣泛應用。將一幅二維圖像按位平面進行分解可以得到若干個二值圖像。一幅灰度為256級的圖像可以被分解為8幅二值圖像。支持分層圖像傳送的編碼方法的基本思路是:首先傳送過去一幅分辨率較低的概要圖像,然后隨傳送數據的不斷到來所得到圖像質量逐步提高。MaYingliCMCHBU支持分層圖像傳送的編碼方法的基本思路MaYingliCMCHBU必須滿足的條件和對之進行評價的項目(1)無損編碼。(2)即使接受端不具有幀存儲器,系統也能在順序傳送模式下正常工作。(3)編碼和解碼操作是實時的。(4)壓縮和恢復兩個功能在時間和復雜性方面是對稱的。(5)具有比MMR更高的壓縮能力。(6)利用同一個數據庫可以同時支持順序和逐層兩種壓縮傳送模式。(7)不允許使用全幀預掃描(單路執行算法)。(8)在64Kbps傳輸速率下能夠做到解碼。(9)魯棒性。MaYingliCMCHBU5.7.3JPEG2000靜態圖像壓縮標準1.JPEG2000標準制定的目的JPEG2000標準的目標是進一步改進目前壓縮算法的性能,以適應低帶寬、高噪聲的環境,以及醫療圖像、電子圖書館、傳真、Internet網上服務和保安等方面的應用。JPEG2000還將彩色靜態畫面采用的JPEG編碼方式與2值圖像采用的JBIG編碼方式統一起來,成為對應各種圖像的通用編碼方式。由于JPEG2000它的特性及功能顯著,且支持舊版本的標準,因此在需要有較好的圖像質量、較低的比特率或者是一些特殊特性的要求(漸進傳輸和感興趣區域編碼等)時,JPEG2000將是最好的選擇。MaYingliCMCHBUJPEG2000的應用領域可大致分成兩個方面:一方面面向傳統的JPEG市場如打印、掃描、數字攝像、遙感等另一方面面向一些新興的應用領域如網路傳輸、彩色傳真、無線通訊,醫療影像、電子商務等。MaYingliCMCHBU2.JPEG2000標準提供的主要特征

JPEG2000標準提供了一套新特征這些特征對于一些新產品(如數碼相機)和應用(如互聯網)是非常重要的。它把JPEG的順序模式、漸進模式、無損模式和分層模式四種模式集成在一個標準之中。JPEG2000放棄了以DCT為主的區塊編碼方式采用以小波轉換為主的多解析編碼方式。JPEG2000標準中無損壓縮和有損壓縮所采用的小波分別是基于提升方案的(5,3)整數小波和Daubechies(9,7)整數小波。編碼端以最大的壓縮質量和最大的圖像分辨率壓縮圖像在解碼端可以從碼流中以任意的圖像質量和分辨率解壓圖像,最大可達到編碼時的圖像質量和分辨率。MaYingliCMCHBUJPEG2000的最主要的特征(1)高壓縮率。(2)無損壓縮和有損壓縮。(3)漸進傳輸。(4)感興趣區域壓縮。(5)碼流的隨機訪問和處理。(6)容錯性。(7)開放的框架結構。(8)基于內容的描述。MaYingliCMCHBU3.JPEG2000的基本框架和實現(1)對原始圖像數據進行離散小波變換(DWT)(2)對變換后的小波系數進行量化(3)對量化后的數據熵編碼(4)最后形成輸出碼流。解碼器是編碼器的逆過程。MaYingliCMCHBU本章小結理解和掌握

數字圖像編碼與壓縮的理論基礎是本章的重點。熟知各種國際標準的特點、應用領域。了解各種編/解碼器的原理和軟件和硬件實現。注意數字圖像編碼與壓縮技術的最新發展和應用前景。MaYingliCMCHBU(1)數據壓縮的基本概念編碼冗余使圖像編碼壓縮成為可能。像素間的相關性形成的冗余視覺特性和顯示設備引起的冗余MaYingliCMCHBU(2)數據壓縮方法無損壓縮有Huffman編碼Shannon編碼游程編碼算術編碼和輪廓編碼等。有損壓縮有預測編碼變換編碼。混合編碼是將預測編碼與變換編碼相結合現代壓縮編碼方法有分形編碼模型基編碼等。MaYingliCMCHBU(3)預測編碼基本原理是利用當前像素與鄰近像素的位置關系計算預測信號,系統所傳遞的是誤差信號,這種差值的概率分布集中在小數值上,大差值的概率極小,有利于用可變碼長編碼以減少傳送的信息量。按利用的鄰近像素的不同,可以是前值預測一維預測二維預測三維預測等。MaYingliCMCHBU(4)變換編碼基本原理是利用坐標變換,如果選擇的變換坐標與圖像特征相匹配就可以大大壓縮二維數據。重要的變換編碼方法是離散余弦變換DCT,它有快速算法,二維變換可以轉化為二次一維變換。DCT變換后的系數相對集中,還可以進一步進行量化,從而更大幅度地壓縮圖像的數據量。MaYingliCMCHBU(5)無損壓縮降低編碼的冗余,在不減少傳送信息量的條件下減少了碼率。主要類型有Huffman編碼算術編碼游程編碼MaYingliCMCHBU(6)JPEG標準適用于靜止圖像。它將圖像分解為8×8的樣值子塊用DCT進行變換、量化、Z字形重排用霍夫曼碼對量化系數進行編碼,進一步壓縮數據量。新的發展JPEG2000標準MaYingliCMCHBUEndofChapter5MaYingliCMCHBUThankYouMaYingliCMCHBU5.8混合編碼設計思想:每一種編碼方式都有其擅長的一點,以及局限的一點,混合編碼的思想就是將兩種以上的編碼方式的優點進行綜合,達到提高編碼效率的目的。MaYingliCMCHBU混合編碼實現的可能性及有效性分析回顧一下講過的幾個內容的特點:1)行程編碼:擅長于重復數字的壓縮。2)Huffman編碼:擅長于像素個數分布不均勻情況下的編碼。3)DCT變換:擅長分離視覺敏感與不敏感的部分。MaYingliCMCHBU例:

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157

行程編碼:4a3b2c1d5e7f

(共6*(8+3)=66Bits)17666MaYingliCMCHBU

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157Huffman編碼:

f=01e=11a=10b=001c=0001d=0000

1010101010001001001000100010000111111111101010101010101

(共7*2+5*2+4*2+3*3+2*4+1*4=53bits)

1766653MaYingliCMCHBU

aaaa

bbb

cc

d

eeeee

fffffff

(共22*8=176bits)

432157Hufman與行程編碼混合:

41030012000110000511701

(共:3+2+3+3+3+4+3+4+3+2+3+2=35bits)176665335

100%37.5%30.1%

9.9%MaYingliCMCHBU圖像壓縮的實例1一次小波變換DCT變換.行程編碼Huffman編碼一次小波變換Huffman編碼變字長行程編碼2差值編碼MaYingliCMCHBUMaYingliCMCHBU復原圖原圖算法1信噪比:66.02壓縮比:11.83:1MaYingliCMCHBU復原圖原圖信噪比:64.55壓縮比:26.50:1算法2現代壓縮編碼示例原圖JPEG100:1混合編碼400:1混合編碼600:1MaYingliCMCHBU5.9圖像壓縮標準二值圖像壓縮標準靜止圖像壓縮標準視頻和運動圖像壓縮標準MaYingliCMCHBU5.8.1二值圖像壓縮標準MaYingliCMCHBU5.8.2靜止圖像壓縮標準1.JPEG

聯合圖像專家組(JointPhotographicExpertsGroup),為單幀彩色圖像壓縮編碼制定靜止圖像壓縮標準JPEG。圖像尺寸可在1~65535行/幀、1~65535像素/行的范圍內。它在較低的計算復雜度下能提供較高的壓縮比與保真度。它采用四種編解碼模式串行(Sequential)DCT(DiscreteCosineTransform)方式、逐漸浮現式(progressive)DCT方式、無失真(Lossless)方式和分層(Hierarchical)方式。該系統的核心屬于變換編碼編碼過程,分為圖像分割二維DCT變換、量化、熵編碼等幾個階段。由于JPEG優良的品質,網站上百分之八十的影像都采用JPEG標準。隨多媒體應用領域的急增,傳統JPEG壓縮技術已無法滿足人們對多媒體影像資料的要求,更高壓縮率以及更多新功能的新一代靜態影像壓縮技術JPEG-2000就誕生了。MaYingliCMCHBU2.JPEG2000JPEG

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論