數字圖像處理-第12章 圖像編碼_第1頁
數字圖像處理-第12章 圖像編碼_第2頁
數字圖像處理-第12章 圖像編碼_第3頁
數字圖像處理-第12章 圖像編碼_第4頁
數字圖像處理-第12章 圖像編碼_第5頁
已閱讀5頁,還剩94頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1第12章圖像編碼數字圖像處理:使用MATLAB分析與實現2為減少視頻信號的數據量,實現有效的傳輸和存儲,因此,需要關注壓縮編碼技術。利用圖像固有的統計特性,以及視覺生理、心理學特性,或者記錄設備和顯示設備等的特性,從原始圖像中經過壓縮編碼提取有效信息,盡量去除無用的或用處不大的冗余信息,以便高效率的進行圖像的數字傳輸或存儲,而且在復原時仍能夠獲得與原始圖像相差不多的復原圖像。第12章圖像編碼主要內容12.1圖像編碼的基本理論12.2圖像的無損編碼12.3圖像的有損編碼12.4JPEG標準和JPEG20003412.1.1圖像壓縮的必要性12.1.2圖像壓縮的可能性12.1.3圖像編碼方法的分類12.1.4圖像編碼壓縮術語簡介12.1圖像編碼的基本理論512.1.1圖像壓縮的必要性圖像編碼的基本理論如一部90分鐘的彩色電影,每秒放映24幀。把它數字化,每幀512

512像素,每像素的R、G、B三分量分別占8b,則總比特數為

90

60

24

3

512

512

8bit=97,200MB

如一張CD光盤可存600MB數據,存儲這部電影光圖像(還有聲音)就需要160張CD光盤。因此,傳輸帶寬、速度、存儲器容量的限制使得對圖象數據進行壓縮顯得非常必要。612.1.2圖像壓縮的可能性圖像編碼的基本理論圖像壓縮所要解決的問題是盡量減少表示數字圖像時需要的數據量,而減少數據量的基本原理是去除其中的冗余數據。數字圖像中的冗余?-----編碼冗余,像素間冗余,心理視覺冗余。

如果能減少或消除其中的一種或多種冗余,就能取得數據壓縮效果。712.1.2圖像壓縮的可能性圖像編碼的基本理論(1)編碼冗余

編碼冗余,又稱為信息熵冗余。如果一個圖像的灰度級編碼,使用了多于實際需要的編碼符號,就稱該圖像包含了編碼冗余。如果用8bit表示該圖像的像素,那么則認為該圖像存在編碼冗余。因為該圖像的像素只有兩個灰度級,用1bit即可表示。

在大多數圖像中,圖像像素的灰度值分布是不均勻的,因此若對圖像的灰度值直接進行自然二進制編碼(等長編碼),則會對有最大和最小概率可能性的值分配相同比特數,而產生了編碼冗余。12.1.2圖像壓縮的可能性圖像編碼的基本理論(1)編碼冗余1010000112.1.2圖像壓縮的可能性圖像編碼的基本理論(1)編碼冗余

用自然二進制編碼時沒有考慮像素灰度值出現的概率。只有按概率分配編碼長度,才是最精減的編碼方法。灰度級出現概率大的用短碼表示,出現概率小的灰度級用長碼表示,則有可能使編碼總長度下降。12.1.2圖像壓縮的可能性圖像編碼的基本理論(1)編碼冗余1112.1.2圖像壓縮的可能性圖像編碼的基本理論(2)像素間冗余對應圖像目標的像素之間一般具有相關性。因此,圖像中一般存在與像素間相關性直接聯系著的數據冗余——像素相關冗余。1212.1.2圖像壓縮的可能性圖像編碼的基本理論空間冗余。鄰近像素灰度分布的相關性很強。頻間冗余。多譜段圖像中各譜段圖像對應像素之間灰度相關性很強。時間冗余。序列圖像幀間畫面對應像素灰度的相關性很強。結構冗余。有些圖像存在較強的紋理結構或自相似性,如墻紙、草席等圖像。知識冗余。有些圖像中包含與某些先驗知識相關的信息(2)像素間冗余1312.1.2圖像壓縮的可能性圖像編碼的基本理論(3)心理視覺冗余

人的眼睛并不是對所有信息都有相同的敏感度,有些信息在通常的視覺感覺過程中與另外一些信息相比來說并不那么重要,這些信息可以認為是心理視覺冗余的。1412.1.3圖像壓縮方法的分類圖像編碼的基本理論(1)基于編碼前后的信息保持程度的分類信息保持編碼,也稱無損編碼

在編解碼過程中保證圖像信息不丟失;

通常壓縮比一般不超過3:1。保真度編碼,也稱有損編碼

丟掉一些人眼不敏感的次要信息,在一定保真度準則下,最大限度地壓縮圖像。特征提取。在圖像識別、分析和分類等技術中,只對感興趣部分特征進行編碼壓縮。1512.1.3圖像壓縮方法的分類圖像編碼的基本理論(2)基于編碼方法的分類熵編碼。基于信息統計特性的編碼技術。

如行程編碼、Huffman編碼和算術編碼等。預測編碼。常用的有差分脈沖編碼調制和運

動估計與補償預測編碼法。變換編碼。將空間域圖像經過正交變換映射

到另一變換域上,再采用適當的量化和熵編碼來有效壓縮圖像。通常采用的變換:離散傅里葉變換(DFT)、離散余弦變換(DCT)和離散小波變換(DWT)等。16其它方法早期的編碼方法,如混合編碼、矢量量化、LZW算法等。近些年來新的壓縮編碼方法,如使用人工神經元網絡ANN的壓縮編碼、分形編碼、小波編碼(WaveletCoding)、基于模型的壓縮編碼(ModelBasedCoding)和基于對象的壓縮編碼(ObjectBasedCoding)等。12.1.3圖像壓縮方法的分類圖像編碼的基本理論1712.1.4圖像編碼術語簡介圖像編碼的基本理論(1)壓縮比r

一般情況下壓縮比r1,r愈大則壓縮程度愈高。(2)圖像熵H

令p(di)為數字圖像第i個灰度級di相應出現概率1812.1.4圖像編碼術語簡介圖像編碼的基本理論(3)編碼效率

令Li為數字圖像第i個灰度級di的編碼長度

1912.2.1無損編碼理論12.2.2Huffman編碼12.2.3算術編碼12.2.4LZW編碼12.2圖像的無損壓縮編碼2012.2.1無損編碼理論圖像的無損壓縮編碼

其中,H(X)為信源X的熵;

為任意小的正數該定理一方面指出了每個字符平均碼字長度的下限為信源的熵,另一方面說明存在任意接近該下限的編碼。(1)Shannon無失真編碼定理2112.2.1無損編碼理論圖像的無損壓縮編碼(2)示例若采用等長編碼,等長編碼是將所有符號當作等概率事件處理的。碼字:碼流:30位假設有一原始符號序列為:

2212.2.1無損編碼理論圖像的無損壓縮編碼若采用變字長編碼,變字長編碼是每個符號的碼字長度隨字符出現概率而變化。實際出現次數統計:a1

共有8次,a2共有2次,a3共有1次,a4共有4次,采用變長編碼:碼流:碼字:25位23若編碼時,對出現概率較大的符號用較少比特數(短碼)表示,對出現概率較小的符號用較多比特數(長碼)表示,則其平均碼字長度要比等長編碼時所需碼字少。12.2.1無損編碼理論圖像的無損壓縮編碼(3)變字長最佳編碼定理2412.2.2Huffman編碼圖像的無損壓縮編碼

這為Huffman于1952年提出的一種編碼方法,是一種最佳編碼方法。所謂最佳編碼方法是指采用Huffman編碼方法得到的單元像素的比特數最接近圖像的實際熵值。而熵為進行無失真編碼的理論極限。Huffman編碼是根據可變長最佳編碼定理,應用哈夫曼算法而產生的一種編碼方法。2512.2.2Huffman編碼圖像的無損壓縮編碼(1)Huffman編碼步驟概率統計,得n個不同概率灰度信息符號;由大到小概率排序;相加兩個最小概率(概率個數減為n-1個),形成新概率集合;再按上一步方法重排,如此重復直到僅有兩個概率為止;分配碼字。原則為從最后一步反向進行,賦值二進制碼元(0,1),構成Huffman碼字;對最后兩個概率:一個賦予“0”碼,一個

賦予“1”碼,這里賦予0和1完全隨機。2612.2.2Huffman編碼圖像的無損壓縮編碼(2)示例

給出一幅8

8的圖像f,要求:對其進行Huffman編碼。計算編碼效率、壓縮比及冗余度。2712.2.2Huffman編碼圖像的無損壓縮編碼解:由題意可知,圖像f共有8個灰度級符號:

0

,

1

,

2

,

3

,

4

,

5

,

6

,

7

。對圖像中的灰度級進行概率統計符號概率p725/6425/6425/6425/6425/6425/6439/64p511/6411/6411/6412/6416/6423/6425/64p27/647/649/6411/6412/6416/64p37/647/647/649/6411/64p45/645/647/647/64p14/645/645/64p63/644/64p02/64其Huffman編碼過程為:0000001111112812.2.2Huffman編碼圖像的無損壓縮編碼012912.2.2Huffman編碼圖像的無損壓縮編碼編碼結果為

0

1

2

3

4

5

6

7

碼字00011010101100000100001000101碼長54344351平均碼字長度=2.625比特/像素30信源熵=2.564比特/像素編碼效率12.2.2Huffman編碼圖像的無損壓縮編碼31

12.2.2Huffman編碼圖像的無損壓縮編碼32(3)例程----

實現【例12.1】中的圖像的Huffiman編碼12.2.2Huffman編碼圖像的無損壓縮編碼程序見教材【例12.2】程序運行結果和【例12.1】相同。Huffiman編碼的最佳輸出碼字并不唯一,但其平均碼長是一樣的,所以不影響編碼效率和數據壓縮性能。3312.2.3算術編碼圖像的無損壓縮編碼Huffman編碼需要為每一個符號設定一個碼字輸出。Huffman編碼碼字輸出必須為整數比特位。算術編碼無需為每一個符號設定一個碼字。即不存在源符號和碼字間的一一對應關系。算術編碼特點:算術編碼是用一個單獨的浮點數來代替一串輸入符號,其編碼輸出可為分數比特位。3412.2.3算術編碼圖像的無損壓縮編碼(1)算術編碼的基本思想算術編碼將待編碼的圖像數據看作是由多個符號組成的序列,直接對該符號序列進行編碼。為一個多符號序列算術編碼。經算術編碼后輸出的碼字對應于整個符號序列,而每個碼字本身確定了0和1之間的1個實數區間。3512.2.3算術編碼圖像的無損壓縮編碼將輸入圖像看作為一個位于實數線上區間[0,1)的信息符號序列。概率統計,建立相應概率模型。根據每個符號出現概率劃分若干個子區間。各子區間互不重疊,每個子區間有一個惟一起始值或左端點。當對輸入的符號序列編碼時,依據符號出現概率來劃分子區間寬度。這就是區間作為代碼的原理。(2)算術編碼的基本原理3612.2.3算術編碼圖像的無損壓縮編碼(3)算術編碼的迭代遞推公式:

StartN

=StartB

+LeftC

LEndN=StartB

+RightC

L式中—StartN

:新子區間的起始位置

EndN

:新子區間的結束位置

StartB

:前子區間的起始位置

LeftC

:當前符號的區間左端

RightC

:當前符號的區間右端

L:前子區間寬度37(4)示例p(1)=0.4,p(2)=0.2,p(3)=0.2,p(4)=0.212.2.3算術編碼圖像的無損壓縮編碼解:[0,0.4);[0.4,0.6);[0.6,0.8);[0.8,1.0);00.40.60.811234對符號1,2,3,4在[0,1)內分別建立編碼區間:試對圖像信源數據集:[41312]進行算術編碼。其中各符號出現概率:3812.2.3算術編碼圖像的無損壓縮編碼根據算術編碼迭代公式,計算新區間:前符號區間為[0,1

,而符號4為[0.8,1.0

StartN=StartB

+LeftC

L=0+0.8

1=0.8

EndN=StartB

+RightC

L=0+1.0

1=1.0

符號4的新編碼區間為[0.8,1.0

,寬度為0.2前符號區間為[0.8,1.0

,而符號1為[0,0.4

:

StartN=StartB

+LeftC

L=0.8+0

0.2=0.8

EndN=StartB

+RightC

L=0.8+0.4

0.2=0.88

符號1的新編碼區間為[0.8,0.88

,寬度為0.08對符號4進行編碼對符號1進行編碼3912.2.3算術編碼圖像的無損壓縮編碼前符號區間為[0.8,0.88

,而符號3為[0.6,0.8

:

StartN=StartB

+LeftC

L=0.8+0.6

0.08=0.848

EndN=StartB

+RightC

L=0.8+0.8

0.08=0.864符號3的新編碼區間為[0.848,0.864

,寬度為0.016前符號區間為[0.848,0.864

,而符號1為[0,0.4

:StartN=StartB

+LeftC

L=0.848+0

0.016=0.848

EndN=StartB

+RightC

L=0.848+0.4

0.016=0.8544

符號1的新編碼區間為[0.848,0.8514

,寬度為0.0064對符號3進行編碼對符號1進行編碼4012.2.3算術編碼圖像的無損壓縮編碼前符號區間為[0.848,0.8544

,而符號2為[0.4,0.6

:StartN=StartB+LeftC

L=0.848+0.4

0.0064=0.85056EndN=StartB+RightC

L=0.848+0.6

0.0064=0.85184

符號2的新編碼區間為[0.85056,0.85184

數據串[41312]的編碼區間為[0.85056,0.85184

。或者說在此區間內任一實數值都唯一對應該數據序列。對符號2進行編碼數據串[41312]的編碼輸出4112.2.3算術編碼圖像的無損壓縮編碼為了取碼長為最短的碼字作為最后的實際編碼碼字輸出把該十進制實數區間用二進制表示為:

[0.110110011011,0.110110100001

忽視小數點,不考慮“0.”,。輸出碼字為:1101101為對[41312]進行算術編碼的結果。數據串[41312]的編碼值為11011014212.2.3算術編碼圖像的無損壓縮編碼熵為:=1.92比特/字符

平均碼長:=2比特/字符

編碼效率:43基于MATLAB編程實現對【例12.3】中的圖像實現算術編碼程序見教材【例12.4】程序運行結果和【例12.3】相同。12.2.3算術編碼圖像的無損壓縮編碼由上面的例子可知:算術編碼就是將每個字符串都與一個子區間[StartN,

EndN

相對應,其中子區間寬度(EndN

StartN)是有效的編碼空間。(5)例程4412.2.4LZW編碼圖像的無損壓縮編碼

是一種基于字典的編碼,能減少或消除圖像中的像素間的冗余。20世紀70年代末,以色列人A.Lempel和J.Ziv提出LZ碼,形成LZ77和LZ78壓縮算法。1984年,由Welch充實,形成LZ78變種—LZW算法。改進的LZ77、LZ78和LZW一起壟斷當今通用數據壓縮領域—gz、zip、arj在標準圖像數據格式中得到廣泛應用—GIF、TIFF思路:用數據中出現的字符序列形成字典,

給出字典的索引作為編碼結果。4512.2.4LZW編碼圖像的無損壓縮編碼(1)LZW編碼的基本思想在起初,構造一個信源字符序列的編碼碼本(字典)。每個字符序列對應一個索引值。在壓縮過程中,動態更新碼本(字典)。每壓縮掃描圖像時,發現一個字典中沒有出現過的字符序列,把該字符序列存到字典中。用字典索引值(編碼)作為該字符序列的代碼,替換原圖中的字符序列。下次再碰到相同字符序列,用字典索引值代替字符序列。壓縮結果,不保留壓縮過程中形成的字典。4612.2.4LZW編碼圖像的無損壓縮編碼(2)LZW編碼的算法步驟建立初始化字典,末尾添加符號:若“RS”在字典中,則無編碼輸出,令R=RS若“RS”不在字典中,則添加“RS”到字典末尾,編碼輸出為R在字典中位置,令R=S每次讀取一個像素,賦予S。且定義“當前識別字符序列”為R,初始化R為空。判斷生成的新連接字串“RS”是否在字典中LZW_CLEAR---編碼開始標志LZW_EOI---編碼結束標志47依次讀取圖像信源數據流中每個像素,判斷圖像信源數據流中是否還有碼字要譯。如果“是”,則返回到步驟2)。如果“否”,則把代表當前識別字符序列R在字典中位置作為編碼輸出。輸出結束標志LZW_EOI的索引。12.2.4LZW編碼圖像的無損壓縮編碼(2)LZW編碼的算法步驟48對一幅圖像f進行LZW編碼。12.2.4LZW編碼圖像的無損壓縮編碼解:建立初始化字符串表。為一個有512字(位置)的字典,其中位置256~511還沒有用到。位置01…CLEAREOI…511索引值01…256257…511(3)示例4912.2.4LZW編碼圖像的無損壓縮編碼輸入數據SRS輸出R生成新字符串及索引NULLNULL256NULL

3030

30

3030-30303030-30<258>3030-30

30-30

3030-30-302583030-30-30<259>11030-1103011030-110<260>110110-110110110110-110<261>110110-110

110-110

110110-110-110261110110-110-110<262>5012.2.4LZW編碼圖像的無損壓縮編碼輸入數據SRS輸出R生成新字符串及索引30110-3011030110-30<263>3030-30

30-30

3030-30-30

30-30-30

3030-30-30-302593030-30-30-30<264>11030-110

30-110

11030-110-11026011030-110-110<265>110110-110

110-110

110110-110-110

110-110-110

26225751最后的編碼結果為{256,30,258,30,110,261,110,259,260,262,257}進行自然二進制編碼輸出共119=99bit,而原始數據為168=128bit,壓縮比為128/99=1.3:112.2.4LZW編碼圖像的無損壓縮編碼52基于MATLAB編程實現【例12.5】中的圖像的LZW編碼。程序見教材【例12.6】程序運行結果和【例12.5】相同。12.2.4LZW編碼圖像的無損壓縮編碼(4)例程5312.2.4LZW編碼圖像的無損壓縮編碼(5)LZW編碼的算法特性自適應性LZW碼從一個空表到在編解碼過程中逐步生成表中內容,從這個意義上講,算法是自適應的前綴性表中任何一個字符串的前綴字符串也在表中,即任何一個字符串R和某一個字符S組成一個字符串RS,若RS在串表中,則R也在表中。動態性編解碼過程中,動態生成建立字符串表,因此在壓縮文件中不必保存字符串表5412.3.1預測編碼12.3.2變換編碼12.3圖像的有損壓縮編碼5512.3.1預測編碼圖像的有損壓縮編碼(1)什么是預測編碼?

指利用圖像信號的空間或時間相關性,用已傳輸的像素對當前的像素進行預測,然后對預測值與真實值的差——預測誤差進行編碼處理和傳輸。當預測比較準確,預測誤差較小時,就可用較少比特進行編碼,可達到壓縮編碼目的。定義56壓縮圖像信道傳輸量化器符號編碼器預測器符號解碼器預測器12.3.1預測編碼圖像的有損壓縮編碼5712.3.1預測編碼圖像的有損壓縮編碼發送端原始信號fN

(i,j)和接收端重建信號f

N

(i,j)之間存在誤差為:此為發送端量化器所造成的量化誤差誤差的嚴重程度取決于使用的量化方法和預測方法之間的相互作用。預測誤差5812.3.1預測編碼圖像的有損壓縮編碼(2)DM編碼DM編碼是最簡單的有損預測編碼方法,其預測器為1階線性預測器其中,a是預測系數,。c是1個正常數。DM方法得到的碼率是1比特/像素。59(3)示例---DM編碼12.3.1預測編碼圖像的有損壓縮編碼設輸入序列為:這里取DM編碼系統中的

a=1和

c=6。60輸入編碼器解碼器誤差Nfee

f

f

025

25

2501272526312531

42403196373137333037

7

6313731

14353146373137

2512237856433743796128438564943497971244975655495569855550

649554969524936554955

312.3.1預測編碼圖像的有損壓縮編碼解:DM編碼過程實現6112.3.1預測編碼圖像的有損壓縮編碼(4)最優預測器選取適當的預測系數ai,實現最佳線性預測。預測誤差eN為:預測誤差的均方值定義:

6212.3.1預測編碼圖像的有損壓縮編碼(4)最優預測器最佳線性預測主要是選擇一組預測系數{ai|i=1,2,…,m}使預測誤差的均方誤差值為最小。要使均方誤差值為最小,則有:這為一個m階線性方程組,可由此解出m個預測系數{ai|i=1,2,…,m}使預測誤差的均方值為最小,因此稱為最佳預測系數。6312.3.1預測編碼圖像的有損壓縮編碼(4)最優預測器求解最佳預測系數需要滿足條件:這種限制是為了確保預測器的輸出能落到灰度級的允許范圍內,并減少傳輸噪聲的影響,傳輸噪聲的影響通常在重構圖像中表現為水平的條紋。6412.3.1預測編碼圖像的有損壓縮編碼通常將對當前像素進行預測的像素集合中像素的個數m,稱為預測器的階數。(5)示例---一個4階線性預測系統掃描行X1X0X2X3X4預測像素1個取樣延遲1行延遲1行加1個取樣延遲1行減1個取樣延遲

a1

a3

a4

a2

4階預測器X0X1X3X4X26512.3.1預測編碼圖像的有損壓縮編碼(6)示例---不同階數的線性預測預測器階數不宜過高應盡量減少乘法運算。6612.3.2變換編碼圖像的有損壓縮編碼(1)變換編碼的基本思想將空間域里描述的圖像,經過某種變換(如DFT、DCT等),在變換域中進行描述,將空間域圖像像素集映射為變換域變換系數集,然后量化和編碼這些系數。空域變換域量化熵編碼碼流輸出正交變換圖像的某些特征更加明顯正交變換本身沒有對數據壓縮,只是為壓縮創造了條件。6712.3.2變換編碼圖像的有損壓縮編碼(2)變換編碼系統組成輸入圖像子塊劃分

正變換系數量化

熵編碼信道

熵解碼反變換子塊拼接輸出圖像壓縮

圖像6812.3.2變換編碼圖像的有損壓縮編碼(3)實現編碼的主要問題子塊尺寸選擇通常劃分子塊需滿足:好處是:相鄰子塊間相關程度減到某個可接受水平子塊的長和寬通常為2的整數次冪使正交變換后能量更加集中大大降低計算復雜度一般典型的劃分子塊尺寸是8

8或16

166912.3.2變換編碼圖像的有損壓縮編碼正交變換K-L變換:很少使用。其嚴重依賴圖像數據,每次都重新計算協方差矩陣,計算量大。DFT變換:塊效應嚴重。DCT變換:被認為是準最佳變換。被國際壓縮標準采納。優點是:(3)實現編碼的主要問題基本沒有塊效應;信息封裝能力強,把最多的信息封裝在最少的系數中。7012.3.2變換編碼圖像的有損壓縮編碼區域編碼由于變換系數集中在低頻區域,而低頻區集中在變換域的左上角,可對該區域變換系數進行量化、編碼、傳輸;而右下角高頻區既不編碼又不傳輸,可達壓縮目的。缺點為高頻分量被丟棄,圖像可視分辨率下降。(3)實現編碼的主要問題比特分配7112.3.2變換編碼圖像的有損壓縮編碼設定一門限值,只對變換系數幅值大于此閾值的編碼,這樣使低頻成分不僅保留,而且某些高頻成分也被選擇編碼。重建圖像時,品質得到改善。閾值編碼(3)實現編碼的主要問題比特分配7212.4.1JPEG基本系統12.4.2JPEG200012.4JPEG標準和JPEG20007312.4.1JPEG基本系統JPEG標準和JPEG2000JPEG定義了三種不同的編碼系統:基于DCT的有損編碼基本系統用于高壓縮比、高精度或漸進重建應用的擴展編碼系統用于無失真應用場合的獨立無損編碼系統所有符合JPEG標準編解碼器都支持基本系統JPEG基本系統提供順序建立方式的高效有失真編碼,輸入圖像的精度為8bit/像素,而量化的DCT值限制為11比特。7412.4.1JPEG基本系統JPEG標準和JPEG2000(1)JPEG編碼流程

DCT量化熵

編碼壓縮數據量化表編碼表RGB顏色轉換零偏置轉換YCbCr8

87512.4.1JPEG基本系統JPEG標準和JPEG2000構造8

8子塊、顏色模型RGB

YCbCr轉換劃分互不重疊的8

8子圖像塊,這些子塊進行從左到右,從上到下的處理。人眼對亮度更敏感,提取亮度特征,將RGB轉換為YCbCr模型:(見式(2-20)和式(2-21))

編碼時對亮度采用特殊編碼,賦予更多碼速

率,而對色差分量可給予較少碼速率。7612.4.1JPEG基本系統JPEG標準和JPEG2000在DCT前,對于灰度級為2n的像素,通過減去2n-1,替換像素本身

零偏置轉換在IDCT后,應加上2n-1,替換像素本身。目的:使像素絕對值出現3位10進制概率大大減少。對于n=8,即將0~255的值域,減去128,轉換為值域在-128~127之間的值。7712.4.1JPEG基本系統JPEG標準和JPEG2000正向離散DCT變換直流分量這說明:在原點的DCT變換和圖像的平均灰度成正比x,y,u,v=0,1,2,…,77812.4.1JPEG基本系統JPEG標準和JPEG20008

8的DCT變換矩陣,共計64個變換域系數。F(0,0)系數稱為直流系數,即DC系數,代表該子圖像平均亮度。其余63個系數稱為交流系數,即AC系數。特性:圖像信號能量主要分布在低頻區域。DCT變換域圖像特性:左上角低頻,右下角高頻。低頻域變換系數值較大,高頻變換域系數值較小。正向離散DCT變換7912.4.1JPEG基本系統JPEG標準和JPEG2000量化

根據人眼的視覺特性,

人眼對亮度信號比對色度信號更加敏感。JPEG標準中使用兩個量化表:亮度量化表和色度量化表。

人眼對低頻信號比對高頻信號更加敏感。

高頻編碼分配較少比特數。量化的原則是低頻部分用小的值量化,高頻部分用大的值量化,量化的結果將會在高頻部分出現大量的0。

8012.4.1JPEG基本系統JPEG標準和JPEG2000量化的具體計算公式為----F(u,v)為DCT系數----Q(u,v)為量化表系數對于亮度和顏色使用不同的量化表,見書表12-2和12-3.量化表左上角的值較小,右下角的值較大,達到保持低頻分量、抑制高頻分量的目的。量化81161110162440516112121419265860551413162440576956141722295187806218223756681091037724355564811041139249647887103121120101729295981121001039912.4.1JPEG基本系統JPEG標準和JPEG2000亮度信號量化表17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999色度信號量化表量化8212.4.1JPEG基本系統JPEG標準和JPEG2000熵編碼DC系數和AC系數分別用不同方式進行編碼。DC系數編碼方式為:預測+統計編碼由兩部分組成:前綴碼編碼(SSSS)+尾碼(預測誤差編碼)AC系數編碼方式為:游程+統計編碼由兩部分組成:游程/前綴碼編碼(NNNN/SSSS)+尾碼(AC系數編碼)8312.4.1JPEG基本系統JPEG標準和JPEG2000用當前的DC系數,減去相鄰的前一個子

塊的DC系數,則:預測誤差DIFF:DIFF=DC–PRE_DCDC系數的編碼步驟SSSS的編碼。通過DIFF查前綴碼表(表12-4)得出前綴碼SSSS根據SSSS查哈夫曼編碼表(表12-5)得出SSSS的哈夫曼編碼尾碼的編碼。對預測誤差DIFF編碼。8412.4.1JPEG基本系統JPEG標準和JPEG2000AC系數的編碼步驟Z形掃描將量化后DCT系數中63個AC系數,按“Z”字型方式重新排序,全零結尾用特殊符號EOB。目的:增加連續的“0”系數的個數8512.4.1JPEG基本系統JPEG標準和JPEG2000NNNN/SSSS的編碼AC系數的編碼步驟尾碼的編碼

非零AC系數本身編碼SSSS從表12-6中查出非零AC系數幅度值所對應的前綴碼SSSSNNNN

該系數前相對于前一個非零系數值的零行程計數根據NNNN/SSSS

查哈夫曼編碼表(表12-7)8612.4.1JPEG基本系統JPEG標準和JPEG2000一個8

8的亮度分量子圖像塊,對其進行JPEG基本編碼。(假設相鄰前一個8

8的亮度分量子圖像塊經處理后的量化DC系數為

30)(2)示例8712.4.1JPEG基本系統JPEG標準和JPEG2000解:零偏置轉換8812.4.1JPEG基本系統JPEG標準和JPEG2000正DCT轉換8912.4.1JPEG基本系統JPEG標準和JPEG2000量化DCT系數9012.4.1JPEG基本系統JPEG標準和JPEG2000熵編碼對于DC系數

差值:DIFF=

35

30)=

5。前綴碼(SSSS)的編碼由DIFF=

5查表12-4,得:SSSS=3。根據SSSS=3查表12-5,得其Huffman碼字輸出為100。尾碼的編碼由于DIFF=

5,則其二進制碼字輸出為010。因此,則有DC系數的編碼輸出為:100010。9112.4.1JPEG基本系統JPEG標準和JPEG2000對于AC系數AC系數

SSSS

15

4

16

52

2

1

12

23

2NNNN/SSSS0/4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論