




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第三章 多媒體數據壓縮編 碼技術3.1 多媒體數據壓縮編碼的重要性和分類3.2 量化3.3 統計編碼3.3 預測編碼3.5 變換編碼3.6 多媒體數據壓縮編碼的國際標準本章重點介紹1.統計編碼、預測編碼和變換編碼的原理2.多媒體數據壓縮編碼的國際標準 JPEG3.多媒體數據壓縮編碼的國際標準 MPEG3.1 多媒體數據壓縮編碼的 重要性和分類3.1.1 多媒體數據壓縮編碼的重要性3.1.2 多媒體數據壓縮的可能性3.1.3 多媒體數據壓縮方法的分類3.1.1 多媒體數據壓縮編碼 的重要性多媒體技術最大難題是海量數據存儲與傳送電視信號數字化后的數據量。信息量與數據量的關系 I = D + duI
2、 信息量D數據量du冗余量1. du在平時說話時是大量存在的。2. 中文百科全書掃描進入計算機冗余更大。3. 圖像信息、視頻信息的冗余就更大了。3.1.2 多媒體數據壓縮的可能性1.空間冗余規則物體和規則背景的表面物理特性具有相關性。例: 圖象中的“A”是一個規則物體,光的亮 度、飽和度及顏色都一樣具有規則,因此,數據A有很大的冗余。 2.時間冗余 3.信息熵冗余(編碼冗余)信息量: 指從N個相等的可能事件中選出一個事件所需要的信息度量和含量。信息熵:指一團數據所帶的信息量,平均信息量就是信息熵(entropy)。 4.結構冗余 圖象有非常強的紋理結構。 如草席圖結構上存在冗余。5.知識冗余
3、圖像的理解與某些基礎知識有關。 例:人臉的圖像有同樣的結構:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中線上 6.視覺冗余 視覺冗余是非均勻、非線性的,視覺系統并不能對于圖像的任何變化都有所感知。 7.其他冗余 圖象空白的非定長性。 3.1.3 多媒體數據壓縮方法 的分類 按編碼算法原理分: (1) 預測編碼 (2) 變換編碼 (3) 量化與向量量化編碼 (3) 信息熵編碼 (5) 子帶編碼 (6) 結構編碼 (7) 基于知識的編碼多媒體數據編碼分類PCM:脈沖編碼調制 多媒體數據壓縮方法根據不同的依據產生不同的分類: 根據質量有無損失有損失編碼和無損失編碼(不可逆編碼和可逆編碼); 按照其作用域
4、在空間或頻率上空間方法,變換方法和混合方法; 根據是否自適應自適應性編碼和非適應性編碼。按壓縮方法分: 有失真壓縮、 無失真壓縮1脈沖編碼調制PCM脈沖編碼是連續模擬信號的數字采樣表示。若量化器為N級,N=2b ,則每一個采樣用b位的二進制代碼表示。信號的量化中,每一色彩分量一般用8位表示。脈沖編碼調制編碼器和解碼器位于一個圖像編碼系統的起點(A/D轉換器)和終點(D/A轉換器2預測編碼DPCM編碼器記錄與傳輸的不是樣本的真實值,而是它與預測值的差差值脈沖編碼調制方法。預測值由欲編碼圖像信號的過去信息決定。本方法通常采用線性預測,比例系數由統計特性估計得到。預測不僅可以在相鄰像素值之間進行,還
5、可以在行與行之間進行。由于真實值與預測值的差值變化遠遠小于真實值的變化范圍,因而可采用較少的位數來表示。如果利用人的視覺特性對差值進行非均勻量化,能夠獲得更高的壓縮比。3變換編碼利用圖像塊(矩陣)的像素值之間的相關性,把圖像變換到一組新的域上,使得能量集中到少數幾個變換系數上,通過存儲這些系數達到壓縮的目的。本方法采用對整幅的原始圖像分成許多個矩形區域子圖像獨立進行變換。常用變換有: 卡亨南洛維變換(KLT) 離散余弦變換(DCT) 沃爾什哈達瑪變換(WHT) 離散傅里葉變換(DFT)。4統計編碼哈夫曼(Huffman)編碼(統計編碼最常用的一種)。對于出現頻率大的符號用較少的位數來表示;對于
6、出現頻率小的符號用較多的位數來表示。其編碼效率主要取決于需編碼的符號出現的概率分布,越集中則壓縮比越高。算術編碼每一符號對應0,1上的一子區間,區間長度為該符號出現的概率。算術編碼的優點是可方便地使用自適應編碼,可以根據當前接收的數據不斷地更改概率模型。5混合編碼合并變換和預測技術的編碼方法。在某一方向上進行酉變換,而在另一方向上采用DPCM對變換系數進行預測編碼。對動態圖像而言,采用二維變換加上時間方向上的DPCM預測。3.2 量 化3.2.1 量化原理3.2.2 標量量化器的設計3.2.3 矢量量化量化指模擬信號到數字信號的映射。量化操作:實質上是用有限的離散量代替無限的連續模擬量的多對一
7、映射操作。3.2.1量化原理將一個連續性的一批數值集合,量化到一個輸出值上。如:256圖像灰度值是連續的,而我們 通常使用和看到的是用0255之間的整數表示的圖像灰度,即:0255級。 這樣可以用log2256=8比特表示一個圖像像素的灰度值,或色差信號值量化原理 量化原理:是使數據比特率下降的一個強有力的措施。 量化輸入值動態范圍很大,需要以多比特數表示一個數值,量化輸出只能取有限個整數,稱量化級。每個量化輸入被強迫歸一到與其接近的某個輸出,即量化到某個級。量化處理總是把一批輸入量化到一個輸出級上,所以量化是個多對一的處理過程,量化中有信息丟失,或者說,會引起量化誤差(量化噪聲)。 數據壓縮
8、編碼中的量化不是指A/D變換后的量化,而是指以PCM(脈沖編碼調制)碼作為輸入,經正交變換、差分或預測處理后,在熵編碼前,對正交系數、差值或預測誤差的量化處理。 PCM編碼:模擬量經過A/D轉換,得到二進制碼的過程,就是脈沖編碼調制(PCM)編碼過程,也稱PCM編碼。3.2.2標準量化器的設計1.量化器的設計要求設計量化器的兩種情況:給定量化分層級數,滿足量化誤差最小;限定量化誤差,確定分層級數,滿足以盡量小的平均比特數,表示量化輸出。2量化方法和量化特性W1 W2 W3 W4 W5 W6 W7 W8(-255255)點數灰度差W1 W2 W3 W4 W5 W6 W7 W8(a)圖(b)圖(c
9、)圖3.2.3矢量量化矢量量化編碼是近年來圖像語音信號編碼技術中流行的一種新型量化編碼方法。矢量量化編碼方法一般是有失真編碼方法。對于PCM數據,一個數一個數地進行量化叫標量量化。對于數據分組,每組K個數構成一個K維矢量,然后以矢量進行量化,稱矢量量化。矢量量化可以更有效地提高壓縮比。 矢量量化 *量化的關鍵問題是設計一個良好的碼本*矢量量化編碼、解碼框圖編碼搜索輸入矢量發送端碼本C傳輸矢量下標ii查表碼本C輸出矢量接收端33 統計編碼3.3.1 統計編碼原理信息量和 信息熵3.3.2 哈夫曼(Huffman)編碼3.3.3 算術編碼根據信息論的原理,可以找到最佳數據壓縮編碼方法,數據壓縮的理
10、論極限是信息熵(一組數據所攜帶的信息量)。熵編碼要求在編碼過程中不丟失信息量,即要求保存信息熵,這種信息保存編碼又叫熵保存編碼。熵編碼是無失真數據壓縮。用這種編碼結果經過解碼后可無失真地恢復原圖像。3.3.1統計編碼原理信息量和信息熵為什么要引入信息熵?信息熵與圖像的概率分布和信息量之間有何關系?就下面信源編碼模型可以說明問題。 編碼器信源(消息集)編碼輸出集X=x1,xnZ=z1,zn符號集Am=a1,amX:是消息集,由幾個信號單元xj構成(j=1,2,.n)Z:是輸出集,由幾個碼字zj構成(j=1,2,n),zj與xj一一對應。Am 是符號集,由m個碼元 ai構成( i=1,2,m),符
11、號集中的碼元組成輸出碼字。當信源發出某個隨機事件(消息)xj后,接收端收到一個相應的碼字zj,從數量上說,所收到的碼字中包含有多少可用的信息量是不確定的。 概念 1. 信息:是用不確定性的量度定義的。2. 信息量:從N個相等可能事件中選出一個 事件所需要的信息度量或含量。3. 熵:如果將信源所有可能事件信息量進行平均就得到信息的熵(熵就是平均 信息量)。信息量信息量指從N個相等可能事件中選出一個事件所需要的信息含量。信息是用不確定性的度量定義的。一個消息的可能性愈小,其信息愈多;反之,消息的可能性愈大,信息愈少。在數學上,所傳輸的消息是其出現概率的單調下降函數。 舉例:確定一個在一組數之中的數
12、例如:從63個數中選出某一個數,可先問“是否大于32?”消除半數的可能,這樣只要6次就可選出某數。這是因為每提問一次都會得到1比特的信息量。因此,在63個數中選定某一數所需的信息量是log2 63=6(bits) 。設從N個數中選任意一個數X的概率為P(x),假定選定任意一個數的概率都相等, P(x)= 1/N,因此定義信息量I(x)=log2N= -log2(1/N)= -log2P(x)=IP(x)信息論定義一種度量信息量的方法為:I(xj) =-log2 P(xj) 信息熵信息熵:指一團數據所帶的信息量,平均信息量就是信息熵(entropy)。如果將信源所有可能事件的信息量進行平均,就得
13、到了信息熵(entropy)。熵就是平均信息量。信息源的符號集為 Xj (j=1,2,3.N)設X出現的概率為P(xj),則信息源X的熵為 H(X)=P(xj) log2 P(xj)3.3.2哈夫曼(Huffman)編碼最佳編碼定理:在變字長碼中,對于出現概率大的信息符號編以短字長的碼,對于出現概率小的信息符號編以長字長的碼,如果碼字長度嚴格按照符號概率的大小的相反順序排列,則平均碼字長度一定小于按任何其他符號順序排列方式得到的碼字長度。 Huffman編碼就是利用這個定理,把信源符號按概率大小順序排列,并設法按逆次序分配碼字長度。 Huffman編碼的方法(1) 把信源符號按概率大小順序排列
14、,并設法按逆次序分配碼字的長度。(2) 在分配碼字長度時,首先將出現概率最小的兩個符號的概率相加合成一個概率。(3) 把這個合成概率看成是一個新組合符號地概率,重復上述做法直到最后只剩下兩個符號概率為止。(3) 完成以上概率順序排列后,再反過來逐步向前進行編碼,每一次有二個分支各賦予一個二進制碼,可以對概率大的賦為0,概率小的賦為1。Huffman 編碼字長參差不齊Huffman編碼在信源編碼概率分布不均勻時效率高,所以效率比較均勻時,不用Huffman編碼。好處:解決對稱性,降低了編碼時間。概率統計和Huffman編碼一般不對稱。 舉例說明舉例說明 4 X0.25 0.250.20 0.15
15、 0.10 0.05對其進行編碼,寫出其碼樹、碼長,并計算平均碼長。符號 概率 編碼過程 編碼X1 0.25 01X2 0.25 10X3 0.20 11X3 0.15 000X5 0.10 0010X6 0.05 0011所以碼長分別為:2,2,2,3,4,4。平均碼長為2.83幾個問題值得注意1.霍夫曼碼沒有錯誤保護功能;2.霍夫曼碼是可變長度碼,因此很難隨意查找或調用壓縮文件中間的內容,然后再譯碼;3.接收端需保存一個與發送端相同的霍夫曼碼表。3.3.3 算術編碼20世紀60年代初,E1ias提出了算術編碼概念。1976年,Bissanen和Pasco首次介紹了它的實用技術。算術編碼在圖
16、像數據壓縮標準(如JPEG,JBIG)中扮演了重要的角色。在算術編碼中,消息用0到1之間的實數進行編碼,算術編碼用到兩個基本的參數:符號的概率和它的編碼間隔。信源符號的概率決定壓縮編碼的效率,也決定編碼過程中信源符號的間隔,而這些間隔包含在0到1之間。編碼過程中的間隔決定了符號壓縮后的輸出。基本思路 用一個浮點輸出數值代替一個流的輸入符號 把要壓縮的整段數據映射到一段實數半開區間0,1)內的某一區段,然后構造出小于l且大于或等于0的一個數值,這個數值就是對該輸入流進行壓縮編碼后的輸出代碼。 例如:可將輸入字符流“eai”映射到區間0.23,0.236),然后取該區間的任一個數,如0.23,作為
17、該輸入字符流的編碼。基本原理將編碼的信息表示成實數0和1之間的一個間隔,信息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進制位就越多。算法舉例 假設信源符號為00, 01, 10, 11,這些符號的概率分別為 0.1, 0.4, 0.2, 0.3 ,根據這些概率可把間隔0, 1)分成4個子間隔:0, 0.1), 0.1, 0.5), 0.5, 0.7), 0.7, 1),二進制消息序列的輸入為:10 00 11 00 10 11 01算法舉例算術編碼算術編碼是一種二元碼的編碼方法。在不考慮信源統計的情況下,只要監視一小段時間內碼出現的頻率,不管統計是平穩的或非平穩的,編碼的碼率總能趨近于
18、信源熵值,每次迭代時的編碼算法只處理一個數據符號,并且只有算術運算。設編碼初始化子區間為0,1),Qe從0算起,則Pe=1-Qe。隨著被編碼數據流符號的輸入,子區間逐漸縮小。 新子區間的起始位置=前子區間的起始位置+當前符號的區間左端前子區間長度;新子區間的長度=前子區間的長度當前符號的概率(等價于范圍長度);最后得到的子區間的長度決定了表示該區域內的某一個數所需的位數。算術編碼在編、譯碼的過程中,子區間的起始位置和長度值的小數點后的位數越來越長,實際中無法實現。因此較實用的改進算法是限制小數點后的位數例如:已知信源0 1X 0.250.75試對1011進行算術編碼LPS 0 Qe0.25,M
19、ps 1 Pe=0.75設C為子區間的左端起始位置,L為子區間的長度, 則符號“0”有 C0,L0.25 符號“1”有 C0.25,L0.75LPS:C=C,L=L*0.25Mps:C=C+L*0.25,L=L*0.75初始區間為0,1),算法編碼如下:步序 符號 C L 1 1 0.25 0.75 2 0 0.25 0.75*0.25 3 1 0.25+0.1875*0.25 0.1875*0.75 4 1 0.3375+0.1306*0.25 0.013*0.75最后的子區間左端起始位置C(0.332)d=(0.01010101) b最后的子區間長度L(0.10536875)d=(0.01
20、11) b編碼取值為0.011可編碼為011在算術編碼中需要注意的幾個問題:1.由于實際計算機精度不可能無限長,運算中溢出是明顯的問題,但多數機器都有16位、32位或者64位的精度,因此可使用比例縮放法解決。 2.算術編碼器對消息只產生一個碼字,這個碼字是在0, 1)中的一個實數,因此譯碼器在接受到表示這個實數的所有位之前不能進行譯碼。 3.算術編碼也是一種對錯誤很敏感的編碼方法,如果有一位發生錯誤就會導致整個消息譯錯。算術編碼 算術編碼可以是靜態的或者自適應的。在靜態算術編碼中,信源符號的概率是固定的。在自適應算術編碼中,信源符號的概率根據編碼時符號出現的頻繁程度動態地進行修改,在編碼期間估
21、算信源符號概率的過程叫做建模。需要開發算術編碼的原因是因為事先知道精確的信源概率是很難的,而且是不切實際的。當壓縮消息時,我們不能期待一個算術編碼器獲得最大的效率,所能做的最有效的方法是在編碼過程中估算概率。因此動態建模就成為確定編碼器壓縮效率的關鍵。特點:不必預先定義概率模型,自適應模式具有獨特的優點;信源符號概率接近時,建議使用算術編碼,這種情況下其效率高于Huffman編碼。算術編碼實現方法復雜一些,但JPEG成員對多幅圖像的測試結果表明,算術編碼比Huffman編碼提高了5%左右的效率,因此在JPEG擴展系統中用算術編碼取代Huffman編碼。3.3 預測編碼3.3.1 預測編碼的基本
22、原理3.3.2 DPCM 和ADPCM3.3.3 幀間預測編碼3.3.1預測編碼方法基本原理 從相鄰數據之間由強的相關性特點考慮,可以利用前面已經出現的數值,進行預測(估計),得到一個預測值,將實際值與預測值求差,對這個差值信號進行編碼、傳送,這種編碼方法即成為預測編碼方法。DPCM基本原理轉入f(i,j)e(i,j)量化器預測器預測器編碼器解碼器信道傳輸e(i,j)f(i,j)輸出f(i,j)f(i,j)f(i,j)f(i,j)預測編碼 不帶量化器的DPCM線性預測編碼,屬于無失真編碼系 統;帶有量化器的DPCM線性預測編碼,屬于有失真編碼系統。 最佳量化器的設計,可利用人眼的視覺可見度閾值
23、和視覺掩蔽效應等生理特征,來確定量化器的級數和步距,使量化誤差總處于人眼難以覺察的范圍內,達到主觀評定準則的要求。3.3.2自適應預測編碼ADPCM 自適應技術的概念是:預測器的預測系數和量化器的量化參數,能夠根據圖像的局部區域分布特點自動調整。 實踐證明,ADPCM編、解碼系統與DPCM編、解碼系統相比,不僅能改善恢復圖像的評測質量和視覺效果,同時還能進一步壓縮數據。 ADPCM系統包括自適應預測,即預測系數的自適應調整和自適應量化,即量化器參數的自適應調整兩部分內容。3.3.3 幀間預測編碼條件補充法運動補償法均方誤差MSE平均絕對幀差MAD3.5變換編碼3.5.1 變換編碼的基本原理3.
24、5.2 K-L變換3.5.3 離散余弦變換(DCT變換)3.5.1 變換編碼的基本原理利用圖像塊像素值之間的相關性,把圖像變換到一組新的基上,使得能量集中到少數幾個變換系數上,通過存儲這些系數達到壓縮的目的。本方法采用對整幅的原始圖像分成許多個矩形區域子圖像獨立進行變換。常用變換有: 卡亨南洛維變換(KLT) 離散余弦變換(DCT) 沃爾什哈達瑪變換(WHT) 離散傅里葉變換(DFT)。基本原理圖子塊 1子塊 2子塊 n.正變換濾波量化編碼信道解碼逆變換綜合拼接源圖像(發送)恢復圖像(接收)變換編碼沃爾什(Walsh)變換傅立葉(Fouries)變換離散正弦(DST)變換離散余弦(DCT)變換
25、哈爾(Haar)變換斜(Slant)變換K-L(Karhunen-Loeve)變換小波(Wavelet)變換3.5.3 離散余弦變換(DCT變換)DCT變換使用下式計算逆變換使用下式計算3.6多媒體數據壓縮的國際標準3.6.1 靜態圖像壓縮標準JPEG3.6.2 MPEG3.6.1 靜態圖像壓縮標準JPEG內容:1、 JPEG標準的主要內容2、 JPEG靜態圖像壓縮算法JPEG標準的主要內容JPEG 是 Joint Photograph Experts Group的縮寫,這是一個在1986年CCITT和ISO聯合成立的一個圖像專家組。JPEG標準即多灰度連續色調靜態圖像壓縮編碼,這是一個適用于
26、彩色和單色多灰度或連續色調靜止數字圖像的壓縮標準。JPEG壓縮算法具有如下特點:1)參數化解碼器,可大范圍調節壓縮質量比;2)適應于任何連續色調圖像;3)硬件要求低;3)有四種工作模式: a.基于DPCM (空間線性預測技術)的無失真算法 b.順序編碼 c.累進編碼 d.分層編碼JPEG標準選定ADCT作為靜態圖像壓縮的標準化算法。該算法包含以下兩種方式: (1)DCT方式(非可逆編碼),包含基本系統(必須保證的功能)和擴展系統(擴充功能);(2)空間方式(可逆編碼)。JPEG標準有兩大分類:第一類方式以DCT(離散余弦變換)為基礎;第二類方式以二維空間DPCM(線性空間預測編碼)為基礎。在D
27、CT方式中,又分為基本系統和擴展系統兩類基本系統是實現DCT編碼與解碼所需的最小功能集,大多數的應用系統只要用此標準,就能基本上滿足要求。擴展系統是為了滿足更為廣闊領域的應用要求而設置的。另一方面,空間方式對于基本系統相擴展系統來說,被稱為獨立功能。2、JPEG靜態圖像壓縮算法1.)基于DPCM的無失真壓縮算法 2.)基于DCT的有失真壓縮編碼3.)基于DCT的累進操作方式編碼 3.)基于DCT的分層操作方式1.基于DPCM無失真壓縮算法基于DPCM的無失真編碼中,為了滿足無失真壓縮的需要,JPEG選擇一個簡單的預測編碼。優點: 硬件易實現,重建圖像質量好缺點: 壓縮比太低,大約為2:1預測器
28、的工作原理是對X的預測值, 將X- 進行無失真熵編碼。熵編碼器采用Huffman編碼或算術編碼。2.基于DCT的有失真壓縮編碼基于DCT壓縮編碼算法包括兩種不同的系統,即基本系統和增強系統。增強系統是基本系統的擴充。基于DCT編碼其壓縮比:10:1100:1。在壓縮比小于30:1的情況下,壓縮后還原得到的圖象與原始圖象相比較,主觀效果幾乎一樣,因此得到了廣泛的應用。基于DCT編碼器的工作原理框圖表示了圖像中一個單分量信號(Y,U,V)的壓縮過程。基于DCT的有失真壓縮編碼基于DCT的JPEG壓縮算法,對中等復雜程度壓縮效果的評價:基于DCT編碼的關鍵步驟為:第一步:分割子塊第二步:對子塊進行正
29、向離散余弦變換FDCT;第三步:對獲得的DCT系數進行量化處理;第四步:DC系數差分編碼、AC系數行程編碼;第五步:熵編碼。基于DCT編碼的關鍵步驟第一步分割子塊把原始圖像順序分割成88子塊;子塊:8 8 象元,特點:象元間變化平緩,相關性高基于DCT編碼的關鍵步驟第二步正向離散余弦變換 對每個單獨的彩色圖像分量,把整個分量圖像分成88的圖像塊,如圖所示,并作為兩維離散余弦變換DCT的輸入。通過DCT變換,把能量集中在少數幾個系數上。DCT變換使用下式計算逆變換使用下式計算基于DCT編碼的關鍵步驟第三步量 化對于有損壓縮算法,JPEG算法使用如圖所示的均勻量化器進行量化,量化步距是按照系數所在
30、的位置和每種顏色分量的色調值來確定。 量化表 因為人眼對亮度信號比對色差信號更敏感,因此使用了兩種量化表:亮度量化值和色差量化值。此外,由于人眼對低頻分量的圖像比對高頻分量的圖像更敏感,因此圖中的左上角的量化步距要比右下角的量化步距小。基于DCT編碼的關鍵步驟第四步DC系數編碼和AC系數ZIGZAG編碼熵編碼可分成兩步進行,先把DC碼和行程碼轉換為中間符號序列,然后給這些符號賦以變長碼字。 JPEG建議的熵編碼是Huffman編碼和自適應二進制算術編碼。基于DCT編碼的關鍵步驟第五步 使用熵編碼還可以對DPCM編碼后的直流DC系數和RLE編碼后的交流AC系數作進一步的壓縮。 在JPEG有損壓縮
31、算法中,使用霍夫曼編碼器來減少熵。使用霍夫曼編碼器的理由是可以使用很簡單的查表(lookup table)方法進行編碼。壓縮數據符號時,霍夫曼編碼器對出現頻度比較高的符號分配比較短的代碼,而對出現頻度較低的符號分配比較長的代碼。這種可變長度的霍夫曼碼表可以事先進行定義。基于DCT的有失真壓縮編碼算法總結DCT變換子塊分割差分編碼 量 化 行程編碼 熵編碼3.基于DCT的累進操作方式編碼 基于DCT的累進操作方式編碼方法基本與順序方式一致。不同的是,累進方式中每個圖像分量的編碼要經過多次掃描才完成。第一次掃描只進行一次粗糙圖像的掃描壓縮,以相對于總的傳輸時間快得多的時間傳輸粗糙圖像,并重建一幀質
32、量較低的可識別圖像,在隨后的掃描中再對圖像作較細的壓縮,這時只傳遞增加的信息,可重建一幅質量提高一些的圖像。這樣不斷累進,直到滿意的圖像為止。有兩種累進方式:(1)頻譜選擇法: 一次掃描中,只對63個DCT變換系數中某些頻帶的系數進行編碼、傳送,在隨后的掃描中,對其他頻帶編碼、傳送,直到全部系數傳送完畢為止;(2)按位逼近法: 沿DCT量化系數有效位方向分段累進編碼。如第一次掃描只取最高有效位的”位編碼、傳送,然后對其余位進行編碼、傳送;掃描分段依次為7653位,3位,.,0位。在必須使用低分辨率的設備來存取或觀察高分辨率圖像的應用中,分層操作方式很有效。所謂的分層方式,即將一幅原始圖像的空間
33、分辨率,分成多個分辨率進行“錐形”的編碼方法。水平(垂直)方向分辨率的下降以2的倍數因子發生改變。3. 基于DCT的分層操作方式基于DPCM的預測編碼無失真編碼器源圖像數據壓縮的圖像數據預測器熵編碼器表說明DPCM預測編碼框圖3.6.2 MPEGMPEG的全稱是運動圖像專家組Moving Picture Experts Group是專門制定多媒體領域內的國際標準的一個組織,該組織成立于1988年,由全世界大約300名多媒體技術專家組成。1 MPEG標準簡介MPEG標準是面向運動圖像壓縮的一個系列標準。最初MPEG專家組的工作項目是3個,即在1.5Mbps,l0Mbps,30Mbps傳輸速率下對
34、圖像編碼,分別命名為MPEG-1,MPEG-2,MPEG-3。l992年,MPEG-2適用范圍擴大到HDTV,能支持MPEG-3的所有功能,因而MFEG-3被取消。MPEG-1即“用于數字存儲媒體運動圖像及其伴音速率為1.5Mbps的壓縮編碼”。MPEG-1的任務主要是,將視頻信號及其伴音以可接收的重建質量壓縮到約1.5Mbps的碼率,并復合成一個單一的MPEG位流,同時保證視頻和音頻的同步。2 MPEG-1標準MPEG系統:定義音頻、視頻及有關數據的同步;MPEG視頻:定義視頻數據的編碼和重建圖像所需的解碼過程,亮度信號分辨率為360230,色度信號分辨率為180120;MPEG音頻:定義音
35、頻數據的編碼和解碼;一致性測試。MPEG-1標準分3個部分MPEG-1標準沒有規定編碼器和解碼器的體系結構或實現方法,但提出了功能和性能上的要求。此外,MPEG算法編碼過程和解碼過程是一種非鏡像對稱算法,也就是說運動圖像的壓縮編碼過程與還原解碼過程是不對稱算法,解碼過程要比編碼過程相對簡單。實際上,MPEG-1和MPEG-2只規定了解碼的方案,重點將解碼算法標準化。因而用硬件實現MPEG算法時,人們首先實現MPEG的解碼器,如CCube公司CL350解碼器系列。 MPEG音頻壓縮算法是第一個高保真音頻數據壓縮國際標準,它同時可完全獨立應用。MPEG音頻(1)音頻信號采樣率可以是32kHz,33
36、.1kHz或 38kHz;(2)壓縮后的比特流可以按3種模式之一支持單 聲道或雙聲道;(3)壓縮后的比特流具有預定義的比特率之一;(3)MPEG音頻標準提供3個獨立的壓縮層次;(5)編碼后的比特流支持循環冗余校驗CRC;(6)MPEG音頻標準支持在比特流中載帶附加信息MPEG音頻標準具有如下特點:MPEG數據壓縮過程中存在的主要問題是:(1)僅使用幀內編碼方法無法達到很高的壓縮比;(2)用單一的靜止幀內編碼方法能最好地滿足隨機存取的要求。MPEG-1視頻編碼技術具體實現中采用了一個折中解決方案,在MPEG算法中采用兩種基本技術(1)基于塊的運動補償技術,目的是減少時間上冗余性;(2)基于DCT
37、變換的ADCT技術,以減少空間上冗余性。基于塊的運動補償技術 MPEG視頻數據流的結構基于塊的運動補償技術 MPEG視頻數據流的結構宏塊 一個塊由一個1616的亮度信息和兩個88色度信息構成。運動信息包含在宏塊中,每個宏塊可有一個/二個運動矢量。基于塊的運動補償技術圖像類型MPEG將運動圖像類型分為3種:I圖像(幀內圖)P圖像(預測圖)B圖像(雙圖)基于塊的運動補償技術圖像類型 (1)I圖像 利用圖像自身的相關性壓縮,提供壓縮數據流中的隨機存取的點,采用基于ADCT的編碼技術,壓縮后,每個像素為12比特。 I圖像也稱幀內圖,類似與JPEG中的幀內編碼。(2)P圖像 用最近的前一個I圖像(或P圖
38、像)預測編碼得到(前向預測),也可以作為下一次預測的參照圖像,也稱為預測圖。(3)B圖像 B圖像在預測時,既可使用前一個圖像作參照,也可使用下一個圖像作參照或同時使用前后兩個圖像作為參照圖像(雙向預測),也稱雙圖。其預測方法采用4種技術: (1)幀內編碼 (2)前向預測 (3)后向預測 (4)雙向預測 基于塊的運動補償技術運動序列流的組成基于塊的運動補償技術運動補償技術主要用于消除P圖像和B圖像在時間上的冗余性,提高壓縮效率。在MPEG方案中,運動補償技術在宏塊一級工作。各圖像類型的宏塊及處理技術見下表 所謂基于塊的運動補償技術即:(1)在參照幀中尋找符合一定條件限制、當前被預測塊的最佳匹配塊
39、;(2)當找到匹配塊后,在恢復被預測塊時,采用兩種處理方法: 直接用匹配塊代替; 用匹配塊加上預測誤差(預測誤差采用ADCT編碼)。每個包含運動信息的1616宏塊,相對于前面相鄰塊的運動信息作差分偏碼,得到運動差值;然后對運動差值,使用變長碼編碼方法,進一步壓縮數據。注意:MPEG標準只說明了怎樣表示運動信息,并沒有說明運動矢量如何計算。MPEG標準 幀內圖像I 不參照任何過去的或者將來的其他圖像幀,壓縮編碼采用類似JPEG壓縮算法幀內圖像I的壓縮編碼算法 預測圖像P使用兩種類型的參數來表示:一種參數是當前要編碼的圖像宏塊與參考圖像的宏塊之間的差值,另一種參數是宏塊的移動矢量。*P380預測圖
40、像P的壓縮編碼算法預測圖像P的壓縮編碼算法移動矢量的算法框圖預測圖像P的壓縮編碼算法絕對差值AE均方誤差MSE平均絕對幀差MAD最佳匹配判據算法框圖插補圖像B的壓縮編碼算法MPEG三種圖像的壓縮后的典型值(比特)MPEG-2標準 MPEG-2標準從1990年開始研究,1993年ISO漢城會議正式通過。它是一個直接與數字電視廣播有關的高質量圖像和聲音編碼標準。MPEG-2可以說是MPEG-1的擴充,因為它們的基本編碼算法都相同。但MPEG-2增加了許多MPEG-1所沒有的功能,例如增加了隔行掃描電視的編碼,提供了位速率的可變性能(scalability)功能。MPEG-2要達到的最基本目標是:位
41、速率為39 Mbit/s,最高達15 Mbit/s。 MPEG-2的標準號為ISO/IEC 13818,標準名稱為“信息技術 電視圖像和伴音信息的通用編碼 MPEG-2標準的主要內容如下:(1)MPEG2視頻利用網絡提供的更高的帶寬(1.5Mbps以上),來支持具有更高分辨率圖像的壓縮和更高的圖像質量;(2)為了適應不同應用的要求,保證數據的可交換性,定義了不同的功能檔次,每個檔次又分為幾個等級(3)編碼器的設計有較大的自由度(4)MPEG-2定義了11種規范,以保證與MPEG-1向下兼容及廣播、通信、計算機、家用視聽設備的需求;(5)MPEG-2音頻向后與MPEG1音頻兼容MPEG-2的編碼
42、方法和MPEG-l的區別主要是在隔行掃描制式下,DCT變換是在場內還是在幀內進行由用戶自行選擇,亦可自適應選擇。一般情況下,對細節多、運動部分少的圖像在幀內進行DCT;而細節少、運動分量多的圖像在場內進行DCT。 MPEG2采用可調型和非可調型兩種編碼結構,且采用兩層等級編碼方式。MPEG-2編碼方法 MPEG2視頻體系要求必須保證與MPEG1向下兼容,并同時力求滿足數字存儲媒體、會議電視/可視電話、數字電視、高清晰度電視(HDTV)、廣播、通信、網絡等應用領域對多媒體視頻、音頻通用編碼方法日益增長的新需求。 如分辨率有低、中、次高、高不同檔次,壓縮方法從簡單到復雜有不同級別等。MPEG2 Video 配置(框架)和級別 視頻壓縮編碼的數據分層比特流結構 對比特流制定了更高層語法結構的語義規范MPEG2 Video 特色編碼方式:信噪比可變性(Signal-to-Noise Scalability空間分辨率可變性(Spatial Scalability)時間分辨率可變性(Temporal Scalability)MPEG2 Video 配置和級別MPEG標準MPEG2 Video 配置MPEG2 Video 級別Simple Main SNR Spatial
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河池市宜州區特崗教師招聘筆試真題2024
- 2024年新疆地方金融監督管理局下屬事業單位真題
- 石大學前兒童保育學課件5-2提高保教活動質量促進幼兒健康發展
- 2025年社區工作者理論試題
- MoS2-MXene@CNTs-nZVI活化過硫酸鹽去除水中二嗪農的研究
- 基于深度學習的乳腺影像分割-洞察闡釋
- 促進體育文化與全民健身服務的融合發展
- 綠色園區社會責任與企業形象塑造
- 深化產學研合作加速技術應用轉化
- 家庭教育服務與社區互動的優化策略
- 職業技術學院森林和草原資源保護專業人才培養方案(三年制)
- 理解當代中國閱讀與寫作學習通超星期末考試答案章節答案2024年
- 附著式升降腳手架維護保養管理制度
- 安徽省宣城市2024-2025學年高二地理下學期期末考試試題含解析
- 購買牦牛合同范本
- 《啊,船長,我的船長喲》教案
- DL-T-1692-2017安全工器具柜技術條件
- 2024年上海市中考語文備考之文言詩文主旨匯編
- 2023-2024學年江蘇省常州市新北區外國語學校七下英語期末綜合測試試題含答案
- 人教版語文七年級下生字詞練習看拼音寫詞語
- 2024年慶陽市交通投資建設集團有限公司招聘筆試沖刺題(帶答案解析)
評論
0/150
提交評論