




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第6
章
多媒體數據壓縮解碼技術引言6.1數據壓縮解碼概述6.1.1基本概念6.1.2數據壓縮條件6.1.3壓縮和解壓縮分類和衡量標準6.2數據壓縮算法6.2.1霍夫曼編碼6.2.2算術編碼6.2.3游程編碼RLE6.2.4詞典編碼6.2.5預測編碼6.2.6變換編碼6.3常見壓縮標準6.3.1靜態圖像壓縮標準JPEG6.3.2運動圖像壓縮標準MPEG6.3.3音頻壓縮編碼技術標準本章小結思考與練習引言數字化后的圖像、音頻和視頻等媒體信息具有海量性,與當前計算機所提供的存儲資源和網絡帶寬之間有很大的差距,這給存儲及傳輸多媒體信息帶來了很大的困難。為此人們嘗試了各種技術方法,其中數據壓縮解碼技術作為解決上述問題的有效途徑,成為了當今通信、廣播、存儲和多媒體娛樂等領域的一項必不可少的關鍵技術。
本章講述了數據壓縮的基本概念、壓縮條件和壓縮編碼分類,并介紹了幾種數據壓縮算法和常見的壓縮標準。6.1數據壓縮解碼概述數字化了的多媒體信號的數據量非常大。6.6.1基本概念從硬件和軟件兩方面考慮硬件方面:提高存儲介質的容量、提高系統和網絡的傳輸速率。有局限性,現有硬件發展的速度和程度不能和當前多媒體應用的海量數據量需求相匹配。軟件方面:采用數據壓縮技術降低數據量,以壓縮形式存儲和傳輸數據。是行之有效的方法,既節約空間,又提高通信干線的傳輸效率。數據壓縮流程最初作為信息論研究中的一個重要課題,在信息論中被稱為信源編碼。近年已成為獨立的體系,主要研究數據的表示、傳輸和轉換方法,以減少數據存儲空間,方便傳輸和存儲。數據壓縮解碼技術
在不丟失信息的前提下,按照一定的算法對數據進行重新組織,減少數據冗余和存儲空間,提高傳輸、存儲和處理效率的一種技術方法。
其本質是去掉數字信號數據中的冗余數據,用盡可能少的比特數來表示源信號并能將其還原。1.數據壓縮
還原壓縮數據的過程。
按壓縮和解壓縮算法耗費代價的不同,分為對稱應用和非對稱應用。對稱應用:編碼和解碼代價應基本相同。如視頻會議系統。非對稱應用:解碼比編碼過程耗費代價小。2.數據解碼6.1.2數據壓縮條件人類感官的生理局限性2.多媒體數據的冗余
冗余:信息所具有的各種性質中多余的無用空間。聽覺局限性:聽覺掩蔽效應等。又稱“認知冗余”,人類的視覺、聽覺系統存在著各種生理局限性。視覺局限性:對色彩的感知不如對亮度的感知敏感;對藍色敏感度差;只能識別幾百種顏色等。1.人類感官的生理局限性紋理結構規則、相互重疊的結構表面。結構冗余人類可以憑借經驗辨識事物,無需進行全面的比較和鑒別。但計算機則沒有經驗可循,只能按部就班地掃描和處理數據,這種與人類的差異所造成的數據冗余就是知識冗余。知識冗余多媒體數據中存在的數據冗余類型:2.多媒體數據的冗余空間冗余時間冗余信息熵冗余結構冗余知識冗余靜態圖像中經常存在。
圖像中,規則物體和背景的表面物理特征具有相關性。空間冗余音頻視頻中經常存在。如:圖像序列中的兩幅相鄰的圖像之間有較大的相關性,甚至幾乎完全相同。時間冗余信息熵冗余什么是信息熵?為了從N個相等的可能事件中挑選出一個事件所需的信息度量和含量,即在N個事件中辨識特定的一個事件要詢問“是或否”次數。信息量從256個數中選定某一個數。先問“是否大于128?”,從而消除半數的可能事件;這樣只需要8次即可選出某數。每次詢問對應一個1bit的信息量,在256個數中選定某數所需的信息量是:log2256=8bit例信息量和事件出現的概率有關,概率越大信息量越小,概率越小,信息量越大。
如果將信源所有可能事件的信息量平均,就得到了“平均信息量”。而信息熵就是一組數據所攜帶的平均信息量,即信息熵=平均信息量。定義:
其中:H為信息熵;N為數據類數或碼元個數;Pi為yi出現的概率。信息熵也稱“編碼冗余”。無失真編碼定理:無失真編碼極限=信源所含平均信息量(熵)信源編碼時,為使單位數據量d接近或等于信息熵H(達到壓縮極限),應使:其中:d為單位數據量;N為數據類數或碼元個數;b(yi)是分配給碼元yi的比特數,
b(yi)=-log2Pi。實際應用中個碼元的先驗概率很難預測,比特分配很難達到最佳,因此實際單位數據量d>信息熵H,即存在信息熵冗余。信息熵冗余也稱熵壓縮法。既減少數據量,又減少信息量。解壓縮后不能完全恢復原始數據。
包括:預測編碼、變換編碼、子帶編碼等。廣泛應用于語音、圖像和視頻的數據壓縮。去掉了數據中的冗余,但不減少信息量,解壓縮后能完全恢復原始數據。包括:霍夫曼編碼、游程編碼、算術編碼、香農編碼、LZW編碼等。一般用于文本數據、特殊應用場合的圖像數據(如指紋圖像、醫學圖像等)及應用軟件的壓縮,壓縮率較低。6.1.3壓縮和解壓縮分類和衡量標準1.有損壓縮編碼和無損壓縮編碼有損壓縮編碼無損壓縮編碼多媒體數據壓縮技術2.定長編碼和變長編碼采用不相同的位數對數據進行編碼。
如霍夫曼編碼、香農編碼。采用相同的位數對數據進行編碼。
如:ASCII碼,碼長為1字節;
漢字國標碼,碼長為2字節。變長編碼定長編碼壓縮比:原始數據量和壓縮后數據量的比值,衡量數據壓縮器效率的質量指標。定義:R=輸出流大小/輸入流大小R<1——壓縮R>1——擴大如:MPEG-1音頻壓縮比1:4;MPEG-2音頻壓縮比1:6~1:8;MPEG-4可達1:10~1:12;MPEG對圖像的壓縮比達1:200。3.壓縮編碼的技術指標壓縮速度:編碼或解碼的快慢程度。
不同的應用要求不同:對稱壓縮時,要求壓縮和解壓縮速度都快,即實時進行;而非對稱壓縮,壓縮速度沒有過高要求,但解壓縮速度則必須是實時的。計算量:壓縮的計算量比解壓縮計算量要大,如動態圖像壓縮編碼的計算量約為解壓縮的4倍。3.壓縮編碼的技術指標壓縮質量:壓縮后對媒體的感知效果。
只有有損壓縮會影響人對媒體的感知效果。6.2數據壓縮算法屬統計編碼一種,按信源符號出現概率大小排序,概率大的分配短碼,概率小的分配長碼。變長編碼,無損壓縮編碼基于編碼樹技術,算法步驟:(1)將信源根據符號出現概率的大小按遞減的順序進行排序。
(2)把概率最小的兩個符號之概率相加合并組成一個新符號(節點),新符號的概率等于這兩個符號概率之和。(3)重復進行第1步和第2步,直到概率的和值等于1為止。
(4)從編碼樹的根開始回溯到原始的符號,并將每一下分枝賦值為1,上分枝賦值為0。(5)最后記錄下從概率1開始到當前信源符號之間的0、1序列,得到每個符號的編碼。
6.2.1霍夫曼編碼
已知各信源數據出現的概率如下:P(A)=0.16,P(B)=0.51,P(C)=0.09,P(D)=0.13,P(E)=0.11求霍夫曼編碼。編碼過程:1、P(C)和P(E)概率值為最小的兩個,被排在第一棵二叉樹中作為樹葉。它們的根節點CE的組合概率為P(CE)=P(C)+P(E)=0.20。從CE到C的一邊被標記為1,從CE到E的一邊被標記為0。2、現在各節點相應的概率為:P(A)=0.16,P(B)=0.51,P(CE)=0.20,P(D)=0.13P(D)和P(A)為概率最小的兩個節點,將這兩個節點作為葉子組合成一棵新的二叉樹。根節AD的組合概率為P(AD)=P(A)+P(D)=0.29。由AD到A的一邊標記為1,由AD到D的一邊標記為0。例:霍夫曼編碼
3、剩下節點的概率如下:P(AD)=0.29,P(B)=0.51,P(CE)=0.20P(AD)和P(CE)兩節點的概率最小,再將它們生成一棵二叉樹。其根節點ADCE的組合概率為0.49。由ADCE到AD一邊標記為0,由ADCE到CE的一邊標記為1。4、最后兩個節點相應的概率如下:P(ADCE)=0.49,P(B)=0.51它們生成最后一棵根節點為ADCEB的二叉樹。由ADCEB到B的一邊記為1,由ADCEB到ADCE的一邊記為0。5、下圖為霍夫曼編碼。編碼結果被存放在一個表中:w(A)=001,w(B)=1,w(C)=011,w(D)=000,w(E)=010例:霍夫曼編碼例:霍夫曼編碼編碼長度可變,壓縮與解壓縮較慢。硬件實現困難。編碼效率取決于信號源的數據出現概率。編碼不唯一,當幾個節點的概率值相同時,選擇方式的不同和構造新節點的兩個子節點位置關系不同都可以導致不同的編碼,但不同的編碼方案平均碼長基本一致。沒有錯誤保護功能,在譯碼時,但如果碼串中有錯誤,那怕僅僅是1位出現錯誤,也會引起一連串的錯誤。霍夫曼編碼特點屬統計編碼一種,無損壓縮編碼。某些方面優于霍夫曼編碼,在JPEG標準的擴展系統中,算術編碼已經取代了霍夫曼編碼。給定事件序列的算法步驟:編碼器在開始時將“當前間隔”[L,H)設置為[0,1)。
對每一事件,按步驟(a)和(b)進行處理
(a)將“當前間隔”分為子間隔,每一個事件一個。
(b)一個子間隔的大小與下一個將出現的事件的概率成比例,選擇子間隔對應于下一個確切發生的事件相對應,并使它成為新的“當前間隔”。
最后輸出的“當前間隔”的下邊界就是該給定事件序列的算術編碼。
6.2.2算術編碼設信源符號為{A,B,C,D},符號概率分別為:{0.1,0.4,0.2,0.3}如果二進制消息序列的輸入為:CADACDB算術編碼過程如下圖:算術編碼——例1:DCBACADACDB編碼過程譯碼過程適用于靜態圖像。基本編碼原則:重復的數據值序列(或稱為“流”)用一個重復次數和單個數據值來代替。常用格式三字節編碼:二字節編碼:6.2.3游程編碼RLE控制符
重復次數
被重復字符
設有字符串:“RTAAAASDEEEEE”三字節編碼為:RT*4ASD*5E
說明——“*”為控制符二字節編碼:1R1T4A1S1D5E游程編碼——例重復次數
被重復字符
詞典:用以前處理過的數據來表示編碼過程中遇到的重復部分。編碼思想:企圖查找正在壓縮的字符序列是否在前面的輸入數據中出現過,如果是,則用指向早期出現過的字符串的“指針”替代重復的字符串。代表算法:LZ77算法、LZSS算法無損壓縮編碼依據數據本身包含有重復代碼序列的特性。6.2.4詞典編碼第一類詞典編碼輸入數據流輸出數據流短語詞典:從輸入的數據中創建。編碼數據過程中,當遇到已經在詞典中出現的“短語”時,編碼器就輸出這個詞典中的短語的“索引號”,而不是短語本身。代表算法:LZ78算法、LZW算法第二類詞典編碼輸入數據流輸出數據流6.2.5預測編碼根據離散信號之間存在著一定關聯性的特點,利用前面一個或多個信號預測下一個信號進行,然后對實際值和預測值的差(預測誤差)進行編碼。
1.預測編碼的原理預測編碼步驟:(1)建立一個供預測用的數學模型。(2)利用以往的樣本數據對新樣本值進行預測。(3)將預測值與實際值相減,對其差值進行預測。減少了數據時間和空間上的相關性如果預測比較準確,誤差就會很小較適合于聲音、圖像數據的壓縮直觀、簡捷、易于實現,特別是用于硬件實現,但壓縮能力有限,如DPCM只能壓縮到2~4bit像素幾種預測編碼:自適應脈沖編碼調制APCM、差分脈沖編碼調制DPCM、自適應差分脈沖編碼調制ADPCM等預測編碼特點在PCM系統中,原始的模擬信號經過采樣后得到的每一個樣值都被量化成為數字信號。為了壓縮數據,可以不對每一樣值都進行量化,而是預測下一樣值,并量化實際值與預測值之間的差值,這就是差分脈沖編碼調制DPCM。2.差分脈沖編碼調制DPCM先對信號進行某種函數變換,從一種信號(空間)變換到另一種(空間),然后再對信號進行編碼。一種間接編碼方法。它是將原始信號經過數學上的正交變換后,得到一系列的變換系數,再對這些系數進行量化、編碼、傳輸。6.2.6變換編碼編碼、解碼原理6.3常見壓縮標準6.3.1靜態圖像壓縮標準JPEG
JPEG(JointPhotographicExpertsGroup)是由國際標準化組織ISO和國際電工技術委員會IEC聯合組成的一個專家組,負責制定靜態的數字圖像數據壓縮編碼標準,這個專家組開發的算法稱為JPEG算法,已成為國際通用標準,因此又稱為JPEG標準。用JPEG標準編碼的圖像文件后輟名為“.jpg”或“.jpeg”,是一種支持8位和24位色彩的壓縮位圖格式,適合在網絡上傳輸。
JPEG簡介JPEG編碼處理過程圖像塊排序系數的Z形排序適用于連續色調的、多級灰度和彩色的靜止圖像。可隨意選擇期望的壓縮比值。平均壓縮比大約15:1;無損壓縮比大約為4:1;有損壓縮比在10:1~100:1之間。當壓縮比大于50倍時將可能出現方塊效應。適用于大部分通用的計算機平臺JPEG特點6.3.2運動圖像壓縮標準MPEG
ISO和IEC成立的運動圖像專家組(MPEG,MovingPictureExpertsGroup),研究和開發運動圖像和音頻的壓縮。MPEG標準是音頻、視頻解壓算法的綜合描述,它還對怎樣多路復合壓縮比特流和如何使解碼后的媒體同步等進行討論和規定。
MPEG簡介MPEG-1標準(信息技術——用于數據率1.5Mbit/s的數字存儲媒體的電視圖像和伴音編碼)。1991年制定,文件擴展名包括*.mpg、*.mlv、*.mpe、*.mpeg及VCD光盤中的.dat文件等。MPEG-2標準(信息技術——活動圖像和伴音信息的通用編碼)。1994年制定,設計目標為高級工業標準的圖像質量以及更高的傳輸率。文件擴展名有.mpg、.mpe、.mpeg、.m2v及DVD上的.vob文件等。MPEG-4標準(甚低速率視聽編碼)。制定于1998年,為了播放流式媒體的高質量視頻而專門設計。MPEG-7標準(多媒體內容描述接口)MPEG-21標準(多媒體框架)已開發和正開發的MPEG標準6.3.3音頻壓縮編碼技術標準國際電報電話咨詢委員會(CCITT)和國際標準化組織(ISO)先后提出一系列有關音頻編碼的建議。G.711標準:主要應用于公共電話網。G.721標準:目前其應用包括電視會議的語音編碼、多媒體多路復用裝置、數字錄音電話及高質量的語音合成器。G.722標準:主要用于高質量語音通信會議等。G.723標準:應用于可視電話、IP電話等。G.728標準:為了進一步適應低速率語音通信的要求而制定的標準,主要用于公共電話。G.729.A標準:主要用于無線移動網、數字多路復用系統和計算機通信系統的應用。1.語音壓縮解壓標準語音壓縮/解壓標準應用在多媒體數字通信方面(包括電視會議等)的標準。2.H系列標準
MPEG-1音頻壓縮技術的數據速率為每聲道32~448kbit/s,適合于CD-DA光盤應用。MPEG-2音頻標準由兩部分組成:MPEG-2音頻和MPEG-2AAC(先進的音頻編碼,ISO/IEC13818-3)。MPEG-2音頻編碼標準是對MPEG-1后向兼容的、支持二至五聲道的后繼版本。MPEG-4Audio標準可集成從話音到高質量的多通道聲音,從自然聲音到合成聲音。MPEG-7Audio標準提供了音頻描述工具。3.MPEG音頻標準本章小結數據壓縮技術一般分為有損壓縮和無損壓縮。
無損壓縮是指重構壓縮數據(還原,解壓縮),而重構數據與原來數據完全相同。典型的無損壓縮算法有:香農編碼、哈夫曼編碼、算術編碼、行程程編碼等。
有損壓縮是重構使用壓縮后的數據,其重構數據與原來數據有所不同,但不影響原始資料表達信息。常用的有損壓縮算法有預測編碼、變換編碼等。各類編碼算法衍生出不同的壓縮標準,包括:靜態圖像壓縮標準JPEG、運動圖像壓縮標準MPEG和音頻壓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年心理咨詢師資格考試理論試卷及答案
- 2025年信息與通信工程考試試題及答案解析
- 2025年數字媒體藝術與設計考核試卷及答案
- Riluzole-13C6-PK-26124-sup-13-sup-C-sub-6-sub-生命科學試劑-MCE
- Paulomenol-A-生命科學試劑-MCE
- 2025年設備維護與管理考試試題及答案
- 2025年量子計算原理與應用測試題及答案
- 2025年公共事務與危機管理考試試卷及答案
- 英語語法入門:詞性及用法解析
- 酒店經營租賃合同
- 2025年重慶市中考數學試卷真題(含標準答案)
- 農機耕地合同協議書范本
- 精裝分包勞務合同協議書
- T/CNESA 1203-2021壓縮空氣儲能系統性能測試規范
- T/CGMA 031003-2020一般用離心空氣壓縮機
- 2025年四年級下冊美術期末測試題附答案
- 2024年深圳市中考歷史試卷真題(含答案解析)
- 公司內部文件管理規定及辦法
- 旋流風口、球型噴口選型參數表
- 雷士燈具檢測報告
- 電子商務概論試題庫及答案(共21頁)
評論
0/150
提交評論