自適應差分脈碼調制_第1頁
自適應差分脈碼調制_第2頁
自適應差分脈碼調制_第3頁
自適應差分脈碼調制_第4頁
自適應差分脈碼調制_第5頁
已閱讀5頁,還剩50頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

自適應差分脈碼調制第一頁,共五十五頁,2022年,8月28日4.2.1概述幾十年來,人們一直致力于壓縮數字化語音占用頻帶的工作,也就是在相同質量指標下,努力降低數字化語音比特率,以提高數字通信系統的頻帶利用率語音壓縮方法有DPCM

SBCATCCELPMPLPCVQADPCMADPCM在更低的碼率下(16-8kbps),質量明顯下降第二頁,共五十五頁,2022年,8月28日4.2.2DPCM基本原理第三頁,共五十五頁,2022年,8月28日4.2.3ADPCM基本原理極點預測器預測誤差濾波器重建濾波器第四頁,共五十五頁,2022年,8月28日4.2.4語音壓縮編碼原理框圖第五頁,共五十五頁,2022年,8月28日語音編碼技術概述語音編碼:移動通信數字化的基礎第1/2代蜂窩系統根本區別語音編碼的意義:提高通話質量(數字化+信道編碼糾錯)提高頻譜利用率(低碼率編碼)提高系統容量(低碼率,語音激活技術)第六頁,共五十五頁,2022年,8月28日語音編碼分類語音編碼器波形編碼器參量編碼器頻域時域非差分子帶編碼自適應變換域編碼差分PCMDPCMM連續可變斜率MADPCMAPC線性預測編碼聲碼器信道聲碼器共振峰聲碼器倒頻譜聲碼器語音激勵聲碼器多脈沖激勵LPC碼本激勵LPC矢量和激勵LPC第七頁,共五十五頁,2022年,8月28日語音編碼分類波形編碼:將時域模擬話音的波形信號進過采樣、量化和編碼形成數字語音信號---《現代通信原理》編碼速率較高,16k~64k包括:PCM,ADPCM,M,CVSDM,APC等占用較高帶寬,適合有線參量編碼:基于人類語音的產生機理建立數學模型,根據輸入語音得出模型參數并傳輸,在收端恢復。編碼速率較低,1.2~4.8kbps包括各種線形預測編碼(LPC)方法和余弦聲碼器語音質量中等,不滿足商用要求混合編碼:波形編碼+參量編碼(LPAS)包括GSM的RPE-LPC編碼和VSELP編碼第八頁,共五十五頁,2022年,8月28日語音編碼的標準G.711PCM(64kbps)G.721ADPCM(32kbps)G.7227kHz帶寬64kbps速率內的音頻編碼G.7236.3k/5.6k雙速率多媒體語音編碼G.72816kbps語音編碼LD-CELPG.7298kbps多媒體語音編碼第九頁,共五十五頁,2022年,8月28日語音編碼的發展極低速率語音編碼,600bps高保真語音編碼自適應多速率語音編碼新的編碼分析技術:非線形預測多精度時頻分析技術(子波分析技術)高階統計分析技術第十頁,共五十五頁,2022年,8月28日線形預測編碼的原理原理:模型化人類語音信號產生的機制,提取模型參數,并且只傳輸模型的參數。語音信號的產生模型:語音的產生,聲帶和聲道不同語音產生的原因:聲音激勵源和聲道不同聲音分類:濁音和清音發聲過程口腔和鼻腔形成時變濾波器第十一頁,共五十五頁,2022年,8月28日清音和濁音清濁音頻譜清濁音信號第十二頁,共五十五頁,2022年,8月28日語音產生模型語音模型的建立:1.產生激勵,2.響應模型參數:基音,共振峰頻率及強度,清濁音判決低碼率編碼碼率降低有限合成的語音波形失去了自然度和音質周期脈沖發生器隨機噪聲發生器G時變數字濾波器清/濁音開關聲道參數基音周期第十三頁,共五十五頁,2022年,8月28日LPC語音編碼使誤差均方最小,可求得一組預測系數{ak},傳送:預測系數,基音周期合增益,清濁音判決第十四頁,共五十五頁,2022年,8月28日4.2.5圖像編碼變換:編碼第十五頁,共五十五頁,2022年,8月28日圖像壓縮標準可壓縮的原因已有的標準第十六頁,共五十五頁,2022年,8月28日為什么要變換和量化變換量化熵編碼具有優良頻率特性的濾波器作變換工具,有利于得到平穩的能量分布,有利于進一步的量化處理原始信號的信息損失主要發生在量化階段,好的量化能以盡可能少的量化誤差換取最小的碼率+=高質量編碼器編碼與變換、量化第十七頁,共五十五頁,2022年,8月28日4.2.6DFT與DCTDFT變換結果有虛部和實部對DFT變換系數量化后,吉布斯效應明顯把x(n)對稱延拓,可以消除其中的虛部,得到DCT變換第十八頁,共五十五頁,2022年,8月28日正交變換的一個例子假設圖象的大小只有一個4×4的塊,即一共16個點,其中每個象素點都有一定的值,我們把這個值叫灰度值。對圖象而言,這些值為0~255之間的整數。假設一幅4×4的圖象,它的灰度值如下:

第十九頁,共五十五頁,2022年,8月28日下面我們對這個4×4的圖象做變換,變換矩陣我們選:一般我們希望它是正交矩陣,即變換矩陣和它的逆矩陣的乘積,為單位矩陣,即:第二十頁,共五十五頁,2022年,8月28日對上述圖像作變換,可以驗證:我們希望這個過程是可逆的,即可以驗證:

=

第二十一頁,共五十五頁,2022年,8月28日二維4×4DCT變換若

表示矩陣對應元素相乘,d=b/c,那么上式可以表示為時,為最優變換矩陣第二十二頁,共五十五頁,2022年,8月28日在這里,d取5/2,非常接近最優值此時,,得到整數變換矩陣的正變換為:

二維4×4DCT整數變換第二十三頁,共五十五頁,2022年,8月28日二維4×4DCT變換與量化對于9比特的預測誤差數據做變換,變換矩陣每一行絕對值之和的最大值為14,因此對于變換后的矩陣元素需要位來表示。現在大多數處理裝置(如CPU,DSP)為32位寬,用上述變換進行處理就沒有數據溢出的危險。

一旦得到變換后的系數,我們就可以對變換系數進行量化操作。對于某個量化步長QStep,對應一個量化參數Q,量化參數Q的取值范圍為0到44整數,量化就是把變換得到的結果都除以QStep:

第二十四頁,共五十五頁,2022年,8月28日可以得到:其中,,floor表示向負無窮取整。量化參數Q與量化步長QStep的對應關系如表1。從表1中可以看出,量化參數Q每增加5時,量化步長QStep就隨之翻倍增加。可以得到第二十五頁,共五十五頁,2022年,8月28日Q01234567891011…QStep

0.6250.68750.81250.87511.251.3751.6251.7522.52.75…Q…14…19…24…29…34…39…QStep

…4…8…16…32…64…128…表1量化參數Q與量化步長QStep的對應關系

第二十六頁,共五十五頁,2022年,8月28日Moret首先提出了小波的概念(Moret小波函數是Grossmann和Morlet在1984年提出的),在很多學者的共同努力下,小波理論得到了完善和發展。特別是Mallat,他提出的多分辨率分析(Multiresolutionanalysis,MRA)理論,對小波構造理論起到了十分重要的作用。

1976年,Crochiere等人首先把子帶編碼應用于語音編碼。在語音編碼中,用作頻譜QMF(Quadraturemirrorfilter)濾波器能夠很好地解決過度帶頻率混疊問題,而且很自然地,人們把QMF引入二維信號處理。子帶就是小波分解后,得到不同的頻帶分量的時域或者空域表現。子帶編碼的基本思想是,把信號分成多個子帶,然后對各個子帶進行編碼。4.2.7小波變換與QMF第二十七頁,共五十五頁,2022年,8月28日QMF濾波器混疊問題(aliasing)從信號處理角度看:QMF濾波器能夠很好地解決過度帶頻率混疊問題。假設:得到:同理:第二十八頁,共五十五頁,2022年,8月28日小波分解從函數正交分解角度看:小波分解能夠很好地解決信號的重構問題。Meyer于1985-1986年度在Boubaki研討會上提出了二進小波概念,完善了QMF濾波器的理論,為QMF把頻譜以二分分解提供了理論依據。對于具有緊支的標準正交函數系,任何連續可積函數的取樣值為:

那么,x(t)可以寫成:

由于(t-n)對不同的n正交,對x(t)的小波分解算法可以寫成:

可以證明,(t-n)對不同的n正交,等價于:

第二十九頁,共五十五頁,2022年,8月28日Mallat提出了多分辨率分析(Multiresolutionanalysis,MRA)理論,希望得到圖象3個方向的紋理特征,以便機器識別第三十頁,共五十五頁,2022年,8月28日小波和QMF的比較完備性概念具有相同的信號完全重構的條件具有相同的信號分解和重構的算法小波分解采用的是L2空間中完備的正交基小波理論,能構造出相同抽頭(Taps)下,不同性能的濾波器小波分析有更廣泛的應用,除了編碼,還能用在信號檢測、微分方程、曲面擬合等領域。第三十一頁,共五十五頁,2022年,8月28日正交小波的構造第三十二頁,共五十五頁,2022年,8月28日根據MRA的思想,Daubechies設計了正交性能良好的高低通濾波器組,但是它們不對稱即不滿足線性相位,因此不能完全重構圖象的邊界第三十三頁,共五十五頁,2022年,8月28日雙正交小波的構造

第三十四頁,共五十五頁,2022年,8月28日3/5雙正交小波

???-1/8???-1/8第三十五頁,共五十五頁,2022年,8月28日3/5小波分解與重構中的對齊問題

x2x1x0

x1x2……xn-4xn-3xn-2xn-1xn-2ck-1/81/43/41/4-1/8…………-1/81/43/41/4-1/8

dk(-1)n1/41/21/4…………1/41/21/40c00c10c2…….cn-20cn-10cn-11/41/21/4……………..1/41/21/40d00d00d1…….dn-20dn-10dn-2(-1)n-1/81/43/41/4-1/8-1/81/43/41/4-1/8分解取偶數點,重構時補0在奇數點,分解時在奇數點,補0在偶數點。然后以邊界點為中心對稱延拓,分解和重構時延拓方式是一樣的。第三十六頁,共五十五頁,2022年,8月28日矢量小波(Multiwavelets)第三十七頁,共五十五頁,2022年,8月28日SOM多重小波具有很好的低通、帶通和高通特性,具有提高編碼質量的潛力第三十八頁,共五十五頁,2022年,8月28日零樹量化(EZWSPIHT)第三十九頁,共五十五頁,2022年,8月28日Wavelet與DCT的比較(Y)第四十頁,共五十五頁,2022年,8月28日Wavelet與DCT的比較(UV)第四十一頁,共五十五頁,2022年,8月28日DCT變換編碼,17.95dBWavelet變換編碼,20.98dB小波變換可以有效的克服塊效應第四十二頁,共五十五頁,2022年,8月28日(a)

Lenna原圖(b)

0.005bpp,PSNR=20.76dB

(c)0.01bpp,PSNR=22.72dB

(d)0.02bpp,PSNR=24.21dB(e)0.05bpp,PSNR=27.30dB(f)

0.1bpp,PSNR=28.81dB

小波編碼在高碼率和低碼率情況下都取得很很好的實驗結果第四十三頁,共五十五頁,2022年,8月28日編碼的尺寸可伸縮性編碼的質量可伸縮性小波變換編碼具有可伸縮性第四十四頁,共五十五頁,2022年,8月28日小波編碼的數據結構的量化手段十分有利于可伸縮性編碼和解碼

第四十五頁,共五十五頁,2022年,8月28日4.2.8視頻編碼與H.264隨著數字技術的發展,欣賞數字影視成為大眾娛樂生活的重要內容。數字影視以數字信號形式,或者說以bit的形式在各種介質(或者叫存儲器)存儲和傳輸。我們希望在容量有限的存儲器內存放更多的電影數量,或者希望在網絡點播中看到更流暢的電影作品。然而存儲器的容量或者網絡能提供的帶寬總是不能滿足人們不斷增長的需要,這就推動了視頻壓縮編碼技術的發展。第四十六頁,共五十五頁,2022年,8月28日對于CIF格式的視頻流,它的畫面大小是352×288個象素,每個象素點用8個bit來表示,對于黑白的畫面來說,一幅畫面需要352×288×8=811,008bit,如果是彩色畫面,則需要1,216,512。為了欣賞到連續的畫面,根據人類的視覺特性,每秒差不多要播放25個這樣的畫面(或者叫幀),才不會有快鏡頭的感覺(比如象卓別林的老電影)。那么,對于一部60分鐘長的電影,它需要的存儲量為1,216,512×25×60×60=109,486,080,000,約為13,685,760,000個字節,即13個G的存儲空間。市場上的硬盤目前流行的一般為150個G,也就是說,這么一個硬盤里面只能放10部電影,這遠遠不能滿足我

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論