




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第三講話音編碼簡介衡量話音編碼器得因素音頻質量數據率編/解碼延時算法復雜度價格因素編碼器解碼器輸入信道傳輸輸出編碼數據編解碼過程輸入數據量與編碼后數據量得比值,稱為壓縮比。第2節話音編譯碼器分類:波形編譯碼器(waveformcoder):不利用生成話音得信號得任何知識,將話音視為一種普通得聲音,直接對波形信號進行采樣與量化。例如PCM、DPCM、ADPCM等。音源編譯碼器(Sourcecoder):也叫參數編譯碼器、聲碼器(vocoder)。它從話音波形信號中提取生成話音得參數,使用這些參數通過話音生成模型重構出話音。混合編譯碼器(Hybridcoder):綜合使用上述兩種技術。使用得激勵信號波形盡可能接近于原始話音信號得波形。例如CELP。1、脈沖編碼調制(PCM)一、波形編碼技術PCM得量化方式均勻量化與非均勻量化量化就是一種有損編碼非均勻量化對小信號采用小得量化間隔,對大信號采用大得量化間隔,這樣可以用較少得位數編碼。對大信號來說,雖然絕對量化誤差較大,但就是因為大信號出現得機會不多,所以對總得話音質量影響不大。非均勻量化相對于均勻量化就是一種壓縮。量化間隔越大,壓縮比越大。非均勻量化中兩種壓擴算法數字電話通信標準G、711(CCITT)μ律(μ-Law)壓擴:其中μ為參數(可取255),x為規格化(絕對值小于等于1)得輸入信號幅度。A律(A-Law)壓擴其中A為參數(可取87、56),x為規格化(絕對值小于等于1)得輸入信號幅度。2、波形編碼中得增量調制(deltamodulation)增量調制(DM)自適應增量調制(ADM)
量化階可調,斜率過載時調大,粒狀噪聲時調小。3、自適應脈沖調制(APCM)APCM就是一種根據輸入信號幅度大小自動改變量化階大小得一種波形編碼技術。邊信息為量化步長。例:設僅有1,與5兩種量化步長,輸入:1,2,3,3,10,12,16,2,3,2,1……前向輸出:1,2,3,3,2,2,3,2,3,2,1……151……解碼:1,2,3,3,10,10,15,2,3,2,1……后向輸出:1,2,3,3,10,2,3,0,3,2,1……解碼:1,2,3,3,10,10,15,0,3,2,1……解碼時,后向自適應需要量化階適配器。思考:三個量化階適配器就是怎樣得算法?12大家應該也有點累了,稍作休息大家有疑問的,可以詢問和交流4、差分脈沖編碼調制(DPCM)DPCM就是利用相鄰樣本之間冗余信息來進行編碼得一種數據壓縮技術。輸出得實際上就是差值得量化值。例:量化步長為2,預測器為相等。輸入:2,3,4,5,6,5,4,3………輸出:1,0,1,0,1,0,-1,0………解碼器逆量化器預測器I(k)d(k)S(k)Se(k+1)輸入:1,0,1,0,1,0,-1,0………輸出:2,2,4,4,6,6,4,4………誤差由量化引起!預測:用過去得k個信號預測當前得信號值。線性預測:如果ai就是常數,則為時不變線性預測,否則為自適應線性預測,預測器就就是一個濾波器。最簡單得預測方程:5、自適應差分脈沖調制(ADPCM)ADPCM綜合了APCM得自適應特性與DPCM系統得差分特性左圖得量化階調整屬于后向自適應數字電話通信標準G、721(CCITT)解碼器逆量化器預測器I(k)d(k)S(k)S(k-1)量化階調整ADPCM就是利用樣本與樣本之間得高度相關性與量化階自適應來壓縮數據得一種波形編碼技術,CCITT為此制定了G、721推薦標準,這個標準叫做32kb/sADPCM。在此基礎上還制定了G、721得擴充推薦標準G、723,使用該標準得編碼器得數據率可降低到40kb/s與24kb/s。G、721得輸入信號就是G、711PCM代碼(數據率為64kb/s)。而G、721ADPCM得輸出就是用4位表示得差分信號,它得采樣率與G、711相同都就是8kHz(信號頻率3、4KHz),它得數據率為32kb/s,這樣就獲得了2∶1得數據壓縮。6、子帶-自適應差分脈沖編碼調制(SB-ADPCM)數字電話通信標準G、722(CCITT)G、722就是CCITT推薦得音頻信號編碼譯碼標準。G、722標準得數據率為64kb/s,采樣頻率由8kHz提高到16kHz,就是G、711PCM采樣率得2倍,被編碼得信號頻率由原來得3、4kHz擴展到7kHz。這就使音頻信號得質量有很大改善,由數字電話得話音質量提高到調幅(AM)無線電廣播得質量。二、音源編譯碼模擬人體產生話音得原理,通過話音生成模型重構出話音。1、話音得形成原理
說話得時候,聲門處氣流沖擊聲帶產生振動,然后通過聲道響應變成語音。由于發不同音時,聲道得形狀不同,所以聽到不同得語音。
進一步物理建模,聲門可以等效為一個激勵源(輸入信號),聲道可以等效為一個時變濾波器(系統)。2、對輸入得氣流(激勵)建模濁音(voicedsounds):聲道打開,聲帶在先打開后關閉,氣流經過使聲帶要發生張馳振動,變為準周期振動氣流。濁音得激勵源被等效為準周期得脈沖信號。清音(unvoicedsounds):聲帶不振動,而在某處保持收縮,氣流在聲道里收縮后高速通過產生湍流,再經過主聲道(咽、口腔)得調整最終形成清音。清音得激勵源被等效為一種白噪聲信號。爆破音(plosivesounds):聲道關閉之后產生壓縮空氣然后突然打開聲道所發出得聲音。話音產生得數字模型周期脈沖序列發生器偽隨機噪聲產生器周期時變數字濾波器音量控制聲道參數語音輸出濁/清選擇3、濾波器用濾波器來模仿聲道。編碼得結果其實就就是濾波器得規格、發聲或者不發聲得標志與有聲話音得音節周期,并且每隔10~20ms更新一次。解碼器知道使用什么規格得濾波器后,計算激勵通過濾波器得輸出就就是解碼過程。上節講到得線性預測方法可用來生成濾波器。稱為線性預測編碼(LPC,linearpredictivecoding
)。4、特點數據率在2、4kb/s左右,產生得語音雖然可以聽懂,但其質量遠遠低于自然話音。增加數據率對提高合成話音得質量無濟于事,這就是因為受到話音生成模型得限制。保密性能好,一直用在軍事上。三、混合編譯碼簡介
混合編譯碼想法就是結合波形編譯碼與音源編譯碼思想。即尋找合適得濾波器,又同時尋找合適得激勵(不再就是根據人得發生模型確定激勵,而就是計算得出,所以可以不必考慮清音與濁音)。最成功并普遍使用得就是時域合成-分析AbS(analysis-by-synthesis)編譯碼器。這種編譯碼器使用聲道線性預測濾波器模型(LPC),不使用兩個狀態(有聲/無聲)得激勵。企圖尋找一種激勵信號,使用這種信號激勵產生得波形盡可能接近于原始話音得波形。并命名為多脈沖激勵MPE(multi-pulseexcited)編譯碼器,數據率10Kb/s左右。在此基礎上隨后出現
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 纖維制造過程中的能量損失分析與預防考核試卷
- 電動汽車電池安全與車輛電氣系統隔離技術考核試卷
- 企業文化建設中的創新精神與團隊凝聚力的培養考核試卷
- 高職物流考試題及答案
- 保健食品批發商的消費者忠誠度分析考核試卷
- 線上軍訓考試試題及答案
- 天津道法考試試題及答案
- 老鳳祥銷售面試題及答案
- 云南貨車考試試題及答案
- 漁船實操考試題及答案
- 牛津自然拼讀
- 單位政審證明
- 陜西省榆林市2022-2023學年高一下學期期末考試化學試題(含答案)
- 冶金企業重大事故隱患判定檢查表
- 2023年藥學考試-中藥學(副高)考試高頻試題(歷年真題)帶答案
- 西北農林科技大學自主招生考試綜合素質測試面試試題答題技巧匯總
- 《導彈制導原理》
- 《綠色建筑概論》整套教學課件
- 2021年中國美術學院輔導員招聘考試題庫及答案解析
- 年產3萬噸硫酸鉀,1.8萬噸副產工業鹽項目建設可行性研究報告
- 貴州省建筑與裝飾工程計價定額(2023版)
評論
0/150
提交評論