數字通信技術_第1頁
數字通信技術_第2頁
數字通信技術_第3頁
數字通信技術_第4頁
數字通信技術_第5頁
已閱讀5頁,還剩47頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數字通信技術第1頁,共52頁,2023年,2月20日,星期六第2頁,共52頁,2023年,2月20日,星期六§2.4語音編碼的合成分析方法第3頁,共52頁,2023年,2月20日,星期六已知s(n),求x(n)的過程,稱為分析。已知x(n),求s(n)的過程,稱為綜合(合成)。LPC聲碼器原理上的主要缺陷:發端只有分析過程,沒有合成過程,是一個開環 系統;激勵模型過于簡單。一、合成分析法4第4頁,共52頁,2023年,2月20日,星期六

合成分析法(AbS,Analysis-By-Synthesis)的基本思想:用合成來指導分析。將合成器引入編碼系統,使之與分析器相結合,在編碼器中產生與譯碼器完全一致的合成語音,將此合成語音與原始語音相比較,根據一定的誤差準則調整計算分析器的各個參數,使兩者之間的誤差達到最小。然后將誤差最小時的語音參數傳送到接收端,得到高質量的合成語音。一、合成分析法5第5頁,共52頁,2023年,2月20日,星期六在LPC基礎上采用AbS的編碼方法。AbS-LPC編碼器包括三個基本部分:時變濾波器(包括LPC和基音濾波器)基于感知的最小化處理;激勵信號;

二、AbS-LPC編碼器6第6頁,共52頁,2023年,2月20日,星期六AbS-LPC編碼器與譯碼器二、AbS-LPC編碼器激勵信號產生編碼端基音合成濾波器LPC合成濾波器解碼端輸出語音誤差最小優化的激勵基音合成濾波器LPC合成濾波器+誤差-+原始語音7第7頁,共52頁,2023年,2月20日,星期六二、AbS-LPC編碼器合成分析編碼方法的特點:發端是一個閉環系統;對激勵信號沒有明顯的分類,由閉環系統選擇與 原始語音誤差最小的激勵信號,使得合成語音質量 比傳統的LPC聲碼器好得多。8第8頁,共52頁,2023年,2月20日,星期六1、時變濾波器 時變濾波器由LPC合成濾波器和基音合成濾波器級連組成。

LPC合成濾波器實現語音的短時預測;基音合成濾波器實現語音的長時預測。二、AbS-LPC編碼器9第9頁,共52頁,2023年,2月20日,星期六二、AbS-LPC編碼器語音的短時預測短時預測(利用一幀時段內前P個樣值預測當前的樣值)可以用全極點模型描述,其傳輸函數為:

其中,H(Z)稱為LP綜合濾波器;A(Z)被稱為LP分析濾波器。預測系數ai是逐幀(幀長20—30ms)更新。10第10頁,共52頁,2023年,2月20日,星期六語音的長時預測

長時預測(利用前幾個子幀的參數預測當前子幀的參數)可以用全極點模型描述,其傳輸函數為1/P(Z):二、AbS-LPC編碼器11第11頁,共52頁,2023年,2月20日,星期六二、AbS-LPC編碼器

延時參數D為基音周期,bi是語音信號的長時預測系數,可以從語音信號中直接提取這兩個參量,也可以從去除了短時相關性所得的余量信號中提取。預測系數個數i取1(q=r=0)~

3(q=r=1)之間,預測逐子幀(子幀長5—10ms)更新。12第12頁,共52頁,2023年,2月20日,星期六

在語音譜中,能量較高的頻段(如共振峰處)的噪聲相對于能量較低頻段的噪聲不易被感知,在度量原始語音與合成語音之間的誤差時可以計入這一因素,在語音能量高的頻段,允許二者的誤差大一些,反之則小一些,為此在計算二者誤差時,引入頻域感覺加權濾波器W(f)。

2、感覺加權濾波器 感覺加權濾波器:是根據人的聽覺特性對預測殘差信號進行處理,以產生較好的主觀聽覺效果。二、AbS-LPC編碼器13第13頁,共52頁,2023年,2月20日,星期六

fs是抽樣速率,分別是原始信號與合成語音的傅里葉變換。在e達到最小值時,在整個積分域內保持常數值。誤差定義為:二、AbS-LPC編碼器 在能量大的語音頻段內使W(f)小,而能量較小的頻段使W(f)較大,從而可提高前者的誤差能量而降低后者的誤差能量。14第14頁,共52頁,2023年,2月20日,星期六感覺加權濾波器W(f)在Z域的表達式為:

=0~1,它控制共振峰區域誤差的增加程度。 當=1時,W(Z)=1,此時不進行加權。 當=0時,W(Z)等于語音的P階全極點模型譜的倒數,由此得到誤差信號頻譜的能量分布與語音信號頻譜的能量分布變化一致,但此時聽覺效果不好,其原因在于人耳對語音的共振峰更敏感,相應地對其信噪比要求也更高。二、AbS-LPC編碼器實際聽音結果表明:8kHz采樣頻率下,的經驗值為0.8。15第15頁,共52頁,2023年,2月20日,星期六感覺加權濾波器的頻率特性二、AbS-LPC編碼器16第16頁,共52頁,2023年,2月20日,星期六3、激勵信號源

激勵信號是AbS-LPC模型的輸入,包含不能由時變濾波器譜模型表征的殘差結構,如超出長時線性預測范圍的相關性就不能由長時線性預測包含,激勵信號還包括不能用確定方法有效表征的隨機結構。采用AbS方法的聲碼器都用激勵信號源的種類命名。例如:(1)多脈沖線性預測編碼(MP-LPC)(2)規則脈沖激勵—長時預測編碼(RPE-LTP-LPC)(3)碼本激勵線性預測編碼(CELP)

二、AbS-LPC編碼器17第17頁,共52頁,2023年,2月20日,星期六§2.5幾種混合編碼方法介紹第18頁,共52頁,2023年,2月20日,星期六

用一種稀疏的脈沖序列作為激勵,不再提取基音。無論是清音還是濁音,都是用一幀中的有限多個脈沖,以最優估計的幅度和位置,作為激勵信號源。一、多脈沖激勵LPCMP-LPC的原理:合成語音有較好的自然度,而且有一定的抗噪聲能力,從算法上避開了提取基音這一難題,但算法較復雜,運算量較大。商用標準:INMARSAT-Aero系統的語音編碼標準,9.6kb/s。MP-LPC的特點:19第19頁,共52頁,2023年,2月20日,星期六

用等間距、幅度變化的脈沖作為激勵,每個子幀(5ms)估計一次最佳激勵脈沖,對脈沖的幅度以及第一個脈沖的位置進行編碼,并且與LP參數的編碼一起送入信道。在GSM標準中,每個子幀(5ms)激勵源有40個脈沖(樣點),共有13個非零脈沖,非零脈沖的間距相等,非零脈沖間有兩個零值樣點,第一個非零脈沖出現位置有4種可能,分別在第1、2、3、4樣點處。二、規則脈沖激勵編碼LPC

RPE-LTP-LPC的原理20第20頁,共52頁,2023年,2月20日,星期六

RPE-LTP-LPC編碼框圖二、規則脈沖激勵編碼LPC預加重分幀自相關Schur迭代對數面積比LAR編碼器LPC分析濾波器反射系數插值LAR解碼器長時分析長時參數編碼器長時參數解碼器+加權濾波器+RPE相位選擇Z-N×APCM編碼器APCM解碼器RPE相位恢復xmcMc

xmaxcbcNcLARcS0(n)S(n)ACFLARd(n)-預處理LPC分析短時預測長時預測RPE編碼+++信號參數輸出參數注釋:e(n)21第21頁,共52頁,2023年,2月20日,星期六

RPE-LTP-LPC解碼框圖二、規則脈沖激勵編碼LPC22第22頁,共52頁,2023年,2月20日,星期六二、規則脈沖激勵編碼LPC參數比特數8個LPC分析參數LARC364個長時預測系數bc84個長時預測延時NC284個激勵序列相位MC84個子幀最大非零樣值xmaxc2452個RPE非零樣值xmc156總計260LAR(i)參數序號(即i的值)1,23,45,67,8編碼比特數6543GSM編碼方案每幀傳輸的比特分配23第23頁,共52頁,2023年,2月20日,星期六二、規則脈沖激勵編碼LPC

13kb/sREP-LTP采用主觀加權最小均方誤差準則逼近 原始語音波形,具有波形編碼特點。采用長時預測、對數量化比等一系列措施,使其在 13kb/s的速率上得到相當好的語言編碼質量,其MOS 分為3.8分。REP-LTP-LPC的特點24第24頁,共52頁,2023年,2月20日,星期六二、規則脈沖激勵編碼LPCREP-LTP-LPC的特點(續)它的抗誤碼性能較好。若不加糾錯,則Pe=10-3時語音質量基本不下降,Pe=10-2時語音質量有所下降,但MOS分仍可達到3.0;加糾錯后,在22.8kb/s的速率上,Pe=10-1時語音質量下降不多。編解碼延遲約30ms,加糾錯后為80ms。非語音信號編碼效果不太理想,傳送數據的效果也不理想。25第25頁,共52頁,2023年,2月20日,星期六

CELP:在預先設計的一組激勵序列矢量碼本中按一定準則搜索每一個子幀的最佳碼矢量作為激勵信號,對濾波器的參數以及碼本的標號和增益進行編碼。

三、碼本激勵LPCCELP原理26第26頁,共52頁,2023年,2月20日,星期六三、碼本激勵LPC碼本長時預測短時預測-感覺加權濾波器均方運算碼本號長時預測系數短時預測系數

圖2-30CELP編碼原理框圖s(n)s(n)的估值d(n)e(n)CELP編碼器原理框圖27第27頁,共52頁,2023年,2月20日,星期六三、碼本激勵LPCCELP編碼的特點運用線性預測技術,構造聲道模型;運用矢量量化技術構成高效的殘差激勵;運用合成分析法和感覺加權進行閉環搜索,從碼 本中搜索出最佳碼矢量,作為激勵信號。28第28頁,共52頁,2023年,2月20日,星期六

CELP的碼本,是將預測誤差信號可能出現的各種樣值的編碼組合按一定規則排列存儲在存儲器中,就像字典一樣,每一個樣值的編碼組合有一個地址碼。收、發雙方各有一個同樣的碼本。發端預測出誤差信號后,在本方的碼本中搜索出與該殘差信號最接近的碼矢量的地址碼,將地址碼傳輸到收方。收方根據收到的地址碼在己方的碼本中找出相應碼矢量加到濾波器上,得到重建的話音。由于傳輸的是碼本的地址碼,大大地減少傳輸的比特數,從而降低編碼速率。關于CELP的碼本(1)三、碼本激勵LPC29第29頁,共52頁,2023年,2月20日,星期六CELP一般建有兩個碼本:自適應碼本:碼字逼近語音的長時周期性(基音)結構;固定的隨機碼本:碼字逼近語音經短時、長時預測后的殘差信號。如果碼本編得好,碼本中的碼字與實際的誤差信號極為接近,同時碼本中碼字又少,就可以以較低的編碼速率得到較好的話音質量。利用AbS閉環系統以及碼本搜索算法可以得到最佳自適應碼矢量及其最佳增益ga、最佳隨機碼矢量及其最佳增益gs。兩者加權相加后即為CELP激勵源。關于CELP的碼本(2)三、碼本激勵LPC30第30頁,共52頁,2023年,2月20日,星期六三、碼本激勵LPC

G.728(LD-CELP),16k/s;

G.729(CS-ACELP),8kb/s;

IS54、IS95(VSELP、QCELP),7.95kb/s、8.5kb/s;FS-1016(CELP),4.8kb/s。商用標準31第31頁,共52頁,2023年,2月20日,星期六FS-1016編碼器結構圖三、碼本激勵LPCMSPE準則32第32頁,共52頁,2023年,2月20日,星期六

8kHz采樣,幀長240個樣點(30ms),一幀內有4 個子幀(60個樣點,7.5ms),每幀發送144個比 特。采用AbS閉環系統,發端有10階短時線性預測、 長 時自適應碼本搜索、隨機碼本搜索,感覺加權濾 波器。發送的參數是每幀的10個LSF參數(34bits); 每 子幀的自適應碼本標號(偶數子幀6bits,奇數 子 幀8bits)及增益(5bits)、隨機碼本標號 (9bits)及增益(5bits)。FS-10164.8kb/s的CELP聲碼器的特點三、碼本激勵LPC33第33頁,共52頁,2023年,2月20日,星期六三、碼本激勵LPC關于QCELP

QUALCOMM公司于1993年研制成功了采用QCELP(QUALCOMMCELP)專利聲碼器算法的全雙工話音編譯碼器——Q4400/Q4401聲碼器。

Q4400聲碼器可提供固定速率和可變速率兩種工作 模式。固定速率模式有4.0kb/s、4.8kb/s、8.0kb/s 和9.6kb/s四種速率供用戶選擇。而變速率模式則 可根據輸入信號的能量從800b/s到9600b/s自動地調 整最佳速率,每次調整間隔為一個幀長(20ms)。34第34頁,共52頁,2023年,2月20日,星期六三、碼本激勵LPC

Q4400聲碼器與其它話音編碼器的質量比較2.4bps10kbps16kbps64kbpsQ4400聲碼器波形編碼器長話質量近長話質量話音質量數據速率關于QCELP35第35頁,共52頁,2023年,2月20日,星期六

IMBE(ImprovedMBE):1991年定為“INMARSAT- M”系統的語音編碼標準。

DVSI(DigitalVoiceSystemInc.)提出的AMBE(AdvancedMBE)算法,進一步改進了合成語音的質量和魯棒性。被選為INMARSATICO系統和“銥” 系統的語音編碼標準。四、多帶激勵LPC美國MIT大學林肯實驗室1988年提出了多帶激勵MBE(Multi-BandExcitation)語音編碼方案,MBE在2.4kb/s-4.8kb/s速率上能合成出音質比傳統聲碼器好得多的語音,而且具有較好的自然度和容忍環境噪聲的能力。36第36頁,共52頁,2023年,2月20日,星期六

傳統聲碼器的缺陷是將全頻帶的語音簡單地由清濁音和基音周期表示,導致合成語音自然度差。對于“干凈”的語音信號,LPC聲碼器這種二元激勵模型能夠在2.4kb/s甚至更低的速率上給出可懂度相當高的合成語音。但是對于含有噪聲的語音信號,由于無法準確地提取語音參數,LPC聲碼器性能嚴重惡化。

事實上許多語音段既含有周期分量,又含有非周期分量。這種特性在頻譜上的表現是:在某些頻段的語音譜呈現周期譜的特征,而在某些頻段上則呈現噪聲譜的特征。四、多帶激勵LPC傳統聲碼器的缺陷37第37頁,共52頁,2023年,2月20日,星期六

CELP以語音線性預測模型為基礎,對殘差信號采用了矢量量化,搜索過程用A-B-S方法,并采取感覺加權均方誤差最小判決準則,在4.816kb/s的速率范圍內獲得了巨大的成功。然而當速率進一步降低時,由于沒有足夠的比特表示激勵矢量,殘差信號的量化將產生較大的誤差,致使合成語音信號的質量迅速下降。四、多帶激勵LPC傳統聲碼器的缺陷(續)38第38頁,共52頁,2023年,2月20日,星期六將語音譜在整個頻帶內按基音諧波頻率為中心, 以基音頻率為帶寬劃分為若干個頻帶;對每個頻帶根據頻譜特征分別進行清濁音判決, 形成多帶激勵譜。整個激勵譜由基音頻率和它的諧波以及一組清濁 音判決參數表示,較好地反映了語音信號的特征。合成語音時,根據各帶的清/濁音參數采用不同 的 激勵信號合成語音,最后將分帶合成信號相加形 成全帶合成語音。四、多帶激勵LPC多帶激勵語音模型39第39頁,共52頁,2023年,2月20日,星期六

MBE以多帶激勵代替LPC中的二元激勵,無論是濁音、清音、還是過渡音,在編碼過程中都要提取三種參數:基音頻率(或基音周期);按基音頻率的各次諧波分帶后每個頻帶的譜包絡參數 (可以近似地認為每個分帶內的譜包絡保持不變);每個頻帶的U/V判決信息。

四、多帶激勵LPC多帶激勵語音分析算法40第40頁,共52頁,2023年,2月20日,星期六四、多帶激勵LPC同時提取這三個參數所涉及的計算量相當大。通常采用一種次優的算法分兩步來完成參數的提取。首先確定基音頻率和每個分帶的譜包絡參數,提取這些參數時可以采用與A-B-S類似的方法。然后再對每個分帶進行U/V判決。41第41頁,共52頁,2023年,2月20日,星期六

美國電信工業協會(TIA)為了選擇北美陸地移動通信系統的語音編碼標準,對工作在7.2kbps速率上的四種聲碼器的語音質量進行了測試。測試結果見下圖。在7.2kbps的IMBE算法中,含有4.4kbps的語音編碼,2.8kbps的差錯控制編碼。測試條件是不同的誤碼率和不同的運動速度。四、多帶激勵LPCMBE性能評估42第42頁,共52頁,2023年,2月20日,星期六四、多帶激勵LPC

IMBE與其它聲碼器的語音質量比較測試43第43頁,共52頁,2023年,2月20日,星期六

1993年美國國防部語音信號數字處理協會(DDVPC)開始選擇新的美國國防部2.4kb/s標準,于1996年3月最終選用TI公司和ASP公司聯合推出的混合激勵線性預測(MELP---MixedExcitationLinearPrediction)聲碼器取代舊標準FS-1015.MELP聲碼器的采樣率為8kHz,每180個樣點為一幀,幀長為22.5ms,每幀量化比特為54bits,總的速率為2.4kb/s。五、混合激勵LPC44第44頁,共52頁,2023年,2月20日,星期六以混合激勵代替基本LPC模型的二元激勵,將周期脈 沖激勵源和白噪聲源混合作為激勵信號,較準確地 描述過渡幀和弱濁音幀的激勵信號。吸取MBE算法的分帶思想,在各個子帶上對混合比例 進行控制。改進周期脈沖信號源的合成,將LPC殘差信號進行傅 立葉變換,提取基音諧波分量,量化后傳到對端用 于合成周期脈沖激勵,提高了

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論