第14章-語音增強_第1頁
第14章-語音增強_第2頁
第14章-語音增強_第3頁
第14章-語音增強_第4頁
第14章-語音增強_第5頁
已閱讀5頁,還剩21頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第14章語音增強§14.1概述§14.2語音特性、人耳感知特性及噪聲特性§14.3濾波法語音增強技術§14.4利用相關特性的語音增強技術§14.5非線性處理法語音增強技術§14.6減譜法語音增強技術§14.7利用Weiner濾波法的語音增強技術§14.1概述

語音增強是指語音質量的改善或提高。因為實際語音都是在有噪聲和干擾的情況下產生的,所以語音增強的目的就是去掉語音信號中的噪聲和干擾。語音增強技術有廣泛的應用,如作為語音編碼和語音識別的預處理,消除語音中的混響,從錄音中恢復出高質量的語音。應用于研究的語音數據大都在無噪環境下采集的。?1)實際環境存在各種各樣的干擾噪聲,最常見的是背景噪聲,噪聲干擾下的語音,其特征參數發生了很大的扭曲,噪聲干擾下的語音識別率大大降低、合成語音質量急劇惡化等。?2)語音增強的目的:從帶噪語音中提取盡可能純凈的原始語音,從主觀度量上講,就是改善語音質量、消除背景噪聲,從客觀度量講,即提高語音可懂度。?3)針對不同的噪聲,采用不同的語音增強方法,因噪聲種類繁多,不可能有通用的語音增強方案。§14.1語音特性、人耳感知特性及噪聲特性?1語音特性:前已述及,這里簡單回顧A、是時變的、非平穩、非遍歷的隨機過程,短時相對平穩;B、分濁音和清音,前者表現出周期性,在頻域有共振峰,能量大都集中在較低頻段內;后者類于白噪聲,無明顯的時域和頻域特性。C、可用統計分析特性描述。2.人耳感知特性目前,用于語音增強的語音感知方面的一些結論:A、幅度譜對感知起決定性影響,相位譜對不敏感;B、人耳對頻率高低的感受近似與該頻率的對數成正比;C、人耳有掩蔽效應,即強信號對弱信號起抑制作用。人耳有掩蔽效應:即指一個聲音的存在會影響對另一個較弱聲音的聽覺,另外,當一個聲音突然停止時,人耳約在150ms內對其它弱音聽不清楚,甚至聽不見。因此提高語音的SNR,就可在語音與噪聲共存時,感覺不到噪聲的存在。D、共振峰對語音感知非常重要,特別是第二共振峰比第一共振峰更為重要,因此對語音信號進行一定的高通濾波不會對可懂度產生影響。E、人耳在多人的說話環境中,能分辨出所需聲音。3.噪聲特性:

(a)加性噪聲(1)沖激噪聲:例如打火、放電都會引起沖激噪聲。它的時域波形是類似于沖激函數的窄脈沖。消除沖激噪聲的方法通常有兩種:對帶噪語音信號的幅度求均值,將該均值作為閾值,超過該閾值則判斷為噪聲,在時域濾除;當沖激脈沖不太密的時候,也可以通過內插的方法避開或平滑掉沖激點,從而在重建語音時去掉沖激噪聲。(2)周期噪聲:例如發動機產生的干擾、市電干擾都是周期性的干擾。在頻譜上表現為離散的窄譜,通常可以采用陷波器方法進行消除。(3)寬帶噪聲:例如說話時同時伴隨著呼吸引起的噪聲,隨機噪聲源產生的噪聲,以及量化噪聲等。應用中常近似為高斯噪聲或白噪聲。噪聲頻譜遍布于語音信號頻譜中,消除比較困難,一般需要采用非線性處理方法,減譜法,Weiner濾波法。(4)語音干擾:干擾語音信號和待傳語音信號同時在一個信道中傳輸所造成的干擾(如在通信中串話引起的)。區別它們的方法是利用基音差別。可以用梳狀濾波器提取基音和各次諧波,再恢復出有用的信號。(b)非加性噪聲傳輸噪聲:傳輸系統的電路噪聲。與背景噪聲不同,它在時域中是語音和噪聲的卷積。處理這種噪聲可以用同態處理的方法,把非加性噪聲變換為加性噪聲來處理。干擾語音背景噪聲純凈語音+信道傳輸噪聲語音增強增強語音§14.3濾波法語音增強技術1陷波器法對于周期噪聲采用陷波器是比較簡便和有效的方法,設計的陷波器的幅頻曲線的凹處對應于周期噪聲的基頻和各次諧波,并使這些頻率處的限波寬度足夠窄。帶噪語音DFTIDFT頻譜整形器增強語音2自適應濾波器自適應濾波器能有效地在未知環境中跟蹤時變的輸入信號。使輸出信號達到最優,所以可以用來構成自適應的噪聲消除器。+自適應濾波器r(t)-+r’(t)s’(t)y(t)=s(t)+n(t)s(t)為語音信號,n(t)為未知噪聲信號,y(t)為帶噪語音信號,r(t)為參考噪聲輸入,與語音信號無關,與噪聲有關。該濾波器的實質是實現帶噪信號中的噪聲估計,并用原始信號y(t)減去估計值r’(t),達到語音增強的目的。§14.4利用相關特性的語音增強技術1自相關處理抗噪法語音增強技術該方法利用語音信號本身相關,而語音與噪聲、噪聲與噪聲可認為互不相關的性質,對帶噪語音信號做自相關處理,可以得到與不帶噪語音信號同樣的自相關序列。即帶噪語音的自相關函數近似等于純凈語音信號的自相關函數。將自相關系數作為識別系統的特征,可以達到抗噪聲的目的。開方器移動Tp自相關系數確定Tp一周期波形切除相關波形連接輸出帶噪語音信號自相關處理抗噪法的流程2利用復數幀段主分量特征的降噪方法來自環境的噪聲具有幀間相關性小,能量分布頻率范圍廣且數值較小,在語音信號主分量特征中對應于貢獻率較小的分量的特點。因此可以利用復數幀段主分量特征提高抗噪性。復數幀段特征是采用相繼的復數幀組成的特征參數矢量作為語音識別輸入特征量,由于噪聲成分具有幀間相關性小的特征,所以利用復數幀段特征量等于相應的減弱了噪聲的影響。為了進一步降噪,可以求取復數幀段參數特征的主分量特征,由于噪聲對應于較小的分量,所以貢獻率較大的主分量作為語音識別特征,而舍棄較小的分量,這樣既可以降低噪聲,也可以解決輸入特征矢量維數增加時,計算量增大的問題。主分量是N個D維樣本的自相關矩陣的本征向量,每一個本征向量對應一個本征值,本征值小的重要性也小,小本征值部分往往對應噪聲,所以可以從特征量中去除小本征值對應的主分量,達到降低噪聲的影響。§14.5非線性處理法語音增強技術1中心削波法對于噪聲頻譜遍布于語音信號頻譜中的寬帶噪聲,如果噪聲振幅比大部分的語音信號振幅低,則削去低幅度成分也就削去了寬帶噪聲。所以我們可以在頻域中采取中心限幅的方法,高幅度的頻譜可以通過而低幅成分不允許通過,從而實現噪聲抑制。2同態濾波法對于乘性或卷積性噪聲可以采用同態濾波的方法。帶噪語音FFTln[]IFFT音調提取FFT頻譜分析合成輸出復倒譜串脈沖同態濾波法原理框圖同態濾波可以用于識別系統的預處理。卷積信號經過同態濾波器后由卷積運算變成了相應的復倒譜求和運算,這樣可以分離出乘性噪聲。再由復倒譜提取音調參數,經過頻譜分析獲取降噪處理之后的共振峰,最后合成為降噪后的語音信號。§14.6減譜法語音增強技術

減譜法是假定加性噪聲與短時平穩的語音信號相互獨立的條件下,從帶噪語音的功率譜中減去噪聲功率譜,從而得到較為純凈的語音頻譜。減譜法假定語音信號短時平穩,所以需要對輸入語音加窗后處理。y(t)=s(t)+n(t)FFT|?|2

Pn(ω)

+-(?)1/2

相位恢復Ψ(ω)IFFTs(t)Py(ω)=Ps(ω)+Pn(ω)設s(t)為純凈語音信號,n(t)為噪聲信號,y(t)為帶噪信號,有y(t)=s(t)+n(t)其傅立葉變換為Y(ω)=S(ω)+N(ω)假定語音信號與加性噪聲獨立,則有|Y(ω)|2=|S(ω)|2+|N(ω)|2即功率譜的關系為:Py(ω)=Ps(ω)+Pn(ω)Ps(ω)=Py(ω)-Pn(ω)噪聲功率譜Pn(ω)可以通過發聲前的靜音段的功率譜來估計。帶噪語音功率譜和噪聲功率譜相減就可以認為是純凈語音功率譜。由于在傅立葉變換后只考慮了功率譜,沒有考慮相位的變化,所以在傅立葉反變換時,還要考慮相位的變化,即Ψ(ω)。§14.7利用Weiner濾波法的語音增強技術該方法是在最小均方準則下用Weiner濾波器實現對語音信號的估計,即對于帶噪語音信號,確定濾波器的沖激響應,使帶噪語音信號經過該濾波器的輸出能夠滿足均方誤差最小。設s(t)為純凈語音信號,n(t)為噪聲信號,y(t)為帶噪信號,有y(t)=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論