現代信號處理報告:語音增強_第1頁
現代信號處理報告:語音增強_第2頁
現代信號處理報告:語音增強_第3頁
現代信號處理報告:語音增強_第4頁
全文預覽已結束

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

現代數字信號處理閱讀報告在認真閱讀本課程相關文獻的過程中,加深了對維納濾波、小波變換、語音信號處理方面知識的理解,本人近期主要是針對語音增強領域相關文獻進行了閱讀,并查閱了相關文獻,學習了語音增強的一般方法。下文主要是本人在閱讀文獻后的一些學習記錄和體會。語音增強研究現狀語音增強是指當語音信號被各種各樣的噪聲干擾、甚至淹沒后,從噪聲背景中提取有用的語音信號,抑制、降低噪聲干擾的技術。語音通信領域中,由于受到周圍環境以及傳輸信道的影響,純凈語音添加了背景噪聲,導致音質惡化。語音增強的目的是降低噪聲分量,提高語音清晰度和可懂度,減輕聽覺疲勞,主要應用在嘈雜環境下的噪聲抑制、語音壓縮和語音識別等場合。由于噪聲干擾干擾通常都是隨機的,從帶噪語音中提取完全純凈的語音幾乎不可能。在這種情況下,語音增強的目的主要有兩個:一是改進語音質量,消除背景噪音,使聽者樂于接受,不感覺疲勞,這是一種主觀度量;二是提高語音可懂度,這是一種客觀度量。這兩個目的往往不能兼得。語音增強方法分時域方法和頻域方法兩種。由于語音的短時幅度譜對聽覺的影響遠大于短時相位譜對聽覺的影響,基于頻域增強方法的研究較多。常見的語音增強方法有大致可分為兩類:1、基于語音統計特性的方法:如譜減法,最大似然估計法(ML),最小均方誤差估計法(MMSE)。2、基于人類感知特性的方法:如利用人耳的聽覺帶通濾波器組特性或聽覺掩蔽效應改善增強效果。例如基于譜相減的語音增強算法、基于小波分析的語音增強算法、基于卡爾曼濾波的語音增強算法、基于信號子空間的增強方法、基于聽覺掩蔽效應的語音增強方法、基于獨立分量分析的語音增強方法、基于神經網絡的語音增強方法等都是近年來應用較為廣泛的語音增強算法。二、閱讀文獻主要內容在目前的頻域語音增強方法存在著一個明顯的缺點:在增強過程中,由于是利用有聲/無聲檢測技術以無聲期間的噪聲方差作為當前分析幀各頻率點的噪聲頻譜分量的估計,而噪聲頻譜具有高斯分布,其幅度隨機變化范圍較寬,便會產生隨機誤差。若某幀某頻率點的實際噪聲分量超過估計值較多,則對純凈信號幅度估計時,就會在這些頻率點上殘留較大的噪聲分量,在頻譜上呈現為隨機出現的尖峰,在聽覺上會形成有節奏性起伏的類似音樂的殘留噪聲,也就是著名的“音樂噪聲”。針對這一情況,相關研究者提出了一系列語音增強算法。譜減法語音信號是一種典型的非平穩信號,但在一個短時間范圍內其特性基本保持不變及相對穩定,因而可以看成一個短時平穩過程進行“短時分析”,即將信號分為一段一段來分析,其中每一段稱為一幀。通過定義第k個頻譜分量的增益函數及后驗性噪比,既譜減法相當于對帶噪語音每一個頻譜分量乘以系數,當信噪比高時,含有語音的可能性大,衰減小。反之,則認為含有語音的可能性小,衰減則增大。最小均方誤差增強方法(MMSE)帶有背景噪聲的語音信號可以表示為,表示對純凈語音信號進行FFT變換后的第k個頻譜分量,作為的MMSE估計值。由貝葉斯公式可得:再根據假設噪聲譜和語音頻譜是服從零均值高斯分布可得:定義一個增益函數,則,由此可得到純凈語音頻譜幅度的估值,對其添加帶噪信號的相位,并進行IFFT即可得到增強后的聲音。基于AR模型的語音增強方法帶噪語音包含的均是平穩噪聲。因此,可以對除白噪聲以外的噪聲進行建模,并設計得到白化濾波器,帶噪語音經過白化濾波器后,可有效抑制色噪聲,但會殘留相當能量的白噪聲,這是用AR模型法很難濾除的。假設3種不同色噪聲均為0均值、平穩隨機過程,對其進行零化處理,同時由于已知數據足夠大,所以暫不考慮數據長度對參數估計的影響。首先確定模型階數,采用從低階到高階搜索的辦法,即從n=1開始對噪聲進行擬合,每次擬和結果用檢驗準則來判斷其適用性,直至達到符合要求的階數。經計算模型參差的自相關系數根據自相關系數檢驗準則:如果(t=1,2….N)是白噪聲,當數據長度N>(200~300),k從1取到(20~30)時,近似于正態分布。根據這一理論,取置信度水平為0.95,可得檢驗式,當滿足此式時,則認為相應的模型為適用模型。在純凈語音上混入-5dB、0dB、5dB的三種較低信噪比的帶噪語音,用譜減法、MMSE法、AR模型法進行語音增強實驗,實驗結果表明:譜減法剩余噪聲較大,語音失真也較為嚴重。MMSE增強結果較好,但語音失真較嚴重。AR模型方法增強后噪聲得到了“白化”,諧波結構的色噪聲得到了有效地抑制,原始語音保留較好,但剩余的白噪聲能量較大。AR模型法增強后語音信噪比在譜減法和MMSE方法之間,其主要原因就是其增強后語音殘留的白噪聲能量較大,導致信噪比較低。三、課程學習心得體會通過對現代數字信號處理課程的學習,加深了自己對信號處理方面的認識,知識體系在本科學習數字信號課程的基礎上進一步得到了提升與完善。在本課程的學習中學到了維納濾波、卡爾曼濾波、自適應濾波器等相關知識,并系統學習了各種功率譜估計模型,對語音信號處理和視頻信號處理方面加深了認識,在本科學習的基礎上更加注重在理論水平上的提升。近期的課程主要講解關于語音信號的處理知識,本人對語音增強方面的知識較為感興趣,通過閱讀相關文獻,對語音增強領域有了大體的了解,學習到語音增強的一般方法,在時域和頻域方面都研究出諸多有效的增強算法,而不同的方法又有不同的利弊。通過閱讀相關文獻,了解目前較為常見的譜減法、MMSE法、AR模型法等語音增強方法,學習了這三種方法的一般處理過程,并了解了這三種算法的性能比較。通過對這些文獻的學習,我獲益良多,但在學習的過程中也存在著不少的疑問。對于文獻中提到了復雜公

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論