第四章小波變換_第1頁
第四章小波變換_第2頁
第四章小波變換_第3頁
第四章小波變換_第4頁
第四章小波變換_第5頁
免費預覽已結束,剩余19頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、.語音增強算法研究 p584.1 小波理論 4.1.1小波變換的定義4.1. 2 小波去噪原理 .4.2 小波包變換語音增強方法4.2.1 小波包變換語音增強方法原理4 2. 2 Bark 尺度小波包分解4.2.3閩值函數4.2.4 實驗仿真4.3 小波包變換和聽覺掩蔽效應的語音增強方法4.3. 1小波包變換和聽覺掩蔽效應的語音增強方法原理4.3. 2實驗仿真 第四章 小波包語音增強算法小波(Wavelets分析的起源可以追溯到20世紀初,在20世紀80年代后期開 始形成一個新興的數學分支。 小波變換是調和分析這一數學領域半個世紀以來的 工作結晶, 是傅里葉變換發展史上的里程碑式的進展, 近些

2、年來成為國外眾多學 者共同關注的熱點。 它在傅里葉變換的基礎上發展而來, 但又有極大不同。 傳統 的信號處理方法是建立在傅立葉變換的基礎上, 而傅立葉分析使用的是一種全局 的變換,要么完全在時域, 要么完全在頻域, 因此無法表達信號的時頻局域性質, 而這種性質恰恰是非平穩信號 (如語音信號 )最根本和最關鍵的性質。小波分析是 建立在泛函分析、 傅立葉分析、樣條分析及調和分析基礎上的新的分析處理工具 它又稱為多分辨分析, 在時域和頻域同時具有良好配局部化特性, 常被譽為信號 分析的“數學顯微鏡” 。小波變換在時頻兩域都具有表征信號局部特征的能力, 它克服了短時傅立葉變換固定分辨率的缺點, 在信號

3、的高頻部分, 可以獲得較好 的時間分辨率, 在信號的低頻部分可以獲得較高的頻率分辨率, 這就使指小波變 換具有對信號的自適應性。 它能有效地從信號中提取信息, 通過伸縮和平移等運 算功能對信號進行多尺度細化分析。 小波分析是目前國際上公認的信號信息獲取 與處班領域的高新技術, 是信號處理的前沿課題, 其中小波去噪也是小波分析的 主要應用之一,對語音增強的研究不可避免的要利用小波這一有效工具。小波包變換理論是 20世紀 80年代中后期逐漸成熟并發展起來的, 由于可同 時進行時域和頻域分析, 具有時頻局部化和變分辨特征, 而且小波函數的選取也 很靈活,因此在語音增強中得到了廣泛的應用。 這就使得小

4、波包變換在信號處理方面有許多獨到的優點,特別適用于像信號處理,圖象處理,量子場論,地震探 測,話音識別與增強,雷達,機器視覺以及數字電視等科技領域31-354.1小波理論4.1.1小波變換的定義“Fl其中,甲(5-1)為給定的一個基本函數,式中 a,b均為常數,且a>0。給定平方可積的信號x(t,義為:工I®" 冋,則日門的小波變換(wavelet transform,WT) 定(吶=十卜(心=) 'f/(5-23 Y Af式中,a, b和t均是連續變量。因此此式又稱為連續小波變換(CWT)o信號皆(f)(a,b)是a和b的函數,b是時移,a是尺度因子。十&#

5、39; 丿 又稱為基本小波,或母小波。W亦U數,稱之為小波基函數,或簡稱小波基。母小波可以是實函數,也可以是復函數。的小波變換是母小波經移位和伸縮所產生的一組函丸是實信號,也是實信號,則憶(")也是實函數,反之,為復函數。在(5-1)式中,時移b的作用是確定對兀(0作伸縮。析的時間位置,也即時間中心。尺度因子a的作用是把基本小波習")£¥,當 a>1時,a越大,則 Z丿的時域支撐范圍(即川)變成時域寬度)較之川)變得越大;反之,當a<1時,a越小,則越窄。這樣,a和b聯合起來確定了對兀(')這樣,(5-2)式的小波變換可以理解為用一組

6、分析寬度不斷變化的基函數對 兀()作分析,這一變化正好適應了對信號分析時在不同頻率范圍需要不同的1石分析的中心位置及分析的時間寬度。分辨率這一基本要求。(5-2)式中的因子始終能和母函數是為了保證在不同的尺度a時,肖有蓍相同的能量,即:(5-3)0,則dt=adt',這樣,上式右邊的積分即等于的傅里葉變換為里葉變換的性質:。令X(Q),肖的傅里葉變換為的傅里葉變換為:ft-b(5=4)(5-4)由Parseval定理,(5-2)式可重新表達為:(5 5)昭;(mr工(昭皐此式即為小波變換的頻域表達式36。5.1.2小波去噪原理假設觀察信號(5 5)”是噪聲序列。假定M(f是零均值且服從

7、式中,"(')是純凈語音信號,高斯分布的隨機序列,對(5-5)式兩邊做小波變換,根據小波變換的性質,有(5-6)閃2)=附7;(依)+爐7;(仏耐即兩個信號和的小波變換等于各個信號小波變換的和。再令u (t)是零均值、獨r立同分布的平穩隨機信號,記然:山M。顯(5=6)是"的協方差矩陣。0是小波變換矩陣,對于正交小波變換,它是正交陣。分別令 x和s是對應令s(t)和u(t)的向量,向量X, S和U分別是x(t) , s(t)和u(t)的小波變換,即:xn, S二必,U二呼甘(5-7)由于X =S+U令P是U的協方差矩陣,由于:£0二耐必 = "7

8、?町二 0所以:P 二 euU =(5-8)(5-9)因為W是正交陣,且0";/,所以 P "/由此,可得到一個重要的結論:平穩白噪聲的正交小波變換仍然是平穩的白噪聲。由此結論可知,對于加法性噪聲模型,經正交小波變換后,最大程度地去 除了 *(r)(5-10)X(r)是含有噪聲的語音信號,的高斯白噪聲。St是沒有疊加噪聲的語音信號,其中,N是方差為X")進行N層離散小波包分解,得到一組小波包分解系數由兩部分組成:一部分是S對應的小波包系數,記為對信號,另一部分是的相關性,其能量將集中在少數的小波系數上,這些系數即是信號經小波變換后在各個尺度下的模極大值。 但是,噪

9、聲經正交小波變換后仍然 是白噪聲,因此,其小波系數仍然是不相關的,它們將分布在各個尺度下的所有 時間軸上。這一結論即為抑制噪聲提供了理論依據,即在小波變換的各個尺度下 保留那些模極大值點,而將其他點置零,或是最大程度地減小,然后利用處理后 的小波系數做小波反變換,即可達到抑制噪聲的目的。5.2小波包變換語音增強方法 521小波包變換語音增強方法原理在小波變換中,由于多分辨分析只是對低頻部分作進一步分解,高頻部分則 不再分解。小波包分析能將頻帶進行多層次劃分,對多分辨分析沒有細分的高頻 部分進一步分解,并能夠根據被分析信號的特征,自適應地選擇相應頻帶,使之 與信號頻譜相匹配,從而提高了時一頻分辨

10、率 37。假設帶噪語音信號可以表示為:N()對應的小波包系數,記為"幾N對于每一個小波包分解系數,選擇一個當T的閾值,并對系數進行閾值量化,得出估計小波系數人A,使得盡量小。5.2.2 Bark尺度小波包分解Barkhausen等學者依據人耳的掩蔽效應的實驗結果,提出了頻率群的概念。即將基底膜分解為許多的小段,每一小段稱為一個頻率群。在20-16000HZ范圍內共有24個頻率群。同一頻率群的聲音在大腦中是疊加在一起進行評價的,具 有一致的心理聲學特征。按頻率由低到高,將頻率群順序編號,將編號定義為 32新的頻率單位Bark。若記Bark域的頻率變量為z,赫茲(Hertz)域頻率變量為

11、/,則有:(5-11)*2_0.53/ + 1960Bark域的頻率描述充分反映了人耳的聽覺特性,因此在語音處理方面得到 了大量應用。根據小波包的函數空間正交剖分理論,可以構造與人耳Bark域頻解,使每個子帶的中心頻率相差減至 致,也不會導致較大的計算量。因此,所示,共68個子頻帶38-41。率描述相似的小波包分解結構,稱之為“ Bark尺度小波包分解”。常規方法是模 擬人耳的24個頻率群,對于8kHz采樣的語音信號,選取1至17個頻率群,得 到的每個子帶的中心頻率相差 IBark。試驗證實,如果對 Bark域進行進一步分 1 / 4 Bark,對語音的描述會更加細本論文采用的小波包分解樹結構

12、如圖5-1to,P)ft*)fl.l)«C|IXDIJ/I1U|M)().»)(1.61 iinHI14.31士叫 C5.1)421 低 3J圖N1 Kuk尺度小注包分解示令國Fig.5-1 principle diugriim uf Bitrk-eule wjvdlt:! pack說 decurtipusitiim523閾值函數在小波閾值去噪理論中42-44,閾值函數的選取和閾值的確定是兩個最基 本的問題。目前存在的閾值函數主要是硬閾值函數和軟閾值函數。但由于硬閾值 函數整體不連續,直接導致了會在去噪后的信號中出現突變的震蕩點,當噪聲水平較高時,這種現象尤為明顯。軟閾值函

13、數雖然整體連續性好, 但是由于當小波 系數較大時,處理過的系數與原系數之間總存在恒定的偏差,這將直接影響重構信號與真實信號的逼近程度,給重構信號帶來不可避免的誤差。考慮到軟、硬閾 值函數存在的缺陷,人們提出了各種基于這兩種基本閾值函數的改進的閾值函數。在去噪過程中起到了決定性的作用。如果 兄太小,那么,施加小波閾值幾閾值以后的小波系數中將包含過多的噪聲分量,達不到去噪的目的;反之,如果>太大,那么將去除一部分信號的分量,從而使由小波系數重將后的信號產生 過大的失真。因此,在實際工作中,估計閾值的大小尤為關鍵。常用的估計閥值I幾的閥值函數為硬閾值函數45和軟閾值函數46:(5-12)(5-

14、13)但是,由于硬閾值函數整體不連續,直接導致了會在去噪后的信號中出現突 變的震蕩點,當噪聲水平較高時尤為明顯。軟閾值函數雖然整體連續性好,但是 由于當小波系數較大時,處理過的系數與原系數之間總存在恒定的偏差,這將直 接影響重構信號與真實信號的逼近程度。文獻36提出了一種改進的閥值函數能夠有效減少失真,其閥值函數:爐呼,> 久空 n (匕 J 屮V 乂(5-14)一種改進的閥值函數公式為:(5-15)小波包變換語音增強方法原理圖:純冷涪冷圖5-2小股也菱嶽語咅曽強育去原理閨Fig.5-2 piinciplc diagriim of wavelet packet小波包變換的語音增強算法的具

15、體步驟為: /分幀。步驟1:對帶噪語音 步驟2:采用5階Daubechies小波進行Bark尺度小波包分解,得到每一級的小 波包分解系數5。步驟3:用小波系數在各尺度下絕對值的中值估算噪聲方差 。丿。(5T6;medlan W.丄)0.6745步驟4:利用通用閥值 図計算每一級的節點閥值,并對該節點的小波包分解 系數進行采用公式(5-15)的處理,更新小波包系數。(5-17)無呷二 5 V21n?V步驟5:進行小波包重建,重疊相加恢復原始數據幀長度的增強語音。524實驗仿真用MATLA對Bark尺度小波包變換語音增強方法進行實驗仿真1. 實驗所用數據:語音取自863語音庫,噪聲為NOISEX.

16、 92數據庫的高斯白噪聲和火車噪聲, 語音信號的采樣率為8kHz,幀長K為256個采樣點,幀疊為50%2. 仿真所選標準:波形圖,語譜圖。3. 仿真結果如下:0.2-0朋喻卩眥瞅洲I艸艸4快刪川刪1恤卅恤伽卅淌-0.2-020- *j0225X 10*0.51152(b)帶噪語咅(SdBfl噪聲)(采樣點數)2.5X 10°0.51152(c)小波包變換講音増強方法(來樣點數)圖5-3波形圖比較Fig.5-3 wavck)mi comparison- 4r.J* 二-2000 - -2000-1152帶噪語fl-fOdBl l 曲)能0.52000-氏屋宰;二七7=苛-哥 二孑

17、9;T' . S 亠苦T 丄;,4000-I g 二 士A r 孟:二 1 r .F 3:一 x 二上00 511.522.5"卜te包變換i卄咅堀強方法強硏咅Us圖5-4語譜a圖比較Fig,5-4 spcclTogram comparison5.3小波包變換和聽覺掩蔽效應的語音增強方法 531小波包變換和聽覺掩蔽效應的語音增強方法原理小波包變換理論是20世紀80年代中后期逐漸成熟并發展起來的,由于可同 時進行時域和頻域分析,具有時頻局部化和變分辨特征,而且小波函數的選取也 很靈活,因此在語音增強中得到了廣泛的應用。 但是,增強后不可避免地伴有一 定程度的音樂噪聲,影響了增強

18、效果。掩蔽效應通過模擬人耳的感知,能夠掩蔽 同時進入聽覺系統的較小噪聲信號。優點是可以有效地抑制音樂噪聲,缺點是性 能受限于對背景噪聲功率譜估計的準確性, 且計算量較大,運行速度較慢。為了 抑制音樂噪聲和提高運算速度,本文提出一種基于小波包變換和聽覺掩蔽效應的 語音增強算法,同時具備了小波包變換和掩蔽效應兩種方法的優點。仿真結果表明,該算法在信噪比和聽覺舒適度上都取得了較好的效果。小波包變換和聽覺掩蔽效應的語音增強方法原理圖 :感知濾波器的作用是在信號頻譜失真最小的情況下使殘差噪聲的頻譜能量小于掩蔽閾值。感知濾波器應滿足:/(e) *73廠 < T(co)<l(5-lS)其中,Na

19、)為背景噪聲功率譜密度,廠(")為噪聲掩蔽閾值。的具體形式為:(5-19)&仙廠)基于小波包變換和聽覺掩蔽效應的語音增強算法的步驟為 步驟1:對帶噪語音信號用小波包分解的方法進行去噪處理,得到增強后的語音A信號1,并進行分幀得到S 2。步驟2:用Johnston掩蔽模型計算掩蔽閥值T。A6步驟3:使增強語音和掩蔽閥值T經過感知濾波器日(1°)A進行濾波,得到S 2(5-20)步驟4:經過幀重疊相加得到增強語音S。A八 St(69)- Hd532實驗仿真用MATLAB對小波包變換和聽覺掩蔽效應的語音增強方法進行實驗仿真1. 實驗所用數據: 語音取自863語音庫,噪聲為

20、NOISEX. 92數據庫的高斯白噪聲和火車噪聲, 語音信號的采樣率為8kHz,幀長K為256個采樣點,幀疊為50%2. 仿真所選標準:波形圖,語譜圖,信噪比,PESQ值,坂倉距離。3. 仿真結果如下:首先,在純凈語音中加入5dB高斯白噪聲作為帶噪語音,采用基于小波包變換 和聽覺掩蔽效應的語音增強算法(本文算法),比較傳統的小波包變換增強算 法,增強后仿真結果如下:621C,1 ; 1 1 1| - -J_ 'II ,| RL i0- -hIl-0.20.511,5但應始出音(采樣點數)2.54X 100,2-0|r I42 =Ih I 嚴卄叮J; II M仆0.2-0,201, 1J

21、 ' II1*計M卩11L1'-T0.511.52帯噪倍育(射B白嗥用)(采樣點敵0.511.52(C)小玻包變換悟音増®方法爲樣山數)2.5X 10*2.5X 10*0.2 rI0 - ,-02I00.511.522.5(小波包變換利攤蔽效應需咅增強力法采樣點教)乂 ifFig 5-6 wavcfbnii comparisonis(a)Jv kt H C t/s)0心NHJ 妍®2000-4000 二00.511.52(b),ir噪講咅(d目白噪聲)t対、2.52000- N ;天嚴 . y"I-> - _ -KF 筆4000100.511

22、.52©小波包斐換語音増強方決(Vs)2000-伍Rd W JBL400010gw -10.511 522.5(日)小波包斐換和掩蔽效應沿汗增強方法 t/s)圖5-7語譜圖®比較Fig.57 ipecirogram comparison4. 結果分析音。曰。圖5-6和圖5-7分別為增強后的波形圖和語譜圖。其中,(a)為純凈語音; (b)為添加5dB白噪聲后的帶噪語音;(C)為采用小波包變換語音增強方法后的增 強語音。(d)為采用小波包變換和掩蔽效應語音增強方法后的增強語音。從時域 波形圖及頻域語譜圖的比較結果可以發現, 帶噪語音采用本文算法增強后,增強 語音和原始語音在波形

23、圖和語譜圖上非常接近,噪聲得到了明顯的抑制,增強效果明顯優于傳統小波包變換的增強算法。其次,采用在純凈語音中分別加入高斯白噪聲,全局信噪比為OdB,5dB,10dB的帶噪語音作為測試對象。比較小波包變換和聽覺掩蔽效應的語音增強方法和傳 統小波包變換的增強算法,增強后語音質量性能的評估采用信噪比 SNF和語音質 量感知評估PESQ PESQ是 ITU-T的P.862標準,用來評價增強后語音的試聽效 果。PESQ尋分在4.5到-0.5之間,得分越高表示語音質量越好。實驗結果如表 5-1 示:3fZ5-r1.5* -=小波包變換和聽愛掩蔽效應語音増強方沈 h 小波包變換語音1ft強方法2345678

24、910輸入佶哋比(dBK白噪聲圖5-8感知:1昏音質量評價(.白噪聲)比較Fig.5-K 卩ESQ(while noise) cumprtriMn從實驗結果可以看出,在各種信噪比下采用小波包變換和聽覺掩蔽效應的語 音增強方法比傳統小波包方法,在信噪比和P ESQh都有很大提高,并且在信噪比較小的情況下,增強效果更加明顯。通過主觀聽測表明:采用傳統小波包方法增強后伴有明顯的音樂噪聲,而采用該方法增強后音樂噪聲得到了明顯地抑制, 取得了較好的增強效果。養5-1信嗥比比較 labile 5-1 compare the SN R唏聲種蹇輸入信噪比UlB)小波包變換方決WB)小波包變換和掩蔽效應方迦曲口

25、噪川04.229358 4»219.f)26KW12,509412.91745.4子空間和小波包變換的語音增強方法541子空間與小波包變換的語音增強方法原理子空間與小波包變換的語音增強方法原理圖為IK1逆變換佔訃噪 聲特征 值圖5-9子空間與小波包埜換的語音增強方法理圖Fig.5-9 Prmciph di;igr4m of subspace 肋(J wEivki packel子空間與小波包變換的語音增強方法具體步驟為:步驟1:帶噪語音進行KL,變換,得到子空間域中的帶噪語音的特征向量U和特征值"步驟2:采用最小值跟蹤算法更新帶噪語音特征值Ay,得到估計噪聲特征值入。步驟3:

26、采用小波包變換方法更新帶噪語音特征值Ar得到八。步驟4:帶噪語音特征值AAf減去噪聲特征值,得到純凈語音特征值估計值S,可以得到時域約束估計器(TDC)增益G步驟5:由KL逆變換可得最優估計器彳-% - V式可得純凈語音的估計5.4.2實驗仿真用MATLA對子空間與小波包變換的語音增強方法進行實驗仿真1.實驗所用數據: 語音取自863語音庫,噪聲為NOISEX. 92數據庫的高斯白噪聲和火車噪聲, 語音信號的采樣率為8kHz,幀長K為256個采樣點,幀疊為50%2.仿真所選標準:波形圖,語譜圖,信噪比,PESQ值,GUI語音增強性能測試界面03.仿真結果如下:首先在純凈語音中加入SdB高斯白噪

27、聲作為帶噪語音,采用子空間與小波包變 換的語音增強方法得到增強后仿真結果如下:0.2-£-0.2-0-0.2-_ -0.2-0.2-II-01.511.5a)K始誥音(采ff點救),T-b' N,2.5 X 1(?0-0.2 L00.2 =0*511.52(b)帶噪譏汗(5dB估哋幣(采樣貞數)Z5X 10*0.511522)小波包變換S音増強方法t采樣點數)2.54X 1002 = =00152.59)子空問和小波包變換的諂rt-増強"法采樣點數斗ffl 5-10波形圖比較Fig-5-lO waveform coinparisim2000>_ -40002000-4000 L上二七0.5152.50.5(a)ffi 始 1 啓 t/s2.5WHIP 峰 雷 E l (5dBA 噪聲 Hf9-=2000-:-一 =4000-0,51,S2.520004000何小液包變換誥音增強方袪t/5T0.51.522,5(l)r-空間和小波包變換的i普宵增強方法t/s圖5=11語講®圖比較FigJ-l 1 spectrogram com parisonK 5-2信嗥比比較table 5-2 Coinpaie l lie SNR輸人信噪比何日)(151015小波也變換方法6J411畑3()12”£

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論