




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、4.1概述4.2語音分幀4.3語音信號的時域分析4.4語音信號的頻域分析語音信號分析語音信號分析 語音信號處理的前提和基礎,只有分析出可表示語音信語音信號處理的前提和基礎,只有分析出可表示語音信號特征的參數,才有可能利用這些參數進行高效的語音通信、語音合成號特征的參數,才有可能利用這些參數進行高效的語音通信、語音合成和語音識別等處理。和語音識別等處理。貫穿于語音分析全過程的是貫穿于語音分析全過程的是“短時分析技術短時分析技術” 語音信號從整體來看其特征及表征其本質特征的參數均是隨時間而語音信號從整體來看其特征及表征其本質特征的參數均是隨時間而變化的,所以它是一個變化的,所以它是一個非平衡態過程
2、非平衡態過程,不能用處理平衡信號的數字信號,不能用處理平衡信號的數字信號處理技術對其進行分析處理。處理技術對其進行分析處理。 但是在一個短時間范圍內(一般認為在但是在一個短時間范圍內(一般認為在10-30ms10-30ms的短時間內),其的短時間內),其特性基本保持不變即相對穩定,因而可以將其看作是一個準穩態過程,特性基本保持不變即相對穩定,因而可以將其看作是一個準穩態過程,即語音信號具有即語音信號具有短時平穩性短時平穩性。 根據所分析出的參數的性質的不同可以分為: 時域分析、頻域分析、倒頻域分析,線性預測分析等;分析方法的不同: 模型分析方法和非模型分析方法不論是分析怎么樣的參數以及彩什么分
3、析方法,在按幀進行語音分析,提取語音參數之前,有一些經常使用的、共同的短時分析技術必須預先進行,如語音信號的數字化、語音信號的端點檢測、預加重、加窗和分幀等,這些也是不可忽視的語音信號分析的關鍵技術。 4.2 4.2 語音分幀語音分幀進行過預加重數字濾波處理后,接下來就要進行加窗分幀處理。一般每秒的幀數約為33-100幀,視實際情況而定。分幀雖然可以采用連續分段的方法,但一般要采用如圖3-1所示的交疊分段的方法,這是為了使幀與幀之間平滑過渡,保持其連續性。前一幀和后一幀的交疊部分稱為幀移。幀移與幀長的比值一般取為0-1/2。分幀是用可移動的有限長度窗口進行加權的方法來實現的,這就是用窗函數(n
4、)來乘s(n),從而形成加窗語音信號s(n)=s(n) (n)。 語音分幀語音分幀幀長與幀移: 取的點數為幀長,乘以采樣周期得幀長時間 兩幀間隔為幀移兩幀一定要有重疊,否則有參數突變 在語音信號數字處理中常用的窗函數是矩形窗和漢明窗等,它們的表達式如下(其中N為幀長): 矩形窗:矩形窗: 漢明窗:漢明窗:elsenNnn, 0) 1(0, 1)(elsenNnNnn, 0) 1(0),1/(2cos46. 054. 0)( 語音分幀語音分幀1.1.窗口的形狀窗口的形狀 雖然,不同的短時分析方法(時域、頻域、倒頻域分析)以及求取不同的語音特征參數可能對窗函數的要求不盡一樣, 一般來講,一個好的窗
5、函數的標準是:在時域因為是語音波形乘以窗函數,所以要減小時間窗兩端的坡度,使窗口邊緣兩端不引起急劇變化而平滑過渡到零,這樣可以使截取出的語音波形緩慢降為零,減小語音幀的截斷效應;在頻域要有較寬的3dB帶寬以及較小的邊帶最大值。 語音分幀語音分幀2.2.窗口的長度采樣周期Ts=1/fs,窗口長度N和頻率分辨率f之間存在下列關系:f=1/NTs可見,采樣周期一定時,f隨窗口寬度N的增加而減小,即頻率分辨率相應得到提高,但同時時間分辨率降低;如果窗口取短,頻率分辨率下降,而時間分辨率提高,因而二者是矛盾的。應該根據不同的需要選擇合適的窗口長度。 語音分幀語音分幀有時窗口長度的選擇,更重要的是要考慮語
6、音信號的基音周期。通常認為在一個語音幀內應包含17個基音周期。然而不同人的基音周期變化很大,從女性和兒童的2ms到老年男子的14ms(即基音頻率的變化范圍為50070Hz),所以N的選擇比較困難。通常在10kHz取樣頻率下,N折中選擇為100200點為宜(即1020ms持續時間)。這樣,經過上面介紹的處理過程,語音信號就已經被分割成一幀一幀的加過窗函數的短時信號,然后再把每一個短時語音幀看成平穩的隨機信號,利用數字信號處理技術來提取語音特征參數。在進行處理時,按幀從數據區中取出數據,處理完成后再取下一幀,等等,最后得到由每一幀參數組成的語音特征參數的時間序列。 語音信號的時域分析就是分析和提取
7、語音信號的時域參數。進行語音分析時,最先接觸到并且也是最直觀的是它的時域波形。語音信號本身就是時域信號, 時域分析是最早使用,也是應用最廣泛的一種分析方法,這種方法直接利用語音信號的時域波形。時域分析通常用于最基本的參數分析及應用,如語音的分割、預處理、大分類等。特點是:表示語音信號比較直觀、物理意義明確。實現起來比較簡單、運算量少。可以得到語音的一些重要的參數。只使用示波器等通用設備,使用較為簡單等。 短時平均能量及含義短時平均能量:每區一個n,得到一個112200( )( ) ()NNnnmmExmm x nmnE 短時能量及短時平均幅度分析短時能量及短時平均幅度分析E En n是一個度量
8、語音信號幅度值變化的函數,但它有一個缺陷,是一個度量語音信號幅度值變化的函數,但它有一個缺陷,即它對高電平非常敏感(因為它計算時用的是信號的平方即它對高電平非常敏感(因為它計算時用的是信號的平方) )。短時平均幅度函數短時平均幅度函數M Mn n,它定義為:它定義為:M Mn n也是一幀語音信號能量大小的表征,它與也是一幀語音信號能量大小的表征,它與E En n的區別在于計的區別在于計算時小取樣值和大取樣值不會因取平方而造成較大差異。算時小取樣值和大取樣值不會因取平方而造成較大差異。10)(NmnnmxM(1)區分清/濁音: 大,對應濁音, 小,對應清音。(2)在SNR高的情況下,能進行有聲/
9、無聲判決 無聲時,背景噪聲的 小 有聲時, 顯著增大。判決時可設置一個門限(3)大致能定出濁音變為清音的時刻,或反之。存在的問題:短時能量函數對信號電平值過于敏感,在實際應用中(如定點設備)很容易溢出。此時可以用平均幅度函數代替,單對清/濁音,有/無聲 的幅度差不如短時能量明顯。 ,nnE M,nnE M,nnE M,nnE M 短時過零率(短時過零率(ZCRZCR)分析)分析短時過零率:一幀語音中語音信號波形穿過橫軸短時過零率:一幀語音中語音信號波形穿過橫軸( (零電平零電平) )的的次數。次數。對于連續語音信號,過零即意味著時域波形通過時間軸;對于連續語音信號,過零即意味著時域波形通過時間
10、軸;對于離散信號,如果相鄰的取樣值改變符號則稱為過零。對于離散信號,如果相鄰的取樣值改變符號則稱為過零。過過零率就是樣本改變符號的次數零率就是樣本改變符號的次數。 短時過零率分析短時過零率分析定義語音信號定義語音信號x xn n(m)(m)的的短時過零率短時過零率Z Zn n為:為:式中,式中,sgnsgn是符號函數,即是符號函數,即10)1(sgn)(sgn21NmnnnmxmxZ) 0(, 1) 0(, 1sgnxxx 短時過零率分析短時過零率分析(1)(1)區分清區分清/ /濁音:濁音: 清音平均過零率高,集中在高頻端清音平均過零率高,集中在高頻端 濁音平均過零率低,集中在低頻端濁音平均
11、過零率低,集中在低頻端(2)(2)從背景噪聲中找出是否有語音。以及語音的起點。從背景噪聲中找出是否有語音。以及語音的起點。清音隨機噪聲,高頻濁音周期信號,低頻 短時過零率分析短時過零率分析在實際應用中,短時平均過零率容易受到A/D轉換的直流偏移、50Hz交流電源的干擾以及噪聲的影響。減少這些干擾可以有兩種方法:(1)采用帶通濾波器消除信號中的直流和50Hz低頻分量(2)用過門限率來修改過零率,減少隨機噪聲的影響過門限率反應了穿過正負門限的次數,如果存在隨機噪聲,只要信號沒有超過-T,T的范圍,就沒有過零率的產生 短時相關分析短時相關分析 相關分析是一種常用的時域波形分析方法,并有自相關和互相關
12、之分。這里主要討論自相關函數。 自相關函數具有一些性質,如它是偶函數;假設序列具有周期性,則其自相關函數也是同周期的周期函數等。可以應用于語音信號的時域分析中。 在語音信號分析中,采用的是短時自相關函數。 1 1短時自相關函數短時自相關函數 定義語音信號定義語音信號x xn n(m)(m)的的短時自相關函數短時自相關函數R Rn n(k)(k)的計算式如下:的計算式如下:這里這里K K是最大的延遲點數。是最大的延遲點數。 短時自相關函數具有以下短時自相關函數具有以下性質性質:(1)(1)如果如果x xn n(m)(m)是周期的是周期的( (設周期為設周期為N)N),則自相關函數是同周期的周期函
13、數,則自相關函數是同周期的周期函數, 即即R Rn n(k)=R(k)=Rn n(k+N(k+Np p) )。(2)R(2)Rn n(k)(k)是偶函數,即是偶函數,即R Rn n(k)=R(k)=Rn n(-k)(-k)。(3)(3)當當k=0k=0時,自相關函數具有最大值,即時,自相關函數具有最大值,即R Rn n(0)|R(0)|Rn n(k)|(k)|,并且,并且R Rn n(0)(0)等于等于確定性信號序列的能量或隨機性序列的平均功率。確定性信號序列的能量或隨機性序列的平均功率。1010( )( )()=( )()(),)0NknnnmNkmR kx m x mkx mnx nmkm
14、kKmk 1 1短時自相關函數短時自相關函數短時自相關函數存在的問題:隨著k的變化,參加運算的項減少。極限k=N-1時無運算!改進方法:兩個不同長度的窗2.2.修正的短時自相關函數修正的短時自相關函數矩形窗矩形窗1 1:矩形窗矩形窗2 2:10( )( ),) 0(NnnnmxmR kx mkkK其它值mNmm, 0) 1(0, 1)()0(),()()(Kkmnxmmxn)10(),()( )(KNkmnxmmxn其它值mKNmm, 0)1(0, 1)( 3 3相關函數的作用(1)區分清/濁音 濁音語音的自相關函數具有一定的周期性 清音語音的自相關函數不具有周期性,類似噪聲。(2)估計濁音語
15、音信號的周期,即估計基音周期 短時平均幅度差函數短時平均幅度差函數短時自相關函數是語音信號時域分析的重要參量。但是,計算自相關函數的運算量很大,其原因是乘法運算所需要的時間較長。為了避免乘法,一個簡單的方法就是利用差值。為此常常采用另一種與自相關函數有類似作用的參量,即短時平均幅度差函數(AMDF)。平均幅度差函數能夠代替自相關函數進行語音分析的原理平均幅度差函數能夠代替自相關函數進行語音分析的原理:如果信號是完全的周期信號如果信號是完全的周期信號( (設周期為設周期為N Np p) ),則相距為周期的整,則相距為周期的整數倍的樣點上的幅值是相等的,差值為零。數倍的樣點上的幅值是相等的,差值為
16、零。,.)2, 0( , 0)()()(ppNNkknxnxnd 短短時平均幅度差函數短時平均幅度差函數的定義:對于周期性的語音信號, 也呈周期性,與 相反的是: 在谷點時,對應的 是峰值平均幅度差函數和自相關函數有密切的關系可由下式表達:kNmnnnkmxmxkF10)()()(2/1)()0()(2)(kRRkkFnnn( )nF k( )nR k( )nF k( )nR k 短時平均幅度差函數短時平均幅度差函數 語音信號的頻域分析就是分析語音信號的頻域特征。 從廣義上講,語音信號的頻域分析包括語音信號的頻譜、功率譜、倒頻譜、頻譜包絡分析等, 而常用的頻域分析方法有帶通濾波器組法、傅里葉變
17、換法、線性預測法等幾種。本章介紹的是語音信號的傅里葉分析法。 因為語音波是一個非平穩過程,因此適用于周期、瞬變或平穩隨機信號的標準傅里葉變換不能用來直接表示語音信號,而應該用短時傅里葉變換對語音信號的頻譜進行分析,相應的頻譜稱為“短時譜”。 利用語音的短時傅里葉變換求語音的短時譜利用語音的短時傅里葉變換求語音的短時譜對第n幀語音信號,短時傅里葉變換,其定義如下:可知函數是時間n的離散函數,又是角頻率 的連續函數,因此,可以從兩個角度解釋短時傅里葉變換的含義:(1)標準傅里葉變換(2)濾波器角度10)()(NmmjnjnemxeX( )() ( )nxmnm x m是窗口函數序列,不同的窗口函數
18、序列,將得到不同的傅里葉變換結果 討論(1 1)當)當n n取固定值時,記取固定值時,記 ,標準,標準傅里葉變換為:傅里葉變換為:(2 2)固定不變,記固定不變,記=L=L,相當于一個濾波器,相當于一個濾波器當n取不同值時,窗 沿著 序列滑動()()( )jj mmjnmmXex mnm ey m e ()jnXe( )( )() ( )ny mx mnm x m標準的標準的FTFT()( ) ()()( )( )( )( )jLjLmnmmjLmmjLmXex mnm enmZ mx mx mnmemeZ ()nm( )x m 離散的短時傅里葉變換令 則在語音信號數字處理中,都是采用 短時傅里葉變換也叫短時譜 特點:(1)時變性:即是角頻率的函數也是時間n的函數(2)周期性:是關于角頻率的周期函數,周期為 短時功率譜短時功率譜 功率譜功率譜: :函數的功率譜函數的功率譜=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業設計與現代制造業的關系
- 工業節能技術與發展方向
- 工作壓力下的營養補充策略
- 工業設備維護與優化管理
- 工作空間環境優化以增強工作成效
- 工作場所的變革與創新
- 工程檢測中水泥檢測技術培訓
- 工程機械結構設計與分析
- 工程設計中智能化技術的應用前景
- 工程機械的結構設計與可靠性分析
- 數字化解決方案設計師職業技能競賽參考試題庫(含答案)
- 《餐飲供應鏈智能管理系統》
- 大創結題報告范文
- GB/T 24821-2024餐桌餐椅
- JGJT46-2024《施工現場臨時用電安全技術標準》條文解讀
- 2024ESC心房顫動管理指南解讀
- 2023年上海浦東新區公辦學校教師招聘考試真題
- 電信人工智能大學習抽測考試題庫(含答案)
- 中華傳統文化融入初中地理大概念單元教學的探究
- 第二單元 公頃和平方千米(講義)-2024-2025學年四年級上冊數學人教版
- 2024-2030年中國擴展現實(XR)行業未來展望與投融資狀況分析報告
評論
0/150
提交評論