




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、中北大學課 程 設 計 說 明 書學 院: 信息商務學院 專 業: 電子信息工程 題 目:信息處理實踐:語音信號的時域特征分析 指導教師:徐美芳 職稱: 講師 2015 年 7 月 8日中北大學課程設計任務書 2014-2015 學年第 二 學期學 院: 信息商務學院 專 業: 電子信息工程 課程設計題目:信息處理實踐:語音信號的時域特征分析 起 迄 日 期: 2015年6 月28日2015年7月 8日 課程設計地點: S教學樓四層機房誰s409 指 導 教 師: 徐美芳 系 主 任: 李雪冬 下達任務書日期: 2015 年 6 月 28 日 課程設計任務書1設計目的:通過設計,掌握USB總線
2、或PCI總線的基本結構,了解基于USB總線或PCI總線A/D卡的通用結構。較全面地掌握語音信號的時域特征的基本理論、原理和實現手段,較系統地分析語音信號的時域特征,使學生具有一定綜合分析問題和解決問題的能力。2設計內容和要求(包括原始數據、技術參數、條件、設計要求等):原始數據:仿真信號或實驗采集語音信號。技術要求:(1)完成基于USB總線或PCI總線A/D卡通用結構報告;(2)通過A/D卡,利用高級語言編寫信號的采集、存儲和顯示程序。(3)完成題目所要求技術:直接對語音信號的時域波形進行分析,提取的特征參數主要有:語音的短時能量,短時平均過零率,短時自相關函數等;通過仿真(實驗)驗證,編程實
3、現各時域特征參數提取的處理和實現手段,并進行結果分析。設計要求:課程設計的目的在于培養學生的綜合素質,要求學生做到:(1)根據題目要求查閱有關資料,確定方案,寫出設計方案;(2)根據對選題的理解,消化查閱資料,給出相關的實現算法和理論根據;(3) 在Matlab或VC環境下,實現算法,并給出仿真結果;(4) 對結果進行分析總結3設計工作任務及工作量的要求包括課程設計計算說明書(論文)、圖紙、實物樣品等:設計工作任務:(1) 了解選題背景,掌握基本技術,制定設計思路,寫出設計方案。(2) 完成設計內容:包括算法和程序設計;實驗驗證及技術改進,寫出設計說明書。(3) 設計答辯。工作量的要求:(1)
4、 通過查閱資料了解選題相關的基本理論、原理以及技術背景,理解選題意義;(2) 掌握USB總線或PCI總線的基本結構,了解基于USB總線或PCI總線A/D卡的通用結構;(3) 完成語音信號特征提取;(4) 通過實驗仿真驗證算法的可行性;(5) 給出技術總結。課 程 設 計 任 務 書4主要參考文獻:1 L.R. Rabiner, B.H. Juang. Fundamentals of Speech Recognition. Prentice Hall, Englewood Cliffs,1993. 清華大學出版社(影印),2002年.2胡航. 語音信號處理(修訂版),哈爾濱工業大學出版社,200
5、2年.3 吳家安等. 語音編碼技術及應用,機械工業出版社,2006年.4 韓繼慶等. 語音信號處理,清華大學出版社,2004年.5 D.G.Childers. Matlab之語音處理與合成工具箱(影印版),清華大學出版社,2004年.6 Thomas F. Quatieri著,趙勝輝等譯,離散時間語音信號處理原理與應用,電子工業出版社,2004.5設計成果形式及要求:仿真結果;課程設計說明書。6工作計劃及進度:2013年6月7日 6月15日:理解選題,查資料,掌握USB總線或PCI總線的基本結構,基于USB總線或PCI總線A/D卡的通用結構;6月16日 6月19日:在教師指導下給出設計方案;6
6、月20日 6月28日:在指導教師輔導下完成實驗;撰寫課程設計說明書; 6月28日:答辯系主任審查意見: 簽字: 年 月 日目 錄一、語音信號的介紹-1 1.1語音信號的特點-2 1.2語音信號的采集-32、 語音信號的分析-5 2.1語音信號分析技術-5 2.2 語音信號的時域分析-5 2.2.1 短時能量-6 2.2.2短時過零率分析-7 2.2.3 短時自相關函數的分析-10 2.3 語音信號的語譜圖-123、 語音信號的綜合仿真分析-13第一章 語音信號的介紹1.1 語音信號的特點通過對大量語音信號的觀察和分析發現,語音信號主要有下面兩個特點: 在頻域內,語音信號的頻譜分量主要集中在30
7、03400Hz的范圍內。利用這個特點,可以用一個防混迭的帶通濾波器將此范圍內的語音信號頻率分量取出,然后按8kHz的采樣率對語音信號進行采樣,就可以得到離散的語音信號。 在時域內,語音信號具有“短時性”的特點,即在總體上,語音信號的特征是隨著時間而變化的,但在一段較短的時間間隔內,語音信號保持平穩。在濁音段表現出周期信號的特征,在清音段表現出隨機噪聲的特征。在語音識別中,正確的判斷輸入語音的起點,重點對于提高識別率往往是重要的,在一些語音識別或低速語音編解碼器應用中,對于已經判別為語音短的部分,還需要進一步判斷清音和濁音。能夠實現這些判別的集聚在于,不同性質語音的各種短時參數具有不同的概率密度
8、函數,以及相鄰的若干幀語音應具有一直的語音特性。在孤立詞語音識別系統中,需要正確判斷每個輸入語音的起點和終點,利用短時平均幅度參數M和短時平均過零率Z可以做到。 在在下面是一段語音信號的時域波形圖(圖2-1)和頻域圖(圖2-2),由這兩個圖可以看出語音信號的兩個特點。 圖1 語音信號時域波形圖 圖2 語音信號頻域波形圖1.2語音信號的采集在將語音信號進行數字化前,必須先進行防混疊預濾波,預濾波的目的有兩個:抑制輸入信導各領域分量中頻率超出fs/2的所有分量(fs為采樣頻率),以防止混疊干擾。抑制50Hz的電源工頻干擾。這樣,預濾波器必須是一個帶通濾波器,設其上、下截止顏率分別是fH和fL,則對
9、于絕人多數語音編譯碼器,fH=3400Hz、fL60100Hz、采樣率為fs8kHz;而對丁語音識別而言,當用于電話用戶時,指標與語音編譯碼器相同。當使用要求較高或很高的場合時fH4500Hz或8000Hz、fL60Hz、fs10kHz或20kHz。為了將原始模擬語音信號變為數字信號,必須經過采樣和量化兩個步驟,從而得到時間和幅度上均為離散的數字語音信號。采樣也稱抽樣,是信號在時間上的離散化,即按照一定時間間隔t在模擬信號x(t)上逐點采取其瞬時值。采樣時必須要注意滿足奈奎斯特定理,即采樣頻率fs必須以高于受測信號的最高頻率兩倍以上的速度進行取樣,才能正確地重建波它是通過采樣脈沖和模擬信號相乘
10、來實現的。 通過錄取了一段wav格式的音頻,對其編程。實驗編程過程: %語音信號時域頻域分析 y,Fs,bits=wavread(1.wav);%讀出信號,采樣率和采樣位數。 y=y(:,1);%我這里假設你的聲音是雙聲道,我只取單聲道作分析,如果你想分 析另外一個聲道,請改成y=y(:,2) sigLength=length(y); Y = fft(y,sigLength); Pyy = Y.* conj(Y) / sigLength; halflength=floor(sigLength/2); f=Fs*(0:halflength)/sigLength; figure;plot(f,Py
11、y(1:halflength+1);xlabel(Frequency(Hz); t=(0:sigLength-1)/Fs; figure;plot(t,y);xlabel(Time(s); 實驗結果如下:圖3 原始信號 由圖可知,這段語音信號的頻率主要集中在1KHz左右,當采樣頻率為44.1KHz時,由于采樣頻率比較大,所以采樣點數就越密,所得離散信號就越逼近于原信號,頻譜也沒有發生混疊。圖4對上述信號進行1/80采樣頻率抽取,即采樣頻率變為將近500Hz時,由于采樣頻率比較小,所以采樣點數就稀疏,所得離散信號就越偏離于原信號,頻譜也發生了混疊。在采樣的過程中應注意采樣間隔的選擇和信號混淆:對
12、模擬信號采樣首先要確定采樣間隔。如何合理選擇t涉及到許多需要考慮的技術因素。一般而言,采樣頻率越高,采樣點數就越密,所得離散信號就越逼近于原信號。但過高的采樣頻率并不可取,對固定長度(T)的信號,采集到過大的數據量(N=T/t),給計算機增加不必要的計算工作量和存儲空間;若數據量(N)限定,則采樣時間過短,會導致一些數據信息被排斥在外。采樣頻率過低,采樣點間隔過遠,則離散信號不足以反映原有信號波形特征,無法使信號復原,造成信號混淆。根據采樣定理,當采樣頻率大于信號的兩倍帶寬時,采樣過程不會丟失信息,利用理想濾波器可從采樣信號中不失真地重構原始信號波形。量化是對幅值進行離散化,即將振動幅值用二進
13、制量化電平來表示。量化電平按級數變化,實際的振動值是連續的物理量。具體振值用舍入法歸到靠近的量化電平上。 語音信號經過預濾波和采樣后,由AD變換器變換為二址制數字碼。這種防混疊濾波通常與模數轉換器做在一個集成塊內,因此目前來說,語音信號的數字化的質量還是有保證的。市面上購買到的普通聲卡在這方面做的都很好,語音聲波通過話筒輸入到聲卡后直接獲得的是經過防混疊濾波、A/D變換、量化處理的離散的數字信號。在實際工作中,我們可以利用windows自帶的錄音機錄制語音文件,圖2-3是基于PC機的語音信號采集過程,聲卡可以完成語音波形的A/D轉換,獲得WAVE文件,為后續的處理儲備原材料。調節錄音機保存界面
14、的“更改”選項,可以存儲各種格式的WAVE文件。Windows自帶的錄音機聲音麥克風聲卡濾波采樣A/D轉換 Wav圖5基于PC機的語音信號采集過程采集到語音信號之后,需要對語音信號進行分析,如語音信號的時域分析、頻譜分析、語譜圖分析以及加噪濾波等處理。第二章 語音信號的分析2.1語音信號分析技術語音信號分析是語音信號處理的前提和基礎,只有分析出可表示語音信號本質特征的參數,才有可能利用這些參數進行高效的語音通信、語音合成和語音識別等處理8。而且,語音合成的音質好壞,語音識別率的高低,也都取決于對語音信號分橋的準確性和精確性。因此語音信號分析在語音信號處理應用中具有舉足輕重的地位。貫穿于語音分析
15、全過程的是“短時分析技術”。因為,語音信號從整體來看其特性及表征其本質特征的參數均是隨時間而變化的,所以它是一個非乎穩態過程,不能用處理乎穩信號的數字信號處理技術對其進行分析處理。但是,由于不同的語音是由人的口腔肌肉運動構成聲道某種形狀而產生的響應,而這種口腔肌肉運動相對于語音頻率來說是非常緩慢的,所以從另一方面看,雖然語音倍號具有時變特性,但是在一個短時間范圍內(一般認為在1030ms的短時間內),其特性基本保持不變即相對穩定,因面可以將其看作是一個準穩態過程,即語音信號具有短時平穩性。所以任何語音信號的分析和處理必須建立在“短時”的基礎上即進行“短時分析”,將語音信號分為一段一段來分析其特
16、征參數,其中每一段稱為一“幀”,幀長一般取為1030ms。這樣,對于整體的語音信號來講,分析出的是由每一幀特征參數組成的特征參數時間序列。根據所分析出的參數的性質的不同,可將語音信號分析分為時域分析、頻域分析、倒領域分析等;時域分析方法具有簡單、計算量小、物理意義明確等優點,但由于語音信號最重要的感知特性反映在功率譜中,而相位變化只起著很小的作用,所以相對于時域分析來說頻域分析更為重要。本文將簡要介紹時域分析、頻域分析以及語譜圖分析。2.2 語音信號的時域分析語音信號的時域分析就是分析和提取語音信號的時域參數。進行語音分析時,最先接觸到并且也是最直觀的是它的時域波形。語音信號本身就是時域信號,
17、因而時域分析是最早使用,也是應用最廣泛的一種分析方法,這種方法直接利用語音信號的時域波形。時域分析通常用于最基本的參數分析及應用,如語音的分割、預處理、大分類等。這種分析方法的特點是:表示語音信號比較直觀、物理意義明確。實現起來比較簡單、運算且少。可以得到語音的一些重要的參數。只使用示波器等通用設備,使用較為簡單等。語音信號的時域參數有短時能量、短時過零率、短時白相關函數和短時平均幅度差函數等,這是語音信號的一組最基本的短時參數,在各種語音信號數字處理技術中都要應用6。在計算這些參數時使用的一般是方窗或漢明窗。2.2.1 短時能量及短時平均幅度分析設語音波形時域信號為x(l)、加密分幀處理后得
18、到的第n幀語音信號為 Xn(m),則Xn(m)滿足下式: (3-1) (1) 其中,n0,1T,2T,并且N為幀長,T為幀移長度。設第n幀語音信號Xn(m)的短時能量用En表示,則其計算公式如下: (2)En是一個度量語音信號幅度值變化的函數,但它有一個缺陷,即它對高電平非常敏感(因為它計算時用的是信號的平方)。為此可采用另一個度量語音信號幅度值變化的函數即短時平均幅度函數Mn,它定義為: (3)Mn也是一帕語音信號能量大小的表征,它與En的區別在于計算時小取樣值和大取樣值不會因取平方而造成較大差異,在某些應用領域呻會帶來一些好處。 短時能量和短時平均幅度函數的主要用途有:可以區分濁音段與清音
19、段,因為濁音時En值比清音時大的多。可以用來區分聲母與韻母的分界,無聲與有盧的分界,連字(指字之間無間隙)的分界等。作為一種超音段信息,用于語音識別中。實驗過程編程如下: a=wavread(1.wav); subplot(6,1,1),plot(a); N=32; for i=2:6 h=linspace(1,1,2.(i-2)*N); En=conv(h,a.*a); subplot(6,1,i),plot(En); if(i=2)legend(N=32); elseif(i=3)legend(N=64); elseif(i=3)legend(N=128); elseif(i=3)lege
20、nd(N=256); elseif(i=3)legend(N=512); end end實驗結果: 圖6 語音信號的短時能量2.2.2短時過零率分析短時過零率表示一幀語音中語音信號波形穿過橫軸(零電平)的次數。過零分析是語音時域分析中最簡單的一種。對于連續語音信號,過零即意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。過零率就是樣本改變符號的次數。定義語音信號Xn(m)的短時過零率Zn為: (4)式中,sgn 是符號函數,即: (5)在實際中求過零率參數時,需要十分注意的一個問題是如果輸入信號中包含有50Hz的工頻干擾或者A/D變換器的工作點有偏移(這等效于輸入信
21、號有直流偏移),往往會使計算的過零率參數很不準確。為了解決前一個問題,A/D變換器前的防混疊帶通濾波器的低端截頻應高于50Hz,以有效地抑制電源干擾。對于后一個問題除了可以采用低直流漂移器件外,也可以在軟件上加以解決,這就是算出每一幀的直流分量并予以濾除。對語音信號進行分析,發現發濁音時,盡管聲道有若干個共振峰,但由于聲門波引起譜的高頻跌落,所以其話音能量約集中在3kHz以下。而發清音時,多數能量出現在較高頻率上。高頻就意味著高的平均過零率,低頻意味著低的平均過零率,所以可以認為濁音時具有較低的過零率,而清音時具有較高的過零率。當然,這種高低僅是相對而言,并沒方精確的數值關系。 利用短時平均過
22、零率還可以從背景噪聲中找出語音信號,可用于判斷寂靜無聲段和有聲段的起點和終點位置。在孤立詞的語音識別中,必須要在一連串連續的語音信號中進行適當分割,用以確定一個一個單詞的語音信號,即找出每一個單詞的開始和終止位置,這在語音處理中是一個基本問題。此時,在背景噪聲較小時用平均能量識別較為有效,而在背景噪聲較大時用平均過零率識別較為有效。但是研究表明,在以某些音為開始或結尾時如當弱摩擦音 (如f、h等音素)、弱燃破音(如p、t、k等音素)為語音的開頭或結尾;以鼻音(如n、 m等音素)為語音的結尾時只用其中一個參量來判別語音的起點和終點是有困難的,必須同時使用這兩個參數。圖3-1是用Mtalab仿真一
23、段語音信號時域波形的短時能量和短時平均過零率。實驗過程編程如下: a=wavread(1.wav) n=length(a); N=320; subplot(3,1,1),plot(a); h=linspace(1,1,N);矩陣運算 En=conv(h,a.*a); subplot(3,1,2),plot(En); for i=1:n-1 if a(i)=0 b(i)=1; else b(i)=-1; end if a(i+1)=0 b(i+1)=1; else b(i+1)=-1; end w(i)=abbs(b(i+1).b(i); end k=1; j=0; while (k+N-1)+
24、20) = +20; % 能量太高的截斷xFFTdB(xFFTdB-40) = -40; % 能量太低的截斷xFFTdB = (xFFTdB+40); % 能量整理到 0,60 之間,當然你可以整理到0,255范圍subplot(2,1,1);plot(x(1:frmsize*frmcnt); title(中北大學信息商務學院); % 畫波形subplot(2,1,2);image(flipud(xFFTdB); colormap(jet)% 畫語譜圖 實驗結果:圖9 譜圖第三章、語音信號的綜合仿真分析錄制一段自己的語音信號,并對錄制的信號進行采樣;畫出采樣后語音信號的時域波形和頻譜圖;實驗過
25、程如下:y,fs,bs=wavread(1.wav);y=y(:,1);lg=length(y);yx=(0:(lg-1)*fs/lg;yx=yx(1:lg/2);% sound(y,fs);figure(1);subplot(211);plot(y);title(原始信號);subplot(212);yf=abs(fft(y);yf=yf(1:lg/2);plot(yx,yf);ycq=zeros(1,lg); %先將抽取后的值全設為零 for i=1:80:lg; %通過循環,每隔80個點將抽取后的值賦值為原函數的 ycq(i)=y(i); %采樣值 end sound(ycq,fs);f
26、igure(2);subplot(211);plot(ycq);title(抽取后的信號);subplot(212);ycqf=abs(fft(ycq);ycqf=ycqf(1:lg/2);plot(yx,ycqf);實驗結果:圖10 原始語音信號圖11 抽取后信號由圖可知這段語音信號頻率主要集中在1000hz左右。對語音信號進行調制,為了減少在傳輸時的耗損,人們一般是先對傳輸信號進行特殊處理,然后再傳遞。把原始的待傳信號托附到高頻振蕩的過程稱為調制。我們知道音頻信號的頻率在我們的聽覺范圍內,音頻信號在無線傳輸的過程中會受到各種聲音的干擾而產生能量消耗!因此限制了傳輸的距離!所以在現實的傳送過程中要現對語音信號進行調制再發送出去!下面是對一段語音信號的調制仿真圖,載波頻率為fc=20000。實驗過程:y,fs,bits=wavread(1.wav);% sound(y,fs,bits);Y=fft(y,40000);%采樣點數40000figure(1);subplot(211);plot(y);title(原始信號波形);subplot(212);plot(abs(Y);title(原始信號頻譜);fc=20000;%載波頻率y1=modulate(y,fc,fs,fm
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年 北京市密云區教育委員會事業單位選調考試試題附答案
- 2025年中國85MEOC終端行業市場發展前景及發展趨勢與投資戰略研究報告
- 中國電動升降貨物梯行業市場規模及投資前景預測分析報告
- 2019-2025年中國農副產品行業市場調研分析及投資戰略咨詢報告
- 2020-2025年中國防彈運鈔車行業市場調研分析及投資前景預測報告
- 2025年度電競項目可行性研究報告
- 2025-2030年中國電解剝離液行業深度研究分析報告
- 2024年全球及中國DNA和RNA聚合酶行業頭部企業市場占有率及排名調研報告
- 建筑圍欄板行業深度研究分析報告(2024-2030版)
- 中國新能源環衛車行業發展監測及投資戰略研究報告
- 數據結構第2章-線性表
- 鐵路空心墩任意兩個截面砼方量計算自編公式
- 中建有限空間專項施工方案
- 華北理工選礦學課件03浮選-1浮選基本原理
- 冠寓運營管理手冊正式版
- 2022年珠海市金灣區體育教師招聘筆試試題及答案
- 畢業離校學生證遺失證明
- 智慧停車技術方案
- 土地整理質量評定表
- 【告知牌】某公司全套重大危險源告知牌(7頁)
- 中考數學復習專題二方程與不等式
評論
0/150
提交評論