




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、學(xué) 號(hào):3070431106題目類型:論文(設(shè)計(jì)、論文、報(bào)告桂林理工大學(xué)GUILIN UNIVERSITY OF TECHNOLOGY本科畢業(yè)設(shè)計(jì)(論文)題目: _聲紋識(shí)別技術(shù)分析 _系(院):信息科學(xué)與工程學(xué)院專業(yè)(方向): _通信工程班 級(jí): _學(xué)生: _指導(dǎo)教師:_楊曉斐桂林理工大學(xué) 畢業(yè)設(shè)計(jì)(論文)獨(dú)創(chuàng)性聲明 本人聲明所呈交的設(shè)計(jì)(論文)是我個(gè)人在指導(dǎo)教師指導(dǎo)下進(jìn)行的研究工 作及取得的研究成果。盡我所知,除了設(shè)計(jì)(論文)中特別加以標(biāo)注和致謝的 地方外,設(shè)計(jì)(論文)中不包含其他人或集體已經(jīng)發(fā)表或撰寫的研究成果,也 不包含為獲得桂林理工大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書(shū)而使用過(guò)的材料。對(duì) 設(shè)計(jì)
2、(論文)的研究成果做出貢獻(xiàn)的個(gè)人和集體,均已作了明確的標(biāo)明。本人 完全意識(shí)到本聲明的法律后果由本人承擔(dān)。設(shè)計(jì)(論文)作者簽名: 日期: 年 月 日桂林理工大學(xué) 設(shè)計(jì)(論文)使用授權(quán)聲明 本設(shè)計(jì)(論文)作者完全了解學(xué)校有關(guān)保留、使用設(shè)計(jì)(論文)的規(guī)定, 同意學(xué)校保留并向國(guó)家有關(guān)部門或機(jī)構(gòu)送交設(shè)計(jì)(論文)的復(fù)印件和電子版, 允許設(shè)計(jì)(論文)被查閱或借閱。本人授權(quán)桂林理工大學(xué)可以將本設(shè)計(jì)(論文) 的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫(kù)進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù) 制手段保存和匯編本設(shè)計(jì)(論文) 。指 導(dǎo) 教 師 簽 名:日期:年月設(shè)計(jì) (論文)作者簽名:日期: 年 月 日桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論
3、文I摘 要聲紋識(shí)別作為生物認(rèn)證技術(shù)的一種關(guān)鍵詞:3 5個(gè)桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文2Voiceprint Recognition Technology AnalysisAbstractAs one of the biometrics authentication techniques, voiceprint recognition is an authe nticati on tech no logy that recog ni zes who is speak ing on the basis of characteristic in formati on in cluded in spe
4、ech waves. Compared to other authe nticati on tech no logies, it has a lot of advantages, such as easy speech data collection, real time recognition and Iong-distance recognition, etc. It can be used widely in many identity recognition fields, such as teleph one banking, accessc on trol system, data
5、base system and so on. Voicepri nt recognition is therefore more and more widely applied in the field of biometric iden tificati on.In this paper, a complete voicepri nt recog niti on system is realized based on Matlab, in cludi ng the pre-process ing of the voice, feature extract ion, later part of
6、 the model trai ning and recog niti on. Voice process ing in the pre-process ing and feature extracti on phases uses the Mel-Frequency Cepstrum Coefficients as characteristic parameter, because it could better reflect the hearing characteristics of human ears than the traditional frequency cepstrum
7、coefficients. In the model of the voiceprint recognition, I use the model of vector qua ntizati on (VQ), which uses the vector coord in ates to represe nt the characteristics of the voicepri nt.The test result indicates that the system can intuitively show the time domain waveform and the codebook v
8、ector figure of the wave files to be trained and tested, and the system has a higher recog niti on rate which is satisfy in g. If the voice in the testi ng wave file has been trained and registered in the system, the system will show the accessary identity in formati on of the voice that has bee n r
9、ecorded in the early training process.Keywords: Voicepri nt Recog niti on; MFCC; Vector Quan tizati on; Matlab桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文III目 次摘 要.IAbstract .II1緒論 .11.1研究背景.11.2聲紋識(shí)別技術(shù)的研究目的與意義 .11.2.1研究意義 .11.3聲紋識(shí)別技術(shù)的國(guó)內(nèi)外研究現(xiàn)狀 .11.3.1聲紋識(shí)別技術(shù)的分類 .11.3.2聲紋識(shí)別技術(shù)的現(xiàn)狀與發(fā)展方向 .11.3.3聲紋識(shí)別技術(shù)面臨的主要問(wèn)題 .11.4論文的主要內(nèi)容及章節(jié)安排.12聲紋識(shí)別技術(shù) .
10、22.1聲紋識(shí)別的預(yù)處理和特征提取 .22.1.1語(yǔ)音信號(hào)的預(yù)處理 .23系統(tǒng)總體設(shè)計(jì) .33.1聲紋識(shí)別系統(tǒng)的需求分析 .33.2系統(tǒng)總體設(shè)計(jì)方案.34聲紋識(shí)別系統(tǒng)的具體實(shí)現(xiàn) .44.1語(yǔ)音信號(hào)預(yù)處理的設(shè)計(jì) .44.2基于MFCC的特征提取 .44.3聲紋識(shí)另廿系統(tǒng)的設(shè)計(jì) .45聲紋識(shí)別系統(tǒng)的性能測(cè)試 .55.1聲紋識(shí)別系統(tǒng)的軟、硬平臺(tái).55.2聲紋識(shí)別系統(tǒng)的界面介紹 .56結(jié)論 .6致謝 .7參考文獻(xiàn) .8桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文11緒論1.11.1研究背景紋識(shí)別與指紋識(shí)別,虹膜識(shí)別一樣,是通過(guò)人體顯著的生物特征和行為特征來(lái)自 動(dòng)識(shí)別待測(cè)人身份的方法。1.21.2聲紋識(shí)別技術(shù)的研究目的
11、與意義1.2.1研究意義比爾.蓋茨認(rèn)為“以人類生物特征(指紋,語(yǔ)音,臉相等)進(jìn)行生物認(rèn)證的技術(shù),在今后數(shù)年 內(nèi)將成為IT產(chǎn)業(yè)內(nèi)最為重要的技術(shù)革命”。1.31.3聲紋識(shí)別技術(shù)的國(guó)內(nèi)外研究現(xiàn)狀1.3.1聲紋識(shí)別技術(shù)的分類1.3.2聲紋識(shí)別技術(shù)的現(xiàn)狀與發(fā)展方向聲紋識(shí)別技術(shù)在未來(lái)將向著遠(yuǎn)程識(shí)別,嵌入式應(yīng)用,和提高在不同環(huán)境下的識(shí)別 率等幾個(gè)方向發(fā)展。1.3.3聲紋識(shí)別技術(shù)面臨的主要問(wèn)題1.41.4論文的主要內(nèi)容及章節(jié)安排本文的主要內(nèi)容有以下幾個(gè)部分。第一章緒論。主要介紹了聲紋識(shí)別技術(shù)的研究背景,研究意義,發(fā)展現(xiàn)狀以及目 前研究的技術(shù)難點(diǎn)。第二章主要介紹聲紋識(shí)別技術(shù)的原理。主要介紹語(yǔ)音信號(hào)各項(xiàng)前期處理的
12、原理包 括預(yù)處理與提取 MFCC語(yǔ)音特征參數(shù),以及 VQ模型的原理。第三章主要介紹系統(tǒng)的總體設(shè)計(jì),包括系統(tǒng)需求分析和系統(tǒng)總體方案設(shè)計(jì)。第四章將介紹本聲紋識(shí)別系統(tǒng)的具體實(shí)現(xiàn)方法。本章將逐一介紹本聲紋識(shí)別系統(tǒng) 各部分的實(shí)現(xiàn)流程以及流程中每一步的實(shí)現(xiàn)方法。第五章將展示本聲紋識(shí)別系統(tǒng)的性能測(cè)試結(jié)果。本章主要通過(guò)解圖的方式展示系 桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文2統(tǒng)實(shí)現(xiàn)各部分功能的情況,并給出具體的實(shí)驗(yàn)步驟和實(shí)驗(yàn)結(jié)果。桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文3(2-1)2-1所示。1* . .ii2聲紋識(shí)別技術(shù)2.12.1聲紋識(shí)別的預(yù)處理和特征提取2.1.1語(yǔ)音信號(hào)的預(yù)處理其傳遞函數(shù)如式2-1:H(Z)= 1 - I1
13、Z1圖2-114顯示了 Mel頻率與實(shí)際頻率的函數(shù)關(guān)系,頻帶劃分如表圖2-1 Mel刻度與頻率的關(guān)系 表2-1 Mel濾波器組的頻帶劃分表濾波器號(hào)頻率范圍(Hz)中心頻率(Hz)濾波器號(hào)頻率范圍(Hz)中心頻率(Hz)10-892813104315489141187224154151343-169415124154-300224161512-189216945224-383300171694-210618926300-472383181892-233821067383-569472192106-258923388472-67456920233
14、8-286025899569-787674212589-3154286010674-907787222860-3742315411787-1043907233154-3817347212907-11871043243472-40003817TOOO 000IOOOOcoco2 2桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文43系統(tǒng)總體設(shè)計(jì)3.13.1聲紋識(shí)別系統(tǒng)的需求分析3.23.2系統(tǒng)總體設(shè)計(jì)方案輸入被訓(xùn)練輸入待識(shí)別語(yǔ)音語(yǔ)音訓(xùn)練識(shí)別”播放預(yù)處理預(yù)處理顯示時(shí)域波形1X1MeMe 1 1倒譜系數(shù)MeMe 1 1倒譜系數(shù)預(yù)處理丄基于VQVQ模型 訓(xùn)練與被訓(xùn)練碼本 逐一計(jì)算距離MeMe 1 1倒譜系數(shù)王1生成碼本并
15、保 存碼本4-判別顯示碼本空間1顯示時(shí)域波形 與碼本空間播放識(shí)別結(jié)果播放識(shí)別結(jié)果圖3-1總體設(shè)計(jì)方案桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文54聲紋識(shí)別系統(tǒng)的具體實(shí)現(xiàn)4.14.1語(yǔ)音信號(hào)預(yù)處理的設(shè)計(jì)4.24.2基于MFCC勺特征提取4.34.3聲紋識(shí)別系統(tǒng)的設(shè)計(jì)桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文65聲紋識(shí)別系統(tǒng)的性能測(cè)試5.15.1聲紋識(shí)別系統(tǒng)的軟、硬平臺(tái)5.25.2聲紋識(shí)別系統(tǒng)的界面介紹聲紋識(shí)別系統(tǒng)的性能測(cè)試桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文76結(jié)論聲紋識(shí)別技術(shù)是一項(xiàng)具有挑戰(zhàn)性的研究項(xiàng)目,在查閱了大量國(guó)內(nèi)外文獻(xiàn)資料的基 礎(chǔ)上,我對(duì)矢量量化進(jìn)行了學(xué)習(xí)和研究,初步實(shí)現(xiàn)了與文本無(wú)關(guān)的聲紋識(shí)別系統(tǒng)。本 文所作的工作主要在兩
16、個(gè)方面:首先分析人耳聽(tīng)覺(jué)的生理機(jī)制,得到了人耳所聽(tīng)到的 聲音高低與頻率并不成正比關(guān)系的特點(diǎn),進(jìn)一步研究Mel頻率用于刻畫(huà)語(yǔ)音音調(diào)的有效性,然后分析了用于聲紋識(shí)別的語(yǔ)音特征參數(shù)MFCC的提取和具體實(shí)施步驟;其次學(xué)習(xí)和研究了矢量量化模型的原理,討論了將矢量量化方法用于與聲紋識(shí)別的具體算 法。本聲紋識(shí)別系統(tǒng)通過(guò) Matlab實(shí)現(xiàn),一共涉及到5個(gè)函數(shù),分別為train、testOne mfcc、vqlbg和vad。其中前四個(gè)為本人自己編寫,最后一個(gè)是參照相關(guān)書(shū)籍和網(wǎng)上的 資料編寫的。另外需要注意的是在后期的改動(dòng)中,已將train函數(shù)的部分代碼嵌入到了GUI界面的.m文件中了。在實(shí)現(xiàn)本系統(tǒng)的過(guò)程中, 我
17、也曾遇到了一些困難, 最大的問(wèn)題就是 GUI界面和功 能函數(shù)之間的數(shù)據(jù)傳遞問(wèn)題,主要表現(xiàn)為數(shù)據(jù)總是以字符串的形式傳遞,使得功能函 數(shù)無(wú)法讀取信息。經(jīng)過(guò)查閱資料,通過(guò)使用強(qiáng)制類型轉(zhuǎn)換的方式,將數(shù)據(jù)強(qiáng)制轉(zhuǎn)換為 字符類型解決了此問(wèn)題。雖然本系統(tǒng)可以完成聲紋識(shí)別系統(tǒng)基本的訓(xùn)練和識(shí)別功能, 但也存在著一些不足之處。最大的不足是界面設(shè)計(jì)不夠人性化,在訓(xùn)練時(shí)不能在界面 中直接錄入被訓(xùn)練人的身份信息。其次是系統(tǒng)訓(xùn)練語(yǔ)音的個(gè)數(shù)需事先設(shè)定好。這些都 是可以考慮改進(jìn)之處。桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文8致謝桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文9參考文獻(xiàn)1許百林基于矢量量化(VQ)和混合高斯模型(GMM )的說(shuō)話人識(shí)別的研究.
18、碩 士學(xué)位論文東南大學(xué),20052 Y Bennani, F Fogelman-Souli ,(P Gallinari. A connectionist approach for automaticspeaker ide ntificati on. Proc ICASSP90 Intern ati onal Conference on Acoustics Speech and Signal Process ing, 20023朱民雄 聞新 黃建群 周露.計(jì)算機(jī)語(yǔ)音技術(shù)(修訂版)M.北京航空航天大學(xué)出 版社,20024胡益平.基于GMM的說(shuō)話人識(shí)別技術(shù)研究與實(shí)現(xiàn).碩士學(xué)位論文.廈門大學(xué), 200
19、75 DS Reyno Id, RC Rose. Robust Test- In depe ndent Speaker ide ntificati on using Gaussia nMixture Speaker Models J, IEEE Transactions on Speech and Audio Processing, 19956 DA Reyno Ids. Speaker Ide ntificati on and Verificatio n Using Gaussia n Mixture SpeakerModels J. Speech Commu ni catio n, 199
20、57 DA Reyno Ids, TF Quatieri, RB Dunn. Speaker Verificati on Using Adapted Gaussia nMixture Models J. Digital Sig nal Processi ng, 20008王炳錫屈丹彭煊.實(shí)用語(yǔ)音識(shí)別基礎(chǔ)M.國(guó)防工業(yè)出版社,20059白瑩.用人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)的與文本無(wú)關(guān)的說(shuō)話人識(shí)別.碩士學(xué)位論文.華北電力大學(xué),200410何振亞顧明亮王太君史笑興.語(yǔ)音信號(hào)的主分量特征.東南大學(xué)應(yīng)用科學(xué)學(xué) 報(bào),199911何強(qiáng) 何英.MATLAB擴(kuò)展編程M.清華大學(xué)出版社,200212 Jialo ng He,
21、Li Liu, G n ther Palm. A Discrim in ative Trai ning Algorithm for VQ-BasedSpeaker Identification J. IEEE transaction on Speech and Audio Processing, 199913 RH Wang, LS He, H Fujisaki. A Weighted Distanee Measure Based On The FineStructure of Feature Space: Application to Speaker Recog nition R. ICAS
22、SP, 199014 SS Steve ns. Ha ndbook of Experime ntal Psychology (2 nd editio n) M. New York:Wiley Baddeley, 198615蔡蓮紅 黃德智 蔡銳.現(xiàn)代語(yǔ)音技術(shù)基礎(chǔ)與應(yīng)用M.清華大學(xué)出版社,20032005桂林理工大學(xué)本科畢業(yè)設(shè)計(jì)論文106.2節(jié)能措施.錯(cuò)誤!未定義書(shū)簽第七章環(huán)境影響分析.錯(cuò)誤!未定義書(shū)簽錯(cuò)誤!未定義書(shū)簽錯(cuò)誤!未定義書(shū)簽錯(cuò)誤!未定義書(shū)簽1.4研究結(jié)論及建議.錯(cuò)誤!未定義書(shū)簽第二章 項(xiàng)目建設(shè)的背景和必要性.錯(cuò)誤!未定義書(shū)簽錯(cuò)誤!未定義書(shū)簽。 錯(cuò)誤!未定義書(shū)簽 錯(cuò)誤!未定義書(shū)簽6.1設(shè)計(jì)依據(jù)1.1項(xiàng)目概況 .1.2研究依據(jù)及范圍1.3主要技術(shù)經(jīng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《水循環(huán)的原理與意義:初中地理教學(xué)教案》
- 2022學(xué)年上海進(jìn)才中學(xué)高一(下)期中歷史試題及答案
- 詩(shī)歌鑒賞技巧與方法:高一語(yǔ)文詩(shī)歌教學(xué)教案
- 書(shū)包蘋果250字(9篇)
- 八面山公司團(tuán)建活動(dòng)方案
- 公交公司清明節(jié)活動(dòng)方案
- 公交愛(ài)心活動(dòng)方案
- 公眾互動(dòng)展覽活動(dòng)方案
- 公眾微信推廣活動(dòng)方案
- 公共機(jī)構(gòu)節(jié)能活動(dòng)方案
- 福建省福州市2023?2024學(xué)年高一下冊(cè)期末考數(shù)學(xué)試卷附解析
- 2024年中國(guó)鐵路成都局集團(tuán)有限公司招聘考試《鐵路基本常識(shí)》真題庫(kù)及答案
- 生態(tài)草場(chǎng)使用權(quán)轉(zhuǎn)讓協(xié)議
- 糧食熏蒸作業(yè)管理制度
- 醫(yī)院醫(yī)保獎(jiǎng)懲管理制度
- 2025年中級(jí)經(jīng)濟(jì)師之中級(jí)經(jīng)濟(jì)師金融專業(yè)題庫(kù)練習(xí)試卷A卷附答案
- Python數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)結(jié)合試題及答案
- 2025-2030中國(guó)EHS管理軟件行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 海鮮水產(chǎn)電商商業(yè)計(jì)劃書(shū)
- 高考數(shù)學(xué)基本技能試題及答案
- 建筑工程項(xiàng)目的整體策劃與實(shí)施試題及答案
評(píng)論
0/150
提交評(píng)論