【畢業學位論文】語音識別自適應技術的研究與實現-計算機科學與技術

上傳人：O*** IP屬地：四川上傳時間：2016-07-31 格式：PDF 頁數：91 大小：1.18MB 積分：0 舉報 版權申訴

已閱讀5頁，還剩86頁未讀，繼續免費閱讀

【畢業學位論文】語音識別自適應技術的研究與實現-計算機科學與技術.pdf 免費下載

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

I 摘要盡管非特定人的語音識別系統已經達到了令人鼓舞的性能，但是在實際應用時由于說話人和環境的改變通常會使得系統性能顯著下降。當遇到特殊口音的說話人，或者環境有一定的噪音時，系統的誤識率甚至有可能增加原來的5倍。語音識別要走向實用，就必須克服這個性，語音應的非常要。文說話人應論了語音應的。通說話人的學的論，和實了常用的說話人應大率和大“性。實應說話人應和環境應有。在，文”一于語音識別的應。通在的一個的，這了的，在應時應 ”了識和應的，有的性。在，的使用了一個的，用來環境和說話人的，了加的。的要用來的于音的，時了個的性。，應的特，時用了一的使用應的略。在論文的實，這即使在應的情況下可以取得的。在無噪音和有噪音的環境別可以降低識別字錯誤率。實這能夠有的克服說話人和環境識別系統的影響，語音識別系統的要求。關鍵詞語音識別，說話人應，環境應， in is a an of so to to to of in of By a At of in a is in a is By a to AP to of In a to by a to AP AP is a of to of on AP a of is In is a in a in a is V 目錄摘要 I V 第一章言 1 音識別 1 音識別的 1 音識別的歷史與狀 2 音識別系統的框架 4 音應 4 話人應 5 他應 6 內發展動態 7 8 8 8 第二章說話人應定人系統與非特定人系統話人話人應話人應的類話人應的要述 25第三章于參換的應大率 30 識量域平滑實大“性介估實述 46第四章應言境應應體框架與的略述 54第五章實與論環境系統框架與論的應實境應的別應應述 70第六章總 73參考文獻 75附錄 81圖表索 85個人歷 87致謝 89 1 第一章引言處于信息革命浪潮時代的今天，人于樣信息的需求與日俱增，人急切需要的信息處式。語音，作人類信息交流的、有、使用的，來者的關。音識別語音識別用算人的語音信動取有的信息，定語音信的語言的。作一個學域，與學、語音學、語言學、學、學、學、人工能、字信處論、式識別論、統信息論、論、算學學。音識別的意義人語音識別識的，人語音識別”了來的目。語音識別的目的就是人與人之間話交流信息一樣，實人由話，就是以“，使能“人的語言，話音的內語言或有的，或者一使能夠人的作，”人類或的動 ”來。 ,語音識別鍵和之,人交革命的下一。: 語言是的。語音識別有大的實際應用，其發展、和實用的發展，其算、動、通信、國、人。目可以的語音識別要應用有語音系統，作一的文字第一章言 - 2 - ，用口述代鍵向算文字，這動和”來革命性的變語音系統，人在動以了一安、的，特別是當系統工作在一特定的環境或已用來其動作的環境或一特殊的用人時于話系統的系統，用了、和的索或，可以用在、交、之，語音識別可以用于口語系統、算輔助教學、動身份域。音識別的歷史與現狀動語音識別開于五十年代。當時電子信頻譜儀開用于語音信識別、量的音節和音。其有代表性的是1952年美國的和1956年節詞識別系統2。六十年代，字算的發展使人語音信的由擬信的向字。在這一時期，4和語音的使人語音的有了一個系統的了。人人類“的和了，發了人耳音的不頻率有不的力的反應力，”了臨頻論。這一時期，在語音識別的算尚未找到算的和算。但人了段類式匹配。與時，語言域的一性在。六十年代的性七十年代語音識別的發展打下了。七十年代，語音識別無論在論，是在系統實，有了的發展。1975年發于性編碼譜系是識別的特征，不但識別大有，算復雜小。一時期，六十年代 ”的動態時間規 7 的應用于語音識別。于和識別系統紛紛建立來。七十年代一個大的里碑，就是和識到可以一章言 - 3 - 應用于語音識別。七十年代”了的孤立詞識別系統， 0、大詞匯量動語音“寫系統11、與話者無關的語音識別系統12。到了八十年代，語音識別有了的性的發展。矢量量13和隱馬爾可夫 14，15在語音識別獲得了的應用，了 6，17這樣的的非特定人續語音識別系統。，八十年代人工神經網絡的熱潮波及語音域，”了于人工神經網絡18或者人工神經網絡和隱馬爾可夫的混 19，20，21的識別系統。九十年代，信處、學、語言、碼搜索算論日益，算軟硬件系統性能不斷，”了一大詞匯量續語音識別系統， 2，3，4。這系統大體用了 “的，不僅有于隱馬爾可夫的學，了復雜的語言以及的碼算。有的系統加了語言部，使系統性能一。目已有不語音識別系統實用階段，走了市，這里列”近個人電雜報道的世要語音識別軟件的評 25。這個評表在實用的語音識別系統已經發展到了非特定人、超大規詞匯量和續語音識別階段，并有大約93%的識別率。表1000、L&H 音識別系統的性能 000 L&H 別率 95% 91% 93% 95%是否支持用支持支持支持支持動詞匯表 160,000 60,000 34,000 64,000 大動詞匯表 250,000 670,000 64,000 2,000,000 第一章言 - 4 - 音識別系統的框架雖目的實用的語音識別系統使用不的和碼，但圖1語音識別系統的一般性的框架。語音信通信處識別使用的一系列特征向量識別再利用語言和學得到應特征向量有大率的詞序列時應有用的信息用來語言和學修改。圖1音識別系統的框架音自適應技術圖1，目的大使用語音識別系統了一個非常要的應。的作用要是用應來調學和語言，使系統應的應用狀況。雖一個訓練的系統可以應不的情況，但和實際作狀況間總存在一定的。以使語音識別系統可以通量的矯盡量小這是十要的。應就是這樣信處 (碼/識別(學模型(言模型(用(用(音(第一章言 - 5 - 一，系統參調，使系統的匹配由于克、通道、環境噪音、說話人、文體和應用的下文的。話人自適應目語音識別在小詞匯量的非特定人別系統已經可以達到的識別率。于平的詞錯誤率達到了3% 26。盡管平錯誤率低，但有一說話人的錯誤顯與其他人。由于使用的說話人來訓練非特定人的系統，使得說話人之間的當作說話人內部的處了。這樣使得一個學了大量的，有可能降低于個的說話人的建。這一可以由一個說話人的語音非特定人系統和特定人系統SD 有的訓練這個系統，特定人系統性能要非特定人系統2到3倍。文獻26”的，表1表1特定人與特定人系統性能于一說話人的語音，非特定人和特定人系統。其訓練得到，再訓練600個。說話人 ) ) .3 .6 .9 .0 .2 .3 .6 .5 .8 .1 .6 94第一章言 - 6 - 特定人系統需一個說話者訓練，一般言需的語音量至應達600 話匯量在5000以27。大量的語音于個使用者是一的，處這需的小時，這使特定人系統的實用性到大。了這個，開說話人應，即在一個已經訓練的系統，用一定的說話人的語音應，圖系統這個說話人的建。一可以是一個說話人訓練的特定人系統和一個用量說話人的訓練語音訓練的非特定人系統的，使系統的識別率近于說話人經訓練的特定人系統的平。了非特定人系統存在的之，說話人應可以用來增識別系統環境的應能力，特別是環境噪音或克的應能力。文工作要在說話人應的。他自適應技術了說話人應( 說話人的音特的應能力) ，應下個環境的應能力，特別是環境噪音或克的應能力。環境噪音的應可以有的一是語音的噪音，使得語音變得。時，系統噪音的應能力就體在不的環境噪音，取不的噪，盡量噪音續作的影響。這需要噪音，以定應的處。有一是有噪音的語音來訓練，使得噪音的一個有部。時，系統噪音的應能力體在噪音反“ 使用時的噪音環境。當環境噪音與訓練噪音不一致時，系統必須噪調，排噪音系統識別性能的影響。第一章言 - 7 - 說話人的語言特的應能力。語言特的應，要是的文體式和語體式的應能力。系統應語音流的特一定的調，使得系統的參特定的語音性。在語體式，要有口語體和體。口語語言存在大量的略、臨時、復調、錯以及非語和無語音 28。說話人的語特的應能力。這一是未來語復系統的要求，即未來的語音識別系統可以動識別語。內外發展動態語音信處應的是語音識別的發展并發展來的。目應已經了語音識別的一個不可缺的要部，并開應用在大實用語音和平，，的。個語音識別的發展，語音識別系統的”性的之一29，30。這是語音識別系統由實實用的一個切關鍵的。說話人應是其不的一個和。這已經了來的的關和，有語音識別的與位開的力應的。語音的國際學會開 ”說話人應作論。目，國際說話人應的要可以大致下說話人規377，其目的是建立一個規的說話人間，使得人的語音可以“其。這樣可以”說話人間的降到低。規的，其使用的有道譜規說話人類17，43，45，65，通一定的類或者類算，不說話人的類組。識別時取與目說話人近的組識別。這是十有的，系統使用。第一章言 - 8 - 譜變換476，91，92，是通使用性或非性的變換”一個說話人的語音譜間“到一個人的譜間，實應。需要 ”的是，這變換即可以用于特征間可以在。參調546，79，82，85，是”原有識求”達到大率a 系統用的參。的介和請參論文的第二章。國的語音識別，但由于語語音識別的要性日益 ”，近十年的發展十。以應九十年代開的說話人應的國可以和國。目國內這的要有清華大學、國學學、國學動、大學、國學大學、國大學、電大學 31，36079，73，74，82。文的工作是語音識別的應的，要內的實及。了下的工作(1) 實于大率的說話人應。(2) 實于大“性的說話人應。(3) ”一個的應。(4) 使用說話人應環境和噪音應。內第一章言 - 9 - 第一章述語音識別、語音應、以及文要工作第二章了說話人的原，要介說話人應的和原，介了常的說話人應 ; 第三章 ”了于大率于大“性應的原和實 ; 第四章述了 ”的應 ; 第五章 ”了實和的第六章文總。 11 第二章說話人自適應技術章 ”了說話人應的、原、類、以及一常的。定人系統與非特定人系統目語音識別系統說話人的類，可以特定人系統D和非特定人系統I。，特定人的語音識別系統用于個特定的用，并要求使用者夠的個人語音以訓練系統。這特定性使系統不的平或信息，有語言無關性，無論口音，要使用者能在訓練及識別持一致就可得到的識別。有特定人系統的識別率已達到95 以31。用使用的性大大了特定人系統的一與應用，一有的用加人，系統要求訓練，否識別率降。一般言，訓練需要的語音量應達到話以話用23 ，錄訓練語音20 以。在有情況下，人大量的語音會令個使用者處這需的加，就無須論及是否可以夠的環境與時間來訓練了。在實，有情況要求頻換使用人，環境下的口述錄音，時間表的信息索。時，非特定人的語音識別系統表” 大。這非特定人系統能夠在一用大量訓練的下，當的用的識別。情況就是一說話人，無論口音、話，能識別。第二章說話人應 - 12 - 這顯與人的吻。遺憾的是第一章表 1示，有非特定人系統的識別無滿實際使用的要求，其錯誤率可當于應的特定人系統的至三倍，在情況下甚至能達 5 倍。，即使是一個工作的非特定人系統在遇到特殊的說話人別，稱，識別率會顯著下降32。特定人系統和非特定人系統性能的距的原是顯的。非特定人系統使用的說話人語音來訓練識別系統的，雖能夠的來語音元的復雜的時變特性、協發音，時卻使得說話人之間的略，降低了系統于個的說話人建的。下體一下說話人的原和類。話人差異（影響識別系統的識別的有，不他可以一般劃類說話人之間的說話人內部的一個人的說話有己的特。當一個人說話時，他發”的語音到的影響，他的道的、寬和物形狀，年齡，性別，康狀況，文，個人的發音習慣。這使得一個人的語音可能和一個人完不一樣。這一可以圖 2得清楚。說話人之間的要個和說話習慣 33。要是緣于個人的發官的形狀、大小和動態特性不。這語音的頻有顯著的影響，使得不人不的學特征男女之間的要。這情況的一個極端的子是說話人性別語音頻譜參的影響。建立一個于的語音，可以發，音頻率 f 取于的尺寸和特性，以及的張力。一般言，男性說話者的 f 大致布在 60200圍內，女性說話者和小孩的 f 在第二章說話人應 - 13 - 200450。目表 34，男性和女性在發元音時有顯不的共振峰頻率，男性發的元音頻低，共振峰寬窄，并頻譜平緩。這是什用男性語音訓練的特定人系統在女性或雙性時有的原。圖2個不說話人發字 8語音的時頻波形圖和語譜圖。可以清楚”不說話人之間的。說話習慣和說話人學習說話的有關，這習慣響發的清晰和共振峰率的不。體的說話人的語和口音，這即使在人的“力十要。人不的說話習慣，個人的教育和文的不，用言的不，屬的社會和團不以及個人的經歷、氣質的。國家影響發音的社會，域環境，宗教信仰，文作了的，并著闡述口音的影響35。文獻? ”，音節之間的協發音會口音的改變變。文獻? ”，實口音的影響大約可以使得識別系統的錯誤率增加23倍。由于發的原是十復雜的，以這說話人之間的用的類來是困的。第二章說話人應 - 14 - 即使略說話人之間的，于一個說話人，在不的時間、不的和狀態下，述一內大的。這是發音之間存在道形狀和語的。當一個人由于感情的變大或小說話時這就加顯。這一個人己的發音稱之說話人內部的。要語、感情語氣和康狀況的影響?。這的一個有變，就可能使這個說話者訓練的識別系統的性能有大的退。總體不說話人學變的微，要個體說話者的語變大得以捕捉和述。在一識別系統，需要區說話人之間的和說話人內部的。人的語音識別個人的語音，就要考慮說話人之間的，輕說話人內部的。不，于非特定人的語音識別系統，不管是說話人的改變，是發音條件的變，要考慮。遺憾的是，迄今止，人沒有能夠建立一套的述，有求助于統的，通大量的訓練獲取平的信息，個人特性的參與。但由于個人信息的削弱，了系統個特定人識別的下降。了這個，說話人應應。話人自適應了第一章第二節和章第一節里到的特定人系統和非特定人系統訓練量和說話人這一矛盾，人 ”了建立一渡性，由的說話人量的樣，系統通取其的有用信息并一定的算原有的非特定人修，得到話者的。這即稱說話人應A，應的系統有人稱統。其原有的說話人常稱參考說話人的說話人目說話人說話人應可以是圖使用特定人系統訓練需的來特定人的建的，圖2。第二章說話人應 - 15 - 的語音識別系統說話人的特定人識別系統一般的語音識說話人特有的信息圖2話人應一個特定人識別系統可以通 ” 訓練的得到的通用語音識和說話人的得到的說話人特有的信息來實。說話人應算的，在早的語音識別系統建立就開了。語音識別的發展，說話人應發得到大家的。話人自適應的分類說話人應，在什時候，以什式應和怎樣使用應可以下有監督應即在特定人使用識別系統之，由系統規定的語音，系統應。目說話人說的訓練語音規定，訓練的字、詞或子是系統已的。無監督應即目人說話人需量或不應，由系統以式逐調系統參，以應于目說話人。系統不道目說話人說的語音內或參的修通識別系統的反饋來實的。靜態的應即識別系統一性使用有應應，的識別。第二章說話人應 - 16 - 的應即識別系統是在逐調到狀態的，不斷使用的來應。調的一般不使用者。這式在應圖2個于說話人應系統通常使用的是靜態有監督的應和無監督的應，者應來冊，者應來識別的向反饋。圖 2 ”了這樣一個實際系統的子36。當應的量無或系統可以一的應時，應使用的應。這情況下，有無監督的可以使用，不無監督的條件。話人自適應的主要說話人應的有，文”他大致以下四類說話人類說話人規譜變換參調不得 ”的是說話人應的類并不唯一，有之間沒有特別清晰的。一文獻37，說話人規算一在特征間的譜變換。在實際的應用，大系統往往使用應，節人語音用冊語音用應用語音訓練應在應冊D 二章說話人應 - 17 - 會 ”個實。下就文的類體介這說話人應話人（盡管說的說話人的大，但人仍可以輕松的識別不口音和性別的人的語音。這說人的大可能可以一規，語音個性的特征。這樣在識別系統說話人之間的就可以了。說話人規的就是來源于人的識別。說話人規的目的是建立一個規的說話人間，使得人的語音可以“其。這樣可以”說話人之間的降到低學特性不變。可以說話人規是圖”說話人的語音特參考說話人的，這樣可以使用已有的參考說話人的特定人識別系統來識別說話人的語音。圖2的示圖。圖2話人規示圖說話人規的在于語音的樣性。要找到一一般的能夠的“到規間是困的。常用的有譜規 ?，38表，時譜可以用來說話人和信道的特征。實，話人的語音規算規的語音語音識別參考說話人的第二章說話人應 - 18 - 是諸用來補償說話人和信道影響的子。處驟首，用一個于能量的有 /無算歷個語流，算有幀的譜，流的有幀參譜，得到的特征參。由于訓練和的有語流的譜零，時說話人和信道可能來的卷積畸變。道 ?，39，67道償道的來規不說話人的。體的實，大致可以類1通語音頻率特性用的共振峰頻率的估，道子 2利用大“ 來估道子。的續處一樣，是利用，頻率語音頻譜道不的影響。了特征參或語音變的，說話人規的一個找的特征參。不的特征參，于不的說話人的性有一定的。有文獻表，在常的特征參，其他的，說話人的應性要?。找的、性的特征參，是期以來工作的目之一。文獻40，41，42”一于征的應。由于變性，這的特征說話人的道是不感的，可以大大小由于道的說話人之間的。在作者的實，特征的識別譜，甚至于大“的道應。由于說話人規需要復雜的“，并有語音信息樣處，了語音件的內以使用率不是十。話人類（說話人類類實說話人應的一個的。應不的說話人有與其應的，應就是找” 應于目說話人的。實際由于要訓練一個

人人文庫> 全部分類> 畢業設計 > 畢業論文

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
5. 人人文庫網僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

【畢業學位論文】語音識別自適應技術的研究與實現-計算機科學與技術

文檔簡介

溫馨提示

最新文檔

評論

老太爷的乳妓h开裆裤,久久久久久精品国产三级非禁歌 ,久久久久久久99精品国产片,免费观看交性大片

【畢業學位論文】語音識別自適應技術的研究與實現-計算機科學與技術

文檔簡介

溫馨提示

最新文檔

評論

相關文檔