




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、2014屆本科畢業(yè)論文(設(shè)計)題 目: 系 別: 信息工程學(xué)院 班 級: 2010級計算機科學(xué)與技術(shù)(嵌入式技術(shù)方向) 學(xué) 號: 201060861? 姓 名: 指導(dǎo)教師: 職 稱 起訖日期: 2013年10月16日-2014年5月31日 文檔頁面設(shè)置約定:一律用A4紙規(guī)范打印,左邊距為2.8cm,右邊距為2.2cm,上邊距都為2.5cm,下邊距都為2.4cm。頁眉、頁腳邊距分別為1.7cm和1.5cm,行間距均為固定行距22磅,文中公式均為單倍行距.字間距為默認(rèn)值奇數(shù)頁眉內(nèi)容為:××屆××專業(yè)畢業(yè)設(shè)計(論文),偶數(shù)頁眉的內(nèi)容為:××
2、×(作者姓名):××××(論文題目),均采用宋體小五號居中。中、置于目錄頁之前。頁碼從正文開始編排。英文摘要單獨一頁置于正文參考文獻后,致謝語單獨一頁置于英文摘要后,英文摘要、致謝語不需要頁眉、頁腳。題目黑體四號字,應(yīng)以簡明、確切、有概括性的詞語反映文章內(nèi)容。字?jǐn)?shù)要適當(dāng),一般不宜超過20個漢字。姓名:宋體小四號字。噪聲環(huán)境下語音特征參數(shù)魯棒性的研究張三豐三明學(xué)院 信息工程學(xué)院 2010級計算機科學(xué)與技術(shù)(嵌入式技術(shù)方向)摘要:實用有效的說話人識別系統(tǒng)越來越成為研究的重點。語音特征參數(shù)的魯棒性直接影響一個說話人識別系統(tǒng)的具體性能,過去主要針對移動
3、通信環(huán)境下存在信道失真的問題,研究差分倒譜的魯棒性。文中則主要在加性白噪聲環(huán)境下研究Mel倒譜參數(shù)、Mel差分倒譜參數(shù)的頑健性以及它們經(jīng)過倒譜系數(shù)零均值化(CMN)處理后識別性能的改進。從仿真結(jié)果可以看出:在加性白噪聲環(huán)境下,差分倒譜參數(shù)具有很好的魯棒性;倒譜系數(shù)零均值化能有效的除去加性白噪聲。關(guān)鍵詞:語音識別;魯棒性;Mel倒譜參數(shù);Mel差分倒譜;倒譜系數(shù)零均值化摘要以簡要文字介紹研究課題的目的、方法、內(nèi)容及主要成果,中文摘要字?jǐn)?shù)一般不超過400字。 關(guān)鍵詞是表述畢業(yè)論文(設(shè)計)主題內(nèi)容信息的單詞或術(shù)語,應(yīng)盡量從漢語主題詞表中選取,第一關(guān)鍵詞應(yīng)能體現(xiàn)出文章的學(xué)科分類。關(guān)鍵詞數(shù)量一般為35個
4、。論文中英文字體均用Times New Roman字體。注:所有文字內(nèi)容僅做樣板。1. 設(shè)計(論文)題目為四號黑體字,可以分為1或2行居中打印;設(shè)計(論文)題目下空一行打印作者姓名(單獨一行,小四號宋體,居中);下行打印“三明學(xué)院 信息工程學(xué)院 XX級XX專業(yè)”(五號宋體,居中);再下行打印摘要。2. 摘要二字為小四號黑體,“摘要:”二字后打印內(nèi)容(五號宋體);摘要內(nèi)容下空一行打印關(guān)鍵字,“關(guān)鍵詞:”三字為小四號黑體,其后的內(nèi)容為五號宋體,關(guān)鍵詞之間用分號隔開, 3. 英文摘要題目和關(guān)鍵字全部采用小四號Times New Roman字體,摘要內(nèi)容和關(guān)鍵字內(nèi)容均用五號Times New Roma
5、n字體。目 錄第一章 緒論11.1 語音識別簡介11.1.1什么是語音識別11.1.2 語音識別的應(yīng)用及分類11.2 國內(nèi)外語音識別技術(shù)的發(fā)展歷史及現(xiàn)狀11.3 語音識別面臨的問題21.4 本課題研究背景及內(nèi)容2第二章 語音識別基礎(chǔ)理論32.1 語音信號產(chǎn)生的機理32.2 語音信號的預(yù)處理42.2.1 預(yù)濾波、采樣、A/D轉(zhuǎn)換42.2.2 預(yù)加重42.2.3 分幀加窗52.3 端點檢測52.3.1 短時能量6 2.3.2 短時平均過零率7第三章 常用的語音識別模型8第四章 噪聲下語音特征參數(shù)的提取識別9第五章 結(jié)論10參考文獻11附件 語音“0”的各狀態(tài)頻譜圖132014屆計算機科學(xué)與技術(shù)(嵌
6、入式技術(shù)方向)專業(yè)畢業(yè)論文(設(shè)計)第一章 緒論語言,是人類進行行為溝通和思想交流最重要的工具1,也是人類最重要的信息載體。隨著信息科技的快速發(fā)展,計算機的越來越便攜化和應(yīng)用的復(fù)雜化,在越來越多的領(lǐng)域有了讓計算機聽懂人言的要求,這樣,就引出了語音處理技術(shù)這門交叉學(xué)科。語音識別技術(shù),是語音處理技術(shù)中的一個重要組成。1. 各級標(biāo)題使用樣式進行設(shè)置。每章標(biāo)題以四號黑體字居中打印;“章”下一行為“節(jié)”,以小四號黑體左起打印;“節(jié)”下空一行為“小節(jié)”,以五號黑體左起打印,換行打印設(shè)計(論文)正文。2. 論文中的英文字體、數(shù)字均為Times New Roman .3. 引用文獻標(biāo)示方式應(yīng)全文統(tǒng)一,并采用所在
7、學(xué)科領(lǐng)域內(nèi)通用的方式,用上標(biāo)的形式置于所引內(nèi)容最末句的右上角,用5號字體。所引文獻編號用阿拉數(shù)字置于方括號中,如:“成果1”。當(dāng)提及的參考文獻為文中直接說明時,其序號應(yīng)該用5號字與正文排齊,如“由文獻8, 10-14可知”。不得將引用文獻標(biāo)示置于各級標(biāo)題處,引用文獻應(yīng)按文中引用出現(xiàn)的順序列全。1.1 語音識別簡介 1.1.1什么是語音識別 所謂的語音識別是指利用計算機自動識別語音的技術(shù),有狹義和廣義之分。狹義的語音識別特指利用計算機識別出語音信號所表達(dá)的內(nèi)容,其目的是要準(zhǔn)確地理解語音所蘊含的含義,例如將語音轉(zhuǎn)換成其所對應(yīng)的文字。而廣義的語音識別則泛指利用語音信號識別出其中所包含的“任何感興趣”
8、的內(nèi)容的一種技術(shù),例如利用語音信號中所包含的特定人的信息進行說話人身份辨認(rèn)的說話人識別技術(shù)2。1.1.2 語音識別的應(yīng)用及分類正文采用五號宋體字打印,行間距均為固定行距22磅,文中公式均為單倍行距.字間距為默認(rèn)值;正文層次標(biāo)題序號依次為“1”、“1.1”、“1.1.1”等,一律頂格,后空一格寫標(biāo)題,第四層次用(1)、(2)等,后空一格寫標(biāo)題。 語音識別的應(yīng)用范圍十分廣泛,遍及各行各業(yè)。如智能家居、語音撥號、信息通訊、自動應(yīng)答系統(tǒng)、工業(yè)控制、機器人、交通導(dǎo)航等等。語音識別是一門新興的交叉性學(xué)科,它廣泛涉及聲學(xué)、語音學(xué)、語言學(xué)、數(shù)字信號處理、通信學(xué)、網(wǎng)絡(luò)技術(shù)、電子技術(shù)、計算機科學(xué)、模式識別和人工智
9、能等眾多學(xué)科。如前所述,語音識別系統(tǒng)有廣義和狹義之分,這里所討論的語音識別分類特針對狹義的語音識別而言3。 由文獻4, 5-8可知“從不同角度,語音識別系統(tǒng)可以分為以下幾類:按詞匯量大小,可分為小詞匯量、中等詞匯量、大詞匯量及無限詞匯量語音識別系統(tǒng);按對說話人的依賴程度可以分為特定人和非特定人語音識別系統(tǒng);按對說話人說話方式的要求,可以分為孤立詞語音識別系統(tǒng)、連接詞語音識別系統(tǒng)及連續(xù)語音識別系統(tǒng);按識別的目的來分,可以分為說話人語音識別系統(tǒng)和語音內(nèi)容理解的語音識別系統(tǒng)”。1.2 國內(nèi)外語音識別技術(shù)的發(fā)展歷史及現(xiàn)狀語音識別的歷史可以追溯到20世紀(jì)50年代。1952年AT&T Bell實驗
10、室的確K.H.Davis等人利用帶通濾波器進行語音頻譜的分析和匹配,并成功用于對10個英文數(shù)字的識別,識別率達(dá)到98%。1960年P(guān).Denes等研制成功第一個計算機語音識別系統(tǒng),同年G.Fant提出了語音產(chǎn)生的聲源濾波器模型,對語音識別工作起到了巨大的推動作用。20世紀(jì)80年代語音識別研究進一步走向深入,其研究重點是連接詞語音識別,用于連接詞識別的分層構(gòu)筑技術(shù)(level building)得到發(fā)展。另一個重要的發(fā)展是語音識別算法從模板匹配技術(shù)發(fā)展到基于統(tǒng)計模型的技術(shù)。期間,美國CMU大學(xué)的J. K. Baker等人將隱馬爾可夫模型(Hidden Markov Model, HMM)應(yīng)用到語
11、音識別領(lǐng)域,在語音識別中獲得極大的成功,成為語音識別的主要方法。HMM模型的研究使大詞匯量連續(xù)語音識別系統(tǒng)的開發(fā)成為可能。1988年,美國CMU大學(xué)用VQ(Vector Quantization)/ HMM的方法實現(xiàn)了997個詞的非特定人連續(xù)語音識別系統(tǒng),其后,連續(xù)語音識別技術(shù)獲得長足的發(fā)展。近年來,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)以及支持向量機(Support Vector Machine, SVM)由于其較強的自適應(yīng)性和學(xué)習(xí)能力而獲得了普遍的重視,并在語音識別中獲得了成功的應(yīng)用。國外的IBM、APPLE、MOTOROLA等公司也投入了漢語語音識別
12、系統(tǒng)的開發(fā)。 IBM 公司于 1997 年正式推出中文聽寫機系統(tǒng)Via Voice,該系統(tǒng)對新聞?wù)Z音識別有較高的精度,是目前比較有代表性的漢語連續(xù)語音識別系統(tǒng)。國內(nèi)漢語語音識別的研究緊密跟蹤識別領(lǐng)域的最新研究成果并基本與之保持同步。目前,國內(nèi)一些研究機構(gòu)對大詞匯量連續(xù)語音識別系統(tǒng)的研究已經(jīng)接近國外最高水平1,其中,具有代表性的研究單位為清華大學(xué)電子工程系與中科院自動化研究所模式識別國家重點實驗室。1.3 語音識別面臨的問題語音識別系統(tǒng)存在一些困難3:語音識別系統(tǒng)的適應(yīng)性差,對環(huán)境依賴性強,即在一種環(huán)境下訓(xùn)練得到的語音識別系統(tǒng)只能在這種環(huán)境下得到最優(yōu)的性能;強噪聲環(huán)境下語音識別率急劇下降,語音信
13、號在受到干擾后表現(xiàn)出多變性,必須尋找新的信號分析處理方法,提高語音識別的抗噪性;如何將語言模型、語法及詞法模型應(yīng)用到大詞匯量連續(xù)語音識別中去;人類的聽覺理解、知識積累和學(xué)習(xí)機制以及大腦神經(jīng)系統(tǒng)的控制機理等方面的認(rèn)識,以及如何將這些知識應(yīng)用到語音識別中去。1.4 本課題研究背景及內(nèi)容如前所提到的,語音識別系統(tǒng)目前還面臨著很多問題,其中的噪聲干擾,是最常見也是影響最廣泛的一個難題。實際應(yīng)用中很多情況下是要求語音識別系統(tǒng)工作在噪聲環(huán)境下,因此一個高性能水平的語音識別系統(tǒng)必需要對不同類型各強度的噪聲具有較強的魯棒性。盡管過去的研究對抗噪聲的語音識別技術(shù)做了大量工作,但到目前為止仍未能找到一種獨立于噪聲
14、的可靠的識別算法4。語音識別系統(tǒng)在噪聲環(huán)境下性能下降的原因在于噪聲造成了訓(xùn)練環(huán)境與識別環(huán)境之間的不匹配,因此,必須盡量減少這種不匹配,以提高識別率。通常,可通過修改訓(xùn)練參數(shù)使之適應(yīng)識別環(huán)境,或用消除噪聲的方法來增強識別率。現(xiàn)有的抗噪語音識別技術(shù)通常可分為以下三類5:抗噪語音特征提取技術(shù)、語音增強技術(shù)和模型補償技術(shù)。基于這樣的背景,本文提出了一個新的在噪聲環(huán)境下提取特征值的識別方法分頻帶識別法。本法是在已有的識別方法基礎(chǔ)上,稍加一點改進而來的。經(jīng)過實驗,發(fā)現(xiàn),其對噪聲環(huán)境下的語音識別還是有效果的。但是目前只是初期研究,我相信,此法應(yīng)該會有廣闊的發(fā)展,有待于我們進一步探討。 (1.1)公式:(公式
15、行間距為:單倍行距)1. 公式應(yīng)另起一行寫在稿紙中央。一行寫不完的長公式,最好在等號處轉(zhuǎn)行,如做不到這一點,可在數(shù)學(xué)符號(如“+”、“-”號)處轉(zhuǎn)行。2. 公式的編號用圓括號括起,放在公式右邊行末,在公式和編號之間不加虛線。公式可按全文統(tǒng)編序號,也可按章單獨立序號,如(3)或(42),采用哪一種序號應(yīng)和稿中的圖序、表序編法一致。3. 夾在文字中公式的分子和分母平列在一行而用斜線分開,請注意避免含義不清。例如,abcosx就會既可能被認(rèn)為是a(bcosx),也可能被認(rèn)為是(ab)cosx。4. 公式中分式的橫線要寫清楚。連分?jǐn)?shù)(即分子、分母也出現(xiàn)分?jǐn)?shù)時)更要注意分線的長短,并把主要分?jǐn)?shù)和等號對齊
16、。5. 公式書寫應(yīng)在文中另起一行,居中書寫。公式的編號加圓括號,放在公式右邊行末,公式和編號之間不加虛線。公式后應(yīng)注明編號,該編號按章順序編排。不引用的簡短公式一般隨文寫,但較復(fù)雜的無編號公式也可另行居中。第二章 語音識別基礎(chǔ)理論2.1 語音信號產(chǎn)生的機理人類的發(fā)音器官包括肺、氣管、喉(包括聲帶)、咽、鼻和口等。這些器官共同形成一條形狀復(fù)雜的管道,其中喉以上的部分稱為聲道,隨著發(fā)出聲音的不同形狀是變化的;面喉的部分稱為聲門。人的發(fā)聲是由于肺部的收縮,壓迫氣流由支氣管經(jīng)過聲門和聲道引起音頻振蕩而產(chǎn)生的。聲道截面積是隨縱向位置而變的函數(shù),稱為聲道截面積函數(shù),聲道的共振峰特性主要取決于聲道截面積函數(shù)
17、,聲道的共振峰特性決定所發(fā)聲音的頻譜特性,即音色。人類發(fā)音過程有三類不同的激勵方式,因而能產(chǎn)生三種不同的聲音,即濁音、清音和爆破音。當(dāng)氣流通過聲門時聲帶的張力剛好使聲帶發(fā)生較低頻率的張弛震蕩,形成準(zhǔn)周期的空氣脈沖,這些空氣脈沖激勵聲道變小產(chǎn)生濁音;如果聲道中某處面積很小,氣流高速沖過此處時產(chǎn)生湍流,當(dāng)氣流速度與橫截面積之比大于某個門限時便產(chǎn)生摩擦音,即清音。如果聲道某處完全閉合建立起氣壓,然后突然釋放而產(chǎn)生的聲音就是爆破音。語音的產(chǎn)生機理可以由圖2-1來描述6。沖擊序列發(fā)生器Z聲門脈沖模型G(Z)隨機噪聲發(fā)生器聲道模型聲道參數(shù)輻射模型圖2-1 語音產(chǎn)生機理2.2 語音信號的預(yù)處理 系統(tǒng)要想獲得
18、一個比較理想的處理對象,對原始信號進行預(yù)處理是必要的。在語音信號處理中,預(yù)處理包括預(yù)濾波、采樣、A/D轉(zhuǎn)換、分幀加窗、預(yù)加重及端點檢測。2.2.1 預(yù)濾波、采樣、A/D轉(zhuǎn)換預(yù)濾波的目的有兩個:(1)抑制輸入信號各頻域分量中頻率超出/2的所有分量(為采樣頻率),以防止混疊干擾。(2)抑制50Hz的電源工頻干擾。這樣,預(yù)濾波必須是一個帶通濾波器,設(shè)其上、下截止頻率分別是,和,則對于絕大多數(shù)語音編譯碼器,=3400Hz,=60100Hz,采樣頻率為=8kHz;而對于語音識別而言,當(dāng)用于電話用戶時,指標(biāo)與語音編譯碼器相同。當(dāng)使用要求較高或很高的場合時,=4500Hz或8000Hz,=60Hz,=10k
19、Hz或20kHz。語音信號經(jīng)預(yù)濾波和采樣后,由A/D轉(zhuǎn)換器轉(zhuǎn)換為二進制數(shù)字碼。 2.2.2 預(yù)加重由于語音信號的平均功率譜受聲門激勵和口鼻輻射的影響,語音信號從嘴唇輻射后,高頻端大約在800Hz以上按6dB/倍頻程跌落7,即語音信號的頻譜產(chǎn)生高頻衰落現(xiàn)象。所以系統(tǒng)得到語音信號頻譜時,頻率越高響應(yīng)的成分越少,高頻部分的頻譜比低頻部分的難求。因此,為抵消這種影響,就在對語音信號分析前進行預(yù)加重(Pre-emphasis)處理。預(yù)加重的目的是提升高頻部分,使信號的頻譜變得平坦,保持在低頻到高頻整個頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分析或聲道參數(shù)分析。預(yù)加重一般是在語音信號數(shù)字化之后、參數(shù)分析
20、之前在計算機里用具有提升高頻特性的預(yù)加重數(shù)字濾波器來實現(xiàn),它一般是一個一階的數(shù)字濾波器,其函數(shù)為: (2.1)其中,為預(yù)加重濾波器的系數(shù),決定截止頻率,取值范圍一般在0.940.97,本文的取值為0.95。圖2-2為數(shù)字3的原始語音信號與預(yù)加重后的信號對照圖,其語音采樣頻率為16K。從圖中可以看出,預(yù)加重后,清音段的能量得到了提升,甚至接近濁音段的能量。圖2-2 數(shù)字“3”的原始語音信號與預(yù)加重后的信號對照2.2.3 分幀加窗語音信號是一種非平穩(wěn)信號,但其具有短時平穩(wěn)的特點。因此,為了能對語音信號進行處理,我們需將語音信號劃分為一個一個的短時段,每一個短時段稱為一幀。通過對語音的分幀操作,可以
21、撮其適時特性,便于模型的建立。數(shù)據(jù)幀長一般可取為2030ms,前一幀與后一幀的交疊部分稱為幀移,幀移與幀長的比例一般取為00.5。分幀可用移動的有限窗口進行加權(quán)的方法來實現(xiàn)的,從2.3 端點檢測端點檢測在語音識別中有著重要的作用。其目的是從包含語音的一段信號中檢測出語音信號段和噪聲段,確定語音段的起點和終點。準(zhǔn)確的端點檢測不僅可以減少計算量,而且能排除無聲段的噪聲干擾,從而提高系統(tǒng)的識別率。下面,簡單介紹幾種目前常用的檢測方法。 2.3.1 短時能量 能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而
22、語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設(shè)定一個門限,當(dāng)信號的幅度超過該門限的時候,就認(rèn)為語音開始,當(dāng)幅度降低到門限以下時,就認(rèn)為語音結(jié)束。能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設(shè)定一個門限,當(dāng)信號的幅度超過該門限的時候,就認(rèn)為語音開始,當(dāng)幅度降低到門限以下時,就認(rèn)為語音結(jié)束。能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜
23、音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設(shè)定一個門限,當(dāng)信號的幅度超過該門限的時候,就認(rèn)為語音開始,當(dāng)幅度降低到門限以下時,就認(rèn)為語音結(jié)束。能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設(shè)定一個門限,當(dāng)信號的幅度超過該門限的時候,就認(rèn)為語音開始,當(dāng)幅度降低到門限以下時,就認(rèn)為語音結(jié)束。能量是語音的一個重要特性,清音的能量較小
24、,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設(shè)定一個門限,當(dāng)信號的幅度超過該門限的時候,就認(rèn)為語音開始,當(dāng)幅度降低到門限以下時,就認(rèn)為語音結(jié)束。能量是語音的一個重要特性,清音的能量較小,濁音的能量較大。由于語音信號的能量隨時間而變化,靜音段和語音段之間的能量差別明顯,靜音段的能量很小,而語音段的能量明顯增大。因此,可以考慮用信號的能量作為特征,區(qū)分靜音段和語音段。只要設(shè)定一個門限,當(dāng)信號的幅度超過該門限的時候,就認(rèn)為語音開始,當(dāng)幅度降低到門限以下時,就認(rèn)
25、為語音結(jié)束。語音信號的短時能量定義如下: (2.2)其中為窗函數(shù),N為窗長。計算短時能量之前,要將語音信號進行預(yù)加重,目的是提升語音信號的清音部分。圖2-3為數(shù)字“3”的原始語音信號與預(yù)加重后的信號及信號短時能量的對照圖。可見,清音部分的能量提高了。圖2-3 數(shù)字“3”的原始語音信號與預(yù)加重后的信號及信號短時能量的對照圖2-4 數(shù)字“3”開始部分的波型插圖:1. 畢業(yè)設(shè)計(論文)的插圖必須精心制作,線條要勻潔美觀。插圖應(yīng)與正文呼應(yīng),不得與正文無關(guān)或與正文脫節(jié)。2. 圖的內(nèi)容安排要適當(dāng),不要過于密實。內(nèi)容的多少和圖的大小應(yīng)符合這樣一條原則:當(dāng)你把插圖放在桌上,你站著看時能方便地看清楚圖上的每一條
26、線和每一個符號。3. 每幅插圖應(yīng)有題目和序號,全文的插圖可以統(tǒng)一編序,也可以逐章單獨編序,但圖序必須連續(xù),不重復(fù),不跳缺。4. 各類線條圖應(yīng)在描圖紙或潔白圖紙上用墨線繪成,墨色要濃,線條要光滑。一般不使用方格坐標(biāo)紙或有色紙畫圖。5. 制圖標(biāo)準(zhǔn):插圖應(yīng)符合國家標(biāo)準(zhǔn)及專業(yè)標(biāo)準(zhǔn)。機械工程圖:采用第一角投影法,嚴(yán)格按照GB44574460-84, GB131-83機械制圖標(biāo)準(zhǔn)規(guī)定。電氣圖:圖形符號、文字符號等應(yīng)符合有關(guān)標(biāo)準(zhǔn)的規(guī)定。流程圖:原則上應(yīng)采用結(jié)構(gòu)化程序并正確運用流程框圖。6. 對無規(guī)定符號的圖形應(yīng)采用該行業(yè)的常用畫法。7. 圖題若采用中英文對照時,其英文字體為五號正體,中文字體為五號宋體。引用
27、圖應(yīng)在圖題的左上角標(biāo)出文獻來源,圖號按章順序編寫,如:圖31為第三章第一圖。如圖中含有幾個不同部分應(yīng)將分圖號標(biāo)注在分圖的左上角,并在圖題下列出各部分內(nèi)容,圖題放在圖下方,用五號宋體字。 2.3.2 短時平均過零率顧名思義,過零就是指時域波形穿過坐標(biāo)軸,即當(dāng)離散信號的相鄰兩個取樣值具有不同的符號時,便出現(xiàn)過零現(xiàn)象。單位時間內(nèi)過零發(fā)生的次數(shù)稱作短時過零率。圖2-5為數(shù)字“3”的原始語音信號與過零率對照圖。過零率定義如下: 2-7其中,sgnx是取符號函數(shù),它和窗函數(shù)w(n)的定義如下 2-8 圖2-5 數(shù)字“3”的原始語音信號與過零率對照 第三章 常用的語音識別模型 第四章 噪聲下語音特征參數(shù)的提
28、取識別 表4-1 各SNR低頻噪聲環(huán)境下兩種識別方法識別率比較方法-5db時的識別率0db時的識別率5db時的識別率10db時的識別率傳統(tǒng)法56%86%96%98%分頻帶法88%96%96%96%表格:1. 表格必須與方案敘述有直接聯(lián)系,表格中的內(nèi)容在技術(shù)上不得與正文矛盾,一般使用“三線表”表格形式,如有特殊表格可不用。2. 每個表格都應(yīng)有自己的序號和標(biāo)題,逐章單獨編序,如表3-1為第三章第一表,表序必須連續(xù),不得跳缺。正文中引用時,“表”字在前,序號在后,如寫“表3-1”,后空一格接寫標(biāo)題,標(biāo)題末尾不加標(biāo)點。標(biāo)題宋體五號,放在表上方,表中文字字號為小五號。3. 表格允許下頁接寫,接寫時表題省
29、略,表頭應(yīng)重復(fù)書寫,并在右上方寫“續(xù)表x x”。4. 表格應(yīng)寫在離正文首次出現(xiàn)處最近的地方,不應(yīng)超前和過分拖后。第五章 結(jié)論 結(jié)論是全文的思想精髓和文章價值的體現(xiàn)。應(yīng)概括說明所進行工作的情況和價值,分析其優(yōu)點和特色,指出創(chuàng)新所在,并應(yīng)指出其中存在的問題和今后的改進方向,特別是對工作中遇到的重要問題要著重指出,并提出自己的見解。它集中反映作者的研究成果,表達(dá)作者對所研究的課題的見解和主張,結(jié)論要簡單、明確,篇幅不宜過長。參考文獻1 王士元, 彭剛. 語言、語音與技術(shù)M. 上海: 上海教育出版社, 2006.2 蔡蓮紅, 黃德智, 蔡銳. 現(xiàn)代語音技術(shù)基礎(chǔ)與應(yīng)用M. 北京: 清華大學(xué)出版社, 20
30、03.3 胡航. 語音信號處理M. 哈爾濱工業(yè)大學(xué)出版社, 2000.4 寧更新. 抗噪聲語音識別新技術(shù)的研究D. 博士學(xué)位論文. 廣州:華南理工大學(xué), 2006.5 李萱. 語音特征參數(shù)提取方法研究D. 碩士學(xué)位論文. 西安:西安電子科技大學(xué), 2006.6 趙力. 語音信號處理M . 北京: 機械工業(yè)出版社,2003.1 馬靜. 基于HMM模型的漢語數(shù)字語音識別算法的研究D. 碩士學(xué)位論文. 太原:太原理工大學(xué), 2008.8 毛峽,丁玉寬圖像的情感特征分析及其和諧感評價J. 電子學(xué)報, 2001,29(12A):1923-19279 Mao Xia, Zhang San. Affecti
31、ve Property of Image and Fractal Dimension J. Chaos, Solitons & FractalsU. K, 2003(15): 905-910參考文獻四字用小四號黑體字,內(nèi)容用五號宋體字。其格式為:參考文獻的著錄均應(yīng)符合國家有關(guān)標(biāo)準(zhǔn)(按GB771487 文后參考文獻著錄格式執(zhí)行)。以“參考文獻”居中排作為標(biāo)識;參考文獻的序號左頂格,并用數(shù)字加方括號表示,如1,2,以與正文中的指示序號格式一致。每一參考文獻條目的最后均以“”結(jié)束。各類參考文獻條目的編排格式及示例如下:1連續(xù)出版物序號作者文獻題名J.刊名,出版年份,卷號(期號):起止頁碼例如
32、: 1毛峽,丁玉寬圖像的情感特征分析及其和諧感評價J. 電子學(xué)報, 2001,29(12A):1923-19272 Mao Xia,et al. Affective Property of Image and Fractal DimensionJ. Chaos, Solitons & FractalsUK,2003:V15 905-9102專著序號作者文獻題名M 出版地:出版者,出版年:起止頁碼例如:3 劉國鈞,王連成圖書館史研究M.北京:高等教育出版社,1979:15-18,313會議論文集序號作者文獻題名A論文集名C出版地:出版者,出版年:起止頁碼例如:4 毛峽繪畫的音樂表現(xiàn)A.中
33、國人工智能學(xué)會2001年全國學(xué)術(shù)年會論文集C.北京:北京郵電大學(xué)出版社, 2001:739-7405 Mao Xia, et al.Analysis of Affective Characteristics and Evaluation of Harmonious Feeling of Image Based on 1/f Fluctuation TheoryA.International Conference on Industrial & Engineering Applications of Artificial Intelligence & Expert Systems
34、 (IEA/AIE ) C. Australia:Springer Publishing House, 2002:17-194學(xué)位論文序號作者文獻題名D. 保存地:保存單位,年份例如:6 張和生地質(zhì)力學(xué)系統(tǒng)理論D. 太原:太原理工大學(xué),19985報告序號作者文獻題名R報告地:報告會主辦單位,年份例如:7 馮西橋核反應(yīng)堆壓力容器的LBB分析R. 北京:清華大學(xué)核能技術(shù)設(shè)計研究院,19976專利文獻序號專利所有者專利題名P. 專利國別:專利號,發(fā)布日期例如:8 姜錫洲一種溫?zé)嵬夥笏幹苽浞桨窹. 中國專利:881056078,1983-08-127國際、國家標(biāo)準(zhǔn)序號標(biāo)準(zhǔn)代號,標(biāo)準(zhǔn)名稱S. 出版地:出
35、版者,出版年例如:9 GB/T 161591996,漢語拼音正詞法基本規(guī)則S.北京:中國標(biāo)準(zhǔn)出版社,19968報紙文章序號作者文獻題名N.報紙名,出版日期(版次)例如:10 毛峽情感工學(xué)破解舒服之迷N. 光明日報,2000-4-17(B1).9電子文獻序號作者電子文獻題名文獻類型/載體類型. 電子文獻的出版或可獲得地址,發(fā)表或更新的期/引用日期(任選)例如:21王明亮中國學(xué)術(shù)期刊標(biāo)準(zhǔn)化數(shù)據(jù)庫系統(tǒng)工程的EB/OL. pub/wml.txt/9808 10-2.html, 1998-08-16/1998-10-04外國作者的姓名書寫格式一般為:名的縮寫、姓。例如A. Johnson,R. O. D
36、uda 1作者1,作者2. 論文名J. 雜志名,年,卷(期)XX頁XXX頁。附件1 語音“0”的各狀態(tài)頻譜圖純凈語音1. 未分頻:附錄:不宜放在正文中的資料,如調(diào)查問卷、公式推演、編寫程序、原始數(shù)據(jù)附表、修改稿等等。可放入設(shè)計(論文)資料袋或采用其他形式袋裝保存。13英文標(biāo)題的首個單詞的首字母必須大寫,標(biāo)題的單詞的首字母需大寫(但是,連詞、介詞和虛詞等首字母都是小寫)單詞的非首字母都小寫。The Investigation of the Robust of Feature Extracted fromSpeech Signals in Additive Gaussian Noise EnvironmentsZhang Sanfeng 2010 Computer Science and Technology (Embeded Technology) Major, School of Information Engineering, Sanming UniversityAbstract:With increa
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- D型人格對住院冠心病患者心身影響的深度剖析與干預(yù)策略探究
- 藥品儲存養(yǎng)護管理制度
- 離崗創(chuàng)業(yè)期間管理制度
- 職業(yè)培訓(xùn)設(shè)備管理制度
- 美術(shù)學(xué)校材料管理制度
- 線下電商客戶管理制度
- 腐蝕rust管理制度
- 皮影剪紙社團管理制度
- 樂元素公司管理制度
- 小庫房紀(jì)律管理制度
- 【完美排版】山東科技出版社二年級下冊綜合實踐活動教案
- 公共政策學(xué)(第三版)-課件
- 齊魯醫(yī)學(xué)Lisfranc-損傷
- 大型鋼網(wǎng)架整體提升施工工法
- 干熄焦?fàn)t內(nèi)固_氣流動與傳熱數(shù)值模擬畢業(yè)論文
- 公司股東變更登記申請書(一變一)
- 供應(yīng)鏈金融業(yè)務(wù)工作開展情況總結(jié)匯報
- 基于motor的六相電機繞組分相設(shè)置
- 一年級數(shù)學(xué)學(xué)困生轉(zhuǎn)化典型案例
- 廣西壯族自治區(qū)醫(yī)院大全
- 電子時鐘 Multisim仿真
評論
0/150
提交評論