




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能是未來(lái)醫(yī)療的發(fā)展趨勢(shì),近些年來(lái),隨著語(yǔ)音識(shí)別關(guān)鍵技術(shù)的不斷突破,經(jīng)被廣泛應(yīng)用。但是據(jù)我們調(diào)查發(fā)現(xiàn),語(yǔ)音識(shí)別技術(shù)在息錄入和輸出,減輕醫(yī)院咨詢(xún)臺(tái)和護(hù)士站工作人員的服務(wù)壓力,提高工作效率與質(zhì)量。(1)運(yùn)用了傳統(tǒng)的端點(diǎn)檢測(cè)方法雙門(mén)限端點(diǎn)檢測(cè)法。先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,包(2)運(yùn)用了Mel倒譜系數(shù)(MFCC)對(duì)語(yǔ)音進(jìn)行特征提取。在端點(diǎn)檢測(cè)后著重說(shuō)明了使用的MFCC原理與設(shè)計(jì)過(guò)程。并對(duì)MFCC、LPC和LPCC方法進(jìn)行了比較說(shuō)明。(3)使用了DTW算法。本文利用了DTW算法,著重說(shuō)明了算法原理和步驟。并與傳統(tǒng)算法HMM和ANN進(jìn)行了對(duì)比,給出了本課題使用DTW算法的原因。(4)設(shè)計(jì)了GUI界面。設(shè)計(jì)的GUI界面包括了語(yǔ)音錄入、特征參數(shù)提取、識(shí)別等主要部分。并且通過(guò)GUI界面可以方便快捷地讓用戶(hù)操縱系統(tǒng)。 1 1 1 21.3導(dǎo)診助手應(yīng)用 41.3.1應(yīng)用 41.3.2功能 4 51.4.1語(yǔ)音識(shí)別系統(tǒng)組成 51.4.2語(yǔ)音識(shí)別系統(tǒng)的分類(lèi) 6 62語(yǔ)音信號(hào)的分析與處理 7 7 72.1.2語(yǔ)音信號(hào)的采集 72.2預(yù)處理 82.2.1預(yù)加重 82.2.2語(yǔ)音信號(hào)的去噪 92.2.3分幀加窗 9 9 3語(yǔ)音信號(hào)的特征參數(shù)的提取 3.1梅爾頻率預(yù)測(cè)倒譜系數(shù)(MFCC) 13.1.1Mel濾波器組 3.1.2MFCC特征參數(shù)提取 3.2線(xiàn)性預(yù)測(cè)系數(shù)(LPC) 3.3線(xiàn)性預(yù)測(cè)倒譜系數(shù)(LPCC) 3.4本章小結(jié) 4語(yǔ)音識(shí)別模式訓(xùn)練和匹配方法 4.1DTW在語(yǔ)音識(shí)別中的應(yīng)用 4.1.1DTW基本原理 4.1.2DTW算法步驟 4.2與其他方法比較 5GUI界面的制作與程序運(yùn)行過(guò)程 5.1GUI界面的制作過(guò)程 5.2程序運(yùn)行過(guò)程 2 6.1全文總結(jié) 6.2展望 音則作為人和機(jī)器對(duì)話(huà)的橋梁,是交流信息最簡(jiǎn)活中廣泛的應(yīng)用,人們發(fā)現(xiàn)在人與機(jī)器之間,最形式中,語(yǔ)音尤為重要,人和機(jī)器的對(duì)話(huà),則是在21世紀(jì)以來(lái)人們一直期待的事情。處理也是人與計(jì)算機(jī)交互的重要手段之一(許詩(shī)茵,何澤宇,2022)。目前,隨著科技市場(chǎng)而言,語(yǔ)音識(shí)別的前景廣泛,如在醫(yī)療服務(wù)、信息查詢(xún)、智能家居、工業(yè)控制等。含了人的情感,例如,一句同樣的話(huà)不同的人說(shuō)就有著不同的情感(盧俊豪,汪澤楷,2023)。在傳統(tǒng)的語(yǔ)言處理系統(tǒng)中,人們往往以語(yǔ)言傳達(dá)的準(zhǔn)確性為首要目標(biāo),而忽視1.1研究背景和意義 (汪明輝,陳麗娟,2021)。本文設(shè)計(jì)的智能語(yǔ)音導(dǎo)診助手可以很好的減輕醫(yī)院工作人目前DTW算法是一種有效計(jì)算語(yǔ)音測(cè)度和時(shí)間規(guī)正的方法,在綜合識(shí)別中廣泛應(yīng)用,本文基于DTW和MFCC算法,基于本文的研究前提這種情況被納入了研究范圍對(duì)探索其在醫(yī)療行業(yè)上的具體應(yīng)用,同時(shí)希望提高和改進(jìn)識(shí)別的效率和速度(周思遠(yuǎn),許一凡,2021)。1.2國(guó)內(nèi)外研究現(xiàn)狀及未來(lái)發(fā)展趨勢(shì)貝爾在1872年首次發(fā)明了遠(yuǎn)程廣播聲音技術(shù)。杜德利發(fā)明了20世紀(jì)30年代全世具有劃設(shè)代的意義。而語(yǔ)音識(shí)別最早的研究可追溯到上個(gè)世紀(jì)的50年代,1952年貝爾運(yùn)用每個(gè)數(shù)字的元音部分的頻譜特征進(jìn)行語(yǔ)音識(shí)別(金俊豪,洪澤楷,2018)。基于前文之論斷1956年,RCA實(shí)驗(yàn)室的Olson等研究人員從8個(gè)帶通濾波器組提取頻譜參數(shù)來(lái)作為語(yǔ)音的特征。20世紀(jì)60年代,日本的很多研究人員開(kāi)發(fā)了很多硬件產(chǎn)品來(lái)進(jìn)行語(yǔ)音識(shí)別,在這一期間的諸多研究成果為后來(lái)將近20多年的語(yǔ)音研究奠定了堅(jiān)實(shí)的基礎(chǔ)(傅正浩,羅曼玲,2019)。RCA實(shí)驗(yàn)室的馬丁等人在60年代末開(kāi)發(fā)了時(shí)間歸正的方法,由此背景出發(fā)此舉大大提升了識(shí)別的性能。同時(shí)期的蘇聯(lián)專(zhuān)家Vint動(dòng)態(tài)時(shí)間規(guī)劃這個(gè)方法來(lái)解決兩種不同語(yǔ)音的時(shí)間對(duì)準(zhǔn)問(wèn)題。這也是為動(dòng)態(tài)時(shí)間彎折(DTW)奠定了基礎(chǔ),但是在當(dāng)時(shí)Vintsyuk并不被人們所知,知道DTW算法廣為人知的時(shí)候,大家才逐步了解到了當(dāng)時(shí)Vintsyuk的研究工作(雷振華,傅宇軒,2019)。20世紀(jì)70年代以來(lái),日本學(xué)者Sakoe提出了一種動(dòng)態(tài)時(shí)間語(yǔ)音識(shí)別規(guī)劃方法,即DTW算法,其成功之處在于時(shí)間歸一化和距離測(cè)量的結(jié)合,這是一種非線(xiàn)性歸一化技域。AT&T的貝爾實(shí)驗(yàn)室在一系列非特定說(shuō)話(huà)人的語(yǔ)音識(shí)別研究中也很活躍(廖景云,20世紀(jì)80年代初,琳達(dá)和其他研究人員提出了一種矢量量化方法,并將矢量量化而80年代開(kāi)始就采用了統(tǒng)計(jì)模型的技術(shù),其中隱馬爾科夫模型(HMM)技術(shù)就是經(jīng)典據(jù)分析、智能算法等前沿工具正日益成為科研探索的關(guān)鍵支據(jù)處理能力,還能揭示傳統(tǒng)方法難以把握的深層知識(shí)與規(guī)律文應(yīng)積極嘗試將這些尖端技術(shù)整合進(jìn)分析體系,以提升研究結(jié)果的精確度和深度理解。所以后來(lái)還是被人們廣泛應(yīng)用在語(yǔ)音識(shí)別中。由于HMM方法可以使大量詞匯連續(xù)性語(yǔ)音識(shí)別的開(kāi)發(fā)成為可能,所以HMM方法至今依然是語(yǔ)音識(shí)別技術(shù)中的主流方法。上世紀(jì)80年代末,美國(guó)卡爾加里梅隆大學(xué)的Sphinx系統(tǒng)采用VQ/HMM方法實(shí)現(xiàn)了97個(gè)獨(dú)20世紀(jì)90年代初,人們開(kāi)始探索人工神經(jīng)網(wǎng)絡(luò)(ANN)并將其用于語(yǔ)言識(shí)別技術(shù)中去。而近年來(lái),從NIST的評(píng)測(cè)結(jié)果可以看出來(lái),國(guó)際上對(duì)于語(yǔ)音識(shí)別的研究工作逐步從實(shí)驗(yàn)研究偏向?qū)嶋H問(wèn)題應(yīng)用中,諸多發(fā)達(dá)國(guó)家比如美國(guó)、日本、歐洲等國(guó)以及IBM、在中國(guó),有人在20世紀(jì)50年代末提出了語(yǔ)言識(shí)別的概念,直到70年代相關(guān)研究人員和科學(xué)家才開(kāi)始研究語(yǔ)言識(shí)別。通過(guò)邏輯推理可知從上世紀(jì)80年代開(kāi)始,國(guó)家開(kāi)始重視語(yǔ)言識(shí)別技術(shù)的研究,中國(guó)科學(xué)院聲學(xué)研究所、清華大學(xué)等多所高校都逐步開(kāi)始語(yǔ)音識(shí)別研究,20世紀(jì)80年代末(王浩宇,趙欣怡,2019),他們從最開(kāi)始的小詞匯孤立詞識(shí)別研究開(kāi)始,到大詞匯量連續(xù)語(yǔ)音識(shí)別,開(kāi)展了一系列語(yǔ)音識(shí)別研究,從上述情況能夠了解到他們的研究為中國(guó)的語(yǔ)音識(shí)別領(lǐng)域打下了堅(jiān)實(shí)的基礎(chǔ)。到了上個(gè)世紀(jì)90年代,先是哈工大與四達(dá)技術(shù)開(kāi)發(fā)中心合作推出了全新的產(chǎn)品,之后在國(guó)家“863”計(jì)劃的大力支持下,清華大學(xué)和中科院聲學(xué)所在語(yǔ)音識(shí)別研究上紛紛取得了重大突破(鄧芝和,張弘揚(yáng),2020)。初步研究成果和計(jì)算數(shù)據(jù)與前文綜述的結(jié)果本研究方法的有效性和可信度。這種吻合不僅支持了早期的研究結(jié)論,也為當(dāng)前理論模型提供了額外的驗(yàn)證。通過(guò)嚴(yán)格的研究流程、資料搜集及分析手段,本文成功再現(xiàn)了先前的關(guān)鍵發(fā)現(xiàn),并在此基礎(chǔ)上進(jìn)行了更深層次的探討。這不僅增強(qiáng)了對(duì)假設(shè)的信心,也展示了所采用方法的科學(xué)性。此外,這種一致性為不同研究間的對(duì)比奠定了基礎(chǔ),有助于構(gòu)建一個(gè)更加完整和系統(tǒng)的理論框架。近年來(lái),隨著我國(guó)國(guó)力的強(qiáng)化和改革開(kāi)放的深化,漢語(yǔ)識(shí)別得到了前所未有的重視,我國(guó)在語(yǔ)音識(shí)別技術(shù)上已經(jīng)取得了重大成果,科大訊飛、百度等知名企業(yè)已經(jīng)在語(yǔ)音識(shí)雖然當(dāng)下我國(guó)的語(yǔ)音識(shí)別技術(shù)已經(jīng)有了喜人的成果,但是很多技術(shù)并未應(yīng)用到人們的生活中來(lái),比如在醫(yī)學(xué)領(lǐng)域、軍事領(lǐng)域、移動(dòng)應(yīng)用領(lǐng)域,語(yǔ)音識(shí)別技術(shù)都還有廣闊的應(yīng)用空間。在目前的語(yǔ)音識(shí)別技術(shù)上,我們還面臨著一些困難:多段語(yǔ)音之間的混淆問(wèn)題;(1)非特定人的問(wèn)題。由于漢語(yǔ)中有很多方言,加上每個(gè)人的□音不同,對(duì)語(yǔ)音識(shí)別造成了額外的困難;(2)噪聲處理問(wèn)題。由于在生活中的不同環(huán)境下噪聲的干擾或多或少,處理噪聲是語(yǔ)音識(shí)別需要著重解決的問(wèn)題之一;(3)語(yǔ)音的連續(xù)性問(wèn)題。漢語(yǔ)中的語(yǔ)言連續(xù)性較高,導(dǎo)致識(shí)別難度加大。1.3導(dǎo)診助手應(yīng)用當(dāng)今國(guó)家正在加強(qiáng)基本衛(wèi)生制度,促進(jìn)了全民治療,優(yōu)化了醫(yī)療資源,而人工智能的快速發(fā)展使人們以往的夢(mèng)想—一智慧醫(yī)療演變成為了現(xiàn)實(shí)。研究人員利用人工智能與傳統(tǒng)醫(yī)院咨詢(xún)服務(wù)的歷史融合優(yōu)勢(shì),提供患者選擇咨詢(xún)服務(wù),解放了導(dǎo)診臺(tái)和護(hù)士站,讓人工智能去完成這項(xiàng)技術(shù)含量低,重復(fù)性高,工作針對(duì)性強(qiáng)的工作實(shí)在是最優(yōu)選擇(成智能導(dǎo)診機(jī)器人的首要目標(biāo)是解決門(mén)診咨詢(xún)量少、問(wèn)題和答案反復(fù)出現(xiàn)的現(xiàn)實(shí),一旦醫(yī)院業(yè)務(wù)高峰期到來(lái),醫(yī)院里人滿(mǎn)為患,在這樣的狀況下智能醫(yī)療服務(wù)機(jī)器人可以及時(shí)做出反應(yīng),引導(dǎo)患者就醫(yī),選擇患者并進(jìn)行醫(yī)院的醫(yī)療環(huán)境、門(mén)診治療程序和患者保健知識(shí)(賈鵬飛,張慧萍,2022)。通過(guò)識(shí)別語(yǔ)言、語(yǔ)音合成、理解自然語(yǔ)言和其他技術(shù),領(lǐng)先的機(jī)器人支持語(yǔ)音、觸摸、影像等互動(dòng)方式,改善醫(yī)療體驗(yàn),提高醫(yī)療服務(wù)質(zhì)量,這是智慧醫(yī)療的重要元素和具體體現(xiàn)。目前國(guó)內(nèi)的導(dǎo)診助手產(chǎn)品已經(jīng)陸續(xù)投入到市場(chǎng),如科大訊飛公司的“曉醫(yī)”,它可以提供問(wèn)路,導(dǎo)診等功能,還有獵戶(hù)星空、安澤智能等諸多科技公司都推出了導(dǎo)診機(jī)器人,旨在服務(wù)大眾。目前國(guó)內(nèi)外都還沒(méi)有成熟的機(jī)器人導(dǎo)診產(chǎn)品,國(guó)外更注重與AI技術(shù)相結(jié)合的問(wèn)診需求體系,大多數(shù)國(guó)家的導(dǎo)診機(jī)器人咨詢(xún)服務(wù)只能提供簡(jiǎn)單的問(wèn)題解答,或在初審和評(píng)估中按照標(biāo)準(zhǔn)的問(wèn)題模型進(jìn)行幫助,而不能真正起到優(yōu)化醫(yī)療服務(wù)流程、提高醫(yī)院日常工作績(jī)效的作用,與國(guó)外產(chǎn)品相比,在這種布局里很多地區(qū)和場(chǎng)景的導(dǎo)診機(jī)器人都實(shí)施了業(yè)務(wù)整合,而機(jī)器人代替人工服務(wù)的模式將逐步推廣到全國(guó)進(jìn)行使用(高偉濤,黃靖宇,目前的國(guó)內(nèi)的導(dǎo)診機(jī)器人的功能主要有以下幾方面:(1)用藥指導(dǎo);(2)健康知識(shí);(3)醫(yī)院咨詢(xún);(4)導(dǎo)航分診。本文的智能語(yǔ)音導(dǎo)診助手根據(jù)語(yǔ)音識(shí)別技術(shù),主要設(shè)計(jì)了導(dǎo)航分診的功能,實(shí)現(xiàn)快速信息錄入和輸出,減輕醫(yī)院咨詢(xún)臺(tái)和護(hù)士站工作人員的服務(wù)壓力,提高工作效率與質(zhì)1.4語(yǔ)音識(shí)別系統(tǒng)概述如圖1-1所示,語(yǔ)音識(shí)別系統(tǒng)主要分為三個(gè)模塊,分別為預(yù)處理模塊、特征提取模塊和模式匹配模塊。其中預(yù)處理模塊包括了語(yǔ)音的預(yù)加重、分幀加窗和端點(diǎn)檢測(cè),預(yù)加重目的就是加強(qiáng)信號(hào)的高頻部分(黃彥霖,趙思潔,2022)5,這明顯地揭示了意圖提高此部分的能量,使得在頻域內(nèi)語(yǔ)音信號(hào)變得更為平坦。加窗分幀的目的是將語(yǔ)音信號(hào)分成一段一段的短時(shí)信號(hào)以便分析它的特征參數(shù),其中,每一小段叫做一幀。特征提取是將一段語(yǔ)音中的特征參數(shù)提取出來(lái)。模板訓(xùn)練是將多個(gè)人語(yǔ)音信號(hào)作為參考模板,基于本文的研究前提這種情況被納入通過(guò)對(duì)當(dāng)前階段性研究成果的梳理,本文對(duì)后續(xù)研究有了新的視角。首要的是在研究方式上,本文能辨識(shí)出多處可優(yōu)化和升級(jí)的空間。過(guò)往的研究歷程為本文提供了寶貴的經(jīng)驗(yàn),讓本文清楚哪些方法有效,哪些需要改進(jìn)或淘汰。在數(shù)據(jù)收集環(huán)節(jié),本文應(yīng)更重視樣本的多樣性和廣泛代表性,確保樣本能準(zhǔn)確反映目標(biāo)群體的特性。同時(shí),針對(duì)各類(lèi)研究議題,靈活運(yùn)用多種數(shù)據(jù)收集手段能提升數(shù)據(jù)的全面性和準(zhǔn)確性。模式匹配是就將所輸入的語(yǔ)音與樣本庫(kù)的語(yǔ)音參數(shù)相對(duì)比匹配,匹配相似度最高的語(yǔ)音識(shí)別系統(tǒng)的分類(lèi)如上圖1-2所示。分為三個(gè)類(lèi)別:(1)按照詞匯量來(lái)分(2)按照識(shí)別對(duì)象來(lái)分識(shí)別對(duì)象指的是非特定人或特定人。如個(gè)人的手機(jī)語(yǔ)音助手是特定人的語(yǔ)音識(shí)別,(3)按照發(fā)音方式來(lái)分的單詞組成的,如漢語(yǔ)中的一個(gè)詞語(yǔ),英語(yǔ)中的一個(gè)單詞這都屬于孤立詞。連1.5論文結(jié)構(gòu)安排(3)第三章介紹了特征參數(shù)音編碼,就是所謂的將這些語(yǔ)音信息中的韻律、響度、基音周期的升降等表示出來(lái)!。另外,技術(shù)手段的發(fā)展水平也對(duì)結(jié)論的核實(shí)過(guò)程產(chǎn)生重要影響,隨著科技的不斷發(fā)展,由于聲音信號(hào)是一種模擬信號(hào),而我們要進(jìn)行數(shù)字化處理的話(huà)必須進(jìn)行模數(shù)轉(zhuǎn)換,這兩個(gè)過(guò)程,語(yǔ)音信號(hào)可以得到時(shí)間上和幅度上的離散數(shù)字信號(hào)41。在MATLAB中,=wavread(wavFilename)(馮梓萱,鄭晨光,2018)。其中“wavFilename”指的是以“.wav”為擴(kuò)展名的文件,“y”是輸出參數(shù),是數(shù)字化的音頻信號(hào)。“fs”是采樣頻率,“nbits”是比特?cái)?shù)。和GUI界面設(shè)計(jì)來(lái)實(shí)現(xiàn)語(yǔ)音錄入,按鈕2是語(yǔ)音庫(kù),里面包含了所有的測(cè)試語(yǔ)音。圖2-2是錄入語(yǔ)音“咳嗽”的時(shí)域波形,同時(shí)在錄入語(yǔ)音后可以在GUI界面上顯示。錄音錄音選擇語(yǔ)音庫(kù)2.2預(yù)處理預(yù)處理部分在語(yǔ)音處理應(yīng)用中有著重要的地位,它為后面的語(yǔ)音識(shí)別工作做了充分的準(zhǔn)備。在預(yù)處理部分,我們首先要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)濾波,通過(guò)邏輯推理可知預(yù)加重,加強(qiáng)語(yǔ)音的高頻部分使整個(gè)語(yǔ)音頻域變得平坦,提高語(yǔ)音處理的質(zhì)量,除此之外后面還要進(jìn)行特征參數(shù)提取、模式匹配等工作(許子晴,王翠云,2022)。本研究在既有的理論支撐下,構(gòu)建了此次的模型架構(gòu),無(wú)論是在信息流通體系還是數(shù)據(jù)分析途徑上,都展現(xiàn)了對(duì)前人研究成果的借鑒與發(fā)揚(yáng),并在此基礎(chǔ)上實(shí)現(xiàn)了新的突破。在信息流程的設(shè)計(jì)層面,本文引入了信息處理領(lǐng)域的經(jīng)典理論,確保信息從收集、傳輸?shù)椒治龅拿恳画h(huán)節(jié)都能高效且無(wú)誤地運(yùn)作。通過(guò)嚴(yán)格把控信息來(lái)源及執(zhí)行標(biāo)準(zhǔn)化處理步驟,信息的可靠性得到了切實(shí)保障,同時(shí)也更加注重信息流的透明度與可回溯特性。2.2.1預(yù)加重預(yù)加重是在發(fā)射端提升語(yǔ)音信號(hào)的高頻,其實(shí)就是將語(yǔ)音信號(hào)通過(guò)一個(gè)高通濾波器。事實(shí)上,語(yǔ)音信號(hào)經(jīng)過(guò)高通濾波器。從上述情況能夠了解到語(yǔ)音信號(hào)將變得更為平滑,并且這樣也能改善高頻部分,并將語(yǔ)音信號(hào)保持在頻帶內(nèi)。它的目的是突出高頻中的共振峰,消除我們的嘴和聲帶在講話(huà)過(guò)程中的唇帶效應(yīng)。其函數(shù)為(李東風(fēng),吳麗娜,2022):其實(shí)現(xiàn)的框圖如下圖2-3所示:圖2-3預(yù)加重實(shí)現(xiàn)框圖我們知道語(yǔ)音信號(hào)是非穩(wěn)態(tài)的、時(shí)變的信號(hào),這個(gè)特性十分不利于數(shù)字化分析5。點(diǎn)就是幀。總體上,幀時(shí)間約為20ms30ms,從微觀角度看,幀時(shí)間很小,可以看作 (若為窗函數(shù),則幀長(zhǎng)就是窗長(zhǎng)),inc為幀移。輸出f代表了分幀之后的數(shù)據(jù)(劉亦菲,吳昊天,2022)。對(duì)信號(hào)進(jìn)行加窗處理就是為了讓信號(hào)末端變得平坦連續(xù)。本文在數(shù)地,研究還實(shí)施了敏感性評(píng)估,以測(cè)量各個(gè)因素的變化對(duì)最中用hamming這個(gè)函數(shù)來(lái)完成。提取的時(shí)候要選擇說(shuō)話(huà)部分的語(yǔ)音.所以雙門(mén)限端點(diǎn)檢測(cè)就是處干此目的(任志強(qiáng).陸麗 (如圖2-2)的起始點(diǎn)可以看出幾乎沒(méi)有振幅波動(dòng),這是因?yàn)殇浺魰r(shí)剛開(kāi)始的時(shí)候沒(méi)用雙門(mén)限端點(diǎn)檢測(cè)利用了短時(shí)能量和短時(shí)過(guò)零率這的部分視為說(shuō)話(huà)部分,反之為靜音或噪音部分,直接去除。實(shí)際效果如下圖2-4所示:開(kāi)始端點(diǎn)檢測(cè)。其中,程序中,x為語(yǔ)音輸入,先進(jìn)行分幀操作,設(shè)置好幀置是為了按照上面的x1和x2對(duì)SF和NF進(jìn)行賦值。SF和NF都是1*fn的數(shù)組,SF=1束的時(shí)間。其中代碼speechIndex=find[SF==1]是為了尋找出SF中數(shù)值等于1的地址隨后,設(shè)計(jì)使用了findSegment函數(shù),它是根據(jù)SF中出每一組有話(huà)段的開(kāi)始結(jié)束時(shí)間以及語(yǔ)音的長(zhǎng)度。由此背景出發(fā)它的調(diào)用格式為:最后,我們使用了vad_ezm1函數(shù)對(duì)語(yǔ)音“咳嗽”進(jìn)行了端點(diǎn)檢測(cè),運(yùn)行后檢測(cè)出的詞語(yǔ)“咳嗽”的參數(shù)和結(jié)果圖如下:圖2-5語(yǔ)音參數(shù)“咳嗽”的端點(diǎn)檢測(cè)Q×圖2-6語(yǔ)音“咳嗽”的端點(diǎn)檢測(cè)結(jié)果2.3本章小結(jié)3.1梅爾頻率預(yù)測(cè)倒譜系數(shù)(MFCC)在語(yǔ)音識(shí)別最常用到的語(yǔ)音特征就是Mel頻率倒譜系數(shù)(MelFrequencyCepstralCoefficients,簡(jiǎn)稱(chēng)MFCC),MFCC的分析時(shí)基于人耳的聽(tīng)覺(jué)機(jī)理,即根據(jù)人的聽(tīng)覺(jué)實(shí)驗(yàn)結(jié)果來(lái)分析語(yǔ)音的頻譜,以此期望能獲得更好的語(yǔ)音特性[12]。它不依賴(lài)輸入信號(hào)的任何性質(zhì)(范怡君,蔡俊輝,2020)。對(duì)人類(lèi)聽(tīng)覺(jué)機(jī)制的研究表明,人耳的靈敏度因不同聲波的頻率而異。對(duì)語(yǔ)音清晰度影響比較大的語(yǔ)音信號(hào)大概在2000Hz到5000Hz左右。高音量頻率元素的存在會(huì)影響對(duì)低音量頻率成分的感知,并使其難以檢測(cè)。鑒于這樣的情況掩蔽效應(yīng)是一種現(xiàn)象,這種現(xiàn)象即響度高的頻率成分會(huì)干擾到頻率低的成分(韓雨辰,趙博涵,2019)。但是對(duì)于高頻聲音來(lái)說(shuō),很難屏蔽低頻聲音,空閑時(shí)的聲屏蔽帶的臨界帶寬比高頻時(shí)要低,這就是為什么人們?cè)诘皖l段形成一個(gè)低頻濾波器組,根據(jù)不同的頻率對(duì)輸入信號(hào)進(jìn)行濾波是非常重要的,帶式濾波器信號(hào)的輸出能量被認(rèn)為是信號(hào)的基本元素,可以用作輸入特征。在數(shù)據(jù)分析方法的選擇上,本文不僅采用了傳統(tǒng)的統(tǒng)計(jì)方法,如描述統(tǒng)計(jì)、回歸分析等,還吸納了近年來(lái)迅猛發(fā)展的數(shù)據(jù)挖掘技術(shù)和算法。例如,本文采用聚類(lèi)分析來(lái)識(shí)別數(shù)據(jù)中的潛在模式,或利用決策樹(shù)模型來(lái)預(yù)測(cè)未來(lái)趨勢(shì)。這些前沿手段為深入理解復(fù)雜現(xiàn)象提供了強(qiáng)大助力,并有助于揭示隱藏在海量數(shù)據(jù)中的深層聯(lián)系。此外,本文還著重強(qiáng)調(diào)了混合方法的應(yīng)用,即將量化研究與質(zhì)性研究相結(jié)合,以獲取更為全面的研究洞察。通過(guò)邏輯推理可知由于此功能不依賴(lài)于信號(hào)的特征,對(duì)輸入信號(hào)基本不做假設(shè)和邊界,并使用了聽(tīng)覺(jué)模型的測(cè)試結(jié)果,因此,與基于聲線(xiàn)模型的LPCC相比,該參數(shù)具有更好的魯棒性,從上述情況能夠了解到更接近人耳的聽(tīng)覺(jué)特性,而且在降低信噪比的情況下,人耳對(duì)聲音信號(hào)的感知是非線(xiàn)性的,梅爾頻譜與線(xiàn)性頻率有下面的公式:公式3-1中,F(xiàn)mel表示為單位是Mel的感知頻率,f是單位為Hz的實(shí)際頻率。下圖展示了Mel頻率與線(xiàn)性頻率的關(guān)系,可以看出,原先不統(tǒng)一的頻譜可以用統(tǒng)一的濾波器由上圖可以看出,在這樣的狀況下在Mel頻域中,人耳對(duì)聲音的感知與Mel頻率線(xiàn)性相關(guān)。3.1.1Mel濾波器組在Mel頻率的計(jì)算過(guò)程中,進(jìn)行的濾波使用的濾波組是帶通濾波器,通常選用的每個(gè)濾波器都帶有三角形濾波特征。每個(gè)三角濾波器的中心頻率為f(m),每個(gè)濾波器的傳遞函數(shù)如公式(3-2):為語(yǔ)音信號(hào)進(jìn)行FFT時(shí)的長(zhǎng)度,一般取256;M為濾波器的個(gè)數(shù),在這種布局里一般取在本設(shè)計(jì)中使用了melbankm函數(shù),目的是為了設(shè)計(jì)在Mel頻率上的平均分布的濾波器。它是MATLAB中自帶的函數(shù),可以在voicebox工具箱中找到。Melbankm函數(shù)的波器的個(gè)數(shù)p取24,在一幀的FFT后的數(shù)據(jù)長(zhǎng)度n取的是256,窗函數(shù)用的是漢明窗對(duì)應(yīng)的是w='m’,當(dāng)然也可以選用三角窗(w='t’),這明顯地揭示了意圖下圖是設(shè)3.1.2MFCC特征參數(shù)提取首先,MFCC特征參數(shù)提取原理框圖如下圖3-4所示:(1)預(yù)處理率泄露,窗函數(shù)每一幀都需要添加。基于前文之論斷這(2)快速傅里葉變換(FFT)對(duì)每一幀的信號(hào)都要進(jìn)行快速傅利葉變換,的作用就是語(yǔ)音信號(hào)由時(shí)域轉(zhuǎn)變?yōu)轭l域。(3)計(jì)算譜線(xiàn)能量標(biāo)軸將一幀語(yǔ)音的頻譜表示出來(lái),然后將其進(jìn)行90度的翻折,可以發(fā)現(xiàn)現(xiàn)在的橫坐標(biāo)實(shí)際需求靈活調(diào)整或更新,同時(shí)保持整體結(jié)構(gòu)的行深入開(kāi)發(fā)或優(yōu)化,以推動(dòng)相關(guān)研究的不斷進(jìn)步。于此特定環(huán)可以觀察共振峰的變化來(lái)觀察聲音的特征變化以便干準(zhǔn)確地識(shí)別語(yǔ)音(楊浩然,劉子琪,2023)。在上文已經(jīng)詳細(xì)介紹了Mel濾波器的設(shè)計(jì),其主轉(zhuǎn)換為可以體現(xiàn)人的聽(tīng)覺(jué)特性的Mel頻譜。(5)計(jì)算DCT倒譜最后要在Mel頻譜上做倒譜的分析,先要取對(duì)數(shù)做逆變換,然后逆變換一般通過(guò)DCT來(lái)實(shí)現(xiàn),取DCT后的第2到第6個(gè)系數(shù)作為MFCC系數(shù),以上分析作為基礎(chǔ)這樣就可以計(jì)算出來(lái)MFCC參數(shù),而這一幀語(yǔ)音的特征就是MFCC。在本設(shè)計(jì)中,使用了MATLAB中的mfcc函數(shù),在設(shè)計(jì)中由于靈活性受限,從而修改了傳統(tǒng)的mfcc函數(shù)程序,使mel濾波器組的采樣頻率、幀長(zhǎng)、幀移等都可以靈活選陳麗娟,2021)參數(shù)的距離。在對(duì)兩段語(yǔ)音作了相同的長(zhǎng)度等參數(shù)設(shè)置后,由此背景出發(fā)出圖(圖如下)顯示這些幀的前16個(gè)參數(shù),由圖顯而易見(jiàn),系數(shù)分別都在45度左右,文件(E)編輯(E)查看(V)窗口(W)3.2線(xiàn)性預(yù)測(cè)系數(shù)(LPC)可以用其前續(xù)時(shí)刻的若干個(gè)采樣值來(lái)描述,把前續(xù)的采樣值通過(guò)線(xiàn)性組合來(lái)無(wú)限逼近x[n],這樣的描述方式可以決定唯一的一組預(yù)測(cè)系數(shù)5。這樣的預(yù)測(cè)系數(shù)就叫作線(xiàn)性預(yù)型相類(lèi)似,但是又有著不同的地方,零極點(diǎn)模型中有特例的存在,一是全之處。往后的研究工作,完全能在現(xiàn)有成果上更進(jìn)一步,尤其在樣本甄良以及理論體系健全等層面,還有著充裕的上升空間可供挖LPCC(LinearPredictiveCepstralCoding)即在LPC(linearpredictivecoding)上進(jìn)3.4本章小結(jié)本章主要介紹了常見(jiàn)的兩個(gè)語(yǔ)音特征參數(shù)(LPCC和MFCC),本設(shè)計(jì)使用的是MFCC。之所以使用MFCC作為特征參數(shù)是因?yàn)樵谡Z(yǔ)音識(shí)別領(lǐng)域,MFCC比其他的特征提取算法都有著更好的表示。正如本章所介音,相較于LPCC,MFCC把線(xiàn)性頻率轉(zhuǎn)化為mel頻率能更好的適應(yīng)人類(lèi)的聽(tīng)覺(jué)特性,所以不具有抗噪聲的能力7。所以結(jié)合多種原因,本文設(shè)計(jì)選擇使用了MFCC作為特征提取系數(shù)。4語(yǔ)音識(shí)別模式訓(xùn)練和匹配方法語(yǔ)音識(shí)別系統(tǒng)就相當(dāng)于模式匹配系統(tǒng),就是根據(jù)模式匹配原則,按照一定的相似度量法則,使未知模式與參考模式庫(kù)中的某個(gè)參考模型作對(duì)比取得最佳匹配的一個(gè)過(guò)程31。目前常用的識(shí)別算法包括DTW(DynamicTimeWarping)、HMM(HiddenMarkovModel)、ANN(ArtificialNeuronNetwork)等等(張子寧,孫佳怡,2022)。從上述情況能夠設(shè)計(jì)使用的是DTW算法,因?yàn)橄鄬?duì)于后兩個(gè)算法,而且對(duì)于孤立詞識(shí)別來(lái)說(shuō),DTW的算法應(yīng)用的更加廣泛,且更為高效簡(jiǎn)單。本章將著重介紹DTW算法,以及實(shí)現(xiàn)的過(guò)程。4.1DTW在語(yǔ)音識(shí)別中的應(yīng)用4.1.1DTW基本原理DTW(DynamicTimeWarping)是一種有效的時(shí)間歸正和語(yǔ)音測(cè)度的計(jì)算方法,廣泛應(yīng)用在孤立詞識(shí)別中II。在本課題中,正是基于孤立詞的語(yǔ)音識(shí)別系統(tǒng),病患說(shuō)出他的病癥特征,系統(tǒng)進(jìn)行識(shí)別來(lái)進(jìn)行相應(yīng)的智能導(dǎo)診。在這樣的狀況下在當(dāng)病患說(shuō)病情的單詞時(shí),有可能發(fā)出的聲音被外界干擾,或者是一些音長(zhǎng)一些音短,而即使在相同的條件下有時(shí)候發(fā)出來(lái)的語(yǔ)音信號(hào)也不完全一致。所以我們采用DTW算法,專(zhuān)門(mén)解決此類(lèi)DTW(DynamicTimeWarping)在語(yǔ)音識(shí)別中主要是在一定的邊界條件下,求待測(cè)模板和參考模板之間的歐式距離,以此來(lái)規(guī)劃一條路線(xiàn)使得待測(cè)模板可以和參考模板之間進(jìn)行匹配(張建華,李思遠(yuǎn),2022)?。歐氏距離指的是失真度量d,它的計(jì)算方式是沿Programming)將解決優(yōu)化問(wèn)題的方式從整體變?yōu)榫植俊T谶@種布局里測(cè)試模板和參考模板我們可以用T和R來(lái)表示,而D[t,r]是它們之間的距離,距離越小相似度越高,距離越大相似度越高。如果它們之間的距離不等,我們就要對(duì)齊T和R。動(dòng)態(tài)規(guī)劃計(jì)算 (DynamicProgramming)簡(jiǎn)稱(chēng)DP就是對(duì)齊的方法。在科研探索中,本文強(qiáng)調(diào)對(duì)誤差的嚴(yán)格把控,主要通過(guò)一系列精細(xì)方法與措施,來(lái)保障數(shù)據(jù)的真實(shí)性和結(jié)果的可靠性。本文構(gòu)思了精密的研究路徑,并對(duì)可能引入誤差的多元因素進(jìn)行了全面分析與評(píng)估,包括環(huán)境波動(dòng)、人為操作的不一致性以及測(cè)量計(jì)算的精確性。通過(guò)執(zhí)行標(biāo)準(zhǔn)化作業(yè)流程與高科技手段,本文確保了數(shù)據(jù)的一致性與可重復(fù)性。為了深化數(shù)據(jù)質(zhì)量,本文還引入了雙重?cái)?shù)據(jù)錄入與交叉校驗(yàn)機(jī)制,有效避免了人為失誤或鍵入錯(cuò)誤帶來(lái)的數(shù)據(jù)偏差。下圖所示的是兩段語(yǔ)言信號(hào)時(shí)域圖,可以大致看出兩語(yǔ)音比較相似,但是由于很多外界條件因素導(dǎo)致每個(gè)語(yǔ)音信號(hào)的波形并不相同,如果我們直接進(jìn)行對(duì)比,結(jié)果顯然不行,如圖a和b。所以我們將處于相同時(shí)刻上的兩聲音進(jìn)行對(duì)比,如a和b’,但是顯然由圖上可以看出,它們的位置有偏差,這明顯地揭示了意圖所以我們需要將它們先對(duì)齊再進(jìn)行相似度計(jì)算。DTW算法正是應(yīng)用了以上的理論,它可以找到兩個(gè)對(duì)應(yīng)的點(diǎn)并且使它們的距離計(jì)算的合理(汪明輝,陳麗娟,2021)。4.1.2DTW算法步驟首先我們要構(gòu)造一個(gè)m*n的矩陣A來(lái)進(jìn)行對(duì)齊。其中矩陣A(i,j)就是T;和R;的距離。比如A(1,2)就是T2和R2的距離(周思遠(yuǎn),許一凡,2021)。正如下圖4-2所示,我們提取的英文單詞的語(yǔ)音特征,他們的長(zhǎng)度不相等,第一個(gè)語(yǔ)音有105幀而第二個(gè)語(yǔ)音有123幀。所以我們可以構(gòu)造出一個(gè)123*105的矩陣。然后計(jì)算每個(gè)點(diǎn)的距離。基于本文的研究前提這種情況被納入了研究范圍每個(gè)點(diǎn)的距離我們通常用歐氏距離來(lái)表示,代碼是d(i,j)=sum(t(i,:)-r(j,:).^2)。具體代碼表示如圖4-3所示。我們將每一維的點(diǎn)進(jìn)行計(jì)算求和就可以表示出總距離。在經(jīng)過(guò)循環(huán)的計(jì)算后,我們可以得出距離矩陣d。如下圖4-4所示(金俊豪,洪澤楷,2018)。12345678172937455671899隨后,在知道我們所有的點(diǎn)的距離后我們要尋找最短對(duì)齊路徑。經(jīng)過(guò)距離的累加,找到最短路徑W需要滿(mǎn)足邊界條件、連續(xù)性條件和單調(diào)性條件。下面進(jìn)行三個(gè)條件的分析(傅正浩,羅曼玲,2019):(2)連續(xù)性條件我們?cè)诼窂降倪x擇上不能跳過(guò)某點(diǎn),比如當(dāng)前在W(a,b)上,下個(gè)點(diǎn)為W(a’,b’(3)單調(diào)性條件單調(diào)性條件就是我們的路徑必須是往前推進(jìn)的,假設(shè)當(dāng)前在W(a,b)上,下個(gè)點(diǎn)為行不斷向前累加,直到終點(diǎn)。這部分代碼如下圖4-5所示。由以上條件,我們可以計(jì)算圖4-4的最短距離,如下圖4-6中的紅線(xiàn)所示。田11234567823456789最后就是識(shí)別的過(guò)程,我們將待識(shí)別的語(yǔ)音的特征參數(shù)與樣本庫(kù)中的語(yǔ)音的特征參數(shù)經(jīng)過(guò)DTW計(jì)算后,得到的最短距離,對(duì)比它們的大小,然后可以判斷相似度的高低。4.2與其他方法比較目前來(lái)看,本課題之所以選擇使用DTW算法,一是本設(shè)計(jì)是基于孤立詞識(shí)別的系統(tǒng),DTW算法在孤立詞識(shí)別應(yīng)用中被廣泛應(yīng)用(雷振華,傅宇軒,2019)。二是因?yàn)镈TW算法方便小巧,它有著識(shí)別快、靈活等優(yōu)點(diǎn)。它與HMM算法相比,它的計(jì)算量比HMM少,但是在應(yīng)對(duì)連續(xù)語(yǔ)音、大詞匯量識(shí)別系統(tǒng)時(shí),它不如HMM算法,識(shí)別效果較差,于此特定環(huán)境中很容易就能看出但相對(duì)于本課題,DTW算法較為合適。而另外的廣為應(yīng)用的ANN算法,它是一種模擬人的大腦神經(jīng)網(wǎng)絡(luò)的算法,具有一些人大腦特有的特性。它的優(yōu)點(diǎn)就是它有著很強(qiáng)的學(xué)習(xí)能力,正如人的大腦一樣(廖景云,甄俊熙,2020)。但是它的缺點(diǎn)就是計(jì)算時(shí)間較長(zhǎng),而且識(shí)別的準(zhǔn)度不高,不是很適合本課題的應(yīng)用,通常我們使用ANN算法都需要將其與其他傳統(tǒng)算法相結(jié)合,這樣才能得到較好的識(shí)別效果。本章主要介紹了DTW的算法原理和本課題應(yīng)用的具體步驟,分析了DTW的優(yōu)點(diǎn)以及適用于本設(shè)計(jì)的原因,最后對(duì)比了主流的模式匹配算法。5.1GUI界面的制作過(guò)程圖形用戶(hù)界面(GraphicalUserInterfaces)簡(jiǎn)稱(chēng)GUI界面是可以人機(jī)交互的一種工具。它可以通過(guò)用戶(hù)的一系列操作使計(jì)算機(jī)產(chǎn)生圖像計(jì)算等功能。一個(gè)良好的GUI界面(1)在MATLAB中輸入guide打開(kāi)GUI啟動(dòng)界面。如圖5-1。(2)新建界面或者打開(kāi)已有界面。圖如下。GUIDE快速入門(mén)新建GUI打開(kāi)現(xiàn)有GUI□將新圖窗另存為:E:\MTB\bin\untitled1.fig□(3)設(shè)計(jì)GUI界面在點(diǎn)擊新建GUI后,會(huì)出現(xiàn)空白的GUI界面,如下圖。我們需要用左邊的工具欄進(jìn)行GUI設(shè)計(jì)。其中常用的工具有,以上分析作為基礎(chǔ)按鈕、可編輯文本、彈出式菜單等等。本設(shè)計(jì)的GUI界面主要有按鈕和坐標(biāo)軸組成。圖5-3空白GUI界面(4)本文設(shè)計(jì)的GUI界面本此語(yǔ)音導(dǎo)診助手的GUI界面如下圖5-4所示。國(guó)按鈕智能語(yǔ)音導(dǎo)診助手圓面板選擇語(yǔ)音庫(kù)提取特征參數(shù)其中我使用了六個(gè)按鈕三個(gè)文本框,以及一個(gè)坐標(biāo)軸。按鈕包括錄音、選擇語(yǔ)音庫(kù)、提取特征參數(shù)、選擇語(yǔ)音、識(shí)別、關(guān)閉。坐標(biāo)軸主要體現(xiàn)語(yǔ)音信號(hào)以及端點(diǎn)檢測(cè)后的語(yǔ)音信號(hào)。在GUI界面上,為了體現(xiàn)導(dǎo)診助手的實(shí)用性,我添加了現(xiàn)場(chǎng)語(yǔ)音錄制功能,在點(diǎn)擊“錄音”按鈕后,我們進(jìn)行語(yǔ)音(病情)輸入,由此背景出發(fā)然后出現(xiàn)可編輯文本進(jìn)行命名,然后添加到準(zhǔn)備好的醫(yī)療信息語(yǔ)語(yǔ)音庫(kù)中(徐雅麗,鄭向陽(yáng),2022)。“選擇語(yǔ)音庫(kù)”是讓用戶(hù)選擇語(yǔ)音文件,“提取特征參數(shù)”是提取語(yǔ)音的特征參數(shù)。“選擇語(yǔ)音”是選擇測(cè)試語(yǔ)音庫(kù)中的語(yǔ)音文件并播放選中的語(yǔ)音。“識(shí)別”是利用DTW算法進(jìn)行的模式匹配,鑒于這樣的情況然后識(shí)別出語(yǔ)音結(jié)果,以及輸出病癥語(yǔ)音對(duì)應(yīng)的科室,如語(yǔ)音“咳嗽”對(duì)應(yīng)的科室為“耳鼻喉科”。在識(shí)別過(guò)程中坐標(biāo)軸還可以顯示出端點(diǎn)檢測(cè)后的語(yǔ)音信號(hào)。最后的“退出”按鈕可以供用戶(hù)選擇繼續(xù)進(jìn)行識(shí)別操作還是退出(朱文博,魏曉茜,2020)。5.2程序運(yùn)行過(guò)程(1)首先點(diǎn)擊GUI界面上的開(kāi)始按鈕。如圖5-5。圖5-5開(kāi)始(2)點(diǎn)擊開(kāi)始后會(huì)出現(xiàn)可以運(yùn)行的GUI界面。如圖5-6。錄音關(guān)閉(3)隨后單擊“錄音”按鈕錄入語(yǔ)音,比如“咳嗽”。然后在彈出的文本框中輸入病癥語(yǔ)音名稱(chēng)“咳嗽”,隨后自動(dòng)保存在語(yǔ)音庫(kù)中。如圖5-7。×選擇語(yǔ)音庫(kù)提取特征參數(shù)選擇語(yǔ)音圖5-7第一步錄音(4)單擊“選擇語(yǔ)音庫(kù)”,選擇錄入的醫(yī)療病情信息語(yǔ)音庫(kù)。如下圖5-8。←個(gè)《畢設(shè)相關(guān)>語(yǔ)音導(dǎo)診助手(修改)>wav>哈文檔系統(tǒng)(D:)《P圖5-8選擇語(yǔ)音庫(kù)(5)點(diǎn)擊“提取特征參數(shù)”,單機(jī)后會(huì)迅速?gòu)棾鲞M(jìn)度條(大概0.2秒),隨后長(zhǎng)文本框中出現(xiàn)“特征參數(shù)提取完畢”,表示提取完畢可以進(jìn)行下一步操作。如圖5-9。特征參數(shù)提取完畢!特征參數(shù)提取完畢!圖5-9提取特征參數(shù)(6)點(diǎn)擊“選擇語(yǔ)音”選擇訓(xùn)練庫(kù)中的語(yǔ)音。X(7)點(diǎn)擊“識(shí)別”進(jìn)行語(yǔ)音識(shí)別。出現(xiàn)識(shí)別結(jié)果,如下圖5-10。X智能語(yǔ)音導(dǎo)診助手智能語(yǔ)音導(dǎo)診助手0結(jié)果咳嗽識(shí)別完畢!進(jìn)1圖5-10語(yǔ)音識(shí)別結(jié)果(8)最后可以進(jìn)行繼續(xù)識(shí)別,也可以點(diǎn)擊“關(guān)閉”退出操作。6.1全文總結(jié)音輸入來(lái)進(jìn)行相應(yīng)的導(dǎo)診功能。本文的主要突出了DTW和MFCC算法的研究。使用了(3)分析介紹了DTW算法。本設(shè)計(jì)選用了DTW算法,并且對(duì)傳統(tǒng)的DTW算法進(jìn)行了簡(jiǎn)單改進(jìn)應(yīng)用到導(dǎo)診助手設(shè)計(jì)中,使得對(duì)于孤立詞語(yǔ)音的識(shí)別速度大大增加,6.2展望本次設(shè)計(jì)使用的是MATLAB平臺(tái)的GUI界面來(lái)實(shí)現(xiàn)設(shè)計(jì)應(yīng)用,雖便于仿真,但是[1]許詩(shī)茵,何澤宇.場(chǎng)景特定詞的非特定人語(yǔ)音識(shí)別[D].西安電子科技大學(xué),2022.[2]盧俊豪,汪澤楷.非特定人孤立詞語(yǔ)音識(shí)別算法研究[D].南京郵電大學(xué),2023.[3]汪明輝,陳麗娟.非特定人語(yǔ)音識(shí)別關(guān)鍵技術(shù)研究[D].國(guó)防科學(xué)技術(shù)大學(xué),2021.[4]周思遠(yuǎn),許一凡.基于D
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)生素食快捷早餐行業(yè)深度調(diào)研及發(fā)展項(xiàng)目商業(yè)計(jì)劃書(shū)
- 2025年收納籃市場(chǎng)需求分析
- 房地產(chǎn)中介行業(yè)2025年服務(wù)質(zhì)量提升與行業(yè)服務(wù)創(chuàng)新趨勢(shì)報(bào)告
- 版語(yǔ)文二年級(jí)下冊(cè) 6樂(lè)三樂(lè)水 錦繡中華練習(xí)卷
- 版語(yǔ)文二年級(jí)上冊(cè)1《讓我們更健壯》練習(xí)卷
- 【7歷期末】安徽省蕪湖市2023-2024學(xué)年七年級(jí)下學(xué)期階段期末教學(xué)質(zhì)量監(jiān)控歷史試題(含解析)
- 胸部疾病患者的護(hù)理
- 《復(fù)數(shù)的加法與減法》教學(xué)課件1
- 電力工程建設(shè)的進(jìn)度控制措施
- 汽車(chē)生產(chǎn)線(xiàn)質(zhì)量?jī)?yōu)化計(jì)劃
- 中醫(yī)理療合同范本
- 小學(xué)經(jīng)典誦讀社團(tuán)活動(dòng)計(jì)劃、安排、記錄
- 中職高教版(2023)語(yǔ)文基礎(chǔ)模塊下冊(cè)-第五單元寫(xiě)作-說(shuō)明的關(guān)鍵在于說(shuō)得“明”【課件】
- 手機(jī)售后培訓(xùn)方案
- 2025年度全國(guó)大學(xué)生創(chuàng)新創(chuàng)業(yè)競(jìng)賽項(xiàng)目保密承諾書(shū)3篇
- DB33T 2288-2020 淡水池塘養(yǎng)殖尾水處理技術(shù)規(guī)范
- GB/T 44880-2024因果矩陣
- 安保工作的多元化發(fā)展
- 【MOOC】人格與精神障礙-學(xué)做自己的心理醫(yī)生-暨南大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 新能源汽車(chē)電氣系統(tǒng)檢修(微課版) 課件 項(xiàng)目二任務(wù)2無(wú)鑰匙進(jìn)入和起動(dòng)系統(tǒng)
- 生成式人工智能講解
評(píng)論
0/150
提交評(píng)論