




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
語音識(shí)別論文〔優(yōu)秀范文6篇〕,計(jì)算機(jī)應(yīng)用技術(shù)論文本篇論文目錄導(dǎo)航:【】語音辨別論文〔優(yōu)秀范文6篇〕【】【】【】【】多媒體應(yīng)用時(shí)代的到來,各項(xiàng)新技術(shù)應(yīng)運(yùn)而生,一直在被研究的語音辨別技術(shù)也被愈加廣泛地應(yīng)用在實(shí)際生活中。以下為搜素整理的語音辨別論文6篇,供大家參考閱讀。語音辨別論文:基于語音辨別的智慧分類垃圾桶研究?jī)?nèi)容摘要:傳統(tǒng)的智慧垃圾桶往往只采用紅外傳感器檢測(cè)能否有人接近,當(dāng)人體接近了垃圾桶,就會(huì)自動(dòng)打開垃圾桶的翻蓋,這樣的垃圾桶不僅無法完成垃圾分類功能,也無法有效防止病毒傳播。因而,旨在實(shí)現(xiàn)一個(gè)能夠自動(dòng)垃圾分類的智慧垃圾桶,該垃圾桶基于微控制器和語音辨別技術(shù),其工作經(jīng)過為:首先,非特定人語音辨別芯片LD3320不斷檢測(cè)外界語音輸入并進(jìn)行語音辨別,接著Arduino微控制器再根據(jù)辨別結(jié)果判定該垃圾所屬的分類,最后指揮舵機(jī)打開相應(yīng)垃圾桶的蓋子。智慧分類垃圾桶不僅能夠助力垃圾分類政策的施行,解決人們困擾的垃圾分類問題,而且可為疫情期間無接觸式垃圾投放提供技術(shù)保障。本文關(guān)鍵詞語:物聯(lián)網(wǎng);語音辨別;智慧分類垃圾桶;Arduino;單片機(jī);垃圾分類;舵機(jī);Abstract:Thepurposeofthispaperistoimplementagarbageclassificationofwisdomcanautomatically,thetrashbinisbasedonmicrocontrollerandvoicerecognitiontechnology,itsworkingprocessis:first,speaker-independentspeechrecognitionchipLD3320continuouslydetecttheoutsidevoiceinputandvoicerecognition,thentheArduinomicrocontrolleraccordingtoclassification,theresultconcludesthatthetrashbelongsthelastcommandsteeringgearopenthelidofthecorrespondingtrashcan.Intelligentgarbagecanscannotonlyhelptheimplementationofgarbageclassificationpolicies,solvetheproblemofgarbageclassificationthatpeoplearetroubledby,butalsoprovideasafetyguaranteeforthecontactlessgarbagedeliveryduringtheepidemic.1智慧垃圾桶簡(jiǎn)介2021年,我們國(guó)家公布了(生活垃圾分類制度施行方案〕,這一舉措對(duì)維護(hù)生態(tài)系統(tǒng)平衡、改善城鄉(xiāng)環(huán)境、促進(jìn)資源回收利用都具有重要意義,該方案將垃圾分為廚余〔易腐〕垃圾、有害垃圾、可回收垃圾和其它垃圾四類。但是,居民常為冗雜的垃圾分類問題而犯難,為此,本項(xiàng)目旨在應(yīng)用語音辨別和單片機(jī)技術(shù)實(shí)現(xiàn)一個(gè)自動(dòng)分類的智能感悟垃圾桶,居民只需面對(duì)智慧垃圾桶,講出要扔垃圾的名稱,智慧垃圾桶就能夠辨別語音輸入并進(jìn)行語音辨別,進(jìn)而區(qū)分出該垃圾所屬的類別,最后自動(dòng)打開該類垃圾的翻蓋。傳統(tǒng)的智能垃圾桶大都基于人體紅外感應(yīng)傳感器,它實(shí)現(xiàn)的基本原理是:微型控制芯片通過紅外傳感器的感應(yīng)檢測(cè)能否有人靠近,當(dāng)有人接近時(shí),微型控制芯片就指揮傳動(dòng)裝置打開垃圾桶的桶蓋,延時(shí)一段時(shí)間后,再自動(dòng)關(guān)閉垃圾桶的桶蓋。但是,由于紅外傳感器的傳感檢測(cè)距離往往缺乏1m,所以這種垃圾桶不但無法有效地解決垃圾分類投遞問題,也不能有效地防止垃圾桶附近細(xì)菌和病毒的傳播?;谡Z音辨別技術(shù)的智慧分類垃圾桶,不僅能夠幫助居民方便快速地完成垃圾分類,同時(shí)也能有效減少因穿插觸摸引起的病毒傳播,實(shí)現(xiàn)了疫情期間無接觸式的垃圾投遞,進(jìn)而為疫情防控提供了更多安全保障。智慧分類感悟垃圾桶是一種以單片機(jī)技術(shù)為基礎(chǔ),運(yùn)用微控制器、傳動(dòng)裝置以及各種傳感器技術(shù)的智能設(shè)備,相比傳統(tǒng)的垃圾桶,智慧分類垃圾桶是一種新型智能產(chǎn)品,實(shí)現(xiàn)了無接觸式垃圾投放與分類。除此之外,它還能夠結(jié)合其它智能設(shè)備應(yīng)用于各種場(chǎng)景,比方結(jié)合智慧燈、智慧窗簾、智慧加濕器等組成智能家居系統(tǒng);結(jié)合智慧ETC設(shè)備、超聲波測(cè)距儀等設(shè)備構(gòu)成智慧停車場(chǎng)等??傊?,智慧垃圾桶在構(gòu)建智慧城市、開創(chuàng)建立文明城市等方面發(fā)揮著重要作用。智慧分類感悟垃圾桶的主要構(gòu)造為:ArduinoUNO微控制芯片分別連接一塊LD3320語音辨別模塊和四個(gè)舵機(jī)。首先,語音辨別模塊不斷檢測(cè)外界環(huán)境中居民講出的垃圾名稱拼音串,比方,香蕉皮、電池、紙片、玻璃等,并進(jìn)行語音辨別,并把辨別結(jié)果傳給微控制器芯片,接著微控制器根據(jù)辨別結(jié)果判定垃圾所屬的分類,最后指揮舵機(jī)打開相應(yīng)垃圾桶的翻蓋,等待延時(shí)一定的時(shí)間〔人投遞垃圾需要的時(shí)間〕后再指揮舵機(jī)自動(dòng)關(guān)閉該垃圾桶的桶蓋。下面分別講明智慧分類垃圾桶四個(gè)模塊及其功能:1)ArduinoUNO開發(fā)板:智慧分類垃圾桶的核心模塊,相當(dāng)于智慧垃圾桶的大腦。ArduinoUNO微控制器能夠脫機(jī)獨(dú)立運(yùn)行可執(zhí)行文件,它指揮智慧垃圾桶有序地進(jìn)行工作:即先調(diào)用語音辨別模塊不斷監(jiān)測(cè)外界的語音輸入并辨別結(jié)果,再根據(jù)輸入的辨別結(jié)果完成判定分類,最后指揮四個(gè)舵機(jī)之一打開垃圾桶的翻蓋。2〕語音辨別模塊:智慧分類垃圾桶的AI〔人工智能〕模塊,相當(dāng)于智慧垃圾桶的感悟耳朵。語音辨別模塊能夠根據(jù)外界的自然語言輸入進(jìn)行語音辨別,并將辨別結(jié)果傳給Arduino開發(fā)板。3〕舵機(jī)模塊:智慧分類垃圾桶的動(dòng)作執(zhí)行模塊,相當(dāng)于智慧垃圾桶的手臂。本文使用四個(gè)舵機(jī)分別置于四種不同的垃圾桶上,它能夠接收ArduinoUNO開發(fā)板的動(dòng)作指令,自動(dòng)打開垃圾桶的翻蓋,當(dāng)垃圾投遞結(jié)束后,再關(guān)閉垃圾桶的翻蓋。4〕垃圾桶外殼:智慧分類垃圾桶的載體。廚余垃圾、有害垃圾、可回收垃圾和其它垃圾,共四類垃圾分別對(duì)應(yīng)四種不同的垃圾桶。2ArduinoUNO微控制芯片Arduino是一種開源的微控制處理單元,它是一個(gè)基于ATmega328P〔也稱為單片機(jī)〕微控制器的開發(fā)板。Arduino單片機(jī)使用簡(jiǎn)單、且非常靈敏,已成為諸多物聯(lián)網(wǎng)應(yīng)用〔諸如智慧交通、智能家居、智慧農(nóng)業(yè)、智慧城市等〕的首選微控制器。本文應(yīng)用ArduinoUNO板實(shí)現(xiàn)了一個(gè)智慧垃圾桶,首先,單片機(jī)指揮非特定人語音辨別芯片LD3320開場(chǎng)語音辨別,再根據(jù)辨別結(jié)果指揮舵機(jī)打開智慧分類垃圾桶的翻蓋,進(jìn)而完成垃圾分類投遞的功能。ArduinoIDE提供應(yīng)用戶兩個(gè)主要函數(shù),華而不實(shí):基于云端處理的語音辨別智能音響的設(shè)計(jì)與研究?jī)?nèi)容摘要:本文設(shè)計(jì)與研究了基于云端處理的語音辨別智能音箱,通過云端人工智能語音交互技術(shù),采用SDK開發(fā)及功能界面,實(shí)現(xiàn)多場(chǎng)景下云端處理的語音辨別,現(xiàn)有傳統(tǒng)音響產(chǎn)品升級(jí),推動(dòng)智能音響在消費(fèi)電子領(lǐng)域發(fā)展,在提供高品質(zhì)音質(zhì)的同時(shí),進(jìn)行獨(dú)特化音響產(chǎn)品的設(shè)計(jì)。語音辨別技術(shù)就是讓智能設(shè)備聽懂人類的語音。這項(xiàng)技術(shù)能夠提供比方自動(dòng)語音翻譯、命令控制等多項(xiàng)應(yīng)用。人工智能的興起,語音辨別技術(shù)在理論和應(yīng)用方面都獲得大突破,已逐步走進(jìn)我們的日常生活。語音辨別技術(shù)的發(fā)展,準(zhǔn)確率與響應(yīng)時(shí)間將突破量變到質(zhì)變的臨界點(diǎn),驅(qū)動(dòng)語音交互產(chǎn)品浸透率迅速提升。本文關(guān)鍵詞語:語音交互;云端處理;智能音響;1概述近年來,智能家居市場(chǎng)迎來了爆發(fā)期。公開數(shù)據(jù)顯示,2020年中國(guó)智能家居市場(chǎng)規(guī)模到達(dá)了1820億元左右,智能家居的設(shè)備出貨量突破了2.15億臺(tái)。隨著技術(shù)的變更,預(yù)測(cè)在2023年全球智能家居設(shè)備出貨量將到達(dá)13.9億臺(tái),中國(guó)智能家居市場(chǎng)為5億臺(tái)。語音辨別是解決機(jī)器聽懂人類語言的一項(xiàng)技術(shù)。所謂聽懂,有兩層意思,一是直譯,把用戶所講的話直接轉(zhuǎn)換成文本;二是義譯,正確理解語音中所包含的要求,并作出正確的應(yīng)答。無論是Siri、Echo,還是其他的智能語音助手都能夠接觸和管理消息。需要注意的是,智能音箱不再只是單一的智能硬件,它將在更多的應(yīng)用層面與使用場(chǎng)景落地。根據(jù)市場(chǎng)分析可知如今電視設(shè)計(jì)的趨勢(shì)是超薄、窄邊框、大尺寸屏幕,而內(nèi)置喇叭和腔體容積卻越來越小,因而搭配超薄平板電視的超薄、小體積及高保真條狀電視音響系統(tǒng)必將成為今后主流的家庭音響,具有廣闊的市場(chǎng)前景。本文設(shè)計(jì)與研究了基于云端處理的語音辨別智能音箱,在功能上支持模擬輸入、S/PDIF輸入、HDMI、HDMIARC、HDMIeARC、Bluetooth和Wi-Fi等功能,方便構(gòu)建連接并使用。通過自主研發(fā)的聲學(xué)采集處理系統(tǒng),采用全新的心理聲學(xué)音頻信號(hào)處理技術(shù)(MAP-Audio),以及完好的DSP算法和DRC調(diào)控技術(shù),通過對(duì)頻率響應(yīng)和動(dòng)態(tài)范圍缺陷的補(bǔ)償,針對(duì)揚(yáng)聲器的聲學(xué)限制、高噪音背景,線性人類感悟做補(bǔ)償,改善聲音質(zhì)量;進(jìn)而彰顯語音辨別智能音響的聲音優(yōu)勢(shì)。2基于云端處理的語音辨別智能音響設(shè)計(jì)本文所設(shè)計(jì)的基于云端處理的智能音響如此圖1所示,對(duì)ATMOS的處理芯片、杜比數(shù)字實(shí)時(shí)編碼〔DolbyDigitalLive〕技術(shù),實(shí)如今無線智能音響、語音交互智能電視與機(jī)頂盒、語音控制裝置、遠(yuǎn)程音頻拾取、游戲控制臺(tái),智能家居和物聯(lián)網(wǎng)模組、車載免提控制與通信上的應(yīng)用。2.1云端語音信號(hào)處理方案人機(jī)對(duì)話系統(tǒng)共有六個(gè)主要部分,包括有語音辨別器、自然語言解析器、問題求解器、語言生成器、語言合成器和對(duì)話管理器。如此圖2所示的人機(jī)交互經(jīng)過中,語音辨別、語義理解、語音合成部分決定著用戶體驗(yàn),因而怎樣準(zhǔn)確的辨別并且自然的反應(yīng),成為智能音箱語音交互設(shè)計(jì)的核心問題。2.1.1語音辨別ASR-AutomaticSpeechRecognition是將聲音轉(zhuǎn)化成文字的經(jīng)過,相當(dāng)于耳朵。通常語音辨別有兩種方式方法:圖1:基于云端智能音箱設(shè)計(jì)框圖圖2:人機(jī)交互經(jīng)過(1〕隱馬爾可夫模型〔HMM-HiddenMarkovModel〕,傳統(tǒng)的辨別方式方法,一般采用較多;(2〕基于深度神經(jīng)網(wǎng)絡(luò)的端到端方式方法,使用相對(duì)較少。2.1.2語義理解NLP-NaturalLanguageProcessingNLP是語音交互中最核心,也是最難的模塊。是實(shí)現(xiàn)智能語音交互的關(guān)鍵部分,決定著機(jī)器能否能夠理解用戶真實(shí)意圖和實(shí)際需求。NLP主要牽涉的技術(shù)有:文本預(yù)處理、詞法分析、語義理解、分詞、文本分類、文本類似度處理、情感傾向分析、文本生成等等。舉個(gè)例子,在處理文本時(shí),會(huì)發(fā)現(xiàn)有大量的同音錯(cuò)別字,怎么樣讓機(jī)器知道這些錯(cuò)別字,并且改正過錯(cuò)來呢,也是NLP的一大難點(diǎn)。圖3:基于云端處理的語音辨別智能音響2.1.3語音反應(yīng)TTS-TextToSpeech實(shí)現(xiàn)TTS,當(dāng)前比擬成熟的有兩種方式方法:拼接法和參數(shù)法。2.2數(shù)字音頻DSP處理方案本方案采用CS49844音頻DSP進(jìn)行基于云端處理的一代環(huán)繞聲的應(yīng)用提供高容量處理。數(shù)字信號(hào)處理器(DSP)支持所有傳統(tǒng)DVD音頻編解碼器和所有Blu-rayDisc?音頻格式,并且擁有足夠的數(shù)字信號(hào)處理器(DSP)容量,可在單個(gè)芯片中支持各種并發(fā)后處理算法,而無需從外部存儲(chǔ)。當(dāng)性能要求需要更多處理時(shí),開發(fā)人員可輕松在擁有四核的CS49844引腳兼容器件之間分別切換。其主要特性有:適用于DolbyATMOS和DTS:X的單芯片解決方案、多聲道解碼和后處理、擁有四核(CS49844)32位DSP、I?S和S/PDIF、串行控制端口和CirrusLogicDSP工具支持。華而不實(shí):2.2.1音頻信號(hào)輸入AudioSourceAudioSource信號(hào)源既可輸入模擬與數(shù)字信號(hào),數(shù)字音頻信號(hào)的格式分為兩種傳輸方式:光纖與電纜傳入方式,數(shù)字音頻信號(hào)通過DigitalSelector的選通開關(guān)后傳入到DSP,模擬音頻信號(hào)經(jīng)過ADC模數(shù)轉(zhuǎn)換后輸入到DSP進(jìn)行處理。2.2.2數(shù)字信號(hào)選擇器DS-DigitalSelector音頻信號(hào)源AudioSource可能發(fā)送光纖同軸兩種類型接口的數(shù)字音頻,這兩種信號(hào)要進(jìn)行一組切換行為才能傳入DSP進(jìn)行解碼,這組切換受控于MCU(MicrocontrollerUnit),這是更合理的設(shè)置搭配,需要在這里處進(jìn)行信號(hào)的選擇。2.2.3動(dòng)態(tài)隨機(jī)存取內(nèi)存-SDRAMSDRAM有同步Synchronization接口,在響應(yīng)控制輸入前會(huì)等待一個(gè)時(shí)鐘信號(hào),這使得SDRAM與DRAM相比,更優(yōu)的操作形式,存儲(chǔ)核心處理所需要各類參數(shù),以及用作中間數(shù)據(jù)緩存。本次的系統(tǒng)設(shè)計(jì)中,牽涉到的音頻處理參數(shù),多個(gè)模塊的數(shù)據(jù)由于數(shù)據(jù)量宏大,無法保存在DSP內(nèi)存中,需要寫入SDRAM,實(shí)時(shí)同步讀寫。2.3杜比數(shù)字實(shí)時(shí)編碼〔DolbyDigitalLive〕技術(shù)應(yīng)用一種實(shí)時(shí)編碼技術(shù),它能將多種音頻信號(hào)轉(zhuǎn)成杜比數(shù)字的專用碼流并通過家庭影院系統(tǒng)進(jìn)行播放。其主要技術(shù)包括有:2.3.1影音的環(huán)繞聲技術(shù)杜比數(shù)字實(shí)時(shí)編碼(Dolby?DigitalLive)技術(shù)使你在看視頻時(shí)沉浸在與影音空間相契合的5.1聲道環(huán)繞聲中,進(jìn)而提供更好的綜合游戲體驗(yàn)。2.3.2無延遲或暫停技術(shù)杜比數(shù)字實(shí)時(shí)編碼(DolbyDigitalLive)技術(shù)已針對(duì)低延遲交互式應(yīng)用進(jìn)行優(yōu)化,不會(huì)在視頻與音頻之間引入任何可感悟的延遲,因此完美地適用于游戲。2.3.3單電纜連接通過使用單個(gè)數(shù)字連接,杜比數(shù)字實(shí)時(shí)編碼(DolbyDigitalLive)技術(shù)確保音頻信號(hào)的完好性并消除多個(gè)模擬和數(shù)字連接的混淆、干擾和染波。杜比全景聲結(jié)合了面向?qū)ο蟮母拍?,?dòng)態(tài)處理聲道的混音、聲音定向、增益等方式,令觀眾體驗(yàn)極佳的沉浸感。利用頂部揚(yáng)聲器和環(huán)繞揚(yáng)聲器創(chuàng)造出逼真而自然的音頻體驗(yàn)。置頂聲道采用了安置在聲條音響頂部的兩只斜向上的喇叭,通過大花板反射構(gòu)成天空置頂聲道。由安置在聲條式音響兩側(cè)的喇叭通過左右墻面反射產(chǎn)生左右環(huán)繞聲道。在一個(gè)狹小的聲條式音響體積內(nèi)要安置8個(gè)獨(dú)立的聲道。杜比全景聲實(shí)現(xiàn)了硬件配置受限的情況下,盡可能重放原創(chuàng)者的設(shè)想效果。讓聲音能夠精到準(zhǔn)確的在三維空間內(nèi)部署和流動(dòng),而減少聲道的限制帶來的影響。如此圖3所示?;谠贫颂幚淼恼Z音處理及現(xiàn)場(chǎng)觀看和交談,支持觸發(fā)輔助信源選擇拾取噪聲抑制技術(shù),實(shí)現(xiàn)了多通道聲學(xué)回聲消除,SSP噪聲抑制,集成語音觸發(fā)引擎,低功率70mW喚醒語音檢測(cè)緩沖聲音形式,集成片上32位的數(shù)字音頻處理器芯片,具有106dB全途徑動(dòng)態(tài)范圍的24位麥克風(fēng)ADC,原始音頻采樣率:8~96kHz,0.125dB
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 藥品研發(fā)分工管理制度
- 藥品采購(gòu)配送管理制度
- 藥店企業(yè)健康管理制度
- 藥店收費(fèi)票據(jù)管理制度
- 薪酬外包服務(wù)管理制度
- 設(shè)備出口資料管理制度
- 設(shè)備定期校驗(yàn)管理制度
- 設(shè)備施工成本管理制度
- 設(shè)備班組安全管理制度
- 設(shè)備自主保全管理制度
- 2025年四川省自貢市中考物理試卷及答案
- 溝通與演講2023學(xué)習(xí)通超星課后章節(jié)答案期末考試題庫2023年
- 斷路器的控制回路和信號(hào)回路
- 中考數(shù)學(xué)復(fù)習(xí)經(jīng)驗(yàn)交流PPT課件
- 內(nèi)部控制專項(xiàng)審計(jì)實(shí)施方案
- 硅膠管檢驗(yàn)管理規(guī)定
- 勞動(dòng)工資統(tǒng)計(jì)培訓(xùn)PPT課件
- DSP課設(shè)——正弦波發(fā)生器
- 從《國(guó)際博物館》看世界博物館發(fā)展解析
- 六宮格數(shù)獨(dú)100題
- 中藥長(zhǎng)壽偏方
評(píng)論
0/150
提交評(píng)論