基于單片機的語音控制開關設計論文_第1頁
基于單片機的語音控制開關設計論文_第2頁
基于單片機的語音控制開關設計論文_第3頁
基于單片機的語音控制開關設計論文_第4頁
基于單片機的語音控制開關設計論文_第5頁
已閱讀5頁,還剩58頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、0 / 63 題 目 基于單片機的語音控制開關設計學生 朱朱 楠楠學號 11130240501113024050 所在學院物物 理理 與與 電電 信信 工工 程程 學學 院院專業班級通通 信信 工工 程程 專專 業業 1102 班班 指導教師 爭爭 兵兵 完成地點物物 理理 與與 電電 信信 工工 程程 學學 院院 實實 驗驗 室室20152015 年年 6 6 月月 0303 日日1 / 63畢業論文設計任務書院(系) 物理與電信工程學院 專業班級 通信 1102 學生 朱楠 一、畢業論文設計題目基于單片機的語音控制開關設計 二、畢業論文設計工作自_2015 _年_ 1_月_10_日 起至_

2、2015_年 6 月_ 10 日止三、畢業論文設計進行地點: 物理與電信工程學院實驗室 四、畢業論文設計的容要求:智能家居作為一個新生產業,目前處于一個導入期與成長期的臨界點,隨著智能家居市場推廣普與的進一步落實,培育起消費者的使用習慣,智能家居市場的消費潛力必然是巨大的,產業前景光明。本課題設計語音智能控制開關,具體要求如下: 1. 掌握語音識別的工作原理,使用語音識別芯片完成硬件設計; 2能實現語音控制開關的開啟和關閉; 3. 系統集成,焊接電路板,調試。 成果形式:實驗樣機一套。 畢業設計進度安排: 1.103.20:查閱資料(參考文獻不少于 10 篇),進行方案論證,完成開題報告。完成

3、不少于 3000 字的外文翻譯; 3.204.30:設計硬件電路,編寫相關軟件、完成電路仿真與樣機調試; 5.15.20:完善系統調試,撰寫論文,準備畢業設計驗收等工作; 5.21-6.10:整理資料,修改論文,準備畢業答辯。 指 導 教 師系 (教 研 室) 通 信 教 研 室 系(教研室)主任簽名批準日期接受論文 (設計)任務開始執行日期學生簽名 / 63基于單片機的語音智能開關設計基于單片機的語音智能開關設計朱楠(理工學院物理與電信工程學院通信 1102 班, 723003)指導教師:爭兵 摘摘 要要 語音識別是解決機器“聽懂”人類語言的一項技術。隨著語音識別理論研究的深入和數字信號處理

4、軟、硬件技術的發展,語音識別技術應用的研究越來越受到人們的關注。智能語音家電控制系統實質上就是一個替代傳統手動開關的受聲控制的電子開關。此系統以STC11L08XE和LD3320語音芯片為硬件核心,對語音芯片LD3320的信息進行處理,并對開關進行控制,通過LD3320外界的麥克風采集聲音信號,再通過LD3320語音芯片進行頻譜分析,在提取語音特征,之后和關鍵詞語列表中的關鍵詞進行對比匹配,最后找出得分最高的關鍵詞作為識別結果輸出給單片機,單片機進行處理后,再輸出信號來控制繼電器,再通過繼電器來控制開關工作,開關又可實現對電器的控制。語音芯片的功能都是通過單片機控制實現的。最終實現對智能語音開

5、關的控制 關關 鍵鍵 詞詞 STC11L08XE 單片機 語音芯片 LD3320 語音識別 I / 63 DesignDesign ofof intelligentintelligent voicevoice switchswitch basedbased onon MCUMCUZhu nan(Grade11,Class2,Major of Communication Engineering,School of Physics and telecommunication Engineering of Shaanxi University of Technology, Hanzhong 7230

6、03,China)Tutor:Zheng Zheng bingAbstractAbstract:Speech recognition is a technology to solve the machine to understand human language. Along with the research of speech recognition theory and the development of digital signal processing software and hardware technology, The research on the applicatio

7、n of speech recognition technology is getting more and more attention.The intelligent speech appliance control system is essentially an electronic switch which replaces the traditional acoustic control with the manual switch. This system LD3320 voice chip and the stc11l08xe as hardware core and the

8、voice chip ld3320 information for processing, and control the switch, through ld3320 external microphone audio signal acquisition, and then through the ld3320 voice chip spectrum analysis, key words in speech feature extraction, and the list of key words contrast matching, finally to find the highes

9、t score of the words as recognition results output to the MCU, MCU processing, then the output signal to control the relay, then through the relay to control of the switch, the switch can be to achieve control of the electric appliances. The function of the speech chip is realized by the MCU control

10、. Control of the intelligent speech switch is realized finally.KeyKey wordswords : : STC11L08XEMCU LD3320 voice chipSpeech recognition II / 63III / 63目錄目錄1 緒論 .11.1 選題的目的與研究意義 11.2 選題的發展現狀和趨勢 11.4 設計的目的和任務.32 系統方案選擇和論證 .42.1 設計要求.42.2 方案選擇和論證.42.3 最佳主體方案.53 硬件設計與實現 .63.1 單片機電路設計.63.2 語音控制部分 .83.3 復位

11、電路 113.4 時鐘電路.123.5 繼電器電路概述 133.6 電路連接總圖 144 軟件設計 .154.1LD3320 的軟件編程 154.2 寄存器的操作 164.3 寄存器功能簡介 184.4 芯片關鍵字的設置 194.5 語音開關源程序 194.6stc 單片機 PC 端下載 215 實物的制作和調試 225.1PCB 板制圖步驟 22IV / 635.2 硬件電路板的制作 225.3 系統調試.23總 結 .24致 .25參考文獻 .26附錄 A 外文翻譯 27附錄 C 源程序 .41附錄 D 元器件清單 .54附錄 E 實物圖 550 / 631 1 緒論緒論1.11.1 選題

12、的目的與研究意義選題的目的與研究意義智能家居作為一項新開發的項目,目前處于一個導入期與成長期的臨界點,目前智能家居市場已逐步形成,培養起消費者的消費習慣,智能家居市場有著不可估量的產業前景,所以,國外很逗企業已經把市場轉向智能家居這個方向,特別是對企業發展環境和客戶需求趨勢的深入研究,一大批優秀的智能家居品牌迅速崛起,逐漸成為智能家居中的翹楚,在日常家居生活中,為了使我們對家庭的控制系統能隨時掌控,需要的信息隨時獲取,操作的終端形式非常重要,多種形式的操作終端是必不可少的。語音智能家居控制是智能家居中很重要的部課題主要研究容。機器進行語音交流,讓機器明白人類語言,從而可以通過語音控制機器,是人

13、類一直研究的課題。語音識別就如同機器的聽覺系統。語音識別就是讓機器通過語音識別和理解從而把語音信號轉變為相應的文字或命令的高技術。近二十年來,語音識別技術取得革命性的進步,開始走進我們生活的方方面面。人們預計,未來 10 年,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。語音識別聽寫機在一些領域的應用被美國新聞界評為 1997年計算機發展十件大事之一。很多專家都認為語音識別技術是 2000 年至 2020 年間信息技術領域十大重要的科技發展之一。 語音識別的大概過程依據在實際中的不同作用,語音識別系統可以分為:特定人與非特定人的識別、獨立詞與連續詞的識別

14、、小詞匯量與大詞匯量以與無限詞匯量的識別。但是任何一個語音識別系統,它的理論基礎和處理步驟都基本一致。語音識別過程主要包括語音信號的預處理、特征提取、模式匹配幾個部分。預處理包括預濾波、采樣和量化、加窗、端點檢測、預加重等過程。語音信號識別必不可缺的一步就是特征參數提取。提取的特征參數需要達到以下要求:(1)提取的特征參數可以很好的表現出它自身的特征,比較容易區分;(2)各階參數之間有都有各自良好的區分特征;特征參數要計算方便,使用效率高的算法,是語音有所保證。在訓練的時候,將特征參數進行稍微的加工后,為每種詞條錄入一個特征模型,保存為模板庫。在識別階段,語音信號經過同一個通道得到語音特征參數

15、,得到測試模板,與參考模板進行匹配,將匹配分數最高的參考模板作為語音輸出的結果。同時,還可以在很多先驗知識的幫助下,提高識別的準確率。(1)語音特征提取:是為了從語音波形中得到隨時間變化的語音特征序列;(2)聲學模型與模式匹配(識別算法):聲學模型一般情況下將獲得的語音特征通過學習算法獲取。在識別時通過對輸入的語音特征同聲學模式的匹配比較,得到最準確的識別結果;(3)語言模型與語言處理:語言模型涵蓋了由語音識別指令組成的語法網絡或由統計方法組成的語言模型,語言處理可以完成語法、語義分析,對小詞表語音識別系統,通常語言處理部分可以省略。 聲學模型作為語音識別系統的底層模型,并且是語音識別系統中最

16、不可或缺的一部分。聲學模型是為了是提供一種快捷的辦法計算語言的特征矢量序列與每個發音模板之間的距離。聲學模板的設計和語言發音特點密切相關,聲學模型單元大小(字發音模型、半音節模型、因素模型)對語音訓練數據量的多少、系統識別率,包括靈活性都會產生很大的作用。必須依據不同的語言特征、識別系統詞匯量的大小決定識別單元的大小。語言模型中對中、大詞匯量的語言識別系統相當重要。當分類有錯誤時就能依據語言模型、語法結構、語義學進行糾錯,尤其是一些同音字必須經過全文結構才可以肯定詞義,語言學理論涵蓋語義結構、語法結構、語言的數學模型等全方位。現在相對成功的語言模型一般使用統計語法的語言模型和基于規則法結構命令

17、語言模型。語法結構可以限定不同詞之間的相互連接關系,減少識別系統的搜索空間。這有利于提高系統識別。1.21.2 選題的發展現狀和趨勢選題的發展現狀和趨勢1 / 631952 年貝爾研究所 Davis 等人研發出了全球上第一個可以識別 10 個英文字母發音的實驗系統。1960 年英國的 Denes 等人研發出了人類第一個計算機語音識別系統。大量的的語音識別研究是進入了 70 年代后,小詞匯量、孤立詞的識別方面取得了很大的突破展。到了 80 年代以后,研究的方向開始向大詞匯量轉變。非特定人連續語音識別,在研究方法上也產生了翻天覆地的變化,也就是說傳統的基于標準模板匹配的技術思路轉變成基于統計模板(

18、HMM)的技術方法。此外,再次提出了將神經網絡技術引入語音識別問題的技術方法。進入 90 年代,語音識別的系統框架方向發展緩慢處于低谷。不過,語音識別技術的應用與產品化發展很是迅速。DARPA(Defense Advanced Research Projects Agency)這一個 10 年計劃是由由美國國防遠景研究計劃局資助的,它的重要意義是鼓勵語言理解系統的研發;到了 80 年代,美國國防部遠景研究計劃局又一次出資贊助一項為期 10 年的 DARPA 的項目,它涵蓋了噪聲下的語音識別和會話(口語)識別系統,識別任務設定為 “(1000 單詞)連續語音數據庫管理”;到了 90 年代,這一

19、DARPA 計劃仍然在持續進行中。其研究重點已轉向識別裝置中的自然語言處理部分,識別任務設定為“航空旅行信息檢索”。從此中國進入了一個前所未有的發展階段。語音作為人機對話的最高手段,使人機對話向人-”人”對話的終端目標發展,它在形式是人機對話的一個新突破,語音的對話方式可使人機界面從數字領域進入語音領域。不過,與真正意義上的完全語音模糊參數的人機對話模式的實現還差很多,這中間還有重大的技術領域需要突破,不過,可以肯定的是伴隨著語音識別,語音合成,信息綜合,網絡通信等許多技術的攻克和發展,人類這一夢寐以求的夢想的一定會在不遠的將來實現,它的前景是一片光明璀璨和無限美妙,目前,主流的大詞匯量語音識

20、別系統采用統計識別技術。 典型的基于在計模式識別方法的語音識別系統由以下幾個基本模塊所構成:(1)信號處理與特征提取模塊。這個人模塊的作用是是從輸入信號中提取特征,提供給聲學模型進行分析。而且,這個模塊通常涵蓋一些信號處理技術,用來降低降低環境噪聲、環境、錄音者等外界因素對特征形成的干擾。(2)統計聲學模型。典型系統多采用基于一階隱馬爾科夫模型進行建模。(3)發音詞典。發音詞典涵蓋了系統所能分析的詞匯集與它們的發音。發音詞典在本質上為聲學建模單元與語言模型建模單元間提供了映射。(4)語言模型。 語音模型針對系統所針對的語言進行建模,理論上,包括正則語言,和全文無關文包括在里面的的全部模型都能做

21、成為語言模型,不過現在各種系統普遍采用的還是基于統計的 N 元文法與其變體。(5)解碼器。語音識別系統的核心就是解碼器,它的作用是是對輸入的信號,根據聲學,語言模型和詞典找出可以以最大幾率輸出這個信號的詞串。1.31.3 選題的應用領域選題的應用領域(1)通信的語音撥號。特別是中高檔上,現已普遍的具有語言撥號功能,隨著語音芯片的價格降低,普通也將具備語音撥號的功能。(2)汽車的語音控制,由于汽車在行駛過程中,駕駛員必須要用手安全駕駛,因此如果在汽車上需要使用手機,就一定要使用有語音撥號功能的免提語音通信方式。而且,對汽車的衛星導航定位系統的操作、以與車其他功能的操作同樣使用語音實現控制。(3)

22、工業控制與醫療領域。操作人員在忙的時候,還有其他情況同樣需要處理時,比較好的犯法就是增加一個人與機器的語言交互界面,操作人員通過語音對機器發出操作命令,機器可以使用語音做出回應。(4)個人數字助理。個人數字助理的語音交互界面,PDA 的體積非常小,人機界面始終是它應用和技術的困難之一,因為 PDA 上使用鍵盤是特別麻煩的,因此,現在通常使用手寫體識別的辦法錄入和搜索信息。不過,用戶依然感覺這些辦法很麻煩。目前業界普遍認為,PDA 的最佳人機交換界面是通過語音作為傳輸媒介的交互放方法,并且已有很少量使用。面對語音識別技術的高速發展,可以預見,在不遠的未來來語音會成為 PDA 不可缺少的人機交互界

23、面。2 / 63(5)智能玩具。我們可以使用語音識別技術和智能娃娃交流,也能使用語音對玩具發出指令,讓它去做一點可行的任務,也能生產出可以帶有語音鎖功能的電子看門狗,智能玩具有不可估量的市場價值,它的關鍵之處就是要減少語音芯片的價格。(6)家電遙控。我們可以用語音控制家里的電視機、VCD、空調、電扇、窗簾,我們僅僅使用一個語音遙控器就能控制把家中所有的的電器,這樣,就能讓讓琳瑯滿目的電器的控制變的非常容易了。1.41.4 設計的目的和任務設計的目的和任務1.4.1 設計目的: (1) 掌握語音識別的工作原理,使用語音識別芯片完成硬件設計; (2) 能實現語音控制開關的開啟和關閉; (3) 系統

24、集成,焊接電路板,調試。1.4.2 設計任務:(1)具有語音控制功能;(2)完成接口電路的設計,完成控制程序的編寫;(3)設計硬件電路,編寫相關軟件、完成電路仿真與樣機調試。2 2 系統方案選擇和論證系統方案選擇和論證2.12.1 設計要求設計要求智能家居作為一個新生產業,目前處于一個導入期與成長期的臨界點,隨著智能家居市場推廣普與的進一步落實,培育起消費者的使用習慣,智能家居市場的消費潛力必然是巨大的,產業前景光明,因此設計一種語音智能開關燈,要求具有語音控制模塊和單片機控制系統,可以實現語音控制,方便了人們的生活,實現了智能家居。2.22.2 方案選擇和論證方案選擇和論證整個智能開關系統電

25、路可分為六大部分:STC11L08XE 單片機、電源、語音識別系統、復位電路、時鐘電路組成。下圖是一個構件圖,它可以用來說明本系統的體系結構。電源復位電路時鐘電路開關電路語音識別芯模塊單片機3 / 63圖 2.1 整體系統框圖 2.2.12.2.1 主控芯片的選擇說明主控芯片的選擇說明 現在市面上單片機的種類比較多,每種單片機都有自己的優缺點,STC 系列單片機是由宏晶科技公司研發的增強型核單片機,相對于傳統的 8051 核單片機,在片資源、性能以與工作速度上都有很大的改善,尤其采用了基于 Flash 的在線系統(ISP)技術,而且,STC11L08XE 可在系統編程,不需要專用的編程器,也不

26、需要專用的仿真,使得單片的應用系統開發變得簡單。還可以選擇使用部 RC 振蕩電路還是外部晶振電路時鐘。掉地模式可由部掉電喚醒也可用定時器喚醒,也可由外部中斷斷口中斷喚醒,因為 INT/RXT 支持下降沿中斷,所以它也支持遠程通信喚醒。2.2.22.2.2 語音芯片的選擇語音芯片的選擇LD3320 是一顆由 ICRouat 公司生產的基于非特定人語音識別(SI-ASR,Speaker Independent Automatic Speech Recognition)技術的語音識別/聲控芯片。該芯片集成了語音處理器和一些外部電路,包括 AD、DA 轉換、麥克風接口、聲音輸出接口等, LD3320

27、芯片是一款“語音識別”專用芯片。它置有非特定語音識別的 DSP 算法,支持動態添加 50 條識別指令,該芯片注重節能和高效因此無需外掛其他輔助器件,單一芯片即可完成語音識別。它只需要一個 MCU 與其并行,寫入識別短語,就可以對其進行語音控制。并且關鍵詞列表是可以任意編輯的所謂的非特定語音輸入指的就是針對不同音色音調的的人,不需要對其進行語音訓練,即使不同年齡不同性別的人,只要說出同一個設定的詞語,它都可以識別。識別準確率高達95%。2.2.32.2.3 繼電器模塊的選擇說明繼電器模塊的選擇說明繼電器是我們生活中常用的一種控制設備,通俗的意義上來說就是開關,在特定的條件下打開或者關閉。繼電器的

28、開關特性在很多的控制系統特別是在離散的控制系統中得到非常廣泛的使用。從其他方面來說,因為一些其他用途設計使用的電子電路,最后多少都可能會和其他機械設備相交互,因此繼電器也可以作為電子設備和機械設備的接口。本設計方案中只要是用單片機來實現對開關的控制,由于語音芯片和單片機的控制電壓都為3.3V,所以觸發電平必須是 3.3V,設計初衷是應用到智能家居這一方面,所以選用交流繼電器,SRS-05VDC-SL 是一款可以任意選擇高電平或低電平觸發的 5V 繼電器。由于繼電器得出發電壓為5V,而語音芯片提供的輸出電壓為 3.3V,所以在輸出端架三極管 NPN 做電壓的放大。可控制交流250V/3A,直流

29、30V/3A,完全可以滿足此次設計任務的要求,故開關模塊就選用 SRS-05VDC-SL 繼電器對開關進行控制。2.32.3 最佳主體方案最佳主體方案 本課題設計語音智能開關采用了以單片機為語音智能控制開關的核心部件件,對語音芯片LD3320 的信息進行處理,并對開關進行控制,通過 LD3320 外界的麥克風采集聲音信號,再通過LD3320 語音芯片進行頻譜分析,在提取語音特征,之后和關鍵詞語列表中的關鍵詞進行對比匹配,最后找出得分最高的關鍵詞作為識別結果輸出給單片機,單片機進行處理后,再輸出信號來控制繼電器,再通過繼電器來控制開關工作,開關又可實現很多對電器的控制,從而實現語音智能控制,整個

30、系統硬件設計合理軟件設計可行,測試可表明,在環境背景的噪聲不是太大,控制者發音不模糊的前提下,語音控制開關的語音語音識別系統能對語音指令做出智能反應,實現了預想中的功能。4 / 633 3 硬件設計與實現硬件設計與實現本系統硬件系統主要由電源語音識別系統,復位電路,單片機,時鐘電路組成。通過麥克風把語音信號收集進來,進行 A/D 轉換,并能對聲音進行識別,控制繼電器輸出實現電器開關功能,通過對聲音指令的識別,來產生控制信號,以控制外繼電器的終端,以此來控制外部開關的動作。3.13.1 單片機電路設計單片機電路設計3.1.23.1.2 部結構部結構STC11L08XE 具有 44 個引腳,其封裝

31、為 LQF44。的部結構如圖 3.1 所示,包含以下幾個方面一個八位微處理器 CPU片數據存儲器 RAM 和特殊功能寄存器 SFR片程序存儲器 ROM兩個定時/計時器 T0,T1,可用作定時器,也可用作對外脈沖進行 四個八位可編程的并行 I/O 端口,每個端口即可做輸入也可作輸出一個串行端口,用做數據的串行通信中斷系統時鐘電路時時鐘鐘電電路路定定時時/ /計計數數器器R RO OM MS SF FR R和和R RA AM MC CP PU U系系統統總總線線并并行行端端口口串串行行端端口口中中斷斷系系統統時時鐘鐘源源T T0 0T T1 1P P0 0 P P1 1P P3 3P P2 2T

32、TX XD DR RX XD DI IN NT T1 1I IN NT T0 0圖 3.1 STC11L08XE 單片機部結構圖3.1.33.1.3 引腳描述引腳描述其引腳功能分別為(1)電源引腳 Vcc 和 GND Vcc 電源端接 +3.3V5 / 63 GND 接 1 (2)時鐘電路引腳 XTAL1 和 XTAL2XTAL1:接外部晶振和微調電容的一端,在片它是振蕩器倒向放大器的入端,若使用外部 TTL 時鐘時,該引腳必須接地。XTAL2:接外部晶振和微調電容的另一端,在片它是振蕩器倒向放大器的出端,若使用外部 TTL 時鐘時,該引腳為外部時鐘的輸入端。(3)復位信號 RST該信號高電平

33、有效,在輸入端保持兩個周期的高電平后,完成復位操作。(4)地址鎖存允許 ALE 系統擴展時,ALE 用于控制地址鎖存器鎖存 P0 口輸出的低 8 位地址,從而實現了 P0 口數據與低位地址的復用(5)最小系統單片機最小系統包括 CPU、供電系統、時鐘系統、復位系統。(6)I/O 口功能STCL1108XE 共有五組 I/O 端口,每組八路,共 40 根 I/O 口線。P0 口。P0 口共 8 根 I/O 口線,分別為:P0.0-P0.7,做一般 I/O 口使用。P1 口。P1 口共 8 根 I/O 口線,分別為:P1.0-P1.7,其中 P1.0,P1.6,P1.7 具有復用功能,具體如表 1

34、 所示。P2 口。P2 口共 8 根 I/O 口線,分別為:P2.0-P2.7,做一般 I/O 口使用。P3 口。P3 口共 8 根 I/O 口線,分別為:P3.0-P3.7,每一位都具有復用功能,具體如表 2 所示。P4 口。P4 口共 8 根 I/O 口線,分別為:P4.0-P4.7,其中 P4.4、P4,7 具有復用功能。具體如表3 所示。表 1 p1 口的復用功能端口引腳復用功能P1.0CLKOUT2:可編程時鐘輸出引腳 2,利用獨立波特率發生器 BRT 的益處作為時鐘輸出P1.6:擴展外部中斷觸發或節電模式的喚醒引腳,可設置INT為外部下降沿中斷,并可在停機、省電模式時,將 MCU喚

35、醒RXD:可設置為串行口的數據接收端,用作第二串口P1.7TDX:可設置為串行口的數據發送,用做第二串口表 3 P3 口的復用功能端口引腳復用功能P4.5ALE:訪問片外數據存儲器的地址鎖存端沖輸出端P4.7RST:片外復位信號輸入端6 / 63表 2 P2 口的復用功能端口引腳復用功能P3.0:擴展外部中斷觸發或節電模式的喚醒引腳,可設置INT為外部下降沿中斷,并可在停機、省電模式時,將 MCU喚醒RXD:可設置為串行口的數據接收端,用作第二串口P3.1TXD:串行口的默認數據發送端P3.2:外部中斷 0 中斷請求輸入端0INTP3.3:外部中斷 1 請求輸入端1INTP3.4CLKOUT0

36、:可編程時鐘輸出引腳 0,利用 T0 的益處作為時鐘的輸出:擴展外部中斷觸發或節電模式的喚醒引腳,可設置INT為外部下降沿中斷,并可在停機、省電模式時將 MCU 喚醒P3.5CLKOUT1:可編程時鐘輸出引腳 1,利用 T1 的益處作為時鐘的輸出:擴展外部中斷觸發或節電模式的喚醒引腳,可設置INT為外部下降沿中斷,并可在停機、省電模式時將 MCU 喚醒P3.6:擴展外數據存儲器的寫擴展端WRP3.7:擴展片外數據存儲器的讀控制端RD3.23.2 語音控制部分語音控制部分3.2.1LD33203.2.1LD3320管腳介紹管腳介紹說明:IO方向: I表示輸入 O表示輸出 AD分類: A表示模擬信

37、號 D表示數字信號7 / 63 表4 LD3320部分管腳說明管腳標號管腳名稱IO 方向AD 方向說明31CLKID時鐘輸入 4-48MHZ34-38P7-P3I/OD并行口連接上拉電阻39P2/SDCKI/OD并行口第 2 位共用 SPI 時鐘,上拉電阻40P1/SDOI/OD并行口第 1 位,公用 SPI 輸出41P0/SDII/OD并行口第 0 位,公用 SPI 輸入42WRB/SPISID寫允許低電平有效,公用 SPI 允許連接上拉電阻43CSB/SCSID并行方式片選信號,公用 SPI 片選信號連接上拉電阻44A0ID地址或數據選擇。在 WRB 有效時,高電平表示 P0-P7 是地址

38、,而低電平表示 P0-P7 是數據45RDBID讀允許低電平有效連接上拉電阻46MDID0:并行工作方式 1:串行工作方式連接上拉電阻47RSTBID復位信號低電平有效連接上拉電阻48INTBOD中斷輸出信號低電平有效連接上拉電阻2-5-根據電路原理圖連接上拉電阻12MBS-A麥克風偏置18VREF-A聲音信號參考電壓8 / 633.2.23.2.2語音識別原理語音識別原理LD3320是一顆基于非特定人語音識別(SI-ASR,Speaker Independent Automatic Speech Recognition)技術的語音識別/聲控芯片。 LD3320 芯片是“語音識別”專用芯片。芯

39、片包括了語音識別處理器和一些外部電路,有ADC、DAC 轉換器、麥克風接口、聲音輸出接口等。LD3320芯片可以不連接任何外部的輔助芯片如Flash、RAM 等,直接集成在自身的產品中就能完成語音識別/聲控/人機對話功能。而且,語音芯片的關鍵詞語列表能夠被隨意的動態改變的的,本文介紹如何編寫程序實現芯片的功能LD3320完成非特定人語音識別,每次識別能設置50項候選句以供識別參考,單字、詞組或短句都可以作為識別的句子,每個是別句的長度應該少于10個漢字或79個字節的拼音串。另外,識別句容是能隨意動態編輯修改的,所以一個系統能完成多種場景。芯用片采用48腳QFN塑料封裝,工作供電固定為3.3V。

40、芯片部電路圖描述如圖3.2所示。芯片的主旨就是是語音識別運算器,加上輸入、輸出、AD/DA轉換等模塊,完成語音識別的功能。LD3320還支持并行和串行接口與其他模塊的連接。 LD3320部集成了快速穩定的優化算法,因此不需要外接Flash和RAM等存儲設備,并且也不需要用戶事先經過語音訓練和錄音來完成非特定的語音識別,所以LD3320的識別率比較高,也比較穩定。MBSVREFMUXADCDACMUXDACMUXClockPLL語音識別運算器并行和串行(SPI)接口輸入電源H HP PO OL LL LO OU UT TL LE EQ Q1 1E EQ Q2 2E EQ Q3 3L LO OU

41、UT TR RV VD DD D V VD DD DI IO OV VD DD DA AP P0 0- -P P7 7控控制制信信號號圖 3.2 LD3320 部電路的邏輯框圖時鐘(Clock)芯片必須連接外部時鐘,可接受的頻率圍是 234MHz,而芯片部還有 PLL 頻率合成器,可產生特定的頻率供部模塊使用。對芯片的復位信號(RSTB*)必須在 VDD/VDDA/VDDIO 都穩定后進行,無論芯片正在進行何種運算,復位信號都可以使它恢復初始狀態,并使各寄存器復位。如果沒有后續的指令(對寄存器的設置),復位后芯片將進入休眠狀態。此后,一個 CSB*信號就可以重新激活芯片進入工作狀態。并行芯片可

42、通過并行方式和外部主 CPU 連接,此時使用 8 根數據線(P0-P7),4 個控制信號(WRB*, RDB*, CS*, A0), 以與一個中斷返回信號(INTB*)。串行接口通過 SPI 協議和外部主 CPU 連接,首先要將 MD 接高電平,而將(SPIS*)接地。此時只使用4 個管腳:片選(SCS*)、SPI 時鐘(SDCK)、SPI 輸入(SDI)和 SPI 輸出(SDO)。 寄存器對芯片的設置和命令,包括傳送數據和接受數據,都是通過對寄存器控制來完成的。例如進行語音識別時,設置識別的關鍵詞語列表,設定芯片的識別模式,識別完成后獲得識別結果都是通過讀/寫寄存器9 / 63來完成。播放聲

43、音時,就是將 MP3 格式的數據循環放入 FIFO 對應的寄存器。(識別結果是通過寄存器返回識別出的關鍵詞語在關鍵詞語列表中的排列序號 Index 數值,該 Index 數值是在設置關鍵詞語列表時指定)喇叭音量的外部控制除了特定寄存器來控制音量以外,芯片外部的電路可以控制喇叭的音量增益。使用的是 EP1、EP2、EP3 對應的管腳。 此次設計的語音識別中,LD3320 與 STC11L08XE 直接相連,而且采用 10K 電阻上拉,A0 用來判斷是數據段還是地址段,控制信號 RDB、WRB、CSB、RSTB 以與中斷返回信號 INTB 與 STC11L08XE 直接相連,為了輔助系統穩定工作,

44、均采用 10K 電阻上拉。LD3320 和 STC11L08XE 采用同一個外部22.1184MHz 時鐘,MBS 作為麥克風偏置,并接一個 RC 電路,以保證輸出一個浮動電壓給麥克風。 LD3320 部語音識別的原理是先通過 MIC 輸入的聲音信號進行頻譜分析,其次提取語音特征,通過以上兩步將得到語音的特征信息,第三步是將關鍵詞列表中的數據與特征信息進行匹配,最終找出得分最高的關鍵詞作為識別結果輸出,具體過程如圖 3.3 所示:MIC頻譜分析特征提取語音識別器關鍵詞列表拼音串MCULD3320芯片圖 3.3 LD3320 語音識別原理圖3.2.3LD33203.2.3LD3320應用電路設計

45、應用電路設計一個微控制器MCU和LD3320組成了LD3320的基本應用電路,電路中的主控芯片單片機,是為了完成對LD3320芯片寄存器的操作。對于LD3320芯片的所有操作,都是通過對寄存器的控制來完成。例如設置標志位、讀取狀態、向FIFO寫入數據、識別完成后獲取識別結果等。比如在編輯關鍵詞的時候,是單片機通過把關鍵詞語的拼音串設置進LD3320有關寄存器來完成關鍵字編輯的。 LD3320的寄存器大概分為這幾類:FIFO數據緩存器、語音識別控制寄存器、音量調節、模擬電路和其他輔助寄存器。寄存器的讀寫方式有兩種方式,即串行SPI方式和標準并行方式。LD3320地址寄存器的地址空間為8位,編號從

46、00H-FFH。 我們將演示程序全部燒錄在MCU置的Flash中,主控MCU直接控制LD3320完成所有語音識別工作。 電源部分主要由21K電阻,10uF電容,瓷電容,和電源指示燈,將5v電源轉換成LD3320需要的3.3V的電壓。音頻的輸入和輸出可以使用駐極體MIC和0.5W的麥克風。語音識別完成后,為了完成對后續電路的驅動,可以利用MCU的串行口與其他模塊進行連接。 MCU的P0端口的8根線和LD3320的并行方式連接,控制線也分別連接,此外還要連接復位信號和中斷信號。對于LD3320來說,復位信號(RSTB)通過單片機發出,不過中斷信號通過LD3320發出,再由的單片機來負責接收。3.3

47、3.3復位電路復位電路10 / 63 在振蕩器工作時,在 RST 引腳上出現多個時鐘周期的高電平使單片機復位。根據設計的的要求,兩種基本形式的復位操作:上電復位和上按鍵與上電復位。上電復位就是在接通電源后自動完成復位操作。如下圖所示電容 C1 和電阻 R1 對電源十 5V 來說構成微分電路。上電后,RST 維持一段高電平時間,因為單片機的等效電阻的影響,圖中電阻 R1 不使用,也可以有上電復位的操作能力,如下圖 3.4 所示。圖 3.4 復位電路 在電源接通后單片機就可以自動復位,而且在單片機運行的時候使用開關控制也可以使單片機復位。常用的是上電或開關復位電路。上電后,由于電容 C2 的充電和

48、反相門的作用,使 RST 持續一段時間的高電平。在單片機正在運行當中時,按下復位鍵 K 然后松開,也可以使 RST 為維持在高電平,因此實現上電與開關復位的操作。根據以往的操作經驗,可以得出這復位電路的電容、電阻的參考值。Cl10uF,R11k C2104本次電路采用的是上電與上電復位。3.43.4 時鐘電路時鐘電路時鐘電路是用來產生單片機工作時所必須的時鐘信號,單片機自身就是一個相當復雜的同步時序電路,為確保工作方式的順利完成,單片機遵循時序執行指令進行工作在單一的時鐘信號的嚴格監控下控制下,時鐘的頻率與單片機的速度和穩定性息息相關。一般有兩種形式的時鐘分別為:部時鐘和外部時鐘。我們系統提供

49、時鐘信號使用的是的是部時鐘,用于構成振蕩器的高增益反向放大器在就在單片機的部,這個放大器的輸入輸出引腳為 XTAL1 和 XTAL2,XTAL1 和 XTAL2 跨接在晶體振蕩器和用于微調的電容,就組成了了一個自激勵振蕩器。電路中的 C1、C2 的選擇在 30PF 左右,但電容太小會影響振蕩的頻率、穩定性和快速性。晶振頻率為 22.1184MHZ,頻率越高單片機的速度就越快,但對存儲器速度要求就高。外部時鐘電路如圖 3.5 所示。 至內部時鐘電路振蕩器石英晶體C1C2XTAL2XTAL1STC1F08XE30PF30PF圖 3.5 STC11L08XE 單片機外部時鐘電路11 / 633.53

50、.5 繼電器電路概述繼電器電路概述繼電器是控制系統中一種重要的原件,它的作用就是按照某種要求接通或斷開控制系統的電路。根據動作的原理不同,繼電器可以分為:電磁式、感應式、電子式、熱效應式、氣動式和電動機式等,最常用的是電磁式繼電器,它是根據吸引線圈中的電流量的大小來動作的。常用的繼電器是有觸點的,觸點有通和斷兩種狀態,狀態的改變由某種信號控制,可以用一個電磁鐵的吸合或斷開控制觸點狀態,這樣就組成一個電磁式繼電器,因此,繼電器就是根據某種物理量的變化來改變其觸點狀態的控制元件。繼電器在控制系統中的作用有兩點: (1)傳遞信號。它用觸電的轉換接通或斷開電路以傳遞控制信號;(2)功率放大。使繼電器動

51、作的功率通常是非常小的,而被其觸點所控制電路的功率要大得多,因此繼電器電路必須有放大功率的作用,從而可以實現對電路的控制。 繼電器分為交流和直流兩種:吸引線圈采用直流控制的直流繼電器;吸引線圈采用交流控制的叫交流繼電器,本次畢業設計采用的是交流繼電器。它實際上是一種可以用低電壓、小電流來控制大電流、高電壓的自動開關。本課題選用的繼電器是 SRS-05VDC-SL 型號的繼電器模塊,SRS-05VDC-SL 型號的繼電器模塊常開口可接最大負載為交流 250V/3A,直流 30V/3A,控制電壓為 5V,具有電源和繼電器動作指示,吸合亮,斷開滅,信號輸入端有信號時,公共端與常開端會導通 。H 為高

52、電平觸發選擇端,即短接 H 處,H_IN 為高電平觸發輸入端,L 為高電平觸發選擇端,即短接 L 處,L_IN 為高電平觸發輸入端,高電平觸發指的是信號輸入端與地之間有電壓的觸發方式,可以理解為信號輸入端與 VCC 正極短路觸發的一種方式,低電平觸發指的是信號輸入端與地之間的電壓為0V 的觸發方式,可以理解為信號輸入端與 GND 負極短路觸發的一種方式.電路如圖3.6 所示 圖 3.6 繼電器電路單片機 P2.3 口與繼電器電路相連,繼電器電路由 1K 電阻,PNP 型三極管,二極管和繼電器組成,三極管在電路中的作用是放大,而放大的極限就是開關,而此處就用到了三極管的開關作用,通過放大單片機

53、P2.3 端口的信號,來控制繼電器吸合或開。二極管起到保護作用,此電路中繼電器控制 220V 電壓,外接一個電燈來顯示繼電器狀態。 3.63.6 電路連接總圖電路連接總圖12 / 634 4 軟件設計軟件設計4.14.1LD3320LD3320 的軟件編程的軟件編程4.1.14.1.1 編程模式編程模式主控 MCU 通過讀/寫 LD3320 的寄存器完成操作。用戶有兩種編程模式:中斷模式和輪詢模式。所謂中斷模式,就是系統的主控 MCU 在接收到外界一個觸發后(比如用戶按動某個按鍵),啟動 LD3320 芯片的一個定時識別過程(比如 5s),要求用戶在這個定時過程中說出要識別的語音關鍵詞語。過了

54、這個過程后,需要用戶再次觸發才能再次啟動一個識別過程。所謂輪詢模式,就是系統13 / 63的主控 MCU 反復啟動識別過程。如果沒有人說話沒有識別結果,則每次識別過程的定時到時后再啟動一個識別過程;如果有識別結果,則根據識別作相應處理后(比如播放某個聲音作為回答)再啟動一個識別過程。在編程時,由于是本次論文是聲控語音識別開關,講究的實用方便。所以,選擇輪詢模式而不是傳統的中斷模式。4.1.2LD33204.1.2LD3320程序流程程序流程如圖4.1所示LD3320的功能是完成有限詞組的非特定人語音的識別的中斷處理,我們將其應用在一個虛擬環境下訓練,訓練中,通常需要下達幾個短口令,但是在我們所

55、設計的訓練環境中,如果口令使用鍵盤或鼠標的方法進行輸入,明顯是不符合畢業設計的要求。因此,我們就用LD3320設計VUI來控制電路,實現語音識別的方式,將獲得的識別結果再轉換成串口信號,輸入計算機,達到語音控制的目的。實踐證明,這種方式可以滿足語音控制的要求,但是語音識別的速度,即實時性還有待改進。語音識別的操作流程(1)語音識別初始化(包括通用初始化),在初始化程序里,主要完成軟復位、模式設定、時鐘頻率設定和FIFO設定。芯片復位是芯片的第47腳(RSTB)發送低電平,然后需對片選CS做一次地至高的操作,以激活部數據處理模塊。(2)寫入識別列表,LD3320語音芯片是基于語音詞庫的語音識別芯

56、片,在這一步中可以將待識別的短語寫入列表中。列表的規定是,每個識別條目對應一個特定的編號(一個字符),不同識別條目的編號可以一樣,但是可以不用連續,不過數值一定不大于于256(00H-FFH)。(3)開始識別,設置若干個相關的寄存器,就可以開始識別,ADC通道即為麥克風輸入通道,ADC增益即為麥克風音量,可以設定為00H-7FH,可以設定的圍設置值為40H-6FH,值如果越大代表MIC音量越大,識別啟動可以很靈敏,不過可能帶來比較多多的錯誤識別。如果值越小代表MIC音量越小,不過需要近距離說話才能啟動語音識別,它的好處就是對于遠處的干擾噪聲不會做出處理。(4)響應中斷,如果麥克風采集到的聲音信

57、號,不管是否識別出正確結果,都會做出一個中斷響應,而中斷響應要根據寄存器的值進行分析,讀取BA寄存器的值可以知道有幾個候選答案值,而C5寄存器里的答案是得分最高,最可能輸出的結果。14 / 63向寄存器寫入ADC增益清空寄存器設置寄存器設置芯片狀態空閑?設置寄存器準備開始識別設置寄存器IC開啟ADC設置寄存器開中斷YN 圖4.1 語音芯片中斷流程圖4.24.2寄存器的操作寄存器的操作本芯片的各種操作,都必須通過寄存器的操作來完成。比如設置標志位、讀取狀態、向FIFO寫入數據等。寄存器讀寫操作有4種方式,即并行方式(軟、硬)和串行SPI方式(軟、硬)。4.2.14.2.1并行方式并行方式 第 4

58、6 腳(MD)接低電平時按照此方式工作。 寫和讀的時序圖如下:15 / 63圖 4.2 并行方式寫時序圖 4.3 并行方式讀時序由時序圖可以看到,A0 用來識別芯片是數據段還是地址段。A0 為高時是地址,如果 A0 為低時是數據。發送地址的時候 CSB*和 WRB*必須有效,同樣的,寫數據是 CSB*和 WRB*也必須有效,而且讀數據時 CSB*和 RDB*也必須有效。 4.2.24.2.2 串行串行 SPISPI 方式方式 第 46 腳(MD)接高電平,且第 42 腿(SPIS*)接地時按照此方式工作。寫和讀的時序圖如下圖 4.4 SPI 方式寫時序在寫的時候首先給 SDI 發送一個“寫”指

59、令(04H),再給 SDI 發送 8 位寄存器地址,然后給SDI 發送 8 位數據。在這個時候,SCS*必須保持在有效(低電平)。在寫的時候要首先 SDI 發送一個“讀”指令(05H),再給 SDI 發送 8 位寄存器地址,然后從SDO 接受 8 位數據。在這期間,SCS*必須保持在有效(低電平)。16 / 63圖 4.5 SPI 方式讀時序4.34.3寄存器功能簡介寄存器功能簡介1.B5寄存器 B5寄存器在檢測完語音數據段以后還會有噪音,連續監測到多長時間的背景噪音才確認是真正的語音結束,通常情況下的默認值是600毫秒,這個設定值也不能太小,否則用戶在中間的小小的停頓也會被判定為錄音結束;2

60、.35寄存器修改麥克風音量的是35寄存器,它的數值一般設定在40H-58H之間,具體數值根據麥克風以與使用的環境來確定,本次程序使用的是43H;值越大代表MIC音量越大,識別啟動越靈敏,但可能帶來更多的誤識別;值越小代表MIC音量越小,但是需要近距離說話才能啟動識別功能,好處是對于外界的干擾沒有反應。3.FIFO寄存器FIFO英文First In First Out 的縮寫,是一種先進先出的數據緩存器,它與普通存儲器的區別是沒有外部讀寫地址線,這樣使用起來就很容易。(*) LD3320芯片部有2個FIFO,分別是: FIFO_EXTFIFO_DATA FIFO_DATA 主數據處理FIFO緩存

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論