信息技術課件語音識別的秘密_第1頁
信息技術課件語音識別的秘密_第2頁
信息技術課件語音識別的秘密_第3頁
信息技術課件語音識別的秘密_第4頁
信息技術課件語音識別的秘密_第5頁
已閱讀5頁,還剩8頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

信息技術課件語音識別的秘密計算機識別聲音的流程聲音采集聲學特征提取聲學模型訓練聲學模型應用圖1:聲音識別的基本流程訓練識別計算機識別聲音的流程聲音采集聲音采集訓練識別特征提取模型訓練特征提取特征比對聲學模型識別聲音計算機識別聲音的流程聲音采集聲學特征提取聲學模型訓練聲學模型應用圖1:聲音識別的基本流程聲音的采集計算機感知聲音主要通過話筒中的傳感器將聲波轉換為電信號01采樣02量化03編碼聲音的數字化

語音的特征又叫聲學特征。聲音主要有三個要素:響度、音調和音色。

頻譜(frequency)可以直觀地反應聲音的三個要素信息,因此計算機理解聲音主要通過頻譜。聲學特征提取什么是聲學特征頻譜幅度頻率優點:1.維數更低,可以粗略刻畫出頻譜的形狀2.表的出聲音的另一個重要特征——共振峰聲學特征提取梅爾頻率倒譜系數(MFCC)

常見的聲學特征包括:基頻、能量、時長、共振峰、梅爾頻譜倒譜系數(MFCC)、廣義梅爾頻譜倒譜系數等。聲學特征提取韻律特征頻譜特征常見的聲學特征聲學模型訓練訓練語料庫提取一句訓練語料特征提取模型訓練中間模型m1m2m3m…模型訓練結束模型庫特征提取文本語音語音特征文本特征圖2:語音識別中模型訓練的過程聲學模型應用圖3:利用模型識別語音的具體過程語音采集特征提取模型匹配輸入待識別的語音輸出結果模型庫聲音識別實例語音輸入法輸入語音語音特征提取模型匹配輸出文字圖5:語音輸入法的工作流程語音識別聲學模型第一,設計一個特征提取器從音樂中提取特征第二,利用特征訓練一個分類器第三,利用分類器根據音樂特征判斷其風格類型梅爾頻率倒譜系數神經網絡聲音識別實例音樂風格識別音樂特征提取器特征分類器風格類型音樂提取特征、特征比對第一,設計一個特征提取器從音樂中提取特征第二,利用特征訓練一個分類器第三,利用分類器根據音樂特征判斷其風格

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論