




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第二章數字音頻技術第二章 數字音頻技術2.1 數字音頻根底2.2 數字音頻緊縮規范2.3 聲卡與電聲設備2.4 MIDI與音樂合成2.5 音頻編輯軟件2.6 語音識別技術本章小結2-3一、聲音的根本概念 聲音是經過一定介質傳播的延續的波。t振幅周期A聲波振幅:音量的大小周期:反復出現的時間間隔頻率:指信號每秒鐘變化的次數重要目的2.1 數字音頻根底2-4 聲音按頻率分類:次聲波可聽聲波超聲波20Hz20kHzf(Hz)語音信號頻率范圍:300Hz-3kHz2.1 數字音頻根底10 20 50 200 3.4k 7k 15k 20kCD-DAFM廣播AM廣播f(Hz)頻帶聲音質量的頻率范圍:2-
2、5 聲音的傳播攜帶了信息,它是人類傳播信息的一種主要媒體。 聲音的三種類型: 波形聲音:包含了一切聲音方式 語音:不僅是波形聲音,而且還有豐富的言語內涵(籠統提取特征意義了解) 音樂:與語音相比,方式更規范。音樂是符號化的聲音。2.1 數字音頻根底2-6二、聲音的數字化 1.聲音信號的類型 模擬信號(自然界、物理) 數字信號(計算機) 2.聲音數字化過程采樣量化編碼模擬信號數字信號模擬信號數字信號A/D ADCD/A DAC2.1 數字音頻根底2-7 3.聲音數字化過程延續的模擬聲音信號聲音信號的采樣離散的音頻信號表示2.1 數字音頻根底2-8 4.聲音數字化三要素采樣頻率量化位數聲道數每秒鐘
3、抽取聲波幅度樣本的次數每個采樣點用多少二進制位表示數據范圍使用聲音通道的個數采樣頻率越高聲音質量越好數據量也越大量化位數越多音質越好數據量也越大立體聲比單聲道的表現力豐富,但數據量翻倍11.025kHz22.05 kHz44.1 kHz 8位25616位65536單聲道立體聲2.1 數字音頻根底2-9 5.聲音數字化的數據量 音頻數據量采樣頻率量化位數 聲道數/8(字節/秒)采樣頻率(kHz)量化位數(bit)數據量(KB/s)單聲道立體聲11.025810.7721.531621.5343.0722.05821.5343.071643.0786.1344.1843.0786.131686.1
4、3172.272.1 數字音頻根底2-10三、音頻的文件格式 1.WAV文件 WAV是Microsoft/IBM共同開發的PC波形文件。因未經緊縮,文件數據量很大。 特點:聲音層次豐富,復原音質好2.1 數字音頻根底 2.MP3文件 MP3(MPEG Audio layer3)是一種按MPEG規范的音頻緊縮技術制造的音頻文件。 特點:高緊縮比(11:1),優美音質2-11 3.RA文件 RA(RealAudio,即時播音系統新型流式音頻,RA、RM、RMX。 特點:在低速的廣域網上實時傳輸音頻 4. WMA文件 WMA(Windows Media Audio)是Windows Media格式中
5、的一個子集(音頻格式)。 特點:緊縮到MP3一半2.1 數字音頻根底2-12 5. MIDI和RMI文件 MIDI(樂器數字接口)是由一組音樂、樂譜或樂器符號的數字集合。 特點:播放效果與硬件相關,數據量很小,音質不高、音色單調等 6.VOC文件 創新公司開發的聲音文件格式,由文件頭塊和音頻數據塊組成。 2.1 數字音頻根底2-13四、音頻的采集與處置 1.聲音的采集錄音軟件專業錄音棚唱盤活錄音帶轉錄數字音頻庫2.1 數字音頻根底 2.聲音的處置 剪接、降噪、平衡、效果、動態處置、格式轉換。2-142.2 數字音頻緊縮規范一、音頻緊縮方法概述編碼器傳輸/存儲解碼器輸入音頻信號輸出音頻信號緊縮編
6、碼技術是指用某種方法使數字化信息的編碼率降低的技術 音頻信號能緊縮的根本根據:聲音信號中存在大量的冗余度;人的聽覺具有強音抑制弱音的景象;低頻段敏感、高頻段不敏感。 2-15 音頻信號緊縮編碼的分類: 無損緊縮(熵編碼) 霍夫曼編碼、算術編碼、行程編碼 有損緊縮 波形編碼-PCM、DPCM、ADPCM 子帶編碼、矢量量化 參數編碼-LPC 混合編碼-MPLPC、CELP2.2 數字音頻緊縮規范2-162.2 數字音頻緊縮規范二、音頻緊縮技術規范分類標準說明電話語音質量G.711采樣8kHz,量化8bit,碼率64kbpsG.721采用ADPCM編碼,碼率32kbpsG.723采用ADPCM有損
7、壓縮,碼率24kbpsG.728采用LD-CELP壓縮技術,碼率16kbps調幅廣播質量G.722采樣16kHz,量化14bit,碼率224(64)kbps高保真立體聲MPEG音頻采樣44.1kHz,量化16bit,碼率705kbps (MPEG三個壓縮層次,384-64kbps)2-172.2 數字音頻緊縮規范三、音頻緊縮工具 音頻文件轉換:Audio Converter、另存為 MP3緊縮工具:MP3Resizer2-182.3 聲卡與音箱一、聲卡(聲音卡、音頻卡) 1.聲卡的主要功能 聲卡是擔任錄音、播音和聲音合成的一種多媒體板卡。其功能包括:錄制、編輯和回放數字音頻文件控制和混合各聲源
8、的音量記錄和回放時進展緊縮和解緊縮語音合成技術(朗誦文本)語音識別技術具有MIDI接口(樂器數字接口)2-19 2.聲卡的組成原理線性輸出總線接口芯片數字音頻處置芯片音樂合成器A/D和D/AMIDI接口混音器CD接口計算機總線話筒輸入線性輸入揚聲器輸出A/D數據處置D/A聲波喇叭2.3 聲卡與音箱2-20 3.聲卡的性能目的 采樣和量化才干 衡量音響器材音質好壞。 采樣頻率:11.025kHz (語音效果) 22.05 kHz (音樂效果) 44.1 kHz (高保真效果) 量化等級: 8位/256級 (語音質量) 16位/65536級(高保真質量)2.3 聲卡與音箱2-21 芯片類型 COD
9、EC芯片(依賴CPU,價錢廉價) 數字信號處置器DSP(不依賴CPU) 總線類型 ISA總線、PCI總線、USB接口 輸出聲道數 2聲道(立體聲)、2.1/4.1/5.1聲道 多通道聲卡(營造杜比環繞立體聲)2.3 聲卡與音箱2-22 4.聲卡的外部接口2.3 聲卡與音箱2-232.3 聲卡與音箱線性輸入接口Line In用來連接外部音頻設備以便進行錄音,如錄音機、CD唱機和音響等話筒輸入接口Mic In用來連接話筒,直接輸入現場的聲音信號線性輸出接口Line Out用來連接外部音頻設備的輸入口,也可連接大功率有源音響等揚聲器輸入接口/Spk Out用來連接揚聲器,從聲卡的內置功率放大器向揚聲
10、器輸出聲音游戲桿MIDI接口用來連接游戲桿或MIDI設備。CD音頻連接器用來連接CD-ROM驅動器,可以直接播放CD音樂,而不占用CPU時間2-24二、電聲設備 1.傳聲器 傳聲器是一種將聲信號轉換成相應電信號的能量轉換器件話筒、麥克風。 傳聲器的分類: 換能原理、聲學原理、指向性、用途、運用方式、有線無線2.3 聲卡與音箱2.3 聲卡與音箱傳聲器的任務原理:聲 能1電動式傳聲器,包括動圈式傳聲器和帶式傳聲器兩種,電磁換能原理。優點:簡一方便、無需放大器、性能穩定、價錢低廉2電容式傳聲器,振膜震動引起電容量變化實現換能。優點:靈敏度高、動態范圍大、瞬態特性好、失真度低缺陷:振膜受潮會導致變形2
11、.3 聲卡與音箱3駐極體式傳聲器,利用駐極體資料制造的電容傳聲器。優點:簡單、體積小、耐振動、價錢低4無線傳聲器,聲音信號轉變為電信號,構成超高頻信號。無線傳聲器不是指傳聲器的構造原理,而是指信號的傳輸方法。優點:可隨身攜帶、無需電纜缺陷:時遠時近,影響拾音效果2.3 聲卡與音箱傳聲器的性能目的:1靈敏度,傳聲器的聲電轉換效率。動圈式:-60-70dB;電容式:-40-50dB2頻率呼應,輸出電平與頻率的關系。3指向性,某頻率下聲波入射方向對應靈敏度的變化特性。4輸出阻抗,兩根輸出線之間在1kHZ時的阻抗。5動態閾,規定諧波失真條件下,傳聲器接受最大壓級與安靜時等效噪聲級之差。2-28 2.揚
12、聲器 將電信號轉換成聲音信號的電聲器件。1磁路系統,磁鐵、導磁板、心柱2振動系統,紙盆、音圈3輔助系統,紙架、鐵架、防塵蓋 電流音圈磁力振動 紙盆振動聲音2.3 聲卡與音箱2.3 聲卡與音箱揚聲器的分類:1按任務原理分類,電動式、電磁式、靜電式、壓電式等。2按放聲頻率分類,低音、中音、高音、全頻帶等。性能目的:輸出功率、頻率特性、信噪比、諧波失真、靈敏度和額定阻抗。2-30 3.音箱 音箱是一種電聲轉換的發音設備。將高、中、低音揚聲器組裝在專門設計的箱體內,經過分頻網絡將高、中、低頻信號分別送至相應的揚聲器進展重放。2.3 聲卡與音箱音箱是揚聲器系統2-31音箱的分類:運用場所:家用音箱、公用
13、音箱功率放大器:有源音箱、無源音箱聲道:2.0雙聲道立體聲 2.1雙聲道超重低音聲道 4.1/5.1/7.1 5.1五聲道超重低音聲道2.3 聲卡與音箱2-32 音箱的性能目的: 1輸出功率:額定、最大峰值。 2頻率范圍:指音箱最低有效回放頻率和最高有效回放頻率之間的范圍。 3信噪比:音箱回放的有效信號與噪聲信號的比值。信噪比較低時,噪聲嚴重。信噪比70-80dB普通音箱信噪比80-90dB高檔音箱信噪比95dB 專業音箱2.3 聲卡與音箱2.3 聲卡與音箱4失真度:諧波失真、互調失真、瞬態失真。其中,瞬態失真直接影響到音質音色復原程度。5靈敏度:指音箱產生全功率輸出時的輸入信號。輸入信號越低
14、,靈敏度越高,性能越好6阻抗:揚聲器輸入信號的電壓與電流比值。高阻抗、低阻抗。2-342.4 MIDI與音樂合成一、MIDI技術概述 1.什么是MIDI MIDI(Musical Instrument Digital Interface,樂器數字接口)是一種利用合成器產生的音樂技術。 采用數字信號處置技術合成的音效: 模擬鋼琴、小提琴、吉他等音色 超越時空的太空音樂2-35 2.MIDI規范 MIDI是各種電子音樂設備之間以及與計算機之間交換信息的國際規范。 MIDI硬件規范:硬件接口規范和信號傳輸機制(I/O通道、銜接電纜和插座方式)。 MIDI軟件規范:音樂信息數字化編碼方式(音符、音符長
15、短、音調和音量等)。原聲鋼琴8分音符的C3音:00 00 60音色Piano編號 音符C3編號 8分音符編號2.4 MIDI與音樂合成2-36二、MIDI合成方式 1.調頻合成法-FM 原理:MIDI合成器接納到MIDI音樂信息后,利用傅立葉級數原理將其分解為假設干個不同頻率的正弦波,然后生成MIDI音樂信息中指定樂器的各個正弦波分量,最后將這些分量合成起來送至揚聲器播放。 特點:系統開銷小,聲音洪亮 聲音音色少,音質較差2.4 MIDI與音樂合成2-37 2.波形表合成法-WT 原理:在MIDI合成器的ROM中預先存放各種實踐樂器的聲音樣本,在進展音樂合成時以查表的方式調用這些樣本,使其與M
16、IDI音樂信息的要求完全相配,然后合成器將這些分段合成的樣本送至揚聲器播放。 特點:音樂真實感強,音色自然 硬波形表,軟波形表。2.4 MIDI與音樂合成2-38三、MIDI的任務過程MIDI輸入設備MIDI接口MIDI文件音序器合成器揚聲器音頻卡PC機 音序器是MIDI音樂創作的中心控制部件。2.4 MIDI與音樂合成2-39四、音樂制造系統 1.根本設備 音源:聲卡(模擬樂器發聲的設備) 音序器:硬件音序器、軟件音序器 Cakewalk, Logic Audio 輸入設備:電子琴(MIDI In,MIDI Out) MIDI鍵盤(省去音源) Cakewalk虛擬鍵盤2.4 MIDI與音樂合
17、成2-40 2.音樂軟件分類 音序軟件:Cakewalk、MusicatorWin3、Logic Audio、Cubase VST 樂譜打印軟件:MIDI Scan、Encore 音樂教育軟件:Earnaster、Tonica 音頻編輯軟件:Cool Edit、Audition、Sound Forge、wavelab 效果器軟件:TC Native、VST2.4 MIDI與音樂合成2-412.6 語音識別技術 語音識別:利用計算機自動識別語音的技術。如將語音轉換成其所對應的文字,利用語音信號中所包含的特定人的信息進展說話人身份識別的說話人識別技術。一、語音識別的開展歷史 1952:Bell實驗
18、室研制出可識別10個英文數字的語音識別器(Audry系統)。 1988:卡內基梅隆大學研制SPHINX識別系統(非特定人、大詞匯量、延續語音)。2-42二、語音識別根本原理 語音識別本質上是一種方式識別過程,主要包括語音信號預處置、特征提取、特征建模(建立參考方式庫)、類似性度量(方式匹配)和后處置等幾個功能模塊。2.6 語音識別技術2-43三、語音識別系統的分類 1.根據詞匯量大小 小詞匯量:100詞 中詞匯量:100-1000詞 大詞匯量:1000詞以上 2.根據對說話人依賴程度 特定人:針對某個用戶進展識別任務 非特定人:針對任何人進展識別任務 限定人:針對特定一組人進展識別任務 2.6
19、 語音識別技術2-44 3.根據對說話人說話方式 孤立詞識別:每次只含詞匯表中的一個詞條,如一個詞、一個詞組或一條命令。 銜接詞識別:每次說詞匯表中假設干個詞條來進展識別,該假設干詞條以慢速延續的方式延續說出,普通指十個數字銜接而成的多位數字的識別。 延續語音識別:指說話人以日常自然的方式講述并進展識別。2.6 語音識別技術2-45四、語音識別軟件 中文聽寫 語音識別軟件 語音命令 語音合成 IBM ViaVoice 8.0中文語音識別系統2.6 語音識別技術2-46五、文本-語音轉換技術基于聲音合成技術的聲音產生技術。能將計算機內的文本轉換成延續自然的言語流。包含兩種類型:1有效詞匯的計算機
20、語音輸出。 用于語音報時、汽車報站2基于語音合成技術的文本-語音轉換器TTS。 包括對言語的了解和語音的聲韻處置 2.6 語音識別技術2-472.5 音頻處置軟件專業音樂軟件音樂編曲軟件(音序器)合成器軟件Cakewalk 1.0-9.0Sonar 1.0-4.xCubase VSI 5.xCubase SX 2.1Logic Audio(PC版、Apple版)(MIDI/音頻/合成器一體化)錄音、混音、音頻編輯軟件CoolEdit (Syntrillium)Audition (Adobe)GoldWare (GoldWare Inc.)效果器軟件效果器插件Waves Native Gold
21、Bundle(20以上)TC Native Bundle(4)Ultrafunk Sonltus fx(7)2-48一、Audition概述 1.Audition的開展歷史1997年 syntrillium公司 Cool Edit pro1.0、 1999年(1.2)、2002年2.0 2003年 Adobe公司 Audition 1.0、 2004年(1.5)、 2006年(2.0)、2007(3.0) 2.Audition的主要功能 Adobe Audition 3.0是集聲音錄制、音頻混合和編輯于一體的數字音頻處置軟件。2.5 音頻處置軟件主要功能:錄音、混音、音頻編輯、效果處置、降噪、
22、音頻緊縮、刻錄音樂CD等2-49 3.Audition的啟動和退出 開場/程序/Adobe Audition、圖標、啟動欄 4.Audition的窗口組成2.5 音頻處置軟件2.5 音頻處置軟件1標題欄:顯示運用程序稱號和正在處置的音頻文件名;2菜單欄:完成對音頻文件的讀取、修正、存儲和軟件設置等;3工具欄:編輯視圖:多軌視圖:CD視圖:任務區:2.5 音頻處置軟件4“文件和“效果列表框:5波形顯示區:顯示音頻文件的波形6控制面板:2.5 音頻處置軟件7“電平指示條:當前音頻電平大小8形狀欄:形狀信息。5.編輯視圖和多軌視圖編輯視圖:編輯獨立的音頻文件。多軌視圖:混合多軌文件或混合MIDI音樂及視頻。采用破壞性編輯方法采用非破壞性編輯方法2-53二、音頻的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 睡眠質量提升與養生保健技巧考核試卷
- 燈具國際貿易風險與應對策略考核試卷
- 鋅錳電池的電極材料在長期儲存中的性能保持考核試卷
- 銀發族養生保健特殊關注考核試卷
- 貓狗常見疾病防治指南
- 冬季小學生疾病預防指南
- 食源性疾病主動監測體系構建與應用
- Orchinol-生命科學試劑-MCE
- 超神數學-高考數學總復習拔高篇(二輪)專題19平面向量中的取值范圍問題(含答案或解析)
- 2025年流媒體平臺競爭格局下的內容創新實踐與案例分析
- 揭陽惠來縣紀委監委等部門屬下事業單位招聘筆試真題2024
- 黨課課件含講稿:以作風建設新成效激發干事創業新作為
- 2025全國農業(水產)行業職業技能大賽(水生物病害防治員)選拔賽試題庫(含答案)
- GA 1812.2-2024銀行系統反恐怖防范要求第2部分:數據中心
- 猩紅熱課件完整版本
- 2024《整治形式主義為基層減負若干規定》全文課件
- 環境法學案例分析題
- 《心理健康與職業生涯》期末考試題庫含答案
- 浙教版科學(全6冊)知識點匯總
- 農產品農業公司財務管理制度
- 修理廠汛期安全應急預案
評論
0/150
提交評論