《音頻信息處理技術》_第1頁
《音頻信息處理技術》_第2頁
《音頻信息處理技術》_第3頁
《音頻信息處理技術》_第4頁
《音頻信息處理技術》_第5頁
已閱讀5頁,還剩63頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.zg- http:/ http:/www.skf- http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 本章導讀 音頻信息處理

2、技術是多媒體信息處理的主要技術之一,音頻信息處理技術是多媒體信息處理的主要技術之一,它使計算機具備了錄音、聲音編輯、語音合成、聲音播放它使計算機具備了錄音、聲音編輯、語音合成、聲音播放等功能。在等功能。在MPC中,可以通過聲音傳遞信息、制造效果、中,可以通過聲音傳遞信息、制造效果、營造氣氛及演奏音樂等。目前的音頻信息處理技術主要包營造氣氛及演奏音樂等。目前的音頻信息處理技術主要包括模擬聲音信號的數字化、數據壓縮編碼、數字音效處理、括模擬聲音信號的數字化、數據壓縮編碼、數字音效處理、音頻文件存儲、傳輸、播放等內容。音頻文件存儲、傳輸、播放等內容。本章主要介紹聲音信本章主要介紹聲音信號及其數字化的

3、基本概念、音頻卡的組成及其工作原理、號及其數字化的基本概念、音頻卡的組成及其工作原理、數字音頻的采集與編輯、數字音頻的采集與編輯、MIDI音樂以及幾個常用的音頻處音樂以及幾個常用的音頻處理軟件等內容,理軟件等內容,并以并以Adobe Audition3.0版本為例,詳細版本為例,詳細介紹音頻信息編輯處理的具體方法。介紹音頻信息編輯處理的具體方法。http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.zg- http:/ http:/www.skf-

4、 http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 本章主要內容本章主要內容4.1 4.1 音頻基礎知識音頻基礎知識 4.2 4.2 音質標準與評價音質標準與評價4.3 4.3 音頻的數字化與編碼音頻的數字化與編碼4.4 4.4 音頻卡音頻卡4.5 4.5 數字音頻的采集與編輯數字音頻的采集與編輯4.6 MIDI4.6 MI

5、DI音樂音樂4.1 4.1 音頻基礎知識音頻基礎知識4.1.1 4.1.1 聲音的物理特征聲音的物理特征 聲音聲音是由物體振動產生的,并以是由物體振動產生的,并以聲波形式聲波形式通過介質(如通過介質(如空氣、水、金屬等)傳播。物理上,聲音可以用空氣、水、金屬等)傳播。物理上,聲音可以用一條連續曲一條連續曲線線來表示,來表示,, ,如圖如圖4-1 4-1 。物體振動的最大位移稱為。物體振動的最大位移稱為振幅振幅A A,聲,聲波中兩個連續波峰(或波谷)之間的距離稱為波中兩個連續波峰(或波谷)之間的距離稱為周期周期T T,周期,周期的倒數的倒數1/T1/T即為即為頻率頻率f f,以,以赫茲(赫茲(H

6、zHz)為單位,頻率為單位,頻率反映了單位時間(反映了單位時間(1 1秒)物秒)物體振動的次數。體振動的次數。圖圖4-1 4-1 聲波的振幅與頻率聲波的振幅與頻率TAt0 聲音按頻率可分為三類:聲音按頻率可分為三類:音頻、次聲、超聲音頻、次聲、超聲 l 低于低于20Hz20Hz的聲音稱為次聲的聲音稱為次聲l 頻率范圍在頻率范圍在20Hz20Hz20kHz20kHz范范圍的可聽聲音稱為音頻,圍的可聽聲音稱為音頻, 其中人說話發出的語音信號的其中人說話發出的語音信號的頻率范圍是頻率范圍是300Hz300Hz3kHz3kHzl 頻率高于頻率高于20kHz20kHz的稱為超音的稱為超音頻(或超聲)頻(

7、或超聲)15 20 300 3k 20k 50k f(Hz)音頻信號音頻信號語音信號語音信號超聲信號超聲信號次聲信號次聲信號圖圖4-2 4-2 不同聲音信號的頻率范圍不同聲音信號的頻率范圍 可聽的音頻聲音又可分為可聽的音頻聲音又可分為語音、樂音、效果音、合語音、樂音、效果音、合成音、噪音(聲)成音、噪音(聲)等五種。等五種。 4.1.2 4.1.2 音頻三要素音頻三要素 音頻有三個主要屬性,分別是音頻有三個主要屬性,分別是音調、音強音調、音強和和音色音色,它們,它們既反映了音頻信號的基本特征,也是人感受聲音信號的三個既反映了音頻信號的基本特征,也是人感受聲音信號的三個主要因素,因此又被稱為音頻

8、三要素。主要因素,因此又被稱為音頻三要素。 音調音調:又稱音高,反映聲音的高低程度,由聲音信號的:又稱音高,反映聲音的高低程度,由聲音信號的頻率大小所決定。頻率越大,音調越高;頻率越小,音調越頻率大小所決定。頻率越大,音調越高;頻率越小,音調越低。低。 音強音強:又稱響度,反映聲音的大小或強弱,由振幅和聲:又稱響度,反映聲音的大小或強弱,由振幅和聲源距離共同決定。振幅越大,距離越小,音強(響度)越大。源距離共同決定。振幅越大,距離越小,音強(響度)越大。 音色音色:又稱音質,反映聲音的品質,它由振動物體(聲:又稱音質,反映聲音的品質,它由振動物體(聲源)的材料、結構、狀態等自身因素決定,表現為

9、聲源的頻源)的材料、結構、狀態等自身因素決定,表現為聲源的頻帶寬度。帶寬度。4.1.3 4.1.3 數字音頻的三種形式數字音頻的三種形式 音頻(音頻(AudioAudio)是指頻率在)是指頻率在20Hz20Hz20kHz20kHz范圍內的可聽聲范圍內的可聽聲音,是多媒體信息中的一種媒體類型音,是多媒體信息中的一種媒體類型聽覺類媒體。聽覺類媒體。 目前多媒體計算機中的音頻主要有目前多媒體計算機中的音頻主要有波形音頻、波形音頻、CDCD音頻和音頻和MIDIMIDI音樂音樂3 3種形式。種形式。1 1、波形音頻:、波形音頻: 是由外部聲音源通過數字化過程采集到多媒體計算機中是由外部聲音源通過數字化過

10、程采集到多媒體計算機中的所有聲音形式??赏ㄟ^編輯(裁剪、合成、效果等)、編的所有聲音形式??赏ㄟ^編輯(裁剪、合成、效果等)、編碼壓縮、存儲、傳輸以及還原播放等方式進行處理。在波形碼壓縮、存儲、傳輸以及還原播放等方式進行處理。在波形音頻中,有一類特殊的聲音需要特別提到,即人的語音。語音頻中,有一類特殊的聲音需要特別提到,即人的語音。語音是波形聲音中人的說話聲音,具有內在的語言學、語音學音是波形聲音中人的說話聲音,具有內在的語言學、語音學的內涵。的內涵。2 2、CDCD音頻音頻 CD-CD-音頻(音頻(CD-AudioCD-Audio)是存儲在音樂)是存儲在音樂CDCD光盤中的數字音光盤中的數字音

11、頻,可以通過頻,可以通過CD-ROMCD-ROM驅動器讀取并采集到多媒體計算機系驅動器讀取并采集到多媒體計算機系統中,并以波形音頻的相應形式存儲、傳輸和處理。統中,并以波形音頻的相應形式存儲、傳輸和處理。3 3、MIDIMIDI音樂音樂 也稱也稱MIDIMIDI音頻。它將音樂符號化并保存在音頻。它將音樂符號化并保存在MIDIMIDI文件中,文件中,并通過音樂合成器產生相應的聲音波形來還原播放。并通過音樂合成器產生相應的聲音波形來還原播放。 音頻是時間的函數,具有很強的前后相關性,所以實音頻是時間的函數,具有很強的前后相關性,所以實時性是音頻處理的基本要求。時性是音頻處理的基本要求。4.1.4

12、4.1.4 數字音頻的文件格式數字音頻的文件格式音頻文件通常分為兩大類:音頻文件通常分為兩大類:聲音文件聲音文件 和和 MIDIMIDI文件文件下表介紹幾種常用的音頻文件格式及后綴名:下表介紹幾種常用的音頻文件格式及后綴名:序號序號音頻文件名稱音頻文件名稱后綴名后綴名1 1WaveWave文件文件 .WAV .WAV 2 2AIFFAIFF文件文件 .AIF/.AIFF .AIF/.AIFF 3 3AudioAudio文件文件 .AU .AU 4 4 Sound Sound文件文件 .SND .SND 5 5VoiceVoice文件文件 .VOC .VOC 6 6 Mpeg Mpeg音頻文件音

13、頻文件 .MP1/.MP2/.MP3 .MP1/.MP2/.MP3 7 7RealAudioRealAudio文件文件 .RA/.RM/.RAM .RA/.RM/.RAM 8 8Windows Media AudioWindows Media Audio文件文件 .WMA/.ASF/.ASX/.WAX .WMA/.ASF/.ASX/.WAX 9 9MIDIMIDI文件文件 .MID/.RMI/.CMI/.CMF .MID/.RMI/.CMI/.CMF 1010ModuleModule文件文件 .MOD/.S3M/.XM/.MTM/.FAR/.KAR/ .MOD/.S3M/.XM/.MTM/.F

14、AR/.KAR/ 4.1.5 4.1.5 音頻處理工具軟件簡介音頻處理工具軟件簡介 音頻工具軟件在內容上主要指處理數字音頻和音頻工具軟件在內容上主要指處理數字音頻和MIDIMIDI樂譜樂譜的各種工具軟件,在功能上包括的各種工具軟件,在功能上包括音頻采集、編輯、合成、編音頻采集、編輯、合成、編碼壓縮以及碼壓縮以及MIDIMIDI樂譜的創作、編輯、發布等環節樂譜的創作、編輯、發布等環節。 按照音頻處理的基本過程,通??砂岩纛l工具軟件分為:按照音頻處理的基本過程,通??砂岩纛l工具軟件分為: 1 1、MIDIMIDI制作軟件制作軟件 2 2、音頻處理軟件、音頻處理軟件 3 3、音頻壓縮軟件、音頻壓縮軟

15、件 4 4、音樂、音樂CDCD刻錄軟件刻錄軟件4.2 4.2 音質標準與評價音質標準與評價4.2.1 4.2.1 音質等級標準音質等級標準 音質音質是指音頻信號經傳輸、處理后所再現的聲音質量是指音頻信號經傳輸、處理后所再現的聲音質量(保真度)。(保真度)。等級等級頻率范圍頻率范圍音質音質高端高端DVDDVD0 048kHz48kHz頂級頂級標準標準DVDDVD0 024kHz24kHzCD-DACD-DA音質音質10Hz10Hz20kHz20kHz高高FMFM廣播音質廣播音質20Hz20Hz15kHz15kHz較高較高AMAM廣播音質廣播音質50Hz50Hz7kHz7kHz中中電話音質電話音質

16、200Hz200Hz3.4kHz3.4kHz低低4.2.2 4.2.2 音質客觀評價音質客觀評價 客觀評價客觀評價是指通過檢測儀器測量音頻信號的技術指標來進是指通過檢測儀器測量音頻信號的技術指標來進行聲音質量評價,主要技術指標有:頻帶寬度、動態范圍和信行聲音質量評價,主要技術指標有:頻帶寬度、動態范圍和信噪比等。噪比等。 理論上,理論上,聲音信號是由許多頻率不同的分量信號組合而聲音信號是由許多頻率不同的分量信號組合而成的復合信號,因此,聲音的頻帶寬度特指復合聲音信號的成的復合信號,因此,聲音的頻帶寬度特指復合聲音信號的頻率范圍,范圍越大,頻帶越寬,可包含的音頻信號(諧波)頻率范圍,范圍越大,頻

17、帶越寬,可包含的音頻信號(諧波)越豐富,因而聲音質量就越高。越豐富,因而聲音質量就越高。 實際上實際上,再現聲音(特別是樂音)的質量與所用的播放,再現聲音(特別是樂音)的質量與所用的播放設備和場地條件有關。高質量的音頻信號要通過高品質的音設備和場地條件有關。高質量的音頻信號要通過高品質的音響設備在較好的音響環境中,才能再現出高質量的音響效果。響設備在較好的音響環境中,才能再現出高質量的音響效果。對于音響設備而言,主要關注對于音響設備而言,主要關注失真度、頻響、瞬態響應、信失真度、頻響、瞬態響應、信噪比、聲道分離度、聲道平衡度噪比、聲道分離度、聲道平衡度等指標。等指標。 4.2.3 4.2.3

18、音質主觀評價音質主觀評價 主觀評價是指通過人聆聽各種聲音而產生的好惡感覺來進主觀評價是指通過人聆聽各種聲音而產生的好惡感覺來進行聲音質量評價。行聲音質量評價。 1 1、語音質量評價方法、語音質量評價方法 常用的主觀評價方法有:常用的主觀評價方法有:平均主觀分法,失真平均主觀分平均主觀分法,失真平均主觀分法,判斷滿意度測量法法,判斷滿意度測量法等。等。 ITU-TP800ITU-TP800標準中定義的標準中定義的MOSMOS,它將語音質量分為,它將語音質量分為5 5級,如級,如表所示:表所示:等級等級音質音質主觀感覺主觀感覺5 5優優未察覺失真未察覺失真4 4良良剛察覺失真,但不討厭剛察覺失真,

19、但不討厭3 3中中察覺失真,稍微討厭察覺失真,稍微討厭2 2差差討厭,但不令人反感討厭,但不令人反感1 1劣劣極其討厭,令人反感極其討厭,令人反感 2 2、樂音質量評價、樂音質量評價 樂音音質的優劣取決于多種因素,如樂音音質的優劣取決于多種因素,如聲源特性、音響器聲源特性、音響器材的信號特性、聲場特性、聽覺特性材的信號特性、聲場特性、聽覺特性等。因此,對音響設等。因此,對音響設備再現的樂音音質的準確評價難度較大。備再現的樂音音質的準確評價難度較大。 主觀評價樂音音質,一般是通過再現樂音的響度、音調主觀評價樂音音質,一般是通過再現樂音的響度、音調和音色的變化及其組合來評價音質的,和音色的變化及其

20、組合來評價音質的, 幾種典型的聽感:幾種典型的聽感:定位感定位感 ,空間感,空間感 ,層次感,層次感 ,厚度,厚度感感 ,立體感,立體感 。除此之外,還有力度感、亮度感、臨場感、。除此之外,還有力度感、亮度感、臨場感、軟硬感、松緊感、寬窄感等許多評價音質的聽感。軟硬感、松緊感、寬窄感等許多評價音質的聽感。 4.3 4.3 音頻的數字化與編碼音頻的數字化與編碼 計算機在處理音頻信號之前,計算機在處理音頻信號之前,必須將模擬的聲音信號數字化,必須將模擬的聲音信號數字化,形成數字音頻。具體過程包括:形成數字音頻。具體過程包括:采樣、量化、編碼采樣、量化、編碼。4.3.1 4.3.1 采樣與采樣頻率采

21、樣與采樣頻率 采樣是每間隔一段時間讀采樣是每間隔一段時間讀取一次聲音信號幅度,使聲音取一次聲音信號幅度,使聲音信號在時間上被離散化,如圖信號在時間上被離散化,如圖4-24-2所示。采樣的主要參數是所示。采樣的主要參數是采樣頻率采樣頻率 。 采樣頻率采樣頻率:是指將模擬聲音波形數字化時,每秒鐘所抽:是指將模擬聲音波形數字化時,每秒鐘所抽取聲波幅度樣本的次數,其計算單位是取聲波幅度樣本的次數,其計算單位是kHz(kHz(千赫茲千赫茲) )。如圖。如圖4-34-3是模擬聲音信號數字化時的采樣圖示。是模擬聲音信號數字化時的采樣圖示。 一般來講,采樣頻率一般來講,采樣頻率越高聲音失真越小,用于越高聲音失

22、真越小,用于存儲數字音頻的數據量也存儲數字音頻的數據量也越大。越大。 采樣頻率的高低是根采樣頻率的高低是根據據聲音信號本身的最高頻聲音信號本身的最高頻率和采樣定理率和采樣定理決定的。決定的。圖圖4-3 4-3 聲音信號采樣聲音信號采樣 采樣定理采樣定理:在進行模擬:在進行模擬/ /數字信號的轉換過程中,當采數字信號的轉換過程中,當采樣頻率樣頻率f fs s大于信號中最高頻率大于信號中最高頻率f fmaxmax的的2 2倍時,即倍時,即f fs s=2f=2fmaxmax,采,采樣之后的數字信號完整地保留了原始信號中的信息。采樣定樣之后的數字信號完整地保留了原始信號中的信息。采樣定理又叫奈奎斯特

23、定理(理又叫奈奎斯特定理(Nyquist theoryNyquist theory)。)。表表4-4 4-4 不同音質數字音頻的常用采樣率不同音質數字音頻的常用采樣率采樣率采樣率音質音質頻率范圍頻率范圍8,000 Hz8,000 Hz電話電話0 04,000 Hz4,000 Hz11,025 Hz11,025 Hz低于低于AMAM廣播廣播0 05,512 Hz5,512 Hz22,050 Hz22,050 Hz接近接近FMFM廣播廣播0 011,025 Hz11,025 Hz32,000 Hz32,000 Hz優于優于FMFM廣播廣播0 016,000 Hz16,000 Hz44,100 Hz

24、44,100 HzCD-DACD-DA0 022,050 Hz22,050 Hz48,000 Hz48,000 Hz標準標準DVDDVD0 024,000 Hz24,000 Hz96,000 Hz96,000 Hz高端高端DVDDVD0 048,000 Hz48,000 Hz4.3.2 4.3.2 量化與量化位數量化與量化位數 量化量化就是把采樣得到的聲音信號幅度轉換為數字值,就是把采樣得到的聲音信號幅度轉換為數字值,是聲音信號在幅度上被離散化。是聲音信號在幅度上被離散化。 量化位數量化位數n n定義了每個采樣點的數據范圍(定義了每個采樣點的數據范圍(0 02 2n n-1-1),),也叫量化

25、等級,量化等級的多少決定了聲音的動態范圍。也叫量化等級,量化等級的多少決定了聲音的動態范圍。圖圖4-4 4-4 量化位數與動態范圍量化位數與動態范圍 4.3.2 4.3.2 量化與量化位數量化與量化位數表表4-5 4-5 不同音質的量化位數、量化范圍、動態范圍不同音質的量化位數、量化范圍、動態范圍量化位數量化位數音質音質量化等級量化等級動態范圍動態范圍8 8位位電話電話25625648 dB48 dB1616位位CDCD65,53665,53696 dB96 dB2424位位DVDDVD16,777,21616,777,216144 dB144 dB3232位位頂級頂級4,294,967,29

26、64,294,967,296192 dB192 dB4.3.3 4.3.3 聲道聲道聲道個數是聲道個數是反映音頻數字化質量的另一個因素。反映音頻數字化質量的另一個因素。單聲道:單聲道:采集聲音數據時,僅采集一個聲波的數據采集聲音數據時,僅采集一個聲波的數據雙聲道(立體聲)雙聲道(立體聲):采集兩個聲波數據:采集兩個聲波數據多聲道(環繞立體聲)多聲道(環繞立體聲):采集兩個以上聲波數據:采集兩個以上聲波數據聲道數越多,再現出的音響效果就越好。聲道數越多,再現出的音響效果就越好。4.3.4 4.3.4 音頻采樣的數據量音頻采樣的數據量數字音頻的數據量主要取決于兩個因素:數字音頻的數據量主要取決于兩

27、個因素:u音質因素音質因素:由采樣頻率、量化位數和聲道數:由采樣頻率、量化位數和聲道數3 3個個參數決定。參數決定。u時間因素:時間因素:單位時間的數據量可用下式表示:單位時間的數據量可用下式表示: fcbs8v= v= v v:為單位時間的數據量(:為單位時間的數據量(KbpsKbps)fc:為采樣頻率(:為采樣頻率(kHzkHz)b b:為量化位數(:為量化位數(bitbit)s s:為聲道數:為聲道數4.3.5 4.3.5 音頻數據編碼音頻數據編碼音頻數據壓縮方法分類音頻數據壓縮方法分類PCMPCM為脈沖調制編碼,為脈沖調制編碼,DPCMDPCM為差分脈沖調制編碼,為差分脈沖調制編碼,A

28、DPCMADPCM為自適應差分脈沖調制編碼為自適應差分脈沖調制編碼, ,VSELPVSELP為矢量和激勵線性預測編碼,為矢量和激勵線性預測編碼,MPLPCMPLPC為多脈沖激勵線性預測編碼,為多脈沖激勵線性預測編碼,CELPCELP為碼本激勵線性預測編碼。為碼本激勵線性預測編碼。4.3.6 4.3.6 音頻編碼標準音頻編碼標準 1 1、一般語音音質的音頻壓縮標準、一般語音音質的音頻壓縮標準u特點:特點:音質低,能聽到聲音就可以音質低,能聽到聲音就可以u應用:應用:各類提示音各類提示音u壓縮標準:壓縮標準: CCITT A LawCCITT A Law CCITT Law CCITT Law 低

29、采樣率或低量化位數的低采樣率或低量化位數的PCM PCM 2 2、電話音質的音頻壓縮標準、電話音質的音頻壓縮標準u頻率范圍頻率范圍:300Hz:300Hz3.4kHz3.4kHz,用標準的,用標準的PCMPCM編碼。編碼。u壓縮標準:壓縮標準: G G系列音頻壓縮標準系列音頻壓縮標準uG G系列音頻壓縮標準利用的技術系列音頻壓縮標準利用的技術: 線性預測技術線性預測技術 矢量量化技術矢量量化技術 綜合分析技術綜合分析技術u典型的算法典型的算法: ADPCMADPCM CELP CELP LD-CELP LD-CELP(短時延碼本激勵線性預測編碼)(短時延碼本激勵線性預測編碼) RPE-LTPR

30、PE-LTP(長時線性預測規則碼激勵)(長時線性預測規則碼激勵) VSELPVSELP(矢量和激勵線性預測編碼)(矢量和激勵線性預測編碼)標準標準參數說明參數說明G.711G.711PCMPCM編碼,采樣速率編碼,采樣速率8kHz8kHz,量化位數,量化位數8Bit8Bit,比特流速率,比特流速率為為64kb/s64kb/s。使用非線性量化技術。使用非線性量化技術G.721G.721ADPCMADPCM編碼:每個數值差分用編碼:每個數值差分用4 4位編碼,采樣率為位編碼,采樣率為8kHz8kHz,比特流被轉換為比特流被轉換為32kbps32kbpsG.723G.723SB-ADPCMSB-AD

31、PCM編碼(有損壓縮),比特流被轉換為編碼(有損壓縮),比特流被轉換為5.35.3 6.3kbps6.3kbps之間之間G.728G.728LD-CELPLD-CELP編碼,比特流被轉換為編碼,比特流被轉換為16kbps16kbps,帶寬限于,帶寬限于3.4kHz3.4kHz;音質與;音質與G.721G.721標準相當標準相當表表4-6 4-6 電話音質的音頻編碼標準電話音質的音頻編碼標準3 3、 AMAM廣播音質的音頻壓縮標準廣播音質的音頻壓縮標準u頻率范圍頻率范圍:50Hz:50Hz7kHz 7kHz u壓縮標準:壓縮標準:ITUITU制定的制定的G.722G.722標準標準 uG.722

32、G.722標準采用的算法:標準采用的算法:SB-ADPCMSB-ADPCM(子帶(子帶ADPCMADPCM)uSB-ADPCMSB-ADPCM算法:算法:將現有的帶寬分成兩個獨立的子帶將現有的帶寬分成兩個獨立的子帶信道,使輸入信號進入濾波器組分成高子帶信號和低信道,使輸入信號進入濾波器組分成高子帶信號和低子帶信號,然后分別進行子帶信號,然后分別進行ADPCMADPCM編碼,最后進入混合器編碼,最后進入混合器形成輸出碼流形成輸出碼流 4 4、高保真立體聲音頻壓縮標準、高保真立體聲音頻壓縮標準u包括包括: :CD-DACD-DA以上音質、以上音質、FMFM廣播音質廣播音質uFMFM廣播音質頻率范圍

33、廣播音質頻率范圍: :20Hz20Hz15kHz15kHz uCD-DACD-DA音頻信號的頻率范圍:音頻信號的頻率范圍:50Hz50Hz20kHz20kHz u壓縮標準:壓縮標準: 1 1)MPEG1MPEG1,MPEG2MPEG2的的layer1layer1、2 2、3 3,MPEG 4 AACMPEG 4 AAC音頻編碼,杜比音頻編碼,杜比AC-3AC-3等等。用于數字廣播、數字電視廣。用于數字廣播、數字電視廣播、消費電子產品、音頻信息的存儲和下載等。播、消費電子產品、音頻信息的存儲和下載等。 2 2)ITU-T G.722.1ITU-T G.722.1、3GPP AMR-WB+3GPP

34、 AMR-WB+和和3GPP 2 3GPP 2 4GV-WB 4GV-WB 。用于像用于像3G3G通信這樣的高音質低碼率應用場合。通信這樣的高音質低碼率應用場合。4.4 4.4 音頻卡音頻卡 4.4.1 4.4.1 音頻卡的功能音頻卡的功能u 錄制和播放數字聲音文件錄制和播放數字聲音文件u 控制音量和混音效果控制音量和混音效果u 聲音文件的壓縮與解壓縮聲音文件的壓縮與解壓縮u MIDIMIDI接口與音樂合成接口與音樂合成 4.4.2 4.4.2 音頻卡的組成與工作原理音頻卡的組成與工作原理圖圖4-6 4-6 音頻卡的一般組成與結構示意圖音頻卡的一般組成與結構示意圖DSPDSP音頻輸出音頻輸出放

35、大器放大器麥克風麥克風MicMic線路輸入線路輸入Line inLine in音樂合成器音樂合成器系統總系統總線接口線接口CDCD輸入輸入混合信號混合信號處理器處理器MIDIMIDI與游與游戲接口戲接口系統總線系統總線放大器放大器 音頻卡的主要功能部件音頻卡的主要功能部件:功率放大器、混合信號處理:功率放大器、混合信號處理器、器、DSPDSP數字信號處理器、音樂合成器以及相關的外圍接口數字信號處理器、音樂合成器以及相關的外圍接口等。等。 聲音的合成與處理聲音的合成與處理:由:由DSPDSP數字聲音處理器、音樂合成數字聲音處理器、音樂合成器及器及MIDIMIDI接口控制器組成接口控制器組成, ,

36、主要任務是完成聲波信號的模主要任務是完成聲波信號的模/ /數、數數、數/ /模轉換,利用調頻技術控制聲音的音調、音色和幅模轉換,利用調頻技術控制聲音的音調、音色和幅度。度。 混合信號處理器及功率放大器混合信號處理器及功率放大器:內置數字:內置數字/ /模擬混音器,模擬混音器,混音器的聲源可以是混音器的聲源可以是MIDIMIDI信號、信號、CDCD音頻、線性輸入、話筒音頻、線性輸入、話筒以及以及PCPC機的揚聲器等,可以選擇輸入一個聲源或將幾個不機的揚聲器等,可以選擇輸入一個聲源或將幾個不同聲源進行混合錄音。同聲源進行混合錄音。 4.4.3 4.4.3 音頻卡的音頻卡的I/OI/O接口接口圖圖4

37、-7 音頻卡的外圍接口連接示意圖音頻卡的外圍接口連接示意圖4.4.3 4.4.3 音頻卡的音頻卡的I/OI/O接口接口圖圖4-8 支持支持5.1環繞的聲卡插口環繞的聲卡插口4.5 4.5 數字音頻的采集與編輯數字音頻的采集與編輯 一般的數字音頻采集首先需要選擇和設置恰當的采樣參一般的數字音頻采集首先需要選擇和設置恰當的采樣參數,然后再開始錄音采集,最后再使用相應的編輯軟件對錄數,然后再開始錄音采集,最后再使用相應的編輯軟件對錄制的音頻數據進行剪輯和效果處理。制的音頻數據進行剪輯和效果處理。 4.5.1 4.5.1 錄音采集錄音采集u 選擇采樣參數選擇采樣參數u 調整輸入音頻的頻響調整輸入音頻的

38、頻響u 檢測輸入音頻的強度檢測輸入音頻的強度 u 開始錄音開始錄音圖圖4-9 4-9 設置錄音參數設置錄音參數1 1、選擇采樣參數、選擇采樣參數 首先要根據實際情況選擇最佳的采樣參數,做到音質與首先要根據實際情況選擇最佳的采樣參數,做到音質與數據量的折中考慮,避免采樣過程中出現存儲空間不足的現數據量的折中考慮,避免采樣過程中出現存儲空間不足的現象發生。象發生。 CDCD音質、音質、電話質量電話質量收音質量收音質量Default Quality Default Quality 2 2調整輸入音頻的頻響調整輸入音頻的頻響 表表4-7 各頻段參數對音質的影響各頻段參數對音質的影響頻段頻段頻率范圍頻率

39、范圍音質影響音質影響低頻低頻202060Hz60Hz空間感。提升低頻共振(嗡),降落空虛;空間感。提升低頻共振(嗡),降落空虛;6060100Hz100Hz渾厚感。提升轟鳴渾厚感。提升轟鳴( (轟轟) ),降落無力;,降落無力;100100150Hz150Hz豐滿度。提升渾濁、降落單??;豐滿度。提升渾濁、降落單??;中頻低段中頻低段150150300Hz300Hz聲音力度、男聲力度。提升聲音硬、無特色,降落軟、飄;聲音力度、男聲力度。提升聲音硬、無特色,降落軟、飄;中頻中頻300300500Hz500Hz語音主要音區,提升語音單調、降落語音空洞;語音主要音區,提升語音單調、降落語音空洞;5005

40、001KHz1KHz人聲基音、聲音廓,提升語音前凸、降落語音收縮感;人聲基音、聲音廓,提升語音前凸、降落語音收縮感; 1k1k2kHz2kHz通透感、順暢感,提升有跳躍感、降落通透感、順暢感,提升有跳躍感、降落 松散;松散; 中頻上段中頻上段2k2k3kHz3kHz對明亮度最敏感,提升聲音硬,不自然;對明亮度最敏感,提升聲音硬,不自然;3k3k4kHz4kHz穿透力,提升穿透力,提升 咳音;咳音;4k4k5kHz5kHz樂器表面響度,提升樂器距離近、降落樂器表面響度,提升樂器距離近、降落 樂器距離遠;樂器距離遠;高頻高頻5k5k6kHz6kHz語言的清晰度,提升聲音鋒利、易疲勞;語言的清晰度,

41、提升聲音鋒利、易疲勞;6k6k8kHz8kHz明亮度、透明度,明亮度、透明度, 提升齒音重、降落提升齒音重、降落 聲音黯淡;聲音黯淡;8k8k10kHz10kHzS S音,影響音色的清晰度和透明度;音,影響音色的清晰度和透明度;極高頻極高頻10k10k12kHz12kHz高頻泛音,光澤;高頻泛音,光澤;12k12k16kHz16kHz高頻泛音,光彩;高頻泛音,光彩;16k16k20kHz20kHz色彩色彩 提升有神秘感;提升有神秘感;3 3、檢測輸入音頻的強度、檢測輸入音頻的強度 在在Win2KWin2K環境下,可通過環境下,可通過“音量控制音量控制”對話框來檢測、調對話框來檢測、調節進入計算

42、機的音源強度。節進入計算機的音源強度。 打開打開WindowsWindows下的音量控制臺,選擇菜單欄中的下的音量控制臺,選擇菜單欄中的“選選項項”“屬性屬性”命令打開命令打開“屬性屬性”對話框。對話框。 圖圖4-10 4-10 音量控制臺音量控制臺 在在“屬性屬性“對話框中的音量調節選項中選擇對話框中的音量調節選項中選擇“錄錄音音”,在顯示音量控制欄中選中麥克風等選項,如圖,在顯示音量控制欄中選中麥克風等選項,如圖4-114-11所所示。示。 在彈出的錄音控制臺中選中麥克風或線路輸入或在彈出的錄音控制臺中選中麥克風或線路輸入或CDCD音頻,使相應的音源有效,如圖音頻,使相應的音源有效,如圖4

43、-124-12所示。所示。 圖圖4-11 “屬性屬性”對話框對話框 圖圖4-12 錄音控制對話框錄音控制對話框4 4、開始錄音、開始錄音圖圖4-11 錄音機操作面板錄音機操作面板4.5.2 4.5.2 抓取抓取CDCD、VCDVCD和和DVDDVD音軌音軌 獲取數字音頻的另一個快捷途徑就是從不同的多媒體產品獲取數字音頻的另一個快捷途徑就是從不同的多媒體產品中直接抓取音軌信息,并轉換壓縮成所需的音頻格式。中直接抓取音軌信息,并轉換壓縮成所需的音頻格式。 WaveLab 5.0版版 :抓取音樂抓取音樂CD、DVD中的音軌中的音軌 “豪杰超級解霸豪杰超級解霸”軟件軟件:抓取音樂:抓取音樂CD、VCD

44、或或DVD光盤等光盤等格式音軌格式音軌 豪杰超級解霸豪杰超級解霸9.0版版 :可從:可從DVD、VCD、RM/RMVB、AVI、MPG、MV等音視頻混合的媒體中提取音頻信息,并保存為一種等音視頻混合的媒體中提取音頻信息,并保存為一種稱為稱為DAC高音質壓縮格式或高音質壓縮格式或WAV、MP3格式的聲音文件格式的聲音文件 注意:在使用抓取音軌來采集數字音頻時,應該遵守有關注意:在使用抓取音軌來采集數字音頻時,應該遵守有關法律規定,取得相應的使用權,避免以后出現知識產權糾紛。法律規定,取得相應的使用權,避免以后出現知識產權糾紛。 4.5.3 4.5.3 編輯數字音頻編輯數字音頻 音頻編輯一般包括音

45、頻編輯一般包括音頻內容剪切音頻內容剪切、合成合成以及以及音質和效音質和效果的編輯果的編輯等方面。等方面。 多音軌(多音軌(Multiple TracksMultiple Tracks) 切邊(切邊(TrimmingTrimming) 拼接和組合(拼接和組合(Splicing and AssemblySplicing and Assembly) 音量調節(音量調節(Volume AdjustmentsVolume Adjustments) 格式轉換(格式轉換(Format ConversionFormat Conversion) 重采樣或降低采樣率(重采樣或降低采樣率(Resampling or

46、 Down samplingResampling or Down sampling) 淡進淡出(淡進淡出(Fade-ins and Fade-outsFade-ins and Fade-outs) 均衡(均衡(EqualizationEqualization) 時間拉伸(時間拉伸(Time StretchingTime Stretching) 數字信號處理(數字信號處理(Digital Signal Processing-DSPDigital Signal Processing-DSP)4.6 MIDI4.6 MIDI音樂音樂4.6.1 4.6.1 什么是什么是MIDIMIDI MIDI MI

47、DI(Musical Instrument Digital InterfaceMusical Instrument Digital Interface)樂器數)樂器數字接口字接口。它是由。它是由YamahaYamaha、RolandRoland等公司在等公司在19831983年聯合提出并不年聯合提出并不斷發展確定的數字音樂的國際標準,它規定了電子樂器和多媒斷發展確定的數字音樂的國際標準,它規定了電子樂器和多媒體計算機之間進行連接的硬件及數據通信協議,是多媒體計算體計算機之間進行連接的硬件及數據通信協議,是多媒體計算機所支持的又一種聲音產生方法機所支持的又一種聲音產生方法MIDIMIDI方法。方

48、法。 MIDIMIDI方法方法就是將數字式電子樂器的彈奏過程記錄下來,如就是將數字式電子樂器的彈奏過程記錄下來,如選的是什么樂器,彈下哪一個鍵,用了多大力氣,持續了多長選的是什么樂器,彈下哪一個鍵,用了多大力氣,持續了多長時間等。時間等。 MIDIMIDI格式的數字化文件格式的數字化文件可以看作是樂譜的數字化描述,它可以看作是樂譜的數字化描述,它記錄的不再是聲音的波形,而是樂器的種類以及音階的高低、記錄的不再是聲音的波形,而是樂器的種類以及音階的高低、長短、強弱、速度等因素,這些被稱為長短、強弱、速度等因素,這些被稱為MIDIMIDI消息,存儲為消息,存儲為MIDIMIDI文件。文件。 4.6

49、.2 MIDI4.6.2 MIDI設備的配置與連接設備的配置與連接 一件樂器只要包含了能處理一件樂器只要包含了能處理MIDIMIDI信息的微處理器以及信息的微處理器以及相關的硬件接口,就可以認為是一臺相關的硬件接口,就可以認為是一臺MIDIMIDI設備設備。 兩臺兩臺MIDIMIDI設備之間可以通過設備之間可以通過接口發送信息接口發送信息而進行相互而進行相互通信。通信。 一臺一臺MIDIMIDI設備可以有設備可以有1 13 3個端口個端口:uMIDI In MIDI In 接口接口:接收來自其它:接收來自其它MIDIMIDI設備上的設備上的MIDIMIDI信息;信息;uMIDI OutMIDI

50、 Out接口接口:用來輸出本設備生成的:用來輸出本設備生成的MIDIMIDI信息;信息;u MIDI ThruMIDI Thru接口:接口:將從將從MIDI InMIDI In端口傳來的信息發送到另端口傳來的信息發送到另一臺相聯的一臺相聯的MIDIMIDI設備上。設備上。 接收設備的接收設備的MIDI InMIDI In連接器內常采用連接器內常采用光電耦合器光電耦合器實現收、發實現收、發設備之間的電氣隔離。設備之間的電氣隔離。 MIDIMIDI信息采用信息采用異步串行方式傳輸異步串行方式傳輸,傳輸速率為,傳輸速率為31.2531.25 KbpsKbps。 在進行在進行MIDIMIDI通信時,用

51、戶可以通過標準的通信時,用戶可以通過標準的MIDIMIDI電纜電纜來相互連來相互連接各端口。如圖接各端口。如圖4-144-14所示。所示。圖圖4-14 MIDI4-14 MIDI與游戲接口電纜與游戲接口電纜MIDIMIDI接口接口游戲接口游戲接口InIn和和OutOut圖圖4-14 4-14 多媒體計算機與多媒體計算機與MIDIMIDI設備連接示意圖設備連接示意圖 MIDIMIDI軟件軟件(音(音序器)是用于記錄、序器)是用于記錄、編輯和播放編輯和播放MIDIMIDI文文件的一種軟件,其件的一種軟件,其作用相當于是作用相當于是MIDIMIDI樂器的一臺多軌磁樂器的一臺多軌磁帶錄音機。帶錄音機。

52、 MIDI MIDI設備可以配備設備可以配備電子鍵盤、合成器、音序器(電子鍵盤、合成器、音序器(MIDIMIDI軟軟件)以及揚聲器或音箱件)以及揚聲器或音箱等。等。 MIDIMIDI鍵盤鍵盤主要用于產生主要用于產生MIDIMIDI信息信息 MIDIMIDI合成器合成器是一種電子設備,使用數字信號處理器或其是一種電子設備,使用數字信號處理器或其他類型的芯片產生音樂或聲音。他類型的芯片產生音樂或聲音。 4.6.3 4.6.3 播放播放MIDIMIDI音樂音樂 聲卡播放聲卡播放MIDIMIDI音樂最常用的方法有兩種:音樂最常用的方法有兩種:FMFM合成合成與與波波表(表(WaveTableWaveT

53、able)合成)合成。 FMFM是運用聲音振蕩的原理對是運用聲音振蕩的原理對MIDIMIDI進行合成處理的。進行合成處理的。 波表合成波表合成,效果較好。它是將各種真實樂器所能發出,效果較好。它是將各種真實樂器所能發出的所有聲音的所有聲音( (包括各個音域、聲調包括各個音域、聲調) )錄制下來,存儲在聲卡錄制下來,存儲在聲卡的的ROMROM中,稱為硬波表。中,稱為硬波表。4.6.4 4.6.4 制作制作MIDIMIDI音樂音樂 制作制作MIDIMIDI音樂,需要按音樂,需要按圖圖4-144-14的示意構成系統。的示意構成系統。 樂譜創作軟件樂譜創作軟件能夠能夠錄制、編輯、打印錄制、編輯、打印M

54、IDIMIDI樂譜樂譜并并播放播放MIDIMIDI音樂音樂。有些樂譜創作軟件還能對。有些樂譜創作軟件還能對樂譜進行量化來調節節拍的不樂譜進行量化來調節節拍的不一致問題。一致問題。 MIDIMIDI編輯編輯中很重要的是中很重要的是選擇選擇MIDIMIDI樂器樂器,MIDIMIDI標準標準規定了不規定了不同的演奏樂器并用編號加以區分,范圍在同的演奏樂器并用編號加以區分,范圍在0 0127127之間,之間,見附錄見附錄三。三。 在在MIDIMIDI樂譜中,樂譜中,樂器樂器IDID用來決定以何種樂器來播放樂曲,用來決定以何種樂器來播放樂曲,為改變樂器,只需改變該數值即可。為改變樂器,只需改變該數值即可

55、。 MIDIMIDI是為多媒體項目創建原始音樂素材的最佳途徑。準備是為多媒體項目創建原始音樂素材的最佳途徑。準備發布時應將其轉換成數字音頻數據。發布時應將其轉換成數字音頻數據。 創作創作MIDIMIDI樂譜的軟件樂譜的軟件:CakewalkCakewalk(Cakewalk 9.0 xCakewalk 9.0 x版)版)4.6.5 4.6.5 樂譜的掃描與識別樂譜的掃描與識別 除了通過除了通過MIDIMIDI方法創作樂譜方法創作樂譜(MIDIMIDI音樂)以外,還可以利音樂)以外,還可以利用用掃描掃描- -識別技術識別技術,快速將印刷樂譜數字化,保存為,快速將印刷樂譜數字化,保存為MIDIMI

56、DI樂譜。樂譜。 SmartScoreSmartScore軟件掃描識別過程:軟件掃描識別過程: 首先,通過掃描儀將樂譜以圖像的方式掃描成數字圖像首先,通過掃描儀將樂譜以圖像的方式掃描成數字圖像, ,掃描參數的選擇與設置掃描參數的選擇與設置: :u 分辨率分辨率: :一般選擇一般選擇150150300300 dpidpi,u 圖像類型圖像類型: :黑白二值或黑白二值或OCROCR,u 掃描后的掃描后的圖片存儲格式圖片存儲格式:TIF:TIF格式格式; 然后,通過樂譜識別功能識別出可編輯的數字樂譜并進行然后,通過樂譜識別功能識別出可編輯的數字樂譜并進行校對、編輯。校對、編輯。識別后的樂譜識別后的樂

57、譜識別前的樂譜圖片識別前的樂譜圖片圖圖4-16 SmartScore4-16 SmartScore軟件的樂譜識別畫面軟件的樂譜識別畫面 SmartScoreSmartScore也可以打開事先存儲好的樂譜圖片并進行也可以打開事先存儲好的樂譜圖片并進行識別,識別完成后會提示將識別的結果保存為識別,識別完成后會提示將識別的結果保存為SmartScoreSmartScore專專用格式的用格式的.enf.enf文件。文件。 4.6.6 MIDI4.6.6 MIDI與數字音頻的比較與數字音頻的比較 MIDIMIDI數字音頻數字音頻是樂譜是樂譜是一段錄音是一段錄音取決于音樂設備的質量和音響取決于音樂設備的質

58、量和音響系統的性能系統的性能取決于音響系統的性能取決于音響系統的性能文件小文件小數字化波形文件大數字化波形文件大與設備有關與設備有關與播放設備無關與播放設備無關依賴于特定的回放設備依賴于特定的回放設備與回放的設備關系不大,與回放的設備關系不大,播放效果幾乎一樣。播放效果幾乎一樣。較小的數據存儲空間較小的數據存儲空間需要較大的數據存儲空間需要較大的數據存儲空間MIDIMIDI文件文件多用于多用于CDCD和和MP3MP3文件文件 MIDIMIDI具有以下幾個優點:具有以下幾個優點: MIDIMIDI文件比數字音頻文件尺寸更小,文件比數字音頻文件尺寸更小,MIDIMIDI文檔的大小文檔的大小與播放質

59、量完全無關。與播放質量完全無關。 由于由于MIDIMIDI文件非常小,可以嵌入到網頁中,因此下載文件非常小,可以嵌入到網頁中,因此下載和播放要比相當的數字音頻速度快。和播放要比相當的數字音頻速度快。 在有些情況下,如果使用的在有些情況下,如果使用的MIDIMIDI聲源質量很高,聲源質量很高,MIDIMIDI將會比數字音頻文件聽起來更好。將會比數字音頻文件聽起來更好。 MIDIMIDI數據是完全可編輯的,可對數據是完全可編輯的,可對MIDIMIDI音樂的音符、音音樂的音符、音高、輸出設備等很小的樂譜單元作精確編輯和修改。高、輸出設備等很小的樂譜單元作精確編輯和修改。 MIDI MIDI也有以下幾

60、方面的不足:也有以下幾方面的不足: 由于由于MIDIMIDI數據并不表示實際的聲音,而是音樂設備的數據并不表示實際的聲音,而是音樂設備的聲音,因此只要聲音,因此只要MIDIMIDI的播放設備與制作的播放設備與制作MIDIMIDI時使用的設備不時使用的設備不一樣,就無法保證播放的最佳效果完全無誤。一樣,就無法保證播放的最佳效果完全無誤。 采用采用MIDIMIDI無法表示語音信號。無法表示語音信號。 采用數字音頻還有兩個,而且經常起決定性作用的原因:采用數字音頻還有兩個,而且經常起決定性作用的原因:u MacintoshMacintosh和和WindowsWindows平臺為數字音頻提供了更多的應

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論