




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
PowerPointTemplate第三章數字聲音基礎
PowerPointTemplate第三章數字聲音基礎1234聲音特性
聲音信號數字化
聲音編碼方法
聲音合成與MIDI系統
56常用音頻處理軟件
聲音文件的存儲與編輯
數字聲音基礎1234聲音特性聲音信號數字化聲音編碼方法聲音合成與M知識結構聲音特性聲音信號數字化聲音編碼方法聲音合成與MIDI系統聲音的存儲及編輯音頻文件的存儲格式轉換CD音軌MP3與WAV格式互換音頻處理軟件簡介CoolEdit編輯制作聲音編碼分類線性預測編碼GSMMP3G721標準常用音頻處理軟件數字聲音基礎知識結構聲音特性聲音信號數字化聲音編碼方法聲音合成與MIDI3.1.1聲音的基本特點聲音的定義
聲音是通過空氣傳播的一種連續的振動波,具有幅度和頻率。聲音用電信號表示時,聲音信號在時間和幅度上都是連續的模擬信號,如圖所示。3.1.1聲音的基本特點聲音的定義3.1.1聲音的基本特點復合信號:聲音信號由許多不同頻率的信號組成,這類信號稱為復合信號,復合信號的頻率范圍稱為聲音信號的帶寬。分量信號:單一頻率的信號稱為分量信號。復合信號與分量信號3.1.1聲音的基本特點復合信號:聲音信號由許多不同頻率3.1.1聲音的基本特點聲音的頻率分布次聲波人耳可聽域(音頻)超聲波<20Hz20~20,000Hz>20,000Hz調幅廣播(AM)50Hz~7,000Hz調頻廣播(FM)20Hz~15,000Hz高級音響3Hz~40,000Hz話音信號300Hz~3,000Hz聲源種類頻帶寬度3.1.1聲音的基本特點聲音的頻率分布次聲波人耳可聽域(3.1.2聲音質量的度量聲音類型帶寬電話語音200~3.4kHz調幅廣播50~7kHz調頻廣播20~15kHzCD20~20kHz評價方法一:帶寬度量法
聲音信號的帶寬來衡量,頻率范圍越寬音質越好。等級由高到低依次為DAT、CD、FM、AM和數字電話。3.1.2聲音質量的度量聲音類型帶寬電話語音200~3.3.1.2聲音質量的度量評價方法二:客觀質量度量法
信噪比(SignaltoNoiseRatio,SNR):指聲源產生最大不失真聲音信號強度與同時發出噪聲強度之間的比率,以S/N表示,單位為分貝(dB)。信噪比越高,音頻質量越好。SNR=10log[(Vsingnal)2(Vnoise)2]=20log|Vsingnal/Vnoise|Vsingnal:信號電壓Vnoise:噪聲電壓S/N:信噪比(單位為dB)3.1.2聲音質量的度量評價方法二:客觀質量度量法SNR3.1.2聲音質量的度量分數質量級別失真級別5優(excellent)無察覺4良(good)(剛)察覺但不討厭3中(fair)(察覺)有點討厭2差(poor)討厭但不反感1劣(bad)極討厭(令人反感)評價方法三:主觀質量度量法
主觀平均判分法:召集若干實驗者對聲音質量進行評分,求出平均值作為對聲音質量的評價。所得分數稱為主觀平均分(MeanOpinionScore,MOS)。3.1.2聲音質量的度量分數質量級別失真級別5優(exc3.2.1聲音數字化過程聲音采樣量化編碼聲音數字化過程
1011001100113.2.1聲音數字化過程聲音量化編碼聲音數字化過程103.2.1聲音數字化過程聲音數字化的兩個重要參數聲音數字化需要回答兩個問題①每秒鐘需要采集多少個聲音樣本,也就是采樣頻率(fs)是多少,②每個聲音樣本的位數(bitpersample,bps)應該是多少,也就是量化精度。3.2.1聲音數字化過程聲音數字化的兩個重要參數3.2.1聲音數字化過程采樣頻率采樣頻率的高低是根據奈奎斯特理論(Nyquisttheory)和聲音信號本身的最高頻率決定的。奈奎斯特理論指出,采樣頻率不應低于聲音信號最高頻率的兩倍,這樣就能把以數字表達的聲音還原成原來的聲音,這叫做無損數字化(losslessdigitization)。采樣定律用公式表示為fs≥2f或者Ts≤T/2其中f為被采樣信號的最高頻率。你可以這樣來理解奈奎斯特理論:聲音信號可以看成由許許多多正弦波組成的,一個振幅為A、頻率為f的正弦波至少需要兩個采樣樣本表示,因此,如果一個信號中的最高頻率為,采樣頻率最低要選擇2。例如,電話話音的信號頻率約為3.4kHz,采樣頻率就選為8kHz。3.2.1聲音數字化過程采樣頻率3.2.1聲音數字化過程量化精度
樣本大小是用每個聲音樣本的位數bit/s(即bps)表示的,它反映度量聲音波形幅度的精度。例如,每個聲音樣本用16位(2字節)表示,測得的聲音樣本值是在0~65535的范圍里,它的精度就是輸入信號的1/65536。樣本位數的大小影響到聲音的質量,位數越多,聲音的質量越高,而需要的存儲空間也越多;位數越少,聲音的質量越低,需要的存儲空間越少。量化精度的另一種表示方法是信號噪聲比,簡稱為信噪比(signal-to-noiseratio,SNR),并用下式計算:SNR=3log2[(Vsignal)2/(Vnoise)2]=6log2(Vsignal/Vnoise)
其中,Vsignal表示信號電壓,Vnoise表示噪聲電壓;SNR的單位為分貝(db)
例1:假設Vnoise=1,采樣精度為1位表示Vsignal=21,它的信噪比SNR=6分貝。假設Vnoise=1,采樣精度為16位表示Vsignal=216,它的信噪比SNR=96分貝。3.2.1聲音數字化過程量化精度3.2.2聲音質量與數據率采樣頻率Hz數據長度bit數據量/分鐘11,02580.66MB22,05081.32MB44,10082.64MB11,025161.32MB22,050162.64MB44,100165.29MB音質評價低一般良好中良好優秀3.2.2聲音質量與數據率采樣頻率Hz數據長度bit3.2.2聲音質量與數據率聲音數據率計算
單聲道,計算數字聲音文件大小的公式為S=R*D*(r/8)*1S:文件大小,單位BR:采樣頻率,KHzD:錄音時間,sr:分辨率,b1:對應單聲道例:R=44.1Khz,r=16b,立體聲,D=10s此為CD質量的紅皮書音頻標準,屬消費者級的壓縮盤標準。3.2.2聲音質量與數據率聲音數據率計算3.2.2聲音質量與數據率20~20000Hz質量采樣頻率(kHz)樣本精度(bit/s)單道聲/立體聲數據率(kB/s)(未壓縮)頻率范圍電話*88單道聲8200~3400HzAM11.0258單道聲11.020~15000HzFM22.05016立體聲88.250~7000HzCD44.116立體聲176.420~20000HzDAT4816立體聲192.0聲音數據率計算3.2.2聲音質量與數據率20~20000Hz質量采3.3.1語音編碼技術分類波形編譯碼器(waveformcoder):不利用生成話音的信號的任何知識,將話音視為一種普通的聲音,直接對波形信號進行采樣和量化。例如PCM、DPCM、ADPCM等。音源編譯碼器(Sourcecoder):也叫參數編譯碼器、聲碼器(vocoder)。它從話音波形信號中提取話音生成模型的參數,使用這些參數通過話音生成模型重構出話音。例如LPC編碼。混合編譯碼器(Hybridcoder):綜合使用上述兩種技術。使用的激勵信號波形盡可能接近于原始話音信號的波形。例如CELP。3.3.1語音編碼技術分類波形編譯碼器(waveform3.3.1語音編碼技術分類音源編譯碼器——話音產生的數字模型周期脈沖序列發生器偽隨機噪聲產生器周期時變數字濾波器音量控制聲道參數語音輸出濁/清選擇3.3.1語音編碼技術分類音源編譯碼器——話音產生的數字3.3.1語音編碼技術分類語音編碼技術比較一般來說,波形編譯碼器的話音質量高,但數據率也很高;音源編譯碼器的數據率很低,產生的合成話音的音質有待提高;混合編譯碼器使用音源編譯碼技術和波形編譯碼技術,數據率和音質介于它們之間。3.3.1語音編碼技術分類語音編碼技術比較一般來說,波形3.3.1語音編碼技術分類語音編碼技術分類LDM多脈沖線性預測(MPLPC)碼激勵線性預測(MPLPC)音頻壓縮編碼方法有損壓縮無損壓縮波形編碼參數編碼(LPC)混合編碼Huffman編碼行程編碼增量調制脈沖編碼調制子帶編碼(SBS)DPCMADPCMADM3.3.1語音編碼技術分類語音編碼技術分類LDM多脈沖線3.3.2脈沖編碼調制(PCM)概念它僅僅是對輸入信號進行采樣和量化。在這個編碼框圖中,它的輸入是模擬聲音信號,它的輸出是PCM樣本。圖中的“防失真濾波器”是一個低通濾波器,用來濾除聲音頻帶以外的信號;“波形編碼器”可暫時理解為“采樣器”,“量化器”可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器。3.3.2脈沖編碼調制(PCM)概念它僅僅是對輸3.3.2脈沖編碼調制(PCM)PCM編碼步驟PCM編碼的兩個步驟:第一步是采樣,就是每隔一段時間間隔讀一次聲音的幅度; 第二步是量化,就是把采樣得到的聲音信號幅度轉換成數字值。量化歸納成兩類:一類稱為均勻量化 另一類稱為非均勻量化采用的量化方法不同,量化后的數據量也就不同。因此,可以說量化也是一種壓縮數據的方法。3.3.2脈沖編碼調制(PCM)PCM編碼步驟3.3.2脈沖編碼調制(PCM)均量化如果采用相等的量化間隔對采樣得到的信號作量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度,也稱為線性量化,如圖所示。量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲。3.3.2脈沖編碼調制(PCM)均量化如果采用相等的量化3.3.2脈沖編碼調制(PCM)非均量化無論對大的輸入信號還是小的輸入信號一律都采用相同的量化間隔。但是,對話音信號來說,大信號出現的機會并不多,增加的樣本位數就沒有充分利用。為了克服這個不足,就出現了非均勻量化的方法,這種方法也叫做非線性量化。非線性量化的基本想法是,對輸入信號進行量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔采樣輸入信號幅度和量化輸出數據之間定義了兩種對應關系:μ律壓擴(companding)算法,A律壓擴算法。3.3.2脈沖編碼調制(PCM)非均量化無論對大的輸入信3.3.2脈沖編碼調制(PCM)μ率壓擴式中:x為輸入信號幅度,規格化成;-1≤x≤1sgn(x)為x的極性;μ律(μ-Law)壓擴(G.711)主要用在北美和日本等地區的數字電話通信中
3.3.2脈沖編碼調制(PCM)μ率壓擴式中:x為輸入信3.3.2脈沖編碼調制(PCM)μ率壓擴曲線3.3.2脈沖編碼調制(PCM)μ率壓擴曲線3.3.2脈沖編碼調制(PCM)A率壓擴0≤|x|≤1/A1/A≤|x|≤1式中:x為輸入信號幅度,規格化成-1≤x≤1;sgn(x)為x的極性;A為確定壓縮量的參數,它反映最大量化間隔和最小量化間隔之比。A律壓擴的前一部分是線性的,其余部分與μ律壓擴相同。A律(A-Law)壓擴(G.711)主要用在歐洲和中國大陸等地區的數字電話通信中
3.3.2脈沖編碼調制(PCM)A率壓擴0≤|x|3.3.2脈沖編碼調制(PCM)A率壓擴曲線3.3.2脈沖編碼調制(PCM)A率壓擴曲線3.3.3差分脈沖編碼調制(DPCM)
是利用樣本與樣本之間存在的信息冗余度來進行編碼的一種數據壓縮技術。差分脈沖編碼調制的思想是,根據過去的樣本去估算(estimate)下一個樣本信號的幅度大小,這個值稱為預測值,然后對實際信號值與預測值之差進行量化編碼,從而就減少了表示每個樣本信號的位數。它與脈沖編碼調制(PCM)不同的是,PCM是直接對采樣信號進行量化編碼,而DPCM是對實際信號值與預測值之差進行量化編碼,存儲或者傳送的是差值而不是幅度絕對值,這就降低了傳送或存儲的數據量。此外,它還能適應大范圍變化的輸入信號。3.3.3差分脈沖編碼調制(DPCM)3.3.3差分脈沖編碼調制(DPCM)DPCM原理圖3.3.3差分脈沖編碼調制(DPCM)DPCM原理圖3.3.3差分脈沖編碼調制(DPCM)各信號意義差分信號d(k):離散輸入信號S(K)和預測器輸出的估算值Se(k-1)之差。注意,Se(k-1)是對S(K)的預測值,而不是過去樣本的實際值。d=S(K)-Se(k-1)重構信號:由逆量化器產生的量化差分信號,與對過去樣本信號的估算值求和得到。它們的和,即作為預測器確定下一個信號估算值的輸入信號。Sr(k)=Se(k-1)+dq(k)由于在發送端和接收端都使用相同的逆量化器和預測器,所以接收端的重構信號可從傳送信號獲得。誤差來源:d與d(k)之間的差異是誤差,原因?3.3.3差分脈沖編碼調制(DPCM)各信號意義3.3.4自適應差分脈沖編碼調制(ADPCM)
核心想法:①利用自適應的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值;②使用過去的樣本值估算下一個輸入樣本的預測值,使實際樣本值和預測值之間的差值總是最小。
ADPCM:采用自適應技術和差分編碼技術相結合。將64kb/s的PCM信號壓縮為32kb/s的脈沖編碼信號,廣泛應用與電話通信網。3.3.4自適應差分脈沖編碼調制(ADPCM)
核心想法3.3.4自適應差分脈沖編碼調制(ADPCM)
ADPCM原理圖自適應量化自適應預測3.3.4自適應差分脈沖編碼調制(ADPCM)
ADPCM原3.3.5線性預測編碼(LPC)LPC是通過分析話音波形來產生聲道激勵和轉移函數的參數,對聲音波形的編碼實際就轉化為對這些參數的編碼,這就使聲音的數據量大大減少。在接收端使用LPC分析得到的參數,通過話音合成器重構話音。合成器實際上是一個離散的隨時間變化的時變線性濾波器,它代表人的話音生成系統模型。時變線性濾波器既當作預測器使用,又當作合成器使用。3.3.5線性預測編碼(LPC)LPC是通過分析話音波形3.3.5線性預測編碼(LPC)
線性預測器是使用過去的P個樣本值來預測現時刻的采樣值x(n),預測值可以用過去P個樣本值的線性組合來表示:
=殘差誤差(residualerror)即線性預測誤差為
=3.3.5線性預測編碼(LPC)線性預測器3.3.5線性預測編碼(LPC)在給定的時間范圍里,如
,使
的平方和即
為最小通過求解偏微分方程,可找到系數ai的值。如果把發音器官等效成濾波器,這些系數值就可以理解成濾波器的系數。這些參數不再是聲音波形本身的值,而是發音器官的激勵參數。3.3.5線性預測編碼(LPC)在給定的時間范圍里,如3.4.1ITU-T音頻壓縮標準用于電話質量的語音壓縮標準G.711,G.721,G.723,G.728用于調幅廣播質量的音頻壓縮標準G.7223.4.1ITU-T音頻壓縮標準用于電話質量的語音壓縮標3.4.1ITU-T音頻壓縮標準ITU-TG電話質量語音壓縮標準電話質量的語音信號頻率范圍為300hz~3.4khz。G.711:1972年CCITT制定,用標準的PCM,采頻8khz,量化倍數8b,對應的速率64kb/s)。主要用于公用電話網中。G.721:將64kb/s比特流轉換成32kb/s比特流,基于ADPCM。G.723:
5.3kb/s或6.3kb/s數據流,可用于可視電話和IP電話等系統中。G.728:1992年,16kb/s比特流,采用短時延碼本激勵線性預測編碼(LD-CELP)算法。主要用于公用電話網中。3.4.1ITU-T音頻壓縮標準ITU-TG電話質量語音3.4.1ITU-T音頻壓縮標準ITU-T調幅廣播質量語音壓縮標準用于調幅廣播的質量的音頻信號頻率范圍為50hz~7khz。G.722:16kHz,14b量化1988年,子帶編碼及ADPCM編碼,能將224kb/s的此類信號壓縮為64kb/s,主要用于視聽多媒體和會議電視等。3.4.1ITU-T音頻壓縮標準ITU-T調幅廣播質量語3.4.2MPEG音頻壓縮標準ISO11172-3:MPEG-1音頻標準(MP1、MP2、MP3)(高保真音頻壓縮標準:音頻信號50hz~20khz)ISO13818-3:MPEG-2音頻標準(DolbyAC-3):5+1聲道、低比特率和后向兼容性ISO13818-7:MPEG-2AAC音頻標準支持采樣頻率從8kHz到96kHz,可支持48個主聲道、16個配聲道和16個數據流。ISO14496-3:MPEG-4音頻標準集成從話音到高質量的多通道聲音,從自然聲音到合成聲音3.4.2MPEG音頻壓縮標準ISO11172-3:M3.4.2MPEG音頻壓縮標準MPEG-1音頻提供3個獨立的壓縮層次,用戶可在復雜性和壓縮質量之間權衡選擇。層1最簡單,使用比特率384kbps,主要用于數字盒式磁帶DCC;層2的復雜度中等,使用比特率192kbps左右,主要應用于數字廣播的音頻編碼、CD-ROM上的音頻信號以及CD-I和VCD。層3最為復雜,使用比特率64kbps,尤其適用于ISDN上的音頻傳輸,有損壓縮但音質保持逼真效果。MP3音樂是利用MPEGAudioLayer3的技術,聲音采用1:10甚至1:12的壓縮率
3.4.2MPEG音頻壓縮標準MPEG-1音頻提供3個獨3.4.2MPEG音頻壓縮標準MP3層3使用比較好的臨界頻帶濾波器,把聲音頻帶分成非等帶寬的子帶,心理聲學模型除了使用頻域掩蔽特性和時間掩蔽特性之外,還考慮了立體聲數據的冗余,并且使用了霍夫曼(Huffman)編碼器。3.4.2MPEG音頻壓縮標準MP3層3使用比較好的臨3.4.3GSM標準GSM(GlobalSystemforMobilecommunications):可譯成全球數字移動通信系統。GSM算法是1992年柏林技術大學(TechnicalUniversityOfBerlin)根據GSM協議開發的,這個協議是歐洲最流行的數字蜂窩電話通信協議。GSM的輸入是幀(frame)數據:一幀(20毫秒)由采樣頻率為8kHz的帶符號的160個樣本組成,每個樣本為13位或者16位的線性PCM(linearPCM)碼。GSM編碼器可把一幀(160×16位)的數據壓縮成260位的GSM幀,壓縮后的數據率為1625字節,相當于13kb/s。由于260位不是8位的整數倍,因此編碼器輸出的GSM幀為264位的線性PCM碼。采樣頻率為8kHz、每個樣本為16位的未壓縮的話音數據率為128kb/s,使用GSM壓縮后的數據率為:(264位×8000樣本/秒)/160樣本=13.2千位/秒GSM的壓縮比:128:13.2=9.7,近似于10:1。3.4.3GSM標準GSM(GlobalSystem3.5.1MIDI簡介MIDI(MusicalInstrumentDigitalInterface):可譯成“電子樂器數字接口”。用于在音樂合成器(musicsynthesizers)、樂器(musicalinstruments)和計算機之間交換音樂信息的一種標準協議從20世紀80年代初期開始,MIDI已經逐步被音樂家和作曲家廣泛接受和使用。MIDI消息:樂譜的數字描述,即一套指令(即命令的約定),它指示樂器即MIDI設備要做什么,怎么做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號,在MIDI電纜上傳送的不是聲音,而是發給MIDI設備或其它裝置讓它產生聲音或執行某個動作的指令。3.5.1MIDI簡介MIDI(MusicalInst3.5.2MIDI系統音樂合成器:解釋MIDI消息并產生音樂。含有鍵盤、音色和音序器。音樂合成方法:頻率調制合成法(frequencymodulation,FM)和樂音樣本合成法(波形表(Wavetable)合成法)音源:產生聲音的設備,提供很多不同音色的樣本波形音序器:用來記錄、編輯和播放MIDI文件的設備。軟件音序器Cakewalk采樣器:開放式音源,對聲音進行采樣,合成音色來供電腦音樂系統使用。其他設備:錄音設備、監聽設備、音響功放3.5.2MIDI系統音樂合成器:解釋MIDI消息并產生3.5.2MIDI系統一個簡單的MIDI系統
上圖表示的是一個簡單的MIDI系統,它由一個MIDI鍵盤控制器和一個MIDI聲音模塊組成。許多MIDI鍵盤樂器在其內部既包含鍵盤控制器,又包含MIDI聲音模塊功能。在這些單元中,鍵盤控制器和聲音模塊之間已經有內部鏈接,這個鏈接可以通過該設備中的控制功能(localcontrol)對鏈接打開(ON)或者關閉(OFF)。3.5.2MIDI系統一個簡單的MIDI系統上圖表示的3.5.2MIDI系統頻率調制(FM)合成法的原理它由5個基本模塊組成:數字載波器、調制器、聲音包絡發生器、數字運算器和模數轉換器。聲音包絡發生器用來調制聲音的電平,這個過程也稱為幅度調制(amplitudemodulation),并且作為數字式音量控制旋鈕,它的4個參數寫成ADSR,這條包絡線也稱為音量升降維持靜音包絡線(Attack,decay,sustain,release,ADSR)包絡線。3.5.2MIDI系統頻率調制(FM)合成法的原理它由3.5.2MIDI系統頻率調制(FM)合成法的原理在樂音合成器中,數字載波波形和調制波形有很多種,不同型號的FM合成器所選用的波形也不同。下圖是YamahaOPL-III數字式FM合成器采用的波形。各種不同樂音的產生是通過組合各種波形和各種波形參數并采用各種不同的方法實現的。用什么樣的波形作為數字載波波形、用什么樣的波形作為調制波形、用什么樣的波形參數去組合才能產生所希望的樂音,這就是FM合成器的算法。3.5.2MIDI系統頻率調制(FM)合成法的原理在樂3.5.2MIDI系統樂音樣本合成聲音參數,產生的聲音質量比FM合成方法產生的聲音質量要高這種方法就是把真實樂器發出的聲音以數字的形式記錄下來,播放時改變播放速度,從而改變音調周期,生成各種音階的音符。樂音樣本的采集相對比較直觀。音樂家在真實樂器上演奏不同的音符,選擇44.1kHz的采樣頻率、16位的樂音樣本,這相當于CD-DA的質量,把不同音符的真實聲音記錄下來,這就完成了樂音樣本的采集。樂音樣本通常放在ROM芯片上。樂音樣本合成器所需要的輸入控制參數比較少,可控的數字音效也不多,大多數采用這種合成方法的聲音設備都可以控制聲音包絡的ADSR。3.5.2MIDI系統樂音樣本合成聲音參數,產生的聲音質3.5.3MIDI規范與接口MIDI規范:1988年MIDI制造商協會正式公布MIDI技術規范第一版(MIDI1.0),作為數字式音樂的國際標準。MIDI是由軟件和硬件兩部分共同組成的系統規范,它定義了電子合成器、定序器、節拍器、個人計算機和其他電子樂器的相互連接性和通信協議。相互連接性:定義了使這些不同的MIDI儀器能夠相互連接的接線方式、連接器類型,和輸入輸出線路。通信協議定義了能夠控制樂器聲音和消息(包括:發出反應,發出狀態,及發出系統獨有)的標準多字節消息。補充規范:“MIDI1.0詳解”、“MIDI1.0規定的補充說明”、“通用MIDI(GM)規范”3.5.3MIDI規范與接口MIDI規范:3.5.3MIDI規范與接口MIDI接口MIDIIn:接受從其他MIDI裝置傳來的信息MIDIOut:發送某裝置生成的原始MIDI消息,向其他設備發送MIDI消息MIDIThru:傳送從輸入口接收的消息到其他MIDI裝置,向其他設備發送MIDI消息。3.5.3MIDI規范與接口MIDI接口MIDIIn3.5.3MIDI規范與接口MIDI工作過程MIDI樂器MIDI接口合成器音序器MIDI文件揚聲器音頻卡PC機MIDI指令模擬音頻信號3.5.3MIDI規范與接口MIDI工作過程MIDI樂器3.6.1數字音頻文件的種類.mid●MIDI(MusicalInstrumentDigitalInterface)樂器接口文件用于合成、游戲,記錄音符時值、頻率、音色特征,數據量小.wav●
WAVE(WaveformAudio)波形音頻文件多媒體系統、音樂光盤制作,記錄物理波形,數據量大.cda●CDA(CDAudio)激光音頻文件準確記錄聲波,數據量大,經過采樣,生成wav和mp3音頻文件.mp3●
mp3(MPEG音頻壓縮標準)壓縮音頻文件
必須經過解壓縮,數據量小3.6.1數字音頻文件的種類.mid●MIDI(Mu3.6.1數字音頻文件的種類文件的擴展名說明auSun和NeXT公司的聲音文件存儲格式(8位m律編碼或者16位線性編碼)aif(AudioInterchange)Apple計算機上的聲音文件存儲格式cmf(CreativeMusicFormat)聲霸(SB)卡帶的MIDI文件存儲格式mctMIDI文件存儲格式mff(MIDIFilesFormat)MIDI文件存儲格式mid(MIDI)Windows的MIDI文件存儲格式mp2MPEGLayerI,IImp3MPEGLayerIIImod(Module)MIDI文件存儲格式3.6.1數字音頻文件的種類文件的擴展名說明auSun和3.6.1數字音頻文件的種類rm(RealMedia)RealNetworks公司的流放式聲音文件格式ra(RealAudio)RealNetworks公司的流放式聲音文件格式rolAdlib聲音卡文件存儲格式snd(sound)Apple計算機上的聲音文件存儲格式seqMIDI文件存儲格式sngMIDI文件存儲格式voc(CreativeVoice)聲霸卡存儲的聲音文件存儲格式wav(Waveform)*Windows采用的波形聲音文件存儲格式wrkCakewalkPro軟件采用的MIDI文件存儲格式3.6.1數字音頻文件的種類rm(RealMedia)R3.6.1數字音頻文件的種類.WAV聲音文件用.wav為擴展名的文件格式稱為波形文件格式(WAVEFileFormat),它在多媒體編程接口和數據規范1.0(MultimediaProgrammingInterfaceandDataSpecifications1.0)文檔中有詳細的描述。該文檔是由IBM和微軟公司于1991年8月聯合開發的,它是一種為交換多媒體資源而開發的資源交換文件格式(ResourceInterchangeFileFormat,RIFF)。波形文件格式支持存儲各種采樣頻率和樣本精度的聲音數據,并支持聲音數據的壓縮。3.6.1數字音頻文件的種類.WAV聲音文件用.wav為3.6.1數字音頻文件的種類.WAV聲音文件波形文件有許多不同類型的文件構造塊組成,其中最主要的兩個文件構造塊是FormatChunk(格式塊)和SoundDataChunk(聲音數據塊)。格式塊包含有描述波形的重要參數,例如采樣頻率和樣本精度等,聲音數據塊則包含有實際的波形聲音數據。RIFF中的其他文件塊是可選擇的。它的簡化結構如圖所示。3.6.1數字音頻文件的種類.WAV聲音文件波形文件有許3.6.2主要音頻處理軟件錄音軟件:Windows錄音機編輯與轉換軟件Windows錄音機CoolEditGoldWaveCakeWalk3.6.2主要音頻處理軟件錄音軟件:Windows錄音機3.6.2主要音頻處理軟件●設備間的信號連接SPEAKERMICLINEIN1mV500mV聲卡機箱后背插頭:φ3.5mm/stereo●使用“錄音機”獲取聲音(1)選擇“程序/附件/娛樂/錄音機”菜單,啟動錄音機(2)單擊[錄音]按鈕,開始錄音(錄音時間為60秒)教學進程錄音軟件3.6.2主要音頻處理軟件●設備間的信號連接SPE(1)鼠標左鍵雙擊任務欄右側圖標(2)檢查“波形”是否被選擇—[√](4)選擇“錄音”選項(5)檢查:錄音控制線路輸入麥克風應有[√](3)選擇“選項/屬性”(6)單擊[確定]按鈕教學進程3.6.2主要音頻處理軟件錄音失敗的處理——操作步驟(1)鼠標左鍵雙擊任務欄右側圖標(2)檢查“(2)選擇“文件/打開”(1)選擇“程序/附件/娛樂/錄音機”(3)選擇需轉換的音頻文件(4)單擊[打開]按鈕(6)單擊[開始轉換]按鈕(7)選擇屬性(采樣頻率)(3)選擇“文件/另存為”菜單,保存文件(5)選擇“文件/屬性”(8)單擊[確定]按鈕(9)如不滿意,可從步驟(2)重新開始3.6.2主要音頻處理軟件編輯與轉換軟件1.Windows錄音機(2)選擇“文件/打開”(1)選擇“程序/附件/娛樂/錄3.6.2主要音頻處理軟件非常出色的數字音樂編輯器和MP3制作軟件:音調、歌曲的一部分、聲音、弦樂、顫音、噪音或是調整靜音。多種特效:放大、降低噪音、壓縮、擴展、回聲、失真、延遲等。多種編輯操作:可以同時處理多個文件,輕松地在幾個文件中進行剪切、粘貼、合并、重疊聲音操作。使用它可以生成的聲音有:噪音、低音、靜音、電話信號等。其他功能:支持可選的插件;崩潰恢復;支持多文件;自動靜音檢測和刪除;自動節拍查找;錄制等。文件轉換:可以在AIF、AU、MP3、RawPCM、SAM、VOC、VOX、WAV等文件格式之間進行轉換,并且能夠保存為RealAudio格式。編輯與轉換軟件2.CoolEditPro軟件3.6.2主要音頻處理軟件非常出色的數字音樂編輯器和MP3.6.2主要音頻處理軟件CoolEditPro2.1軟件3.6.2主要音頻處理軟件CoolEditPro2.3.6.2主要音頻處理軟件編輯與轉換軟件3.GoldWave軟件●軟件功能ECHOPITCHMIXSTOP音頻處理效果■波表顯示聲音數據,直觀、簡捷■為聲音增加各種效果(如回聲、機器聲等)■編輯wav和mp3聲音(如刪除、粘貼、靜音等)■合成聲音(把其他聲音與當前聲音混合)■所有編輯都可進行STEREO/MONO聲道編輯■CPU:PentiumⅡ或以上■內存:≮64MB■硬盤緩存:Windows\temp■系統:Windows98、Windows2000●軟件的工作環境3.6.2主要音頻處理軟件編輯與轉換軟件3.Gold3.6.2主要音頻處理軟件播放控制器音頻編輯器菜單編輯工具左聲道右聲道軟件圖標GoldWave軟件3.6.2主要音頻處理軟件播放控制器音頻編輯器菜單3.6.2主要音頻處理軟件CakewalkProAudio、CakewalkSonar功能強大的專業編輯、創作、調試
MIDI
音樂的軟件可以快速的編曲、錄音、混音、以及彈奏MIDI自帶有一系列完備的音頻效果器,像均衡、混響、合唱、動態等,支持第三方的DirectX插件式效果器。編輯與轉換軟件4.MIDI音樂編輯軟件——CakeWalk3.6.2主要音頻處理軟件CakewalkProAuPowerPointTemplate第三章數字聲音基礎
PowerPointTemplate第三章數字聲音基礎1234聲音特性
聲音信號數字化
聲音編碼方法
聲音合成與MIDI系統
56常用音頻處理軟件
聲音文件的存儲與編輯
數字聲音基礎1234聲音特性聲音信號數字化聲音編碼方法聲音合成與M知識結構聲音特性聲音信號數字化聲音編碼方法聲音合成與MIDI系統聲音的存儲及編輯音頻文件的存儲格式轉換CD音軌MP3與WAV格式互換音頻處理軟件簡介CoolEdit編輯制作聲音編碼分類線性預測編碼GSMMP3G721標準常用音頻處理軟件數字聲音基礎知識結構聲音特性聲音信號數字化聲音編碼方法聲音合成與MIDI3.1.1聲音的基本特點聲音的定義
聲音是通過空氣傳播的一種連續的振動波,具有幅度和頻率。聲音用電信號表示時,聲音信號在時間和幅度上都是連續的模擬信號,如圖所示。3.1.1聲音的基本特點聲音的定義3.1.1聲音的基本特點復合信號:聲音信號由許多不同頻率的信號組成,這類信號稱為復合信號,復合信號的頻率范圍稱為聲音信號的帶寬。分量信號:單一頻率的信號稱為分量信號。復合信號與分量信號3.1.1聲音的基本特點復合信號:聲音信號由許多不同頻率3.1.1聲音的基本特點聲音的頻率分布次聲波人耳可聽域(音頻)超聲波<20Hz20~20,000Hz>20,000Hz調幅廣播(AM)50Hz~7,000Hz調頻廣播(FM)20Hz~15,000Hz高級音響3Hz~40,000Hz話音信號300Hz~3,000Hz聲源種類頻帶寬度3.1.1聲音的基本特點聲音的頻率分布次聲波人耳可聽域(3.1.2聲音質量的度量聲音類型帶寬電話語音200~3.4kHz調幅廣播50~7kHz調頻廣播20~15kHzCD20~20kHz評價方法一:帶寬度量法
聲音信號的帶寬來衡量,頻率范圍越寬音質越好。等級由高到低依次為DAT、CD、FM、AM和數字電話。3.1.2聲音質量的度量聲音類型帶寬電話語音200~3.3.1.2聲音質量的度量評價方法二:客觀質量度量法
信噪比(SignaltoNoiseRatio,SNR):指聲源產生最大不失真聲音信號強度與同時發出噪聲強度之間的比率,以S/N表示,單位為分貝(dB)。信噪比越高,音頻質量越好。SNR=10log[(Vsingnal)2(Vnoise)2]=20log|Vsingnal/Vnoise|Vsingnal:信號電壓Vnoise:噪聲電壓S/N:信噪比(單位為dB)3.1.2聲音質量的度量評價方法二:客觀質量度量法SNR3.1.2聲音質量的度量分數質量級別失真級別5優(excellent)無察覺4良(good)(剛)察覺但不討厭3中(fair)(察覺)有點討厭2差(poor)討厭但不反感1劣(bad)極討厭(令人反感)評價方法三:主觀質量度量法
主觀平均判分法:召集若干實驗者對聲音質量進行評分,求出平均值作為對聲音質量的評價。所得分數稱為主觀平均分(MeanOpinionScore,MOS)。3.1.2聲音質量的度量分數質量級別失真級別5優(exc3.2.1聲音數字化過程聲音采樣量化編碼聲音數字化過程
1011001100113.2.1聲音數字化過程聲音量化編碼聲音數字化過程103.2.1聲音數字化過程聲音數字化的兩個重要參數聲音數字化需要回答兩個問題①每秒鐘需要采集多少個聲音樣本,也就是采樣頻率(fs)是多少,②每個聲音樣本的位數(bitpersample,bps)應該是多少,也就是量化精度。3.2.1聲音數字化過程聲音數字化的兩個重要參數3.2.1聲音數字化過程采樣頻率采樣頻率的高低是根據奈奎斯特理論(Nyquisttheory)和聲音信號本身的最高頻率決定的。奈奎斯特理論指出,采樣頻率不應低于聲音信號最高頻率的兩倍,這樣就能把以數字表達的聲音還原成原來的聲音,這叫做無損數字化(losslessdigitization)。采樣定律用公式表示為fs≥2f或者Ts≤T/2其中f為被采樣信號的最高頻率。你可以這樣來理解奈奎斯特理論:聲音信號可以看成由許許多多正弦波組成的,一個振幅為A、頻率為f的正弦波至少需要兩個采樣樣本表示,因此,如果一個信號中的最高頻率為,采樣頻率最低要選擇2。例如,電話話音的信號頻率約為3.4kHz,采樣頻率就選為8kHz。3.2.1聲音數字化過程采樣頻率3.2.1聲音數字化過程量化精度
樣本大小是用每個聲音樣本的位數bit/s(即bps)表示的,它反映度量聲音波形幅度的精度。例如,每個聲音樣本用16位(2字節)表示,測得的聲音樣本值是在0~65535的范圍里,它的精度就是輸入信號的1/65536。樣本位數的大小影響到聲音的質量,位數越多,聲音的質量越高,而需要的存儲空間也越多;位數越少,聲音的質量越低,需要的存儲空間越少。量化精度的另一種表示方法是信號噪聲比,簡稱為信噪比(signal-to-noiseratio,SNR),并用下式計算:SNR=3log2[(Vsignal)2/(Vnoise)2]=6log2(Vsignal/Vnoise)
其中,Vsignal表示信號電壓,Vnoise表示噪聲電壓;SNR的單位為分貝(db)
例1:假設Vnoise=1,采樣精度為1位表示Vsignal=21,它的信噪比SNR=6分貝。假設Vnoise=1,采樣精度為16位表示Vsignal=216,它的信噪比SNR=96分貝。3.2.1聲音數字化過程量化精度3.2.2聲音質量與數據率采樣頻率Hz數據長度bit數據量/分鐘11,02580.66MB22,05081.32MB44,10082.64MB11,025161.32MB22,050162.64MB44,100165.29MB音質評價低一般良好中良好優秀3.2.2聲音質量與數據率采樣頻率Hz數據長度bit3.2.2聲音質量與數據率聲音數據率計算
單聲道,計算數字聲音文件大小的公式為S=R*D*(r/8)*1S:文件大小,單位BR:采樣頻率,KHzD:錄音時間,sr:分辨率,b1:對應單聲道例:R=44.1Khz,r=16b,立體聲,D=10s此為CD質量的紅皮書音頻標準,屬消費者級的壓縮盤標準。3.2.2聲音質量與數據率聲音數據率計算3.2.2聲音質量與數據率20~20000Hz質量采樣頻率(kHz)樣本精度(bit/s)單道聲/立體聲數據率(kB/s)(未壓縮)頻率范圍電話*88單道聲8200~3400HzAM11.0258單道聲11.020~15000HzFM22.05016立體聲88.250~7000HzCD44.116立體聲176.420~20000HzDAT4816立體聲192.0聲音數據率計算3.2.2聲音質量與數據率20~20000Hz質量采3.3.1語音編碼技術分類波形編譯碼器(waveformcoder):不利用生成話音的信號的任何知識,將話音視為一種普通的聲音,直接對波形信號進行采樣和量化。例如PCM、DPCM、ADPCM等。音源編譯碼器(Sourcecoder):也叫參數編譯碼器、聲碼器(vocoder)。它從話音波形信號中提取話音生成模型的參數,使用這些參數通過話音生成模型重構出話音。例如LPC編碼。混合編譯碼器(Hybridcoder):綜合使用上述兩種技術。使用的激勵信號波形盡可能接近于原始話音信號的波形。例如CELP。3.3.1語音編碼技術分類波形編譯碼器(waveform3.3.1語音編碼技術分類音源編譯碼器——話音產生的數字模型周期脈沖序列發生器偽隨機噪聲產生器周期時變數字濾波器音量控制聲道參數語音輸出濁/清選擇3.3.1語音編碼技術分類音源編譯碼器——話音產生的數字3.3.1語音編碼技術分類語音編碼技術比較一般來說,波形編譯碼器的話音質量高,但數據率也很高;音源編譯碼器的數據率很低,產生的合成話音的音質有待提高;混合編譯碼器使用音源編譯碼技術和波形編譯碼技術,數據率和音質介于它們之間。3.3.1語音編碼技術分類語音編碼技術比較一般來說,波形3.3.1語音編碼技術分類語音編碼技術分類LDM多脈沖線性預測(MPLPC)碼激勵線性預測(MPLPC)音頻壓縮編碼方法有損壓縮無損壓縮波形編碼參數編碼(LPC)混合編碼Huffman編碼行程編碼增量調制脈沖編碼調制子帶編碼(SBS)DPCMADPCMADM3.3.1語音編碼技術分類語音編碼技術分類LDM多脈沖線3.3.2脈沖編碼調制(PCM)概念它僅僅是對輸入信號進行采樣和量化。在這個編碼框圖中,它的輸入是模擬聲音信號,它的輸出是PCM樣本。圖中的“防失真濾波器”是一個低通濾波器,用來濾除聲音頻帶以外的信號;“波形編碼器”可暫時理解為“采樣器”,“量化器”可理解為“量化階大小(step-size)”生成器或者稱為“量化間隔”生成器。3.3.2脈沖編碼調制(PCM)概念它僅僅是對輸3.3.2脈沖編碼調制(PCM)PCM編碼步驟PCM編碼的兩個步驟:第一步是采樣,就是每隔一段時間間隔讀一次聲音的幅度; 第二步是量化,就是把采樣得到的聲音信號幅度轉換成數字值。量化歸納成兩類:一類稱為均勻量化 另一類稱為非均勻量化采用的量化方法不同,量化后的數據量也就不同。因此,可以說量化也是一種壓縮數據的方法。3.3.2脈沖編碼調制(PCM)PCM編碼步驟3.3.2脈沖編碼調制(PCM)均量化如果采用相等的量化間隔對采樣得到的信號作量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度,也稱為線性量化,如圖所示。量化后的樣本值Y和原始值X的差E=Y-X稱為量化誤差或量化噪聲。3.3.2脈沖編碼調制(PCM)均量化如果采用相等的量化3.3.2脈沖編碼調制(PCM)非均量化無論對大的輸入信號還是小的輸入信號一律都采用相同的量化間隔。但是,對話音信號來說,大信號出現的機會并不多,增加的樣本位數就沒有充分利用。為了克服這個不足,就出現了非均勻量化的方法,這種方法也叫做非線性量化。非線性量化的基本想法是,對輸入信號進行量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔采樣輸入信號幅度和量化輸出數據之間定義了兩種對應關系:μ律壓擴(companding)算法,A律壓擴算法。3.3.2脈沖編碼調制(PCM)非均量化無論對大的輸入信3.3.2脈沖編碼調制(PCM)μ率壓擴式中:x為輸入信號幅度,規格化成;-1≤x≤1sgn(x)為x的極性;μ律(μ-Law)壓擴(G.711)主要用在北美和日本等地區的數字電話通信中
3.3.2脈沖編碼調制(PCM)μ率壓擴式中:x為輸入信3.3.2脈沖編碼調制(PCM)μ率壓擴曲線3.3.2脈沖編碼調制(PCM)μ率壓擴曲線3.3.2脈沖編碼調制(PCM)A率壓擴0≤|x|≤1/A1/A≤|x|≤1式中:x為輸入信號幅度,規格化成-1≤x≤1;sgn(x)為x的極性;A為確定壓縮量的參數,它反映最大量化間隔和最小量化間隔之比。A律壓擴的前一部分是線性的,其余部分與μ律壓擴相同。A律(A-Law)壓擴(G.711)主要用在歐洲和中國大陸等地區的數字電話通信中
3.3.2脈沖編碼調制(PCM)A率壓擴0≤|x|3.3.2脈沖編碼調制(PCM)A率壓擴曲線3.3.2脈沖編碼調制(PCM)A率壓擴曲線3.3.3差分脈沖編碼調制(DPCM)
是利用樣本與樣本之間存在的信息冗余度來進行編碼的一種數據壓縮技術。差分脈沖編碼調制的思想是,根據過去的樣本去估算(estimate)下一個樣本信號的幅度大小,這個值稱為預測值,然后對實際信號值與預測值之差進行量化編碼,從而就減少了表示每個樣本信號的位數。它與脈沖編碼調制(PCM)不同的是,PCM是直接對采樣信號進行量化編碼,而DPCM是對實際信號值與預測值之差進行量化編碼,存儲或者傳送的是差值而不是幅度絕對值,這就降低了傳送或存儲的數據量。此外,它還能適應大范圍變化的輸入信號。3.3.3差分脈沖編碼調制(DPCM)3.3.3差分脈沖編碼調制(DPCM)DPCM原理圖3.3.3差分脈沖編碼調制(DPCM)DPCM原理圖3.3.3差分脈沖編碼調制(DPCM)各信號意義差分信號d(k):離散輸入信號S(K)和預測器輸出的估算值Se(k-1)之差。注意,Se(k-1)是對S(K)的預測值,而不是過去樣本的實際值。d=S(K)-Se(k-1)重構信號:由逆量化器產生的量化差分信號,與對過去樣本信號的估算值求和得到。它們的和,即作為預測器確定下一個信號估算值的輸入信號。Sr(k)=Se(k-1)+dq(k)由于在發送端和接收端都使用相同的逆量化器和預測器,所以接收端的重構信號可從傳送信號獲得。誤差來源:d與d(k)之間的差異是誤差,原因?3.3.3差分脈沖編碼調制(DPCM)各信號意義3.3.4自適應差分脈沖編碼調制(ADPCM)
核心想法:①利用自適應的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值;②使用過去的樣本值估算下一個輸入樣本的預測值,使實際樣本值和預測值之間的差值總是最小。
ADPCM:采用自適應技術和差分編碼技術相結合。將64kb/s的PCM信號壓縮為32kb/s的脈沖編碼信號,廣泛應用與電話通信網。3.3.4自適應差分脈沖編碼調制(ADPCM)
核心想法3.3.4自適應差分脈沖編碼調制(ADPCM)
ADPCM原理圖自適應量化自適應預測3.3.4自適應差分脈沖編碼調制(ADPCM)
ADPCM原3.3.5線性預測編碼(LPC)LPC是通過分析話音波形來產生聲道激勵和轉移函數的參數,對聲音波形的編碼實際就轉化為對這些參數的編碼,這就使聲音的數據量大大減少。在接收端使用LPC分析得到的參數,通過話音合成器重構話音。合成器實際上是一個離散的隨時間變化的時變線性濾波器,它代表人的話音生成系統模型。時變線性濾波器既當作預測器使用,又當作合成器使用。3.3.5線性預測編碼(LPC)LPC是通過分析話音波形3.3.5線性預測編碼(LPC)
線性預測器是使用過去的P個樣本值來預測現時刻的采樣值x(n),預測值可以用過去P個樣本值的線性組合來表示:
=殘差誤差(residualerror)即線性預測誤差為
=3.3.5線性預測編碼(LPC)線性預測器3.3.5線性預測編碼(LPC)在給定的時間范圍里,如
,使
的平方和即
為最小通過求解偏微分方程,可找到系數ai的值。如果把發音器官等效成濾波器,這些系數值就可以理解成濾波器的系數。這些參數不再是聲音波形本身的值,而是發音器官的激勵參數。3.3.5線性預測編碼(LPC)在給定的時間范圍里,如3.4.1ITU-T音頻壓縮標準用于電話質量的語音壓縮標準G.711,G.721,G.723,G.728用于調幅廣播質量的音頻壓縮標準G.7223.4.1ITU-T音頻壓縮標準用于電話質量的語音壓縮標3.4.1ITU-T音頻壓縮標準ITU-TG電話質量語音壓縮標準電話質量的語音信號頻率范圍為300hz~3.4khz。G.711:1972年CCITT制定,用標準的PCM,采頻8khz,量化倍數8b,對應的速率64kb/s)。主要用于公用電話網中。G.721:將64kb/s比特流轉換成32kb/s比特流,基于ADPCM。G.723:
5.3kb/s或6.3kb/s數據流,可用于可視電話和IP電話等系統中。G.728:1992年,16kb/s比特流,采用短時延碼本激勵線性預測編碼(LD-CELP)算法。主要用于公用電話網中。3.4.1ITU-T音頻壓縮標準ITU-TG電話質量語音3.4.1ITU-T音頻壓縮標準ITU-T調幅廣播質量語音壓縮標準用于調幅廣播的質量的音頻信號頻率范圍為50hz~7khz。G.722:16kHz,14b量化1988年,子帶編碼及ADPCM編碼,能將224kb/s的此類信號壓縮為64kb/s,主要用于視聽多媒體和會議電視等。3.4.1ITU-T音頻壓縮標準ITU-T調幅廣播質量語3.4.2MPEG音頻壓縮標準ISO11172-3:MPEG-1音頻標準(MP1、MP2、MP3)(高保真音頻壓縮標準:音頻信號50hz~20khz)ISO13818-3:MPEG-2音頻標準(DolbyAC-3):5+1聲道、低比特率和后向兼容性ISO13818-7:MPEG-2AAC音頻標準支持采樣頻率從8kHz到96kHz,可支持48個主聲道、16個配聲道和16個數據流。ISO14496-3:MPEG-4音頻標準集成從話音到高質量的多通道聲音,從自然聲音到合成聲音3.4.2MPEG音頻壓縮標準ISO11172-3:M3.4.2MPEG音頻壓縮標準MPEG-1音頻提供3個獨立的壓縮層次,用戶可在復雜性和壓縮質量之間權衡選擇。層1最簡單,使用比特率384kbps,主要用于數字盒式磁帶DCC;層2的復雜度中等,使用比特率192kbps左右,主要應用于數字廣播的音頻編碼、CD-ROM上的音頻信號以及CD-I和VCD。層3最為復雜,使用比特率64kbps,尤其適用于ISDN上的音頻傳輸,有損壓縮但音質保持逼真效果。MP3音樂是利用MPEGAudioLayer3的技術,聲音采用1:10甚至1:12的壓縮率
3.4.2MPEG音頻壓縮標準MPEG-1音頻提供3個獨3.4.2MPEG音頻壓縮標準MP3層3使用比較好的臨界頻帶濾波器,把聲音頻帶分成非等帶寬的子帶,心理聲學模型除了使用頻域掩蔽特性和時間掩蔽特性之外,還考慮了立體聲數據的冗余,并且使用了霍夫曼(Huffman)編碼器。3.4.2MPEG音頻壓縮標準MP3層3使用比較好的臨3.4.3GSM標準GSM(GlobalSystemforMobilecommunications):可譯成全球數字移動通信系統。GSM算法是1992年柏林技術大學(TechnicalUniversityOfBerlin)根據GSM協議開發的,這個協議是歐洲最流行的數字蜂窩電話通信協議。GSM的輸入是幀(frame)數據:一幀(20毫秒)由采樣頻率為8kHz的帶符號的160個樣本組成,每個樣本為13位或者16位的線性PCM(linearPCM)碼。GSM編碼器可把一幀(160×16位)的數據壓縮成260位的GSM幀,壓縮后的數據率為1625字節,相當于13kb/s。由于260位不是8位的整數倍,因此編碼器輸出的GSM幀為264位的線性PCM碼。采樣頻率為8kHz、每個樣本為16位的未壓縮的話音數據率為128kb/s,使用GSM壓縮后的數據率為:(264位×8000樣本/秒)/160樣本=13.2千位/秒GSM的壓縮比:128:13.2=9.7,近似于10:1。3.4.3GSM標準GSM(GlobalSystem3.5.1MIDI簡介MIDI(MusicalInstrumentDigitalInterface):可譯成“電子樂器數字接口”。用于在音樂合成器(musicsynthesizers)、樂器(musicalinstruments)和計算機之間交換音樂信息的一種標準協議從20世紀80年代初期開始,MIDI已經逐步被音樂家和作曲家廣泛接受和使用。MIDI消息:樂譜的數字描述,即一套指令(即命令的約定),它指示樂器即MIDI設備要做什么,怎么做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號,在MIDI電纜上傳送的不是聲音,而是發給MIDI設備或其它裝置讓它產生聲音或執行某個動作的指令。3.5.1MIDI簡介MIDI(MusicalInst3.5.2MIDI系統音樂合成器:解釋MIDI消息并產生音樂。含有鍵盤、音色和音序器。音樂合成方法:頻率調制合成法(frequencymodulation,FM)和樂音樣本合成法(波形表(Wavetable)合成法)音源:產生聲音的設備,提供很多不同音色的樣本波形音序器:用來記錄、編輯和播放MIDI文件的設備。軟件音序器Cakewalk采樣器:開放式音源,對聲音進行采樣,合成音色來供電腦音樂系統使用。其他設備:錄音設備、監聽設備、音響功放3.5.2MIDI系統音樂合成器:解釋MIDI消息并產生3.5.2MIDI系統一個簡單的MIDI系統
上圖表示的是一個簡單的MIDI系統,它由一個MIDI鍵盤控制器和一個MIDI聲音模塊組成。許多MIDI鍵盤樂器在其內部既包含鍵盤控制器,又包含MIDI聲音模塊功能。在這些單元中,鍵盤控制器和聲音模塊之間已經有內部鏈接,這個鏈接可以通過該設備中的控制功能(localcontrol)對鏈接打開(ON)或者關閉(OFF)。3.5.2MIDI系統一個簡單的MIDI系統上圖表示的3.5.2MIDI系統頻率調制(FM)合成法的原理它由5個基本模塊組成:數字載波器、調制器、聲音包絡發生器、數字運算器和模數轉換器。聲音包絡發生器用來調制聲音的電平,這個過程也稱為幅度調制(amplitudemodulation),并且作為數字式音量控制旋鈕,它的4個參數寫成ADSR,這條包絡線也稱為音量升降維持靜音包絡線(Attack,decay,sustain,release,ADSR)包絡線。3.5.2MIDI系統頻率調制(FM)合成法的原理它由3.5.2MIDI系統頻率調制(FM)合成法的原理在樂音合成器中,數字載波波形和調制波形有很多種,不同型號的FM合成器所選用的波形也不同。下圖是YamahaOPL-III數字式FM合成器采用的波形。各種不同樂音的產生是通過組合各種波形和各種波形參數并采用各種不同的方法實現的。用什么樣的波形作為數字載波波形、用什么樣的波形作為調制波形、用什么樣的波形參數去組合才能產生所希望的樂音,這就是FM合成器的算法。3.5.2MIDI系統頻率調制(FM)合成法的原理在樂3.5.2MIDI系統樂音樣本合成聲音參數,產生的聲音質量比FM合成方法產生的聲音質量要高這種方法就是把真實樂器發出的聲音以數字的形式記錄下來,播放時改變播放速度,從而改變音調周期,生成各種音階的音符。樂音樣本的采集相對比較直觀。音樂家在真實樂器上演奏不同的音符,選擇44.1kHz的采樣頻率、16位的樂音樣本,這相當于CD-DA的質量,把不同音符的真實聲音記錄下來,這就完成了樂音樣本的采集。樂音樣本通常放在ROM芯片上。樂音樣本合成器所需要的輸入控制參數比較少,可控的數字音效也不多,大多數采用這種合成方法的聲音設備都可以控制聲音包絡的ADSR。3.5.2MIDI系統樂音樣本合成聲音參數,產生的聲音質3.5.3MIDI規范與接口MIDI規范:1988年MIDI制造商協會正式公布MIDI技術規范第一版(MIDI1.0),作為數字式音樂的國際標準。MIDI是由軟件和硬件兩部分共同組成的系統規范,它定義了電子合成器、定序器、節拍器、個人計算機和其他電子樂器的相互連接性和通信協議。相互連接性:定義了使這些不同的MIDI儀器能夠相互連接的接線方式、連接器類型,和輸入輸出線路。通信協議定義了能夠控制樂器聲音和消息(包括:發出反應,發出狀態,及發出系統獨有)的標準多字節消息。補充規范:“MIDI1.0詳解”、“MIDI1.0規定的補充說明”、“通用MIDI(GM)規范”3.5.3MIDI規范與接口MIDI規范:3.5.3MIDI規范與接口MIDI接口MIDIIn:接受從其他MIDI裝置傳來的信息MIDIOut:發送某裝置生成的原始MIDI消息,向其他設備發送MIDI消息MIDIThru:傳送從輸入口接收的消息到其他MIDI裝置,向其他設備發送MIDI消息。3.5.3MIDI規范與接口MIDI接口MIDIIn3.5.3MIDI規范與接口MIDI工作過程MIDI樂器MIDI接口合成器音序器MIDI文件揚聲器音頻卡PC機MIDI指令模擬音頻信號3.5.3MIDI規范與接口MIDI工作過程MIDI樂器3.6.1數字音頻文件的種類.mid●MIDI(MusicalInstrumentDigitalInterface)樂器接口文件用于合成、游戲,記錄音符時值、頻率、音色特征,數據量小.wav●
WAVE(WaveformAudio)波形音頻文件多媒體系統、音樂光盤制作,記錄物理波形,數據量大.cda●CDA(CDAudio)激光音頻文件準確記錄聲波,數據量大,經過采樣,生成wav和mp3音頻文件.mp3●
mp3(MPEG音頻壓縮標準)壓縮音頻文件
必須經過解壓縮,數據量小3.6.1數字音頻文件的種類.mid●MIDI(Mu3.6.1數字音頻文件的種類文件的擴展名說明auSun和NeXT公司的聲音文件存儲格式(8位m律編碼或者16位線性編碼)aif(AudioInterchange)Apple計算機上的聲音文件存儲格式cmf(Creat
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 室內外裝修公司管理制度
- 賓館保潔制度與管理制度
- 對高層消防安全管理制度
- 山東省生豬屠宰管理制度
- 崇明區攝影服務管理制度
- 工程設備租賃設備管理制度
- 幼兒園家長快遞管理制度
- 幼兒園房屋設備管理制度
- 幼兒園校園活動管理制度
- 幼兒園物資儲存管理制度
- 杭州市上城區2025年下半年下半年招考50名專職社區工作者易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年中國SUV帳篷行業市場前景預測及投資價值評估分析報告
- 福建省惠安縣2025屆七下數學期末學業質量監測試題含解析
- 2025年就業指導培訓課件
- 2025-2030石油管道行業市場深度調研及競爭格局與投資研究報告
- 2025年三級電子商務師職業技能鑒定理論考試題庫(含答案)
- 腹部超聲檢查規范指南
- 2025年中國國際技術智力合作集團有限公司招聘筆試參考題庫含答案解析
- 食品安全自查、從業人員健康管理、進貨查驗記錄、食品安全事故處置等保證食品安全的規章制度
- 國家保密知識培訓課件
- 新22J01 工程做法圖集
評論
0/150
提交評論