




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、2021/8/261第二章 聲音的合成2021/8/262l一、音頻信號2021/8/263 1 .聲音是一種波 聲波可以在空氣中傳播,也可以在液體及固體中傳播。 聲音三要素 (1) 音調 (高低) (2) 音強 (強弱) (3) 音色 (特質)2021/8/264 2 .音質音質與頻率范圍成正比,頻率范圍越寬音質越好 3 .聲音采樣 把聲音信號按固定的時間間隔,轉換成有限個數字表示的離散序列。2021/8/2652021/8/2662021/8/2672021/8/2682021/8/26900000001001000111001101010112021/8/2610 常用聲音信號與采樣頻率
2、 聲音信號CD音樂數字電話采樣頻率信號帶寬數字電話44.1K16K8K20K7K3.4K2021/8/26112021/8/26122021/8/2613 4 .音頻文件的種類及特點 (1)MIDI文件(電子樂器數字接口) 是用于在音樂合成器、電子樂器、音序器和計算機之間交換音樂信息的一種標準協議。2021/8/2614 MIDI實質上是由MIDI控制器(或MIDI文件)產生的指示電子音樂合成器要做什么、怎么做(如演奏某個音符、加大音量、生成音響效果)的一套標準指令。MIDI不是聲音信號,在MIDI電纜上傳送的不是聲音,而是動作指令。2021/8/26152021/8/2616 由于MIDI只
3、是記錄音樂信息的數字代碼,所以生成的文件比較小,便于傳播,也便于編輯修改 與Mp3、Wav等音頻格式不同的是MIDI的播放質量很大程度上取決于硬件或軟件的音源環境,也就是說同樣的MIDI文件在不同的電腦上可能有非常明顯的效果差別,究其原因是因為它們調用的波表音色庫不一樣2021/8/2617聲音文件:24.9K聲音文件:16K2021/8/2618 (2) 2021/8/2619 標準格式的WAV文件和CD格式一樣,也是44.1K的采樣頻率,速率88K/秒,16位量化位數 WAV格式的聲音文件質量和CD相差無幾 2021/8/26202021/8/26212021/8/2622 MP3也就是指
4、的是MPEG標準中的音頻部分,也就是MPEG音頻層。根據壓縮質量和編碼處理的不同分為 3層,分別對應“*.mp1”/“*.mp2”/“*.mp3”這3種聲音文件。 MPEG音頻文件的壓縮是一種有損壓縮, MPEG3高壓縮率,基本保持低音頻部分不失真,但是犧牲了聲音文件中12KHz到16KHz高音頻這部分的質量來換取文件的尺寸2021/8/2623 相同長度的音樂文件,用.mp3格式來儲存,一般只有.wav文件的1/10,而音質要次于CD格式或WAV格式的聲音文件。文件尺寸小,音質好2021/8/26242021/8/2625二、錄音編輯2021/8/26261.基于句子和單詞的錄音編輯方式 可
5、以預先將句子、單詞作為錄音的單位,對錄音、講話所涉及的有關句子或單詞逐個進行錄音并保存 為了實現這種錄音編輯方式,應事先存入大量的有關單詞、句子(即需要大量的存儲空間),聲音合成時還需要快速地檢出和呈現(需要高速的檢索和控制)。2021/8/26272.基于音節的編輯合成方式在任何語言中,音節的數量比單詞的數量少很多;基于音節的編輯方式在合成時的檢索、控制變得十分方便;基于音節的合成方式的音質較差,很難表現人們在講話時的各種情感和聲調的變化;根據發音耦合的原理和要求,人們對單詞的發音制定了一定的規則,基于這種規則進行聲音合成,可以得到較好的聲音效果。2021/8/26283.錄音編輯聲音合成的
6、分析(1)以錄音編輯的方式進行聲音合成,需要大容量的存儲設備(2)為了讓一定容量的存儲設備能存儲更多的聲音信息,需要對聲音信息的數據量進行壓縮(3)通過編碼的方式,減少聲音信息中的冗余性是實現聲音信息壓縮的基本方法。2021/8/2629三、脈沖代碼調制PCM2021/8/2630脈沖代碼調制 PCM(pulse code modulation)是一種對模擬信號的編輯聲音信號是一種模擬信號,經PCM編碼后,變成數字信號通常所說的PCM錄音就是一種數字錄音。2021/8/26311.基本原理PCM編碼過程:(1)對模擬聲音信號進行采樣2021/8/26322021/8/2633采樣周期采樣信號t
7、振幅2021/8/2634(2)將各個采樣點的聲音信號值通過模數變換(A D轉換)變換成由0和1組成的脈沖變換序列2021/8/26350011001000010000111111101101正值負值模擬信號碼字序列2021/8/2636(3)在PCM(脈沖代碼調制)中所分配碼字的首位為符號位,信號為正時,首位為0信號為負時,首位為1(4)對聲音采樣的頻率稱為采樣頻率:f經采樣后對每一個采樣點分配的碼字為a位,用于存儲1秒鐘的聲音信號所需的存儲容量為fa ,它也表示了傳遞聲音信號所需的速率。2021/8/2637例:設聲音信號的采樣頻率為10KHz,PCM編碼所分配碼字長度為8bit,傳送該聲
8、音信號所需的傳遞速率應不低于 101038=8104 bits2021/8/2638(5)PCM錄音及其聲音合成系統揚聲器AD變換器錄音 話筒大容量存儲器DA變換器2021/8/26392.采樣與量化(1)在PCM調制中,采樣頻率應是聲音信號中最高頻率的兩倍以上(2)聲音信號中包括有多種不同的頻率成分,為使各種不同的頻率成分都能很好地傳遞、呈現,所需的帶寬應是 20Hz-20KHz 采樣頻率應選為40Hz(3)對于連續的聲音信息,由于其相關性,通過前、后的有關信息可以實現信息的預測和識別,聲音合成時采樣頻率選為8KHz就足夠了(至多10KHz)2021/8/2640(4)PCM編碼中,除需要以
9、一定的頻率進行采樣外,還需要對每一個樣本進行量化,分配一定的碼字(5)量化的精度,即分配碼字的長度,對聲音的失真度有很大影響。 2021/8/2641聲音信號與量化精度的關系2021/8/2642量化噪音與量化精度,即分配碼字長度a之間有如下關系: 6(a-1)dB 例如:要求噪音的信噪比SN不低于60dB 6(a-1)=60 a=11說明:在PCM編碼時,分配的碼字長度應不低于11bit2021/8/2643如采樣頻率為10kHz 分配的碼字長度為11bit,記錄1秒鐘的聲音信息所需要的存儲容量為: 1110103=110(kb)若以字節計算,記錄1分鐘的聲音信號所需存儲容量: 110103
10、8=14(KB)40KB的存儲容量,只能存3秒鐘2021/8/26443.高頻濾波為提高聲音合成效果,進行預處理: 采樣頻率為f 將聲音信號中高于f2的高頻成分濾掉, 這種處理是通過低通濾波器完成2021/8/2645低通濾波器2021/8/2646四、增量調制2021/8/26471.基本原理 增量調制是一種以最低的一位數進行數據壓縮的編碼方式 在DM系統中,應預先確定具有一定振幅值的增量,并根據當前信號與基于預測編碼的預測值之間的差值進行編碼。 設當前時刻n的聲音信號值為Sn ,基于預測編碼的n-1時刻的聲音信號預測值為Sn-1其間的誤差值en 為 en = Sn -Sn-1 en為預測誤
11、差2021/8/2648 預測編碼是按照不斷減少預測誤差的方向進行編碼的,通過編碼,使預測值Sn-1不斷逼近Sn 在DM方式中,預測值是以 Sn = Sn-1+ 確定的下面以聲音信號采樣序列: 4,5,1,0,3在編碼前,應預先確定增量, 設=2,并給定編碼的初始條件為S0=02021/8/26492021/8/2650 n=1時刻: 聲音信號為4,由于初始條件為S0=0 e1=S1 - S0 =4-0=4由于e10 分配增量 =2,以碼字0表示, 預測值為 S1= S0 + =22021/8/2651n=2時刻: 聲音信號為5,預測誤差為 e2=S2 S1 =5-2=3由于e20 分配增量
12、=2,以碼字1表示, 預測值為 S2= S1 + =42021/8/2652n=3時刻: 聲音信號為1,預測誤差為 e3=S3 S2 =1-4= -3由于e30 分配增量為- ,以碼字0表示, 預測值為 S3= S2 - =4-2=2聲音信號、預測值、預測誤差與碼字序列及其相互間的關系如下圖所示2021/8/2653DM方式的信號波形2021/8/2654l通過上述DM編碼的過程,可得到聲音信號的DM編碼的0、1符號序列。根據這樣的符號序列,通過DM編碼的逆操作,可進行解碼,恢復原聲音信號。l例如, =2的情況下,接收的碼字序列為“1101 1100”,當碼字“1”到來時,進行+2的操作,當碼
13、字“0”到來時,進行-2的操作,由此可得到解調后的聲音信號為“2,4,2,4,6,8,6,4”。2021/8/26552021/8/26562.粒狀噪聲與超載噪聲 增量調制是一種一位數的編碼方式,它根據預測誤差的正、負分配相應的 在很多情況下,信號的變化很小,甚至不變,在這種情況下,DM編碼仍然要分配+或-.2021/8/26572.粒狀噪聲與超載噪聲2021/8/2658l如上圖,在原聲音信號不變,或緩慢變化時,DM編碼的碼字序列卻是010101這樣變化的碼字序列。l這種變化的0、1序列,經解碼后產生一種 噪聲,對原聲音符號的音質造成一定的影響,稱這種噪聲為粒狀噪聲(GranularNois
14、e)。為了減小粒狀噪聲的影響,應減小增量的幅度。顯然, 的幅度越小,粒狀噪音越小。2021/8/2659l當增量的幅值減小時,會給DM方式的聲音信號帶來超載噪聲(OverloadNoise)l對于一定的增量幅值,當聲音信號變化比較大時,DM編碼信號值的變化跟不上聲音信號的變化,使得編碼信號值的變化比原聲音信號產生一種延遲 如圖所示2021/8/2660超載噪聲2021/8/2661 為了減少超載噪聲應增大增量的幅值,這與減小粒狀噪聲是相矛盾的。 一般地,人們對超載噪聲噪聲的感知不太敏感,而粒狀噪聲在整個頻譜范圍上都會產生一定的影響,它對音質的影響較大。因此,在決定增量的幅值時,與實際的聲音信號大小相比較,應選擇增量足夠小的幅值 增量的幅值過小,必將使超載噪聲增加,為減少超載噪聲,可增加采樣頻率,使得在一定的采樣間隔內聲音信號的變化減
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權】 ISO 10254:2025 EN Air cargo and ground equipment - Vocabulary
- 公司沙龍diy蛋糕活動方案
- 公司組團戶外活動方案
- 公司法律宣傳月活動方案
- 公司游泳池活動方案
- 公司登高運動策劃方案
- 公司約客活動策劃方案
- 公司更名征集活動方案
- 公司春節福利活動方案
- 公司消保活動策劃方案
- 2024年深圳市中考語文試卷真題(含答案解析)
- “扣子”智能體在高中生物學教學中的應用
- 電信通信設備的應急維修
- 新能源汽車充電站建設合作協議
- 出院病人終末消毒流程
- 山西焦煤招聘2025筆試題庫
- star法則培訓課件
- 手術室護士自我簡介
- 地下管線保護和加固措施
- 廣告公司分支機構合同
- 2024年新課標培訓2022年小學英語新課標學習培訓課件
評論
0/150
提交評論