音頻基礎知識.doc_第1頁
音頻基礎知識.doc_第2頁
音頻基礎知識.doc_第3頁
音頻基礎知識.doc_第4頁
音頻基礎知識.doc_第5頁
已閱讀5頁,還剩7頁未讀 繼續免費閱讀

音頻基礎知識.doc.doc 免費下載

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

.音頻,英文是AUDIO,也許你會在錄像機或VCD的背板上看到過AUDIO輸出或輸入口。這樣我們可以很通俗地解釋音頻,只要是我們聽得見的聲音,就可以作為音頻信號進行傳輸。有關音頻的物理屬性由于過于專業,請大家參考其他資料。自然界中的聲音非常復雜,波形極其復雜,通常我們采用的是脈沖代碼調制編碼,即PCM編碼。PCM通過采樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字編碼。一、音頻基本概念1、 什么是采樣率和采樣大小(位/bit)。聲音其實是一種能量波,因此也有頻率和振幅的特征,頻率對應于時間軸線,振幅對應于電平軸線。波是無限光滑的,弦線可以看成由無數點組成,由于存儲空間是相對有限的,數字編碼過程中,必須對弦線的點進行采樣。采樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率信息更豐富,為了復原波形,一次振動中,必須有2個點的采樣,人耳能夠感覺到的最高頻率為20kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行40k次采樣,用40kHz表達,這個40kHz就是采樣率。我們常見的CD,采樣率為44.1kHz。光有頻率信息是不夠的,我們還必須獲得該頻率的能量值并量化,用于表示信號強度。量化電平數為2的整數次冪,我們常見的CD位16bit的采樣大小,即2的16次方。采樣大小相對采樣率更難理解,因為要顯得抽象點,舉個簡單例子:假設對一個波進行8次采樣,采樣點分別對應的能量值分別為A1-A8,但我們只使用2bit的采樣大小,結果我們只能保留A1-A8中4個點的值而舍棄另外4個。如果我們進行3bit的采樣大小,則剛好記錄下8個點的所有信息。采樣率和采樣大小的值越大,記錄的波形更接近原始信號。2、有損和無損根據采樣率和采樣大小可以得知,相對自然界的信號,音頻編碼最多只能做到無限接近,至少目前的技術只能這樣了,相對自然界的信號,任何數字音頻編碼方案都是有損的,因為無法完全還原。在計算機應用中,能夠達到最高保真水平的就是PCM編碼,被廣泛用于素材保存及音樂欣賞,CD、DVD以及我們常見的WAV文件中均有應用。因此,PCM約定俗成了無損編碼,因為PCM代表了數字音頻中最佳的保真水準,并不意味著PCM就能夠確保信號絕對保真,PCM也只能做到最大程度的無限接近。我們而習慣性的把MP3列入有損音頻編碼范疇,是相對PCM編碼的。強調編碼的相對性的有損和無損,是為了告訴大家,要做到真正的無損是困難的,就像用數字去表達圓周率,不管精度多高,也只是無限接近,而不是真正等于圓周率的值。3、為什么要使用音頻壓縮技術要算一個PCM音頻流的碼率是一件很輕松的事情,采樣率值采樣大小值聲道數 bps。一個采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的WAV文件,它的數據速率則為 44.1K162 =1411.2 Kbps。我們常說128K的MP3,對應的WAV的參數,就是這個1411.2 Kbps,這個參數也被稱為數據帶寬,它和ADSL中的帶寬是一個概念。將碼率除以8,就可以得到這個WAV的數據速率,即176.4KB/s。這表示存儲一秒鐘采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的音頻信號,需要176.4KB的空間,1分鐘則約為10.34M,這對大部分用戶是不可接受的,尤其是喜歡在電腦上聽音樂的朋友,要降低磁盤占用,只有2種方法,降低采樣指標或者壓縮。降低指標是不可取的,因此專家們研發了各種壓縮方案。由于用途和針對的目標市場不一樣,各種音頻壓縮編碼所達到的音質和壓縮比都不一樣,在后面的文章中我們都會一一提到。有一點是可以肯定的,他們都壓縮過。4、頻率與采樣率的關系采樣率表示了每秒對原始信號采樣的次數,我們常見到的音頻文件采樣率多為44.1KHz,這意味著什么呢?假設我們有2段正弦波信號,分別為20Hz和20KHz,長度均為一秒鐘,以對應我們能聽到的最低頻和最高頻,分別對這兩段信號進行40KHz的采樣,我們可以得到一個什么樣的結果呢?結果是:20Hz的信號每次振動被采樣了40K/20=2000次,而20K的信號每次振動只有2次采樣。顯然,在相同的采樣率下,記錄低頻的信息遠比高頻的詳細。這也是為什么有些音響發燒友指責CD有數碼聲不夠真實的原因,CD的44.1KHz采樣也無法保證高頻信號被較好記錄。要較好的記錄高頻信號,看來需要更高的采樣率,于是有些朋友在捕捉CD音軌的時候使用48KHz的采樣率,這是不可取的!這其實對音質沒有任何好處,對抓軌軟件來說,保持和CD提供的44.1KHz一樣的采樣率才是最佳音質的保證之一,而不是去提高它。較高的采樣率只有相對模擬信號的時候才有用,如果被采樣的信號是數字的,請不要去嘗試提高采樣率。5、流特征隨著網絡的發展,人們對在線收聽音樂提出了要求,因此也要求音頻文件能夠一邊讀一邊播放,而不需要把這個文件全部讀出后然后回放,這樣就可以做到不用下載就可以實現收聽了。也可以做到一邊編碼一邊播放,正是這種特征,可以實現在線的直播,架設自己的數字廣播電臺成為了現實。幾個補充概念:什么是分頻器?分頻器是指將不同頻段的聲音信號區分開來,分別給于放大,然后送到相應頻段的揚聲器中再進行重放。在高質量聲音重放時,需要進行電子分頻處理。 它可分為兩種:(1)功率分頻器:位于功率放大器之后,設置在音箱內,通過LC濾波網絡,將功率放大器輸出的功率音頻信號分為低音,中音和高音,分別送至各自揚聲器。連接簡單,使用方便,但消耗功率,出現音頻谷點,產生交*失真,它的參數與揚聲器阻抗有的直接關系,而揚聲器的阻抗又是頻率的函數,與標稱值偏離較大,因此誤差也較大,不利于調整。(2)電子分頻器:將音頻弱信號進行分頻的設備,位于功率放大器前,分頻后再用各自獨立的功率放大器,把每一個音頻頻段信號給予放大,然后分別送到相應的揚聲器單元。因電流較小故可用較小功率的電子有源濾波器實現,調整較容易,減少功率損耗,及揚聲器單元之間的干擾。使得信號損失小,音質好。但此方式每路要用獨立的功率放大器,成本高,電路結構復雜,運用于專業擴聲系統。(摘自av_world) 什么是激勵器?激勵器是一種諧波發生器,利用人的心理聲學特性,對聲音信號進行修飾和美化的聲處理設備。通過給聲音增加高頻諧波成分等多種方法,可以改善音質、音色、提高聲音的穿透力,增加聲音的空間感。現代激勵器不僅可以創造出高頻諧波,而且還具有低頻擴展和音樂風格等功能,使低音效果更加完美、音樂更具表現力。使用激勵器提高聲音的清晰度,可懂性和表現力。使聲音更加悅耳動聽,降低聽音疲勞,增加響度。雖然激勵器只給聲音增加了0.5dB左右的諧波成分,但實際聽起來,音量好像增加了10dB左右。使聲音的聽覺響度明顯增加,聲音圖像的立體感,以及聲音的分離度的增加;改善了聲音的定位和層次感,還可以提高重放聲音的音質,磁帶的復制率。因為聲信號在傳送和錄制過程中會損失高頻諧波成分,出現高頻噪聲。此時前者用激勵器先對信號進行補償,后者可用濾波器將高頻噪聲濾掉后,再營造出高音成分,保證重放音質。 激勵器的調節需要音響師對系統的音質和音色進行判別,再根據主觀聽音評價進行調整。( 什么是均衡器?均衡器是一種可以分別調節各種頻率成分電信號放大量的電子設備,通過對各種不同頻率的電信號的調節來補償揚聲器和聲場的缺陷,補償和修飾各種聲源及其它特殊作用,一般調音臺上的均衡器僅能對高頻、中頻、低頻三段頻率電信號分別進行調節。均衡器分為三類:圖示均衡器,參量均衡器和房間均衡器。1圖示均衡器:亦稱圖表均衡器,通過面板上推拉鍵的分布,可直觀地反映出所調出的均衡補償曲線,各個頻率的提升和衰減情況一目了然,它采用恒定Q值技術,每個頻點設有一個推拉電位器,無論提升或衰減某頻率,濾波器的頻帶寬始終不變。常用的專業圖示均衡器則是將20Hz20kHz的信號分成10段、15段、27段、31段來進行調節。這樣人們根據不同的要求分別選擇不同段數的頻率均衡器。一般來說10段均衡器的頻率點以倍頻程間隔分布,使用在一般場合下,15段均衡器是2/3倍頻程均衡器,使用在專業擴聲上,31段均衡器是1/3倍頻程均衡器,多數有在比較重要的需要精細補償的場合下,圖示均衡器結構簡單,直觀明了,故在專業音響中應用非常廣泛。2參量均衡器:亦稱參數均衡器,對均衡調節的各種參數都可細致調節的均衡器,多附設在調音臺上,但也有獨立的參量均衡器,調節的參數內容包括頻段、頻點、增益和品質因數Q值等,可以美化(包括丑化)和修飾聲音,使聲音(或音樂)風格更加鮮明突出,豐富多彩達到所需要的藝術效果。3房間均衡器,用于調整房間內的頻率響應特性曲線的均衡器,由于裝飾材料對不同頻率的吸收(或反射)量不同以及簡正共振的影響造成聲染色,所以必須用房間均衡器對由于建聲方面的頻率缺陷加以客觀地補償調節。 頻段分得越細,調節的峰越尖銳,即Q值(品質因數)越高,調節時補償得越細致,頻段分的越粗則調節的峰就比較寬,當聲場傳輸頻率特性曲線比較復雜時較難補償。( 什么是壓縮限幅器?壓縮限幅器是壓縮器和限幅器的統稱。它是音頻信號的一種處理設備,可以將音頻電信號的動態進行壓縮或進行限制。壓縮器為可變增益放大器,其放大倍數(增益)可以隨輸入信號的強弱而自動變化,是成反比的。當輸入信號達到一定程度(閾值也稱臨界值)時,輸出信號隨輸入信號的增加而增加,這種情況稱為壓縮(Compressor);不再增加則稱為限制(Limiter)。過去的壓限器采用硬拐點(Hard-knee)技術,輸入信號一達到閾值。增益就立即減少,這樣就會出現信號在拐點(增益變化的轉折點)處動態突變現象,使人耳明顯地感覺到強信號被突然壓縮的現象。為了解決這一不足,現代新型壓限器采用了軟拐點(soft-knee)技術,這種壓限器在閾值前后的壓縮比變化是平衡的,漸變的,使壓縮變化難以察覺,音質進一步提高。壓限器在錄音過程中可以使樂器和歌唱者的音量保持一定的平衡;保證各種信號強度的均衡。有時也用來消除歌唱者的口齒聲,或利用改變壓縮和釋放時間,產生聲音由小變大的“反轉聲”特殊效果。在廣播系統中是用它來壓縮較大動態范圍的節目信號在防止調制失真和防止發射機過載的前提下,提高平均發射電平。在歌舞廳的擴聲系統中,壓限器是將信號通過壓縮在保持原節目的風貌下,降低音樂的動態,以滿足擴聲系統和藝術活動的要求。雖然壓限器有多種用途,現代壓縮器普通采用了軟拐點等新技術,可進一步減小壓限器的壓縮器的副作用,但是并不意味著壓限器對音質的破壞作用就已不復存在了。所以,在擴聲系統中,不要濫用壓限器,即使要用也應該慎用減少用壓限器對信號進行處理。這不僅是保護功放、音箱的需要,也是對改善音質的需要。 什么是信噪比(S/N)?信噪比指的是線路中某一參考點的信號功率與無信號時固有的噪音功率之比值,用分貝(dB)表示,其數值越高越好,表示雜音起少。什么是分貝分貝(dB)為表示相對功率或幅度電平的標準單位。用dB表示。 分貝數越大代表的所發出的聲音越大,分貝在計算上是每增加 10 分貝,則聲音大小約是原來的十倍。dB: deciBel分貝。用以表達兩個電壓、功率或聲音的相對水準。dBm: 分貝的一個變種,0dB = 1mW into 600 OhmsdBv: 分貝的一個變種,0dB = 0.775 volts.dBV: 分貝的一個變種,0dB = 1 volt.dB/Octave: 分貝/八度。濾波器斜率的表達方式,每個八度的分貝數越大說明斜線更陡直。這個概念相對較為復雜,我們用物理學計算來說明:為了表示聲音的強弱程度,人們引入了“聲強”的概念,并用1秒內垂直穿過單位面積的聲能多少來量度它的大小,聲強用字母“I”表示,它的單位是“瓦米2”。根據規定可知,如果1秒內垂直穿過單位面積的聲能加倍,那么聲強的值也變為原來的2倍。所以說聲強是不隨人們感覺而轉移的客觀物理量。雖然聲強是個客觀物理量,但是聲強的大小和人們主觀感到的聲音強弱,卻有非常大的差異。為了符合人們對聲音強弱的主觀感覺,物理學里又引入了“聲強級”的概念,分貝就是聲強級的一個單位,它是貝爾的十分之一。聲強級又是怎樣規定的呢?它和聲強有什么關系呢?測量證明,人耳對不同頻率的聲波,敏感程度是不同的。對于3000赫茲的聲波最敏感。只要這個頻率的聲強達到I01012瓦米2,就能引起人耳的聽覺。聲強級就是以人耳能聽到的這個最小聲強I0為基準規定的,并把I01012瓦米2的聲強規定為零級聲強,也就是說這時的聲強級為零貝爾(也是零分貝)。當聲強由I0加倍為2I0時,人耳感到的聲音強弱并沒有加倍。只有當聲強達到10I0時,人耳感到的聲音強弱才增大一倍,這個聲強對應的聲強級為1貝爾10分貝;當聲強變為100I0時,人耳感到的聲音強弱增大2倍,對應的聲強級為2貝爾20分貝;當聲強變為1000I0時,人耳感到的聲音強弱增大3倍,對應的聲強級為3貝爾30分貝,依此類推。人耳能承受的最大聲強為1瓦米21012I0,它對應的聲強級為12貝爾120分貝。公式:聲壓級(dB)=20Lg(測量到的聲壓/參考聲壓值)老魚注:當測量到的和參考聲壓一樣大小時,取對數后的計算結果就是0dB。在模擬的音頻設備上,是可以大于過0dB的,但數字設備沒有,數字計算需要一個量度,無限的值是沒有的。所以在我們用的數字設備和軟件中,0dB成了一個參考標準值。二、常見音頻格式及播放器介紹 主流音頻格式的特點及其適應性各種各樣的音頻編碼都有其技術特征及不同場合的適用性,我們大致講解一下如何去靈活應用這些音頻編碼。4-1 PCM編碼的WAV前面就提到過,PCM編碼的WAV文件是音質最好的格式,Windows平臺下,所有音頻軟件都能夠提供對她的支持。Windows提供的WinAPI中有不少函數可以直接播放wav,因此,在開發多媒體軟件時,往往大量采用wav,用作事件聲效和背景音樂。PCM編碼的wav可以達到相同采樣率和采樣大小條件下的最好音質,因此,也被大量用于音頻編輯、非線性編輯等領域。特點:音質非常好,被大量軟件所支持。適用于:多媒體開發、保存音樂和音效素材。4-2 MP3MP3具有不錯的壓縮比,使用LAME編碼的中高碼率的mp3,聽感上已經非常接近源WAV文件。使用合適的參數,LAME編碼的MP3很適合于音樂欣賞。由于MP3推出年代已久,加之還算不錯的音質及壓縮比,不少游戲也使用mp3做事件音效和背景音樂。幾乎所有著名的音頻編輯軟件也提供了對MP3的支持,可以將mp3象wav一樣使用,但由于mp3編碼是有損的,因此多次編輯后,音質會急劇下降,mp3并不適合保存素材,但作為作品的demo確實相當優秀的。mp3長遠的歷史和不錯的音質,使之成為應用最廣的有損編碼之一,網絡上可以找到大量的mp3資源,mp3player日漸成為一種時尚。不少VCDPlayer、DVDPlayer甚至手機都可以播放mp3,mp3是被支持的最好的編碼之一。MP3也并非完美,在較低碼率下表現不好。MP3也具有流媒體的基本特征,可以做到在線播放。特點:音質好,壓縮比比較高,被大量軟件和硬件支持,應用廣泛。適用于:適合用于比較高要求的音樂欣賞。4-3 OGGOgg是一種非常有潛力的編碼,在各種碼率下都有比較驚人的表現,尤其中低碼率下。Ogg除了音質好之外,她還是一個完全免費的編碼,這對ogg被更多支持打好了基礎。Ogg有著非常出色的算法,可以用更小的碼率達到更好的音質,128kbps的Ogg比192kbps甚至更高碼率的mp3還要出色。Ogg的高音具有一定的金屬味道,因此在編碼一些高頻要求很高的樂器獨奏時,Ogg的這個缺陷會暴露出來。OGG具有流媒體的基本特征,但現在還沒有媒體服務軟件支持,因此基于ogg的數字廣播還無法實現。Ogg目前的被支持的情況還不夠好,無論是軟件的還是硬件的,都無法和mp3相提并論。特點:可以用比mp3更小的碼率實現比mp3更好的音質,高中低碼率下均具有良好的表現。適用于:用更小的存儲空間獲得更好的音質(相對MP3)4-4 MPC和OGG一樣,MPC的競爭對手也是mp3,在中高碼率下,MPC可以做到比競爭對手更好音質,在中等碼率下,MPC的表現不遜色于Ogg,在高碼率下,MPC的表現更是獨孤求敗,MPC的音質優勢主要表現在高頻部分,MPC的高頻要比MP3細膩不少,也沒有Ogg那種金屬味道,是目前最適合用于音樂欣賞的有損編碼。由于都是新生的編碼,和Ogg際遇相似,也缺乏廣泛的軟件和硬件支持。MPC有不錯的編碼效率,編碼時間要比OGG和LAME短不少。特點:中高碼率下,具有有損編碼中最佳的音質表現,高碼率下,高頻表現極佳適用于:在節省大量空間的前提下獲得最佳音質的音樂欣賞。4-6 WMA微軟開發的WMA同樣也是不少朋友所喜愛的,在低碼率下,有著好過mp3很多的音質表現,WMA的出現,立刻淘汰了曾經風靡一時的VQF編碼。有微軟背景的WMA獲得了很好的軟件及硬件支持,Windows Media Player就能夠播放WMA,也能夠收聽基于WMA編碼技術的數字電臺。因為播放器幾乎存在于每一臺PC上,越來越多的音樂網站都樂意使用WMA作為在線試聽的首選了。除了支持環境好之外,WMA在64-128kbps碼率下也具有相當出色的表現,雖然不少要求較高的朋友并不夠滿意,但更多要求不高的朋友接受了這種編碼,WMA很快的普及開了。特點:低碼率下的音質表現難有對手適用于:數字電臺架設、在線試聽、低要求下的音樂欣賞4-7 mp3PRO作為mp3的改良版本的mp3PRO表現出了相當不錯的素質,高音豐滿,雖然mp3PRO是通過SBR技術在播放過程中插入的,但實際聽感相當不錯,雖然顯得有點單薄,但在64kbps的世界里已經沒有對手了,甚至超過了128kbps的mp3,但很遺憾的是,mp3PRO的低頻表現也象mp3一樣的破,所幸的是,SBR的高頻插值可以或多或少的掩蓋掉這個缺陷,因此mp3PRO的低頻弱勢反而不如WMA那么明顯。大家可以在使用RCA mp3PRO Audio Player的PRO開關來切換PRO模式和普通模式時深深的感覺到。整體而言,64kbps的mp3PRO達到了128kbps的mp3的音質水平,在高頻部分還略有勝出。特點:低碼率下的音質之王適用于:低要求下的音樂欣賞4-8 APE一種新興的無損音頻編碼,可以提供50-70%的壓縮比,雖然比起有損編碼來太不值得一提了,但對于追求完美注意的朋友簡直是天大的福音。APE可以做到真正的無損,而不是聽起來無損,壓縮比也要比類似的無損格式要好。特點:音質非常好。適用于:最高品質的音樂欣賞及收藏。 三、音頻信號的編碼處理1、PCM編碼PCM 脈沖編碼調制是Pulse Code Modulation的縮寫。前面的文字我們提到了PCM大致的工作流程,我們不需要關心PCM最終編碼采用的是什么計算方式,我們只需要知道PCM編碼的音頻流的優點和缺點就可以了。PCM編碼的最大的優點就是音質好,最大的缺點就是體積大。我們常見的Audio CD就采用了PCM編碼,一張光盤的容量只能容納72分鐘的音樂信息。大家知道,無論現在的多媒體電腦功能如何強大,其內部也只能處理數字信息。而我們聽到的聲音都是模擬信號,怎樣才能讓電腦也能處理這些聲音數據呢?還有,究竟模擬音頻與數字音頻有什么不同呢?數字音頻究竟有些什么優點呢?這些都是我們下面所要介紹的。把模擬音頻轉成數字音頻,在電腦音樂里就稱作采樣,其過程所用到的主要硬件設備便是模擬/數字轉換器(Analog to Digital Converter,即ADC)。采樣的過程實際上是將通常的模擬音頻信號的電信號轉換成許多稱作“比特(Bit)”的二進制碼0和1,這些0和1便構成了數字音頻文件。如下圖,圖中的正弦曲線代表原始音頻曲線;填了顏色的方格代表采樣后得到的結果,二者越吻合說明采樣結果越好。 上圖中的橫坐標便是采樣頻率;縱坐標便是采樣分辨率。圖中的格子從左到右,逐漸加密,先是加大橫坐標的密度,然后加大縱坐標的密度。顯然,當橫坐標的單位越小即兩個采樣時刻的間隔越小,則越有利于保持原始聲音的真實情況,換句話說,采樣的頻率越大則音質越有保證;同理,當縱坐標的單位越小則越有利于音質的提高,即采樣的位數越大越好。有一點請大家注意,8位(8Bit)不是說把縱坐標分成8份,而是分成28256份;同理16位是把縱坐標分成21665536份;而24位則分成224=16777216份。現在我們來進行一個計算,看看一個數字音頻文件的數據量到底有多大。假設我們是用44.1kHz、16bit來進行立體聲(即兩個聲道) 2、WAVE這是一種古老的音頻文件格式,由微軟開發。WAV是一種文件格式,符合 PIFF Resource Interchange File Format規范。所有的WAV都有一個文件頭,這個文件頭音頻流的編碼參數。WAV對音頻流的編碼沒有硬性規定,除了PCM之外,還有幾乎所有支持ACM規范的編碼都可以為WAV的音頻流進行編碼。很多朋友沒有這個概念,我們拿AVI做個示范,因為AVI和WAV在文件結構上是非常相似的,不過AVI多了一個視頻流而已。我們接觸到的AVI有很多種,因此我們經常需要安裝一些Decode才能觀看一些AVI,我們接觸到比較多的DivX就是一種視頻編碼,AVI可以采用DivX編碼來壓縮視頻流,當然也可以使用其他的編碼壓縮。同樣,WAV也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示WAV只能使用PCM編碼,MP3編碼同樣也可以運用在WAV中,和AVI一樣,只要安裝好了相應的Decode,就可以欣賞這些WAV了。在Windows平臺下,基于PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持,由于本身可以達到較高的音質的要求,因此,WAV也是音樂編輯創作的首選格式,適合保存音樂素材。因此,基于PCM編碼的WAV被作為了一種中介的格式,常常使用在其他編碼的相互轉換之中,例如MP3轉換成WMA。3、MP3編碼MP3作為目前最為普及的音頻壓縮格式,為大家所大量接受,各種與MP3相關的軟件產品層出不窮,而且更多的硬件產品也開始支持MP3,我們能夠買到的VCD/DVD播放機都很多都能夠支持MP3,還有更多的便攜的MP3播放器等等,雖然幾大音樂商極其反感這種開放的格式,但也無法阻止這種音頻壓縮的格式的生存與流傳。MP3發展已經有10個年頭了,他是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3的簡稱,是MPEG1的衍生編碼方案,1993年由德國Fraunhofer IIS研究院和湯姆生公司合作發展成功。MP3可以做到12:1的驚人壓縮比并保持基本可聽的音質,在當年硬盤天價的日子里,MP3迅速被用戶接受,隨著網絡的普及,MP3被數以億計的用戶接受。MP3編碼技術的發布之初其實是非常不完善的,由于缺乏對聲音和人耳聽覺的研究,早期的mp3編碼器幾乎全是以粗暴方式來編碼,音質破壞嚴重。隨著新技術的不斷導入,mp3編碼技術一次一次的被改良,其中有2次重大技術上的改進。VBR:MP3格式的文件有一個有意思的特征,就是可以邊讀邊放,這也符合流媒體的最基本特征。也就是說播放器可以不用預讀文件的全部內容就可以播放,讀到哪里播放到哪里,即使是文件有部分損壞。雖然mp3可以有文件頭,但對于mp3格式的文件卻不是很重要,正因為這種特性,決定了MP3文件的每一段每一幀都可以單獨的平均數據速率,而無需特別的解碼方案。于是出現了一種叫VBR(Variable bitrate,動態數據速率)的技術,可以讓MP3文件的每一段甚至每一幀都可以有單獨的bitrate,這樣做的好處就是在保證音質的前提下最大程度的限制了文件的大小。這種技術的優越性是顯而易見的,但要運用確實是一件難事,因為這要求編碼器知道如何為每一段分配bitrate,這對沒有波形分析的編碼器而言,這種技術如同虛設。正是如此,VBR技術并沒有一出現就顯得光彩奪目。專家們通過長期的聲學研究,發現人耳存在遮蔽效應。聲音信號實際是一種能量波,在空氣或其他媒介中傳播,人耳對聲音能量的多少即響度或聲壓最直接的反應就是聽到這個聲音的大小,我們稱它為響度,表示響度這種能量的單位為分貝(dB)。即使是同樣響度的聲音,人們也會因為它們頻率不同而感覺到聲音大小不同。人耳最容易聽到的就是4000Hz的頻率,不管頻率是否增高或降低,即使是響度在相同的情況下,大家都會覺得聲音在變小。但響度降到一定程度時,人耳就聽不到了,每一個頻率都有著不同的值。 可以看到這條曲線基本成一個V字型,當頻率超過15000Hz時,人耳的會感覺到聲音很小,很多聽覺不是很好的人,根本就聽不到20000Hz的頻率,不管響度有多大。當人耳同時聽到兩個不同頻率、不同響度的聲音時,響度較小的那個也會被忽略,例如:在白天我們很難聽到電腦中散熱風扇的聲音,晚上卻成了噪聲源,根據這種原理,編碼器可以過濾掉很多聽不到的聲音,以簡化信息復雜度,增加壓縮比,而不明顯的降低音質。這種遮蔽被稱為同時遮蔽效應。但聲音A被聲音B遮蔽,如果A處于B為中心的遮蔽范圍內,遮蔽會更明顯,這個范圍叫臨界帶寬。每一種頻率的臨界帶寬都不一樣,頻率越高的臨界帶寬越寬。根據這種效應,專家們設計出人耳聽覺心理模型,這個模型被導入到mp3編碼中后,導致了一場翻天覆地的音質革命,mp3編碼技術一直背負著音質差的惡名,但這個惡名現在已經逐漸被洗脫。到了此時,一直被埋沒的VBR技術光彩四射,配合心理模型的運用便現實出強大的誘惑力與殺傷力。長期來,很多人對MP3印象不好,更多人認為WMA的最佳音質要好過MP3,這種說法是不正確的,在中高碼率下,編碼得當的MP3要比WMA優秀很多,可以非常接近CD音質,在不太好的硬件設備支持下,沒有多少人可以區分兩者的差異,這不是神話故事,盡管你以前盲聽就可以很輕松區分MP3和CD,但現在你難保證你可以分辨正確。因為MP3是優秀的編碼,以前被埋沒了。4、OGG編碼網絡上出現了一種叫Ogg Vorbis的音頻編碼,號稱MP3殺手!Ogg Vorbis究竟什么來頭呢?OGG是一個龐大的多媒體開發計劃的項目名稱,將涉及視頻音頻等方面的編碼開發。整個OGG項目計劃的目的就是向任何人提供完全免費多媒體編碼方案!OGG的信念就是:OPEN!FREE!Vorbis這個詞匯是特里普拉特柴特的幻想小說Small Gods中的一個花花公子人物名。這個詞匯成為了OGG項目中音頻編碼的正式命名。目前Vorbis已經開發成功,并且開發出了編碼器。Ogg Vorbis是高質量的音頻編碼方案,官方數據顯示:Ogg Vorbis可以在相對較低的數據速率下實現比MP3更好的音質!Ogg Vorbis這種編碼也遠比90年代開發成功的MP3先進,她可以支持多聲道,這意味著什么?這意味著Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓軌軟件(目前這種軟件還沒有)的支持下,可以對所有的聲道進行編碼,而不是MP3只能編碼2個聲道。多聲道音樂的興起,給音樂欣賞帶來了革命性的變化,尤其在欣賞交響時,會帶來更多臨場感。這場革命性的變化是MP3無法適應的。和MP3一樣,Ogg Vorbis是一種靈活開放的音頻編碼,能夠在編碼方案已經固定下來后還能對音質進行明顯的調節和新算法的改良。因此,它的聲音質量將會越來越好,和MP3相似,Ogg Vorbis更像一個音頻編碼框架,可以不斷導入新技術逐步完善。和MP3一樣,OGG也支持VBR。5、MPC 編碼MPC是又是另外一個令人刮目相看的實力派選手,它的普及過程非常低調,也沒有什么復雜的背景故事,她的出現目的就只有一個,更小的體積更好的音質!MPC以前被稱作MP+,很顯然,可以看出她針對的競爭對手是誰。但是,只要用過這種編碼的人都會有個深刻的印象,就是她出眾的音質。6、mp3PRO 編碼2001年6月14日,美國湯姆森多媒體公司(Thomson Multimedia SA)與佛朗赫弗協會(Fraunhofer Institute)于6月14日發布了一種新的音樂格式版本,名稱為mp3PRO,這是一種基于mp3編碼技術的改良方案,從官方公布的特征看來確實相當吸引人。從各方面的資料顯示,mp3PRO并不是一種全新的格式,完全是基于傳統mp3編碼技術的一種改良,本身最大的技術亮點就在于SBR(Sp

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論