




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、視頻編碼技術視頻編碼技術 men aidong, multimedia telecommunication centre, bupt 運動圖象的三要素運動圖象的三要素 幀分辨率(幀分辨率(dvd圖象:圖象: 704x576704x576像素像素/幀)幀) 像素(顏色的位深,真彩像素(顏色的位深,真彩24位)位) 三原色(紅綠籃三原色(紅綠籃rgb) 亮度亮度y、色度、色度cb,cr 幀率幀率(pal:25幀幀/秒秒;ntsc:30幀幀/秒秒) men aidong, multimedia telecommunication centre, bupt 像素的數字化:像素的數字化:色彩模型色彩模型
2、 rgb模型(紅綠蘭)模型(紅綠蘭) 紅:紅:8bit 綠:綠:8bit 蘭:蘭:8bit rgb模型計算機上常用模型計算機上常用 ycrcb 模型(亮度加色差)模型(亮度加色差) 亮度:亮度: 8bit 紅色差:紅色差: 2bit(色差壓縮)(色差壓縮) 蘭色差:蘭色差: 2bit(色差壓縮)(色差壓縮) ycrcb 模型更適合圖形壓縮模型更適合圖形壓縮 men aidong, multimedia telecommunication centre, bupt 數字圖象格式:數字圖象格式:幀分辨率幀分辨率 視頻會議圖像格式圖像大小(像素 sub-qcif12896 qcif176 144 c
3、if352 288 4cif704 576 10cif(hdtv)1280 720 像素、幀率兩要像素、幀率兩要 素在數字視頻圖像格式中素在數字視頻圖像格式中 為隱含要素。為隱含要素。 men aidong, multimedia telecommunication centre, bupt 運動數字圖象采集數碼量運動數字圖象采集數碼量 1幀4cif(dvd)圖象像素:704x57640萬/幀 1像素(紅綠藍): 3x8位編碼=24bit碼率 pal制dvd圖象幀率: 25幀/秒 每秒圖象采集數碼量: 40萬/幀x 24bit x 25幀/秒=240000000bit/秒 dvd圖象原始數碼量
4、:240mbit/秒( rgb模型) vcd圖象原始數碼量:60mbit/秒 即使是即使是vcdvcd圖象如不壓縮編碼也無法在圖象如不壓縮編碼也無法在2m2m專線(專線(e1e1專線)上傳輸專線)上傳輸 men aidong, multimedia telecommunication centre, bupt 關鍵技術關鍵技術 視頻壓縮(視頻編碼)視頻壓縮(視頻編碼) 音頻壓縮(音頻編碼)音頻壓縮(音頻編碼) 交換方式與控制方式交換方式與控制方式 men aidong, multimedia telecommunication centre, bupt 視頻壓縮(視頻編碼)視頻壓縮(視頻編碼)
5、 圖象固有的統計規律圖象固有的統計規律 空間的相關性(空間冗余)空間的相關性(空間冗余) 時間的相關性(時間冗余)時間的相關性(時間冗余) 視覺、心理視覺、心理 錄入和顯示設備錄入和顯示設備 men aidong, multimedia telecommunication centre, bupt8 n 國際標準組織國際標準組織 itu (vceg) 更悠久、更專注于傳統的視頻編碼目標(例如,更悠久、更專注于傳統的視頻編碼目標(例如, 更好的壓縮和包丟失更好的壓縮和包丟失/誤碼恢復)誤碼恢復) iso/iec(mpeg) 更大、更具有雄心勃勃的目標(例如,更大、更具有雄心勃勃的目標(例如,“面
6、面 向對象視頻編碼向對象視頻編碼”、“自然分析合成混合編碼自然分析合成混合編碼”和數字電影)和數字電影) 兩者有時合作制定標準(例如,兩者有時合作制定標準(例如,iso、iec and itu 協作制定了協作制定了 mpeg-2/h.261 和和 mpeg avc/h.264) n 活躍的產業聯盟和協會活躍的產業聯盟和協會 dvd、3gpp、3gpp2、 smpte、ietf, etc. 中國的中國的 avs n 游離于正式標準之外的廠商,事實上的工業標準:游離于正式標準之外的廠商,事實上的工業標準: microsoft real networks quicktime 視頻編碼標準:視頻編碼標
7、準:視頻編碼標準組織視頻編碼標準組織 men aidong, multimedia telecommunication centre, bupt9 h.264 / mpeg4 avc h.261 h.262 / mpeg2 h.263 h.263+ h.263 + itu-t standards joint itu-t ; 去塊效去塊效 應濾波應濾波 幀內幀內 預測預測 4x4 整數整數 “idct” 當前幀當前幀 原始圖像 1. 變換變換&量化去除空間冗余量化去除空間冗余 2. 預測(運動補償)去除時間冗余預測(運動補償)去除時間冗余 3. 熵編碼去除變換系數的冗余熵編碼去除變換系數的冗余
8、men aidong, multimedia telecommunication centre, bupt11 n 運動補償:去除時間冗余運動補償:去除時間冗余 例例: 序列圖象序列圖象 視頻編碼技術:視頻編碼技術:運動補償運動補償 n動機:運動動機:運動/固定目標的大小是可變的固定目標的大小是可變的 許多小塊也可能需要花費許多比特來編碼許多小塊也可能需要花費許多比特來編碼 不同塊大小和形狀的運動補償不同塊大小和形狀的運動補償 1616 88 44 men aidong, multimedia telecommunication centre, bupt12 大小和形狀可變塊(大小和形狀可變塊
9、(7種)種) 8x8 0 4x8 01 01 23 4x48x4 1 0 8x8 types 0 16x16 01 8x16 mb types 8x8 01 23 16x8 1 0 n運動估計匹配塊的尺寸不斷縮小運動估計匹配塊的尺寸不斷縮小 h.261:1616 h.263:88 h.264:7 種可變塊大小,最小種可變塊大小,最小 44 avs:4 種可變塊大小,最小種可變塊大小,最小 88 節省了節省了15%以上的比特率以上的比特率 forema n 30fps qcif 運動補償:運動補償:發展趨勢發展趨勢 men aidong, multimedia telecommunication
10、 centre, bupt13 n運動估計參考幀的數量不斷增加運動估計參考幀的數量不斷增加 i 幀(幀內編碼)、幀(幀內編碼)、p 幀、幀、b 幀幀 多參考幀預測:假設為多參考幀預測:假設為5個參考幀預測,相對于一個參考幀來說,個參考幀預測,相對于一個參考幀來說, 可節省可節省 5% 到到 10% 比特率比特率。 h.264 p 幀、幀、b 幀前后最多幀前后最多 16 幀幀 avs p 幀前后幀前后 2 幀、幀、b 前后前后 1 幀幀 運動補償:運動補償:發展趨勢發展趨勢 men aidong, multimedia telecommunication centre, bupt14 n 變換編
11、碼:去除空間冗余。變換編碼:去除空間冗余。變換后,在變換域中,低頻系數的變換后,在變換域中,低頻系數的 能量遠大于高頻系數的能量,變換系數的相關性將大大去除。能量遠大于高頻系數的能量,變換系數的相關性將大大去除。 視頻編碼技術:視頻編碼技術:變換編碼變換編碼 men aidong, multimedia telecommunication centre, bupt15 變換變換編碼:編碼:dct(離散余弦變換離散余弦變換) n dct 快速算法是中國人陳文雄快速算法是中國人陳文雄 (1977) 提出提出 n llm 快速快速 dct 算法算法 (loeffler, ligtenberg and
12、 moschytz,1989) 此算法需要此算法需要 11 次乘法和次乘法和 29 次加法次加法 men aidong, multimedia telecommunication centre, bupt16 變換變換編碼:編碼: dct 變換的尺寸變換的尺寸 2*2 4*4 8*8 16*16 32*32 64*64 子塊子塊 尺寸尺寸 位位/象素象素 2.52.5 2.02.0 1.51.5 1.01.0 n dct 編碼效率和尺寸之間的關系是單調曲線,其拐點在編碼效率和尺寸之間的關系是單調曲線,其拐點在 44、88、1616 區段區段 n 需要根據圖像分辨率(需要根據圖像分辨率(qcif
13、、cif、sdtv、hdtv或數或數 字電影)選擇字電影)選擇 dct 變換塊的大小。變換塊的大小。 44 更適宜于小尺寸圖像,相應的塊效應主觀感覺也會減弱更適宜于小尺寸圖像,相應的塊效應主觀感覺也會減弱 4 44 4 更好的運動補償,意味著更小的空間相關性更好的運動補償,意味著更小的空間相關性 n h.264 有有 44、88 變換塊變換塊 n avs avs 有有 8 88 8 變換塊變換塊 men aidong, multimedia telecommunication centre, bupt17 變換變換編碼:編碼: dct 變換的復雜度變換的復雜度 n 傳統的傳統的 dct 變換變
14、換 dct 需要實數運算,反變換中引起了精度的損失。需要實數運算,反變換中引起了精度的損失。 n h.264、avs 等使用了非常簡單的等使用了非常簡單的44或或88 整數變換整數變換: 對傳統對傳統 dct 非常精巧的逼近非常精巧的逼近 變換矩陣只包含變換矩陣只包含 +/-1 和和 +/-2 計算只需要加法、減法和移位計算只需要加法、減法和移位 n 結果顯示僅有可以忽略不計的質量損失結果顯示僅有可以忽略不計的質量損失 (0.02db) 差值圖像基于 4x4 整數變換: 主類:自適應塊大小變換(8x4, 4x8, 8x8) 對于 8x8 色度和 16x16 幀內亮度塊dc 系數再次變 換(re
15、peated transform) 1111 2112 1111 1221 h men aidong, multimedia telecommunication centre, bupt18 上下文上下文 模型模型 二進制化二進制化 概率概率 估計估計 編碼編碼 引擎引擎 更新概率估計更新概率估計 自適應二進制算術編碼器自適應二進制算術編碼器 基于過去獲得的條基于過去獲得的條 件選擇一個模型件選擇一個模型 非二進制符號映射非二進制符號映射 為二進制序列為二進制序列 使用提供的模型進行編碼并更新模型使用提供的模型進行編碼并更新模型 n 獲得好的性能,源于:獲得好的性能,源于: 通過上下文通過上下
16、文選擇模型選擇模型 基于本地統計的基于本地統計的自適應估計自適應估計 算術編碼算術編碼減少計算復雜度減少計算復雜度 視頻編碼技術:視頻編碼技術:熵編碼熵編碼 n h.264 cabac 熵編碼熵編碼 men aidong, multimedia telecommunication centre, bupt19 視頻編碼技術:視頻編碼技術:幀內預測幀內預測 n 動機:動機:i 幀是自然圖像,具有很強的空間相關幀是自然圖像,具有很強的空間相關 h.261、mpeg2 沒有幀內預測,只有幀間預測沒有幀內預測,只有幀間預測 h.263+ 和和 mpeg4 中,中,在變換域中在變換域中根據相鄰塊對當前塊
17、的某些根據相鄰塊對當前塊的某些 系數做預測系數做預測 h.264 在空域內,依據在空域內,依據與當前塊相鄰的象素,對當前塊進行預測。與當前塊相鄰的象素,對當前塊進行預測。 宏塊或塊基于先前編碼的塊進行預測:宏塊或塊基于先前編碼的塊進行預測: 先前編碼的塊位于當前塊的上面和先前編碼的塊位于當前塊的上面和/或左面的塊或左面的塊 亮度塊有兩類幀內預測方式:亮度塊有兩類幀內預測方式: 9 種種 44 幀內預測模式幀內預測模式,用于紋理區域,用于紋理區域 4 種種 1616 幀內預測模式幀內預測模式,用于平滑區域,用于平滑區域 色度樣值只有色度樣值只有 4 種種 88 幀內預測模式幀內預測模式,類似于亮
18、度樣值的,類似于亮度樣值的 1616 幀內預測模式幀內預測模式 avs 同樣思想:同樣思想: 5 種種 88 幀內預測模式幀內預測模式,用于紋理區域,用于紋理區域 4 種種 88 幀內預測模式幀內預測模式,用于平滑區域,用于平滑區域 men aidong, multimedia telecommunication centre, bupt20 n h.264 去塊效應環路濾波器去塊效應環路濾波器 高壓縮解碼的幀間圖像高壓縮解碼的幀間圖像 顯著地減小預測殘留圖像顯著地減小預測殘留圖像 沒有濾波沒有濾波h.264/avc 去塊效應濾波去塊效應濾波 視頻編碼技術:視頻編碼技術:去塊效應環路濾波器去塊
19、效應環路濾波器 men aidong, multimedia telecommunication centre, bupt21 視頻編碼技術:視頻編碼技術:主要視頻編碼標準的技術比較主要視頻編碼標準的技術比較 mpeg-2mpeg-4h.263h.264vc-1avs 變換變換8x8 dct變換8x8 dct變換8x8 dct變換4x4、8x8 整數變換整數變換 4x4、2x2 哈達碼變換哈達碼變換 4x4、8x4、4x8、 8x8 整數變換 8x8 整數變換整數變換 量化量化傳統方式傳統方式傳統方式乘法與移位實現乘法與移位實現傳統方式乘法與移位實現乘法與移位實現 幀內預測幀內預測變換后 dc
20、系數變換域幀內預測變換域幀內預測4x4、8x8亮度塊:亮度塊:9 種種 16x16亮度快:亮度快:4 種種 色度塊:色度塊:4 種種 變換域幀內預測8x8 亮度塊:亮度塊:5 種種 色度塊:色度塊:4 種種 運動補償塊大小運動補償塊大小16x16、16x816x16、16x8、8x816x16、8x816x16、16x8、8x16、 8x8、8x4、4x8、4x4 16x16、8x816x16、16x8、 8x16、8x8 運動矢量精度運動矢量精度 象素 象素 象素 象素象素 象素 象素象素 內插濾波器內插濾波器1/2象素:2-tap1/2象素:8-tap 1/4象素:2-tap 1/2象素:
21、2-tap1/2象素:象素:6-tap 1/4象素:象素:2-tap 1/2象素:4/2-tap 1/4象素:4-tap 1/2象素:象素:4-tap 1/4象素:象素:4-tap 參考幀參考幀1個參考幀1個參考幀1個參考幀16 個參考幀個參考幀1 個參考幀2 個參考幀個參考幀 b 幀特征幀特征前向/后向 前向/前向 后向/后向 2 個運動矢量 前向/后向 前向/前向 后向/后向 2 個運動矢量 前向/后向 前向/前向 后向/后向 2 個運動矢量 前向前向/后向后向 前向前向/前向前向 后向后向/后向后向 2 個運動矢量個運動矢量 前向/后向 2個運動矢量 前向前向/后向后向 對稱的對稱的 1
22、 個運動矢個運動矢 量量 去塊效應濾波去塊效應濾波無有有有有有有有 熵編碼熵編碼vlcvlc vlc、算術編碼vlc, cavlc, cabac多 vlc 碼表自適應自適應 vlc 碼表碼表 幀編碼類型幀編碼類型幀、場、paff幀、場、paff幀幀、場、幀、場、paff、 mbaff 幀、場、paff幀、場、幀、場、paff 類(類(profile)simple、main、high 等 19 個類baseline、main、 externed、high (frext) simple、main、 advanced 一個類一個類 幀類型幀類型i、p、bi、p、bi、p、b、si、spi、p、b、s
23、i、spi、p、b、bii、p、b 取樣格式取樣格式4:2:0、4:2:24:2:04:2:04:2:0、4:2:2、4:4:4、 灰度、灰度、rgb 4:2:04:2:0 men aidong, multimedia telecommunication centre, bupt22 n h.264 編解碼器的實現意味著放寬通常的復雜度編解碼器的實現意味著放寬通常的復雜度(存儲和存儲和 計算計算)限制,相對于限制,相對于 mpeg2編解碼器,粗略估計:編解碼器,粗略估計: 解碼能力需要增加解碼能力需要增加 4-5x 編碼能力需要增加編碼能力需要增加 10 x 折中:折中:最好的質量和最小的帶寬
24、消耗,高度復雜計算使得最好的質量和最小的帶寬消耗,高度復雜計算使得 asic 昂貴,實現復雜。昂貴,實現復雜。 視頻編碼實現:視頻編碼實現:h.264 md:模式判決 tq:變換和量化 mc:運動補償 me:運動估計 vlc:變字長碼 men aidong, multimedia telecommunication centre, bupt23 copy ip 存儲存儲 dvr ip 視頻電話、會議視頻電話、會議 dtv h.264 istb vod h.264 視頻應用環境視頻應用環境 ip 視頻流視頻流 dtvmpeg2 over ip stb 3gpp vod sip / h.264 o
25、ver ip 轉碼轉碼 視頻監控視頻監控 h.264 over lan / ip hfc 轉碼轉碼 轉碼轉碼 視頻編碼應用:視頻編碼應用:領域領域 men aidong, multimedia telecommunication centre, bupt24 小結小結 n 現代視頻編碼體系結構沒有革命性的改變,現代視頻編碼體系結構沒有革命性的改變,基于混合視頻編碼方案基于混合視頻編碼方案, 但不斷改進,但不斷改進,越來越精巧和完善,使得壓縮率和圖像質量不斷提高,越來越精巧和完善,使得壓縮率和圖像質量不斷提高, 復雜度也大大增加:復雜度也大大增加: 新的關鍵技術特征新的關鍵技術特征: 增強的運動
26、補償增強的運動補償 小尺寸的整數變換小尺寸的整數變換 增強的熵編碼增強的熵編碼 cavlc 和和 cabac 其它:增強的去塊效應濾波器等其它:增強的去塊效應濾波器等 在相同質量下,在相同質量下,節省比特率節省比特率 50 以上,主觀質量感覺比客觀以上,主觀質量感覺比客觀 psnr 指指 標更好。標更好。 復雜度增加,編碼器復雜度增加,編碼器 3-10 x,解碼器,解碼器 2-5x n 最新發展的標準有最新發展的標準有 h.264/mpeg avc、smpte vc1/ms wmv9和和 我國的我國的 avs。 n 研究方向是可伸縮的視頻編碼研究方向是可伸縮的視頻編碼(scalable vid
27、eo code,svc),不同的應用,不同的應用 可以由一個共同的碼流來實現,目前已經公布的視頻編碼標準都沒可以由一個共同的碼流來實現,目前已經公布的視頻編碼標準都沒 有這個功能。有這個功能。 數字音頻壓縮技術數字音頻壓縮技術 digital audio compression men aidong, multimedia telecommunication centre, bupt26 引言數字音頻的數據量引言數字音頻的數據量 n 數字化是趨勢數字化是趨勢 信息量非常大,高傳輸帶寬或存儲容量信息量非常大,高傳輸帶寬或存儲容量 5.1 聲道環繞立體聲:聲道環繞立體聲: 648khz18bits
28、.184mbit/s n 減少代表原始聲音信號的信息量減少代表原始聲音信號的信息量 更好利用現有頻率資源更好利用現有頻率資源 便于計算機處理和存儲便于計算機處理和存儲 寬帶網中高質量傳輸寬帶網中高質量傳輸 men aidong, multimedia telecommunication centre, bupt27 n 波形編碼波形編碼 將波形直接變換成數字碼流。特點:比特率較高、解碼后質量較高、延將波形直接變換成數字碼流。特點:比特率較高、解碼后質量較高、延 時較小。可以分為:時較小。可以分為:時域波形編碼,如時域波形編碼,如pcm、adpcm、 m等;等;頻域波形頻域波形 編碼,如:子帶編
29、碼(編碼,如:子帶編碼(sbc)、自適應變換編碼()、自適應變換編碼(atc)等。等。 pcmpcm原理(原理(19371937年,法年,法alec reeresalec reeres) 電子管電子管 pcmpcm(4646年,年,bellbell實驗室)實驗室) 晶體管晶體管 pcmpcm(6262年,市話擴容,年,市話擴容,64kb/s64kb/s) 單片單片ic pcmic pcm(7070年代,微波、衛星、光纖)年代,微波、衛星、光纖) 增量編碼原理(增量編碼原理(19461946年,法年,法 de lorainede loraine) 自適應增量自適應增量 cvsdcvsd(6060
30、年代末,軍用,年代末,軍用,3232、16kb/s16kb/s) cvsdcvsd(continuously variable slope delta modulatorcontinuously variable slope delta modulator) (連續變化斜率增量調制器)(連續變化斜率增量調制器) 其他編碼(其他編碼(7070年代,年代,adpcmadpcm、subbandsubband、atcatc、apcapc等)等) 在在16kb/s16kb/s以上得到較好的話音質量。以上得到較好的話音質量。 特點:話音質量好,但編碼速率高。特點:話音質量好,但編碼速率高。 音頻編碼歷史:
31、數字語音(音頻編碼歷史:數字語音(1 1) men aidong, multimedia telecommunication centre, bupt28 n參數編碼參數編碼 從信源信號的某個域中提取特征參數從信源信號的某個域中提取特征參數,并變換成數字碼流。如:各種,并變換成數字碼流。如:各種 聲碼器。聲碼器。 波形編碼通道聲碼器(波形編碼通道聲碼器(3939年,年,dudlydudly,二次大戰保密電話),二次大戰保密電話) lpclpc聲碼器(聲碼器(6767年,年,atalatal、schroederschroeder) 同態聲碼器(同態聲碼器(6969年,年,oppenheimopp
32、enheim) 共振峰聲碼器(共振峰聲碼器(7171年,年,rabinerrabiner、schaferschafer、elanaganelanagan) mbembe聲碼器(聲碼器(8888年,年,griffingriffin、limlim) 波形插值(波形插值(9191年,年,w.b. kleijnw.b. kleijn) 2.4kb/s2.4kb/s、1.2kb/s1.2kb/s、較好;、較好;600-800b/s600-800b/s可懂。可懂。 特點:編碼速率低,自然度差特點:編碼速率低,自然度差、解碼后質量較低、延時解碼后質量較低、延時 較大較大。 音頻編碼歷史:數字語音(音頻編碼歷
33、史:數字語音(2 2) men aidong, multimedia telecommunication centre, bupt29 n 混合編碼器混合編碼器 將以上二種方法混合,將以上二種方法混合,利用線性預測、利用線性預測、vqvq、a-b-sa-b-s、感覺加權、后、感覺加權、后 濾波等技術。濾波等技術。如:如:g723.1,g728,g729,gsm的語音編碼,的語音編碼,is-95的的 語音編碼等。語音編碼等。 多脈沖激勵線性預測(多脈沖激勵線性預測(mpelp 1982 atalmpelp 1982 atal、remderemde) 規則脈沖激勵線性預測(規則脈沖激勵線性預測(r
34、pelp 1985 deprettererpelp 1985 deprettere、kroonkroon) 碼本激勵線性預測(碼本激勵線性預測(celp 1985 manfredcelp 1985 manfred、schroederschroeder、atalatal) 8-16kb/s8-16kb/s,高質量。特點:話音質量高、編碼速率低,高質量。特點:話音質量高、編碼速率低, 但算法復雜。但算法復雜。 音頻編碼歷史:數字語音(音頻編碼歷史:數字語音(3 3) men aidong, multimedia telecommunication centre, bupt30 n 主要應用于娛樂與
35、鑒賞,對于重建信號的音質有很高的要主要應用于娛樂與鑒賞,對于重建信號的音質有很高的要 求,目前采用比特率較高的波形編碼技術進行壓縮。求,目前采用比特率較高的波形編碼技術進行壓縮。可以可以 直接在時域進行,也可以轉到頻域或其他變換域進行。直接在時域進行,也可以轉到頻域或其他變換域進行。 n 1982年激光唱盤年激光唱盤 (cd: compact disk)上市。上市。md:mini- disk,日本索尼公司采用,日本索尼公司采用atracadaptive transform acoustic coder壓縮技術。壓縮技術。 n 1987數字音頻磁帶錄音數字音頻磁帶錄音 (dat: digital
36、 audio tape) 問世。問世。 n dab (digital audio broadcasting) 源于歐洲。源于歐洲。 n ac3 來自來自 dolby 公司公司 n . 音頻編碼歷史:寬帶音頻音頻編碼歷史:寬帶音頻 men aidong, multimedia telecommunication centre, bupt31 音頻編碼性能評價(音頻編碼性能評價(1 1) n 編碼速率編碼速率(kbps、kb/s) 信號帶寬信號帶寬:可懂度、自然度、透明度。:可懂度、自然度、透明度。 2003400hz、507000hz、2015000hz、1020000hz。 采樣速率采樣速率:
37、8khz、16khz、32khz、44.1/48khz。 樣值比特數樣值比特數(b/樣點),樣點),總速率總速率 r(kb/s)。)。 固定碼率及可變碼率固定碼率及可變碼率。 n 重建語音質量重建語音質量 客觀評價客觀評價: 信噪比信噪比 分段信噪比分段信噪比 (一般(一般15db以上較好,以上較好,20db以上相當好)以上相當好) men aidong, multimedia telecommunication centre, bupt32 音頻編碼性能評價(音頻編碼性能評價(2 2) 編解碼延時(編解碼延時(ms) 公眾網(公眾網(25ms)、點對點、廣播、存儲)、點對點、廣播、存儲 回聲
38、控制或回聲抵消回聲控制或回聲抵消 正常通話秩序正常通話秩序 與重建質量關系與重建質量關系 算法復雜度算法復雜度 硬件、成本硬件、成本 浮點、定點浮點、定點 mips、ram、rom 其他其他 抗隨機誤碼和突發誤碼能力抗隨機誤碼和突發誤碼能力 抗丟包和丟幀能力抗丟包和丟幀能力 對不同信號編碼能力對不同信號編碼能力 級聯或轉接能力級聯或轉接能力 men aidong, multimedia telecommunication centre, bupt 語音壓縮(音頻編碼)語音壓縮(音頻編碼) itu-t g.711(1988)g.711(1988) 語音語音pcmpcm編碼標準,編碼標準,64kb
39、it/s64kbit/s g.722(1988)g.722(1988) 7 k h z7 k h z 音 頻 編 碼 標 準 ,音 頻 編 碼 標 準 , 64kbit/s64kbit/s g.728(1992)g.728(1992) ld-celpld-celp語音編碼標準,語音編碼標準, 16kbit/s16kbit/s g.723.1g.723.1 低速率語音編碼建議,具有低速率語音編碼建議,具有 兩 種 速 率兩 種 速 率 6 . 3 k b i t / s6 . 3 k b i t / s 和和 5.3kbit/s5.3kbit/s。 mpegmpeg mp3mp3:mpeg1 a
40、udio layer-3mpeg1 audio layer-3的的 簡稱從簡稱從mpeg-1mpeg-1標準衍生的、開標準衍生的、開 放的編碼方案放的編碼方案50k-100kbit/s50k-100kbit/s accacc mpeg2mpeg2音頻壓縮音頻壓縮 mp4mp4 men aidong, multimedia telecommunication centre, bupt34 聲音壓縮編碼理論基礎聲音壓縮編碼理論基礎 n 冗余(冗余(redundance) 信號一部分可由另一部分重建或另外表達形式簡單說明,稱為信號有冗信號一部分可由另一部分重建或另外表達形式簡單說明,稱為信號有冗 余
41、余 去除冗余實現壓縮編碼去除冗余實現壓縮編碼 信號冗余是變化的,故不能產生恒定碼流輸出信號冗余是變化的,故不能產生恒定碼流輸出 n 不相關不相關 (irrelevance) 聽覺不能感覺的那部分信號,它對聲音信號的確定或音色和發音位置沒聽覺不能感覺的那部分信號,它對聲音信號的確定或音色和發音位置沒 有貢獻有貢獻 不相關信號部分不傳輸不相關信號部分不傳輸 利用掩蔽效應來掩蓋量化失真利用掩蔽效應來掩蓋量化失真 n 人耳聽覺特性人耳聽覺特性 人耳分辨能力人耳分辨能力 人耳對不同頻段聲音的敏感程度不同,通常對低頻比對高頻更敏感人耳對不同頻段聲音的敏感程度不同,通常對低頻比對高頻更敏感 人耳對語音信號的相位不敏感人耳對語音信號的相位不敏感 人耳掩蔽效應人耳掩蔽效應 masking effect masking effect men aidong, multimedia telecommunication centre, bupt35 現有標準:語音編碼標準現有標準:語音編碼標準 (1)(1) men aidong, multimed
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 危害評估模型-洞察及研究
- 基因治療載體設計-第2篇-洞察及研究
- 腦機接口交互技術-洞察及研究
- 多云協同架構優化-洞察及研究
- 災害應急響應路徑優化-洞察及研究
- 安全運行保障技術-洞察及研究
- 邊緣云安全機制-洞察及研究
- 農業補貼精準施策-洞察及研究
- 土地政策評估方法-洞察及研究
- 行業壟斷特征分析-洞察及研究
- 2024年上海浦東新區公辦學校儲備教師教輔招聘真題
- 2025年高考歷史全國卷試題評析-教育部教育考試院
- 貴州省貴陽市2023?2024學年度第二學期期末監測試卷高一 數學試題(含解析)
- 井岡山的故事試題及答案
- 城市管理公司管理制度
- 2025年中國合成生物學行業市場前景預測及投資價值評估分析報告
- 游藝項目合作合同協議書
- 觸電急救97課件
- T/CAQI 96-2019產品質量鑒定程序規范總則
- 育嬰師上戶合同范本
- 醫療行業注塑車間的數字化改造實踐
評論
0/150
提交評論