




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
多媒體技術電子教學課件第3章1/19/20251陳文華第3章多媒體數據
壓縮編碼技術3.1多媒體數據壓縮編碼的重要性3.2預測編碼技術3.3哈夫曼編碼技術3.4行程(游程)RLE編碼技術3.5靜態圖像壓縮編碼國際標準—JPEG3.6運動圖像壓縮編碼國際標準—MPEG1/19/20252陳文華第3章多媒體數據
壓縮編碼技術3.1多媒體數據壓縮編碼的重要性
3.1.1數據冗余類型
3.1.2數據壓縮技術的分類
1/19/20253陳文華第3章
多媒體數據
壓縮編碼技術3.1媒體數據壓縮編碼的重要性
信息時代的重要特征是信息的數字化。早期的計算機系統采用模擬方式表示信息,但存在著明顯的缺點:
①經常會產生噪音和信號丟失,并且在復制過程中逐步積累噪音和誤差。②模擬信號不適合數字計算機加工處理。1/19/20254陳文華3.1
媒體數據壓縮
編碼的重要性
數字化后未經壓縮的視頻和音頻等媒體信息的數據量是非常大的1.圖像數據量的大小可用下面的公式來計算:
圖像數據量=圖像的總像素×色彩深度÷8(單位為Byte,簡寫為B)
例如,一幅640×480、24位(bit)真彩色的圖像,其文件大小為:
640×480×24÷8=921.6KB1/19/20255陳文華3.1媒體數據壓縮
編碼的重要性2.雙通道立體聲激光唱盤,采用脈沖碼調制采樣,采樣頻率為44.1KHz,采樣精度16位,其一秒鐘時間內的采樣數據量為:
44.1×1000×16×2÷8=176.4KB
一個650MB的CD—ROM,大約可存1小時的音樂。1/19/20256陳文華3.1媒體數據壓縮
編碼的重要性3.對動態圖形和視頻圖像。例如對于彩色電視信號,設代表光強Y的帶寬為4.2MHz、色彩I為1.5MHz和色飽和度Q為0.5MHz,采樣頻率>2倍原始信號頻率,各分量均被數字量化為8位,從而1秒鐘電視信號的數據量為:(4.2+1.5+0.5)×2×8×1000000÷8=12.4MB1/19/20257陳文華3.1媒體數據壓縮
編碼的重要性
容量為650MB的CD—ROM僅能存1分鐘的原始電視數據。若為高清晰度電視(HDTV)其1秒鐘數據量約為150MB(1.2Gbps÷8),一張CD—ROM還存不下5秒鐘的HDTV圖像。
巨大數字化信息的數據量對計算機存儲資源和網絡帶寬有很高的要求,解決的辦法就是要對視、音頻的數據進行大量的壓縮。播放時,傳輸少量被壓縮的數據,接收后再對數據進行解壓縮并復原。1/19/20258陳文華3.1.1數據冗余類型1.空間冗余
基于離散像素采樣來表示物體顏色的方式通常沒有利用景物表面顏色的這種空間相關性,這些相關性的光成像結構在數字化圖像中就表現為空間冗余。我們可以通過改變物體表面顏色的像素存儲方式來利用空間相關性,達到減少數據量的目的。1/19/20259陳文華3.1.1數據冗余類型2.時間冗余
時間冗余反映在圖像序列中的相鄰幀圖像(電視圖像、動畫)之間有較大的相關性,一組連續畫面中的相鄰幀往往包含相同的背景和移動物體,只不過移動物體所在的空間位置略有不同,把一幀圖像中的某物體或場景可以由其他幀圖像中的物體或場景進行處理后重構出來,可以大大減少時間冗余。1/19/202510陳文華3.1.1數據冗余類型3.結構冗余
有些圖像具有較強的相似性的紋理結構,例如布紋圖像和草席圖像,方格狀的地板圖案等,我們稱此為結構冗余。4.知識冗余
有許多圖像的理解與某些基礎知識有相當大的相關性,這類規律性的結構可由先驗知識和背景知識得到,我們稱此類冗余為知識冗余。根據已有的知識,我們可以構造圖像物體的基本模型,并創建圖像庫。1/19/202511陳文華3.1.1數據冗余類型5.視覺冗余
人的接收系統如視覺系統和聽覺系統是有一定限度的,人眼并不能察覺圖像場的所有變化,如人類視覺系統分辨能力約為64灰度等級,而一般圖像量化采用256灰度等級,這類冗余我們稱為視覺冗余。6.聽覺冗余
人耳的敏感性不能察覺所有頻率的變化,存在聽覺冗余。1/19/202512陳文華3.1.2數據壓縮技術
的分類
根據多媒體數據冗余類型的不同,解碼后數據與原始數據是否完全一致、質量有無損失來進行分類,壓縮方法可被分為有失真編碼和無失真編碼兩大類。
無失真壓縮法也稱無損壓縮,無失真壓縮的特點是壓縮比較小,大約在2∶l至5∶l之間,主要用于文本數據、程序代碼和某些要求嚴格不丟失信息的環境中,常用的無失真壓縮編碼有如哈夫曼編碼等。1/19/202513陳文華3.1.2數據壓縮技術
的分類
有失真壓縮法也稱有損壓縮,有失真壓縮法的冗余壓縮取決于初始信號的類型、前后的相關性、信號的語義內容等,壓縮比可以從幾到幾百倍,常用的有失真壓縮編碼技術有預測編碼、變換編碼、模型編碼、混合編碼方法等。主要用于壓縮圖像、聲音等信息。1/19/202514陳文華
常用的圖像和視頻壓縮方法如圖3-1所示:
圖像和視頻壓縮方法哈夫曼編碼行程編碼算術編碼LZW編碼DCT編碼小波變換子帶編碼無失真壓縮有失真壓縮預測編碼變換編碼模型編碼運動補償混合編碼分形編碼JPEGMPEGH.2613.1.2數據壓縮技術
的分類1/19/202515陳文華3.2預測編碼技術
根據離散信號之間存在著一定的相關性的特點,利用圖像像素的以往樣本值(前面一個或幾個點的數據)對于新樣本值(下一個點的數據)進行預測,然后將樣本的實際值與其預測值相減得到一個誤差值(較小),這樣可以用比較少的數碼進行編碼得到較大的數據壓縮結果,達到壓縮數據的目的,因此預測編碼技術是一種有失真編碼方法。1/19/202516陳文華
最常用的是差值脈沖編碼調制法,簡稱為DPCM。圖3-2所示的是DPCM編、解碼系統原理圖傳輸信道輸入預測器量化器編碼器解碼器預測器XnenXn″en′輸出Xn′Xn′en′Xn″3.2預測編碼技術1/19/202517陳文華3.2預測編碼技術
設xn為tn時刻的亮度取樣值,預測器根據tn時刻之前的樣本值x1,x2…,xn-1對xn作預測,得到預測值xn′,xn
與xn′之間的誤差為:
en=xn-xn′(3-1)
接收端恢復的輸出信號為xn″是xn的近似值,兩者的誤差是:△xn=xn-xn″=xn′十en-(xn′十en′)=en-en′(3-2)1/19/202518陳文華3.2預測編碼技術
在預測編碼中,量化器的量化對像是預測誤差en-en′分布在零值附近,正負兩邊的分布一般是對稱的,圖3-3預測誤差分布特性示意圖。概率預測誤差圖3-3預測誤差分布示意圖1/19/202519陳文華量化輸出輸入電平非均勻量化間隔非均勻量化器1/19/202520陳文華3.2預測編碼技術
非均勻量化器對于具有相同的輸入信號動態范圍、相同的圖像主觀評價質量下,輸出的比特數較低。預測編碼系統的缺點:
預測誤差的量化是造成圖像質量下降的主要原因,比如在圖像邊界斜率過載,表現為圖像輪廓變模糊;因最小量化電平不夠小(量化位數不夠高),使圖像灰度緩變區產生顆粒噪聲。
1/19/202521陳文華3.3哈夫曼編碼技術
假設一個信息源能產生的事件序列中的事件取自一個有限事件集,事件集S中的任一事件Si發生的概率為P(Si)都相等,即P(Si)=1/S,則其所能攜帶的信息量I(Si)定義為:
I(Si)=-log21/S=-log2P(Si)(3-3)
這里P(Si)是信息源產生的事件為Si的概率。等式右邊加一負號的目的是保證I(Si)的數值不為負值。定義中用2為底的對數,并規定信息量I(Si)的計量單位為比特(bit)。1/19/202522陳文華3.3哈夫曼編碼技術
如果一個信息源發出的是由8個二值數(0,1)表示的組合信息。如果這種組合是等概率的,即P(Si)=1/256,(i=0,1,2,…255),則此8個數字提供的信息量按(3-3)式計算:
I(Si)=-log21/256=-log21十log2256
=8(bit)(3-4)
組合的總數是256種可能,每一種可能的組合為8比特。如果上述256種可能組合中是非等概率的,可以證明信息量I(Si)將小于8(bit)的。1/19/202523陳文華3.3哈夫曼編碼技術
離散無記憶(不受其前面事件出現與否的影響)信息源中一個事件所攜帶的平均信息量H(S)定義為:
(3-5)
平均信息量又稱為信息熵,熵實際上是信源事件集中各事件所攜帶的信息量的數學期望。熵值的單位是比特。
數據壓縮的另一個基本途徑則是去清除聯合信源中各信源間的相關性。1/19/202524陳文華3.3哈夫曼編碼技術
哈夫曼編碼利用了以上原理,屬于一種變字長碼,把信息源事件按概率大小順序排列,對出現概率大的信息源事件賦予短碼字,而對于概率小的信息源事件賦予長碼,只要碼字長度按照信息出現的概率大小逆順序排列,可通過數學證明這一結論:平均碼字長度一定小于其它任何事件順序的排列方式。1/19/202525陳文華3.3哈夫曼編碼技術
哈夫曼編碼一般過程如下:
1.把事件(消息)按出現的概率由大到小排成一個序列。如P(1)>P(2)>P(3)>…>P(Sm-1)>P(Sm),即將信息源事件按概率遞減順序排列。2.把其中兩個最小的概率P(Sm-1),P(Sm)挑出來,且將事件“1”賦給其中最小的,即P(Sm)→1;事件“0”賦給另一稍大的即P(Sm-1)→0。
1/19/202526陳文華3.3哈夫曼編碼技術
3.把兩個最小概率相加作為新事件的概率,即求出P(Sm-1),P(Sm)之和P(Si):
P(Si)=P(Sm-1)十P(Sm)
設P(Si)是對應于一個新的消息的概率。4.將P(Si)與上面未處理的(m-2)個消息P(Sm-2)的概率重新由大到小再排列,構成一個新的概率序列。5.重復步驟2),3),4),在每次合并信息源時,將被合并的信源分別賦“0”和“1”直到所有m個事件的概率均已全部合并處理為止。1/19/202527陳文華3.3哈夫曼編碼技術
6.尋找從每一個信息源事件到概率總和為1處的路徑,對每一信息源事件寫出“1”、“0”序列(從樹根到信息源事件節點)作為碼字。
Huffman編碼的平均碼字長度可以用下列公式求出:
(3-6)
這里的ni,為第i個消息事件的碼字長度,P(Si)為第i個消息出現的概率。舉一例子來說明這一編碼過程。
表3-1信息源消息事件及其對應的概率
1/19/202528陳文華3.3哈夫曼編碼技術圖3-5哈夫曼編碼全過程:F1/19/202529陳文華3.3哈夫曼編碼技術
根據哈夫曼的編碼規則,我們得到如表3-2所示:
由于8個消息事件A,B,C…,H的每個概率為已知,則哈夫曼碼的平均長度L可按公式(3-6)計算為:
L=1×0.4十3×(0.18+0.10)+4×(0.10十0.06十0.07)十5×(0.05十0.04)=2.61比特
1/19/202530陳文華3.3哈夫曼編碼技術
圖像的熵H(S)可按公式(3-5)計算為:
定義編碼效率為熵值H(S)與平均碼長L的比值,即:編碼效率(3-7)
=2.55/2.61=97.8%
哈夫曼編碼有它的不足之處:
必須先得到信息源碼元(消息)的統計概率,才能進行編碼。折中的方法是根據經驗值人為地給出Huffman碼表,但這樣的編碼無法達到最佳。1/19/202531陳文華3.4行程(游程)
RLE
編碼技術
行程編碼主要思路是用編碼器不斷比較信息源符號相鄰元素值的變化幅度,一旦發現有明顯的變化,就開始一個行程。編碼器檢測每一個行程起點位置開始的多次重復的比特或者字符序列,然后將一個相同值的連續串出現次數作為行程長度,并將行程長度轉換成代碼,再取用信息源符號的一個代表值作為代碼,這種編碼稱為行程編碼,或稱游程編碼,常用RLE表示。1/19/202532陳文華對一幅兩維圖像F(i,j)作水平掃描后得到的部分像素的像素值1/19/202533陳文華3.4行程(游程)
RLE
編碼技術
用RLE對這一行數據編碼后得到的碼字表:
RLE編碼壓縮編碼技術尤其適用于:
計算機生成的圖形圖像和黑白二值圖像的編碼,解壓縮速度很快。RLE的壓縮率的大小取決于圖像本身的特點,可以得到較大的壓縮比。對復雜的圖像不適宜用RLE進行編碼。1/19/202534陳文華3.5靜態圖像壓縮編碼
的國際標準--JPEG靜態圖像壓縮編碼JPEG概況
3.5.1JPEG壓縮編碼的基本系統(1)數據塊準備(2)離散余弦正變換DCT(3)量化(4)DCT系數Z形掃描(5)DC系數編碼(6)AC系數編碼
3.5.2JPEG壓縮編碼的擴展系統1/19/202535陳文華
3.5靜態圖像壓縮編碼的國際標準--JPEG
JPEG是國際上彩色、灰度、靜止圖像的第一個國際標準。用來在低分辨率到高分辨率的較寬范圍內支持較高的圖像分辨率和量化精度。它不僅適用于黑白、彩色照片和印刷圖片等靜止圖像的壓縮,而且擴大到了彩色傳真、電話會議、新聞圖片的傳送上,以及電視圖像序列的幀內圖像的壓縮編碼也常采用JPEG壓縮標準。1/19/202536陳文華3.5靜態圖像壓縮編碼
的國際標準--JPEG
變換編碼的基本思路:
1.編碼時略去某些能量很小的高頻分量以降低碼率。2.變換編碼還可以根據人眼對不同頻率分量的敏感程度而對不同系數采用不同的量化臺階,以進一步提高壓縮比。
JPEG開發的壓縮編碼算法有三種工作方式:
1.基本系統(單次掃描)。2.擴展系統(常采用累進編碼或分層編碼方式)。3.無損壓縮編碼。1/19/202537陳文華3.5.1
JPEG
壓縮編碼的基本系統
下面我們討論一個基于離散余弦正變換DCT的有失真JPEG編解碼的工作原理,圖3-7是基于DCT的JPEG編碼的過程框圖。
1/19/202538陳文華1.數據塊準備
塊準備將一幀(幅)圖像分成8×8的數據塊。對于彩色圖像,可以看作多分量(Y亮度信號分量和U和V色度信號分量)進行壓縮處理。
假設圖像的大小為480行,每一行有640個像素。并假設按4∶l∶l取樣格式,即四個亮度分量,一個色差分量U,一個色差分量V,則亮度分量就是一個640×480的數值矩陣,色差分量是一個320×240的數值矩陣。
塊準備必須劃分出4800個(640×480÷8)亮度塊和兩份1200個(320×240÷8)色差塊,共計7200個數據塊。1/19/202539陳文華2.離散余弦正變換DCT
若采樣精度為P位,采樣數據在范圍(0,2P-1),則變成在范圍(-2P-1,2P-1-l)內,以此作為DCT正變換的輸入。在解碼器的輸出端經IDCT反變換后,得到一系列8×8的圖像數據塊,需將其數值范圍由(-2P-1,2P-1-l)再變回到(0,2P-1
)范圍內的無符號整數,才能重構圖像。2.離散余弦正變換DCT
離散變換可以用矩陣表示。假設信源序列為一個n行k列的矩陣X,變換矩陣為T,經過某種變換后得到輸出序列Y為:
Y=TX1/19/202540陳文華2.離散余弦正變換DCT
如果所采用的變換是正交變換,則T為正交矩陣,即有:
T-1T=I
其中I是單位矩陣。在接收端,進行變換:
X=T-1Y
則可以恢復源信號序列X。
JPEG將8×8大小的子塊圖像進行離散余弦DCT變換。1/19/202541陳文華2.離散余弦正變換DCT
下面是離散余弦正變換DCT和它的IDCT逆變換的數學表達式。
DCT變換為
1/19/202542陳文華2.離散余弦正變換DCT
將每個數據塊的數據從空間域變換到頻率域,輸出64個DCT變換系數。如圖3-8所示,64個像素變換為64個系數。
(a)像素塊(b)DCT系數陣列橫向頻率增加方向U縱向頻率增加方向VXY1/19/202543陳文華2.離散余弦正變換DCT
圖3-9為二維離散余弦變換的示意圖。幅度x
ya=f(x,y)DC系數DCT系數Fx
Fyc=g(Fx,Fy)1/19/202544陳文華3.量化
量化是一種不可逆的、有失真的過程,在基于DCT的編碼器中,量化是引起信息丟失的主要原因。對DCT系數進行量化有兩個作用:
①降低系數的幅值。②
增加系數中值為0的項數。1/19/202545陳文華3.量化
表3-4缺省的亮度Y分量量化表1/19/202546陳文華3.量化
表3-5缺省的色度U、V分量量化表。1/19/202547陳文華3.量化
JPEG的量化器的公式可定義為:
其中:DCT變換系數C(u,v);Q(u,v)是量化器步長,它是量化表的元素。1/19/202548陳文華4.DCT
系數Z形掃描圖3-10Z形掃描順序
其一維數組元素的位置順序如圖3-10。
ZZ(0)=C(0,0),ZZ(1)=C(0,l),ZZ(2)=C(l,0),…,ZZ(63)=C(7,7)。編碼順序依據ZZ的序號。01561415272824713162629423812172530414391118243140445310192332394552542022333846515560213437475056596135364849575862631/19/202549陳文華5.
DC系數編碼
對相鄰塊之間的DC系數的差值DIFF=Di-Di-1進行編碼。
DIFF=ZZ(0)-PRED進行無失真編碼。因輸入數據已偏移到零電平,已先行減去了2P-1,在掃描起點初始化時刻,規定PRED=0。Blocki-1Blocki圖3-11DC系數的差值DIFF=Di-Di-1DiDi-1┅┅┅┅1/19/202550陳文華5.
DC系數編碼
若后面的ZZ(0)的動態范圍為-1023~+1023,則DIFF的動態范圍可達-2047~+2047,這樣每個值賦予一個碼字則碼表過于龐大。因此,JPEG對碼表進行簡化,采用“前綴碼(SSSS)+尾碼”。前綴碼表示尾碼的有效位數(設為B位),尾碼則直接采用B位自然二進制碼。8位精度的SSSS值的范圍為0~11(12項),其碼表可參見表3-6原始圖像分量為8位精度時DC系數差值的典型哈夫曼編碼表所示。1/19/202551陳文華5.
DC系數編碼對于尾碼為DIFF的B位:當DIFF≥0,用原碼,尾碼的最高位是“l”;當DIFF<0,用反碼,尾碼的最高位是“0”;如設DIFF=12,SSSS=4,其前綴碼字為“101”,4位尾碼為“1100”,從而DIFF=12的編碼為“1011100”。如果DIFF=-12,4位尾碼為12反碼“0011”,從而DIFF=-12的編碼為“1010011”。解碼時,由前綴碼“101”知尾碼有4位;若碼字是“1100”,因其最高位為“1”,立即可得DIFF=12;若碼字是“0011”,則因其最高位為“0”,知DIFF應為負數,尾碼是個反碼,取反后可得實際值DIFF=-12。1/19/202552陳文華6.AC系數的編碼
Z形掃描將二維量化系數矩陣轉換成一維數組ZZ中的“零游程/非零值”。
若最后一個“零游程/非零值”中只有零游程(ZRL),則直接傳塊結束碼字“EOB”結束本塊。
“零游程/非零值”編碼表示為“NNNN/SSSS+尾碼”。
其中:4位“NNNN”為相對于前一個非零值的零游程計數,表示ZRL=0~15;
如果ZRL>15,則用“NNNN/SSSS”=“1111/0000”表示ZRL=16,再對ZRL=ZRL-16繼續編碼。1/19/202553陳文華6.AC系數的編碼
對于基本系統,SSSS將不超過10,可參見
表3-7AC系數的尾碼位數賦值表。前綴碼的二維哈夫曼碼表的大小為NNNN×SSSS+2=162;亮度和色差各有自己的碼表(分別見表3-8亮度AC系數碼表和表3-9色差AC系數碼表)。1/19/202554陳文華6.AC系數的編碼
若ZZ(k)為非零AC系數,則其編碼步驟與DC系數的類似:
①根據ZZ(k)的幅度范圍由表3-7查出尾碼的位數SSSS=B。②由ZRL計數值NNNN以及SSSS從表3-8或表3-9中查出前綴碼字。③按以下規則直接寫出尾碼的碼字,當ZZ(k)≥0,用原碼,當ZZ(k)<0,用反碼。1/19/202555陳文華6.AC系數的編碼
現以一實例說明其編碼過程。設某亮度圖像塊的量化系數矩陣按Z形掃描得到:
k01234567
ZZ(k)125-202000
k89~303132~63
ZZ(k)
10-10
假如其前一亮度塊的量化DC系數為12。1/19/202556陳文華6.AC系數的編碼
則編碼過程如下:第一步,DC系數編碼,因為DIFF=ZZ(0)-PRED=12-12=0,由表3-6直接查得其前綴碼“00”。第二步,AC系數編碼。第1個非零值ZZ(1)=5,它與ZZ(0)之間無零系數,故NNNN=0,因“5”落入表3-7中的第3組,故SSSS=3,而NNNN/SSSS=0/3,由表3-8查得為“100”,從而ZZ(1)=5的編碼為“100101”。第2個非零值ZZ(2)=-2,它與ZZ(1)之間無零系數,故NNNN=0,因“-2”落入表3-7中的第2組,故SSSS=2,而NNNN/SSSS=0/2,由表3-8查得為“01”,而-2的反碼為“01”。從而ZZ(2)=-2的編碼為“0101”。1/19/202557陳文華6.AC系數的編碼
第3個ZZ(4)=2,NNNN/SSSS=1/2,查表3-8得碼字“11011”,而2的原碼為10,所以取ZZ(3)~ZZ(4)的編碼為“1101110”。第4個ZZ(8)=1,NNNN/SSSS=3/1,查表3-8得碼字“111010”,而1的原碼為1,所以取ZZ(5)~ZZ(8)的編碼為“1110101”。第5個ZZ(31)=-1,由于NNNN=30-9+1=22>15,故先編碼ZRL=16,由表3-8查得F/0(16進制表示)的碼字為“11111111001”;此后有NNNN=22-16=6<15,故再編碼NNNN/SSSS=6/1,查出其碼字為“1111011”,而-1的反碼為0,從而ZZ(9)~ZZ(31)的編碼為“11111111001+1111011+0”。
1/19/202558陳文華6.AC系數的編碼
此后無非零值,直接用一個“EOB(0/0)”結柬本塊,查表3-7得其碼字為“1010”。
綜合以上兩個步驟,可知該圖像塊的編碼位流為:
“0010010101011101110111010111111111001111101101010”共用了49位,而原始圖像塊要用8×8×8=512位表示,故壓縮比為512∶49=10.45∶1。1/19/202559陳文華3.5.1JPEG
壓縮編碼
的基本系統
對于中等復雜程度的彩色圖像,其壓縮比與恢復圖像的質量大致如表3-10所示。表3-10壓縮效果與恢復圖像質量的關系
1/19/202560陳文華3.5.1JPEG
壓縮編碼
的基本系統
順序編碼運行方式1/19/202561陳文華3.5.2
JPEG
壓縮編碼
的擴展系統1.基于DCT的累進編碼運行方式
累進編碼方式要掃描多次。1/19/202562陳文華3.5.2JPEG
壓縮編碼
的擴展系統2.分層編碼運行方式
水平方向和垂直方向分辨率以2的倍數因子下降(降低原始圖像的空間分辨率),導出若干低分辨率的原圖像,分層后再采用JPEG的壓縮編碼方法進行編碼,隨后以上重復步驟,直到圖像達到完整的分辨率編碼為止。1/19/202563陳文華3.5.2JPEG壓縮編碼
的擴展系統3.無損壓縮預測編碼運行方式源圖像數據表說明預測器熵編碼器壓縮后圖像數據1/19/202564陳文華無損壓縮預測編碼
運行方式
DPCM編碼簡單,易于用硬件實現。由于是無失真編碼,解碼后的圖像質量很高。
Px1/19/202565陳文華3.6運動圖像壓縮編碼的國際標準—MPEG運動圖像壓縮編碼—MPEG概況
3.6.1MPEG標準簡介3.6.2幀間編碼技術3.6.3運動補償技術3.6.4MPEG視頻壓縮數據流結構3.6.5MPEG音頻1/19/202566陳文華3.6運動圖像壓縮編碼的國際標準——MPEG
MPEG專家組工作將整個過程分為三步:
①要求
提出要求有雙重的目的:目標,競爭的原則。
②竟爭
提出了14個不同的方案。
③集中
測試和評價,并綜合出一個最佳方案。1/19/202567陳文華3.6.1MPEG
標準簡介1.MPEG—1標準
MPEG—1的標準名稱為“動態圖像和伴音的編碼”—用于速率小于每秒約1.5Mbps的數字存儲媒體。
MPEG—1的最大壓縮比可達約1∶200。
MPEG—1標準有3個部分組成:
MPEG—1視頻(Video)MPEG—1音頻(Audio)MPEG—1系統(System)1/19/202568陳文華1.MPEG—1
標準
設計目標是把每秒30幀、亮度信號的分辨率為360×240,色度信號分辨率為180×120,傳送壓縮成數據率為1.2Mbps的編碼圖像。
MPEG—1電視圖像的壓縮算法采用兩種基本壓縮技術:①為減少時間冗余度,采用16×16個像素組成的圖像塊的運動補償技術。②為了減少空間冗余度,采用8×8圖像化的DCT變換技術。1/19/202569陳文華1.MPEG—1
標準
聲音壓縮編碼技術支持高壓縮的音頻數據流,其采樣率為48,44.l或22KHz,量化精度為16位的聲音壓縮。支持兩個聲道,可設置成單聲道(mono)、雙聲道(dual)或立體聲(stereo)。采用MPEG—1算法可以把位速率降到0.192Mbps。MPEG—1系統采用多路復合技術,把數字電視圖像和聲音復合成單一數據位流,MPEG—1的數據位流分成內外兩層,外層為系統層,內層為壓縮層。1/19/202570陳文華
2.MPEG—2
標準
MPEG—2標準稱為“活動圖像及有關聲音信息的通用編碼”標準。設計目標是把以10Mbps速度傳送每秒30幀、分辨率為720×572高分辨率的廣播級視頻圖像,壓縮后的傳送數據率為3~15Mbps。MPEG—2標準是HDTV、DVD以及新型數字式交互有線網所采用的數字視頻壓縮標準。
MPEG—2標準是MPEG—1標準的擴充、豐富和完善,并與MPEG—1標準相兼容。1/19/202571陳文華2.MPEG—2
標準
MPEG—2標準主要分為四部分:
第一部分:系統。第二部分:視頻。第三部分:音頻。第四部分:一致性測試。
MPEG—2標準使計算機處理全彩色、全屏幕、全動態的視頻圖像,同時也能使有線、無線、CD-ROM等傳輸和存儲介質有效地傳送視頻圖像,并且具有CD的音質,使多媒體技術與通信和廣播等技術結合起來。1/19/202572陳文華3.MPEG—4
標準
用來支持低比特率下的多媒體通信,還支持用于通信、訪問和數字視聽數據處理的新方法。注重多媒體系統的交互性和靈活性,以最少量的數據、極低的音頻/視頻壓縮碼率來顯示建立精確的畫面,達到具有高效編碼、高效存儲與傳播以及可交互操作的特性。1/19/202573陳文華4.MPEG—7
標準
正式名稱為多媒體內容描述接口。
MPEG—7標準只規定信息內容描述格式,而不規定如何從原始的多媒體資料中抽取內容描述和查詢、檢索方法。MPEG—7標準不針對特定的應用領域,而是盡可能支持廣泛的應用領域。
主要用途:在數字圖書館、多媒體目錄服務、圖像分析、音樂詞典、教育、多媒體編輯、多媒體業務引導等多個領域。1/19/202574陳文華4.MPEG—7
標準
視頻壓縮算法用到了三項基本技術:
①幀間編碼技術和基于塊的運動補償技術。②空間壓縮(也稱為幀內壓縮)技術。③熵編碼,使用Huffman編碼技術。
MPEG標準所用的編碼模型與JPEG的編碼模型類似,分為5個階段:
幀間編碼和運動補償、變換編碼、量化、直流分量DC及交流分量AC的編碼和熵編碼。1/19/202575陳文華3.6.2幀間編碼技術
利用的時間相關性可進一步消除視頻其相鄰幀之間具有冗余信息,提高壓縮比。將圖像分成三種類型:1.參考幀(I)以自身圖像的相關性進行壓縮處理,必須要傳送。2.預測幀(P)
用前面的參考幀或預測幀作為參照圖像信息進行預測編碼,并可作為下一個預測幀(B幀圖像或P幀圖像)的參照圖像信息。但因此可能引起預測誤差。1/19/202576陳文華3.6.2幀間編碼技術3.雙向預測幀(B)
又稱插補幀,在預測時,既可以使用前面或后面的視頻幀(I參考幀,P預測幀)進行雙向預測,也可以同時使用前后兩個視頻幀進行預測編碼,但本身不能作為下一個預測幀的參照圖像信息。在編碼時,先對參考幀進行變換編碼,然后對預測幀進行編碼,再對兩者之間的雙向預測幀進行編碼,這個過程對隨后的下一個預測幀和雙向預測幀重復,直到完成所有幀的編碼為止。1/19/202577陳文華3.6.2幀間編碼技術
采用下述四種預測技術:①
幀內編碼
②
前向預測③
后向預測④雙向預測
圖3-12顯示一個典型的視頻圖像序列次序。
I
B
B
P
B
B
P
B
B
P
B
B
P
B
B
I
B
B12
3
4
5
67
8
910
1112
13141516
1718
I幀和P幀間有兩個B幀每十五幀有一幅I幀圖像(0.5秒)1/19/202578陳文華3.6.2幀間編碼技術
編碼器的輸出視頻圖像序列排列順序。1423756108IPBB
P
BBP
B9131112161415……
BPBBIB
B……
發送端編碼器的輸出到接收端解碼器的輸入端,經解碼器的輸出,又恢復為圖3-12編碼器輸入順序顯示。1/19/202579陳文華3.6.3運動補償技術
運動矢量選擇二維16×16像素塊作為一個的運動矢量處理。運動矢量又稱為宏塊,它有不同的類型:可以是I幀內型,F前向預測型、B后向預測型A平均值(雙向預測)型。
概念:
當前圖像可看作是前一幀圖像位移后的結果,其位移的內容包括運動方向和運動幅度。運動補償方法是跟蹤畫面內的運動情況并對其加以補償后,與當前的圖像宏塊值相減得到預測誤差,再進行編碼、傳送。1/19/202580陳文華3.6.3運動補償技術
討論預測器計算表達式,設前一參照幀為I0,后一參照幀為I2,當
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學校現金員管理制度
- 學校規范化管理制度
- 學生代管班管理制度
- 學生課間跑管理制度
- 安保部獎罰管理制度
- 宋朝對地方管理制度
- 定制類訂單管理制度
- 實訓室開放管理制度
- 審核相關方管理制度
- 客運駐站辦管理制度
- 2023年電池車間MES解決方案
- BSCI驗廠全套程序文件
- 2022-2023學年蘇教版高一數學新教材教學講義第4章 指數與對數 單元綜合測試卷
- 2023春國開個人與團隊管理模擬測試1試題及答案
- 蕪湖人教版七年級初一上冊地理期末測試題及答案
- 中考說明文考點及答題技巧 【 知識精細梳理 】 中考語文提分必背
- 文化人類學教學大綱
- 地震學基礎地震烈度課件
- 認識及預防登革熱課件
- 消防救援隊伍資產管理系統培訓課件
- 《創新創業基礎》課程教學成效
評論
0/150
提交評論