第五章序列圖像編碼及運動估計_第1頁
第五章序列圖像編碼及運動估計_第2頁
第五章序列圖像編碼及運動估計_第3頁
第五章序列圖像編碼及運動估計_第4頁
第五章序列圖像編碼及運動估計_第5頁
已閱讀5頁,還剩82頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章

序列圖像編碼及運動估計中國礦業大學信電學院主要內容

5.1概述

5.2視頻信號的數字化5.3二維運動估計

5.4采用時間預測和變換編碼的視

頻編碼5.1概述概念:活動圖像信號,也稱為數字序列圖像或連續幀圖像,指由多幅尺寸相同的靜止圖像組成的圖像序列。例如數字化后的電視或視頻信號。其中的每幅靜止圖像稱為一個幀。

活動圖像與靜止圖像相比,可以認為多了一個時間軸,成為三維信號,因此活動圖像也被稱為三維圖像?;顒訄D像都是一幀一幀地傳輸,看作一個沿時間軸分布的圖像序列,統稱為序列圖像。這里主要討論序列圖像中的視頻圖像的壓縮編碼視頻圖像壓縮編碼分類:

幀內編碼:也稱為空間壓縮。利用每幅(單幀)圖像內部的相關性進行幀內壓縮編碼。當壓縮一幀圖像時,僅考慮本幀的數據而不考慮相鄰幀之間的冗余信息。幀內一般采用有損壓縮算法。壓縮后的視頻數據仍可以以幀為單位進行編輯。幀內壓縮一般達不到很高的壓縮。

幀間編碼:也稱為時間壓縮。利用時間軸上相鄰幀之間的相關性(前后兩幀信息變化很小)進行幀間壓縮編碼。幀間壓縮一般是無損的。

混合編碼:為不同的編碼方法組合在一起相結合的編碼方法。如變換編碼和幀間預測編碼。視頻圖像編碼要求:

實時性:圖像傳輸系統必須能實時地對活動電視

圖像進行編碼傳輸。

高效性:必須能使數字視頻信號以一定目標碼率

傳輸。如視頻信號8bit/像素,數碼率高

達216Mbit/s。視頻圖像編碼目的:在保證一定重建質量前提下,以盡量少數據量來表征視頻信息,以減少視頻序列的碼率,便于能夠在給定的通信信道上實時傳輸視頻信號。5.2視頻信號的數字化5.2.1電視制式幀:一段視頻中的每一幅圖像稱為一幀。根據視覺暫留原理,要使人的視覺產生連續的動態感覺,每秒鐘圖像的播放幀數要在24~30(幀頻)幀頻:每秒播放的幀數。電視制式:即電視的播放標準(掃描分辨率、幀頻、色彩空間的轉換關系不同)。目前國際上有三種不同的電視制式:①NTSC;②PAL;③SECAMNTSC(nationaltelevisionsystemcommittee),

是國家電視制式委員會的縮寫。美國研制的一種與黑白電視兼容的彩色電視制式。幀頻:每秒播放30幀畫面掃描行數(掃描分辨率):每幀有526行像素美國、加拿大、日本、韓國、菲律賓、臺灣等

NTSC制式優點:在信號傳輸無失真情況下,具有比較高彩色圖像質量;兼容性好;重現的彩色圖像無明顯的“爬行”和亮度閃爍現象;較易于實現信號處理;色度信號的形成和分離都比較簡單。PAL(PhaseAlternationLine),

是相位逐行交替的縮寫。西德在1962年研制的一種與黑白電視兼容的彩色電視制式。幀頻:每秒播放25幀畫面掃描行數(掃描分辨率):每幀有625行像素西歐國家、新加坡、澳大利亞、中國大陸以及香港等

PAL制式基本原理:采用逐行倒相正交平衡調幅的色度信號,解調時先經過逐行梳狀濾波器將色度信號分離后再同步檢波;最后利用視覺平均作用補償小幅度串色所引起的彩色偏差。

PAL制式優點:對相位失真不敏感,多徑接收對PAL信號影響小。SECAM(SequentialCouleurAvecMemoire)

是順序與存儲彩色電視系統的縮寫。法國研制的一種與黑白電視兼容的彩色電視制式;幀頻:每秒播放25幀畫面掃描行數(掃描分辨率):每幀有625行像素

法國、俄羅斯等東歐國家和中東一帶

SECAM制式優點:傳輸失真對色度信號影響小,大面積彩色圖像幾乎不受微分增益和微分相位失真的影響,受傳輸通道頻率特性和多徑接收的影響也不大。SECAM是一種順序同時制。是采用錯開傳輸時間的方法(時分原則)來避免串色以及造成的彩色失真。SECAM編碼解碼方式與PAL制式完全不同。不同電視制式的技術指標TV制式NTSCPALSECAM幀頻/Hz302525行/幀525625625亮度帶寬/MHz4.26.06.0彩色幅載波/MHz3.584.434.25色度帶寬/MHz1.3(I),0.6(Q)1.3(U),1.3(V)>1.0(U),>1.0(V)聲音載波/MHz4.56.56.55.2.2視頻信號的數字化(1)復合數字化:先用高速模/數轉換器對彩色全電視信號進行數字化,然后在數字域中進行分離亮度和色度,以獲得所希望的YUV(PAL,SECAM制)分量或YIQ(NTSC制)分量,最后轉換成RGB分量數據。此種方法稱為復合數字化。(2)分量數字化:從復合彩色電視圖像中分離出彩色分量的亮度和色度,得到YUV或YIQ分量,然后用3個模/數轉換器對3個分量分別進行數字化,最后再轉換成RGB空間,此種方法稱為分量數字化。

分量數字化是視頻信號數字化的主流。1.視頻信號數字化方法分類2.視頻信號采樣結構的選擇

概念:采樣結構是指采樣點在空間與時間上的相對位置。

采樣結構分類:正交結構:在圖像平面上沿著水平方向采樣點等間隔排列,沿垂直方向采樣點上下對齊排列。行交叉結構:每行內采樣點數為整數加半個。(a)正交結構(b)行交叉結構3.數字視頻的采樣格式

在復合電視信號中,亮度信號的帶寬是色度信號帶寬的兩倍。因此其數字化時可采用對信號的色差分量的采樣率低于對亮度分量的采樣率。用Y:U:V來表示YUV三分量的采樣比例,則數字視頻的采樣格式有如下4種:

(1)Y:U:V=4:4:4

指在每條掃描線上在水平和垂直方向上每4個連續的取樣點取4個亮度Y樣本、4個紅色差Cr樣本和4個藍色差Cb樣本,相當于每個像素包含3個樣本。即對每個采樣點,亮度Y、色差U和V各取一個樣本,也就是每個像素用3個樣本表示。

采樣格式××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××4:4:4采樣格式4:2:2采樣格式×表示亮度Y采樣點○表示色度UV采樣點

(2)Y:U:V=4:2:2

這種方式指在每條掃描線上,在每4個連續的采樣點上,取4個亮度Y的樣本值,而色差U、V分別取其第一點和第三點的樣本值,共8個樣本,平均每個像素用2個樣本表示。這種方式能給信號的轉換留有一定余量,效果更好一些。這是通常所用的方式,每4個連續的采樣點取4個亮度Y樣本、2個紅色差Cr樣本和2個藍色差Cb樣本,結果相當于平均每個像素用2個樣本表示。

色度信號在水平方向上采樣點數為亮度信號的一半,而在垂直方向上的采樣點數相同。

(3)Y:U:V=4:1:1這種方式是在每4個連續的采樣點上,取4個亮度Y的樣本值,而色差U、V分別取其第一點的樣本值,共6個樣本,每個像素用1.5個樣本表示。

色差信號在在水平方向上采樣點數為亮度信號的1/4,而在垂直方向上的采樣點數相同。采樣格式××××××××××××××××××××××××××××××4:1:1采樣格式×表示亮度Y采樣點○表示色度UV采樣點(4)Y:U:V=4:2:04:2:0子采樣格式是指分別在水平和垂直方向上每2個連續的采樣點上取2個亮度Y樣本、1個紅色差Cr樣本和1個藍色差Cb樣本,平均每個像素用1.5個樣本表示。色差信號分別在水平方向和垂直方向上采樣點數為亮度信號的1/2。采樣格式4:2:0采樣格式4:2:0采樣格式×表示亮度Y采樣點○表示色度UV采樣點MPEG1、H.261支持MPEG2支持掃描方式小結電視圖像既是空間的函數,也是時間的函數,而且又是隔行掃描式,所以其采樣方式比掃描儀掃描圖像的方式要復雜得多。分量采樣時采到的是隔行樣本點,要把隔行樣本組合成逐行樣本,然后進行樣本點的量化,YUV到RGB色彩空間的轉換等,最后才能得到數字視頻數據。

4.數字視頻標準為了在PAL、NTSC和SECAM電視制式之間確定共同的數字化參數,國際無線電咨詢委員會(CCIR)制訂了廣播級質量的數字電視編碼標準,稱為CCIR601標準。該標準規定了彩色電視圖像轉換成數字圖像時使用的采樣頻率,彩色空間之間的轉換關系等。(1)采樣頻率ITU-RBT.601標準為三種電視制式規定了共同的電視圖像采樣頻率。其基本的計算方法是:對PAL制、SECAM制,采樣頻率fs為:fs=625×25×N=15625×N=13.5MHz,N=864其中:N為每一掃描行上的采樣數目。在PAL制、SECAM制中,625是指行數,25表示每秒幀數。

(2)有效顯示分辨率對PAL制和SECAM制的亮度信號,每一條掃描行采樣864個樣本;對NTSC制的亮度信號,每一條掃描行采樣858個樣本。為了使這些制式的采樣點兼容,規定每一掃描行的有效樣本數均為720個。(3)數據量CCIR601規定,每個樣本點都按8位數字化,即有256個等級。但實際上亮度信號占220級、色度信號占225級,其他位作同步、編碼等控制用。如果按fs的采樣率和4:2:2的格式采樣,則數字視頻的數據量為:

13.5(MHz)×8(bit)+2×6.75(MHz)×8(bit)=27MB/s

(4)CIF、QCIF和SQCIF為了兼容625行的電視圖像和525行的電視圖像,CCITT定義了公用中分辨率格式CIF(CommonIntermediateFormat),1/4公用中分辨率格式(Quarter-CIF,QCIF)和(Sub-QuarterCommonIntermediateFormat,SQCIF)格式。CIF格式具有如下特性:

電視圖像的空間分辨率為352×288。

使用非隔行掃描(Non-InterlacedScan)。

使用NTSC幀速率,電視圖像的最大幀速率為30000/1001≈29.97幅/秒。CIFQCIFSQCIF行數/幀像素/行行數/幀像素/行行數/幀像素/行亮度(Y)288360(352)144180(176)96128色度(Cb)144180(176)7290(88)4864色度(Cr)144180(176)7290(88)4864下表是CIF、QCIF和SQCIF圖像格式參數。5.3視頻信號編碼方法一、視頻信號編碼的依據:1、視頻信號編碼的出發點:

對于活動圖像,相鄰幀的時間間隔很短(1/251/30s),在景物運動不很劇烈場合,相鄰幀間相關性很強。編碼時充分利用活動圖像的相鄰幀(在時間軸方向)的相關性進行預測。2、視頻信號編碼的依據:

依據1:從信源角度看,自然景物大多都處于相對不變或緩變狀態,為幀間相關性存在前提條件。5.3.1視頻信號編碼基礎幀間預測典型情況:可視電話圖像可視電話圖像內容通常為一個細節不十分復雜背景前,有一個活動量不大的單個人物的頭-肩像。假定人位置在第k幀與第k-1幀相比有一定x方向位移,可將畫面分為3個各具特點區域:背景區、運動物體區、暴露區背景區:指攝像機不動而攝取人物后面的背景。一般背景區是靜止的,若外界條件不變,則這兩幀背景區絕大部分數據相同,意味著兩幀背景區之間幀間相關性很強。運動物體區:若將物體運動近似看作簡單平移,則第k幀與第k-1幀的運動區的數據也基本相同。簡單平移看作只有x方向位移量Dx,則可采用某種位移估值方法對位移量進行“運動補償”。暴露區:指在運動后所暴露出的原來曾被物體遮蓋住區域。若有存儲器將這暴露區的數據暫時存儲,則再次經遮蓋后再暴露出來的數據與原先存儲數據相同,這為一幀間相關性。注意:如果將整個畫面從一類景物切換為另一類景物時,則談不上幀間相關性利用。因為整個畫面內容數據全部改變了。這三類區域的幀間相關性是幀間壓縮編碼的重要依據。

依據2:利用人眼視覺特性,在活動圖像編碼中針對圖像內容在清晰度和活動性(幀頻)適當調整碼率,可使重建圖像在視覺上保持一致主觀效果。保證對于傳輸序列圖像的靜止部分的較高空間分辨率。同時,可降低時間軸分辨率,通過抽幀或跳幀減少傳輸幀數,在接收端依靠幀存儲器把未傳輸幀補充??山档托蛄袌D像中的運動物體部分的分辨率。物體的運動速度愈高,可用更低清晰度進行傳輸。二、視頻信號編碼的關鍵問題:對于序列圖像中大量存在的靜止或緩變區域,如何把運動區域和靜止或緩變區域分割開來??對于靜止區域如何壓縮編碼??對于運動區域如何壓縮編碼??如何把運動區域和靜止或緩變區域分割?設第k幀圖像位于位置z=(x,y)的像素采樣值為Ik(z)。其預測值為第k-1幀圖像(前一幀圖像)的相對應同一位置處像素復原值I’k-1(z)。則有:定義一閾值TH,則有:若|FDk(z)|TH

,認為Ik(z)位于圖像相對靜止部分

(背景區)

若|FDk(z)|TH

,認為Ik(z)位于圖像運動區域。幀間差如何對于靜止或緩變區域壓縮編碼?幀(場)重復工作形式:通常用在可視電話等傳輸碼率很低應用場合。在序列圖像傳輸中進行抽幀,使少傳一些幀。在接收端可以采用對前幀重復讀出方式補滿。如何對于運動區域壓縮編碼?運動估計與補償預測方法:相鄰畫面高度相似,其中差別變化是由于物體運動或攝象機運動所引起的。畫面中物體或像素的運動是可以估計的。因此,可以從前面的畫面預測當前畫面,編碼器只對預測誤差進行編碼。不能進行預測的畫面或區域使用JPEG進行編碼(利用畫面內部相關性)。相鄰幀間的主要變化是由于構成景物的各物體的運動引起的。5.3.2運動估計與補償的基本概念

定義:將活動圖像分為若干個塊,檢測出當前幀中每個塊在前一幀(參考幀)圖像中的對應位置,從而可以估計出這個塊的位移,用運動矢量表示。這個過程叫做運動估計。

運動估計通常以宏塊為單位進行,計算被壓縮圖像與參考圖像在對應位置處的宏塊間的位置偏移。該位置偏移是以運動矢量描述,代表水平和垂直兩個方向的位移。1.運動估計場景中物體運動反映在畫面中,表現為當前畫面部分內容是前一畫面部分內容的位移運動。2.運動補償

定義:就是根據求出的運動矢量,找到當前幀的像素(或像素塊)是從前一幀的哪個位置移動過來的,從而得到當前幀像素(或像素塊)的預測值。由于用當前幀在前一幀圖像中對應部分來對當前幀進行預測,而相鄰兩幀中對應的運動部分圖像信息會有所不同,所以一般會產生補償殘差。

運動估計及補償的基本原理:利用幀間運動估計得到待編碼圖像塊的一個(或多個)參考塊,然后用這個參考塊進行運動補償,將補償后殘差進行DCT變換和可變長編碼。3.運動補償幀間預測編碼定義:對于運動的物體,如果能估計出物體在相鄰幀內的相對位移,那么用上一幀中物體的對應區域對當前幀物體進行預測,編碼傳輸預測誤差部分,就可壓縮這部分區域的碼率。這種考慮了運動物體對應區域的位移或運動的預測方式稱為運動補償幀間預測編碼。幀間運動估計與補償預測的基本過程運動補償幀間預測編碼原理框圖:+-熵編碼幀間預測器運動補償壓縮圖像塊輸入圖像塊enfnfn運動補償預測幀間誤差圖像運動補償預測圖像其中:fn為輸入圖像塊;fn為運動補償預測圖像運動補償幀間預測編碼技術的組成:物體的劃分:劃分靜止區域和運動區域。這里假設運動物體僅作平移。

運動估計:對每一個運動物體進行位移估計。

運動補償:由位移估值建立同一運動物體在不同幀空間位置對應關系,建立預測關系。

補償后的預測信息編碼:對運動物體的補償后的位移幀差信號DFD,以及運動矢量等進行編碼傳輸。5.3.3基于塊的運動估計—塊匹配算法塊匹配算法通過對圖像序列中相鄰兩幀圖像間的子塊匹配來進行運動估計。前提條件:在塊匹配算法中,圖像被分割為子塊,把子塊分成靜止和運動兩類,運動子塊中的所有像素的運動矢量被認為相同,都只作相等的平移?;舅枷耄簩τ趲琸(當前幀)中像素(n1,n2)的位移,通過考慮一個中心定位在(n1,n2)的塊,搜索幀來找出同樣大小的最佳匹配塊的位置來確定。1.基本思想

初始搜索點的選擇。①直接選擇參考幀對應塊中心位置;②選擇預測的起點。

匹配準則。一般方法有均方誤差函數和平均絕對誤差函數等準則。

搜索方法。有全搜索、三步搜索、交叉搜索、分層運動估計算法等。

塊的大小選擇。塊的大小應滿足下列要求:每一個塊幾乎都只具有單一運動或者沒有運動。塊不能過小,以保證可以搜索到正確的塊。目前塊大小用較多為16,有時也取4,8。2.提高搜索效率的主要技術常用的匹配準則給定兩個圖像塊Bi和Bi-1,均方誤差絕對誤差求這兩個誤差函數對應最小值時(?x,?y)為最佳運動估計⑴全搜索算法(FS)基本思想:要估計一個像素的位移(運動)時,在當前幀中取以該像素為中心的一個子塊,然后在前一幀圖像中所有可能位置尋找一個與之最匹配(相關最大)的子塊,則匹配子塊中心與當前幀中子塊中心的位移即為估計的位移(運動)矢量。匹配準則:最小平均絕對誤差函數(MAD)設將當前幀中劃分為NN像素子塊,A為待處理的子塊。水平和垂直方向最大位移均為dm。3.典型的塊匹配算法塊匹配算法就是在其前一幀以A為中心的搜索區SR:

(N+2dm)(N+2dm)內尋找一個與A相關性最大的同樣大小的子塊B,B與A的坐標偏移量即為估計的子塊A的運動矢量設B與A的坐標偏移量為(i,j),則:平均絕對

誤差MAD第k幀灰度值則在某一個位置偏移(i,j)下有最小誤差minij,選定一閾值T,則有:當minij

T,說明在一定誤差范圍內達到匹配,運動矢量為dx=i,dy=j當minij

>T,說明不能匹配。應該對該子塊直接幀內編碼。在全搜索條件下,塊匹配算法達到全局最優,但缺點為運算量大,總共要計算(1+2dm)(1+2dm)次匹配運算,且搜索算法時間占到整個編碼時間的50%~80%。⑵二維對數算法(TDL)開創了快速算法的先例?;舅枷耄簭脑c開始,以“十”字形分布的五個點構成每次搜索的點群,通過快速搜索跟蹤最匹配點。算法步驟:從原點開始,選取一定的步長,在以“十”字形分布的五個點處進行塊匹配計算并比較若最匹配點在邊緣四個點處,則以該點作為中心點,保持步長不變,重新搜索“十”字形分布的五個點若最匹配點位于中心點,則保持中心點位置不變,將步長減半,構成“十”字形點群,在五個點處計算若步長為1,在中心及周圍8個點處找出最匹配點,該點所在位置即對應最佳運動矢量,算法結束;否則,重復第2步算法搜索過程圖示:11111222223333344444-7-6-5-4-3-2-101234567-7-6-5-4-3-2-1012345674444算法搜索過程圖示:起初步長=2⑶三步搜索法(TSS)基本思想:搜索范圍為7。即在上一幀以當前子塊為原點,將當前子塊在其上下左右距離為7范圍內按一定規則移動,每移動到一個位置,取出同樣大小的子塊與當前子塊進行匹配計算。匹配準則:最小均方誤差函數(MSE)或最小平均絕

對誤差函數(MAD)具體方法:第一步:在搜索范圍內,以當前子塊為中心,以4為步幅。選擇標記為“1”的9個點分別為中心位置的子塊與當前子塊進行匹配,求出最佳匹配的子塊中心位置,然后把中心位置移到該點。如果在某點找到最小的MSE或MAD,則表示在該點一定范圍內達到最佳匹配。第二步:以第一步求出最佳子塊為中心,以2為步幅。選擇9個標記為“2”點分別為中心位置的子塊與當前子塊進行匹配,求出最佳匹配的子塊中心位置,然后把中心位置移到該點。第三步:以第二步求出最佳子塊為中心,以1為步幅。選擇9個標記為“3”點分別為中心位置的子塊與當前子塊進行匹配,求出最佳匹配的子塊中心位置。則它與當前子塊中心位置偏移量為估計的位移量。結論:在dm=7時,三步法僅需要39-7=25次匹配,比全搜索算法匹配次數少很多。三步搜索算法111111111222222222333333333搜索9+8+8=25次-7-6-5-4-3-2-101234567-7-6-5-4-3-2-101234567

⑷交叉法(CSA)是在TDL、TSS基礎上為進一步減少計算量發展起來的基本思想:從原點開始,以“×”字形分布的五個點構成搜索點群,以TDL的搜索方式搜索最匹配點,僅在最后一步采用“十”字形點群算法描述:從原點開始,選取最大搜索長度的一半作為步長,在以“×”字形分布的五個點處進行塊匹配計算并比較以上一步的最匹配點為中心,步長減半,繼續進行“×”字形五點搜索,若步長大于1,重復本步;若步長為1,則進行第三步若上一步最匹配點處于中心點、左下角或右上角,做“十”字形搜索;若上一步最匹配點處于左上角或右下角,則做“×”字形搜索。搜索到的最匹配點為最佳運動矢量,算法結束交叉法搜索過程圖示:111112222233333搜索5+4+4=13次-7-6-5-4-3-2-101234567-7-6-5-4-3-2-101234567

⑸四步搜索法(FSS)基本思路現實中序列圖像的運動矢量大多都是中心分布的,從而在5×5大小的搜索窗口上構造了有9個檢測點的搜索模板步驟以搜索區域原點為中心選定5×5的搜索窗,然后在9個檢測點處進行匹配計算若最匹配點位于中心點,跳到第3步,即縮小搜索窗口為3×3最匹配點不在中心點,跳到第2步窗口保持5×5,搜索模式改變上一步最匹配點位于窗口4個角上,則另外再搜索5個檢測點上一步最匹配點位于窗口的4邊中心點處,則需再搜索3個檢測點若這一次的最匹配點在窗口中心,則跳到第3步,否則,重復本步將窗口縮小到3×3,計算出最匹配點的位置即對應最佳運動矢量四步搜索法過程圖示1111111112222333333444444444-7-6-5-4-3-2-101234567-7-6-5-4-3-2-101234567最匹配點分別為:(0,-2)(2,-4)(2,-4)(3,-4),搜索共分4步。

⑹菱形搜索法(DS)本算法經過多次改進,已成為目前快速匹配算法中性能最優異的算法之一;1999年10月,DS算法被MPEG-4國際標準采用并收入驗證模型。基本思想:使用兩種搜索模板,9個檢測點的大模板LDSP和5個檢測點的SDSP

搜索時,先用大模板計算,當最匹配塊出現在中心點處時,換大模板為小模板,再進行匹配計算,5個點中的最匹配點即為最優點。大模板LDSP小模板SDSP算法步驟:用LDSP在搜索區域中心及周圍8個點處進行匹配計算,若最匹配點位于中心,則進行

Step3;否則,到Step2

以上一次找到的最匹配點為中心點,用新的LDSP來計算,若最匹配點位于中心點,則進行Step3;否則,重復本步以上一次找到的最匹配點為中心點,將LDSP換為SDSP,在5個點處計算,找到最匹配點,該點所在位置即為最佳運動矢量。菱形搜索算法過程圖示1111111112222223333344444-7-6-5-4-3-2-101234567-7-6-5-4-3-2-101234567最匹配點分別為:(2,0)(2,-2)(2,-2)(2,-3),使用3次LDSP和1次SDSP,搜索共分5步。菱形搜索算法分析選用了大小兩種形狀的搜索模板,先用LDSP搜索,步長大,搜索范圍廣,進行粗定位,避免搜索窗口太小時,陷入局部最優;粗定位后,再用SDSP準確定位,保證匹配精度從前圖中可看出,搜索時各步之間相關性強,模板移動只需要在幾個新的檢測點處進行匹配計算,提高了搜索速度復習:視頻信號編碼技術————

運動補償幀間預測編碼技術物體的劃分:劃分靜止區域和運動區域。這里假設運動物體僅作平移。

運動估計:對每一個運動物體進行位移估計。

運動補償:由位移估值建立同一運動物體在不同幀空間位置對應關系,建立預測關系。

補償后的預測信息編碼:對運動物體的補償后的位移幀差信號,以及運動矢量等進行編碼傳輸。②③④抽幀或跳幀復習:如何實現運動矢量估計?——塊匹配算法

初始搜索點的選擇。①直接選擇參考幀對應塊中心位置;②選擇預測的起點。

匹配準則。一般方法有均方誤差函數和平均絕對誤差函數等準則。

搜索方法。有全搜索、三步搜索、交叉搜索等。

塊的大小選擇。塊的大小應滿足下列要求:每一個塊幾乎都只具有單一運動或者沒有運動。塊不能過小,以保證可以搜索到正確的塊。目前塊大小用較多為16,有時也取4,8。復習:塊匹配方法全搜索算法二維對數搜索算法三步搜索算法交叉法四步搜索算法菱形(鉆石形)搜索算法②以“十”字形分布的五個點構成每次搜索的點群,若步長為1,周圍8鄰域匹配。③搜索范圍為7—“4-2-1”④以“×”字形的五個點構成搜索點群,若步長為1,上一步最匹配點處于中心點、左下角或右上角,“十”字形搜索;若處于左上角或右下角,則“×”字形搜索。⑤“5×5”的搜索窗口,若步長為1,則“3×3”的搜索窗口⑥9個檢測點的大模板LDSP和5個檢測點的SDSP大模板LDSP小模板SDSP整像素運動估計

亞像素搜索法(DS)前幾種運動估計算法,得到的運動矢量為整數值,稱之為整像素精度運動估計。在塊匹配算法中,搜索相應塊的步長不一定是整數。也就是實際圖像的運動并不一定是整像素,所以,整像素運動估計有一定的誤差。為進一步提高精度,希望估計到的運動矢量為分數像素數,或稱亞像素。使用亞像素步長的一個問題是對于當前幀里給定的一個采樣點,在參考幀里可能沒有相應的采樣點,必須由可利用的樣點內插得到。對圖像進行插值運算,得到整像素點之間的分數像素點的值,然后再進行運動估計。塊匹配搜索移動時,塊中心點可以和分數像素點對準,使得到更精確的運動矢量。

MPEG和H.263均采用了1/2像素精度運動估計,證實了比整數運動估計更有效。

H.264采用了1/4像素精度運動估計.插值算法:一般采用雙線性插值?!痢痢痢痢琳袼匚恢谩癜胂袼匚恢貌捎秒p線性內插法實現半像素精度預測5.3.4基于像素的運動估計在基于像素的運動估計中,對每個像素估計其運動矢量,顯然這個問題難以處理:如果使用恒定亮度假設,對于參考幀的每個像素,在目標幀里將會有許多完全相同亮度的像素在圖像編碼的發展過程中,該辦法曾起過重要作用,但沒有被標準所采用。實驗研究也表明,它的有效性不如塊匹配

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論