圖像信息處理技術_第1頁
圖像信息處理技術_第2頁
圖像信息處理技術_第3頁
圖像信息處理技術_第4頁
圖像信息處理技術_第5頁
已閱讀5頁,還剩433頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

關于圖像信息處理技術第1頁,課件共438頁,創作于2023年2月4.1圖像信號概述

圖像是一種可視化的信息,圖像信號是圖像信息的理論描述方法,圖像信號按其內容變化與時間的關系來分,主要包括靜態圖像和動態圖像兩種。靜態圖像其信息密度隨空間分布,且相對時間為常量;動態圖像也稱時變圖像,其空間密度特性是隨時間而變化的。人們經常用靜態圖像的一個時間序列來表示一個動態圖像。第2頁,課件共438頁,創作于2023年2月

圖像分類還可以按其他方式進行:如按其亮度等級的不同可分為二值圖像和灰度圖像;按其色調的不同可分為黑白圖像和彩色圖像;按其所占空間的維數不同可分為平面的二維圖像和立體的三維圖像等等。圖像信號的記錄、存儲和傳輸可以采用模擬方式或數字方式。傳統的方式為模擬方式,例如,目前我們在電視上所見到的圖像就是以一種模擬電信號的形式來記錄,并依靠模擬調幅的手段在空間傳播的。將模擬圖像信號經A/D變換后就得到數字圖像信號,數字圖像信號便于進行各種處理,例如最常見的壓縮編碼處理就是在此基礎上完成的。本書介紹的圖像信息處理技術就是針對數字圖像信號的。第3頁,課件共438頁,創作于2023年2月1.彩色圖像信號的分量表示對于黑白圖像信號,每個像素點用灰度級來表示,若用數字表示一個像素點的灰度,有8比特就夠了,因為人眼對灰度的最大分辨力為26。對于彩色視頻信號(例如常見的彩色電視信號)均基于三基色原理,每個像素點由紅(R)、綠(G)、藍(B)三基色混合而成。若三個基色均用8比特來表示,則每個像素點就需要24比特,由于構成一幅彩色圖像需要大量的像素點,因此,圖像信號采樣、量化后的數據量就相當大,不便于傳輸和存儲。第4頁,課件共438頁,創作于2023年2月

為了解決此問題,人們找到了相應的解決方法:利用人的視覺特性降低彩色圖像的數據量,這種方法往往把RGB空間表示的彩色圖像變換到其他彩色空間,每一種彩色空間都產生一種亮度分量和兩種色度分量信號。常用的彩色空間表示法有YUV、YIQ和YCbCr等。第5頁,課件共438頁,創作于2023年2月

(1)YUV彩色空間。通常我們用彩色攝像機來獲取圖像信息,攝像機把彩色圖像信號經過分色棱鏡分成R0、G0、B0三個分量信號,分別經過放大和r校正得到RGB,再經過矩陣變換電路得到亮度信號Y和色差信號U、V,其中亮度信號表示了單位面積上反射光線的強度,而色差信號(所謂色差信號,就是指基色信號中的三個分量信號R、G、B與亮度信號之差)決定了彩色圖像信號的色調。最后發送端將Y、U、V三個信號進行編碼,用同一信道發送出去,這就是在PAL彩色電視制式中使用的YUV彩色空間。YUV與RGB彩色空間變換的對應關系如式(4.1-1)所示。第6頁,課件共438頁,創作于2023年2月YUV彩色空間的一個優點是,它的亮度信號Y和色差信號U、V是相互獨立的,即Y信號分量構成的黑白灰度圖與用U、V兩個色彩分量信號構成的兩幅單色圖是相互獨立的。因為YUV是獨立的,所以可以對這些單色圖分別進行編碼。此外,利用YUV之間的獨立性解決了彩色電視機與黑白電視機的兼容問題。

(4.1-1)第7頁,課件共438頁,創作于2023年2月YUV表示法的另一個優點是,可以利用人眼的視覺特性來降低數字彩色圖像的數據量。人眼對彩色圖像細節的分辨能力比對黑白圖像細節的分辨能力低得多,因此就可以降低彩色分量的分辨率而不會明顯影響圖像質量,即可以把幾個相同像素不同的色彩值當做相同的色彩值來處理(即大面積著色原理),從而減少了所需的數據量。在PAL彩色電視制式中,亮度信號的帶寬為4.43MHz,用以保證足夠的清晰度,而把色差信號的帶寬壓縮為1.3MHz,達到了減少帶寬的目的。第8頁,課件共438頁,創作于2023年2月

在數字圖像處理的實際操作中,就是對亮度信號Y和色差信號U、V分別采用不同的采樣頻率。目前常用的Y、U、V采樣頻率的比例有4∶2∶2和4∶1∶1,當然,根據要求的不同,還可以采用其他比例。例如要存儲R∶G∶B=8∶8∶8的彩色圖像,即R、G、B分量都用8比特表示,圖像的大小為640×480像素,那么所需要的存儲容量為640×480×3×8/8=921600字節;如果用Y∶U∶V=4∶1∶1來表示同一幅彩色圖像,對于亮度信號Y,每個像素仍用8比特表示,而對于色差信號U、V,每4個像素用8比特表示,則存儲量變為640×480×(8+4)/8=460800字節。盡管數據量減少了一半,但人眼察覺不出有明顯變化。第9頁,課件共438頁,創作于2023年2月

(2)YIQ彩色空間。在NTSC彩色電視制式中選用YIQ彩色空間,其中Y表示亮度,I、Q是兩個彩色分量。I、Q與U、V是不相同的。人眼的彩色視覺特性表明,人眼對紅、黃之間顏色變化的分辨能力最強;而對藍、紫之間顏色變化的分辨能力最弱。在YIQ彩色空間中,色彩信號I表示人眼最敏感的色軸,Q表示人眼最不敏感的色軸。在NTSC制式中,傳送人眼分辨能力較強的I信號時,用較寬的頻帶(1.3~1.5MHz);而傳送人眼分辨能力較弱的Q信號時,用較窄的頻帶(0.5MHz)。YIQ與RGB彩色空間變換的對應關系如式(4.1-2)所示。第10頁,課件共438頁,創作于2023年2月(4.1-2)第11頁,課件共438頁,創作于2023年2月

(3)YCbCr彩色空間。YCbCr彩色空間是由ITU-R(國際電聯無線標準部,原國際無線電咨詢委員會CCIR)制定的彩色空間。按照CCIR601-2標準,將非線性的RGB信號編碼成YCbCr,編碼過程開始是先采用符合SMPTE-CRGB(它定義了三種熒光粉,即一種參考白光,應用于演播室監視器及電視接收機標準的RGB)的基色作為r校正信號。第12頁,課件共438頁,創作于2023年2月

非線性RGB信號很容易與一個常量矩陣相乘而得到亮度信號Y和兩個色差信號Cb、Cr。YCbCr通常在圖像壓縮時作為彩色空間,而在通信中是一種非正式標準。YCbCr與RGB彩色空間變換的對應關系如式(4.1-3)所示,可以看到:數字域中的彩色空間變換與模擬域中的彩色空間變換是不同的。(4.1-3)第13頁,課件共438頁,創作于2023年2月2.彩色圖像信號的分量編碼通過圖像信號的表示方法的討論可以看到:對于彩色圖像信號數字壓縮編碼,可以采用兩種不同的編解碼方案。一種是復合編碼,它直接對復合圖像信號進行采樣、編碼和傳輸;另一種是分量編碼,它首先把復合圖像中的亮度和色度信號分離出來,然后分別進行取樣、編碼和傳輸。目前分量編碼已經成為圖像信號壓縮的主流,在20世紀90年代以來頒布的一系列圖像壓縮國際標準中均采用分量編碼方案。以YUV彩色空間為例,分量編碼系統的基本框圖如圖4.1-1所示,其中對亮度信號Y使用較高的采樣頻率,對色差信號U、V則使用較低的采樣頻率。

第14頁,課件共438頁,創作于2023年2月圖4.1-1彩色圖像信號分量編碼系統的基本框圖第15頁,課件共438頁,創作于2023年2月4.2圖像信號數字化

圖像信號數字化與音頻數字化一樣主要包括兩方面的內容:取樣和量化。圖像在空間上的離散化稱為取樣,即使空間上連續變化的圖像離散化,也就是用空間上部分點的灰度值來表示圖像,這些點稱為樣點(或像素,像元,樣本)。一幅圖像應取多少樣點呢?其約束條件是:由這些樣點采用某種方法能夠正確重建原圖像。第16頁,課件共438頁,創作于2023年2月

取樣的方法有兩類:一類是直接對表示圖像的二維函數值進行取樣,即讀取各離散點上的信號值,所得結果就是一個樣點值陣列,所以也稱為點陣取樣;另一類是先將圖像函數進行正交變換,用其變換系數作為取樣值,故稱為正交系數取樣。對樣點灰度級值的離散化過程稱為量化,也就是對每個樣點值數字化,使其和有限個可能電平數中的一個對應,即使圖像的灰度級值離散化。量化也可分為兩種:一種是將樣點灰度級值等間隔分檔取整,稱為均勻量化;另一種是將樣點灰度級值不等間隔分檔取整,稱為非均勻量化。第17頁,課件共438頁,創作于2023年2月4.2.1取樣點數和量化級數的選取假定一幅圖像取M×N個樣點,對樣點值進行Q級分檔取整。那么對M,N和Q如何取值呢?首先,M,N,Q一般總是取2的整數次冪,如Q=2b,b為正整數,通常稱為對圖像進行b比特量化,M、N可以相等,也可以不相等。若取相等,則圖像距陣為方陣,分析運算方便一些。其次,關于M、N和b(或Q)數值大小的確定。對b來講,取值越大,重建圖像失真越小。若要完全不失真地重建原圖像,則b必須取無窮大,否則一定存在失真,即所謂的量化誤差。第18頁,課件共438頁,創作于2023年2月

一般供人眼觀察的圖像,由于人眼對灰度分辨能力有限,用5~8比特量化即可。對M×N的取值主要依據取樣的約束條件。也就是在M×N大到滿足取樣定理的情況下,重建圖像就不會產生失真,否則就會因取樣點數不夠而產生所謂混淆失真。為了減少表示圖像的比特數,應取M×N點數剛好滿足取樣定理。這種狀態的取樣即為奈奎斯特取樣。M×N常用的尺寸有512×512,256×256,64×64,32×32等。第19頁,課件共438頁,創作于2023年2月

再次,在實際應用中,如果允許表示圖像的總比特數M×N×b給定,對M×N和b的分配往往是根據圖像的內容和應用要求以及系統本身的技術指標來選定的。例如,若圖像中有大面積灰度變化緩慢的平滑區域如人圖像的特寫照片等,則M×N取樣點可以少些,而量化比特數b多些,這樣可使重建圖像灰度層次多些。若b太少,在圖像平滑區往往會出現“假輪廓”。第20頁,課件共438頁,創作于2023年2月

反之,對于復雜景物圖像,如群眾場面的照片等,量化比特數b可以少些,而取樣點數M×N要多些,這樣就不會丟失圖像的細節。究竟M×N和b如何組合才能獲得滿意的結果很難講出一個統一的方案,但是有一點是可以肯定的:不同的取樣點數和量化比特數組合可以獲得相同的主觀質量評價。第21頁,課件共438頁,創作于2023年2月*4.2.2點陣取樣在分析取樣和重建圖像時,往往認為取樣系統的輸入圖像是一個確定的圖像場,即為確知函數,如一幅照片或膠片。但是在某些情況下,如電視圖像由于噪聲影響和取樣方式變化,把這種取樣看成是二維隨機過程的取樣更為有益,當然實際取樣還有一些問題要注意。第22頁,課件共438頁,創作于2023年2月1.確定圖像場的點陣取樣原理對理想取樣而言,其取樣函數為空間抽樣函數

S(x,y),離散形式可表示為(4.2-1)δ函數的取樣陣列如圖4.2-1所示。第23頁,課件共438頁,創作于2023年2月圖4.2-1δ函數的取樣陣列第24頁,課件共438頁,創作于2023年2月

令fI(x,y)代表一理想的無限大連續圖像場,其點陣取樣方法就是用空間抽樣函數S(x,y)和連續圖像函數fI(x,y)相乘。設fS(x,y)表示取樣后的圖像,理想取樣數學模型如圖4.2-2所示。圖4.2-2理想取樣數學模型第25頁,課件共438頁,創作于2023年2月由此可以得到(4.2-2)第26頁,課件共438頁,創作于2023年2月

式中,連續函數fI(x,y)移入求和式內變為離散形式fI(iΔx,jΔy),表明只是在取樣點(iΔx,jΔy)上計值。根據二維傅立葉變換卷積定理,可以得到頻域關系式為

(4.2-3)式中第27頁,課件共438頁,創作于2023年2月

假定理想圖像的頻譜是有限的,截止頻率為uc和vc,根據δ函數的篩選性質對式(4.2-3)進一步運算可以得式(4.2-4)和如圖4.2-3所示的取樣圖像頻譜示意圖。

(4.2-4)第28頁,課件共438頁,創作于2023年2月圖4.2-3取樣圖像頻譜示意圖第29頁,課件共438頁,創作于2023年2月

由式(4.2-4)和圖4.2-3可以看出,取樣圖像頻譜是原圖像頻譜在頻域中的無窮多個重復。重復頻譜之間間隔Δu和Δv取決于取樣間隔Δx和Δy的大小,只要選取合適的Δx、Δy,就能保證Δu、Δv等于或大于原圖像截止頻率2uc、2vc,那么各個重復頻譜之間就不會重疊。在這種情況下,選用合適的二維重建濾波器,就可以取出一個完整的原圖像頻譜(即除所有i,j≠0的頻譜成分),再由二維傅立葉反變換獲得和原圖像一樣的重建圖像

。第30頁,課件共438頁,創作于2023年2月

取樣正確與否的原則是能否由取樣圖像不失真地重建原圖像,而正確取樣的關鍵是取樣間隔Δx、Δy的選擇,因此保證正確取樣的條件是因為(4.2-5)第31頁,課件共438頁,創作于2023年2月所以則(4.2-6)第32頁,課件共438頁,創作于2023年2月

滿足式(4.2-5)和式(4.2-6)中“等于”條件的取樣稱為奈奎斯特取樣。滿足兩式中大于條件的取樣稱為過取樣,而不滿足上述兩條件的取樣稱為欠取樣。在欠取樣情況下,會產生混淆失真。混淆失真是取樣中應注意的一個重要問題。防止出現混淆失真的辦法,從理論上講,若已知原圖像頻譜的最高頻率成分,則使用過取樣或奈奎斯特取樣,而不要使用欠取樣;第33頁,課件共438頁,創作于2023年2月

但若不知道原圖像頻譜的最高頻率成分,則應先采用已知截止頻率的低通濾波器預先過濾圖像,限制其高頻率成分,再針對低通濾波器截止頻率進行過取樣或奈奎斯特取樣。在實際取樣系統中,取樣脈沖寬帶效應相當于一個低通濾波器,另外光學系統的透鏡散焦,孔闌衍射也都可以等效為低通濾波器的作用,盡管會引起圖像模糊降質,但對防止混淆失真卻是有好處的。第34頁,課件共438頁,創作于2023年2月2.隨機圖像場取樣實際圖像往往有噪聲,這種附加有噪聲的確定圖像場可以認為是隨機圖像場,因此這里簡單介紹一下隨機圖像場的取樣。式中,τx=x1-x2;τy=y1-y2。第35頁,課件共438頁,創作于2023年2月

用狄拉克取樣函數S(x,y)對這個隨機過程進行取樣所獲得的取樣場為(4.2-8)因而取樣場的自相關函數為

(4.2-9)第36頁,課件共438頁,創作于2023年2月

根據狄拉克函數性質:兩個狄拉克函數相乘還是一個狄拉克函數,即S(x1,y1)S(x2,y2)=S(x1-x2,y1-y2)=S(τx,τy)

(4.2-10)將式(4.2-7)和式(4.2-10)代入式(4.2-9)即可得第37頁,課件共438頁,創作于2023年2月對上式兩邊取二維傅立葉變換,根據傅氏變換定理得(4.2-11)(4.2-12)第38頁,課件共438頁,創作于2023年2月圖4.2-4有噪聲圖像的取樣(一維示意圖)第39頁,課件共438頁,創作于2023年2月4.2.3圖像信號量化經過取樣的圖像只是在空間上被離散為像素(樣本)的陣列,而每一個樣本灰度值還是一個有無窮多個取值的連續變化量,必須將其轉化為有限個離散值,賦予不同碼字才能真正成為數字圖像,再由計算機或其他數字設備進行處理運算,這樣的轉化過程稱為量化。將樣本連續灰度等間隔分層量化方式稱為均勻量化,不等間隔分層量化方式稱為非均勻量化。量化既然以有限個離散值來近似表示無限多個連續量,就一定會產生誤差,這就是所謂的量化誤差。第40頁,課件共438頁,創作于2023年2月

由此產生的失真叫量化失真或量化噪聲,對均勻量化來講,量化分層越多,量化誤差越小,但編碼時占用比特數就越多。在一定比特數下,為了減少量化誤差,往往要用非均勻量化,如按圖像灰度值出現的概率大小不同進行非均勻量化,即對灰度值經常出現的區域進行細量化,反之進行粗量化。在實際圖像系統中,由于存在著成像系統引入的噪聲及圖像本身的噪聲,因此量化等級取得太多(量化間隔太小)是沒有必要的,因為如果噪聲幅度值大于量化間隔,量化器輸出的量化值就會產生錯誤,得到不正確的量化。第41頁,課件共438頁,創作于2023年2月

在應用屏幕顯示其輸出圖像時,灰度鄰近區域邊界會出現“忙動”現象。假設噪聲是高斯分布,均值為0,方差為σ2,在有噪聲情況下,最佳量化層選取有兩種方法,一是令正確量化的概率大于某一個值,二是使量化誤差的方差等于噪聲方差。針對輸出圖像是專供人觀察評價的應用,研究出了一些按人的視覺特性進行非均勻量化方式,如圖像灰度變化緩慢部分細量化,而圖像灰度變化快的細節部分粗量化,這是由于視覺掩蓋效應被發現而產生的。再如按人的視覺靈敏度特征進行對數形式量化分層等。第42頁,課件共438頁,創作于2023年2月4.3數字圖像壓縮方法的分類

圖像壓縮的基本目標就是減小數據量,但最好不要引起圖像質量的明顯下降,在大多數實際應用中,為了取得較低的比特率,輕微的質量下降是允許的。至于圖像壓縮到什么程度而沒有明顯的失真,則取決于圖像數據的冗余度。較高的冗余度形成較大的壓縮,而典型的圖像信號都具有很高的冗余度,正是這些冗余度的存在允許我們對圖像進行壓縮。第43頁,課件共438頁,創作于2023年2月

例如,我們在第2章介紹的空間冗余和時間冗余是圖像信號最常見的冗余,所有的這些冗余度都可以被除去而不會引起顯著的信息損失,但壓縮編碼無法減少冗余度。不同的出發點有不同的分類,按照信息論的角度,數字圖像壓縮方法一般可分為:(1)可逆編碼(ReversibleCoding或InformationPreservingCoding),也稱為無損壓縮。這種方法的解碼圖像與原始圖像嚴格相同,壓縮是完全可恢復的或無偏差的,無損壓縮不能提供較高的壓縮比。第44頁,課件共438頁,創作于2023年2月

(2)不可逆編碼(Non-ReversibleCoding),也稱為有損壓縮。用這種方法恢復的圖像較原始圖像存在一定的誤差,但視覺效果一般是可接受的,它可提供較高的壓縮比。第45頁,課件共438頁,創作于2023年2月

按照壓縮方法的原理,數字圖像壓縮方法可分為:

(1)預測編碼(PredictiveCoding)。預測編碼是一種針對統計冗余進行壓縮的方法,它主要是減少數據在空間和時間上的相關性,達到對數據的壓縮,是一種有失真的壓縮方法。預測編碼中典型的壓縮方法有DPCM和ADPCM等,它們比較適合于圖像數據的壓縮。第46頁,課件共438頁,創作于2023年2月

(2)變換編碼(TransformCoding)。變換編碼也是一種針對統計冗余進行壓縮的方法。這種方法將圖像光強矩陣(時域信號)變換到系數空間(頻域)上進行處理。常用的正交變換有DFT(離散傅氏變換)、DCT(離散余弦變換)、DST(離散正弦變換)、哈達碼變換和Karhunen-Loeve變換。第47頁,課件共438頁,創作于2023年2月

(3)量化和矢量量化編碼(VectorQuantization)。量化和矢量量化編碼本質上也還是一種針對統計冗余進行壓縮的方法。當我們對模擬量進行數字化時,必然要經歷一個量化的過程。在這里量化器的設計是一個很關鍵的步驟,量化器設計的好壞對于量化誤差的大小有直接的影響。矢量量化是相對于標量量化而提出的,如果我們一次量化多個點,則稱為矢量量化。第48頁,課件共438頁,創作于2023年2月

(4)信息熵編碼(EntropyCoding)。根據信息熵原理,用短的碼字表示出現概率大的信息,用長的碼字表示出現概率小的信息。常見的方法有哈夫曼編碼、游程編碼以及算術編碼。

(5)子帶編碼(Sub-bandCoding)。子帶編碼將圖像數據變換到頻域后,按頻率分帶,然后用不同的量化器進行量化,從而達到最優的組合。或者是分步漸近編碼,在初始時對某一頻帶的信號進行解碼,然后逐漸擴展到所有頻帶,隨著解碼數據的增加,解碼圖像也逐漸地清晰起來。此方法對于遠程圖像模糊查詢與檢索的應用比較有效。第49頁,課件共438頁,創作于2023年2月

(6)結構編碼(StructureCoding),也稱為第二代編碼(SecondGenerationCoding)。編碼時首先求出圖像中的邊界、輪廓、紋理等結構特征參數,然后保存這些參數信息。解碼時根據結構和參數信息進行合成,從而恢復出原圖像。(7)基于知識的編碼(Knowledge-BasedCoding)。對于人臉等可用規則描述圖像,利用人們對其的知識形成一個規則庫,據此將人臉的變化等特征用一些參數進行描述,從而用參數加上模型就可以實現人臉的圖像編碼與解碼。圖像壓縮算法的總體框圖如圖4.3-1所示。第50頁,課件共438頁,創作于2023年2月圖4.3-1圖像壓縮算法的總體框圖第51頁,課件共438頁,創作于2023年2月

下面幾節主要介紹幾種常見的壓縮編碼方法:信息熵編碼方法(如哈夫曼編碼、游程編碼和算術編碼)、預測編碼和變換編碼,并介紹新一代編碼方法(如知識基編碼和分形編碼)等以及相關知識。由于矢量量化編碼和子帶編碼方法在上一章中結合音頻編碼已經介紹,它們在應用于圖像時原理基本相同,這里不再贅述。

第52頁,課件共438頁,創作于2023年2月4.4典型的熵編碼方法4.4.1基本概念

1.圖像熵和平均碼字長度

1)圖像熵(Entropy)設數字圖像像素灰度級集合為(W1,W2,…,Wk,…,WM),其對應的概率分別為P1,P2,…,Pk,…,PM。按信息論中信源信息熵定義,數字圖像的熵H為第53頁,課件共438頁,創作于2023年2月

由此可見,一幅圖像的熵就是這幅圖像的平均信息量度,也是表示圖像中各個灰度級比特數的統計平均值。式(4.4-1)所表示的熵值是在假定圖像信源無記憶(即圖像的各個灰度級不相關)的前提下獲得的,這樣的熵值常稱為無記憶信源熵值,記為H0(·)。對于有記憶信源,假如某一像素灰度級與前一像素灰度級相關,那么公式(4.4-1)中的概率要換成條件概率P(Wi/Wi-1)和聯合概率P(Wi,Wi-1),則圖像信息熵公式變為(4.4-1)第54頁,課件共438頁,創作于2023年2月

式中,P(Wi,Wi-1)=P(Wi)P(Wi/Wi-1),則稱H(Wi/Wi-1)為條件熵。因為只與前面一個符號相關,故稱為一階熵H1(·)。如果與前面兩個符號相關,求得的熵值就稱為二階熵H2(·)。依此類推可以得到三階和四階等高階熵,并且可以證明

H0(·)>H1(·)>H2(·)>H3(·)>…(4.4-2)第55頁,課件共438頁,創作于2023年2月

香農信息論已證明:信源熵是進行無失真編碼的理論極限。低于此極限的無失真編碼方法是不存在的,這是熵編碼的理論基礎。而且可以證明,如果考慮像素間的相關性,使用高階熵一定可以獲得更高的壓縮比。第56頁,課件共438頁,創作于2023年2月

2)平均碼字長度設βk為數字圖像第k個碼字Ck的長度(二進制代數的位數),其相應出現的概率為Pk,則該數字圖像所賦予的碼字平均長度R為(4.4-3)第57頁,課件共438頁,創作于2023年2月3)編碼效率在一般情況下,編碼效率往往用下列簡單公式表示(4.4-4)式中,H為信源熵,R為平均碼字長度。第58頁,課件共438頁,創作于2023年2月

根據信息論中信源編碼理論,可以證明在R≥H條件下總可以設計出某種無失真編碼方法。若編碼結果使R遠大于H,表明這種編碼方法效率很低,占用比特數太多。例如對圖像樣本量化值直接采用PCM編碼,其結果平均碼字長度R就遠比圖像熵H大。若編碼結果使R等于或很接近于H,這種狀態的編碼方法稱為最佳編碼。它既不丟失信息而引起圖像失真,又占用最少的比特數,例如下面要介紹的哈夫曼編碼即屬于最佳編碼方法。第59頁,課件共438頁,創作于2023年2月

若要求編碼結果R<H,則必然丟失信息而引起圖像失真。這就是在允許失真條件下的一些失真編碼方法。熵編碼的目的就是要使編碼后的圖像平均比特數R盡可能接近圖像熵H。一般是根據圖像灰度級數出現的概率大小賦予不同長度的碼字,概率大的灰度級用短碼字,反之,用長碼字。可以證明,這樣的編碼結果所獲得的平均碼字長度最短。這就是下面要介紹的變長最佳編碼定理。第60頁,課件共438頁,創作于2023年2月2.變長最佳編碼定理

【定理】在變長編碼中,對出現概率大的信息符號賦予短碼字,而對于出現概率小的信息符號賦予長碼字。如果碼字長度嚴格按照所對應符號出現概率大小逆序排列,則編碼結果平均碼字長度一定小于任何其他排列方式。這個定理就是下面要介紹的哈夫曼編碼方法的理論基礎。設圖像灰度級為W1,W2,…,Wi…,WN;各灰度級出現的概率分別為P1,P2,…,Pi,…,PN;第61頁,課件共438頁,創作于2023年2月

編碼所賦予的碼字長度分別為t1,

t2,…,ti,…,

tN;則編碼后圖像平均碼字長度R應為第62頁,課件共438頁,創作于2023年2月

再令嚴格按照定理規則進行編碼,其結果平均碼字長度為R1;R2為將其中任兩個灰度級不按定理規則編碼(即概率大的灰度級賦予長碼字。反之,用短碼字),而其他所有灰度級仍按定理規則編碼所得的圖像平均碼字長度,那么R2應等于R1加上“不按定理規則編碼所增加的平均碼字長度”ΔR。只要證明ΔR大于0,即可以證明上述定理。第63頁,課件共438頁,創作于2023年2月3.可變長最佳編碼的平均碼字長度設可變長編碼所用碼元進制為D,被編碼的信息符號總數為N,第i個符號出現的概率為Pi,與其對應的碼字長度為ti,則可以證明這種編碼結果平均碼字長度R落在下列區間內第64頁,課件共438頁,創作于2023年2月

式中,,由此可以引導出對某一信息符號存在下式(4.4-5)對二進制碼進一步簡化為-lbPi≤ti<-lbPi+1(4.4-6)第65頁,課件共438頁,創作于2023年2月4.惟一可譯編碼有些情況下,為了減少表示圖像的平均碼字長度,往往對碼字之間不加同步碼。但是,這樣就要求所編碼字序列能被惟一地譯出來。滿足這個條件的編碼稱為惟一可譯編碼,也常稱為單義可譯碼。單義可譯碼往往是采用非續長代碼。第66頁,課件共438頁,創作于2023年2月1)續長代碼和非續長代碼若代碼中任何一個碼字都不是另一個碼字的續長,也就是不能在某一碼字后面添加一些碼元而構成另一個碼字,稱其為非續長代碼。反之,稱其為續長代碼。如二進制代碼[0,10,11]即為非續長代碼,而[0,01,11]則為續長代碼。因為碼字01可由碼字“0”后加上一個碼元“1”構成。第67頁,課件共438頁,創作于2023年2月2)單義代碼在介紹單義代碼前,先簡單介紹一下克勞夫特(Kraft)不等式:若信源符號有m種取值,其碼字長度分別為li(i=1,2,…,m);又設最長的碼字長度為L,碼元種類(即多少進制碼)為D,長度為li的碼字占用了

個長度為L的碼字,也就是必須有對于二進制,則有。第68頁,課件共438頁,創作于2023年2月

任意有限長的碼字序列,只能被惟一地分割成一個個碼字,則這樣的碼字序列稱為單義代碼。單義代碼的充要條件是滿足克勞夫特(Kraft)不等式(4.4-7)

式中,D為代碼中碼元種類,對于二進制D=2;n為代碼中碼字個數;ti為代碼中第i個碼字的長度(即碼元個數)。第69頁,課件共438頁,創作于2023年2月

如代碼C=[00,10,001,101],因為是二進制碼,則D=2,共有4個碼字C1=00、C2=10、

C3=001、C4=101,其相應的長度為t1=2、t2=2、t3=3、t4=3,代入式(4.4-7)可得第70頁,課件共438頁,創作于2023年2月4.4.2哈夫曼(Huffman)編碼方法哈夫曼編碼是根據可變長度最佳編碼定理,應用哈夫曼算法而產生的一種編碼方法。在具有相同輸入概率集合的前提下,它的平均碼字長度比其他任何一種惟一可譯碼都小,因此,也常稱其為緊湊碼。下面以一個具體的例子來說明其編碼方法,如圖4.4-1所示。第71頁,課件共438頁,創作于2023年2月圖4.4-1哈夫曼(Huffman)編碼的示例第72頁,課件共438頁,創作于2023年2月1.編碼步驟

(1)先將輸入灰度級按出現的概率由大到小順序排列(對概率相同的灰度級可以任意顛倒排列位置)。(2)將最小兩個概率相加,形成一個新的概率集合。再按第(1)步方法重排(此時概率集合中概率個數已減少一個)。如此重復進行,直到只有兩個概率為止。第73頁,課件共438頁,創作于2023年2月

(3)分配碼字。碼字分配從最后一步開始反向進行,對最后兩個概率一個賦予“1”碼,一個賦予“0”碼。如概率0.60賦予“0”碼,0.40賦予“1”碼(也可以將0.60賦予“1”碼,0.40賦予“0”碼)。如此反向進行到開始的概率排列。在此過程中,若概率不變,則仍用原碼字。如圖4.4-1中第六步中概率0.40到第五步中仍用“1”碼。若概率分裂為兩個,其碼字前幾位碼元仍用原來的。碼字的最后一位碼元一個賦予“0”碼元,另一個賦予“1”碼元。如圖中第六步中概率0.60到第五步中分裂為0.37和0.23,則所得碼字分別為“00”和“01”。第74頁,課件共438頁,創作于2023年2月2.前例哈夫曼編碼的編碼效率計算根據式(4.4-1)求出前例信源熵為根據式(4.4-3)求出平均碼字長度為第75頁,課件共438頁,創作于2023年2月根據式(4.4-4)求出編碼效率η為可見哈夫曼編碼效率很高。第76頁,課件共438頁,創作于2023年2月*4.4.3游程編碼在圖像中,尤其是一些不太復雜的圖像和計算機生成的圖像中,往往存在著灰度或顏色相同的圖像塊,對這樣的圖像進行掃描時,對應這些相同灰度和顏色的圖像塊就會有連續多行掃描行數據具有相同的數值,而且在同一行上會有許多連續的像素點具有同樣的數值。只保留連續相同像素值中的一個值及具有相同數值的像素點數目,這種方法就是人們常說的行程編碼或游程編碼(RLC,RunLengthCoding),而且這種方法可以用少的數據量來表示圖像信息。第77頁,課件共438頁,創作于2023年2月

在二元序列中,只有兩種符號,即“0”和“1”;這些符號可連續出現,連“0”這一段稱為“0”游程,連“1”這一段稱為“1”游程。它們的長度分別為L(0)和L(1)。“0”游程和“1”游程總是交替出現的。倘若規定二元序列是以“0”開始,第一個游程是“0”游程,第二個必為“1”游程,第三個又是“0”游程等等。對于隨機的二元序列,各游程長度將是隨機變量;其取值可為1,2,3,…,直到無限。第78頁,課件共438頁,創作于2023年2月

定義了游程和游程長度,就可把任何二元序列變換成游程長度的序列,或簡稱游程序列。這種變換是一一對應的,也就是可逆的。例如有一二元序列

000101110010001…

可變換成下列游程序列

3113213…第79頁,課件共438頁,創作于2023年2月*4.4.4算術編碼哈夫曼編碼、游程編碼等無損編碼都是建立在符號和碼字相對應的基礎上的,這種編碼通常叫做塊碼或分組碼。此時,信源符號應是多元的,而且不考慮符號相關性。要用于最常見的二元序列,須采用游程編碼、分幀編碼或合并符號等方法,轉換成多值符號,而這些符號間的相關性也不予考慮。這就使信源編碼的匹配原則不能充分滿足,編碼效率就有所損失。倘若要較好的解除相關性,常需在序列中取很長一段,而這將遇到采用等長碼時的那種困難。第80頁,課件共438頁,創作于2023年2月

為了克服這種局限性,就需跳出塊碼的范疇,研究非塊碼的編碼方法。這就是從全序列出發,采用遞推形式的連續編碼。其實香農早就提出信源序列的積累概率的概念,把這個概率映射到[0,1)區間上,使每個序列對應區間內的一點,這就是一個二進位的小數。這些點把[0,1)區間分成許多小段,每段的長度等于某一序列的概率。再在段內取一個二進位小數,其長度可與該序列的概率匹配,達到高效編碼的目的。這也就是算術編碼的基本概念。在這里將著重討論積累概率的意義以及遞推計算等,以說明算術編碼的基本原理。再通過實例介紹獨立二元序列的編碼過程。第81頁,課件共438頁,創作于2023年2月1.積累概率的遞推計算我們先從信源符號的積累概率開始,再討論序列的積累概率。設信源符號集為A={a0,a1,a2,…,am-1}

相應的概率為Pr,r=0,1,2,…,m-1。定義各符號的積累概率為(4.4-8)第82頁,課件共438頁,創作于2023年2月

顯然,由上式可得P0=0,P1=p0,P2=p0+p1,…

而且pr=Pr+1-Pr由于Pr和Pr+1都是小于1的正數,可用[0,1)區間內的兩個點來表示,則pr就是這兩點間的小區間的長度。不同的符號有不同的小區間,它們互不重疊,這種小區間內任一個點可作為該符號的代碼。第83頁,課件共438頁,創作于2023年2月

現在來計算序列的積累概率。為了簡單起見,先以獨立二元序列為例來計算,所得的結果很容易推廣到一般情況。設有一序列S=011,這種三個二元符號的序列可按自然二進數排列,000,001,010,…,則S的積累概率為P(S)=p(000)+p(001)+p(010)(4.4-9)倘若S后面接一個“0”,積累概率就成為P(S0)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)=p(000)+p(001)+p(010)=P(S)第84頁,課件共438頁,創作于2023年2月

因為兩個四元符號的最后一位是“0”和“1”時,根據歸一律,它們的概率和應等于前三位的概率,即p(0000)+p(0001)=p(000)等。第85頁,課件共438頁,創作于2023年2月

倘若S后面接一個“1”,則其積累概率是P(S1)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)+p(0110)

=P(S)+p(0110)=P(S)+p(S)p0

由于二元集的積累概率為P0=0,P1=p0,所以上面兩式可統一寫成P(Sr)=P(S)+p(S)Pr

r=0,1(4.4-10)第86頁,課件共438頁,創作于2023年2月

這樣寫的式子很容易推廣到多元序列,即可得到一般的積累概率遞推公式P(Sar)=P(S)+p(S)Pr

(4.4-11)

以及序列的概率公式p(Sar)=p(S)pr(4.4-12)

對于有相關性的序列,上面的兩個遞推公式也是適用的,只是上式中的單符號概率應換成條件概率。第87頁,課件共438頁,創作于2023年2月

用遞推公式可逐位計算序列的積累概率,而不用像式(4.4-9)那樣列舉所有排在前面的那些序列概率。實際上,可用兩個存儲器把p(S)和P(S)存下來,然后根據輸入符號和式(4.4-11)、式(4.4-12),更新兩個存儲器中的值。在起始時可令P(φ)=0,p(φ)=1其中φ代表空集,只有一個符號ar的序列就是φar。第88頁,課件共438頁,創作于2023年2月2.代碼長度從以上關于積累概率P(S)的計算中可看出,P(S)把區間[0,1)分割成許多小區間,每個小區間的長度等于各序列的概率p(S),而這些小區間內的任一點可用來代表這些序列,現在來討論如何選擇這個點。令

(4.4-13)第89頁,課件共438頁,創作于2023年2月

其中[X]代表大于或等于X的最小整數,把積累概率P(S)寫成二進位的小數,取其前L位,若有尾數,就進位到第L位,這樣得到一個數C。例如,P(S)=0.10110001,p(S)=1/7,則L=3,得C=0.110。這個C就可以作為S的碼字。可以證明這C點必然在長度為p(S)的小區間內,因而是可以惟一解碼的。第90頁,課件共438頁,創作于2023年2月

這樣構成的碼字,編碼效率是很高的,因為已經達到概率匹配,尤其是當序列很長時。由式(4.4-13)可見,對于長序列,p(S)必然很小,L與概率倒數的對數已幾乎相等。也就是取整數所造成的差別很小,平均代碼長度將接近S的熵值。第91頁,課件共438頁,創作于2023年2月

實際編碼過程是這樣的。可先設定兩個存儲器,起始時一個為“0”,另一個為“1”,分別代表空集的積累概率和概率。每輸入一個信源符號,更新一次,得到P(S)值后,按前述方法得到碼字C,暫存起來,C值也隨輸入符號而更新。直至序列結束,就可作為該序列的碼字輸出。由于P(S)是遞增的,而增量隨著序列的增長而減小。因為增量是序列的概率與信源符號的積累概率的乘積,所以C的前幾位一般已固定,在以后的計算中不會被更新,因而可以輸出。第92頁,課件共438頁,創作于2023年2月

解碼也逐位進行。由于P(S)的遞增性,第一個符號的積累概率不會小于以后的C值,所以從C值就可譯出第一個信源符號。由該符號按編碼方法算得的P(S)與C比較就可判斷下一個信源符號,依次下去就可譯出全序列。其實,在算術編碼中,解碼過程與編碼過程是相似的。第93頁,課件共438頁,創作于2023年2月3.實現算術編碼的一些問題以上從理論上簡單討論了算術編碼的編譯方法以及它的編碼效率,可以看出它有許多優點,尤其它的漸近最佳性,亦即當序列無限增長時,平均碼長將漸近地等于序列的熵值。但在實際實現時,尚有一些必須解決的問題。第94頁,課件共438頁,創作于2023年2月

(1)復雜性問題。每次遞推運算中都有乘法,當序列概率和符號的積累概率展開成二進位小數后的位數較多且要求精度較高時,就有一定的運算量。這種運算必須在輸入一個信源符號的時間內完成,以保證實時編解碼,有時會造成困難。要消除乘法,只有一種情況,這就是編碼序列是二元序列,而且其符號概率較小的一個是2-k的形式,其中k是正整數。此時乘以2-k等于移位,乘以1-2-k等于移位和相減。這樣就完全沒有乘法運算,可加快運算速度。這就是為什么算術編碼一般只用于二元序列的編碼,而且符號概率常用2-k去近似。第95頁,課件共438頁,創作于2023年2月(2)計算精度問題。即使在二元序列的情況下,精度問題仍存在。隨著遞推運算的延續,P(S)和p(S)(即積累概率和序列的概率)的小數位數也將逐步增加,若不能隨時輸出和加以截斷,運算器將難于容納,但有所截斷必然降低精度。而精度不夠會影響編解碼的正確性。這是因為隨著序列長度增大,小區間數目越來越多,長度越來越短。計算精度不夠會使有些小區間互相重疊或消失(即長度為零),前者使惟一性喪失,后者使無碼字可編。這些會造成差錯,就不是無損編碼,而且這些差錯還會擴散。所以最初提出的算術編碼要求無限精度,這是不現實的。有限精度是可能的,只是編碼效率會有所下降。第96頁,課件共438頁,創作于2023年2月

(3)存儲量問題。碼字C的長度也隨序列S長度的增加而不斷增長。若不及時輸出,存儲量將非常大。但若輸出過早,運算過程中可能還需調整已輸出的部分,就會影響結果。當未輸出部分的前面各位都是“1”時,后面在計算時略有增加,就可能進位到已輸出部分,尤其是連“1”很長時,原以為保留許多位已經夠了,但仍會影響已輸出部分。從理論上說,這種連“1”的長度可以達到無限,當然出現這種情況的概率也將接近于零。這類問題常稱為進位問題,在實際應用時也必須設法解決。第97頁,課件共438頁,創作于2023年2月4.二元獨立序列的算術編碼示例設有二元獨立序列:

S=11111100已知其符號概率p0=1/4,p1=3/4,則第98頁,課件共438頁,創作于2023年2月用前面的公式和編碼規則,可得P(S)

=p(00000000)+p(00000001)+p(00000010)+…+p(11111011)

=1-p(11111111)-p(11111110)-p(11111101)-p(11111100)

=1-p(111111)

=1-(3/4)6=0.110100100111C=0.1101010

第99頁,課件共438頁,創作于2023年2月

該碼字C在P(11111100)和P(11111101)之間,必可惟一譯出序列S。這樣編碼的效率為

η=熵/平均碼字長度==92.7%

隨著S的增長,編碼效率一般還可提高。但是這種按全序列的編碼,計算量和存儲量將隨S的增長而不斷增加,因而幾乎不可能實現。現在用遞推公式式(4.4-11)和式(4.4-12)來計算上面的序列的碼字。這種編碼過程如圖4.4-2所示。第100頁,課件共438頁,創作于2023年2月圖4.4-2算術編碼過程示例第101頁,課件共438頁,創作于2023年2月

由式(4.4-10)以及二元集的積累概率P0=0,P1=p0可得P(S0)=P(S),P(S1)=P(S)+p(S)p0。所以,

當輸入第一個1:P(S1)=0+1×(1/4)=1/4→0.01;輸入第二個1:P(S1)=1/4+(3/4)×(1/4)=7/16→0.0111;輸入第一個0:P(S0)=P(S),即與上一行相同,換成二進制小數還是相同。依次類推,而計算序列概率按公式p(S0)=p(S)p0,p(S1)=p(S)p1計算即可。第102頁,課件共438頁,創作于2023年2月圖4.4-3算術編碼的圖解第103頁,課件共438頁,創作于2023年2月

4.5預測編碼4.5.1DPCM系統的基本原理

DPCM系統的基本原理是指基于圖像中相鄰像素之間具有較強的相關性。每個像素可以根據前幾個已知的像素值來作預測。因此在預測法編碼中,編碼與傳輸的值并不是像素取樣值本身,而是這個取樣值的預測值(也稱估計值)與實際值之間的差值。DPCM系統的原理框圖如圖4.5-1所示。

第104頁,課件共438頁,創作于2023年2月

圖4.5-1DPCM系統的原理框圖第105頁,課件共438頁,創作于2023年2月

設輸入信號xn為tn時刻的取樣值。

是根據tn時刻以前已知的m個取樣值xn-m,…,xn-1對xn所作的預測值,即(4.5-1)式中,ai(i=1,…,m)稱為預測系數,m為預測階數。

en為預測誤差信號,顯然(4.5-2)第106頁,課件共438頁,創作于2023年2月

設qn為量化器的量化誤差,e′n為量化器輸出信號,可見qn=en-e′n

(4.5-3)接收端解碼輸出為x″n,如果信號在傳輸過程中不產生誤差,則有e′n=e″n,x′n=x″n,

。此時發送端的輸入信號xn與接收端的輸出信息x″n之間的誤差為(4.5-4)第107頁,課件共438頁,創作于2023年2月4.5.2最佳線性預測在線性預測的預測表達式(4.5-1)中,預測值

是xn-m,…,xn-1的線性組合,分析可知,需選擇適當的預測系數ai使得預測誤差最小,這是一個求解最佳線性預測的問題。一般情況下,應用均方誤差為極小值準則獲得的線性預測稱為最佳線性預測。在討論如何確定預測系數ai之前,先簡單討論一下線性預測DPCM中,對xn作最佳預測時,如何取用以前的已知像素值xn-1,xn-2,…,x1。xn與鄰近像素的關系示意圖如圖4.5-2所示。第108頁,課件共438頁,創作于2023年2月圖4.5-2xn與鄰近像素的關系示意圖第109頁,課件共438頁,創作于2023年2月

(1)若取用現在像素xn的同一掃描行中前面最鄰近像素x1來預測xn,即xn的預測值

,則稱為前值預測。

(2)若取用xn的同一掃描行中前幾個已知像素值,如x1,x5,…來預測xn,則稱為一維預測。(3)若取用xn的同一行和前幾行若干個已知像素值,如x1,x5,x2,x3,x4,…來預測xn,則稱為二維預測。第110頁,課件共438頁,創作于2023年2月(4)若取用已知像素不但是前幾行的而且還包括前幾幀的,那么相應的稱其為三維預測。在一維預測情況下不失一般性。設xn是期望E{xn}=0的廣義平穩隨機過程,則設(4.5-5)第111頁,課件共438頁,創作于2023年2月為了使最小,必定有

i=1,2,…,m

(4.5-6)

解這m個聯立方程可得ai(i=1,2,…,m)。xn的自相關函數為R(k)=E{xnxn-k}第112頁,課件共438頁,創作于2023年2月且R(-k)=R(k),代入式(4.5-6)得i=1,2,…,m

(4.5-7)寫成矩陣形式為第113頁,課件共438頁,創作于2023年2月

上式最左邊的矩陣是xn的相關矩陣,為Toeplitz矩陣,所以用Levinson算法可解出各ai

(i=1,2,…,m),從而得到在均方誤差最小意義下的最佳線性預測。式(4.5-5)也可以用自相關函數來表示,即(4.5-9)第114頁,課件共438頁,創作于2023年2月

因為E{xn}=0,所以R(0)即為xn的方差,可見。因而傳送差值en比直接傳送原始信號xn更有利于數據壓縮。R(k)越大,表明xn的相關性越強,則越小,所能達到的壓縮比就越大。當R(k)=0(k>0)時,即相鄰點不相關時,,此時預測并不能提高壓縮比。第115頁,課件共438頁,創作于2023年2月

二維、三維線性預測的情況與一維完全類似,只不過推導的過程相對一維來說要復雜一些,這里不再推導,有興趣的讀者可以參考相關書籍。應用均方差極小準則所獲得的各個預測系數ai之間有什么樣的約束關系呢?假設圖像中有一個區域亮度值是一個常數,那么預測器的預測值也應是一個與前面相同的常數,即第116頁,課件共438頁,創作于2023年2月將此結果代入式(4.5-1)得因此第117頁,課件共438頁,創作于2023年2月1980年Pirsch進一步研究并修正了這個結論。他認為,為了防止DPCM系統中出現“極限環”(LimitCircle)振蕩和減少傳輸誤碼的擴散效應,應滿足下列兩個條件:

(1)預測誤差e=0應該是一個量化輸出電平,也就是量化分層的總數K應是奇數。

(2)所有預測系數ai除滿足外,還應滿足第118頁,課件共438頁,創作于2023年2月4.5.3DPCM系統中的圖像降質由于預測器和量化器的設計以及數字信道傳輸誤碼的影響,在DPCM系統中會出現一些圖像降質現象。經過許多實驗可總結為下列幾種。(1)斜率過載引起圖像中黑白邊沿模糊,分辨率降低。這主要是當掃描到圖像中黑白邊沿時,預測誤差信號比量化器最大輸出電平還要大得多,從而引起很大的量化噪聲。

第119頁,課件共438頁,創作于2023年2月

(2)顆粒噪聲。顆粒噪聲主要是最小的量化輸出電平太大,而圖像中灰度緩慢變化區域輸出可能在兩個最小的輸出電平之間隨機變化,從而使畫面出現細斑,而人眼對灰度平坦區域的顆粒噪聲又很敏感,從而使人主觀感覺上圖像降質嚴重。第120頁,課件共438頁,創作于2023年2月

(3)假輪廓圖案。假輪廓圖案主要是由于量化間隔太大,而圖像灰度緩慢變化區域的預測誤差信號太小,就會產生像地形圖中等高線一樣的假輪廓圖案。(4)邊沿忙亂。邊沿忙亂主要在電視圖像DPCM編碼中出現,因為不同幀在同一像素位置上量化噪聲各不相同,黑白邊沿在電視監視上將呈現閃爍跳動犬齒狀邊沿。第121頁,課件共438頁,創作于2023年2月

(5)誤碼擴散。任何數字信道中總是存在著誤碼。在DPCM系統中,即使某一位碼有差錯,對圖像一維預測來講,將使該像素以后的同一行各個像素都產生差錯。而對二維預測,誤碼引起的差錯還將擴散到以下各行。這樣將使圖像質量大大下降,其影響的程度取決于誤碼在信號代碼中的位置以及有誤碼的數碼所對應的像素在圖像中的位置。第122頁,課件共438頁,創作于2023年2月

一般來說,一維預測誤碼呈水平條狀圖案,而二維預測誤碼呈“彗星狀”向右下方擴散。二維預測比一維預測抗誤碼能力強得多。對電視圖像來講,要使圖像質量達到人不能察覺的降質,實驗表明,對DPCM要求傳輸誤碼應優于5×10-6,而對于一維前值預測DPCM則應優于10-9,二維DPCM應優于10-8。第123頁,課件共438頁,創作于2023年2月4.5.4自適應預測編碼在討論線性預測中,我們假設輸入數據是平穩的隨機過程。然而,實際的輸入數據并非是平穩過程,或總體上平穩,但局部不平穩。此時,按照量化信噪比的觀點來看,使用固定參數的線性預測是不合理的,這時可以采用自適應預測的編碼方法。可以定期地重新計算協方差矩陣和相應的加權因子,充分利用其統計特性及其變化,重新調整預測參數,這樣就使得預測器隨著輸入數據的變化而變化,從而也得到較為理想的輸出。第124頁,課件共438頁,創作于2023年2月

自適應預測又可分為線性自適應預測和非線性自適應預測兩種編碼方法,這里只簡單介紹一種線性自適應預測方案,對于非線性預測則要復雜得多。

1977年Yamada提出二維DPCM的一個自適應預測方案,所采用的xn與鄰近像素的關系如圖4.5-2所示,預測公式為(4.5-10)第125頁,課件共438頁,創作于2023年2月

式中,a1=0.75,a4=0.25,k是一個自適應參數,按下式定義取值:(4.5-11)第126頁,課件共438頁,創作于2023年2月*4.5.5運動補償和運動估值

1.運動補償在幀間預測編碼中,為了達到較高的壓縮比,最關鍵的就是要得到盡可能小的幀間誤差。在普通的幀間預測中,實際上僅在背景區進行預測時可以獲得較小的幀間差。如果要對運動區域進行預測,首先要估計出運動物體的運動矢量V,然后再根據運動矢量進行補償,即找出物體在前一幀的區域位置,這樣求出的預測誤差才比較

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論