數字圖像基礎_第1頁
數字圖像基礎_第2頁
數字圖像基礎_第3頁
數字圖像基礎_第4頁
數字圖像基礎_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數字圖像定義:數字圖像可以定義為與之相對應的物體的數字表示。通常用一個二維數組表示一幅圖像,也可以認為一幅圖像就是一個二維矩陣。二維矩陣的每個位置對應于圖像上的每個像素點,而二維矩陣每個位置上存儲的數值對應于圖像上每個像素點所具有的信息,比如:灰度等等。既然數字圖像可以用二維矩陣來表示,那么數字圖像的處理就可以認為是對對二維矩陣的操作。圖像的數字化:將一幅圖像進行數字化的過程就是在計算機上創建生成一個二維矩陣的過程。數字化過程包括三個步驟:掃描、采樣、量化。掃描:就是按照一定的先后順序(如:行優先)對圖像進行遍歷的過程。像素是遍歷過程中尋址的最小單位,對應于數組尋址的單位。采樣:即遍歷過程中在

2、在圖像的每個最小尋址單位即像素位置上測量灰度值,采樣的結果是得到每一像素的灰度值。量化:就是將采樣得到的像素灰度值經過模數轉換等器件轉化為離散的整數值。數字圖像處理中的基本圖像類型:二值圖像:二值圖像的矩陣僅有兩個值構成即“0”和“1”。0 表示黑色,1表示白色。因此二值圖像在計算機中的數據類型為一個二進制位。灰度圖像:灰度圖像的二維矩陣每個元素的值可能都不一樣,它有一個范圍【0255】,其中0表示純黑色,255表示純白色,中間數字表示由黑到白的過度。其數據類型一般為8位無符號數。索引圖像:索引圖像可以表示彩色圖像,其結構比較復雜,除了存儲圖像數據的二維矩陣以外,還有一個存儲RGB顏色的二維矩

3、陣,稱為顏色索引矩陣(COLORMAP)。存儲數據的二維矩陣里面存儲的仍然是圖像各個像素的灰度值,而顏色索引矩陣是一個【256】【3】形式的二維矩陣,256對應于0255個灰度值,而每行的三個分量表示對應于每個灰度值的像素點,它的RGB分量的值。例如:COLORMAP3802表示灰度值為38的像素點的RGB各分量值。由于每個像素只有256個灰度值,而每個灰度值決定了一種顏色,所以索引圖像最多有256種顏色。RGB圖像:它與索引圖像一樣可以表示彩色圖像,分別用R,G,,B三原色表示每個像素的顏色,但是他們的數據結構不同。RGB圖像的數據結構是一個三維矩陣,它的每一像素的顏色值直接存儲在矩陣中。因

4、此這個矩陣可用M*N*3來表示。M:表示矩陣每行的像素數,N:表示每列的像素數,3表示每一像素的三個顏色分量。由于每個像素的顏色值都直接放在圖像矩陣中,所以其顏色理論上多達(2*2*2)種。圖像的統計特征:1. 信息量:一幅圖像如果共有種灰度值并且出現的概率分別是,則根據香農定理,這幅圖像的信息量可有下式表示:();通稱為熵,當圖像中個灰度值出現的概率彼此相等時,圖像的熵最大。2. 計算灰度平均值:灰度平均值是指一幅圖像中所有像素灰度值的算術平均數,它反應圖像中不同物體的平均反射強度,一般用下式表示: (2)3. 計算灰度中值:灰度中值是指圖像中所有灰度處于中間的值,當當灰度級數為偶數時,則取

5、中間的兩個灰度的平均值。4. 計算灰度眾數:灰度眾數就是指圖像中出現次數最多的灰度值,它是一幅圖像中面積占優的物體的灰度特征的反應。5. 計算灰度標準差:灰度標準差是反映各像素灰度值與圖像平均灰度值的總的離散程度,它與熵一樣是衡量一幅圖像信息量大小的主要指標,是圖像統計特征中最重要的統計量之一。一般情況下,標準差越大圖像信息量越大。計算公式如下: (3)6計算灰度值域:灰度值域是圖像最大灰度與最小灰度的差值,即 (4)計算多為圖像的統計特征:1 計算協方差矩陣:設和是大小為的兩幅圖像,則兩者之間的協方差計算公式為: (5) 式中和 圖像和的均值將N個波段相互間的協方差排列在一起所組成的矩陣稱為

6、協方差矩陣,即 (6)2.計算相關系數相關系數是描述圖像波段間的相關程度的統計量,反映了兩個波段圖像所含信息的重疊程度。如果兩個波段的相關系數較大,則說明僅選擇一個波段就可以表示兩個波段的信息。特別的,一個波段與其本身的相關系數是1,表明完全重疊。計算公式為: (7)式中、圖像、的標準差 圖像、的協方差將N個波段相互間的相關系數排列在一起組成的矩陣稱為相關矩陣R,即 (8)另外,圖像的統計特征還包括直方圖特征,直方圖指圖像中所有灰度值的概率分布,對于數字圖像來說,實際上就是圖像灰度值的概率密度函數的離散化圖形。圖像處理圖像處理的一般步驟:1. 獲取原始圖像2. 預處理a) 濾波降噪b) 圖像增

7、強c) 圖像分割3. 特征提取4. 數據融合,包括三個方面:像素級融合,特征級融合,決策級融合。5. 分類決策下面著重講述圖像分割:圖像分割:就是依據圖像的灰度、顏色、紋理、邊緣等特征,把圖像分成各自滿足某種相似性準則或具有某種共同特征的連通區域集合的過程。設R代表某個圖像區域,對R的分割可看作將R分成若干個滿足以下條件的非空子集(子區域)R1,R2,Rn。(1)。即分割成的所有子區域的并集能夠構成原來的區域R。(2)對于所有的和以及,有。即分割成的各子區域互不重疊。(3)對于i=1,2,3,n;有P(Ri)=TURE。即分割得到的屬于同一區域的像素應具有某些相同的特性。(4)對于ij,有P(

8、RiRj)=FALSE。即分割得到的屬于不同區域的像素應具有不同的性質(5)對于i=1,2,n;Ri是聯通的區域。即同一子區域的像素應當是連通的。圖像分割的方法:圖像分割的方法有很多,總體上講有如下幾類比較常用:基于邊緣檢測的圖像分割、基于閾值的圖像分割、基于跟蹤的圖像分割、基于區域的圖像分割(基于聚類的圖像分割)。一:基于邊緣檢測的圖像分割圖像邊緣:圖像邊緣意味著圖像中一個區域的結束和另一個區域的開始,圖像中相鄰區域之間的像素集合構成了圖像的邊緣。圖像邊緣即圖像的灰度發生空間突變的像素的集合圖像邊緣有兩個特征:方向和幅度。沿邊緣走向,像素值變化比較緩慢;沿垂直于邊緣走向,像素值變化比較劇烈。

9、一般常用一階和二階導數來描述和檢測邊緣,而導數可利用微分算子來計算。對于數字圖像來說,通常利用差分來近似微分。一介微分梯度邊緣檢測:設f(x,y)為連續圖像函數,Gx 和Gy 分別為x方向和y方向的梯度,且在點(x, y)處的梯度可以表示為一個矢量,并有其梯度定義: (9)對應于歐式距離的梯度幅值: (10)對應于棋盤距離的梯度幅值: (11)對應于街區距離的梯度幅值: (12)有梯度矢量幅角表示的梯度方向是函數f(x, y)增加最快的方向: (13) 幾個常用算子:(1) Roberts 算子是一個交叉算子,其在點(i, j)的梯度幅值表示為: (14)卷積模板可表示為: (15)其中, G

10、x和Gy分別為: (16)(2) Sobel算子Sobel算子在點(i, j)的梯度幅值表示為: (17)簡化的卷積模板表示形式:(18)其中,Sx 和 Sy分別是x方向和y方向梯度的模板表示: (19)(2) Prewitt 算子(3) Prewitt算子在點(i, j)的梯度幅值表示為: (20)簡化的卷積模板表示形式為: (21)其中,Sx和Sy分別是X方向和Y方向提督的模板形式: (22)二階微分邊緣檢測:拉普拉斯二階導數算子: (23)二階差分的偏導數近似式為: (24)以上是以(i+1, j)為中心,用i 替換 i+1可得一(i, j)為中心的二階偏導數公式:也即有: (25)同理

11、有: (26)所以有:(27)對應的集中模板為: (28)基于閾值的圖像分割方法:基于閾值的圖像分割方法是提取物體與背景在灰度上的差異,把圖像分為具有不同灰度級的目標區域和背景區域的一種圖像分割技術。基本思想:首先確定一個灰度閾值,然后將灰度值大于給定閾值的像素判歸為某一物體,賦予同一個編號,將灰度值小于給定閾值的像素歸為另一物體,賦予另一個相同的編號。適用情況:被分割物體的灰度值比較均一并且它周圍背景的灰度值也比較均一。公式:單閾值情況: (9)多閾值情況: (10)式中,Tk為各個分割閾值,假定共有N個閾值。半閾值化分割:圖像經閾值化分割后不是表示成二值和多值圖像,而是將比閾值大的像素的灰

12、度保持不變,而將比閾值小的像素的灰度變為黑色;或者將比閾值小的像素的灰度保持不變,而將比閾值大的像素變為白色。公式如下:(11) (12)基于跟蹤的圖像分割:先通過對圖像上的點的簡便運算,來檢測出可能存在的物體上的點,然后在檢測的點的基礎上通過跟蹤運算來檢測物體的邊緣輪廓的一種圖像分割方法。輪廓跟蹤法:一種適用于黑白二值圖像的分割方法,算法如下:(1) 在靠近邊緣處任取一起始點,然后按照每次只前進一步,步距為一個像素的原則進行跟蹤;(2) 當跟蹤中的某步是由白區進入黑區時,以后各步向左轉,知直到穿出黑區為止(3) 當跟蹤的某步是由黑區進入白區時,以后各步向右轉,直到穿出白區為止;(4) 當圍繞

13、目標邊界循環跟蹤一周回到起點時,則所跟蹤的軌跡就是目標的輪廓;否則繼續按(2)和(3)的原則進行跟蹤。黑白起點黑起點白輪廓跟蹤法可能使某些凸起部分被漏掉。 利用不同起點跟蹤凸起部分光柵跟蹤方法:先利用檢測準則確定接受對象點,然后根據已有的接受對象點和跟蹤準則確定新的接受對象點,最后將所有標記為1且相鄰的對象點聯接起來就得到了檢測到的細曲線。需要事先確定檢測閾值d、跟蹤閾值t,且要求d>t。 檢測準則:對圖像逐行掃描,將每一行中灰度值大于或等于檢測閾值d的所有點(稱為接受對象點)記為1。 跟蹤準則:設位于第i行的點(i,j)為接受對象點,如果位于第i+1行上的相鄰點(i+1,j-1)、(i

14、+1,j)和(i+1,j+1)的灰度值大于或等于跟蹤閾值t,就將其確定為新的接受對象點,并記為1。 光柵跟蹤圖像分割算法: (1)確定檢測閾值d和跟蹤閾值t,且要求d>t; (2)用檢測閾值d逐行對圖像進行掃描,依次將灰度值大于或等于檢測閾值d的點的位置記為1; (3)逐行掃描圖像,若圖像中的(i,j)點為接受對象點,則在第i+1行上找點(i,j)的鄰點: (i+1,j-1)、(i+1,j)、(i+1,j+1)并將其中灰度值大于或等于跟蹤閾值t的鄰點確定為新的接受對象點,將相應位置記為1; (4)重復步驟(3),直至圖像中除最末一行以外的所有接受點掃描完為止。 基于區域的圖像分割 :基于

15、區域的圖像分割是根據圖像的灰度、紋理、顏色和圖像像素統計特征的均勻性等圖像的空間局部特征,把圖像中的像素劃歸到各個物體或區域中,進而將圖像分割成若干個不同區域的一種分割方法。 區域生長法 :區域生長法的基本思想是根據事先定義的相似性準則,將圖像中滿足相似性準則的像素或子區域聚合成更大區域的過程。區域生長的基本方法是首先在每個需要分割的區域中找一個“種子”像素作為生長的起點,然后將種子像素周圍鄰域中與種子像素有相同或相似性質的像素合并到種子像素所在的區域中,接著以合并成的區域中的所有像素作為新的種子像素繼續上面的相似性判別與合并過程,直到再沒有滿足相似性條件的像素可被合并進來為止。這樣就使得滿足

16、相似性條件的像素就組成(生長成)了一個區域。 區域生長法的三個關鍵條件的確定: (1)選擇和確定一組能正確代表所需區域的種子像素一般原則為: 接近聚類重心的像素可作為種子像素。例如,圖像直方圖中像素最多且處在聚類中心的像素; 紅外圖像目標檢測中最亮的像素可作為種子像素; 按位置要求確定種子像素; 根據某種經驗確定種子像素。 (2) 確定在生長過程中能將相鄰像素合并進來的相似性準則。主要有: 當圖像是彩色圖像時,可以各顏色為準則,并考慮圖像的連通性和鄰近性; 待檢測像素點的灰度值與已合并成的區域中所有像素點的平均灰度值滿足某種相似性標準,比如灰度值差小于某個值; 待檢測點與已合并成的區域構成的新

17、區域符合某個大小尺寸或形狀要求等。 (3) 確定終止生長過程的條件或規則 一般的停止生長準則是生長過程進行到沒有滿足生長準則的像素時為止; 其它與生長區域需要的尺寸、形狀等全局特性有關的準則。 分裂合并法 分裂-合并分割法是從整個圖像出發,根據圖像和各區域的不均勻性,把圖像或區域分裂成新的子區域;根據毗鄰區域的均勻性,把毗鄰的子區域合并成新的較大區域。如果把整幅圖像分成大小相同的4個方形象限區域,并接著把得到的新區域進一步分成大小相同的4個更小的象限區域,如此不斷繼續分割下去,就會得到一個以該圖像為樹根,以分成的新區域或更小區域為中間結點或樹葉結點的四叉樹。 分裂-合并分割法 設同一區域Ri中

18、的所有像素滿足某一相似性準則時,P(Ri)=TRUE,否則P(Ri)=FALSE。 (1)將圖像R分成4個大小相同的象限區域Ri,i=1,2,3,4; (2)對于任何的Ri,如果P(Ri)=FALSE,則將該Ri再進一步拆分成4個更小的象限區域; (3)如果此時存在任意相鄰的兩個區域Rj和Rk使P(RjRk)=TRUE成立,就將Rj和Rk進行合并; (4)重復(2)和(3),直到無法進行拆分和合并為止。 對于灰度圖象的一些可以選擇的分裂-合并準則: (1)同一區域中最大灰度值與最小灰度值之差或方差小于某選定的閾值; (2)兩個區域的平均灰度值之差及方差小于某個選定的閾值; (3)兩個區域的灰度

19、分布函數之差小于某個選定的閾值; (4)兩個區域的某種圖像統計特征值的差小于等于某個閾值。 BMP圖像文件的結構1.概述:位圖文件的基本結構:位圖文件由文件頭、信息頭、顏色信息和圖像數據四部分組成。文件頭主要包含文件的大小,文件的類型,圖像數據偏離文件頭的長度等信息;位圖信息頭包含圖象的尺寸信息、圖像用幾個比特數值來表示一個像素、圖像是否壓縮,圖像所用的顏色數等信息。顏色信息包含圖像所用的顏色表,顯示圖像時需用到這個顏色表來生成調色板,但如果圖像為真彩色,既圖像的每個像素用24個比特來表示,文件中就沒有這一塊信息,也就不需要操作調色板。文件中的數據塊表示圖像的相應的像素值。特別需要注意的是:圖

20、像的像素值在文件中存放的順序為從左到右,從下到上,也就是說在BMP圖像文件中首先存放的是圖像的最后一行像素,最后存儲圖像的第一行像素,但對于同一行的像素,則是按照從左到右的順序存儲的;另外,文件存儲圖像的每一行像素時,所占的字節數必須為4的倍數,不足的在后面補零。2.BMP文件頭BMP文件頭數據結構含有BMP文件的類型、文件的大小、和位圖數據的起始位置。結構定義如下:Typedef struct tagBITMAPFILEHEADERWORD bfType; / 位圖文件的類型,必須為“BM”DWORD bfSize; / 位圖文件的大小,以字節為單位WORD bfReserved1; / 位

21、圖文件保留字,必須為0WORD bfReserved2; / 位圖文件保留字,必須為0DWORD bfOffBits; / 位圖數據的起始位置,以相對于位圖文件頭的偏移量表示,以字節為單位 BITMAPFILEHEADER;該結構占據14個字節。3.位圖信息頭位圖信息頭用于說明位圖尺寸信息等typedef struct tagBITMAPINFOHEADERDWORD biSize; / 本結構所占用字節數LONG biWidth; / 位圖的寬度,以像素為單位LONG biHeight; / 位圖的高度,以像素為單位WORD biPlanes; / 目標設備的平面數不清,必須為1WORD b

22、iBitCount/ 每個像素所需的位數,必須是1(雙色), 4(16色),8(256色)或24(真彩色)之一DWORD biCompression; / 位圖壓縮類型,必須是 0(不壓縮),1(BI_RLE8壓縮類型)或2(BI_RLE4壓縮類型)之一DWORD biSizeImage; / 位圖的大小,以字節為單位LONG biXPelsPerMeter; / 位圖水平分辨率,每米像素數LONG biYPelsPerMeter; / 位圖垂直分辨率,每米像素數DWORD biClrUsed;/ 位圖實際使用的顏色表中的顏色數DWORD biClrImportant;/ 位圖顯示過程中重要的

23、顏色數 BITMAPINFOHEADER;該結構占據40個字節。注意:對于BMP文件格式,一般都不對圖像數據進行壓縮處理,如果位圖采用壓縮處理的話,那么16色彩采用RLE4壓縮算法,256色的圖像采用RLE8壓縮算法。4顏色表顏色表用于說明位圖中的顏色,它有若干個表項,每一個表象是一個RGBQUAD類型的結構,定義一種顏色。RGBQUAD的結構定義如下:typedef struct tagRGBQUAD BYTE rgbBlue;/ 藍色的亮度(值范圍為0-255)BYTE rgbGreen; / 綠色的亮度(值范圍為0-255)BYTE rgbRed; / 紅色的亮度(值范圍為0-255)B

24、YTE rgbReserved;/ 保留,必須為0 RGBQUAD;注意:RGBQUAD數據結構中,增加了一個保留字段rgbReserved,它不代表任何顏色,必須取固定的值為“0”,同時,RGBQUAD結構中定義的顏色值中,紅色、綠色和藍色的排列順序與一般真彩色圖像文件的顏色數據排列順序恰好相反,既:若某個位圖中的一個像素點的顏色的描述為“00,00,ff,00”,則表示該點為紅色,而不是藍色顏色表中RGBQUAD結構的個數有BITMAPINFOHEADER中的biBitCount項來確定,當biBItcount =1,4,8時,分別有2,16,256個顏色表項。 當biBitCount =

25、 24時,圖像為真彩色,圖像中每個像素的顏色用三個字節來表示,分別對應R、G、B的值,圖像文件沒有顏色表項。5位圖信息頭和顏色表組成位圖信息,BITMAPINFO結構定義如下:typedef struct tagBITMAPINFO BITMAPINFOHEADER bmiHeader; / 位圖信息頭RGBQUAD bmiColors1; / 顏色表 BITMAPINFO;6.位圖數據位圖數據記錄了位圖的每一個像素值或該對應像素的顏色表的索引值,圖像記錄順序在同一掃描行是從左到右掃描,在掃描行之間是從下到上掃描。這種格式又稱為bottom_up位圖。每個像素所占的字節數:當biBitCoun

26、t = 1時,一個像素占一位,8個像素占一個字節;當biBitCount = 4時,一個像素值占4位,兩個像素占一個字節;當biBitCoount = 8時,一個像素占一個字節; 當biBitCount = 24時,一個像素占三個字節,此時圖像為真彩色圖像,當圖像不為真彩色時,圖像文件中包含顏色表,位圖的數據表示對應像素點在顏色表中相應的索引值。當為真彩色時,每一個像素用三個字節表示圖像相應像素點的彩色值,每個字節分別對應R、G、B分量的值,這時圖像文件中沒有顏色表。圖像文件中一個掃描行所占字節數的計算方法:DataSizePerLine= (biWidth* biBitCount+31)/8

27、;/ 一個掃描行所占的字節數注意: 加31 是因為Windows規定圖像文件一個掃描行所占字節數必須為4的倍數,因為是取整操作,所以如果最后不夠四個字節的話就會丟失,所以加上31再取整,這樣就能把最后不夠四個字節的部分取上。位圖數據的大小按下式計算(不壓縮情況):DataSize= DataSizePerLine* biHeight。typedef struct tagBITMAP LONG bmType; LONG bmWidth; LONG bmHeight; LONG bmWidthBytes; WORD bmPlanes; WORD bmBitsPixel; LPVOID bmBits

28、; BITMAP, *PBITMAP, NEAR *NPBITMAP, FAR *LPBITMAP;typedef struct tagRGBTRIPLE BYTE rgbtBlue; BYTE rgbtGreen; BYTE rgbtRed; RGBTRIPLE;typedef struct tagRGBQUAD BYTE rgbBlue; BYTE rgbGreen; BYTE rgbRed; BYTE rgbReserved; RGBQUAD;typedef RGBQUAD FAR* LPRGBQUAD;typedef struct tagBITMAPCOREHEADER DWORD bcSize; /* used to get to color table */ WORD bcWidth; WORD bcHeight; WORD bcPlanes; WORD bcBitCount; BITMAPCOREHEADER, FAR *LPBITMAPCOREHEADER, *PBITMAPCOREHEADER;typedef struct tagBITMAPINFOHEADER DWORD biSize; LONG biWidth; LONG biHeight; WORD biPlan

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論