基于Matlab實(shí)現(xiàn)以圖識(shí)圖的研究_第1頁(yè)
基于Matlab實(shí)現(xiàn)以圖識(shí)圖的研究_第2頁(yè)
基于Matlab實(shí)現(xiàn)以圖識(shí)圖的研究_第3頁(yè)
基于Matlab實(shí)現(xiàn)以圖識(shí)圖的研究_第4頁(yè)
基于Matlab實(shí)現(xiàn)以圖識(shí)圖的研究_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余7頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、    基于matlab實(shí)現(xiàn)以圖識(shí)圖的研究    劉瑞霖【摘 要】以前我們想根據(jù)一張圖片搜索更多類似圖片時(shí),往往是輸入圖片的文件名、索引或關(guān)鍵詞來(lái)搜索,其結(jié)果往往不盡人意。本文作者擬研究運(yùn)用圖像識(shí)別技術(shù)來(lái)實(shí)現(xiàn)以圖識(shí)圖。圖像識(shí)別是基于圖片內(nèi)容,應(yīng)用計(jì)算機(jī)視覺技術(shù),讓計(jì)算機(jī)根據(jù)“看到”的有關(guān)圖片而進(jìn)行比對(duì)、匹配,搜索結(jié)果的相似度將有所提高。以圖識(shí)圖的實(shí)現(xiàn)方法有很多,本文的研究方法是基于matlab平臺(tái),通過對(duì)目標(biāo)圖片和圖庫(kù)圖片進(jìn)行顏色、紋理等特征分析,通過指定算法得到特征矩陣,從而匹配相似度較高的圖片。從研究結(jié)果看,本文所設(shè)計(jì)的研究步驟和算法,能較好地實(shí)現(xiàn)以

2、圖識(shí)圖的功能?!娟P(guān)鍵詞】matlab;以圖識(shí)圖;顏色特征;紋理特征;顏色直方圖;特征矩陣1 研究的背景和目的隨著互聯(lián)網(wǎng)的發(fā)展,人們之間的交流已不再局限于文字,圖片也成為了信息傳遞的一種重要媒介。然而,雖然圖片比文字更為生動(dòng)、直觀,容易理解,但面對(duì)一幅陌生的圖片,想通過搜索而進(jìn)一步了解它卻遠(yuǎn)沒有文字搜索容易。在這種情況下,能幫助用戶找到近似的圖片的以圖識(shí)圖技術(shù),便尤為重要。美國(guó)的谷歌識(shí)圖、中國(guó)的百度識(shí)圖等應(yīng)用相繼推出,讓這方面的研究吸引了越來(lái)越多的關(guān)注。以前的搜索引擎一般是根據(jù)圖片的文件名、索引、關(guān)鍵詞等來(lái)進(jìn)行匹配,但是結(jié)果往往會(huì)不盡人意。以圖識(shí)圖是應(yīng)用了計(jì)算機(jī)視覺(computer visio

3、n)技術(shù),讓計(jì)算機(jī)“看到”有關(guān)圖片而進(jìn)行自動(dòng)比對(duì)、匹配,搜索結(jié)果的相似度將有所提高。本文擬通過matlab平臺(tái),研究以圖識(shí)圖的實(shí)現(xiàn)方法。2 研究的實(shí)施方法2.1 研究平臺(tái)的介紹matlab是指矩陣實(shí)驗(yàn)室(matrixlaboratory).是一個(gè)高級(jí)的矩陣/陣列語(yǔ)言,同時(shí)也是個(gè)是一個(gè)包含大量計(jì)算算法的集合。matlab擁有600多個(gè)工程中要用到的數(shù)學(xué)運(yùn)算函數(shù),可以方便的實(shí)現(xiàn)用戶所需的各種計(jì)算功能。它還提供了專業(yè)水平的符號(hào)計(jì)算、文字處理、可視化建模仿真和實(shí)時(shí)控制等功能.由于matlab是為矩陣計(jì)算而研發(fā)的,內(nèi)含多種矩陣運(yùn)算方法,而每張圖片又可以看作多個(gè)像素點(diǎn)組合而成的矩陣,因此它在圖片的特征提取

4、和計(jì)算方面顯得尤為方便,適合以圖識(shí)圖軟件的編寫。2.2 以圖識(shí)圖的原理以圖識(shí)圖簡(jiǎn)單來(lái)講就是根據(jù)客戶的目標(biāo)圖片在圖片庫(kù)里搜尋相似圖片?;镜脑砭褪侵父鶕?jù)圖像內(nèi)容特征以及特征組合,給每張圖片分配一個(gè)像指紋一樣的矩陣,矩陣越接近,圖片就越相似。本文是通過提取圖像的內(nèi)容特征,如顏色、紋理、形狀等來(lái)研究,沒有包括更深一層的語(yǔ)義。提取圖像的內(nèi)容特征就是對(duì)圖片特征矩陣(顏色矩陣、紋理矩陣等)的提取,將人類所能觀察到的圖片數(shù)據(jù)化。數(shù)據(jù)化后,將圖片庫(kù)中原有的特征矩陣相比對(duì),通常是求兩矩陣之差。因此,數(shù)據(jù)化后得出的檢索結(jié)果,就是圖片庫(kù)中,與目標(biāo)圖片的某幾種特征差別最小的,比如說(shuō)顏色最相近,紋理最近似的。1)顏色

5、特征圖像其實(shí)是由許許多多被稱為像素點(diǎn)的小點(diǎn)構(gòu)成的,每個(gè)像素點(diǎn)有不同的值,這是組成圖像的基本單元要素。顏色特征就是根據(jù)不同像素點(diǎn)的不同值的特征而提取的一種全局特征。一個(gè)像素點(diǎn)代表一種顏色,將所有像素點(diǎn)進(jìn)行提取、統(tǒng)計(jì),就可以得到各種顏色在圖像中像素點(diǎn)總個(gè)數(shù),然通過顏色直方圖表達(dá)出來(lái)。2)紋理特征“紋理是由一個(gè)具有一定的不變性的視覺基元,在給定區(qū)域內(nèi)的不同位置上,以不同的形變和不同的方向重復(fù)出現(xiàn)的一種圖紋”,它也是圖像的重要“身份”特征之一。使用紋理特征可以較好地區(qū)分出相似顏色區(qū)域,對(duì)于物體和背景不易分割的圖像比較適用。能表達(dá)各種顏色的在圖像中的分布情況,導(dǎo)致搜索準(zhǔn)確率大大降低。3)顏色直方圖顏色直

6、方圖是顏色在圖像中的空間分布情況,它是基于不同的顏色空間和坐標(biāo)系。常用的顏色空間有rgb、hsv、luv和lab空間,其中hsv是最常用的,對(duì)應(yīng)人眼視覺特性,從色彩(hue)、飽和度(saturation)和值(value)三個(gè)方面來(lái)表達(dá)圖像的特征。2.3 研究實(shí)施步驟基于圖像內(nèi)容實(shí)現(xiàn)檢索的基本思路是:1)分析目標(biāo)圖片的基本內(nèi)容,通過自動(dòng)或半自動(dòng)的方法提取目標(biāo)圖像的特征,包括顏色、紋理、形狀以及空間關(guān)系等特征。2)將得到的圖像特征作為其“指紋身份”,根據(jù)指定的算法計(jì)算和評(píng)價(jià)目標(biāo)圖像和圖庫(kù)圖像各種特征之間的相似程度。3)根據(jù)比對(duì)結(jié)果,將最相似的一組圖片反饋給使用者。(1)圖像解碼通過掃描、采樣和

7、量化,提取圖片的顏色空間。在matlab中可以直接用一個(gè)子程序a=imread(圖片路徑/圖片名.圖片格式)實(shí)現(xiàn)。(2)圖像預(yù)處理對(duì)圖像進(jìn)行縮放、灰度、反轉(zhuǎn)、直方圖等格式轉(zhuǎn)換,以供程序提取特征使用。(3)圖片特征提取通過程序提取圖像顏色、紋理和hsv顏色空間等描述全局特征,使用fast、harris描述圖像的局部特征。(4)得出特征矩陣通過matlab得到mat格式的矩陣集合,每個(gè)矩陣代表一個(gè)圖片。(5)特征相似度匹配及索引用“距離”的概念來(lái)度量圖片的相似度。有閔式、余弦和海明距離來(lái)規(guī)定這些圖片的相似程度,計(jì)算兩張圖片的“距離”的最簡(jiǎn)單的算法就是:距離=sqrt(sum(x-y)2), x與y

8、代表兩個(gè)矩陣中相對(duì)應(yīng)的元素。再按照一定的檢索算法,和圖片庫(kù)的特征進(jìn)行比對(duì),得到匹配程度的排序。2.4 具體算法1)比較兩張圖片imgn1和imgn2的紋理特征:imgn1=zeros(m1,n1);for i=2:m1-1 for j=2:n1-2pow1=0;for q =j-1:j+1for p=i-1:i+1if img1(p,q) > img1(i,j)if p=i | q=jimgn1(i,j)=imgn1(i,j)+2pow1;pow1=pow1+1;endendendendendendx1=imgn1(:);x=1.0.*hist(x1,256)/(m1*n1);img2=

9、imread('d:f.jpg');img2=rgb2gray(img2);m2 n2=size(img2);imgn2=zeros(m2,n2);for a=2:m2-1for b=2:n2-1pow2=0;for t =b-1:b+1for s=a-1:a+1if img2(s,t) > img2(a,b)if s=a | t=bimgn2(a,b)=imgn2(a,b)+2pow2;pow2=pow2+1;endendendendendendx2=imgn2(:);y=1.0.*hist(x2,256)/(m2*n2);dist=sqrt(sum(x-y).*(x-

10、y);dist=dist/32)比較兩張圖片i1和i2的hsv顏色特征:i1=imread('d:b.jpg');i2=imread('d:e.jpg');m1,n1,c1=size(i1);m2,n2,c2=size(i2);i1=rgb2hsv(i1);i2=rgb2hsv(i2);h1=i1(:,:,1);s1=i1(:,:,2);v1=i1(:,:,3);h2=i2(:,:,1);s2=i2(:,:,2);v2=i2(:,:,3);xh=1.0.*imhist(h1)/(m1*n1);yh=1.0.*imhist(h2)/(m2*n2);disth =s

11、um(xh-yh).*(xh-yh);sumh=sum(disth(:);sumh=sumh/3;xs=1.0.*imhist(s1)/(m1*n1);ys=1.0.*imhist(s2)/(m2*n2);dists=sum(xs-ys).*(xs-ys);sums=sum(dists(:);sums=sums/3;xv=1.0.*imhist(v1)/(m1*n1);yv=1.0.*imhist(v2)/(m2*n2);distv=sum(xv-yv).*(xv-yv);sumv=sum(distv(:);sumv=sumv/3;sqrt(sumh+sums+sumv)3)局部特征fast角

12、點(diǎn):角點(diǎn)就是在圖片中灰度急劇變化的點(diǎn)。fast算法規(guī)定,如果點(diǎn)a的周圍(在半徑為3個(gè)像素點(diǎn)的圓周內(nèi)),有足夠多的點(diǎn)(12個(gè)點(diǎn)),與點(diǎn)a的灰度之差大于設(shè)定的一個(gè)閾值,那么程序就判定點(diǎn)a為角點(diǎn)。在以圖識(shí)圖中,角點(diǎn)可作為局部特征來(lái)進(jìn)行檢索。但一張圖片中有無(wú)數(shù)像素點(diǎn),如果將每個(gè)點(diǎn)進(jìn)行計(jì)算,工作量將會(huì)巨大。因此通過算法篩選出可能是角點(diǎn)的像素點(diǎn)是一種有效的方法。以下是簡(jiǎn)易判斷fast角點(diǎn)的代碼:第一層:i=imread('d:day-2flower2.jpg');im2uint8(rgb2gray(i);h=fspecial('gaussian',5);i=imfilter(i,h);m,n=size(i);t=20;corners=zeros(m,n);for i=4:m-20for j=20:n-20surpass=0;if abs(i(i,j)-i(i-3,j)>tsurpass=surpass+1;endif abs(i(i,j)-i(i,j-3)>tsurpass=surpass+1;endif abs(i(i,j)-i(i+3,j)>tsurpass=surpass+1;endif abs(i(i,j)-i(i

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論