




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
湖南大學畢業設計(論文)第=1\*ROMANI頁HUNAN畢業論文論文題目手機網頁質量檢測學生姓名學生學號專業班級自動化1103班學院名稱電氣與信息工程學院指導老師學院院長2015年5月25日湖南大學畢業設計(論文)第頁摘要隨著移動行業的高速發展,為用戶提供快速準確的網頁體驗的重要性日益突出,但出于各種原因,手機網頁顯示時常會出現部分錯誤,對手機網頁的錯誤檢測具有重要的現實意義。目前手機網頁錯誤檢測主要依賴人工檢測,但成本高,勞動強度大,針對手機網頁錯誤的自動化檢測還沒有成熟有效的方法,為此,本文提出了一種基于圖像匹配的手機網頁顯示錯誤自動檢測方法。實驗表明,該方法能夠準確地檢測出手機網頁中的控件缺失、漂移、格式不一致等顯示錯誤。該方法對不同分辨率或瀏覽器的影響具有一定的魯棒性,填補了對手機網頁錯誤進行切實有效地自動化檢測的技術空檔,在就瀏覽器等軟件的開發測試方面有重大的應用前景,具有較高的實際應用價值。關鍵詞:手機網頁錯誤檢測;圖像匹配;圖像比對
AbstractWiththerapiddevelopmentofmobileindustry,providingfastandaccuratewebbrowsingexperienceisbecomingmoreandmoreimportantforusers,butmobilewebapppagesoftenappearsomemistakesforvariousreasons,webapppageerrordetectionhasimportantpracticalsignificance.Atpresent,thewebapppageerrordetectionmainlyreliesonmanualinspection,butthecostishigh,andthelaborintensityisbig,thewebapppageerrorautomationdetectionmeasurehasnotyetmatureandeffective.Inthispaper,anautomaticwebapppageerrordetectionapproachbasedonimagematchingisproposedforthesereasons.Experimentsshowedthatthisapproachcanaccuratelydetectthelackofcontrols,drifting,incorrectformatofcontrolsandsoon.Theapproachisstableunderresolutionorbrowserchange,andoffersaneffectivelyautomatictechnologytocompensatethewebapppageerrordetection.Ithasgreatapplicationprospectandhighapplicationvalueintermsofbrowsersoftwaredevelopment.KeyWords:Webapppageerrordetection;Imagematching;Imagecomparison
目錄摘要 IAbstract II目錄 III1緒論 11.1課題研究背景與意義 11.2國內外研究狀況 11.3論文的研究內容及組織結構 22手機網頁錯誤檢測理論基礎 32.1SIFT算法介紹 32.1.1SIFT算法簡述 32.1.2構造尺度空間 32.1.3關鍵點檢測 52.1.4關鍵點方向分配 72.1.5生成關鍵點描述子 72.1.6關鍵點匹配 82.2豪斯多夫距離介紹 92.2.1豪斯多夫距離簡述 92.2.2k-th豪斯多夫距離 92.2.3豪斯多夫距離的計算 92.3DTW算法介紹 122.3.1DTW算法簡述 122.3.2全局彎曲路徑約束的DTW算法 143手機網頁錯誤檢測過程 143.1系統流程 143.2圖片預處理 163.3文本行切分及匹配 163.3.1文本行切分 163.3.2文本行匹配 173.4獲取前景二值圖 183.4.1獲取前景二值圖 183.4.2去除前景二值圖中的橫向邊框 193.5文本塊切分 193.6文本塊比對篩選 213.6.1基于模板匹配的篩選 213.6.2基于內容的篩選 223.7結果與分析 234總結與展望 254.1總結 254.2展望 26致謝 27參考文獻 281緒論1.1課題研究背景與意義當前,互聯網用戶逐漸向移動端傾斜,截至2014年12月,我國使用手機上網的人群在網民中占比達到85.8%,較2013年提升了4.8個百分點。網民總數已從2013年的5億增加至5.57億。手機即時通信的使用率已從2013年底的86.1%提升至91.2%[1]。據工信部發布,移動電話普及率達到94.5%,全年提高了3.7個百分點[2][3]。移動電話由于其方便快捷的特點,已從過去單一的通信工具過渡到為用戶提供信息瀏覽、快捷支付等豐富互聯網功能服務的平臺,同時,因為手機網民具備基數大的特點,因此擁有潛在的巨大商業價值。隨著移動互聯網產業的迅猛發展,為用戶提供準確的手機網頁顯示體驗具有日益增加的市場需求。圖1.1中國手機網民規模及其占網民比例然而,在手機網頁的瀏覽中時常會遇到各種顯示錯誤,比較典型的情況有控件缺失、漂移、格式不一致等。手機網頁錯誤來源復雜多樣,具體原因尚不明確,難以從根源上解決。盡管部分錯誤可能與工程師的工作不完善相關,但針對該方向的解決措施仍舊不能完全解決問題,同時還會給工程師加重工作負擔。當前相關移動服務行業的高效智能化建設需求不斷增強,通過手機網頁質量自動檢測技術的研究可以提供更好的技術方法,從而提高檢測效率和質量。1.2國內外研究狀況網頁錯誤的分析研究最早是在PC端進入人們的視野的,相關技術主要集中在對網絡、軟件及系統等顯式或潛在的缺陷進行檢測和完善方面,如基于可靠的Web日志分析[4]。現今,PC端已不再是獨寵,移動服務行業迅速崛起并向著更加自動化、智能化的方向快速發展,手機網民規模日益增加,已有眾多目光會聚到了改善移動端的用戶體驗上。當前,網頁作為手機上最重要的應用之一,手機網頁瀏覽技術研究熱門主要包括功能擴展、體系結構設計以及性能優化等[5][6][7]。伴隨著手機網頁暴露出的頁面顯示錯誤情況,人們不得不面臨著解決手機網頁顯示質量和可靠性的問題。然而,受到手機網頁錯誤來源不明確,難以從根源上解決的制約,因此找到一種切實有效的檢測技術手段逐步成為關注焦點。目前,國內外針對手機網頁錯誤的自動化檢測技術尚處于起步研究階段,現主要依賴人工檢測。人工檢測是用人眼來對比實際頁面和標準頁面,并確定實際頁面上的各個元素是否顯示正常。這種方法人工成本很高,而且長時間高強度工作可能對人體健康造成危害。因此,亟需開發一種能夠自動對比實際頁面圖像和標準頁面圖像,并定位顯示錯誤區域的方法。直覺上,最簡單的方法是直接將兩幅圖片做差,差不為零的區域即可作為顯示錯誤區域。但是,實際中由于硬件和軟件的不同,不同屏幕不同瀏覽器上,頁面顯示的長寬比例不一致,同時使得頁面中的控件的大小樣式等存在一定的差異,另外,受手機網頁顯示錯誤復雜不同形式的影響,如控件缺失、格式錯誤等,使得單純的差值比較無所適從。總體而言,當前對手機網頁錯誤進行自動檢測還沒有成熟有效的方法。1.3論文的研究內容及組織結構針對上述問題,本文著眼于根據手機端的實際顯示結果與標準顯示是否一致來判斷是否正確,利用圖像匹配的方法對手機網頁顯示標準圖片和待檢圖片進行測試。首先對手機頁面進行預處理,并將頁面進行文本塊切分,再利用圖像匹配的方法對文本塊分塊比對,最后篩選出錯誤位置。具體包括手機頁面基于特征點的配準,二值化,文本塊切分,利用圖像匹配技術進行分塊比對等。該方法可以實現對手機網頁的錯誤的自動檢測及定位,并對頁面中控件樣式大小及字體變化等具有一定的抗干擾能力。該方法在就瀏覽器等軟件的開發測試方面有重大的應用前景,具有較高的實際應用價值。本文基于圖像匹配的相關技術對手機網頁錯誤自動檢測方法進行研究,各部分相關內容組織結構如下:第一章:緒論。本章對手機網頁錯誤檢測的背景,意義及其基本情況和方法等進行了簡要的闡述。第二章:介紹手機網頁錯誤檢測技術理論基礎。第三章:對手機網頁錯誤檢測算法研究進行詳細說明,并給出實驗結果及分析。第四章:總結與展望。2手機網頁錯誤檢測理論基礎本文提出的手機網頁錯誤檢測方法主要是基于圖像匹配技術實現的,受到手機屏幕分辨率、瀏覽器等因素的影響,手機網頁標準圖片與待檢圖片之間的控件位置、尺寸,文本字體等往往存在細微差異。因此,針對圖像匹配算法的選擇和確定應考慮到有良好的魯棒性,且在實際應用中需要具備計算效率高的特點。本文中的檢測方法首先根據SIFT特征點對頁面進行初始局部區域匹配,再利用豪斯多夫距離、DTW算法等進行基于文本塊的逐步篩選匹配,最后分析得到檢測結果。2.1SIFT算法介紹2.1.1SIFT算法簡述SIFT(ScaleInvariantFeatureTransform),即尺度不變特征變換,Lowe于1999年首次提出[8],并在2004年進行了整理和完善[9]。SIFT算法對于圖像旋轉、尺度變化、仿射失真、噪聲和光照變化影響等具有良好的魯棒性。這種方法的另一個重要性在于,它可以產生大量的特征點,一個典型的像素點圖片將產生約2000個穩定特征點(當然這個數字需要依賴于圖片的內容和對各種參數的選取)。SIFT算法主要包括對于尺度和旋轉不變的極值點檢測,關鍵點定位(根據其穩定程度進行選擇),方向(一個或多個方向)分配,特征描述(統計鄰域的梯度方向)和特征點匹配(根據兩個描述子的最近鄰與次最近鄰的比值進行匹配)幾個步驟。2.1.2構造尺度空間檢測尺度不變特征位置即搜尋所有可能尺度中的穩定特征,尺度空間中尺度使用的為連續函數(Witkin,1983)。Koenderink(1984)和Lindeberg(1994)給出,在眾多合理的假設中,唯一可能的尺度空間核是高斯函數。若輸入圖像為,是尺度可變高斯函數,圖像的尺度空間定義為:(2-1)其中,為卷積運算,定義為:(2-2)在尺度空間中,為了能夠較好地檢測出穩定的興趣點,Lowe(1999)提出,在DOG(differenceofGaussian)方程和圖像的卷積中計算尺度空間極值,可以通過兩個相鄰尺度空間差計算得出:(2-3)其中,為常數因子。選擇此方程的幾個原因:1)計算效率高。需要在每個尺度空間特征描述中計算,從而可以通過簡單的減法計算得到。2)DOG方程提供了對尺度歸一化LOG(LaplacianofGaussian)算子的近似,。Lindeberg(1994)給出具有因子的歸一化拉普拉斯算子對于尺度不變性是必需的。3)經過詳細的實驗比較,Mikolajczyk(2002)發現與其它諸如梯度,Hessian,Harris角點等眾多特征描述方法相比,通過的極值可以提取得到最穩定的圖像特征[10]。和的關系為:(2-4)因此,(2-5)式中的因子是常數,因此不會影響極值的位置。當靠近1時,近似誤差趨近于0,但是在實際中發現,近似值對極值檢測的穩定性和位置幾乎沒有影響。構建的一個有效方法如圖2.1所示。圖中左邊一欄為初始圖像經過逐步高斯卷積得到的高斯尺度空間,右邊一欄為相鄰圖像相減得到的DOG圖像。當一個完整的octave被處理后,通過兩倍初始值的降采樣得到下一個octave。圖2.1DOG(differenceofGaussian)金字塔2.1.3關鍵點檢測檢測的局部極值點,即每個取樣點和當前圖像的八鄰域和上下相鄰尺度圖像中的九鄰域比較,并選取比全部鄰域點(共26個點)都大或者都小的點。注:DOG圖像中的極值是通過一個像素點(標有)與其26個鄰域(當前尺度及相鄰尺度中的區域)相比較得到的。圖2.2DOG(differenceofGaussian)尺度空間局部極值點檢測針對上一步檢測得到候選點,還需要計算其位置、尺度和主曲率,并以此剔除對噪聲敏感的低對比度點和邊緣響應點。去除低對比度點Brown和Lowe(2002)提出了的擬合三維二次函數的方法。對尺度空間函數泰勒展開到二次項:(2-6)其中,。對式(2-6)求導并令其為0,得到極值的位置:(2-7)將式(2-7)代入式(2-6),可得:(2-8)假設圖像的像素值范圍為,當取值小于0.03時,則丟棄該極值點。消除邊緣響應DOG方程會產生很強的邊緣響應,對于一個質量不好的極值點的主曲率,其值在橫跨邊緣方向較大,但在垂直方向較小。主曲率可以通過一個的Hessian矩陣計算。(2-9)的特征值和的主曲率具有比例關系,這里僅關心其比例值,因此可借用Harris和Stephens(1988)的方法[11],從而避免直接計算的特征值。設為最大特征值,為較小特征值,則,(2-10)(2-11)令為和的比值,即,則,(2-12)該結果僅與相關,當和相等時取得最小值,且與值成正相關。因此,要檢測主曲率小于某個閾值,只需要檢查(2-13)這是容易計算的,典型的,取。2.1.4關鍵點方向分配基于局部圖像特征為每個關鍵點分配一個統一的方向,并據此實現對圖像旋轉的不變性。根據實驗表明以下的方法可以得到最穩定的結果,對于每一個圖像樣本及在當前尺度下,梯度模值和方向為:(2-14)(2-15)利用直方圖統計關鍵點鄰域內取樣點的梯度方向,直方圖方向范圍為度,共36個柱。將直方圖中的峰值作為局部梯度的優勢方向,并為達到最高峰值的80%的峰值分配方向。2.1.5生成關鍵點描述子注:從的取樣窗口中計算得到的描述子數組。圖2.3關鍵點描述子的生成圖中所示為的取樣窗口分為的子域,實際計算時以關鍵點為中心取的窗口,并分為16個的子域,再將每個子域高斯加權累積,從而為每個關鍵點生成一個維的特征向量。2.1.6關鍵點匹配這里根據兩個描述子的最近鄰與次最近鄰的比值進行匹配,最近鄰定義為關鍵點描述子間的最小歐氏距離,當該比值小于指定的閾值時則認為匹配成功。可通過改變最近鄰與次最近鄰的比值閾值來調整匹配性能。注:測試數據為40,000個關鍵點。圖2.4距離比值與匹配PDF關系在Lowe的實現過程中,選取最近鄰與次最近鄰的比值為0.8,從而消除了90%的錯誤匹配,同時正確匹配的丟棄率低于5%。2.2豪斯多夫距離介紹2.2.1豪斯多夫距離簡述豪斯多夫距離常用于度量空間中點集之間的距離,它不需要建立點之間的對應關系,而只需計算兩個點集之間的最大距離,因此可以有效地對許多特征點進行計算。與其它距離度量方法相比,豪斯多夫距離具有較高的計算效率,且對特征點缺失或匹配點誤差等影響具有良好的魯棒性。給出兩個有限點集和,則和之間的豪斯多夫距離定義為:(2-16)其中,(2-17)(2-18)2.2.2k-th豪斯多夫距離豪斯多夫距離對噪聲較為敏感,尤其當出現離群點,則豪斯多夫距離將主要由這些離群點主導。在絕大多數情況下,我們希望能夠允許一定離群點的存在,由此引入k-th豪斯多夫距離[12]:(2-19)該距離為選取點集中與匹配最佳的個點得到的匹配結果,可先計算點集和點集的點對點距離,然后按照距離遞增順序選取個點。這一措施即需要先將點集分為兩個部分:與點集相似的部分和離群部分。在k-th豪斯多夫距離中,是通過一個給定的誤差閾值來決定點集的數量上限的:(2-20)在實際應用豪斯多夫距離過程中,分離擾動(利用距離)和離群點(利用排序)是非常重要的。2.2.3豪斯多夫距離的計算豪斯多夫距離可以通過距離變換實現快速計算。距離變換即求取二值圖像中所有像素點與最近目標點的距離,最終實現二值圖像到灰度圖像的轉換(其中每個像素點的灰度值等于它到最近目標點的距離),這里的灰度圖像稱作距離圖像。設目標區域為,對于距離矩陣中的每個灰度值:(2-21)按照定義,距離矩陣可通過蠻力法,即直接計算二值圖像中每個像素與最近目標點的距離,雖然這種方法思路清晰簡單,且結果精確,但效率是非常低的。早在距離變換于1966年被首次提出之后[13],Rosenfeld(1968)就給出了利用模板掃描的計算方法[14],后面又有人在此基礎上做了部分改進,這里介紹典型的Borgefors(1986)提出的一種兩次模板掃描方法[15]。首先將二值圖像中目標點灰度值初始化為0,將非目標點(即背景點)初始化為一個合適足夠大的值。如圖2.5所示模板(模板大小、值可以不同)中,常數為局部距離,在圖像中逐像素滑動模板,將每一個標記像素點(包括0)分別與圖像對應像素點值相加,取所有相加結果中最小值更新當前圖像灰度值。算法步驟為:1)圖像初始化:目標點灰度值初始化為0,非目標點初始化為一個合適足夠大的值。2)對于圖像中每個像素點,利用圖2.5所示Forwardmask從左到右,從上到下掃描計算:(2-22)3)對于圖像中每個像素點,利用圖2.5所示Backwardmask從右到左,從下到上掃描計算:(2-23)其中,為圖像灰度值,為圖2.5所示模板中的局部距離。圖2.5距離變換模板距離變換中一般可取的距離有歐式距離,街區距離,城市距離等,因為歐式距離具有其它方法所不具有的旋轉不變性,因此歐氏距離常常被采用。但歐氏距離是一種非線性的距離度量方法,所以一般并不直接計算兩個像素點之間的歐式距離,而常常采用切割算法替代歐式距離變換[16]。如圖2.6,常量,,應滿足條件:,,這是對歐式距離的近似。對于模板,設置(最大誤差為8%);對于模板,設置(最大誤差為2%)。以模板為例,得到圖2.7所示距離變換模板后,按照前面所述算法步驟計算距離圖像。模板的選擇主要取決于對高速度和高精度的需求。圖2.6部分常用模板圖2.7距離變換模板2.3DTW算法介紹2.3.1DTW算法簡述DTW(DynamicTimeWarping)即動態時間歸整,主要用于測量在時間或速度上存在不同的兩個時間序列的相似度。與歐式距離相比,DTW算法允許相比較的時間序列長短不一或在時間軸上異相,DTW算法的這種性質使得其被廣泛應用在時間序列挖掘領域和其它學科,如醫學,氣象學,手勢識別和金融等[17][18]。注:圖示兩個時間序列在整體上相似,但在時間軸上沒有對齊。歐式距離假定一個序列的第個點與另一個序列的第個點對齊,會產生一種悲觀的相異性度量。非線性的動態時間歸整允許更好的距離度量。圖2.8DTW與歐式距離點集映射關系比較假設有兩個時間序列,:(2-24)(2-25)在DTW算法中,為了得到兩個序列的映射關系,首先建立一個大小為的匹配距離矩陣,其中,坐標為的元素為點和的距離,這里的距離一般取歐式距離,即。因此,序列,之間的映射關系即對應為矩陣中的一個彎曲路徑,設的第個元素,則有:(2-26)注:彎曲路徑為圖中灰色方塊所示。圖2.9匹配距離矩陣的建立和彎曲路徑示意彎曲路徑通常具有如下限制條件:邊界條件:且。連續性:設有,,則應滿足和。單調性:設有,,則應滿足和。實際中會存在多條彎曲路徑滿足上述條件,我們只對具有最小花費的路徑感興趣:(2-27)為了選取我們感興趣的最小花費路徑,DTW算法中采用動態規劃的方法。建立一個大小為的累積距離矩陣(也常常稱作花費矩陣),其中,為當前單元對應的距離及前一個相鄰最小累積距離單元之和:(2-28)其中,。即為最佳匹配路徑所對應的匹配距離。可以看出,兩個序列的歐式距離實際上是路徑的第個元素為的特殊情況。DTW算法的時間和空間復雜度為。2.3.2全局彎曲路徑約束的DTW算法彎曲路徑約束即限制最優路徑與對角線的距離,換言之,就是限制動態規劃的搜索范圍。使用全局約束的主要原因:1)可以防止序列的病態匹配,如一個較小的部分序列映射到另一個相對較大的部分序列。2)可以略微加快DTW的計算速度。下面是最常用的兩種全局約束方法,Sakoe-Chiba約束(Sakoe和Chiba,1978)和Itakura平行四邊形(Itakura,1975):注:圖中,灰色區域為搜索路徑的限制范圍。圖2.10Sakoe-Chiba約束和Itakura平行四邊形3手機網頁錯誤檢測過程3.1系統流程本方法是一種基于圖像匹配的手機網頁錯誤自動檢測方法,其基本步驟為:1)對標準圖片和待檢圖片進行預處理:首先以兩圖中較小寬度尺寸為基準縮小圖片至相同寬度,再將兩圖擴展至相同高度,以得到相同尺寸的比對圖片,便于之后進行比較。2)利用圖片中的邊緣信息,通過水平投影和垂直投影等統計方法去除輸入的標準圖片和待檢圖片中背景部分,將文本部分劃分成若干文本行區域;然后利用特征點、位置、寬度等信息對標準圖片和待檢圖片之間的文本行進行匹配,并將未匹配到的文本行歸為錯誤區域。該步驟的目的在于獲取并匹配標準圖片和待檢圖片的文本行,再將匹配到的文本行用于后續的相同處理和比對。3)對每一組匹配的文本行,將其具有最大頻數的RGB像素值附近作為背景,并利用大津法選取合適的閾值對文本行的前景和背景進行分割,以獲得頁面的前景二值圖。該步驟的目的是獲取比對圖片的前景二值圖,并將其作為后面的文本塊切分及比對的輸入。4)對每一組匹配的文本行,基于其前景二值圖進行對應的列切分,最終完成頁面的文本塊切分。該步驟的目的是將標準圖片和待檢圖片劃分成若干的文本塊區域,并用于之后的匹配和比對。5)將每一個文本塊作為模板,找到其在另一幅圖對應位置的附近區域,再基于前景二值圖進行模板匹配,將模板匹配得到的最佳匹配結果作為文本塊的相似度,然后將相似度較高的文本塊歸為正確區域,相似度較低的文本塊則作為候檢文本塊。該步驟的目的在于初步快速篩選出錯誤可能性較高的文本塊待進一步檢測,且當標準圖片和待檢圖片文本塊切分不一致或不準確,使得文本塊與塊之間無法正確對應,繼而無法進行后續基于文本塊與塊之間的內容測試時,一定程度上也能過濾掉正確顯示的文本塊,避免錯檢。6)對每一個候檢文本塊,將在另一幅圖對應位置附近的文本塊作為其匹配文本塊,然后將未成功匹配的候檢文本塊歸為錯誤區域;再將成功得到的每一組匹配文本塊基于其內容特征計算匹配度,最后篩選出匹配度較低的候檢文本塊作為錯誤區域。7)對每一個錯誤文本塊或文本行,根據其與周圍文本塊的位置關系,重新估計其邊界,再合并標準圖片和待檢圖片中的錯誤區域得到最終的錯誤檢測結果。注:如圖所示,本方法首先將校準至相同尺寸的比對圖片進行文本行的切分和匹配,再對匹配的文本行進行對應的前景二值圖提取和文本塊切分,然后將初步篩選得到的候檢文本塊進行匹配和測試篩選,將過程中未成功匹配的文本行或塊合并到錯誤位置當中,最后檢測得到錯誤區域。圖3.1系統流程3.2圖片預處理將標準圖片和待檢圖片校準至相同尺寸。因為在普遍情況下,手機網頁顯示圖片的水平方向僅存在縮放差異,因此首先以兩圖中較小寬度尺寸為基準縮小圖片至相同寬度,然后將高度較小的圖片末尾補0以擴展兩圖至相同高度,得到標準圖片和待檢圖片。3.3文本行切分及匹配利用圖片的邊緣信息進行文本行的切分,再根據比對圖片文本行間的特征信息完成文本行的匹配,其具體步驟為:3.3.1文本行切分普遍情況下,文本行與行之間為純色,文本行內為非單一顏色,因此首先將每行像素值間的最大差異較小的像素行視為純色,即當作背景,以此初步得到文本區域。然后對初始文本區域采用坎尼邊緣檢測算法得到其邊緣圖片,將網頁的邊緣圖片中取值不全為0的像素行作為文本行,其它部分作為背景,以實現文本行的切分。當手機網頁中出現邊框與邊框上下相連等特殊情況,利用坎尼算法[19]得到的邊緣圖片會誤把該邊界當作文本行部分,不能將兩個文本行有效分割開來,因此這里利用水平線檢測模板對圖片進行濾波。(3-1)對濾波后的圖片采用大津法[20]得到其二值圖片,將二值圖片中水平方向較長的細線作為邊界線,并以此邊界線輔助分割文本行得到最后的文本行切分結果。3.3.2文本行匹配以標準圖片的某一文本行作為輸入,基于RANSAC算法[21]選取文本行的SIFT特征點,獲取與待檢圖片中每一文本行匹配的SIFT特征點數目,并得到最大匹配點數量與次最大匹配點數量之比,當最大匹配點數量大于一定值,且比率小于某個指定閾值時則認為是正確匹配,由此對標準圖片中每一文本行進行逐一匹配。對標準圖片中未匹配到的文本行,在兩端找到與其距離最近的已匹配到的文本行,及其在待檢圖片中的對應匹配行號,(若在某一端未找到已匹配文本行,則以圖片邊界作為代替),再將待檢圖片中文本行,之間的范圍內與文本行位置關系最接近,且寬度相近的文本行作為匹配。最后將標準圖片和待檢圖片中未能成功匹配的文本行歸為錯誤區域。注:左邊為標準圖片,右邊為待檢圖片。圖3.2文本行切分及匹配3.4獲取前景二值圖以一組匹配的文本行,作為輸入,結合RGB直方圖和大津法獲取前景二值圖。其具體步驟為:3.4.1獲取前景二值圖將文本行中具有最大頻數的RGB像素值附近作為背景,首先獲取文本行中每一像素點與像素值的距離,這里的距離具體指歐式距離:(3-2)(3-3)其中,,,分別為文本行的RGB三個通道,,,分別為文本行的RGB三個通道,,,分別對應標準圖片或待檢圖片RGB通道的最大頻數像素值。對,采用大津法進行二值化即得到文本行,的前景二值圖。將每一組匹配行逐一處理,最后得到標準圖片和待檢圖片的前景二值圖,。3.4.2去除前景二值圖中的橫向邊框考慮到手機網頁中存在部分文本邊框線(如搜索框),為了避免在之后切分文本塊時將整個文本框劃分為一個整體,從而不能將頁面邊框里的內容細分出來,還需要去除前景二值圖和中的邊框線部分,實際上只需去除整個邊框線的橫向部分便能實現文本框內容的細分。對單張前景二值圖的具體處理為:首先設置待去除橫向邊框線的長度及寬度閾值,(這里的算法將長度不小于,寬度不大于的邊框線去除),再利用下面公式得到去除橫向邊框線后的前景二值圖。(3-4)(3-5)(3-6)其中為開操作,為原點在其中心的的方形結構元,為原點在其中心的的方形結構元,,為中間變量。注:左邊為標準圖片,右邊為待檢圖片。圖3.3前景二值圖3.5文本塊切分利用得到的前景二值圖進行頁面的文本塊切分,以一組匹配的文本行,作為輸入,將,的前景二值圖中非0部分作為文本塊區域,選取適當的閾值,將間距小于的文本塊合并,并使得匹配文本行的文本塊切分一致。具體操作為:StepStep1:將文本行,的前景二值圖中取值不全為0的像素列作為文本塊部分,其余作為背景。Step2:取閾值。Step3:將間距小于閾值的文本塊合并。Step4:當取得閾值使得文本行,分塊數量一致,且閾值在大于的臨近范圍內與閾值取時,文本行,的分塊結果不變時停止,否則繼續。Step5:當時(其中為指定的適當閾值上限),,跳轉至Step3,否則停止。若在范圍內找不到滿足條件的閾值,則用事先指定的某一適當閾值合并文本塊。對每一組匹配的文本行逐一地進行上述處理以實現對整個標準圖片和待檢圖片匹配文本行部分的文本塊切分。注:左邊為標準圖片,右邊為待檢圖片。圖3.4文本塊切分3.6文本塊比對篩選對文本塊進行逐層測試和篩選,得到錯誤檢測結果,該過程的具體步驟為:3.6.1基于模板匹配的篩選將每一個文本塊作為模板,找到其在另一幅圖對應位置的附近區域,再基于前景二值圖進行模板匹配,我們認為,即使在區域外出現了與文本塊正確對應的文本塊,也應視文本塊為錯誤(即文本塊漂移),因此,區域的大小應視實際應用中對控件正確顯示范圍的限制要求而定。根據模板匹配計算得到結果矩陣,將中最小值作為最佳匹配,得到文本塊的相似度進行篩選,這里的模板匹配采用歸一化平方差法(公式(3-7))以及邏輯運算法(公式(3-8))逐次檢測:(3-7)(3-8)(3-9)(3-10)(3-11)其中,若的尺寸為,的尺寸為,則矩陣的尺寸為,,表示取最小值,表示膨脹操作,為原點在其中心的十字形結構元:(3-12)由此計算得到每個文本塊的相似度,篩選出相似度較低的文本塊作為候檢文本塊并進一步測試。3.6.2基于內容的篩選對篩選出的候檢文本塊,首先找到其在另一幅圖中對應的文本行,然后在文本行中找到對應位置附近區域中的文本塊,其中區域的大小同樣視對控件正確顯示范圍的限制要求而定,再將文本塊作為文本塊的匹配塊進行比對,這里的比對采用多步篩選的形式。此時的匹配測試是在假設和匹配的情況下進行,因此可將,縮放至相同尺寸后再利用公式(3-8)~(3-12)計算得到匹配度。現把豪斯多夫距離定義重寫如下:(3-13)(3-14)(3-15)對于匹配度較低的候檢文本塊,,首先將,的前景二值圖片縮放至相同尺寸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年VB考試前準備及試題及答案
- 軟件開發員考試必知試題及答案
- 追求卓越的心態與方法2024年高考作文試題及答案
- 盈利能力與風險管理策略的有效結合試題及答案
- 信息處理技術員考試基礎知識概述及答案
- 大數據技術與AI的結合應用試題及答案
- 氣體委托充裝協議
- 行政法學實踐案例及試題研究
- 【黃岡】2025年湖北黃岡市團風縣事業單位統一公開招聘工作人員35人筆試歷年典型考題及考點剖析附帶答案詳解
- 班級實踐活動總結與分享計劃
- 三方水泥合同協議
- 采礦管理協議書范本
- 廣西壯族自治區2025年4月高三畢業班診斷學考試數學試卷及答案(廣西三模)
- 安徽中醫藥大學專職輔導員招聘筆試真題2024
- 研學部管理制度
- 2025年03月山東省環科院及權屬企業校園公開招聘筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2024北京海淀區三年級(下)期末語文試題及答案
- 帶電粒子在復合場中的運動教學設計
- 貴州省婦幼健康服務體系與能力提升實施方案
- 運維經理培訓
- 事業單位停薪留職協議
評論
0/150
提交評論