



下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 一種基于模糊模板匹配的車牌漢字識別方法 吳 煒,楊曉敏,劉大宇,何小海 時間:2009年08月25日 字 體: 大 中 小 關鍵詞: ? 摘? 要:關鍵詞: 模式識別? 車牌識別? 模板匹配?1。因而,漢字的整體信息在無筆
2、順識別中起著無法替代的重要作用。? 統計模式識別借助概率論的知識,判斷或決策對象的特征類別,使得決策的錯誤率達到最小?;诮y計特征的識別方法先抽取識別對象的穩定特征,組成特征矢量,然后在字符集的特征空間中進行特征匹配?;谝陨险J識,在分析汽車牌照中漢字字符的特點后,采用了有別于結構分析的一種基于字符圖像特征統計的模式識別方法進行漢字識別。同時針對統計方法無法區分的相似漢字,提取其微結構信息進行特殊的校正識別。1? 特征統計匹配? 統計決策論其要點是提取待識別模式的一組統計特征,然后按照一定準則所確定的決策函數進行分類判決2。漢字的統計模式識別是將字符點陣看作一個整體,從該整體上經過大量統計得到
3、所用特征,用盡可能少的特征模式來描述盡可能多的信息。所采用的方法有:特征統計的方法、整體變換分析法3、幾何矩特征、筆劃密度特征、字符投影特征、外圍特征、微結構特征和特征點特征等。這些方法都具有各自的優缺點,應根據具體應用進行選取。主要方法有外圍面積特征匹配法和網格特征匹配法。外圍面積特征反映了字符的輪廓信息。外圍面積特征提取法,主要是從周圍形狀的心理學知識來獲得漢字信息的特征,即對文字周圍上下左右的形狀進行量化,從而構造特征向量。網格特征實際是結構模式識別和統計模式識別相結合的產物。字符圖像被均勻或非均勻地劃分為若干區域,稱之為“網格”。在每個網格內尋找各種特征,如目標面積比例、交叉點、筆劃端
4、點的個數、細化后的筆劃長度和筆劃密度等。特征統計以網格為單位,即使個別點統計有誤差也不會造成大的影響,從而增強了特征的抗干擾性。因此這種方法得到日益廣泛的應用。在實際的車牌漢字識別中,當相同漢字的二值圖形變動較小時該方法較有效。具體應用:將尺寸為34×66象素的漢字二值圖均勻分成32個正方形的小區域(不考慮外邊框的1個象素),統計每個8×8的小區域內目標象素(白色)所占的面積比例,就得到了歸一化的32維特征矢量。統計多幅相同漢字的32維特征矢量,取均值作為該漢字的標準網格特征模板。識別時,計算待識別漢字的32維網格特征矢量與模板矢量之間的Euclid距離,求得最小距離值,其
5、對應的漢字即為識別結果。在具體應用中,由于外部原因常常會出現字符模糊、字符傾斜的情況,而網格特征匹配方法對字符模糊和傾斜較敏感,因此魯棒性不是很強,不適合實際應用。2? 模板匹配2.1 基于二值圖形變動分析的模糊模板匹配? 在含有汽車牌照的圖像中,將漢字定位并提取出來以后,還要完成規格化、二值化等操作。即使是相同的漢字,由于車牌傾斜、模糊,特別是由于每次定位不可能完全精確一致等諸多因素的影響,導致在二值圖中字體的形狀、大小都會不同,字體位置也會發生不同程度的偏移。將這種二值圖形的不規則現象稱為圖形的變動。在漢字識別的分析過程中,希望對圖形變動的大小進行量化處理。因此,提出了求圖形整體變動量的統
6、計方法,其優點是不需要參照標準圖形,可以進行客觀評價,并構造出用于匹配識別的模糊模板。? 對每一個車牌的漢字字符,選取n幅質量較好的參考圖。將這n幅參考圖規格化為17×33的標準大小后進行二值化處理,得到標準參考圖fi? f(x,y)為得到的二值化后的待識別圖像,把所有點的置信度平均后得到總的置信度con作為判別依據。最大置信度con所對應的模板漢字作為匹配識別輸出的結果。? ? 公式中的width和height分別是歸一化后標準圖像的長和寬。通過對實驗結果的分析發現,識別錯誤的圖像,往往嚴重變形、模糊,二值化效果差。2.2 基于二值圖形變動分析的模糊模板匹配的改進算法? 針對以上問
7、題,提出了一種簡單的改進算法。將切分后不同大小的灰度字符圖像規格化為17×33的標準尺寸以后,將各象素點的灰度值線性變換到0,1區間,再與模糊圖形模板匹配,計算Euclid距離,其最小距離值對應的模板漢字作為匹配識別輸出的結果。該方法的優點是不用對灰度圖像作二值化處理,避免了由于二值化操作帶來的圖像信息損失。特別是對一些模糊圖像,若直接采用二值化效果較差,影響匹配準確度。因此使用該方法在一定程度上提高了識別正確率。? 實驗中發現,對少數明暗程度變化大或對比度不強的模糊圖像,該方法也產生了少量識別錯誤。這是由于將待識別圖像的各點灰度值線性拉伸到0,1區間后,原始圖像明暗程度不同導致其平
8、均值與對應模板的平均值并不一致,直接用Euclid距離進行匹配,帶來了計算誤差。因此引入了歸一化相關性度量公式:? ? 其中I(i,j)和Tn(i,j)分別是輸入的待識別的字符圖像和第n個模板,分別是輸入字符圖像所有灰度的均值和第n個模板的均值,w和h分別為圖像的長和寬,S(I,Tn)是匹配函數,其值在01之間,代表待識別圖像與模板圖像的匹配程度。使用該公式計算相關性,可以避免由于明暗和對比度變化導致圖像和模板的“能量”不一致而帶來的匹配誤差,進一步提高了匹配準確度。3? 試驗結果的進一步校正? 模板匹配表現的主要是漢字的整體特征,但是有些漢字存在著一定程度上整體的相似性,因此必須對相似的字符
9、進行進一步的校正才能提高識別的正確率。對相似漢字的區分,往往是尋找其特有的筆劃結構,這也是在統計模式識別中引入結構方法的必要之處。例如在車牌漢字識別中,“粵”字與其他省份漢字的最大區別是底部的鉤狀結構。為此對預處理后的17×33二值圖像的底部1/4部分作水平和垂直方向的投影,水平投影17個特征值(由左、右二邊分別投影得到),垂直投影33個特征值(由上、下二邊分別投影得到),形成50維的微結構投影特征矢量?!盎洝弊治⒔Y構特征及其統計41幅圖像后的微結構投影特征直方圖如圖2所示。經統計平均后作為區分相似漢字的依據。實際校正時,計算微結構特征的匹配距離。若小于預先設定的閾值,則直接返回該漢字作為識別結果。?4? 實驗流程及結果? 對識別300幅切分后的質量較好的漢字灰度圖進行識別,實驗流程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 稅務師網盤課件百度云
- 2025年 福建省大數據集團有限公司招聘考試筆試試題附答案
- 中國雙缸洗衣機塑件行業市場發展前景及發展趨勢與投資戰略研究報告(2024-2030)
- 農業機械生產線項目人力資源管理分析報告
- 2025-2030年中國鹽酥雞行業深度研究分析報告
- 2024-2030年中國遼寧省農村城鎮化建設行業市場發展監測及投資潛力預測報告
- 2024-2030年中國塞棒行業市場深度分析及發展潛力預測報告
- 2025年中國交互電子白板行業發展監測及投資戰略規劃報告
- 2025年中國晶閘管整流器行業市場全景調研及投資規劃建議報告
- 2025年中國電子元器件配件市場深度分析及行業前景展望報告
- 現場7S管理培訓
- 液氨安全管理及應急處置
- 2025年中考山西考試試題及答案
- 2025年湖南省長沙市岳麓區博才小學五下數學期末學業質量監測試題含答案
- 生產車間5S培訓教材
- 課題申報書:AI賦能高校輔導員能力提升的路徑研究
- 【MOOC期末】《中國哲學》(北京師范大學) 期末中國大學慕課答案
- 整本書閱讀:《鄉土中國》(考教銜接講義)-2025年高考語文一輪復習(新教材新高考)
- 護理新技術項目匯報
- DL T596《電力設備預防性實驗規程》知識培訓
- DB11T 594.1-2017 地下管線非開挖鋪設工程施工及驗收技術規程 第1部分:水平定向鉆施工
評論
0/150
提交評論