漢王車牌識別算法解析_第1頁
漢王車牌識別算法解析_第2頁
漢王車牌識別算法解析_第3頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、機(jī)動(dòng)車闖紅燈是日常交通管理中常見的交通違章現(xiàn) 象,不僅擾亂了正常的交通秩序,也是造成機(jī)動(dòng)車交通 事故的主要原因之一。“電子警察”就是針對機(jī)動(dòng)車路口闖紅燈這種極易造成惡性事故的交通違章現(xiàn)象進(jìn) 行自動(dòng)監(jiān)測記錄,做到了無人值守,不間斷監(jiān)測,證據(jù)充分正確。車牌識別技術(shù)(Vehicle License Plate Recognition, VLPR)是計(jì)算機(jī)視覺和 模式識別技術(shù)在現(xiàn)代智能交通系統(tǒng)中的一項(xiàng)重要研究課題,是實(shí)現(xiàn)交通管理智能化 的重要環(huán)節(jié)。它是以數(shù)字圖像處理、模式識別、計(jì)算機(jī)視覺等技術(shù)為基礎(chǔ)的智能識 別系統(tǒng),它利用每一個(gè)汽車都有唯一的車牌號碼,通過攝像機(jī)所拍攝的車輛圖像進(jìn)行 車牌號碼的識別。在

2、不影響汽車狀態(tài)的情況下,計(jì)算機(jī)自動(dòng)完成車牌的識別,從而可 降低交通管理工作復(fù)雜度。車牌自動(dòng)識別技術(shù)在車輛過路、過橋全自動(dòng)不停車收費(fèi), 交通流量控制指標(biāo)的測量,車輛自動(dòng)識別,高速公路上的事故自動(dòng)測報(bào),不停車檢查, 車輛定位,汽車防盜,稽查和追蹤車輛違規(guī)、違法行為,維護(hù)交通安全和城市治安,防 止交通堵塞,提高收費(fèi)路橋的服務(wù)速度,緩解交通緊張狀況等方面將會起到積極的作 用。針對以往車牌識別算法的缺點(diǎn)和不足,例如識別率低、識別速度慢、車牌定位 不準(zhǔn)確等,本文提出了一種新的基于小波分析的改進(jìn)車牌定位算法,同時(shí)將引入動(dòng)量 因子的BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到字符識別,加快了網(wǎng)絡(luò)的訓(xùn)練過程。基于小波變換和神經(jīng)網(wǎng)絡(luò)的車牌

3、識別技術(shù)總體設(shè)計(jì)1車牌定位算法的基本思路在某一個(gè)相位的紅燈周期內(nèi),如果檢測到有車輛通過,觸發(fā)視頻采集模塊采集 前端攝像機(jī)傳送來的視頻流,進(jìn)行圖像采集,采集到的圖像是24位的真彩色圖像,首 先將圖像進(jìn)行灰度變換,轉(zhuǎn)換為256色的灰度圖。在車牌區(qū)域的局部圖像內(nèi),字符筆 畫與車牌背景間的亮度反差形成明顯而密集的邊緣,上升緣與下降緣交替出現(xiàn)。利 用車牌區(qū)域的這一高頻特征,采用小波分析的多分辨率思想,進(jìn)行水平方向上的小波 變換,小波變換后的高頻部分可以突出車牌區(qū)域,后繼處理只需要對高頻圖像進(jìn)行變 換,即可定位出車牌。采用這種方法可以將運(yùn)算量減少一半,大大縮短了車牌定位的 時(shí)間。接下來,利用局部閾值方法,

4、將高頻圖像部分二值化。此時(shí)的圖像可能含有一 些干擾信息,因此要先對其進(jìn)行中值濾波,以消除一些不必要的噪聲??紤]到數(shù)學(xué)形 態(tài)學(xué)的腐蝕和膨脹運(yùn)算可以分別起到突出輪廓和填充空洞的作用,因此利用數(shù)學(xué)形 態(tài)學(xué)的閉運(yùn)算來突出車牌的輪廓和消除孤立的部分。然后根據(jù)對車牌的先驗(yàn)知識 (例如長寬比在一定范圉內(nèi)等)提取車牌的候選區(qū)。最后,將車牌候選區(qū)域變換到 HSI色彩空間,通過判斷背景的顏色來確定準(zhǔn)確的車牌區(qū)域。2字符識別算法的基本思路首先,將已經(jīng)確定的車牌區(qū)域變換成灰度圖。利用中值濾波進(jìn)行預(yù)處理,然后 利用中值濾波消除牌照上的污點(diǎn),利用HOUGH變換對車牌進(jìn)行傾斜度矯正。接著采 用自適應(yīng)閾值法,將圖像二值化。利

5、用豎直方向的投影具有波峰、波谷間隔出現(xiàn)的 特性,將字符進(jìn)行分割。最后,將分割的字符大小歸一化后,送入改進(jìn)的BP神經(jīng)網(wǎng)絡(luò) 進(jìn)行字符識別。改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)采用了動(dòng)量因子,實(shí)驗(yàn)表明采用該方法大大縮短 了網(wǎng)絡(luò)的訓(xùn)練時(shí)間。3車牌定位中小波變換的運(yùn)用本方案使用Mallat 一維分解算法實(shí)現(xiàn)圖像的小波分解。假設(shè)2j二W,即現(xiàn)在的 圖像分辨率為j,則待變換的圖像表示為fj (n),則離散函數(shù)fj (n)的小波分解 為:fj (n)=wj-l-fj-l其中,,。上式的分解中,町-1代表了圖像的變化比較明顯 的部分,即圖像的高頻部分。而fj(n)代表圖像所包含的基本信息,即圖像的低頻部分。將圖像分解 為低頻和高

6、頻部分后,車牌字符、邊緣等變化比較明顯的部分就包含在一維小波分 解后的高頻圖像部分中了。小波變換低頻系數(shù)圖像保持了原圖像輪廓的主要信息,而高頻圖像反應(yīng)了原圖 在不同方向上的細(xì)節(jié)信息。分析小波高頻圖像二值化后的水平投影圖可以得到:尖峰的寬度即為車牌上下 方向的大致坐標(biāo)。從豎直投影圖可以看出,變化平緩的部分為車牌左右方向的大致 坐標(biāo)。但圖像中存在的噪聲對準(zhǔn)確識別車牌位置仍然有很大的干擾,但干擾噪聲明 顯比釆用邊緣檢測算法要少的多,更重要的是只需要對高頻圖像進(jìn)行檢測,運(yùn)算時(shí)間 縮減了一半,只需要掃描半幅圖像。4字符識別中改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的運(yùn)用4.1字符識別總體設(shè)訃車牌的第一個(gè)字符為漢字,第二為英文字

7、母,第三個(gè)字符為英文或阿拉伯?dāng)?shù)字, 笫四至笫七個(gè)字符為阿拉伯?dāng)?shù)字,同時(shí)考慮到過于復(fù)雜的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)會增加網(wǎng)絡(luò) 訓(xùn)練時(shí)間,同時(shí)訃算量也會增大,所以采用四種不同結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)分別進(jìn)行識 別。4.2 BP神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)(1) 網(wǎng)絡(luò)種類以及網(wǎng)絡(luò)層數(shù)的確定神經(jīng)網(wǎng)絡(luò)的許多特性正是山于隱含層的存在才具備的。然而,具體取多少隱含 層合適至今為止卻沒有確定的規(guī)律可循,不同的應(yīng)用對象,與其相適應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu)差 別很大。本文中采用具有一個(gè)隱含層的三層BP神經(jīng)網(wǎng)絡(luò)??紤]到BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練 速度慢,容易陷入局部最小,這里采用加入動(dòng)量因子的改進(jìn)BP算法來構(gòu)造漢字神經(jīng) 網(wǎng)絡(luò)。(2) 傳遞函數(shù)的確定山于BP網(wǎng)絡(luò)的非線性逼近

8、能力是通過S型傳遞函數(shù)體現(xiàn)出來的,所以隱含層 一般采用S型傳遞函數(shù),輸出層的傳遞函數(shù)可以采用線性或S型傳遞函數(shù)。當(dāng)希望 網(wǎng)絡(luò)的輸出范圍無限制時(shí),應(yīng)“1使用線性傳遞函數(shù)。當(dāng)用S型傳遞函數(shù)作為輸出層 的傳遞函數(shù)時(shí),其非線性逼近速度快于線性傳遞函數(shù),但此時(shí)的網(wǎng)絡(luò)輸出被限制在 (0, 1)或(-1, 1)。在我們設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)漢字識別器中,為了減少神經(jīng)網(wǎng)絡(luò)輸出層的 神經(jīng)無數(shù),我們采用二進(jìn)制編碼來作為輸出的LI標(biāo)向量。故我們在輸出層采用對數(shù) S型傳遞函數(shù),以限制輸出范圍在0, 1范圍內(nèi)。(3) 輸入層個(gè)數(shù)的確定輸入層個(gè)數(shù)根據(jù)待識別字符所抽取的特征向量維數(shù)大小來確定??紤]到速度 和精度雙重因素,因此特征向

9、量維數(shù)不能太高。過低的維數(shù)將無法描述漢字之間的 差異,較高的維數(shù)則對于待識別圖像的微小偏移比較敬感。在本系統(tǒng)中,特征提取采 用的是基于投影圖和輪廓提取的方法進(jìn)行的,網(wǎng)絡(luò)的輸入層個(gè)數(shù)應(yīng)取為:96個(gè),即為 豎直投影圖的像素個(gè)數(shù)加上水平投影圖的像素個(gè)數(shù)。(4) 輸出層神經(jīng)元個(gè)數(shù)的確定在系統(tǒng)中,神經(jīng)網(wǎng)絡(luò)輸出層神經(jīng)元個(gè)數(shù)是依據(jù)所需要識別的字符數(shù)U來確定 的。此外,為減少輸出層神經(jīng)元數(shù),我們采用二進(jìn)制編碼來作為輸岀的H標(biāo)向量。舉 例而言,在車牌的漢字只有30多個(gè),那么把30多個(gè)漢字進(jìn)行二進(jìn)制編碼,最少需要 5位,如00000, 00001, 00010等等,故共需要5個(gè)輸出端,其忖標(biāo)向量即為上述的二 進(jìn)制

10、的編碼值。對于字母數(shù)字神經(jīng)網(wǎng)絡(luò),需要識別的字符個(gè)數(shù)有36個(gè),把這36個(gè)字 符進(jìn)行二進(jìn)制編碼至少需要6位,因此字母數(shù)字神經(jīng)網(wǎng)絡(luò)的輸出層神經(jīng)元的個(gè)數(shù)是 6個(gè)。但是,我們所選取的神經(jīng)網(wǎng)絡(luò)的激勵(lì)函數(shù)為S型的函數(shù)山于在無窮遠(yuǎn)處才能取得極值,這里的編碼取為0. 1和0. 9來分別表示0和1。例如魯?shù)木幋a為:0. 1, 0. 1, 0. 1 ,0. 1, 0. lo(5) 隱含層神經(jīng)元個(gè)數(shù)的確定神經(jīng)網(wǎng)絡(luò)隱含層的神經(jīng)元個(gè)數(shù)過少,會導(dǎo)致訓(xùn)練時(shí)間過長,迭代次數(shù)多,權(quán)值來 回調(diào)整,不易穩(wěn)定。隱含層神經(jīng)元個(gè)數(shù)過少,會增加網(wǎng)絡(luò)的學(xué)習(xí)時(shí)間,網(wǎng)絡(luò)所需要的 存儲容量也變大。因此,綜合以上兒點(diǎn),漢字神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元的個(gè)數(shù)選

11、取為 18個(gè)。(6) 初始值的選取山于神經(jīng)網(wǎng)絡(luò)系統(tǒng)是非線性的,故網(wǎng)絡(luò)初始權(quán)值對于學(xué)習(xí)是否達(dá)到局部最小、 是否能夠收斂以及訓(xùn)練時(shí)間的長短的關(guān)系很大。如果初始值太大,使得加權(quán)后的輸 入落在S型傳遞函數(shù)的飽和區(qū),從而導(dǎo)致其導(dǎo)數(shù)f' (x)非常小,而在計(jì)算權(quán)值修正公 式中,因,當(dāng)f' (x)0時(shí),則有8 0,這使得A 8和,從而使得調(diào)節(jié)過程幾乎停頓下 來。所以,一般總是希望經(jīng)過初始加權(quán)后的每個(gè)神經(jīng)元的輸岀值部接近于零,這樣可 以保證每個(gè)神經(jīng)元的權(quán)值都能夠在它們的S型傳遞函數(shù)變化最大之處進(jìn)行調(diào)節(jié)。所 以一般取初始權(quán)值在(-1, 1)之間的隨機(jī)數(shù),而且要求數(shù)值比較小,這樣可以保證每個(gè) 神經(jīng)

12、元在一開始就處在它們傳遞函數(shù)變化最大的地方。在對系統(tǒng)進(jìn)行仿真測試時(shí),使用時(shí)間作為種子,來產(chǎn)生隨機(jī)的初始值。函數(shù)srand(unsigned)(time(NULL);Wij= (double)(rand()/(32767/2) -1 用 來產(chǎn)生在T, 1內(nèi)的初始值。(7) 學(xué)習(xí)速率的選取學(xué)習(xí)速率決定每一次循環(huán)訓(xùn)練中所產(chǎn)生的權(quán)值變化量。大的學(xué)習(xí)速率可能導(dǎo) 致系統(tǒng)的不穩(wěn)定;但小的學(xué)習(xí)速率將導(dǎo)致較長的訓(xùn)練時(shí)問,可能收斂很慢,不過能保 證網(wǎng)絡(luò)的誤差值不跳出誤差表面的低谷而最終趨于最小誤差值。所以在一般情況下,傾向于選取較小的學(xué)習(xí)速率以保證系統(tǒng)的穩(wěn)定性。學(xué)習(xí)速率的選取范圍一般在0. oro. 8之間。這里

13、的學(xué)習(xí)速率選取為0.4。(8) 動(dòng)量因子的選取動(dòng)量因子的引入可使網(wǎng)絡(luò)權(quán)值的變化不僅反映誤差曲面局部的梯度信息,而且 反映了誤差曲面最近的變化趨勢。其實(shí)質(zhì)是將最后一次權(quán)值變化的影響,通過一個(gè) 動(dòng)量因子來傳遞。引入動(dòng)量因子可以平滑誤差曲面梯度方向劇烈變化的作用,從而 在一定程度上解決了局部最小值的問題。(9) 總結(jié)將前面所確定的各個(gè)參數(shù)進(jìn)行總結(jié)。(10) 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練設(shè)計(jì)完神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)之后,接下來就需要對網(wǎng)絡(luò)進(jìn)行訓(xùn)練。4.3字符識別測試結(jié)果為了驗(yàn)證所設(shè)汁的神經(jīng)網(wǎng)絡(luò)的有效性,測試集選取了 300幅圖片進(jìn)行了實(shí)際測 試,表1列出了各個(gè)神經(jīng)網(wǎng)絡(luò)識別的一些參數(shù)。實(shí)驗(yàn)結(jié)果表明,漢字識別網(wǎng)絡(luò)對于光照條件和清晰度較好的漢字基本能夠識別 出來,具有較強(qiáng)的容錯(cuò)能力和學(xué)習(xí)能力。同普通的BP神經(jīng)網(wǎng)絡(luò)相比,網(wǎng)絡(luò)收斂速度 更快,可以有效地提高系統(tǒng)的抗干擾性和識別率。字母數(shù)字網(wǎng)絡(luò)能夠

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論