基于BP神經網絡的數字識別_第1頁
基于BP神經網絡的數字識別_第2頁
基于BP神經網絡的數字識別_第3頁
基于BP神經網絡的數字識別_第4頁
基于BP神經網絡的數字識別_第5頁
已閱讀5頁,還剩9頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、百度文庫-好好學習,天天向上模式識別作業題目基于BP神經網絡的數字識別科目模式識別II百度文庫-好好學習,天天向上基于BP神經網絡的數字識別摘要人工神經網絡技術在現在取得了巨大的發展,它具有的高度非線性,使我們能表達一些至少是目前尚無法用計算理論表達清楚的外部世界模型;同時,神經網絡所具有的自學習,自組織能力使我們能在與外部世界的交互作用下,實現無法用當前的計算理論表達清楚的功能;對于那些無法建立精確數學模型的系統,神經網絡有著獨特的優勢。本課題主要研究基于BP神經網絡的方法來實現數字識別。首先對圖像進行灰度化、二值化、平滑去噪、歸一化、細化的預處理,以便于進行像素值的提取,對設計好的神經網絡

2、進行訓練,對比訓練的結果與期望的結構,并根據對比的結果對神經網絡的一些權值進行修改,最終得到訓練好的神經網絡。并選擇測試樣本,進行仿真測試。整個仿真實驗中,對含數字的圖片進行處理,其數字識別效果可在本課題中的MATLAB仿真實驗中體現。關鍵詞:神經網絡;灰度化;預處理;仿真測試-II-II百度文庫-好好學習,天天向上目錄Notableofcontentsentriesfound.百度文庫-好好學習,天天向上百度文庫-好好學習,天天向上 - 背景介紹.研究背景為了解決計算機字符的自動識別、高速加工處理,使計算機達到真正智能化,人們對計算機識別進行了多年的研究,并取得了很大的進步。數字識別是字符識

3、別的一個分支,一般通過特征匹配及特征判別的方法來進行處理,目前識別率還較低。因此,為了提高識別率,還要尋求新的方法和途徑。近年來,人工神經網絡技術取得了巨大的發展,它所具有的優勢:固有的并行結構和并行處理、知識的分布存儲、容錯性、自適應性、模式識別能力,為手寫體數字識別開辟了新的途徑。數字識別作為模式識別的一個重要分支,在郵政、稅務、交通、金融等行業的實踐活動中有著及其廣泛的應用。數字識別作為模式識別領域的一個重要問題,也有著重要的理論價值。一方面,阿拉伯數字是世界各國通用的符號,因此,數字是一個重要樞紐。在符號識別領域,數字識別為這一領域提供了一個算法研究的平臺。另一方面,數字的識別方法很容

4、易推廣到其它一些相關問題,特別是對英文字母的識別,但到目前為止機器的識別本領還無法與人的認知能力相比,這仍是一個有難度的開放問題。.數字識別的發展現狀模式識別(PatternRecognition)是對表征事物或現象的各種形式的(數值的、文字的和邏輯關系的)信息進行處理和分析,以對事物或現象進行描述、辨認、分類和解釋的過程。它是信息科學和人工智能的重要組成部分。而數字識別作為模式識別的一個分支。在日常生活和科研中具有十分重要的作用。數字識別的算法一般是采用以知識、神經網絡、人工智能為基礎的模板匹配法、輪廓多邊形相關、傅立葉系數法等方法來進行識別的。以上方法識別效率高,但是實現較為復雜。.本課題

5、主要的研究內容MATLAB軟件包含了被稱為Toolbox的各類應用問題的求解工具。神經網絡工具箱正是在MATLAB環境下所開發出來的許多工具箱之一。設計者則可以根據自己的需要去調用工具箱中有關神經網絡的設計與訓練的程序,使自己能夠從煩瑣的編程中解脫出來,集中精力去思考和解決問題。人工神經網絡(ANN)是理論化的人腦神經網絡的模型,是模仿大腦神經網絡結構和功能而建立起來的一種信息處理系統。神經網絡的一個最主要的功能就是分類,這個功能有助于機器的模式識別。本課題就是利用神經網絡的分類功能,并借助于MATLAB軟件的神經網絡工具箱,采用具有自適應學習速率和附加動量因子的BP型神經網絡,從而實現羅馬數

6、字的模式識別。圖像預處理由于自然和人為因素影響,可能造成數字圖像筆劃缺損、噪聲嚴重及幾何形變等現象。故識別前必須對圖像進行必要的預處理。圖像處理流程如圖1所示。圖1圖像預處理流程.彩色圖像的灰度化圖像輸入后一般都是256色彩色圖像,因為256色位圖調色板內容復雜,很多算法無法進行,所以要進行彩色圖像的灰度化。灰度化后灰度圖像的RGB值是相等的,只有亮度的不同,灰度值大的像素亮度也大,灰度值小的圖像亮度暗,灰度值為255的像素為白色,灰度值為0的像素為黑色。.灰度圖像的二值化彩色圖像灰度化后每像素只有一個值,即灰度值,二值化就是根據一定標準將圖像分成黑白二色。因為本課題所做的是掃描圖像,所以用給

7、定閾值法,給定閾值為220。.梯度銳化因為二值化后的圖像字體模糊,所以有必要進行梯度銳化。梯度銳化同時對噪聲也起一定的去除作用,在這里采取Roberts算子對圖像銳化,可以讓模糊的邊緣變清楚,同時選用合適閾值可以減弱和消除細小的噪聲。.去離散噪聲由于圖像的掃描和傳輸過程可能夾帶噪聲,所以需要去離散噪聲。具體方法是:掃描整個圖像,當發現一個黑色像素就考察和它直接或間接相連的黑色像素有多少,如果大于一定值(具體數值視情況定),就可以認為它非離散點,否則就認為他是離散點,將其從圖像中去掉。.歸一化調整因為掃描的字符大小存在差異而對同一尺寸的圖像進行識別準確率高一些,所以要進行歸一化調整。歸一化方法是

8、先得到原來字符的高度,并與系統要求的高度比較,得出高度變換系數,然后根據這個系數得到變換后應有的寬度,得出高度、寬度后,把新圖像里的點按照插值的方法映射到原圖像,為了以后特征提取方便,進行BP網絡訓練時縮短訓練時間,高和寬不宜設置過大。這里取高為m寬為n。模式識別.特征提取經過預處理,把原來大小不同、分布不規律的各字符變成大小一樣、排列整齊的字符。下面要從預處理完的字符中提取最能體現這一個字符的特征向量,將提取出的訓練樣本中的特征向量代入BP網絡中就可以對BP網絡進行訓練。提取出待識別的樣本中特征向量代入訓練好的BP網絡中就可以進行識別。在這里采取逐像素特征提取法,方法是對圖像進行逐行逐列掃描

9、,當遇到黑色像素時,取其特征值為1,當遇到白色像素時,取其特征值為0。這樣掃描結束后就形成一個維數與圖像中像素點的個數相同的特征向量矩陣。.BP神經網絡BP算法的多層感知器采用BP算法的多層感知器是至今為止應用最廣泛的神經網絡,在多層感知器的應用中,一般習慣將單隱層感知器稱為三層感知器,所謂三層包括了輸入層、隱層和輸出層。三層BP神經網絡如圖2所示。圖2三層BP網,隱層輸出向量為三層感知器中,輸入向量為=(1*八*;1|,輸出層輸出向量為=時宀小汐,期百度文庫-好好學習,天天向上百度文庫-好好學習,天天向上望輸出向量為7輸入層到輸出層的權值為鞋丨1-,隱藏層到輸出層的權值矩陣為卅=(比WW,北

10、),各層之間的信號關系如下:對輸出層有:5=山叫)頊5=工2對隱藏層有:上式中,變換函數f(x)均為單極性sigmoid函數心777F(x)具有連續可導的特點,以上共同構成三層感知器的數學模型算法過程初始化對權值矩陣w、V賦隨機數,將樣本模式計數器p和訓練次數計數器q置為1,誤差E置0,學習率n設為o1內的小數,網絡訓練后達到的精度|血設為一個正的小數。輸入訓練樣本對,計算各層輸出用當前樣本對X,d序列賦值=2心上=12“占=八心,i=12沖3)計算網絡輸出誤差設共有P對訓練樣本,網絡對于不同的樣本具有不同的誤差采用均方根誤差作為總誤差:(4)計算各層誤差信號=(各:*)兒(1-打)/-I(5

11、)調整各層權值在阿二祠廠=-s)0-耳)七7=眄、=應?E)打(1-兒)形X=|6)檢查是否對所有樣本完成一次輪訓若p,P,計數器p、q增1,返回步驟(2),否則轉步驟(7)。7)檢查網絡總誤差是否達到精度要求BP學習算法的流程如圖3所示。百度文庫-好好學習,天天向上百度文庫-好好學習,天天向上- - 圖3BP學習算法的流程圖神經網絡設計與訓練神經網絡的設計方法按照BP神經網絡設計方法選用兩層BP網絡。采用newff函數來建立BP網絡。其輸入節點數為16X16=256,隱層傳輸函數為Sigmoid函數。假設用一個輸出節點表示10個數字,則輸出層傳輸函數為pureline,隱層節點數為1256+

12、1+a(a=110),取25。神經網絡仿真程序設計構造訓練樣本集,并構成訓練所需的輸入向量P和目標向量t.通過畫圖工具獲得數字。本例構造了新宋體12號、8號字體各10個,黑體12號、8號各10個,及宋體加粗18號字體。神經網絡測試。由于圖像處理的復雜性,對于不同噪聲的污染選擇不同的方法,選擇沒有噪聲的數字進行測試。選擇訓練樣本中的任意數據進行測試,結構非常正確。選擇生成的新宋體8號大小的數字進行測試。結果正確,選擇其他類型的字體進行測試,則結果不是完全正確。仿真實驗的結果簡單起見,只對含有單獨數字的圖片樣本進行識別,不涉及分割字符等前期處理。使用BP網絡進行數字識別的流程如下:首先利用大量的訓

13、練樣本來訓練網絡,以得到以文件形式保存的權值。訓練樣本為精心選擇的可以很好地反映樣本可分特性的已知數據。將訓練樣本圖片進行特征提取后,就可以送入BP網絡進行訓練。其次,訓練完BP網絡后就可以用它對未知數據進行識別了。首先要經過預處理,然后進行特征提取,最后送入BP網絡直至得出結果。數字識別效果如圖4、5、6所示。Figure1匚|冋反RFigure2回區FiEcInsToRedWineHe勺原始數字圖像FiEcVi葉ToDeslWin淫nsh-b數字識別結果(a=0)0圖4數字0的識別效果原始數字圖像廠WFigure12口叵FiEViMToDeslWinM四nat圖5數字4的識別效果圖6數字9

14、的識別效果總結數字識別是多年來的研究熱點,將神經網絡應用于數字識別是神經網絡應用最為成功的方面之一,人工神經網絡在模式識別問題上,相比其他傳統方法有其優勢:要求對問題的了解較少;可以對特征空間進行較復雜的劃分;適用于高速并行處理系統來實現。本課題結合神經網絡技術,對數字識別問題進行了探討和研究,主要研究成果如下:(1)針對數字數據,首先進行了灰度化、二值化、平滑去噪、歸一化、細化等常規預處理,然后對處理完的數字圖像進行特征提取,提取了能體現字符特點的特征向量。(2)針對數字識別問題,研究了BP神經網絡分類器的建立和識別過程。仿真結果表明,對于字體和字號與訓練樣本集相同的測試樣本,無論圖像中的數字在什么位置,都可以識別出來,而對于字體和字號與訓練樣本集不同的測試樣本,只有一部分能正確識別。并且對于帶有噪聲的數字,運行程序的實驗結果是不理想的,所以本課題程序有待于進一步的整理和調試。為提高識別率,可以增加訓練樣本,或通過增加字體的特征向量等途徑來解決。參考文獻李望晨.BP神經網絡改進及其在手寫數字識別中的應用第3-4頁哈爾濱工業大學碩士學位論文,劉長安.人工神經網絡的研究方法及應用電子工業出版社出版,等.阮秋崎等譯數字圖像處理電子工業出版社出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論