




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、CN4321258/TP ISSN10072130X 計算機工程與科學COMPU TER EN GIN EERIN G&SCIENCE2010年第32卷第5期Vol132,No15,2010基于擴展卡爾曼粒子濾波算法的神經網絡訓練Neural Netwo rk Training Based o nt he Extended Kalman Particle Filter王法勝,郭權WANG F a2sheng,GU O Q u an(大連東軟信息學院計算機科學與技術系,遼寧大連116023(Deptartment of Computer Science and T echnology,D
2、alian N eusoft Institute of I nform ation,Dalian116023,China摘要:神經網絡的訓練是一種非線性系統的辨識問題,基本粒子濾波算法已被成功用于訓練神經網絡,但基本粒子濾波算法在建議分布的選擇上并沒有考慮當前時刻觀測值的影響,本文針對該問題提出使用擴展卡爾曼濾波器來生成建議分布。由于擴展卡爾曼濾波器在傳遞近似建議分布的均值和協方差的過程中充分利用了觀測值信息,從而可以更好地描述神經網絡權值的后驗概率分布。實驗結果證明,使用擴展卡爾曼濾波器作為建議分布的粒子濾波算法性能明顯優于基本粒子濾波算法。Abstract:Training neural
3、networks can be viewed as an identification problem for a nonlinear dynamic system.The ge2 neric particle filter has been applied with success to neural network training,but the proposal distribution chosen by the ge2 neric particle filter does not incorporate the latest observations which can deter
4、iorate the performance of the algorithm.In this paper,we propose to use the extended Kalman filter to generate proposal distribution in the particle filtering f rame2 work.The extended Kalman filter can make efficient use of the latest observations,and the generated proposal distribution can approxi
5、mate the posterior distribution of neural network weights much better,which consequently improve the perform2 ance of the particle filter.The experimental results show that the proposed particle filter outperforms the generic particle fil2 ter.關鍵詞:多層感知器;神經網絡訓練;擴展卡爾曼粒子濾波K ey w ords:multilayer percept
6、ron;neural network training;extended Kalman particle filter中圖分類號:TP183文獻標識碼:A1引言多層感知器(Multilayer Perceptrons是應用較為廣泛的一種人工神經網絡結構。在多數實際應用中,一般采用BP算法來訓練神經網絡。盡管BP算法對于小型網絡以及規模相對簡單的問題能夠取得較好的效果,但對于復雜問題收斂性能非常差。為了克服BP算法的缺陷,研究者提出了很多改進方法,比如引入變步長、加入動量項等等。Singhal S和Wu L1提出將多層感知器的訓練看作非線性動態系統的辨識問題,使用狀態空間法建立模型,并應用擴展卡
7、爾曼濾波算法(Extended Kalman Filter,簡稱EKF來進行訓練。實驗結果表明,與傳統的BP算法相比,EKF訓練算法的收斂性能明顯優于BP算法。這一研究成果受到許多研究者的重視。EKF算法基于局部線性化方法,針對輸出方程,將其展開成一階泰勒展式,然后使用卡爾曼濾波方程估計神經網絡權值。然而,EKF算法對輸出方程進行局部線性化的過程中常常會丟失一些重要的信息,對于非線性輸出模型而言,使用E KF進行線性化以后得到的分布不能很好地逼近真實843收稿日期:2009209203;修訂日期:2009212206基金項目:國家863計劃資助項目(2006AA01A124作者簡介:王法勝(1
8、983-,男,山東臨沂人,碩士,講師,研究方向為智能信息處理;郭權,博士,教授,研究方向為人工智能和網絡安全。通訊地址:116023遼寧省大連市軟件園路8號大連東軟信息學院計算機系A32220;Tel:133*;E2mail:wangfashengneusoft. Address:Deptart ment of Computer Science,Dalian Neusoft Institute of Information,8Ruanjianyuan Rd,Dalian,Liaoning116023,P.R. China的非線性系統分布。為解決EKF 算法存在的問題,Freitas 等人2提出
9、使用SIR 算法(Sequential Importance Sam 2pling 2Resampling ,簡稱SIR 對神經網絡進行序貫訓練(Se 2quential Training 。SIR 算法,即粒子濾波算法,是近年來新興的一種解決非線性濾波問題的方法,其基本思想是用一個帶有權重(也稱重要性比率的樣本粒子集合來逼近感興趣的概率分布。Freitas 等人率先提出使用該算法對神經網絡進行訓練,并在實驗中證明其性能要優于EKF 訓練算法,這主要是由于粒子濾波算法能夠更好地逼近真實的神經網絡權值的概率分布。但是,SIR 算法卻存在嚴重的退化問題,即經過若干次迭代以后,僅有極少數粒子的權重能
10、夠對逼近概率分布產生重要影響,大多數粒子權重小到可以忽略不計的程度。退化現象嚴重影響粒子濾波算法的性能3。有效減少退化現象影響的方法之一是選擇一個好的建議分布來產生樣本粒子4。一種比較好的選擇方法是,將后驗概率密度近似為高斯分布,這樣只要得到了均值和協方差,就可以構造該高斯分布,以該高斯分布為建議分布,從中抽取樣本粒子。本文以該思想為基礎,使用EKF 算法來構造近似高斯后驗概率密度函數,以此產生擴展卡爾曼粒子濾波算法,并應用該算法訓練多層感知器網絡,在實驗中與SIR 算法對比,驗證了算法的訓練性能。2粒子濾波算法2.1神經網絡的狀態空間模型首先,使用狀態空間表示法為神經網絡建模,以描述神經網絡
11、隨時間變化的過程。使用一個狀態遷移方程描述神經網絡權值的變化,一個測量方程描述某一具體物理過程的輸入和輸出之間的非線性關系,方程如下:w k+1=w k +d k (1y k =g (w k ,x k +v k(2其中,y k R o 表示輸出測量,x k R d 表示輸入測量,w kR m 表示神經網絡的權值。非線性測量函數g (使用一個多層感知器來近似。假設系統測量噪聲v k 為0均值高斯噪聲,協方差為R 。假設第k +1時刻的網絡權值依賴于k 時刻的網絡權值以及系統隨機過程噪聲d k 。過程噪聲可用來描述系統參數變化的不確定性、系統建模誤差或者未知的輸入量,如目標機動等。假設過程噪聲為0
12、均值高斯噪聲,協方差為Q 。2.2粒子濾波算法粒子濾波算法的基本思想是使用一個帶權粒子集合來逼近在推理過程中需要進行的積分運算,這些粒子取自于神經網絡權值的后驗概率密度函數p (w 0:k |y 1:k 。后驗概率密度可近似為:p (w 0:k |y 1:k =Ni =1q ik(w 0:k (w 0:k -w i 0:k (3其中,w i0:k 表示用來近似后驗概率密度函數的粒子;(為delta 函數;N s 表示使用的粒子數目,粒子w i0:k 從后驗概率密度函數中抽取;q k (w 0:k 為粒子的重要性比率。在實際應用中,直接從后驗概率密度中抽取樣本粒子是很難做到的。因此,有學者提出從
13、一個已知的概率分布密度,即建議分布密度(w 0:k |y 1:k 中抽取樣本粒子,使用這些粒子來近似后驗概率密度4。引入建議分布以后,粒子的重要性比率q k (w 0:k 可以通過下式遞歸計算得到:q k =q k-1p (y k |w k p (w k |w k-1(w k |w 0:k-1,y 1:k (4上式為我們提供了一種遞歸更新粒子重要性比率的機制。再采樣技術可以有效減少退化現象的影響,它的基本思想是去除重要性比率低的粒子,復制重要性比率高的粒子,再采樣之后得到的粒子集合中,每一個粒子的重要性比率均為1/N s 。關于再采樣方法的內容,請參考文獻4。文獻2,4給出了詳細的SIR 粒子
14、濾波算法。SIR 粒子濾波算法中建議分布函數選擇的是先驗概率密度轉移函數p (w k |w k-1,但先驗概率密度轉移函數只考慮了上一時刻神經網絡權值w k-1對當前時刻神經網絡權值的影響,忽視了當前時刻觀測值y k 對估計網絡權值的作用。為解決這個問題,本文使用高斯近似方法,將網絡權值的后驗概率密度函數近似為高斯函數,然后使用EKF 來估計高斯函數的參數,這樣在估計過程中,EKF 融合了當前時刻觀測值的影響,從而可以提高估計精度。3擴展卡爾曼粒子濾波神經網絡訓練算法擴展卡爾曼粒子濾波算法(Extended Kalman Particle Filter ,簡稱EKPF 是由Doucet 3等人
15、提出的。本文將在神經網絡訓練背景下詳細介紹EKPF 算法。將后驗概率密度函數近似為高斯密度函數,使用均值和方差即可描述該高斯函數。p (w 0:k |y 1:k p N (w 0:k |y 1:k =N ( w k ,P k (5因此,我們只需要遞歸地計算權值的均值和相應的協方差即可,將近似高斯分布向前傳遞。在粒子濾波算法的框架內,對每一個粒子,使用EKF 產生并傳遞近似高斯的建議分布,即:q (w i t |w i0:k-1,y 1:k =N ( wi k ,P i k ,i =1,N s (6在時刻k -1,根據最新的觀測值信息,使用EKF 方程計算每一個粒子的均值和協方差的估計,然后從構
16、成的近似建議分布中抽取第i 個粒子,該過程遞歸進行下去。假設在k -1時刻,已經得到樣本粒子集合w i0:k-1,q i k-1N s i =1來近似表示k -1時刻的后驗概率密度函數,在k 時刻,首先根據方程(1計算該時刻的預測狀態和預測協方差:w i k|k-1=w i k-1(7P i k|k-1=F i k P i ,T k-1F i ,Tk+G i k Q k G i ,T k (8計算卡爾曼增益:K k =P i k|k-1H i ,T k U i k R k U i ,T k +H i k P k|k-1i H i ,T k -1(9k 時刻觀測值y k 到來,根據該時刻的觀測值
17、和計算的卡爾曼增益,更新前面計算的均值和協方差的預測值:w i k = w i k|k-1+K k (y k -g ( w i k|k-1,x k (10P i k =P i k|k-1-K k H i k P i k|k-1(11這樣就得到了k 時刻的均值和協方差估計,進而可以得到近似的高斯建議分布N ( w i k ,P i k ,從中抽取粒子w i k 94N( w i k,P i k。EKPF算法步驟總結如下:步驟1初始化網絡權值(k=0時刻:FOR i=1,N s,從網絡第一層先驗分布p1(w0和第二層先驗分布p2(w0中抽取粒子w i0;計算重要性比率:q i0=p(y0|w i0
18、;歸一化重要性比率:q i0=q i0N s j=1q j0步驟2FOR k=1,2,(1采樣階段:FOR i=1,N s計算雅克比矩陣F i k&G i k和H i k&U i k;使用E KF方程更新粒子得到均值和協方差估計量 w i k和P i k;抽取粒子w i kN( w i k,P i k;根據方程(4計算重要性比率;歸一化重要性比率:q i k+1=q i k+1N s j=1q j k+1(2再采樣階段:去除重要性比率較小的粒子,同時復制重要性比率較大的粒子,得到N s個隨機粒子w i k+1,為每個粒子分配大小相同的重要性比率,q i k+1=1/N s。4實
19、驗本節將通過實驗驗證EKPF算法的性能。在實驗中,輸入輸出數據由下列非線性非平穩狀態空間模型產生:x k+1=0.5x k+25x k(1+x k2+8cos(1.2k+process_noise(12y k=x2k20+60.05(k-1+3+measurement_noise(13實驗中,使用一個多層感知器來逼近這些數據,該多層感知器網絡為三層前饋網絡,隱層神經元數為10個,輸出層為1個線性神經元。多層感知器的訓練中使用SIR粒子濾波算法和EKPF算法。粒子濾波算法的粒子數目N s為50個。表1所示為兩種算法的一步預測平均誤差及運行時間對比,實驗進行100次,獨立運行,每一次運行120個時
20、刻。從表中可以看出,EKPF訓練算法的一步預測誤差約為4. 58,低于SIR訓練算法的6.76;在運行時間方面,SIR為115s,EKPF為118s,相差不大,EKPF算法訓練運行時間稍高于SIR算法。表1平均一步預測誤差對比算法RMS error Time(sSIR 6.76115EKPF 4.58118圖1所示為某一次運行中,E KPF算法和SIR算法訓練感知器對輸出的預測誤差曲線。從圖1中可以看出,EKPF算法明顯優于SIR算法。圖1兩種算法的一步預測值與真實值對比曲線5結束語本文提出一種新型的神經網絡訓練算法,即EKPF算法。在粒子濾波算法框架內,使用EKF算法傳播近似高斯建議分布,有效利用觀測值提供的信息,從而可以更好地描述神經網絡權值的分布函數。本算法不僅可用于多層前饋網絡,也可用于遞歸神經網絡、徑向基函數神經網絡等.參考文獻:1Singhal
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國鐵觀音茶市場調查研究報告
- 法學概論考試復習的心理準備試題及答案
- 2025年中國豪華鋁合金球形支架市場調查研究報告
- 2025年中國螺桿空氣壓縮機專用油市場調查研究報告
- 河湖整治面試題及答案
- 初中生化試題及答案
- 江西試題及答案
- 籃協培訓考試題及答案
- 競賽規程試題及答案
- 網絡管理員考試應試策略和試題及答案
- 珠寶首飾加工工藝介紹課件
- 《電業安全工作規程》
- 處置室工作制度(6篇)
- 二次配線工藝標準守則
- 骨髓穿刺術評分表
- 海底撈火鍋店各崗位職責
- 發證機關所在地區代碼表
- 車輛安全設施設備定期檢查臺賬
- Q∕GDW 10799.7-2020 國家電網有限公司電力安全工作規程 第7部分:調相機部分
- 田中靖久頸椎病癥狀量表20分法
- 人教版小學五年級數學競賽試題及答案
評論
0/150
提交評論