




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第第3章章 人工神經元網絡控制論人工神經元網絡控制論控制基礎控制基礎智能控制基礎智能控制基礎2/683.1 引言引言3.2 前向神經網絡模型前向神經網絡模型3.6 神經網絡控制基礎神經網絡控制基礎3.7 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識3.8 神經網絡控制的學習機制神經網絡控制的學習機制3.9 神經網絡控制器的設計神經網絡控制器的設計3.3 動態神經網絡模型動態神經網絡模型 3.10 單一神經元控制法單一神經元控制法目錄目錄3/683.6.1 引言引言v神經網絡控制的優越性神經網絡控制的優越性v神經網絡控制器的分類神經網絡控制器的分類v神經網絡的逼近能力神經網絡的逼近能
2、力神經網絡是一種具有高度神經網絡是一種具有高度非線性非線性的連續時間動力系統,的連續時間動力系統,它有著很強的它有著很強的自學習自學習功能和對非線性系統的強大映射功能和對非線性系統的強大映射能力,已廣泛應用于復雜對象的控制中。神經網絡所能力,已廣泛應用于復雜對象的控制中。神經網絡所具有的大規模并行性、冗余性、容錯性、本質的非線具有的大規模并行性、冗余性、容錯性、本質的非線性及自組織、自學習、自適應能力,給不斷面臨挑戰性及自組織、自學習、自適應能力,給不斷面臨挑戰的控制理論帶來生機。的控制理論帶來生機。4/68神經網絡控制的優越性神經網絡控制的優越性 1神經網絡可以處理那些難以用模型或規則描述的
3、過程或系統難以用模型或規則描述的過程或系統2神經網絡采用并行分布式信息處理并行分布式信息處理,具有很強的容錯性。 3神經網絡是本質的非線性系統非線性系統,可以實現任意非線性映射。4很強的信息綜合能信息綜合能力,能夠同時處理大量不同類型的輸入,能夠很好地解決輸入信息之間的互補性和冗余性問題;5神經網絡的硬件實現愈趨方便硬件實現愈趨方便,大規模集成電路技術的發展為神經網絡的硬件實現提供了技術手段研究重點研究重點5/68 v 神經網絡神經網絡的的穩定性與收斂性穩定性與收斂性問題;問題;v神經網絡神經網絡控制系統的穩定性與收斂性問題控制系統的穩定性與收斂性問題;v 神經網絡學習算法的神經網絡學習算法的
4、實時性實時性;v 神經網絡神經網絡控制器和辨識器控制器和辨識器的模型和結構;的模型和結構;6/68v 根據神經網絡在控制器中的作用不同,神經網根據神經網絡在控制器中的作用不同,神經網絡控制器可分為兩類,一類為絡控制器可分為兩類,一類為神經控制神經控制,它是以,它是以神經網絡為基礎而形成的獨立智能控制系統;另神經網絡為基礎而形成的獨立智能控制系統;另一類為一類為混合神經網絡控制混合神經網絡控制,它是指利用神經網絡,它是指利用神經網絡學習和優化能力來改善傳統控制的智能控制方法,學習和優化能力來改善傳統控制的智能控制方法,如自適應神經網絡控制等。如自適應神經網絡控制等。v 綜合目前的各種分類方法,可
5、將神經網絡控制綜合目前的各種分類方法,可將神經網絡控制的結構歸結為以下六類。的結構歸結為以下六類。神經網絡控制器的分類神經網絡控制器的分類 7/68神經網絡控制器的分類神經網絡控制器的分類 逆控制器逆控制器 自適應網絡控制器自適應網絡控制器 前饋控制結構前饋控制結構 自適應評價網絡自適應評價網絡 混合控制系統混合控制系統 神經網絡控制器8/68(1) 導師指導下的控制器導師指導下的控制器XUY專家經驗控制器動力學系統動力學系統神經網絡UYX利用專家經驗圖3-2-1 導師指導下的神經控制結構圖動力學系統神經網絡YYUd動力學系統UYYdF-1Y=FU圖3-2-2 逆控制器的結構圖網絡控制器N神經
6、網絡N參考模型非線性系統ryecipmceecpyyiu+-圖3-2-3自適應網絡控制結構圖v學習樣本取自于專家經驗學習樣本取自于專家經驗v輸入來自傳感器,輸出為控制信號輸入來自傳感器,輸出為控制信號v缺點是靜態過程缺乏在線學習機制缺點是靜態過程缺乏在線學習機制 系統為根據視覺信息對機械手臂進行控系統為根據視覺信息對機械手臂進行控制,使其能夠準確地對不規則形狀物體進制,使其能夠準確地對不規則形狀物體進行抓舉。行抓舉。v系統組成:系統組成:v(1)神經網絡控制器)神經網絡控制器NC為一塊嵌入式為一塊嵌入式DSP處處理器,神經網絡算法根據上述原理由程序實現理器,神經網絡算法根據上述原理由程序實現。
7、v(2)對象)對象P為被控對象機械臂,其各關節驅動為被控對象機械臂,其各關節驅動電機的信號線與電機的信號線與NC輸出端相連,作為神經網絡輸出端相連,作為神經網絡的輸出。的輸出。(1) 導師指導下的控制器導師指導下的控制器v(3)系統的輸入為機器視覺信息經轉化后的數)系統的輸入為機器視覺信息經轉化后的數字信號(多維),其中包含了物體的位置和形字信號(多維),其中包含了物體的位置和形狀信息;輸出為機械臂各部分的位置電信號及狀信息;輸出為機械臂各部分的位置電信號及傳感器信號(多維)。傳感器信號(多維)。v(4)NC包含訓練引腳,其與有人手控制的機包含訓練引腳,其與有人手控制的機械臂的驅動信號相連。該
8、信號作為以人為導師械臂的驅動信號相連。該信號作為以人為導師的導師值訓練信號。的導師值訓練信號。(1) 導師指導下的控制器導師指導下的控制器(1) 導師指導下的控制器導師指導下的控制器12/68(2) 逆控制器逆控制器 XUY專家經驗控制器動力學系統動力學系統神經網絡UYX利用專家經驗圖3-2-1 導師指導下的神經控制結構圖動力學系統神經網絡YYUd動力學系統UYYdF-1Y=FU圖3-2-2 逆控制器的結構圖網絡控制器N神經網絡N參考模型非線性系統ryecipmceecpyyiu+-圖3-2-3自適應網絡控制結構圖v神經網絡的訓練目的是逼近系統的神經網絡的訓練目的是逼近系統的逆動力學模型逆動力
9、學模型,Yd期望輸出作為神經網絡輸入期望輸出作為神經網絡輸入v以便使期望輸出與對象實際輸出之間的傳遞函數以便使期望輸出與對象實際輸出之間的傳遞函數為為1,則被控對象的輸出為期望輸出。,則被控對象的輸出為期望輸出。13/68(3) 自適應網絡控制器自適應網絡控制器 v模型參考自適應網絡控制器模型參考自適應網絡控制器 XUY專家經驗控制器動力學系統動力學系統神經網絡UYX利用專家經驗圖3-2-1 導師指導下的神經控制結構圖動力學系統神經網絡YYUd動力學系統UYYdF-1Y=FU圖3-2-2 逆控制器的結構圖網絡控制器N神經網絡N參考模型非線性系統ryecipmceecpyyiu+-圖3-2-3自
10、適應網絡控制結構圖v利用神經網絡代替線性系統中的線性處理單元利用神經網絡代替線性系統中的線性處理單元v控制誤差反饋到控制器進行修改使誤差最小控制誤差反饋到控制器進行修改使誤差最小14/68(4) 前饋控制結構前饋控制結構v基于魯棒性問題提出基于魯棒性問題提出v反饋的目的在于提高抗隨機擾動的能力反饋的目的在于提高抗隨機擾動的能力v非線性成分由網絡控制器完成非線性成分由網絡控制器完成v難點是如何在系統模型未知條件下找到有效的學難點是如何在系統模型未知條件下找到有效的學習方法習方法15/68(4) 前饋控制結構前饋控制結構16/68(4) 前饋控制結構前饋控制結構17/68(4) 前饋控制結構前饋控
11、制結構18/68(4) 前饋控制結構前饋控制結構19/68(4) 前饋控制結構前饋控制結構20/68(4) 前饋控制結構前饋控制結構 (5) 神經網絡自適應評價控制神經網絡自適應評價控制 通常由兩個單元組成:搜索單元和自適應評價單元。通常由兩個單元組成:搜索單元和自適應評價單元。自適應評判網絡通過不斷的獎勵、懲罰等再勵學習,使自適應評判網絡通過不斷的獎勵、懲罰等再勵學習,使自己逐漸成為一個合格的自己逐漸成為一個合格的“教師教師”,學習完成后,根據,學習完成后,根據系統目前的狀態和外部激勵反饋信號產生一個內部再勵系統目前的狀態和外部激勵反饋信號產生一個內部再勵信號,以對目前的控制效果作出評價。信
12、號,以對目前的控制效果作出評價。 (6) 神經網絡混合控制神經網絡混合控制 該控制方法是集成人工智能各分支的優點,由神該控制方法是集成人工智能各分支的優點,由神經網絡技術與模糊控制、專家系統等相結合而形成的經網絡技術與模糊控制、專家系統等相結合而形成的一種具有很強學習能力的智能控制系統。一種具有很強學習能力的智能控制系統。 由神經網絡和模糊控制相結合構成模糊神經網絡,由神經網絡和模糊控制相結合構成模糊神經網絡,由神經網絡和專家系統相結合構成神經網絡專家系統。由神經網絡和專家系統相結合構成神經網絡專家系統。神經網絡混合控制可使控制系統同時具有學習、推理神經網絡混合控制可使控制系統同時具有學習、推
13、理和決策能力。和決策能力。 23/683.6.2 神經網絡的逼近能力神經網絡的逼近能力 v相關結論:相關結論:含含一個隱層以上一個隱層以上的多層前向傳播神經網絡不的多層前向傳播神經網絡不僅可以以僅可以以任意精度任意精度逼近逼近連續函數本身連續函數本身,還可,還可以逼近函數的以逼近函數的導數項導數項。 24/683.1 引言引言3.2 前向神經網絡模型前向神經網絡模型3.6 神經網絡控制基礎神經網絡控制基礎3.7 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識3.8 神經網絡控制的學習機制神經網絡控制的學習機制3.9 神經網絡控制器的設計神經網絡控制器的設計3.3 動態神經網絡模型動態
14、神經網絡模型 3.10 單一神經元控制法單一神經元控制法目錄目錄25/683.7.1 辨識基礎辨識基礎3.7.2 神經網絡辨識模型的結構神經網絡辨識模型的結構 3.7.3 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識3.7 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識 26/68vL.A.Zadeh曾經下過這樣的定義:曾經下過這樣的定義:“辨識是辨識是在輸入和輸出數據的基礎上,從一組給定的在輸入和輸出數據的基礎上,從一組給定的模型中,確定一個與所測系統等價的模型模型中,確定一個與所測系統等價的模型”。v使用非線性系統的輸入輸出數據來訓練神經使用非線性系統的輸入輸出數據來
15、訓練神經網絡可認為是網絡可認為是非線性函數的逼近問題非線性函數的逼近問題。v多層前向傳播網絡能夠逼近任意多層前向傳播網絡能夠逼近任意L2非線性函非線性函數。數。(雙隱層比單隱層具有更高的逼近精度)(雙隱層比單隱層具有更高的逼近精度)3.7.1辨識基礎辨識基礎v輸入輸出數據輸入輸出數據能夠測量到的輸入輸出能夠測量到的輸入輸出v模型類模型類系統的結構系統的結構 v等價準則等價準則辨識的優化目標辨識的優化目標27/68辨識的基本要素辨識的基本要素v模型的選擇模型的選擇 隱含層數和節點數的選擇隱含層數和節點數的選擇多次仿真實驗多次仿真實驗得到(兼顧精確性和復雜性)得到(兼顧精確性和復雜性)v輸入信號的
16、選擇輸入信號的選擇 時域:激勵系統的所有模態時域:激勵系統的所有模態 頻域:足以覆蓋系統的頻譜(白噪聲或偽隨頻域:足以覆蓋系統的頻譜(白噪聲或偽隨機信號)機信號)v誤差準則的選擇誤差準則的選擇 28/68k)k( e (f)W(E)k(e)k( e 神經網絡辨識的特點神經網絡辨識的特點v不要求建立實際系統的辨識格式不要求建立實際系統的辨識格式v可以對本質非線性系統進行辨識,非算法式可以對本質非線性系統進行辨識,非算法式v收斂速度不依賴于待辨識系統的維數,只與收斂速度不依賴于待辨識系統的維數,只與神經網絡本身即其學習算法有關神經網絡本身即其學習算法有關v權值在辨識中對應于的模型參數權值在辨識中對
17、應于的模型參數v可以用于在線控制可以用于在線控制29/30/683.7.1 辨識基礎辨識基礎3.7.2 神經網絡辨識模型的結構神經網絡辨識模型的結構 3.7.3 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識3.7 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識 31/683.7.2 神經網絡辨識模型的結構神經網絡辨識模型的結構 逆模型法逆模型法 前向建模法前向建模法32/68前向建模法前向建模法v所謂前向建模法是利用神經網絡來逼近非線所謂前向建模法是利用神經網絡來逼近非線性系統的前向動力學模型性系統的前向動力學模型 。v 動態系統的建模:一個辦法是對神經網絡本身引入動態動
18、態系統的建模:一個辦法是對神經網絡本身引入動態環節,如動態回歸網絡和動態神經元模型。環節,如動態回歸網絡和動態神經元模型。v 另一個辦法是將輸入輸出的另一個辦法是將輸入輸出的滯后信號滯后信號加到多層前向網絡加到多層前向網絡中形成動態關系。中形成動態關系。前向建模法前向建模法33/68 1)m-u(ku(k),.,1),n-y(k(y(k),.,f1)(kyN34/68逆模型法逆模型法v直接法:直接法:v 待辨識系統的輸出作為神經網絡的輸入,神經網絡的輸待辨識系統的輸出作為神經網絡的輸入,神經網絡的輸出與動態系統的輸入進行比較,相應的輸入誤差用來訓出與動態系統的輸入進行比較,相應的輸入誤差用來訓
19、練神經網絡練神經網絡35/68存在的問題存在的問題v存在的問題存在的問題n學習過程不一定是目標最優的。 (學習樣本)n一旦非線性系統對應關系不是一對一的,那么不準確的逆模型可能會被建立。 v克服方法克服方法增加使用已建模的神經網絡正向模型增加使用已建模的神經網絡正向模型36/683.7.1 辨識基礎辨識基礎3.7.2 神經網絡辨識模型的結構神經網絡辨識模型的結構 3.7.3 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識3.7 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識v前向神經網絡具有良好的學習性能前向神經網絡
20、具有良好的學習性能v利用利用靜態靜態神經網絡描述神經網絡描述動態動態系統系統v誤差反向傳播是一般誤差反向傳播是一般BP學習算法的精髓學習算法的精髓v動態反向傳播的關鍵是找到反映該動態過程動態反向傳播的關鍵是找到反映該動態過程的關系式的關系式v帶時滯的多層感知器網絡帶時滯的多層感知器網絡+動態誤差反向回動態誤差反向回歸學習算法歸學習算法37/38/68并行結構并行結構)1(),.,1(),(),1( ),.,1( ),( ) 1( mkukukunkykykyNky串行結構串行結構)1(),.,1(),(),1(),.,1(),() 1( mkukukunkykykyNky串行結構更穩定根據可分
21、離性和線性性,有4種結構。辨識的兩種結構辨識的兩種結構39/68含線性部分的辨識問題(模型含線性部分的辨識問題(模型1、2)模型模型1)1mk(u),.,1k(u),k(ug) ik(y) 1k(y1n0ii模型模型2) ik(u)1nk(y),.,1k(y),k(y f) 1k(40/68線性部分的參數已知線性部分的參數已知 41/68線性部分的參數未知線性部分的參數未知 42/68線性部分學習方法線性部分學習方法v最小二乘法最小二乘法v其中其中v初始條件完全未知時,可取初始條件完全未知時,可取)( ) 1() 1()(1()( ) 1( 2lllylKllT)()1() 1() 1(lPl
22、lKIlPT1)1()() 1() 1()1()() 1(llPllllPlKTIP)0(; 0)0( )1(),.,1(),() 1(43/68非線性部分學習方法非線性部分學習方法vBP學習學習) l (wo) l (w) 1l (wjipipjjijiLayerHidden)Net()w(LayerOutput)Net()ot (44/68例例38v考慮以下模型:考慮以下模型:y(k+1)=ay(k)+by(k-1)+g(u)其中其中a=0.3,b=0.6g(u)=u3+0.3u2-0.4uv試辨識該系統試辨識該系統45/68解解v線性部分,采用遞推最小二乘學習法線性部分,采用遞推最小二乘
23、學習法v非線性部分采用前向傳播多層神經網絡來逼非線性部分采用前向傳播多層神經網絡來逼近。近。選擇神經網絡結構為選擇神經網絡結構為)l () 1l () 1l (y)(1l (K) l () 1l (T21T)1l () l (P) 1l () 1l ()1l () l (P) 1l (K) l (P)1l () 1l (KI ) 1l (PT00ba)0(100010)0( ,1,8,4,1 0 ,46/68辨識效果辨識效果v校驗輸入信號校驗輸入信號 :100.2 , 1 , 01002sin)(47/68非線性可分離系統(模型非線性可分離系統(模型3))1(),.,1(),()1(),.,1
24、(),() 1(48/68BP學習學習pjLpjpjLpjLpjLpjLpjpjLpjLpjLtoooNettoofNet112111211( )( )( )( )( )( )( )( )()()()pjLpjpjLpjLpjLtoofNet21222( )( )( )( )()()pjrpjrpkrkkjrfNetw1111111( )( )()()()pjrpjrpkrkkjrfNetw2222121( )( )()()()49/68例例3- 9v考慮如下非線性離散系統:考慮如下非線性離散系統:v求:采用雙模型法解決該系統的辨識問題。求:采用雙模型法解決該系統的辨識問題。)()(1)()
25、1(50/68兩種方法的學習曲線兩種方法的學習曲線v單一模型網絡:單一模型網絡:v兩模型網絡:兩模型網絡: 2,20,10,1 2,2,6,51/68兩模型法的辨識效果兩模型法的辨識效果52/683.1 引言引言3.2 前向神經網絡模型前向神經網絡模型3.6 神經網絡控制基礎神經網絡控制基礎3.7 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識3.8 神經網絡控制的學習機制神經網絡控制的學習機制3.9 神經網絡控制器的設計神經網絡控制器的設計3.3 動態神經網絡模型動態神經網絡模型 3.10 單一神經元控制法單一神經元控制法目錄目錄53/683.8 神經網絡控制的學習機制神經網絡控制
26、的學習機制 v神經元控制器的目的在于如何設計一個有效神經元控制器的目的在于如何設計一個有效的神經元網絡去完成代替傳統控制器的作用,的神經元網絡去完成代替傳統控制器的作用,使得系統的輸出跟隨系統的期望輸出。為了使得系統的輸出跟隨系統的期望輸出。為了達到這個目的,神經網絡的學習方法就是尋達到這個目的,神經網絡的學習方法就是尋找一種有效的途徑進行網絡連接權陣或網絡找一種有效的途徑進行網絡連接權陣或網絡結構的修改,從而結構的修改,從而使得網絡控制器輸出的控使得網絡控制器輸出的控制信號能夠保證系統輸出跟隨系統的期望輸制信號能夠保證系統輸出跟隨系統的期望輸出出。 54/68分類分類v3.8.1 監督式學習
27、監督式學習n離線學習法n在線學習法n反饋誤差學習法n多網絡學習法v3.8.2 增強式學習增強式學習55/681. 離線學習法離線學習法 系統的逆模型系統的逆模型樣本空間應盡量遍及整個控制域樣本空間應盡量遍及整個控制域適合適合靜態靜態環境環境56/682. 在線學習法在線學習法 學習只能在期望輸出學習只能在期望輸出yd值域內進行值域內進行適合適合模型已知模型已知的動態環境的動態環境57/68學習方法學習方法v采用最速下降法采用最速下降法)()()()()()()()()()()()()() 1(kwkukukykykykwkwkykykykwwEkwkwjidjijidjijipjiji假設系統
28、的假設系統的Jacobian矩陣已知矩陣已知58/683. 反饋誤差學習法反饋誤差學習法 反饋控制的輸出作為網絡的訓練誤差信號反饋控制的輸出作為網絡的訓練誤差信號反饋控制保持系統穩定并消除誤差;前饋反饋控制保持系統穩定并消除誤差;前饋控制加快速度,并逐漸占主導地位控制加快速度,并逐漸占主導地位適用于非線性系統適用于非線性系統線性絕對占優線性絕對占優條件下的條件下的網絡學習網絡學習 59/684. 多神經網絡學習法多神經網絡學習法1 v前向建模多網絡控制前向建模多網絡控制v建立位置非線性動態系統的前向模型建立位置非線性動態系統的前向模型v利用此前向模型實現利用此前向模型實現誤差反向傳播誤差反向傳
29、播完成網絡完成網絡控制的權陣學習控制的權陣學習 60/68多神經網絡學習法多神經網絡學習法2 v逆模型建模的多網絡控制結構圖逆模型建模的多網絡控制結構圖v建立逆模型建立逆模型vyd為逆模型輸入信號由此產生期望的控制信號為逆模型輸入信號由此產生期望的控制信號udvud與與u比較產生的誤差作為比較產生的誤差作為Nc的學習信號的學習信號 非線性系統神線網絡控制器Nc+-yyu圖3-2-23 前向建模多網絡控制結構圖神經網絡控制器Nc非線性系統+-yyu圖3-2-24 逆模型建模的多網絡控制結構圖神經網絡辨識器NiyM神經網絡逆模型 辨識器Nyu-61/683.8.2 增強式學習增強式學習 v當某些被
30、控系統的導師信號無法獲得時當某些被控系統的導師信號無法獲得時v利用利用當前控制是否成功當前控制是否成功來決定下一次控制該來決定下一次控制該如何走的學習方式。如何走的學習方式。 v修正的辦法是對某一成功的行為進行修正的辦法是對某一成功的行為進行鼓勵鼓勵,而對不成功的行為進行而對不成功的行為進行懲罰懲罰。 v用神經網絡來實現時,用神經網絡來實現時, 則可在權值空間進行則可在權值空間進行調整。調整。62/683.1 引言引言3.2 前向神經網絡模型前向神經網絡模型3.6 神經網絡控制基礎神經網絡控制基礎3.7 非線性動態系統的神經網絡辨識非線性動態系統的神經網絡辨識3.8 神經網絡控制的學習機制神經
31、網絡控制的學習機制3.9 神經網絡控制器的設計神經網絡控制器的設計3.3 動態神經網絡模型動態神經網絡模型 3.10 單一神經元控制法單一神經元控制法目錄目錄63/683.9.1 直接逆模型控制法直接逆模型控制法 3.9.2 直接網絡控制法直接網絡控制法 3.9.3 多網絡自學習控制法多網絡自學習控制法 3.9 神經網絡控制器的設計神經網絡控制器的設計 64/683.9.1 直接逆模型控制法直接逆模型控制法 訓練結構示意圖 逆模型訓練完畢后直接投入控制系統的運行逆模型訓練完畢后直接投入控制系統的運行 65/68直接逆模型控制的結構示意圖直接逆模型控制的結構示意圖 不進行在線學習,運行于靜態參數
32、環境不進行在線學習,運行于靜態參數環境缺乏魯棒性,可在外環增加一個反饋控制缺乏魯棒性,可在外環增加一個反饋控制66/683.9.1 直接逆模型控制法直接逆模型控制法 3.9.2 直接網絡控制法直接網絡控制法 3.9.3 多網絡自學習控制法多網絡自學習控制法 3.9 神經網絡控制器的設計神經網絡控制器的設計 67/683.9.2 直接網絡控制法直接網絡控制法 在網絡的輸入端引入系統的狀態信號在網絡的輸入端引入系統的狀態信號(帶時滯的多層前向網絡)(帶時滯的多層前向網絡)將學習機制(將學習機制(BP算法)實時在線用于網絡控制器的調整算法)實時在線用于網絡控制器的調整68/68例例3-10v考慮被控
33、系統考慮被控系統 假設動力學逆模型成立假設動力學逆模型成立 ,為,為v試用直接網絡控制法控制。試用直接網絡控制法控制。n=3,m=2y ky k y ky ku ky ku kykyk()( ) () () ()( ()( )()()11211111222 1)-u(k2),-y(k1),-y(ky(k),1),gy(ku(k)69/68解解v構造神經網絡結構為構造神經網絡結構為5,25,12,1。v輸出單元層的神經元的激勵函數為線性單元輸出單元層的神經元的激勵函數為線性單元v其余層的神經元為其余層的神經元為Sigmoid激勵元。激勵元。v取取=0.05v期望輸出為:期望輸出為:ykkkd(
34、)sin. sin21000 70/68學習公式學習公式wkwkoijijpjpi()( )1pjddyky kdy kdu kyky kykyk( )( )( )( )( )( )()()112322pjpjpjpllljoow()1輸出層 隱含層 71/68學習結果學習結果100次次直接網絡控制法遠遠優于直接逆模型控制法直接網絡控制法遠遠優于直接逆模型控制法72/681攝動法 2符號函數法 3前向神經網絡方針模型法(前向建模)4多網絡自學習控制法 ( 逆模型)Jacobian矩陣的替代矩陣的替代當系統未知時,當系統未知時,Jacobian矩陣(矩陣(dy/du)無法直接求得)無法直接求得)
35、/sgn(uyuy /73/683.9.1 直接逆模型控制法直接逆模型控制法 3.9.2 直接網絡控制法直接網絡控制法 3.9.3 多網絡自學習控制法多網絡自學習控制法 3.9 神經網絡控制器的設計神經網絡控制器的設計 74/683.9.3多網絡自學習控制法多網絡自學習控制法v模型未知的情況模型未知的情況v基本思想是利用逆動力學模型和系統的期望基本思想是利用逆動力學模型和系統的期望輸出輸出yd(k+1)去構造一個期望的控制量去構造一個期望的控制量ud(k),從而解決了神經控制器從而解決了神經控制器Nc在系統模型未知情在系統模型未知情況下的學習問題。況下的學習問題。v神經網絡辨識和神經網絡控制神
36、經網絡辨識和神經網絡控制75/68u( k)u ( k)iZZZZ- 1- 1- n+1- m神 經 網 絡辨 識 器 N+Z神 經 網 絡控 制 器 N對 象u( k)y( k+1)y( k+1)d- 1- 1ZZZ- n+1- m圖 3- 2- 35 多 網 絡 自 學 習 控 制 結 構 圖y ( k+1)d+dci多網絡自學習控制法多網絡自學習控制法 神經網絡辨識器精確逼近逆模型才能保證神經網絡辨識器精確逼近逆模型才能保證Nc導師信號的可靠性導師信號的可靠性76/68例例3-11 v考慮非線性系統考慮非線性系統 v求:試用多神經自學習網絡控制方法來設計求:試用多神經自學習網絡控制方法來設計此系統的非線性控制器,要求系統的期望輸此系統的非線性控制器,要求系統的期望輸出為:出為:y ky k y ky ku ky ku kykyk()( ) () () ()( ()( )()()11212111222ykkkd( )sin, ,.21000 77/68解解v假設被控對象的逆動力學模型存在,即有:假設被控對象的逆動力學模型存在,即有:神經網絡辨識器神經網絡辨識器Ni的結構為的結構為;神經網絡控制器神經網絡控制器Nc的網絡結構為的網絡結構為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025園林綠化設計合同范本
- 2025勞動合同協議書范本模板
- 2025企業合同終止的情形分析:合規解除勞動合同的途徑與條件
- 江蘇省鎮江市2024-2025學年高一上學期期中檢測生物試卷 含解析
- 腰椎疼痛康復護理
- 脊柱外科術后護理
- 靜脈留置消毒護理
- 心臟支架術后護理規范
- 【方案】2024咪咕全域營銷媒體手冊6928mb
- 三晉卓越聯盟·2024-2025學年高三5月質量檢測卷(25-X-635C)生物(B)
- 2025-2030年芳綸纖維行業市場深度調研及發展趨勢與投資研究報告
- 船舶股份合伙協議書
- 《傳染病學:新冠病毒》課件
- 圖形的位置(課件)-數學人教版六年級下冊
- 設備購置合同協議書
- 2025年全國保密教育線上培訓考試試題庫附參考答案(完整版)帶答案詳解
- 煙臺科目一試題及答案
- 秸稈買賣協議書模板
- 市場營銷-理論、方法與實訓 第4版 課件 第10章促銷策略
- 焊接工程師考核指南試題及答案
- 濟南市工程咨詢院招聘筆試真題2024
評論
0/150
提交評論