智能控制_09神經網絡控制_第1頁
智能控制_09神經網絡控制_第2頁
智能控制_09神經網絡控制_第3頁
智能控制_09神經網絡控制_第4頁
智能控制_09神經網絡控制_第5頁
已閱讀5頁,還剩102頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第9章 9.1 概述概述 神經網絡是一種具有高度非線性的連續時間動力神經網絡是一種具有高度非線性的連續時間動力系統,它有著很強的自學習功能和對非線性系統的強系統,它有著很強的自學習功能和對非線性系統的強大映射能力,已廣泛應用于復雜對象的控制中。神經大映射能力,已廣泛應用于復雜對象的控制中。神經網絡所具有的大規模并行性、冗余性、容錯性、本質網絡所具有的大規模并行性、冗余性、容錯性、本質的非線性及自組織、自學習、自適應能力,給不斷面的非線性及自組織、自學習、自適應能力,給不斷面臨挑戰的控制理論帶來生機。臨挑戰的控制理論帶來生機。 從控制角度來看,神經網絡用于控制的優越性主要從控制角度來看,神經網絡

2、用于控制的優越性主要表現為:表現為:(1 1)神經網絡可是處理那些難以用模型或規則描述的)神經網絡可是處理那些難以用模型或規則描述的對象;對象;(2)神經網絡采用并行分布式信息處理方式,具有很)神經網絡采用并行分布式信息處理方式,具有很強的容錯性;強的容錯性; (3 3)神經網絡在本質上是非線性系統,可以實現任意)神經網絡在本質上是非線性系統,可以實現任意非線性映射。神經網絡在非線性控制系統中具有很大的非線性映射。神經網絡在非線性控制系統中具有很大的發展前途;發展前途;(4 4)神經網絡具有很強的信息綜合能力,它能夠同時)神經網絡具有很強的信息綜合能力,它能夠同時處理大量不同類型的輸入,能夠很

3、好地解決輸入信息處理大量不同類型的輸入,能夠很好地解決輸入信息之間的互補性和冗余性問題;之間的互補性和冗余性問題;(5 5)神經網絡的硬件實現愈趨方便。大規模集成電路)神經網絡的硬件實現愈趨方便。大規模集成電路技術的發展為神經網絡的硬件實現提供了技術手段,技術的發展為神經網絡的硬件實現提供了技術手段,為神經網絡在控制中的應用開辟了廣闊的前景。為神經網絡在控制中的應用開辟了廣闊的前景。神經網絡控制所取得的進展為:神經網絡控制所取得的進展為:(1) 基于神經網絡的系統辨識:可在已知常規模型結構基于神經網絡的系統辨識:可在已知常規模型結構的情況下,估計模型的參數;或利用神經網絡的線性、的情況下,估計

4、模型的參數;或利用神經網絡的線性、非線性特性,建立線性、非線性系統的靜態、動態、非線性特性,建立線性、非線性系統的靜態、動態、逆動態及預測模型;逆動態及預測模型;(2) 神經網絡控制器:神經網絡作為控制器,可實現對神經網絡控制器:神經網絡作為控制器,可實現對不確定系統或未知系統進行有效的控制,使控制系統不確定系統或未知系統進行有效的控制,使控制系統達到所要求的動態、靜態特性;達到所要求的動態、靜態特性;(3) 神經網絡與其他算法相結合:神經網絡與專家系統、神經網絡與其他算法相結合:神經網絡與專家系統、模糊邏輯、遺傳算法等相結合可構成新型控制器;模糊邏輯、遺傳算法等相結合可構成新型控制器;(4)

5、 優化計算:在常規控制系統的設計中,常遇到求解優化計算:在常規控制系統的設計中,常遇到求解約束優化問題,神經網絡為這類問題提供了有效的途約束優化問題,神經網絡為這類問題提供了有效的途徑;徑;(5) 控制系統的故障診斷:利用神經網絡的逼近特性,控制系統的故障診斷:利用神經網絡的逼近特性,可對控制系統的各種故障進行模式識別,從而實現控可對控制系統的各種故障進行模式識別,從而實現控制系統的故障診斷。制系統的故障診斷。 神經網絡控制在理論和實踐上,以下問題是研究神經網絡控制在理論和實踐上,以下問題是研究的重點:的重點:(1) 神經網絡的穩定性與收斂性問題;神經網絡的穩定性與收斂性問題;(2) 神經網絡

6、控制系統的穩定性與收斂性問題;神經網絡控制系統的穩定性與收斂性問題;(3) 神經網絡學習算法的實時性;神經網絡學習算法的實時性;(4) 神經網絡控制器和辨識器的模型和結構。神經網絡控制器和辨識器的模型和結構。 根據神經網絡在控制器中的作用不同,神經網絡控制根據神經網絡在控制器中的作用不同,神經網絡控制器可分為兩類,一類為神經控制,它是以神經網絡為基器可分為兩類,一類為神經控制,它是以神經網絡為基礎而形成的獨立智能控制系統;另一類為混合神經網絡礎而形成的獨立智能控制系統;另一類為混合神經網絡控制,它是指利用神經網絡學習和優化能力來改善傳統控制,它是指利用神經網絡學習和優化能力來改善傳統控制的智能

7、控制方法,如自適應神經網絡控制等。控制的智能控制方法,如自適應神經網絡控制等。 綜合目前的各種分類方法,可將神經網絡控制的結構綜合目前的各種分類方法,可將神經網絡控制的結構歸結為以下七類。歸結為以下七類。9.2 神經網絡控制結構神經網絡控制結構 9.2.1 9.2.1 神經網絡監督控制神經網絡監督控制 通過對傳統控制器進行學習,然后用神經網絡控制器逐漸通過對傳統控制器進行學習,然后用神經網絡控制器逐漸取代傳統控制器的方法,稱為神經網絡監督控制。神經網絡監取代傳統控制器的方法,稱為神經網絡監督控制。神經網絡監督控制的結構如圖督控制的結構如圖9-19-1所示。所示。 神經網絡控制器實際上是一個前饋

8、控制器,它建立的是被神經網絡控制器實際上是一個前饋控制器,它建立的是被控對象的逆模型。神經網絡控制器通過對傳統控制器的輸出進控對象的逆模型。神經網絡控制器通過對傳統控制器的輸出進行學習,在線調整網絡的權值,使反饋控制輸入趨近于零,從行學習,在線調整網絡的權值,使反饋控制輸入趨近于零,從而使神經網絡控制器逐漸在控制作用中占據主導地位,最終取而使神經網絡控制器逐漸在控制作用中占據主導地位,最終取消反饋控制器的作用。一旦系統出現干擾,反饋控制器重新起消反饋控制器的作用。一旦系統出現干擾,反饋控制器重新起作用。這種前饋加反饋的監督控制方法,不僅可以確保控制系作用。這種前饋加反饋的監督控制方法,不僅可以

9、確保控制系統的穩定性和魯棒性,而且可有效地提高系統的精度和自適應統的穩定性和魯棒性,而且可有效地提高系統的精度和自適應能力。能力。NNC控制器對象+-+ tyd te ty tun tup tu圖9-1 神經網絡監督控制 圖圖9-2為神經網絡直接逆控制的兩種結構方案。為神經網絡直接逆控制的兩種結構方案。在圖在圖9-2(a)中,中,NN1和和NN2為具有完全相同的網絡結為具有完全相同的網絡結構,并采用相同的學習算法,分別實現對象的逆。構,并采用相同的學習算法,分別實現對象的逆。在圖在圖9-2(b)中,神經網絡中,神經網絡NN通過評價函數進行學習,通過評價函數進行學習,實現對象的逆控制。實現對象的

10、逆控制。 對象 tyd te ty tun tuNN1NN2+-對象 tyd tE ty tuNN評價函數(b) 9.2.3 神經網絡自適應控制 與傳統自適應控制相同,神經網絡自適應控制也與傳統自適應控制相同,神經網絡自適應控制也分為神經網絡自校正控制和神經網絡模型參考自適應分為神經網絡自校正控制和神經網絡模型參考自適應控制兩種。自校正控制根據對系統正向或逆模型的結控制兩種。自校正控制根據對系統正向或逆模型的結果調節控制器內部參數,使系統滿足給定的指標,而果調節控制器內部參數,使系統滿足給定的指標,而在模型參考自適應控制中,閉環控制系統的期望性能在模型參考自適應控制中,閉環控制系統的期望性能由

11、一個穩定的參考模型來描述。由一個穩定的參考模型來描述。 (2 2)神經網絡間接自校正控制)神經網絡間接自校正控制 其結構如圖其結構如圖9-39-3所示。假設被控對象為如所示。假設被控對象為如下單變量仿射非線性系統:下單變量仿射非線性系統: 若利用神經網絡對非線性函數若利用神經網絡對非線性函數 和和 進進行逼近,得到行逼近,得到 和和 ,則控制器為:,則控制器為:其中其中 為為 時刻的期望輸出值。時刻的期望輸出值。kkkkuygyfy1kyfkygkyfkyg kkkygyfrku/11kr1k神經網絡估計器常規控制器對象 tyd te tu ty+-g ,f圖圖9-3 9-3 神經網絡間接自校

12、正控制神經網絡間接自校正控制2. 2. 神經網絡模型參考自適應控制神經網絡模型參考自適應控制 分為直接模型參考自適應控制和間接模型分為直接模型參考自適應控制和間接模型參考自適應控制兩種。參考自適應控制兩種。(1 1)直接模型參考自適應控制)直接模型參考自適應控制 如圖如圖9-4所示。神經網絡控制器的作用是使所示。神經網絡控制器的作用是使被控對象與參考模型輸出之差為最小。但該方被控對象與參考模型輸出之差為最小。但該方法需要知道對象的法需要知道對象的 信息信息 。 Jacobianuy參考模型NNC對象 tr te tu ty+- tym tec+-圖圖9-4 9-4 神經網絡直接模型參考自適應控

13、制神經網絡直接模型參考自適應控制(2 2)間接模型參考自適應控制)間接模型參考自適應控制 如圖如圖9-59-5所示。神經網絡辨識器所示。神經網絡辨識器NNINNI向神經向神經網絡控制器網絡控制器NNCNNC提供對象的信息,用于控制器提供對象的信息,用于控制器NNCNNC的學習。的學習。參考模型NNC對象 tr te tu ty+- tym tec+-NNC+- tei tyn圖圖9-5 神經網絡間接模型參考自適應控制神經網絡間接模型參考自適應控制 9.2.4 9.2.4 神經網絡內模控制神經網絡內模控制 經典的內模控制將被控系統的正向模型和逆模型直經典的內模控制將被控系統的正向模型和逆模型直接

14、加入反饋回路,系統的正向模型作為被控對象的近接加入反饋回路,系統的正向模型作為被控對象的近似模型與實際對象并聯,兩者輸出之差被用作反饋信似模型與實際對象并聯,兩者輸出之差被用作反饋信號,該反饋信號又經過前向通道的濾波器及控制器進號,該反饋信號又經過前向通道的濾波器及控制器進行處理。控制器直接與系統的逆有關,通過引入濾波行處理。控制器直接與系統的逆有關,通過引入濾波器來提高系統的魯棒性。器來提高系統的魯棒性。 圖圖9-69-6為神經網絡內模控制,被控對象的正向模型及為神經網絡內模控制,被控對象的正向模型及控制器均由神經網絡來實現。控制器均由神經網絡來實現。濾波器對象+- tyd te ty tu

15、神經網絡控制器神經網絡正向模型NN1NN2 tym+-d圖圖9-6 神經網絡內模控制神經網絡內模控制 9.2.5 9.2.5 神經網絡預測控制神經網絡預測控制 預測控制又稱為基于模型的控制,是預測控制又稱為基于模型的控制,是7070年代后期發年代后期發展起來的新型計算機控制方法,該方法的特征是預測展起來的新型計算機控制方法,該方法的特征是預測模型、滾動優化和反饋校正。模型、滾動優化和反饋校正。 神經網絡預測控制的結構如圖神經網絡預測控制的結構如圖9-79-7所示,神經網絡預所示,神經網絡預測器建立了非線性被控對象的預測模型,并可在線進測器建立了非線性被控對象的預測模型,并可在線進行學習修正。行

16、學習修正。 利用此預測模型,通過設計優化性能指標,利用非利用此預測模型,通過設計優化性能指標,利用非線性優化器可求出優化的控制作用線性優化器可求出優化的控制作用 。 tu非線性優化器對象+- tyd te ty tu+d神經網絡預測器濾波器 ty +-kty 圖9-7 神經網絡預測控制9.2.6 9.2.6 神經網絡自適應評判控制神經網絡自適應評判控制 神經網絡自適應評判控制通常由兩個網絡組成,如神經網絡自適應評判控制通常由兩個網絡組成,如圖圖9-89-8所示。自適應評判網絡通過不斷的獎勵、懲罰等所示。自適應評判網絡通過不斷的獎勵、懲罰等再勵學習,使自己逐漸成為一個合格的再勵學習,使自己逐漸成

17、為一個合格的“教師教師”,學習,學習完成后,根據系統目前的狀態和外部激勵反饋信號產生完成后,根據系統目前的狀態和外部激勵反饋信號產生一個內部再勵信號,以對目前的控制效果作出評價。控一個內部再勵信號,以對目前的控制效果作出評價。控制選擇網絡相當于一個在內部再勵信號指導下進行學習制選擇網絡相當于一個在內部再勵信號指導下進行學習的多層前饋神經網絡控制器,該網絡在進行學習后,根的多層前饋神經網絡控制器,該網絡在進行學習后,根據編碼后的系統狀態,在允許控制集中選擇下一步的控據編碼后的系統狀態,在允許控制集中選擇下一步的控制作用。制作用。自適應評價網絡控制選擇網絡對象 tu ty編碼器 tr tr 內部再

18、勵外部再勵反饋圖圖9-8 神經網絡自適應評判控制神經網絡自適應評判控制 9.2.7 9.2.7 神經網絡混合控制神經網絡混合控制 該控制方法是集成人工智能各分支的優點,由神該控制方法是集成人工智能各分支的優點,由神經網絡技術與模糊控制、專家系統等相結合而形成的經網絡技術與模糊控制、專家系統等相結合而形成的一種具有很強學習能力的智能控制系統。一種具有很強學習能力的智能控制系統。 由神經網絡和模糊控制相結合構成模糊神經網絡,由神經網絡和模糊控制相結合構成模糊神經網絡,由神經網絡和專家系統相結合構成神經網絡專家系統。由神經網絡和專家系統相結合構成神經網絡專家系統。神經網絡混合控制可使控制系統同時具有

19、學習、推理神經網絡混合控制可使控制系統同時具有學習、推理和決策能力。和決策能力。 9.3 單單9.3.1 單神經元自適應控制算法單神經元自適應控制算法 單神經元自適應控制的結構如圖單神經元自適應控制的結構如圖9-9所示。所示。圖圖9-9 單神經元自適應單神經元自適應PID控制結構控制結構 單神經元自適應控制器是通過對加權系數的調單神經元自適應控制器是通過對加權系數的調整來實現自適應、自組織功能,控制算法為整來實現自適應、自組織功能,控制算法為 如果權系數的調整按有監督的如果權系數的調整按有監督的Hebb學習規則實學習規則實現,即在學習算法中加入監督項現,即在學習算法中加入監督項 ,則神經網絡權

20、,則神經網絡權值學習算法為:值學習算法為:31)()() 1()(iiikxkwKkuku kz)()()() 1()()()()() 1()()()()() 1()(333222111kxkukzkwkwkxkukzkwkwkxkukzkwkw式中,式中, 為 學 習 速 率 ,為 學 習 速 率 , 為 神 經 元 的 比 例 系為 神 經 元 的 比 例 系數,數, 。 kekz)()(1kekx) 1()()(2kekekx) 2() 1(2)()()(23kekekekekxK0K 值的選擇非常重要。值的選擇非常重要。 越大,則快速性越好,越大,則快速性越好,但超調量大,甚至可能使系

21、統不穩定。當被控對象但超調量大,甚至可能使系統不穩定。當被控對象時延增大時,時延增大時, 值必須減少,以保證系統穩定。值必須減少,以保證系統穩定。 值選擇過小,會使系統的快速性變差。值選擇過小,會使系統的快速性變差。KKKK)(40.5sgn(sin)(tkrin9.3.2 9.3.2 仿真實例仿真實例 2)-(0.6321)-(0.102)-(0.261)-(0.368)(kukukykyky9.4 RBF9.4 RBF網絡監督控制網絡監督控制9.4.1 RBF9.4.1 RBF網絡監督控制算法網絡監督控制算法 基于RBF網絡的監督控制系統結構如圖9-14所示。 RBFPD控制對象+-+ k

22、r ke ky kun kup ku圖圖9-14 9-14 神經網絡監督控制神經網絡監督控制 在在RBFRBF網絡結構中,取網絡的輸入為網絡結構中,取網絡的輸入為 ,網絡,網絡的徑向基向量為的徑向基向量為 , 為高斯基函數:為高斯基函數: krTmhh,1Hjh )2-exp(-22jjjbkrhC網絡的權向量為:網絡的權向量為: RBFRBF網絡的輸出為:網絡的輸出為: 其中其中 為為RBFRBF網絡隱層神經元的個數。網絡隱層神經元的個數。T1,mwwW mmjjnwhwhwhku11m控制律為:控制律為: kukukunp設神經網絡調整的性能指標為:設神經網絡調整的性能指標為: 221ku

23、kukEn采用梯度下降法調整網絡的權值:采用梯度下降法調整網絡的權值: kwkukwkujnjp近似地取近似地取由此所產生的不精確通過權值調節來補償。由此所產生的不精確通過權值調節來補償。神經網絡權值的調整過程為:神經網絡權值的調整過程為:其中其中 為學習速率,為學習速率, 為動量因子。為動量因子。 211kkkkkWWWWW khkukukwkukukukwkEkwjnjpnjj則則9.4.2 9.4.2 仿真實例仿真實例被控對象為:被控對象為:ssG1047087.35ss1000)(23RBF網絡監督控制程序為網絡監督控制程序為chap9_2.m 神經間接自校正控制結構如圖神經間接自校正

24、控制結構如圖9-17所示,所示,它由兩個回路組成:它由兩個回路組成:(1)自校正控制器與被控對象構成的反饋回)自校正控制器與被控對象構成的反饋回路。路。(2)神經網絡辯識器與控制器設計,以得到)神經網絡辯識器與控制器設計,以得到控制器的參數。控制器的參數。 辯識器與自校正控制器的在線設計是自校辯識器與自校正控制器的在線設計是自校正控制實現的關鍵。正控制實現的關鍵。圖圖9-17 9-17 神經網絡間接自校正控制框圖神經網絡間接自校正控制框圖9.5.2 9.5.2 自校正控制算法自校正控制算法 考慮被控對象:考慮被控對象:其中其中 , 分別為對象的輸入、輸出,分別為對象的輸入、輸出, 為非為非零函

25、數。零函數。 kukykygky1uy 1)(krgku g NkrNNgku1)( g g Ng N9.5.3 RBF9.5.3 RBF網絡自校正控制算法網絡自校正控制算法 采用兩個采用兩個RBF網絡分別實現未知項網絡分別實現未知項 、 的的辨識。辨識。RBF網絡辨識器的結構如圖網絡辨識器的結構如圖9-18所示,所示, 和和 分別為兩個神經網絡的權值向量。分別為兩個神經網絡的權值向量。 g WV圖圖9-18 9-18 神經網絡辨識器神經網絡辨識器 在在RBF網絡結構中,取網絡的輸入為網絡結構中,取網絡的輸入為 ,網,網絡的徑向基向量為絡的徑向基向量為 , 為高斯基為高斯基函數:函數: 其中其

26、中 。 為節點為節點 的基寬度參數,的基寬度參數, , 為網絡第為網絡第 個結點的中心矢量,個結點的中心矢量, , 。 kyTmhh,1Hjh )2-exp(-22jjjbkyhCmj, 1jbj0jbjCjmjcc111,CTmbb,1B兩個兩個RBF網絡的輸出分別為:網絡的輸出分別為: mmjjwhwhwhkNg11 mmjjvhvhvhkN11m 1;1;1kukVkyNkWkyNgkym辨識后,對象的輸出為:辨識后,對象的輸出為:其中其中 為為RBF網絡隱層神經元的個數。網絡隱層神經元的個數。網絡的權向量為:網絡的權向量為:T1,mwwWT1,mvvV采用梯度下降法調整網絡的權值:采用

27、梯度下降法調整網絡的權值: khkykykwkEkwjmwjwj khkykykvkEkvjmvjvj設神經網絡調整的性能指標為:設神經網絡調整的性能指標為: 221kykykEm 神經網絡自校正控制系統的結構如圖神經網絡自校正控制系統的結構如圖9-19所示。所示。 神經網絡權值的調整過程為:神經網絡權值的調整過程為: 211kkkkkWWWWW 211kkkkkVVVVV其中其中 和和 為學習速率,為學習速率, 為動量因子。為動量因子。wv圖圖9-19 9-19 神經網絡自校正控制框圖神經網絡自校正控制框圖 9.5.4 仿真實例仿真實例 被控對象為:被控對象為:其中其中 , 。 ) 1(15

28、)1(sin(8 . 0)(kukyky 1sin8 . 0kykyg 15kyRBF網絡自校正控制程序為網絡自校正控制程序為chap9_3.m。 9.6 基于基于RBF網絡直接模型參考自適應控制網絡直接模型參考自適應控制9.6.1 基于基于RBF網絡的控制器設計網絡的控制器設計 控制系統的結構如圖控制系統的結構如圖9-23所示。所示。 設參考模型輸出為設參考模型輸出為 ,控制系統要求對,控制系統要求對象的輸出象的輸出 能夠跟蹤參考模型的輸出能夠跟蹤參考模型的輸出 。 kym ky kym則跟蹤誤差為:則跟蹤誤差為: kykykecm-參考模型RBF對象 kr ke ku ky+- kym k

29、ec+-圖圖9-23 基于基于RBF網絡的直接模型參考網絡的直接模型參考自適應控制自適應控制指標函數為:指標函數為: 控制器為控制器為RBF網絡的輸出:網絡的輸出: 其中其中 為為RBF網絡隱層神經元的個數,網絡隱層神經元的個數, 為第為第 個網絡隱層神經元與輸出層之間的連接權,個網絡隱層神經元與輸出層之間的連接權, 為第個為第個 隱層神經元的輸出。隱層神經元的輸出。 2k21eckE mmjjwhwhwhku11mjwjjhj在在RBF網絡結構中,網絡結構中, 為網絡的輸入為網絡的輸入向量。向量。RBF網絡的徑向基向量為網絡的徑向基向量為 ,為,為高斯基函數:高斯基函數: 其中其中 , 為節

30、點為節點 的基寬度參數,的基寬度參數, , 為網絡第為網絡第 個結點的中心矢量,個結點的中心矢量, , 。Tnxx,1XTmhh,1Hjh)2-exp(-22jjjbhCXmj, 1jbj0jbjCjjnjijjccc,1CTmbb,1B網絡的權向量為:網絡的權向量為: 按梯度下降法及鏈式法則,可得權值的學按梯度下降法及鏈式法則,可得權值的學習算法如下:習算法如下:其中其中 為學習速率,為學習速率, 為動量因子。為動量因子。T1,mwwW jjhkukyecwkEwkk kwwwwjjjjk1-kk同理,可得同理,可得RBF網絡隱層神經元的高斯函數網絡隱層神經元的高斯函數的中心參數及基的中心參

31、數及基寬的學習算法如下:寬的學習算法如下: 32-kkkjijjjjjjbchwkuykecbukuykecbkEkbx 2)-(k-1)-(k(1)-(k(k)jjjjjbbkbbb 2kkkjijijjijijijbcxhwkuykeccukuykecckEkc 2)-(kc-1)-(k(c1)-(k(k)ijijijijijkccc 在學習算法中,在學習算法中, 稱為稱為 信息,表示信息,表示系統的輸出對控制輸入的敏感性,其值可由神系統的輸出對控制輸入的敏感性,其值可由神經網絡辨識而得。在神經網絡算法中,對經網絡辨識而得。在神經網絡算法中,對 值的精確度要求不是很高,不精確部分可值的精確

32、度要求不是很高,不精確部分可通過網絡參數及權值的調整來修正,關鍵是其通過網絡參數及權值的調整來修正,關鍵是其符號,因此可用符號,因此可用 的正負號來代替,這樣的正負號來代替,這樣可使算法更加簡單。可使算法更加簡單。 kuykJacobian kuyk kuyk9.6.2 仿真實例仿真實例 被控對象為一非線性模型:被控對象為一非線性模型: 21-ky1/1-ku1-k0.10y-ky 取采樣周期為取采樣周期為 ,參考模型為,參考模型為 ,其中其中 為正弦信號,為正弦信號, 。msts1 krkykymm16 . 0 krtskkr2sin50. 0)(RBF網絡直接模型參考自適應控制程序為網絡直

33、接模型參考自適應控制程序為chap9_4.m 9.7 基于不確定逼近的基于不確定逼近的RBF網絡自適應控制網絡自適應控制 9.7.1 問題的提出問題的提出其中其中 為為 階正定慣性矩陣,階正定慣性矩陣, 為為 階慣性矩陣,階慣性矩陣, 其中為其中為 階慣性向量。階慣性向量。 如果模型建模精確,且如果模型建模精確,且 ,則控制律可設計為:則控制律可設計為: 通過對文獻通過對文獻18的控制方法進行詳細推導及仿真分析,研究基于的控制方法進行詳細推導及仿真分析,研究基于模型不確定逼近的模型不確定逼近的RBF網絡機器人自適應控制的設計方法。網絡機器人自適應控制的設計方法。 設設n關節機械手的動力學方程為

34、:關節機械手的動力學方程為:,D q qC q q qGqd(9.30) D qnn,C q q nn G q1n0d dvp,D qqk ek eC q q qG q(9.31) 其中其中 , , 。2p200kv2002k0 將控制律式(9.31)代入式(9.30)中,得到穩定的閉環系統為 (9.32)其中 為理想的角度, , 。 在實際工程中,對象的實際模型很難得到,即無法得到精確的 、,只能建立理想的名義模型。 將機器人名義模型表示為 , , ,針對名義模型的控制律設計為: (9.33) 將控制律式(9.33)代入式(9.30)中,得 (9.34) 采用 分別減去上式左右兩邊,并取,

35、, 則vp0ek ek edqdeqqdeqq D q,C q q G q 0Dq0,Cq q 0Gq 0dvp00e, Dqqk ekCq q qGq 0dvp00,D q qC q q qG qDqqk ek eCq q qGqd 000,Dq qCq q qGq0DDD0CCC0GGG 由由式(式(9.359.35)可見,由于模型建模的不精確會導致控制性能的下降。因此,)可見,由于模型建模的不精確會導致控制性能的下降。因此,需要對建模不精確部分進行逼近。需要對建模不精確部分進行逼近。 式(式(9.359.35)中,取建模不精確部分為:)中,取建模不精確部分為: 假設模型不確定項為已知,則

36、可設計修正的控制律為:假設模型不確定項為已知,則可設計修正的控制律為: (9.37) 將控制律式(將控制律式(9.37)代入式()代入式(9.30)中,則可得到穩定的閉環系統)中,則可得到穩定的閉環系統式(式(9.32)。)。 在實際工程中,模型不確定項在實際工程中,模型不確定項 為未知,為此,需要對不確定項為未知,為此,需要對不確定項進行逼近,從而在控制律中實現對不確定項進行逼近,從而在控制律中實現對不確定項 的補償。的補償。 10 f xDDqCqGd(9.36) 10 f xDDqCqGd f x f x f x9.7.2 模型不確定部分的模型不確定部分的RBF網絡逼近網絡逼近 采用采用

37、RBF網絡對不確定項網絡對不確定項 進行自適應逼近。進行自適應逼近。 RBF網絡算法為:網絡算法為: , (9.38) (9.39) 其中其中X為網絡的輸入信號,為網絡的輸入信號,Y為網絡的輸出信號,為網絡的輸出信號, 為高斯基函數的輸出,為高斯基函數的輸出,為神經網絡權值。為神經網絡權值。 由已知證明可知由已知證明可知19,20,在下述假設條件下,在下述假設條件下,RBF網絡針對連續函數在緊集范圍內網絡針對連續函數在緊集范圍內具有任意精度的逼近能力。具有任意精度的逼近能力。 假設:假設:(1)神經網絡輸出為連續;)神經網絡輸出為連續;(2)存在理想逼近的神經網絡輸出,針對一個非常小的正數,有

38、)存在理想逼近的神經網絡輸出,針對一個非常小的正數,有 f x22/xciiigbni,2 , 1 Ty x12,n (9.40) 其中,其中, , 為階矩陣,表示對為階矩陣,表示對 最佳逼近的神最佳逼近的神經網絡權值。經網絡權值。 取取 為理想神經網絡的逼近誤差,即為理想神經網絡的逼近誤差,即 (9.41) 由由RBF網絡的逼近能力可知,建模誤差網絡的逼近能力可知,建模誤差 為有界,假設其界為為有界,假設其界為 ,即,即 (9.42) 其中其中 (9.43) *0max,f x f x *arg minsup,xMxM f xf x * f x *,f xf x 0 0*sup,f xf x

39、 *T,f x x 控制器設計為 (9.44)其中 (9.45) (9.46)其中 為 的估計值, 。 由于 有界,則 有界,取 。 將控制律式(9.44)代入式(9.30)中,有9.7.3 控制器的設計及分析控制器的設計及分析12 10dvp00,Dqqk ek eCq q qGq 20,D q f x * T,f x x f x*maxF0dvp000,D q qC q q qGqDqqk ek eCq q qGqDq fd采用采用 分別減去上式左右兩邊,得:分別減去上式左右兩邊,得:即000,Dq qCq q qGq00dvp0, D q qC q q qGqdDq qDqqk ek e

40、Dq fx 0vp, D q qC q q qG qdDqek ek ef x 1vp0,ek ek ef x DqD q qC q q qG qd vp,ek ek efx fx采采取取 ,建模不精確部分為,建模不精確部分為 ,則,則上式可寫上式可寫為:為:Txee 10 f xDDqCqGd ,xAx B f xf x 其中其中 ,pv0IAkk0 BI 由于由于 則 (9.47) 定義Lyapunov函數為 (9.48) 其中 。 矩陣P為對稱正定矩陣,并滿足如下Lyapunov方程 (9.49) 其中 。 *TTT,f xf x f xf x f x f x x x x其中其中 。*

41、TxAxB x2T1122Vx Px0T PAA PQ0Q 定義定義22TT,trtriji jrRRRR R 其中其中 為矩陣的跡,則為矩陣的跡,則 tr2Ttr TTTTTTTTTTTTTTTTTTTTTTTTTTT11tr211tr211tr211tr2 x Pxx Px x P AxB xx A xBPx xPAA P xx PB xx PBx B Px B Px x Qxx B Px B Px V 其中其中 , TTTTx PB xx B PxTTTx PB B Px (9.51) 則 (9.52) 可以采用以下兩種自適應律設計方法。 (1)自適應律一 取自適應律為: (9.53)其

42、中 。 則 由于由于 TTTTtr x B PxB Pxx TTTTTT11tr2V x QxB Pxx B Px TTTBP xx0Txx P B 由于 ,則 由已知 ,設 為矩陣Q特征值的最小值, 為矩陣特征值的最大值,則 (9.54)要使 ,需要 ,即X的收斂半徑為 TTT12V x Qx B PxT01BminQminQ2m in0m axm in0m ax12122V QxPxxQxP0Vmaxmin02PQxmax0min2PxQ 可見,當Q的特征值越大、P的特征值越小、神經網絡建模誤差 的上界 越小時,X的收斂半徑越小,跟蹤效果越好。但該方法不能保證權值 的有界性。為此,可采用自

43、適應律二。 (2)自適應律二 取自適應律為: (9.56) 其中 , 。 將式(9.56)代入式(9.52)得:0*T1kx PBx 010kTTTT1TTTT111tr21tr2Vkk x Qxx B Pxx Qxx B Px根據根據F范數的性質,有范數的性質,有 ,則,則 則要使要使 ,需要滿足一下條件:,需要滿足一下條件:或或2TFFFtrxxxxxx2TTT*FFFtrtrtr 2T*TT1FFF22*min110maxFFF2min1max10maxFF22max1min1max0max1212121224 x Qxx B PxQxxxPxxQxPxQxPFVkkkkkkk0V 21

44、min0maxmax124kQxP 22max110maxmax24FkkP 即收斂條件為:或即收斂條件為:或 22max110maxmax24FkkP 22max110maxmax24FkkP 210maxmaxmin24kxPQ 2max10maxmaxF1124kkP 因此,采用自適應律二,可保證權值的有界性,即解決神經網絡權因此,采用自適應律二,可保證權值的有界性,即解決神經網絡權值的收斂問題。值的收斂問題。 從從 的收斂情況可知:當的收斂情況可知:當Q的特征值越大、的特征值越大、P的特征值越小、神經的特征值越小、神經網絡建模誤差網絡建模誤差 的上界的上界 越小、越小、 越小時,則越小

45、時,則X的收斂半徑越小,跟的收斂半徑越小,跟蹤效果越好。蹤效果越好。x0max9.7.3 仿真實例仿真實例 選二關節機器人系統(不考慮摩擦力),其動力學模型為:選二關節機器人系統(不考慮摩擦力),其動力學模型為: ,D q qC q q qG qd 0120102201022012 coscoscosvqqqqqqqqqD q 其中其中 其中 , , , 。 誤差擾動、位置指令和系統的初始狀態分別為: 位置指令為: 被控對象的初值為 ,取 , , 的變化量為20%。0222021220212sinsin,sin0q qqqqqqq qqC q q 1121215 cos8.75 cos8.75

46、 cosgqgqqgqqG q33.13v018.98q028.75q8 . 9g6, 32321ddd,123dddee 1d2d10.2sin 0.510.2 cos 0.5qtqtTT1230.5qqqqDCG 仿真程序中,自適應律取第1種,即,控制律取第3種,即,采用神經網絡控制,控制參數取: 取 ,采用式(3.14)設計 , ,自適應律參數取 , 高斯基函數參數的初始值分別取 和3.0。采用Simulink和S函數進行控制系統的設計,仿真結果如圖9-25至圖9-28所示。50000050000050000050Q3 pkvk20 10.001k 21012圖圖9-

47、25 關節關節1的位置跟蹤的位置跟蹤 圖圖9-26 關節關節2的位置跟蹤的位置跟蹤圖圖9-27 關節關節1的模型不確定項及其估計的模型不確定項及其估計圖圖9-28 關節關節2的模型不確定項及其估計的模型不確定項及其估計 通過對文獻21的控制方法進行詳細推導及仿真分析,研究基于模型整體逼近的機器人RBF網絡自適應控制設計方法。9.8.1 問題的提出 設n關節機械手方程為: (9.57) 其中 為 階正定慣性矩陣, 為 階慣性矩陣,其中 為 階慣性向量, 為摩擦力, 為未知外加干擾, 為控制輸入。9.8 基于模型整體逼近的機器人基于模型整體逼近的機器人RBF網絡自適應控制網絡自適應控制 d,D q

48、 qC q q qG qF q D qnn,C q q nn G q1n F q d 跟蹤誤差為: 定義誤差函數為: (9.58) 其中 ,則 (9.59)其中 。 dttteqq reeT0d qrqedddddddd DrD qqeD qeDqD qeCqGFD qeCrC qeGFCrf ddf xD qeC qeGF 在實際工程中,模型不確定項f為未知,為此,需要對不確定項f進行逼近。采用RBF網絡逼近f,根據 的表達式,網絡輸入取 設計控制律為: (9.60) 其中 為針對f進行逼近的RBF網絡輸出值。 將控制律式(9.60)代入式(9.59),得: (9.61) fxTTTTTdd

49、dxeeqqq vfK r f xvdvdv0 DrCrfK rfKC rfKC r 如果定義Lyapunov函數則 這說明在 固定條件下,控制系統的穩定依賴于 ,即 對 的逼近精度及干擾 的大小。 采用RBF網絡對不確定項f進行逼近。理想的RBF網絡算法為:其中為網絡的輸入信號, 。T12L r DrTTTTTv011222L r Drr Drr K rrDC rr TT0vL r r K rvK0ffd22/iiigxc1,2,in12 nf ff y W x 跟蹤誤差為: 定義誤差函數為: (9.58)其中, 則 (9.59)其中 。 dttteqq reeT0d qrqeddddddd

50、d DrD qqeD qeDqD qeCqGFD qeCrC qeGFCrf ddf xD qeC qeGF 在實際工程中,模型不確定項f為未知,為此,需要對不確定項f進行逼近。采用RBF網絡逼近,根據的表達式,網絡輸入取 設計控制律為: (9.60)其中 為針對f進行逼近的RBF網絡輸出值。 將控制律式(9.60)代入式(9.59),得: (9.61)其中 , 。TTTTTdddxeeqqq vfK r f xvdvdv0 DrCrfK rfKC rfKC rfff0d f 如果定義Lyapunov函數則 這說明在 固定條件下,控制系統的穩定依賴于 ,即 對f的逼近精度及干擾 的大小。 采用

51、RBF網絡對不確定項f進行逼近。理想的RBF網絡算法為: 其中x為網絡的輸入信號, 。T12L r DrTTTTTv011222L r Drr Drr K rrDC rr TT0vL r r K rvK0fd22/iiigxc1,2,in y W x12 nf ff9.8.2 針對進行逼近的控制針對進行逼近的控制1控制器的設計控制器的設計 采用采用RBF網絡逼近,則網絡逼近,則RBF神經網絡的輸出為:神經網絡的輸出為: (9.62)取取 , 設計控制律為:設計控制律為: (9.63)其中其中 v 為用于克服神經網絡逼近誤差為用于克服神經網絡逼近誤差 的魯棒項。的魯棒項。 將控制律式(將控制律式

52、(9.63)代入式()代入式(9.59),得:),得: (9.64)其中其中 。 Tf xW xWWWmaxFWW vf xK rv Tvdv1 DrKC rW xvKC r T1dW xv 將魯棒項v設計為: (9.65)其中 , 。2穩定性及收斂性分析穩定性及收斂性分析 定義Lyapunov函數: 則將(9.64)式代入上式,得 Ndsgnb vrNeddbTT111tr22Lr DrW F WTTT11tr2Lr Drr DrW F WTTT1TTvd12tr2L r K rrDC rWF Wrrv 根據機器人特性有 。取 ,即神經網絡自適應律為: (9.66)則由于則T20rDC rT

53、 WFrTWFrTTvdL r K rrvTTTTdddNd0rvrr vrr b0L 9.8.3 針對中各項分別逼近的控制 控制律仍采用式(9.63)。由式(9.59)知,被控對象中的項 可寫為:其中 , 。 采用RBF神經網絡對 中的各項分別進行逼近: f x 12,ttf xD q C q q G qF q 1dtqe 2dtqe f x TDDD qW qTCC,C q qW q q TGGG qW q TFFF qW q 則 (9.67) 其中 自適應律取: (9.68) (9.69) (9.70) (9.71)其中 , , , 。 DCTTTTD1C2GFGFttf xW W WW

54、 TABCDxTTTTTDCGFWWWWWTDDDDDDkWF rFr WTCCCCCCkWF rFr WTGGGGGGkWF rFr WTFFFFFFkWF rF r WD0k C0k G0k F0k 穩定性分析:穩定性分析: 定義Lyapunov函數為則 將式(9.64)代入上式,得 考慮機器人特性,并將神經網絡自適應律式(9.67)式(9.71)代入上式,得:T1T1T1T1DDDCCCGGGFFF11111trtrtrtr22222TLr MrW FWW FWW FWW FWTTT1T1T1T1DDDCCCGGGFFF1trtrtrtr2Lr Drr DrW FWW FWW FWW FWTTTTT1TvdDDDDT1TT1TT1TCCCCGGGGFFFF12tr2trtrtrL r K rrDC rrr vWF W rWF W rWF W rWF W r 由于考慮魯棒項(9.65),則TTTvDDDDCCCCTTTTGGG

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論