基于神經網絡課件_第1頁
基于神經網絡課件_第2頁
基于神經網絡課件_第3頁
基于神經網絡課件_第4頁
基于神經網絡課件_第5頁
已閱讀5頁,還剩49頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1 基本概念 最優控制系統 最優控制系統,是指在一定的具體條件下,完成所要求的控制任務時,其目標函數(性能指標)具有最優值的系統,更具體些說,最優控制是指在一定的約束條件下,選擇一個表征過程的目標函數,決定一個最優控制函數,以使目標函數達到極大值或極小值,對于同一系統,若選擇的目標函數不同,則可能得到不同的最優控制1 基本概念性能指標最優控制理論中,數字控制系統的性能指標定為性能指標可分為三種形式:積分型積分型目標函數可寫成 Q為加權矩陣1 基本概念終值型 終值型目標函數可寫成綜合型上述綜合型性能指標是比較普遍的性能指標。1 基本概念 若將綜合型的目標函數寫成 則當J為最小時,系統在整個控制過

2、程中,狀態偏差最小。這種目標函數稱為二次型性能指標。二次型性能指標在最優控制中占有很重要的地位。1 基本概念 最優控制問題 令系統的狀態方程為 其初始條件為 式中X(k)是n維列向量,U(k)是p維列向量。 最優控制的任務是在一定的約束條件下,在時間0,N內求N個控制 使狀態由初始值 轉移到終止值X(N),并使 性能指標取最小值(或最大值)。 kX01 基本概念 線性二次型最優控制在最優控制中占有很重要的地位,其原因有二,一方面許多多線性系統的最優控制屬于這種類型,另一方面線性二次型最優控制可以得到具有狀態反饋的線性閉環最優控制系統,工程上易于實現。 所謂線性二次型最優控制就是在狀態方程的約束

3、條件下,尋找最優控制 使狀態X(0) 轉移到X(N),并使下式二次型性能指標取最小值: kU01 基本概念 簡單地講,二次型最優控制就是指性能指標為二次型的最優控制。2 神經網絡伺服最優魯棒控制系統 什么是伺服系統? 用來精確地跟隨或復現某個過程的反饋控制系統。又稱隨動系統。在很多情況下,伺服系統專指被控制量(系統的輸出量)是機械位移或位移速度,加速度的反饋控制系統,其作用是使輸出的機械位移(或轉角)準確地跟蹤輸入的位移(或轉角)。伺服系統的結構組成和其他形式的反饋控制系統沒有原則上的區別。伺服系統最初用于船舶的自動駕駛,火炮控制和指揮儀中,后來逐漸推廣到很多領域,特別是自動車床,天線位置 2

4、 神經網絡伺服最優魯棒控制系統 控制,導彈和飛船的制導等。采用伺服系統主要是為了達到下面幾個目的:以小功率指令信號去控制大功率負載。火炮控制和船舵控制就是典型的例子。在沒有機械連接的情況下,由輸入軸控制位于遠處的輸出軸,實現遠距同步傳動。使輸出機械位移精確地跟蹤電信號,如記錄和指示儀表等。 衡量伺服系統性能的主要指標有頻帶寬度和精度。 伺服系統按所用驅動元件的類型可分為機電伺服系統,液壓伺服系統和氣動伺服系統。2 神經網絡伺服最優魯棒控制系統 伺服系統的離散最優魯棒控制 隨著智能機器人和高精度的數控機床的發展,伺服技術得到了日益廣泛的應用,同時對伺服技術也提出了更高的要求。希望伺服系統具有快速

5、性好,無超調,無靜差,抗擾能力強等。然而由于實際的被控系統的數學模型往往含有非線性,干擾,不確定因素,當模型的不確定性超過傳統線性最優魯棒控制所允許的范圍時,控制系統就變得不穩定,因此傳統控制方法很難滿足現代伺服系統的要求。2 神經網絡伺服最優魯棒控制系統 將人工神經網絡所具有的并行性,自適應,自學習等能力應用于現有的最優魯棒控制,作為控制系統中的補償環節,完成更精確建模和穩定的控制,使控制系統具有更高一級的“智能”控制,以滿足快速,穩定的伺服系統控制要求。2 神經網絡伺服最優魯棒控制系統 最優伺服系統的設計目標是系統跟蹤一定指令信號時誤差最小。解決這個問題的方法是: 設一個離散系統,其離散狀

6、態方程為 其中 是 維狀態向量, 是m維控制向量, 是l維輸出向量,F,G,C分別是 , , 維的系統參數矩陣。 1n kU tynn)(mnnl kX2 神經網絡伺服最優魯棒控制系統 假定在一個穩定及可觀的指令信號 作用下,控制輸入 為 其中M和K分別為 和 維的反饋增益和前饋增益矩陣, 為給定的指令向量。 假定系統存在有穩態的平衡狀態 它們滿足方程和的穩態情況,即 nmlm kU2 神經網絡伺服最優魯棒控制系統 若用帶記號”*”的新變量表示系統偏離穩態的平衡狀態值(擾動),則這些新的變量定義為 將 式代入 和 式得: 2 神經網絡伺服最優魯棒控制系統 顯然,從式和中分別減去穩態的關系式 ,

7、可得到新的差分方程: 且有2 神經網絡伺服最優魯棒控制系統由和式可組成一個新的增廣系統 其中 這里 為 m維向量。V kV2 神經網絡伺服最優魯棒控制系統 現在的問題是,尋求控制輸入 ,使如下性能指標J最小 或 其中 S 為 維正定權陣, 為 維的半正定矩陣,R為 維的正定矩陣。 在式的約束條件下,使式表示的性能指標為最小。 kV)(llnnmm2 神經網絡伺服最優魯棒控制系統 此時求 的方法完全與線性最優調節器問題相同。于是,可求得增廣系統的最優控制輸入 為 (21) 其中 (22) 式中 為增廣系統的Riccatti方程,是 維正定矩陣。 kV kVP mnmn2 神經網絡伺服最優魯棒控制

8、系統 可分解為 (23)其中 為 維矩陣, 為 維矩陣, 為 維矩陣。將(22)式與(23)式相比較得 其中P定義為 (24)PP11P12P22nnmnmm2 神經網絡伺服最優魯棒控制系統 將 , 和 代入(24)式,得原系統的Riccati方程 (25) 若(F,G)是穩定的,(Q,F)可觀,則閉環系統是漸近穩定的。 假定 (26) 那么(21)式可簡化為 (27) P11P12P222 神經網絡伺服最優魯棒控制系統 比較(18)式和(27)式,便得到伺服系統的反饋增益和前饋增益 (28) 從(28)式可知,如果系統的參數 F,G,C及權矩陣Q和R已知,那么可利用(25)(26)(28)

9、式計算出最優控制器的增益M和K陣。 為了能觀察和估計系統的狀態,我們可根據系統模型(1)和(2)式中已知的控制輸入u(k) 2 神經網絡伺服最優魯棒控制系統 和輸出y(k)來估計系統狀態,其(k+1)時刻的觀測器的狀態方程為 (29) 式中 表示狀態估計值,H是 維的觀測器的反饋增益矩陣。如果選擇適當的H矩陣,使(F-HG)的特征值都位于Z平面的單位圓內,那么隨時間K的增長,觀測值 快速收斂于x(k)。kxmnkx3 基于神經網絡的非線性最優控制 引言 經典線性最優控制是從時域角度根據對象的動態知識形成控制對象的數學模型。如果模型方程能夠精確地表達對象的動態性,那么可以依二次型性能指標函數綜合

10、出一個狀態變量的線性反饋控制律,形成一個閉環反饋控制系統。這個系統是漸近穩定的,且在二次型指標意義下達到最優。但是,在工程實際系統中,參數往往不是準確的,甚至含有非線性特性,造成對象的模型不確定性。3 基于神經網絡的非線性最優控制 要繼續保持漸近穩定性所容許的非線性限度,一般的最優控制方法很難解決這個問題。本文提出在原有最優控制的基礎上并聯兩個神經網絡模型來完成精確模型的建立和穩定控制,以解決線性最優控制存在的問題。3 基于神經網絡的非線性最優控制 線性最優控制 設線性時不變系統的狀態方程為 (30) 其中,x(t)是n維系統的狀態向量,u(t)是m維輸入控制向量,A是 維的系統參數矩陣,B是

11、 維增益矩陣。 線性最優控制問題是尋找控制律u(t),使下列性能指標最小: (31)nmmn3 基于神經網絡的非線性最優控制 其中,Q為 維的半正定矩陣,R為 維正定矩陣。若最優控制存在唯一,且可由下式確定: (32) 其中,K是 維的最優反饋增益,P是 維的矩陣,可由下列Riccati方程解出: (33) 這里的Riccati方程具有唯一正定解。nnmmnmnn3 基于神經網絡的非線性最優控制 然而,實際控制對象的數學模型往往含有不確定性因素。如果模型的不確定性超過一定范圍,控制系統就變得不穩定,這樣不可能由線性系統方程(30)構造的數學模型求得最優解。為解決方程(30)含有的不確定性因素,

12、本文引入了神經網絡的學習方法補償被控制對象數學模型的不確定性。3 基于神經網絡的非線性最優控制 神經網絡非線性最優控制器設計 圖1所示為本文設計的神經網絡伺服最優控制器結構圖。它由狀態觀測器,主控增益和反饋增益,兩個神經網絡(NNC,NNM)組成。其中,NNC網絡表示神經網絡控制補償器,完成最優控制律的補償作用,NNM表示神經網絡模型補償器,它完成原系統模型的不確定性補償作用。3 基于神經網絡的非線性最優控制 設NNM網絡的輸入信號為 ,輸出信號為 ;NNC網絡的輸入信號 輸出為 。系統參數A,B經過預估后,所得到系統模型表示為 (34) NNM和NNC兩個網絡經過訓練以后,并入系統,且狀態觀

13、測器的狀態方程和最優控制律分別表示為 (35) (36)3 基于神經網絡的非線性最優控制 其中,M表示主控增益,K表示反饋增益陣, 表示系統誤差, 表示指令信號, 表示系統的實際輸出。 (37) 現在的問題是如何調整網絡權值,使3 基于神經網絡的非線性最優控制3 基于神經網絡的非線性最優控制()NNC和NNM的學習算法 設一個NN網絡模型如圖2所示, 為第n層節點的總數,網絡的輸入為 ,隱層的第j個節點的輸出為 ,輸出層的第k個節點的輸出為 , 和 分別為輸入層第i個節點到隱層的第j個節點和隱層的第j個節點到輸出層的第K個節點的連接權值,則有如下關系: (38) (39)3 基于神經網絡的非線

14、性最優控制 其中,隱層激活函數為 ,輸出層的節點激活函數為3 基于神經網絡的非線性最優控制()建模網絡NNM的學習算法 模型網絡NNM訓練主要取決于實際對象響應 與估計響應 的接近程度。因此,本文選取下面誤差函數為訓練網絡的指標函數: (40) 利用最速下降法修正網絡的權值: (41)3 基于神經網絡的非線性最優控制 分別是(42)(43)(44)3 基于神經網絡的非線性最優控制 其中, 為學習率,3 基于神經網絡的非線性最優控制()控制網絡NNC的學習算法 網絡NNC與原線性最優控制律式(32)并聯,以補償式(30)中模型不確定性引起的控制誤差。如果對象的動態模型能由式(30)精確地表達,那

15、么NNC網絡的輸出應為零,這樣NNC網絡的訓練誤差函數仍保持 為最小,因此訓練NNC網絡的性能指標為: (45)3 基于神經網絡的非線性最優控制 式(45)中 在t時刻是未知的,但可用估計值 取代它,于是訓練NNC的誤差函數定義為 (46) 仍用最速下降法修正NNC的權值: (47) (48)3 基于神經網絡的非線性最優控制 式(47)和(48)中, 為學習率, 表示網絡權值, 表示動量因子, 計算如下: 首先設建模網絡NNM的非線性映射定義為 即 (49) 而控制模型NNC非線性映射定義為 ,即 (50)3 基于神經網絡的非線性最優控制很容易從式(35)和(37)獲得: (51) (52)因

16、而有: (53)3 基于神經網絡的非線性最優控制 式中, 的計算與網絡NNM學習算法相同,直接對NNC網絡的各節點求導數獲得,其中 表示NNC網絡 和 的權值。 而 可通過NNM網絡求偏導得出: 由式(38)(39) 得: (54) 由(54)式可推導出 (55)3 基于神經網絡的非線性最優控制 系統的實驗仿真 本文對新的控制器進行了數字仿真,以驗證所提控制算法的正確性和適應范圍。控制算法計算步驟如下: 1)初始化 2)測量 3)NNM學習階段由4144式計算 4)計算3 基于神經網絡的非線性最優控制5)NNC學習階段由4748式計算6)令 ,返回2) 。 例1 設被控對象為如下表示的非線性時

17、不變系統。 3 基于神經網絡的非線性最優控制其中,參數a表示控制非線性的程度。假設原線性系統的參數估計為:3 基于神經網絡的非線性最優控制選取 用方程(33)解Riccati方程得到: (60)仿真時,控制性能指標: (61)其中 (62)3 基于神經網絡的非線性最優控制 每當t=100步時,給被控對象加入一個隨機干擾信號 ,以檢查系統的狀態響應,比較傳統的LOR(線性最優調節器)和本文提出的神經網絡最優控制(NNLC)器性能。如果控制器性能優良,則 收斂于零。3 基于神經網絡的非線性最優控制 例2 設非線性程度 時,圖3表示了用LOR方法的仿真結果,圖中,控制輸入u和狀態響應 在下一個干擾加

18、入前均不收斂于零,這說明LOR方法對模型具有不確定性,非線性,受到干擾時其魯棒性較差。圖4表明了用NNLC方法仿真結果(仿真中使用了兩個三層BP網絡,其中NNM網結構: 即4-30-2網絡結構;3 基于神經網絡的非線性最優控制 NNC結構: 即3-30-1網絡,學習率 ,初始神經網絡權值 從圖4中表明控制輸入u,狀態響應 均能在下一次干擾出現前收斂于零,保證了系統的穩定性控制。3 基于神經網絡的非線性最優控制 下面分別是圖3 LOR控制的仿真結果和圖4 NNLC控制的仿真結果。3 基于神經網絡的非線性最優控制 例3 伺服控制仿真,在所有參數同例1的情況下,我們取不同的非線性參數 ,來驗證所提方法的有效性。如 ,指令信號 時的伺服跟蹤輸出響應見圖5所示。3 基于神經網絡的非線性最優控制下面分別是圖5 輸出響應曲線和圖6 作用輸出響應。3 基于神經網絡的非線性最優控制 圖6所示, 時的輸出響應曲線。圖7所示, 時的響應曲線,其中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論