第三章變分法泛函極值問題_第1頁
第三章變分法泛函極值問題_第2頁
第三章變分法泛函極值問題_第3頁
第三章變分法泛函極值問題_第4頁
第三章變分法泛函極值問題_第5頁
已閱讀5頁,還剩102頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三章用變分法解最優控制

—泛函極值問題

整理課件本章主要內容3.1變分法根底3.2無約束條件的泛函極值問題3.3有約束條件的泛函極值——動態系 統的最優控制問題3.4小結返回主目錄整理課件在動態系統最優控制問題中,性能指標是一個泛函,性能指標最優即泛函到達極值。解決泛函極值問題的有力工具是變分法。所以下面就來列出變分法中的一些主要結果,大局部不加證明,但讀者可對照微分學中的結果來理解。整理課件3.1變分法根底

如果對某一類函數中的每一個函數,有一個實數值與之相對應,則稱為依賴于函數的泛函,記為粗略來說,泛函是以函數為自變量的函數。1、泛函:先來給出下面的一些定義。整理課件

若對任給的,存在當時,就有則稱在處是連續的。

2、泛函的連續性:

整理課件滿足下面條件的泛函稱為線性泛函這里是實數,和是函數空間中的函數。

3、線性泛函:

整理課件4、自變量函數的變分:自變量函數的變分是指同屬于函數類中兩個函數、之差這里,t看作為參數。當為一維函數時,可用圖3-1來表示。整理課件圖3-1自變量函數的變分整理課件這里,是的線性泛函,若時,有,則稱是泛函的變分。是的線性主部。當自變量函數有變分時,泛函的增量為

5、泛函的變分:整理課件6、泛函的極值:

若存在,對滿足的 一切X, 具有同一符號,則稱在處有極值。整理課件

定理:在處有極值的必要條件是對于所有容許的增量函數(自變量的變分),泛函在處的變分為零為了判別是極大還是極小,要計算二階變分。但在實際問題中根據問題的性質容易判別是極大還是極小,故一般不計算。整理課件3.2無約束條件的泛函極值問題3.2.1泛函的自變量函數為標量函數的情況

為簡單起見,先討論自變量函數為標量函數(一維)的情況。我們要尋求極值曲線,使下面的性能泛函取極值(3-1)整理課件于是泛函J的增量可計算如下(以下將*號省去)上式中是高階項。為此,讓自變量函數、在極值曲線、附近發生微小變分、,即整理課件

根據定義,泛函的變分是的線性主部,即對上式第二項作分部積分,按公式可得(3-2)整理課件

J取極值的必要條件是等于零。因是任意的,要使(3-2)中第一項(積分項)為零,必有(3-3)上式稱為歐拉——拉格朗日方程。〔3-2〕式中第二項為零的條件要分兩種情況來討論:整理課件

1、固定端點的情況

這時,它們不發生變化,所以。而(3-2)中第二項可寫成當時,(3-4)式自然為零。(3-4)整理課件2、自由端點的情況

這時和可以發生化,,而且可以獨立地變化。于是要使(3-2)中第二項為零,由(3-4)式可得(3-6)(3-5)整理課件因為這里討論是標量函數的情況,和也是標量,且是任意的,故(3-5)、(3-6)可化為〔3-7〕、〔3-8〕稱為橫截條件。(3-8)(3-7)整理課件當邊界條件全部給定(即固定端點)時,不需要這些橫截條件。當 給定時,不要(3-8)。當 給定時,不要(3-7)。整理課件3.2.2泛函的自變量函數為向量函數的情況

現在,將上面對是標量函數時所得到的公式推廣到是n維向量函數的情況。這時,性能泛函為(3-9)(3-10)式中整理課件向量歐拉——拉格朗日方程為(3-11)式中泛函變分由〔3-2〕式改為整理課件

(當和時)橫截條件為〔自由端點情況〕整理課件

例3-1取極值的軌跡。求通過點〔0,0〕及〔1,1〕且使整理課件

即它的通解形式為式中:這是固定端點問題,相應的歐拉——拉格朗日方程為整理課件

由初始條件,可得A=0。再由終端條件,可得,因而極值軌跡為整理課件

例3-2求使指標

取極值的軌跡,并要求,但對沒有限制。整理課件解即常數于是是常數,則是時間的線性函數,令由可得,又終端是自由的,由式(3-7)可得橫截條件為這是終端自由的情況。歐拉—拉格朗日方程為整理課件容易驗證時,對應局部極小;時,,對應局部極大。由上式解得或。時的極值軌跡為;時的極值軌跡為。即整理課件3.3有約束條件的泛函極值

——動態系統的最優控制問題前面討論泛函極值問題時,對極值軌跡沒有附加任何約束條件。但在動態系統最優控制問題中,極值軌跡必須滿足系統的狀態方程,也就是要受到狀態方程的約束。考慮下列系統(3-13)整理課件這是綜合指標。我們要求出最優控制和滿足狀態方程的極值軌跡,使性能指標取極值。式中,為維狀態向量,為維控制向量(這里假定不受限制.否則不能用變分法求解,而要用極小值原理或動態規劃法求解)是n維連續可微的向量函數。性能指標如下:(3-14)整理課件

在下面的討論中,假定初始時刻和初始狀態 是給定的,終端則可能有幾種情況。我們將就幾種常見的情況來討論,即給定,自由和自由,屬于一個約束集。整理課件3.3.1終端時刻給定,終端狀態自由(3-16)(3-15)與有約束條件的函數極值情況類似,引入待定的n維拉格朗日乘子向量函數將狀態方程〔3-13〕寫成等式約束方程的形式整理課件

與以前不同的是,在動態問題中拉格朗日乘子向量是時間函數。在最優控制中經常將稱為伴隨變量,協態(協狀態向量)或共軛狀態。引入后可作出下面的增廣泛函(3-17)整理課件

于是有約束條件的泛函的極值問題化為無約束條件的增廣泛函的極值問題。(3-18)再引入一個標量函數它稱為哈密頓〔Hamilton〕函數,在最優控制中起著重要的作用整理課件

于是可寫成(3-19)對上式積分號內第二項作分部積分后可得整理課件 設、相對于最優值、的變分分別為和 因為自由,故還要考慮變分。下面來計算由這些變分引起的泛函的變分 。整理課件為極小的必要條件是:對任意的、、,變分等于零。由(3-18)及(3-20)可得下面的一組關系式整理課件(協態方程)(3-21)(狀態方程)(3-22)(控制方程)(3-23)(橫截條件)(3-24)整理課件

(3-21)~(3-24)即為取極值的必要條件,由此即可求得最優值,,。 (3-22)式即為狀態方程,這可由的定義式(3-18)看出,實際解題時無需求,只要直接用狀態方程即可,這里為形式上對稱而寫成(3-22)式。〔3-21〕與〔3-22〕一起稱為哈密頓正那么程。整理課件

(3-23)是控制方程,它表示在最優控制處取極值。注意,這是在為任意時得出的方程,當有界且在邊界上取得最優值時,就不能用這方程,這時要用極小值原理求解。 (3-24)是在固定、自由時得出的橫截條件。當固定時,,就不需要這個橫截條件了。橫截條件表示協態終端所滿足的條件。整理課件在求解〔3-21〕~〔3-24〕時,我們只知道初值和由橫截條件〔3-24〕求得的協態終端值,這種問題稱為兩點邊值問題,一般情況下它們是很難求解的。因為不知道,如果假定一個,然后正向積分(3-21)~(3-24),則在時的值一般與給定的不同,于是要反復修正的值,直至與給定值的差可忽略不計為止。整理課件 非線性系統最優控制兩點邊值問題的數值求解是一個重要的研究領域。對于線性系統兩點邊值問題的求解,那么可尋找缺少的邊界條件并只要進行一次積分,下面的例3-4給出了求解過程。

整理課件例3-3設系統狀態方程為的邊界條件為。求最優控制,使下列性能指標為最小。整理課件

解這里、均給定,故不需要橫截條件(3-24)式。作哈密頓函數那么協態方程和控制方程為即整理課件故可得正那么方程對正那么方程進行拉氏變換,可得(3-25)(3-26)(3-27)由〔3-25〕式可求得整理課件

于是,解出為(3-28)代入〔3-26〕,即得整理課件(3-29)反變換可求得整理課件將〔3-28〕代入〔3-26〕可得

故整理課件

由,從上式可得把代入(3-29),可得,而最優控制為整理課件設系統的狀態方程為要求確定最優控制,使指標泛函例3-4初始條件為取極小值終端條件為自由整理課件這里是自由的,所以要用到橫截條件〔3- 24〕式,因終端指標

解:作哈密頓函數由〔3-21〕~〔3-23〕可求得所以(3-30)(3-31)整理課件將代入狀態方程,可得即得(3-32)整理課件邊界條件為(3-37)(3-36)(3-35)(3-34)(3-33)整理課件

(3-39)(3-38)(3-40)(3-41)可見這是兩點邊值問題,對正那么方程〔3-33〕~〔3-36〕進行拉氏變換,可得整理課件代入初始條件,,可得故由〔3-38〕~〔3-41〕可解出整理課件

同樣可解得

利用終端條件,,由(3-42)、(3-43)可得(3-43)(3-42)整理課件

由上二式可解出

由〔3-42〕式可得最優狀態軌跡整理課件 由〔3-43〕式可得最優協態

由〔3-32〕式可得最優控制同理還可求出整理課件圖3-2最優控制和最優狀態軌跡解整理課件

注意,這個系統是線性定常系統,這種線性兩點邊值問題的解可以通過尋找缺少的邊界條件,并且進行一次積分而求得其解。對非線性兩點邊值問題,那么要借助于迭代方法產生一個序列,來屢次修正缺少的初始條件的試探值,直到滿足兩點邊值的條件。圖3-2是最優解的軌跡曲線。整理課件3.3.2終端時刻自由,終端狀態受約束

設終端狀態滿足下面約束方程(3-46)(3-45)(3-44)性能指標為其中整理課件引入n維拉格朗日乘子向量函數和維拉格朗日乘子向量,作出增廣性能泛函

將代入(3-47),可得(3-49)(3-48)(3-47)引入哈密頓函數整理課件與固定時的情況不同,現在由、、和所引起。這里不再為零,而可計算如下(參見圖3-3):(3-51)則(3-50)令整理課件圖3-3各種變分的表示整理課件(3-52)令整理課件一是在時函數相對的變化.另一是因的變化所引起的函數值的變化量后者可用它的線性主部來近似。注意,這里和不同,故*號不能省去。上式表明由兩部分組成:整理課件

現在來計算(只計算到一階小量)。整理課件上式中方括號外的下標*表示、、是最優值、、。是上式的線性主部,故整理課件

對第三項作分部積分,可得整理課件第四項可表示為〔忽略二階小量〕整理課件

上式最后一個等號用到了(3-52)式。表示的自變量取最優值時的值。根據上面的結果可得整理課件取極值的必要條件為因、、、為任意,故得〔省去*號〕(協態方程)(3-53)(狀態方程)(3-54)(控制方程)(3-55)(橫截方程)(3-56)整理課件與固定情況相比,這里多了一個方程,,用它可求出最優終端時間。

(3-57)整理課件要求確定最優控制,使最小。例3-5設系統狀態方程為邊界條件為自由性能指標為整理課件

解這是自由問題。終端狀態固定,是滿足約束集的特殊情況,即作哈密頓函數整理課件正那么方程是控制方程是整理課件將代入,可得因邊界條件全部給定,故不用橫截條件。確定最優終端時刻的條件〔3-57〕式為整理課件因為由正則方程,所以,于是最優控制再由正則方程,可得由上式求得整理課件

由初始條件,求得,故最優軌跡為以終端條件代入上式,即求得最優終端時刻整理課件火箭發射最優程序問題。設火箭在垂直平面內運動,加速度與水平面夾角為,是控制作用,見圖3-4。令

例3-6(水平速度)(垂直速度)(水平距離)(垂直高度)整理課件圖3-4火箭發射示意圖整理課件忽略重力和空氣阻力時,系統的狀態方程和初始條件為(3-58)整理課件要求選擇最優控制程序,使性能指標自由終端狀態為為最小。整理課件 因為要求最小,故是自由問題。由給 定的終端狀態可得三個約束方程為解(3-59)整理課件

作哈密頓函數協態方程為(3-60)整理課件

橫截條件為即整理課件上式右端矩陣中的自變量已省略。由(3-59)式求出上式中的偏導數,可得協態的終值為(3-61)整理課件

常數積分協態方程可得常數整理課件代入協態終值條件后,得故(3-62)整理課件由控制方程,得(3-63)即整理課件下面來積分狀態方程(3-58),為此將自變量變成。由(3-63)式得為了確定最優程序,還需確定拉格朗日未定常數、。整理課件將上面關系代入狀態方程,即得積分上面兩式得整理課件由初始條件可求得(3-64)(3-65)整理課件

將上面的和代入狀態方程(3-58)的后兩式,積分并經較復雜運算得

(3-66)(3-67)整理課件

(注:另一解為,但這時由(3-67)式可得出與給定終端條件不符,故略去的解)由終端條件和(3-65)式得

故(3-68)整理課件由〔3-63〕式得于是(3-70)故(3-69)整理課件將終端條件和(3-69)式代入(3-64)式,可得(3-71)整理課件將終端條件,(3-69)式和(3-71)式代入(3-67)式可得(3-72)整理課件現在歸納一下所得的結果:由(3-72)式可確定,由(3-71)式確定最短時間,由(3-70)式即可求得最優推力方向角。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論