最優控制——變分法


 

第一章 最優控制基礎

1、一般的最優化問題要最小化的性能指標定義在數域上,而變分問題的性能指標(目標泛函)的定義域是函數的集合。

2、 泛函:從任意定義域到實數域或復數域的映射。泛函的定義域是函數集,值域是數集,也就是說,泛函是從函數空間到數域的一個映射

3、最優控制問題的四個基本元素:狀態方程、容許控制、目標集、性能指標

其中狀態方程(關於狀態變量和控制變量的常微分方程)

 

是最優控制問題與經典變分問題的重要區別之一

4、經典變分問題需要連續的控制變量--->之后的極小值原理處理不連續控制變量、狀態變量或者控制變量有約束的情況--->更復雜的非線性狀態方程、控制變量不可微等      動態規划方法

5、無確定模型的最優控制方法:強化學習與自適應動態規划、模型預測控制、微分博弈、平行控制

第二章 最優控制方法

1、直接變分法 實質:以函數為輸入,以實數為輸出

在局部范圍內對最優解加以”擾動“,再考察性能指標是否發生變化。利用微積分取極限的思想。

(鏈式法則,先對x求,再對x'求,以及分步積分巴拉巴拉復習一下

2、拉格朗日的delata方法,加以擾動,對比最優曲線和擾動后的曲線,看新的性能指標是不是會<最優的,若是極值點,這個增量應該總是>=0的,在該點足夠小的鄰域內是幾乎為0的

得出

 

問題:可能導致擾動后x落在定義域之外,結論不再有效

3、拉格朗日乘子法和KKT條件

 

第三章 變分法

1、函數變分:函數的增量 delta x    

泛函增量:J(x+delta x)-J(x)    類比計算極值的時候函數值的差

線性泛函:若滿足齊次性條件和可加性條件,則稱之為線性泛函

若泛函增量可以寫成函數變分的線性泛函及其高階無窮小項的兩部分加和,則稱泛函對函數x可微,且其中的線性泛函就是泛函變分。

2、泛函極值的必要條件

駐點條件:泛函變分為0(反證法,前提是定義域是開集) 

適用場景:控制變量可在全空間中任意取值沒有約束,容許控制為連續函數全體。

不適用場景:控制變量或其分量取值於實數空間中的閉區間

3、最簡變分法:(歐拉-拉格朗日方程)

 

求變分不止可以用看線性泛函和高階無窮小,還可以用微積分的方法求解:

 

4、 歐拉-拉格朗日方程是關於狀態x的二階微分方程

分為三種情況:

三種結果:

 

5、hamilton方程組

物理學家將歐拉-拉格朗日這個二階微分方程化成了一階常微分方程組

6、等式約束的處理

拉格朗日乘子法

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM