【論文網】
最優控制理論是研究和解決從一切可能的控制方案中尋找最優解的一門學科,解決最優控制問題的主要方法有古典變分法、極小值原理和動態規划。最優控制理論已被應用於綜合和設計最速控制系統、最省燃料控制系統、最小能耗控制系統、線性調節器等。同時,這篇綜述也闡釋了幾種常見方法之間的關系。
1、最優控制問題基本介紹
最優控制是使控制系統的性能指標實現最優化的基本條件和綜合方法,是現代控制理論的核心之一,是從大量實際問題中提煉出來的。它所研究的問題可以概括為:對一個受控的動力學系統或運動過程,從一類允許的控制方案中找出一個最優的控制方案,使系統的運動在由某個初始狀態轉移到指定的目標狀態的同時,其性能指標最優。最優控制是最優化方法的一個應用。從數學意義上說,最優化方法是一種求極值的方法,即在一組約束為等式或不等式的條件下,使系統的目標函數達到極值,即最大值或最小值。從經濟意義上說,是在一定的人力、物力和財力資源條件下,是經濟效果達到最大(如產值、利潤),或者在完成規定的生產或經濟任務下,使投入的人力、物力和財力等資源為最少。
控制理論發展到今天,經歷了古典控制理論和現代控制理論兩個重要發展階段,現已進入了以大系統理論和智能控制理論為核心的第三個階段。對於確定性系統的最優控制理論,實際是從20世紀50年代才開始真正發展起來的,它以1956年原蘇聯數學家龐特里亞金(Pontryagin)提出的極大值原理和1957年貝爾曼提出的動態規划法為標志。時至今日,隨着數字技術和電子計算機的快速發展,最優控制的應用已不僅僅局限於高端的航空航天領域,而更加滲入到生產過程、軍事行動、經濟活動以及人類的其他有目的的活動中,對於國民經濟和國防事業起着非常重要的作用。
對於靜態優化的方法,解決的主要是如何求解函數的極值問題;變分法則被用來求解泛函的極值問題;極小值原理的方法,適用於類似最短時間控制、最少燃料控制的問題。另外,還有線性系統二次型指標的最優控制,即線性二次型問題。與解析法相比,用最優控制理論設計系統有如下的特點:
(1)適用於多變量、非線性、時變系統的設計。
(2)初始條件可以任意。
(3)可以滿足多個目標函數的要求,並可用於多個約束的情況。
2、最優控制的求解方法
2.1 變分法
變分法是求解泛函極值的一種經典方法,可以確定容許控制為開集的最優控制函數,也是研究最優控制問題的一種重要工具。掌握變分法的基本原理,還有助於理解以最小值原理和動態規划等最優控制理論的思想和內容。
但是,變分法作為一種古典的求解最優控制的方法,只有當控制向量u(t)不受任何約束,其容許控制集合充滿整個m維控制空間,用古典變分法來處理等式約束條件下的最優控制問題才是行之有效的。在許多實際控制問題中,控制函數的取值常常受到封閉性的邊界限制,如方向舵只能在兩個極限值范圍內轉動,電動機的力矩只能在正負的最大值范圍內產生等。因此,古典變分法不適於解決許多重要的實際最優控制問題。
2.2 最小值原理
極小值原理是對經典變分法的擴展,可以解決經典變分法無法解決的最優控制問題。也就是當控制有約束,哈密頓函數H對U不可微時,要用極小值原理。所得出的最優控制必要條件與變分法所得的條件的差別,僅在於用哈密頓函數在最優控制上取值的條件代替,可以看出,后者可以作為前者的特殊情況。其他條件包括正則方程,橫截條件,邊界條件等都一樣。需要注意的是,極小值原理解決最短時間控制問題時,最短時間的控制量只能取約束的邊界值+1或-1;而最少燃料控制的控制量可取邊界值+1、-1、0。
用極小值原理解非線性系統的最優控制將導致非線性兩點邊值問題,這類問題求解是很困難的。即使系統是線性的,但當指標函數是最短時間、最少燃料這種形式,要求得到最優控制的解析表達式,並構成反饋控制(即把U(t)表示為X(t)的函數)也是非常困難的。 若系統是線性的,指標函數是二次型的,可以求得線性最優反饋控制率。
2.3 動態規划
動態規划又稱為多級決策理論,是貝爾曼提出的一種非線性規划方法。它將一個多級決策問題化為一系列單極決策問題,從最后一級狀態開始到初始狀態為止,逆向遞推求解最優決策。動態規划法原理簡明,適用於計算機求解,在許多理論問題的研究中,都應用到動態規划的思路。
動態規划是求解最優化問題的重要方法,在應用動態規划時,有一個前提條件是系統的狀態變量必須滿足“無后效性”。所謂無后效性的概念是:在任一時刻,系統狀態為x(),以后的狀態僅決定於x()以及x()到達終點時刻的狀態x()的控制策略,而與以前的狀態和以前的控制策略無關。因此,在應用動態規划方法時,要注意狀態變量的選取,使之滿足“無后效性”的條件。例如,討論物體在空間運動時,不僅選用物體的空間位置座位狀態變量,而且要將速度變量也包括在狀態變量之內,以便滿足“無后效性”的條件。動態規划法的局限性還表現在所謂的“維數災難”問題:當狀態變量的維數增加,要求計算機內存成指數倍增長,計算工作量也大大增加。此外,求解連續決策過程采用的動態規划法得到的哈密頓-雅克比方程是偏微分方程,求解x()也是相當困難的。動態規划雖然提供的是充分條件,但是,由於連續型系統的哈密頓-雅克比方程難於求解而不能滿足實際需要。
2.4 線性二次型最優控制
線性二次型問題的實用意義在於:把它所得到的最優反饋控制與非線性系統的開環最優控制結合起來,可減少開環控制的誤差,達到更精確的控制的目的。
與經典控制問題相比,線性二次型問題有兩個顯著的特點:第一,它研究的是多輸入多輸出動態系統的控制問題,其中包括了作為特例的單輸入單輸出情形;第二,它的性能指標是綜合性的,既包含有誤差的成分,又包含有控制能量的成分。根據線性的最優反饋控制律,即控制量正比與狀態變量,可寫成或。把這種線性二次型問題的最優控制與非線性系統的開環控制結合起來,還可減少開環控制的誤差。線性二次型問題的最優控制一般可分狀態調節器問題和伺服跟蹤問題兩大類。
對於終端時刻tf有限的連續系統狀態調節器問題,要求加權陣P、Q為對稱半正定,R為對稱正定,但並不要求系統完全可控。
3、三種方法之間的相互關系
動態規划法、極小值原理和變分法,都是求解最優控制問題的重要方法。由動態規划的哈密頓-雅克比方程,可以推得變分法中的歐拉方程和橫截條件:也可以推得極小值原理的必要條件。
變分法對解決開集約束的最優控制問題十分有效,但對於處理閉集性約束就無能為力了。變分法與極小值原理都可以解微分方程所描述的變分問題作為目標,結果得出了一組常微分方程所表示的必要條件。這三種方法要求的條件不同,其中屬動態規划要求最高。在所要求的條件都滿足的情況下,使用這三種方法所得結論相同。
參考文獻
[1] 胡壽松-最優控制理論與系統[M].(第二版)北京:科學出版社,2005.
[2] 張蓮-現代控制理論.北京:清華大學出版社,2008.1.
[3] 於長官-現代控制理論及應用.哈爾冰工業大學出版社,2005.1.
[4] 舒欣梅-現代控制理論基礎.西安:西安電子科技大學出版社,2008.2.
[5] 劉豹-現代控制理論.(3版)北京:機械工業出版社,2006.7.
