版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章緒論
第一章緒論一、最優控制簡介二、最優控制發展過程三、最優控制應用舉例四、小結五、本科程主要內容返回主目錄一、最優控制簡介
在生產過程、軍事行動、經濟活動以及人類的其他有目的的活動中,常需要對被控系統或被控過程施加某種控制作用以使某個性能指標達到最優,這種控制作用稱為最優控制。二、最優控制發展過程
以後,拉塞爾(LaSalle)發展了時間最優控制的理論,即所謂Bang—Bang控制理論。1953至1957年間美國學者貝爾曼(Bellman)創立了“動態規劃”理論,發展了變分學中的哈密頓—雅可比(Hamilton—Jacobi)理論。
上世紀五十年代初期布紹(Bushaw)研究了伺服系統的時間最優控制問題。1956至1958年間蘇聯學者龐特裏雅金等創立了“極大值原理”。這兩種方法成為了目前最優控制理論的兩個柱石。
時至今日,最優控制理論的研究無論在深度上和廣度上都有了很大的發展,例如發展了對分佈參數系統、隨機系統、大系統的最優控制理論的研究等等。三、最優控制應用舉例例1-1火車快速運行問題。設有一列火車從甲地出發,要求算出容許的控制使其到達乙地的時間最短。火車的運動方程(1-1)
(1-2)式中,是火車的品質,是火車的加速度,為使旅客舒適,其值有限制。是產生加速度的控制作用(即推力),其值也應有限制,設選擇使為最小。初始條件(1-3)終端條件(1-4)性能指標(1-5)
月球軟著陸問題。為了使太空船在月球表面上實現軟著陸(即著陸時速度要為零),要尋求著陸過程中發動機推力的最優控制規律,使得燃料的消耗最少。設飛船的品質為,離月球表面的高度為,飛船的垂直速度為,發動機推力為,月球表面的重力加速度為,設不帶燃料的飛船品質為,初始燃料的品質為
,則飛船的運動方程可表示為(參見圖1-1)例1-2
圖1-1月球軟著陸最優控制問題(1-6)式中
為比例係數,表示了推力與燃料消耗率的關係。
控制目的是使燃料消耗量最小,即飛船在著陸時的品質保持最大,即為最大。(1-10)
容許控制(1-9)
終端條件
(1-8)初始條件
(1-7)例1-3
是初始時刻的商品存貨量,且。從的實際意義來看,顯然必須選取生產率使得(1-13)
生產計畫問題。設表示商品存貨量,表示對商品的需求率,是已知函數,表示生產率,它將由計畫人員來選取,故是控制變數。滿足下麵的微分方程(1-12)(1-11)其次,生產能力應該有限制,即容許控制為(1-14)這裏表示最大生產率,另外為了保證滿足需求,必須有
由到的總成本為要求尋找最優控制,使總成本最小。(1-15)(1-16)
假定每單位時間的生產成本是生產率的函數,即。設是單位時間儲存單位商品的費用,於是,單位時間的總成本為四、小結:
由上面的例子可見,求解最優控制問題時要給定系統的狀態方程,狀態變數所滿足的初始條件和終端條件,性能指標的形式(時間最短、消耗燃料最小,誤差平方積分最小等)以及控制作用的容許範圍等。其中,為維狀態向量,為維控制向量,為維向量函數,它可以是非線性時變向量函數,也可以是線性定常的向量函數。狀態方程必須精確的知道。
用數學語言來比較詳細地表達最優控制問題的內容:
(1)建立被控系統的狀態方程(1-17)
而到達終端的時刻和狀態則因問題而異。
(2)確定狀態方程的邊界條件。一個動態過程對應於維狀態空間中從一個狀態到另一個狀態的轉移,也就是狀態空間中的一條軌線。在最優控制中初態通常是知道的,即(1-18)(1-19)例如,在流水線生產過程中,是固定的;在飛機快速爬高時,只規定爬高的高度,而是自由的,要求越小越好。終端狀態一般屬於一個目標集,即當終端狀態是固定的,即時,則目標集退化為維狀態空間中的一個點。而當終態滿足某些約束條件,即這時處在維狀態空間中某個超曲面上。若終態不受約束,則目標集便擴展到整個維空間,或稱終端狀態自由。(1-20)上述性能指標包括兩個部分,即積分指標和終端指標,這種綜合性指標所對應的最優控制問題稱為波爾紮(Bolza)問題。當只有終端指標時,稱為邁耶爾(Mayer)問題;當只有積分指標時,稱為拉格朗日(Lagrange)問題。
(3)選定性能指標。性能指標一般有下麵的形式:(1-21)
性能指標的確定因問題的性質而異。在導彈截擊目標的問題中,我們要求彈著點的散佈度最小,這時可用終端指標來表示。在快速控制問題時,要求系統從一個狀態過渡到另一個狀態的時間最短,即,這就是積分指標。
性能指標是控制作用的函數,也就是函數的函數,這種以函數為引數的函數稱為泛函,所以又稱為性能泛函。有的文獻中也把性能指標稱為代價函數、目標函數等等。(4)確定控制作用的容許範圍,即
是維控制空間中的一個集合。例如,控制飛機的舵偏角是受限制的,控制電機的電流是受限制的,即有。這時控制作用屬於一個閉集。當不受任何限制時,稱它屬於一個開集。下麵將看到處理這兩類問題的方法是不同的。可稱為容許集合,屬於的控制則稱為容許控制。(1-22)
(5)按一定的方法計算出容許控制將它施加於用狀態方程描述的系統,使狀態從初態轉移到目標集中的某一個終態,並使性能指標達到最大或最小,即達到某種意義下的最優。五、本課程主要內容
課程將介紹求解最優控制問題的方法:經典變分法,極大(小)值原理,動態規劃法,線性二次型最優控制(系統為線性,指標為狀態和控制的二次型),線性二次型高斯控制(系統為線性且有高斯雜訊,指標為二次型),奇異最優控制,微分對策控制(系統受雙方控制),最優魯棒控制等。本書還將介紹最優控制的一些基本的數值求解方法,最後介紹一些MATLAB在求解最優控制問題中的應用實例。第二章靜態優化——函數的極值問題本章主要內容:2.1無約束條件的函數極值問題2.2有約束條件的函數極值問題2.3小結2.4習題2.1無約束條件的函數極值問題一元函數極值問題二元函數極值問題多元函數極值問題一元函數的極值問題
一元函數在處取極值的必要條件為
(2-1)當
(2-2)
為極小。
當(2-3)
為極大。
為簡單起見,今後我們將只討論極小,式(2-1)和(2-2)一起構成為極小值的充分條件。當時,也可能有極小值,不過要檢驗高階導數。
上述情況可用圖2-1來表示。R點是局部極小點,又是總體極小點,U只是局部極小點,T是局部極大點,S是拐點,不是極值點。圖2-1函數的極值點和拐點
例2-1求使
最小的x。解:
故解使達到極小。本例是著名的最小二乘問題。二元函數極值問題
下麵考慮二元函數的極值問題。設在處取得極小值,記,這裏(T表示轉置,X是列向量)。在處取得極小值的必要條件和充分條件可如下求得。將在周圍展開為泰勒級數
(2-4)式中
表示高階無窮小。將(2-4)式用向量矩陣形式表示
(2-5)式中,(2-6)
由(2-5)式可知,取極值的必要條件為
(2-7)
進一步,若(2-8)
則這個極值為極小值。由於是任意的不為零的向量,要使(2-8)式成立,由矩陣理論可知,二階導數矩陣(又稱為Hessian陣)必須是正定的。正定陣形式上可表示為(2-9)(2-7)和(2-9)一起構成了在處取極小值的充分條件。
多元函數極值問題設n個變數的多元函數為
式中
則在處有極小值的必要條
件為一階導數向量等於零向量,即進一步,若二階導數矩陣是正定陣,即(2-11)則這個極值是極小。
式(2-10)和(2-11)一起構成了多元函數在處取極小值的充分條件。由(2-11)式可知,是實對稱矩陣。判別實對稱矩陣是否為正定有兩個常用的方法。一是檢驗的特徵值,若特徵值全部為正,則是正定的。另一是應用塞爾維斯特(Sylvest)判據。根據此判據,若的各階順序主子式均大於零,即
(2-12)則就是正定的。det表示A陣的行列式。例2-2求下麵的多元函數的極值點解
由上面三個方程求得可能的極值點為
二階導數陣為
用塞爾維斯特判據來檢驗,有
故為正定,在處,為極小。2.2有約束條件的函數極值問題
前面討論函數的極值問題時,向量的各個分量可獨立地選擇,相互間無約束。本節將討論的各分量滿足一定約束條件的情況。
設具有個n變數的多元函數為
X的各分量滿足下麵的m個等式約束方程
(2-13)
若能從m個約束方程中解出m個X的分量,即將它們用其他n-m個的X分量表示,那麼X中只剩下n-m個獨立變數。於是問題可化為求n-m個變數的多元函數的無約束極值問題。這就是所謂的“消去法”。
由於從m個方程(一般是非線性方程)求出m個分量常常是困難的,故經常採用“拉格朗日乘子法”。為此,對個約束方程,引入個拉格朗日乘子,並作出一個輔助函數—拉格朗日函數。
若令
則(2-14)式可用向量形式表示為
(2-15)
於是的條件極值問題就化為的無條件極值問題。函數L有極值的必要條件為
例2-3求從原點(0,0,0)至平面
的最短距離。解原點至空間任何一點的距離的平方為
要使極小,而點必須在所規定的平面上。
這是一個條件極值問題。作拉格朗日函數
極值的必要條件為
聯立求解上面四個方程可得
可能的極值點座標為
根據問題的性質可以判斷極小值存在且是唯一的。故上面的即是極小點的座標。將極小點座標代入函數中,即可求出最短距離的平方為此問題的約束方程是、、的線性函數,因此容易用“消去法”來求極值點。
例如,從中解出,將它用、表示,於是問題就化為求二元函數的無條件極值問題。讀者可自行驗證這樣做的結果與拉格朗日乘子法的結果是一樣的。
例2-4動態控制問題的參數化法。設一個動態系統由下麵的非線性狀態方程描述給定,終止時間t=0.5s,要求算出最優控制,它使得指標函數
為最小。解:這是動態控制問題,這裏將控制作用參數化,於是可用靜態最優化的方法求解。
設控制作用可用下麵的級數來逼近是已知的時間函數集,如sin、cos、Hermite多項式等正交函數或其他線性無關的函數。於是可用N個參數來表示,即被參數化了。確定就等於確定N個參數,使指標J最小。這裏可用數值尋優的方法來確定參數。2.3小結
1.n個變數的多元函數取無約束極小值的必要條件為,充分條件為和。
2.在滿足約束條件時的極小值的求取,可用拉格朗日乘子法,令是拉格朗日乘子(列)向量。2.4習題
1.求使得最大的。
2.求使為極值的極值點。
3.求使為極值的極值點。
4.求使且
5.求原點到曲線的距離為最小。
6.求函數極值,若
7.在第一象限內作橢球面
的切平面,使切平面與三座標面所圍成的四面體體積最小,求切點的座標。第三章用變分法解最優控制
—泛函極值問題
本章主要內容3.1變分法基礎3.2無約束條件的泛函極值問題3.3有約束條件的泛函極值——動態系 統的最優控制問題3.4小結返回主目錄
在動態系統最優控制問題中,性能指標是一個泛函,性能指標最優即泛函達到極值。解決泛函極值問題的有力工具是變分法。所以下麵就來列出變分法中的一些主要結果,大部分不加證明,但讀者可對照微分學中的結果來理解。3.1變分法基礎
如果對某一類函數中的每一個函數,有一個實數值與之相對應,則稱為依賴於函數的泛函,記為粗略來說,泛函是以函數為引數的函數。1、泛函:先來給出下麵的一些定義。
若對任給的,存在當時,就有則稱在處是連續的。
2、泛函的連續性:
滿足下麵條件的泛函稱為線性泛函這裏是實數,和是函數空間中的函數。
3、線性泛函:
4、引數函數的變分:
引數函數的變分是指同屬於函數類中兩個函數、之差
這裏,t看作為參數。當為一維函數時,可用圖3-1來表示。圖3-1引數函數的變分
這裏,是的線性泛函,若時,有,則稱是泛函的變分。是的線性主部。
當引數函數有變分時,泛函的增量為
5、泛函的變分:6、泛函的極值:
若存在,對滿足的 一切X, 具有同一符號,則稱在處有極值。
定理:
在處有極值的必要條件是對於所有容許的增量函數(引數的變分),泛函在處的變分為零為了判別是極大還是極小,要計算二階變分。但在實際問題中根據問題的性質容易判別是極大還是極小,故一般不計算。3.2無約束條件的泛函極值問題3.2.1泛函的引數函數為標量函數的情況
為簡單起見,先討論引數函數為標量函數(一維)的情況。我們要尋求極值曲線,使下麵的性能泛函取極值(3-1)於是泛函J的增量可計算如下(以下將*號省去)上式中是高階項。為此,讓引數函數、在極值曲線、附近發生微小變分、,即
根據定義,泛函的變分是的線性主部,即對上式第二項作分部積分,按公式可得(3-2)J取極值的必要條件是等於零。因是任意的,要使(3-2)中第一項(積分項)為零,必有(3-3)上式稱為歐拉——拉格朗日方程。(3-2)式中第二項為零的條件要分兩種情況來討論:
1、固定端點的情況
這時,它們不發生變化,所以。而(3-2)中第二項可寫成當時,(3-4)式自然為零。(3-4)2、自由端點的情況
這時和可以發生化,,而且可以獨立地變化。於是要使(3-2)中第二項為零,由(3-4)式可得(3-6)(3-5)
因為這裏討論是標量函數的情況,和也是標量,且是任意的,故(3-5)、(3-6)可化為(3-7)、(3-8)稱為橫截條件。(3-8)(3-7)
當邊界條件全部給定(即固定端點)時,不需要這些橫截條件。當 給定時,不要(3-8)。當 給定時,不要(3-7)。3.2.2泛函的引數函數為向量函數的情況
現在,將上面對是標量函數時所得到的公式推廣到是n維向量函數的情況。這時,性能泛函為(3-9)(3-10)式中
向量歐拉——拉格朗日方程為(3-11)式中泛函變分由(3-2)式改為
(當和時)橫截條件為(自由端點情況)
例3-1
取極值的軌跡。求通過點(0,0)及(1,1)且使
解
即它的通解形式為
式中:這是固定端點問題,相應的歐拉——拉格朗日方程為
由初始條件,可得A=0。再由終端條件,可得,因而極值軌跡為
例3-2
求使指標
取極值的軌跡,並要求,但對沒有限制。解即常數於是是常數,則是時間的線性函數,令
由可得,又終端是自由的,由式(3-7)可得橫截條件為這是終端自由的情況。歐拉—拉格朗日方程為容易驗證時,對應局部極小;時,,對應局部極大。由上式解得或。時的極值軌跡為;時的極值軌跡為。
即3.3有約束條件的泛函極值
——動態系統的最優控制問題前面討論泛函極值問題時,對極值軌跡沒有附加任何約束條件。但在動態系統最優控制問題中,極值軌跡必須滿足系統的狀態方程,也就是要受到狀態方程的約束。考慮下列系統(3-13)這是綜合指標。我們要求出最優控制和滿足狀態方程的極值軌跡,使性能指標取極值。式中,為維狀態向量,為維控制向量(這裏假定不受限制.否則不能用變分法求解,而要用極小值原理或動態規劃法求解)是n維連續可微的向量函數。性能指標如下:(3-14)
在下面的討論中,假定初始時刻和初始狀態 是給定的,終端則可能有幾種情況。我們將就幾種常見的情況來討論,即給定,自由和自由,屬於一個約束集。3.3.1終端時刻給定,終端狀態自由(3-16)(3-15)與有約束條件的函數極值情況類似,引入待定的n維拉格朗日乘子向量函數
將狀態方程(3-13)寫成等式約束方程的形式
與以前不同的是,在動態問題中拉格朗日乘子向量是時間函數。在最優控制中經常將稱為伴隨變數,協態(協狀態向量)或共軛狀態。引入後可作出下麵的增廣泛函(3-17)
於是有約束條件的泛函的極值問題化為無約束條件的增廣泛函的極值問題。(3-18)再引入一個標量函數它稱為哈密頓(Hamilton)函數,在最優控制中起著重要的作用
於是可寫成(3-19)對上式積分號內第二項作分部積分後可得
設、相對於最優值、的變分分別為和 因為自由,故還要考慮變分。下麵來計算由這些變分引起的泛函的變分 。
為極小的必要條件是:對任意的、、,變分等於零。由(3-18)及(3-20)可得下麵的一組關係式(協態方程)(3-21)(狀態方程)(3-22)(控制方程)(3-23)(橫截條件)(3-24)
(3-21)~(3-24)即為取極值的必要條件,由此即可求得最優值,,。
(3-22)式即為狀態方程,這可由的定義式(3-18)看出,實際解題時無需求,只要直接用狀態方程即可,這裏為形式上對稱而寫成(3-22)式。(3-21)與(3-22)一起稱為哈密頓正則程。
(3-23)是控制方程,它表示在最優控制處取極值。注意,這是在為任意時得出的方程,當有界且在邊界上取得最優值時,就不能用這方程,這時要用極小值原理求解。
(3-24)是在固定、自由時得出的橫截條件。當固定時,,就不需要這個橫截條件了。橫截條件表示協態終端所滿足的條件。
在求解(3-21)~(3-24)時,我們只知道初值和由橫截條件(3-24)求得的協態終端值,這種問題稱為兩點邊值問題,一般情況下它們是很難求解的。
因為不知道,如果假定一個,然後正向積分(3-21)~(3-24),則在時的值一般與給定的不同,於是要反復修正的值,直至與給定值的差可忽略不計為止。
非線性系統最優控制兩點邊值問題的數值求解是一個重要的研究領域。對於線性系統兩點邊值問題的求解,則可尋找缺少的邊界條件並只要進行一次積分,下麵的例3-4給出了求解過程。
例3-3
設系統狀態方程為的邊界條件為。求最優控制,使下列性能指標為最小。
解
這裏、均給定,故不需要橫截條件(3-24)式。作哈密頓函數則協態方程和控制方程為即
故可得正則方程對正則方程進行拉氏變換,可得(3-25)(3-26)(3-27)由(3-25)式可求得
於是,解出為(3-28)代入(3-26),即得(3-29)反變換可求得
將(3-28)代入(3-26)可得
故
由,從上式可得把代入(3-29),可得,而最優控制為設系統的狀態方程為要求確定最優控制,使指標泛函例3-4初始條件為取極小值終端條件為自由
這裏是自由的,所以要用到橫截條件(3- 24)式,因終端指標
解:作哈密頓函數由(3-21)~(3-23)可求得所以(3-30)(3-31)將代入狀態方程,可得
即得(3-32)邊界條件為(3-37)(3-36)(3-35)(3-34)(3-33)
(3-39)(3-38)(3-40)(3-41)
可見這是兩點邊值問題,對正則方程(3-33)~(3-36)進行拉氏變換,可得代入初始條件,,可得故由(3-38)~(3-41)可解出
同樣可解得
利用終端條件,,由(3-42)、(3-43)可得(3-43)(3-42)
由上二式可解出
由(3-42)式可得最優狀態軌跡
由(3-43)式可得最優協態
由(3-32)式可得最優控制同理還可求出圖3-2最優控制和最優狀態軌跡解
注意,這個系統是線性定常系統,這種線性兩點邊值問題的解可以通過尋找缺少的邊界條件,並且進行一次積分而求得其解。
對非線性兩點邊值問題,則要借助於迭代方法產生一個序列,來多次修正缺少的初始條件的試探值,直到滿足兩點邊值的條件。圖3-2是最優解的軌跡曲線。3.3.2終端時刻自由,終端狀態受約束
設終端狀態滿足下麵約束方程(3-46)(3-45)(3-44)性能指標為其中
引入n維拉格朗日乘子向量函數和維拉格朗日乘子向量,作出增廣性能泛函將代入(3-47),可得(3-49)(3-48)(3-47)引入哈密頓函數
與固定時的情況不同,現在由、、和所引起。這裏不再為零,而可計算如下(參見圖3-3):(3-51)則(3-50)令圖3-3各種變分的表示(3-52)令一是在時函數相對的變化.另一是因的變化所引起的函數值的變化量後者可用它的線性主部來近似。注意,這裏和不同,故*號不能省去。上式表明由兩部分組成:
現在來計算(只計算到一階小量)。
上式中方括弧外的下標*表示、、是最優值、、。是上式的線性主部,故
對第三項作分部積分,可得
第四項可表示為(忽略二階小量)
上式最後一個等號用到了(3-52)式。表示的引數取最優值時的值。根據上面的結果可得
取極值的必要條件為因、、、為任意,故得(省去*號)(協態方程)(3-53)(狀態方程)(3-54)(控制方程)(3-55)(橫截方程)(3-56)
與固定情況相比,這裏多了一個方程,,用它可求出最優終端時間。
(3-57)要求確定最優控制,使最小。例3-5設系統狀態方程為邊界條件為自由性能指標為
解這是自由問題。終端狀態固定,是滿足約束集的特殊情況,即作哈密頓函數正則方程是控制方程是將代入,可得因邊界條件全部給定,故不用橫截條件。確定最優終端時刻的條件(3-57)式為
因為由正則方程,所以,於是最優控制再由正則方程,可得由上式求得
由初始條件,求得,故最優軌跡為以終端條件代入上式,即求得最優終端時刻
火箭發射最優程式問題。設火箭在垂直平面內運動,加速度與水平面夾角為,是控制作用,見圖3-4。令
例3-6(水準速度)(垂直速度)(水準距離)(垂直高度)圖3-4火箭發射示意圖
忽略重力和空氣阻力時,系統的狀態方程和初始條件為(3-58)要求選擇最優控制程式,使性能指標自由終端狀態為為最小。
因為要求最小,故是自由問題。由給 定的終端狀態可得三個約束方程為解(3-59)
作哈密頓函數協態方程為(3-60)
橫截條件為即上式右端矩陣中的引數已省略。由(3-59)式求出上式中的偏導數,可得協態的終值為(3-61)
常數積分協態方程可得常數代入協態終值條件後,得故(3-62)由控制方程,得(3-63)即
下麵來積分狀態方程(3-58),為此將引數變成。由(3-63)式得
為了確定最優程式,還需確定拉格朗日未定常數、。將上面關係代入狀態方程,即得積分上面兩式得由初始條件可求得(3-64)(3-65)
將上面的和代入狀態方程(3-58)的後兩式,積分並經較複雜運算得(3-66)(3-67)
(注:另一解為,但這時由(3-67)式可得出與給定終端條件不符,故略去的解)由終端條件和(3-65)式得故(3-68)由(3-63)式得於是(3-70)故(3-69)
將終端條件和(3-69)式代入(3-64)式,可得(3-71)
將終端條件,(3-69)式和(3-71)式代入(3-67)式可得(3-72)
現在歸納一下所得的結果:由(3-72)式可確定,由(3-71)式確定最短時間,由(3-70)式即可求得最優推力方向角。
由上面的計算可知,對於這樣一個比較簡單的例子求出解析解也是比較困難的。一般情況下可用數值積分法求解。3.4小結 1、
函數的函數叫做泛函。性能指標是控制作用的函數,故稱為性能泛函。和微分類似可引入泛函的變分。取極值的必要條件為。2、
泛函(為向量)取無約束極值的必要條件為(歐拉——拉格朗日方程)當、自由時,還有橫截條件(當和時)3、
求解動態系統的最優控制是一個求取有約束條件的泛函極值問題。系統的狀態方程就是狀態變數要滿足的一個約束方程,即
設系統狀態方程為,性能指標為,初始狀態給定,終端狀態滿足向量約束方程(包括給定的情況)。4、
則由變分法可得下麵的結果:
其中,稱為哈密頓函數。(1)終端時刻給定時,取極值的必要條件為(橫截條件)(控制方程)
正則方程有個變數,積分時要個邊界條件,初始條件給定時提供了個邊界條件,若也完全給定則又提供了個邊界條件,這時可不需要橫截條件,見例3-3。
當自由或部分分量自由就要靠橫截條件來提供缺少的邊界條件,見例3-4。(2) 終端條件自由,取極值的必要條件與給定時的不同處,僅在於多一個求最優終端時刻的條件(3-57)5、
用經典變分法求解最優控制時,假定不受限制,為任意,故得出控制方程
不滿足這種情況時,要用極小值原理或動態規劃求解。這些內容在下面的章節仲介紹。第四章極小值原理及其應用
4.1經典變分法的局限性
4.2連續系統的極小值原理4.3最短時間控制問題
4.4最少燃料控制問題4.5離散系統的極小值原理
4.6小結
4.1經典變分法的局限性
上面我們用經典變分法解最優控制問題時,得出了最優性的必要條件
在得出這個條件時,作了下麵的假定:是任意的,即不受限制,它遍及整個向量空間,是一個開集;是存在的。
在實際工程問題中,控制作用常常是有界的。如飛機舵面的偏角有限制,火箭的推力有限制,生產過程中的生產能力有限制等等。一般,我們可用下麵的不等式來表示iiMtu£)(這時屬於一個有界的閉集,寫成,為閉集。更一般的情況可用下麵的不等式約束來表示。
當屬於有界閉集,在邊界上取值時,就不是任意的了,因為無法向邊界外取值,這時就不一定是最優解的必要條件。考察由圖4-1所表示的幾種情況,圖中橫軸上每一點都表示一個標量控制函數,其容許取值範圍為。圖4-1有界閉集內函數的幾種形狀對於圖4-1(a)仍對應最優解。對於圖4-1(b)所對應的解不是最優解,最優解在邊界上。對於圖4-1(c)常數,由這個方程解不出最優控制來(這種情況稱為奇異情況),最優解在邊界上。另外,也不一定是存在的。例如狀態方程的右端對U的一階偏導數可能不連續,或由於有些指標函數,如燃料最優控制問題中,具有下麵的形式這時對U的一階偏導數不連續。
經典變分法無法處理上面的情況,必須另辟新的途徑。極小值原理就是解決這類問題的有力工具。用極小值原理求解控制無約束的最優控制問題和古典變分法是完全一樣的。1956年前蘇聯學者龐特裏雅金提出這個原理時,把它稱為極大值原理,目前較多地採用極小值原理這個名字。下麵給出這個原理及其證明,並舉例說明其應用。4.2連續系統的極小值原理
由於可以利用擴充變數的方法將各類最優控制問題化為定常系統,末值型性能指標情況下的標準形式。我們這裏只就定常系統、末值型性能指標、固定、末端受約束情況下給出極小值原理的簡單證明。設系統的狀態方程為
(4-1)
初始條件為
(4-2)控制向量,並受下麵的約束
(4-3)末值狀態必須滿足的約束條件為
(4-4)
(4-5)其中性能指標函數為為待定列向量。在本節中,假設函數,,,存在且連續,並假定容許控制是在控制域內取值的任何分段連續函數。這時如果選定了某一容許控制,則容易證明在任意的初始條件下,方程(4-1)唯一的確定了系統狀態的變化規律,且是連續的和分段可微的。在這些條件下,我們就定常系統、末值型性能指標、固定、末端受約束情況下給出極小值原理的簡單證明。證明:採用擾動法,即給最優控制一個變分,它將引起最優軌線的變分,並使性能指標有一增量,當為極小時,必有,由此即可導出最優控制所應滿足的必要條件。在變分法中,是微量,即將最優控制和鄰近的容許控制相比較,因而最多只能建立哈密頓函數的相對極小值性質。龐特裏亞金極大值原理卻將最優控制與控制域內所有可能的值進行比較,因而得出結論,在整個控制域內最優控制使哈密頓函數成為絕對極小值。正是這個性質使得龐特裏亞金極大值原理成為尋找最優控制的有力工具。但是這樣,的改變量必須看成有限量,而不再是微量。如果讓改變的時間很短,則由此引起的最優軌線的改變仍是微量,性能指標的增量也是微量,因而對各關係式的數學處理仍是比較容易的。設為最優控制,任選一時刻及一微量,在時間間隔中給一有限大小的改變量,且使得。現在研究由引起的最優軌線的變化。分為三段考慮:1在這一段中,,因而。2系統的狀態方程(4-1)可在初始條件下直接積分。當時,當時,兩式相減可得這一段的(4-6)可以對的大小作估計由於是微量,所以也是微量,因而在精確到一階微量的情況下,下式成立(4-7)將式(4-7)代入(4-6),並注意到微量在微小時間間隔上的積分是高階微量,即得在第二段時間間隔得終點,則有或(4-8)其中表示二階以上的微量。3這時又有,系統的狀態方程為而狀態變數的變分滿足方程
(4-9)引入變數及哈密頓函數(4-10)
(4-11)
(4-12)顯然,方程(4-9)和(4-11)為共軛方程,立即求得積分或(4-13)即最終求得了由於的有限改變而引起的最優軌線的變化,特別是末值狀態的變化。下麵研究由引起的最優性能指標的改變量。由於故有(4-14)綜合(4-8)、(4-12)、(4-13)和(4-14)等式,可以建立與有限改變量之間的關係已知中的任意時刻,並以表示,當時,上式變為,
,或用哈密頓函數的運算式(4-10)表示可得
(4-15)或於是定常系統、末值型性能指標、固定、末端受約束情況下極小值原理得以證明。總結上述討論,可將龐特裏雅金極小值原理寫為如下形式:定理(極小值原理):系統狀態方程(4-1)
初始條件
(4-2)控制向量,並受下麵的約束
(4-3)終端約束
(4-4)指標函數
(4-5)要求選擇最優控制,使取極小值。取極小值的必要條件是、、和滿足下麵的一組方程1正則方程
(協態方程)(4-16)
(狀態方程)(4-17)2邊界條件
(4-18)3橫截條件
(4-19)
4最優終端時刻條件
(4-20)在最優軌線和最優控制上哈密頓函數取極小值
(4-21)將上面的結果與用古典變分法所得的結果((3-34)~(3-38)式)對比可見,只是將這個條件用(4-21)代替,其他無變化。應該指出,當存在,且得出的絕對極小,如圖4-1(a)所示時,即為條件(4-21)式。所以極小值原理可以解決變分法所能解決的問題,還能解決變分法不能解決的問題。如何應用條件(4-21)式,這是一個關鍵,我們將用具體例子來說明。4.3最短時間控制問題
節省時間意味著提高生產率或先發制人取得軍事行動的勝利。所以人們很早就開始了對最短時間控制的研究,這方面的研究結果很多,這裏先就簡單的重積分系統的最短時間控制展開討論。在前面的緒論中列舉了火車快速行駛問題。設火車品質m=1,把運動方程寫成狀態方程形式,令可化為下麵的最短時間控制問題。例4-1重積分系統的最短時間控制狀態方程
(4-22)初始條件為
(4-23)終端條件為
(4-24)控制約束為
(4-25)求出使性能指標
(4-26)取極小的最優控制。解
;因為控制作用有限制(屬於有界閉集),故要用極小值原理求解。取哈密頓函數
(4-27)協態方程為
(4-28)
(4-29)積分上面兩個方程可得
(4-30)
(4-31)其中,、是積分常數。由的運算式(4-27)可見,若要選擇使取極小,只要使越負越好,而,故當,且與反號時,取極小,即最優控制為由此可見,最優解取邊界值+1或-1,是開關函數的形式。什麼時候發生開關轉換,將取決於的符號。而由(4-31)式可見,是的線性函數,它有四種可能的形狀(見圖4-2),也相應有四種序列
由圖4-2可見,當為的線性函數時最多改變一次符號。圖4-2與的四種形狀從上面兩式消去t,即可得相軌跡方程
(4-33)當時,狀態方程的解為
(4-32)下麵來求出取不同值時的狀態軌跡(也稱為相軌跡)。在圖4-3中用實線表示,不同的C值可給出一簇曲線。由(4-32)第一式知增大時增大,故相軌跡進行方向是自下而上,如圖中曲線上箭頭所示。當時,狀態方程的解為
(4-34)消去,可得相軌跡方程圖4-3相軌跡圖在圖4-3中用虛線表示。因增大時,減少,故相軌跡進行方向是自上而下。兩簇曲線中,每一簇中有一條曲線的半支進入原點。在的曲線簇中,通過原點的曲線方程為
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2021年桂林电子科技大学汉语国际教育专业《现代汉语》期末试卷B(有答案)
- 雷达电子对抗技术及其运用研究
- 《MIMO产品介绍》课件
- 《白雪歌李清清》课件
- 新团员知识培训课件材料
- 文学社工作总结范文(29篇)
- 非机动车安全管理协议书范本
- 中国成功企业的管理奥秘课件
- 危废仓库管理制度(2篇)
- “皖南八校”2025届高三第二次大联考 数学试卷(含答案解析)
- 人教版2024-2025学年第一学期八年级物理期末综合复习练习卷(含答案)
- 辽宁省沈阳市2023-2024学年五年级上学期语文期末考试试卷(含答案)
- 反间谍主题班会
- 特种设备培训计划及方案
- 财务机构代理出口退税合同范本
- (高鸿业)微观经济学习题解析+微观经济学题库解析
- 2024年北京北师大实验中学初三(上)期中物理试题及答案
- 2025年中国资管行业市场全景评估及未来投资趋势预测报告(智研咨询)
- 购货者资格审核制度
- 专项12-全等模型-手拉手-专题训练
- 《建筑工程设计文件编制深度规定》(2022年版)
评论
0/150
提交评论