最优控制中的变分法_第1页
最优控制中的变分法_第2页
最优控制中的变分法_第3页
最优控制中的变分法_第4页
最优控制中的变分法_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 最优控制中的变分法最优控制中的变分法4.1.2 泛函及其定义域泛函及其定义域若对于某类函数中的所有函数若对于某类函数中的所有函数 ,变量,变量 都有一确定的都有一确定的值与之对应,则称值与之对应,则称 为依赖于函数为依赖于函数 的泛函,记作的泛函,记作)(txJJ)(tx)(txJJ 如图,平面上给定两点之间的如图,平面上给定两点之间的曲线长度是一个泛函。曲线长度是一个泛函。1xloyo0 x0y1y图图4-1 平面上给定两点间的曲线长度平面上给定两点间的曲线长度AB)(xy设两点间曲线长度为设两点间曲线长度为取单位弧长取单位弧长 ,则有,则有lJ 单位弧长变化率单位弧长变化率则两点间曲线长

2、度则两点间曲线长度其值取决于函数其值取决于函数 的选取的选取dl22)()(dydxdl21ydydxdxylxyJxx1021)()(xy定义定义 4-10 设设 为为 线性赋范空间,线性赋范空间, 为实数集,若存在一为实数集,若存在一一对对应关系一对对应关系nRnRRyRxxJyn,),(4-1)则则 称为称为 到到 的泛函算子。的泛函算子。)(xJnRRnRxxxJxJxxJ212121,),()()(4-2)nRxxJxJ),()(4-3)则则 称为线性泛函算子。称为线性泛函算子。)(xJ若式若式(4-1)满足下列线性条件:满足下列线性条件:4.1.3 泛函的变分泛函的变分定义定义 4

3、-13 设设 是线性赋范空间是线性赋范空间 上的连续泛上的连续泛 函,若其增量可表示为函,若其增量可表示为 (4-6)式中式中 是关于是关于 的线性连续泛函,的线性连续泛函, 是是关于关于 的高阶无穷小,则的高阶无穷小,则 称为泛函称为泛函 的变分。的变分。)(xJnR),(),()()()(xxrxxLxJxxJxJ),(xxLx),(xxrx)(xJ),(xxLJ定理定理4-1 设设 是线性赋范空间是线性赋范空间 上的连续泛函,若在上的连续泛函,若在处处 是可微的,是可微的, ,则其变分为,则其变分为)(xJnR0 xx )(xJnRxx0,10 ,| ),(),(000 xxJxxJ(4

4、-7)P12 例例2-1fttdttxxLJ0),(fttdtxxLxxLJ0得到得到定义定义4-14 设设 是线性赋范空间是线性赋范空间 上的连续泛函,若在上的连续泛函,若在 处二次可微,其中处二次可微,其中 ,则泛函的二次微分,则泛函的二次微分称为泛函称为泛函 在在 处的二次变分,记为处的二次变分,记为)(xJnR0 xx ),(02xxJnnRxRx0,)(xJ0 xx 定理定理4-2 设设 是线性赋范空间是线性赋范空间 上的连续泛函,若在上的连续泛函,若在 处处 是二次可微的,则其二次变分为是二次可微的,则其二次变分为)(xJnR0 xx )(xJ220002(,)(,)|, 01J

5、xxJ xx(4-8)4.1.4 泛函极值与变分引理泛函极值与变分引理(1) 泛函极值的定义泛函极值的定义定义定义4-15 设设 是线性赋范空间是线性赋范空间 中某个子集中某个子集 上的线上的线性连续泛函,点性连续泛函,点 ,若存在某一正数,若存在某一正数 ,使集合,使集合在在时,均有时,均有则称泛函则称泛函 在在 处达到极小值。处达到极小值。)(xJnRDDx 0nRxxxxxU,|),(00DxUx),(00)()()(0 xJxJxJ)(xJ0 xx 若若则称泛函则称泛函 在在 处达到极大值。处达到极大值。0)()()(0 xJxJxJ)(xJ0 xx 定理定理4-3 设设 是在线性赋范

6、空间是在线性赋范空间 中某个开子集中某个开子集 上定上定义的可微泛函,且在义的可微泛函,且在 处达到极值,其中处达到极值,其中 ,则泛函则泛函 在在 处必有处必有(4-11) 0 xx )(xJnRD)(xJnnRxRx0,0 xx 0),(0 xxJ定理定理4-4 设设 是在线性赋范空间是在线性赋范空间 中某个开子集中某个开子集 上定上定义的可微泛函,且在义的可微泛函,且在 处存在二次变分,其中处存在二次变分,其中 如果如果 (4-12) 则泛函则泛函 在在 处达到极小值处达到极小值0 xx )(xJnRD)(xJnnRxRx0,0 xx 200(,)0,(,)0J xxJ xx(2)泛函极

7、值的必要条件与一次变分)泛函极值的必要条件与一次变分(3)泛函极小值的充要条件与二次变)泛函极小值的充要条件与二次变分分定理定理4-5 设设 是时间区间是时间区间 上的上的 维连续向量函数,若维连续向量函数,若对于对于 维任意的连续向量函数维任意的连续向量函数 ,其边界条件为,其边界条件为均有均有则则)(t(4-14)10,ttnn)(t0)()(10tt0)(10dttttT10, 0)(tttt(4)变分引理)变分引理4.2.1 无约束泛函极值的必要条件4.2 欧拉方程研究使泛函0( )( , , )fttJ xL x x t dt(4 15)达到极小值的问题.其中nxR0, ft t(

8、)x t,在时间区间上,及被积函数 连续可微.要求确定( , , )L x x t一个容许函数 ,使泛函 取极小值.用几何语言说,要求找出一条容许曲线 ,使给定函数 沿 的积分取极小值.*( )x t*( )x t( , , )L x x t*( )x t(4 15)如果 代表控制系统的状态向量,则式 代表系统的性能指标.变分问题是要求在状态空间中确 定一条最优轨线,使给定性能指标 达到极小值 ( )x t(4 15)(4 15)由于控制问题是多种多样的,因而变分问题也不尽相同.假定现在考虑最简单的两端固定问题,其 及 固定,两点边界条件已知为:0tft则无约束泛函极值问题可以描述如下.00(

9、),()ffx txx tx(4 16)问题4-1 无约束泛函极值问题为0min( )( , , )fttxJ xL x x t dt(417)式中 及 在 上连续可微, 及 固定.已知 ,求满足式(4-17)的极值轨线 .( , , )L x x t( )x t0,ftt0tft00(),(),( )nffx txx txx tR*( )xt设 是满足边界条件(4-16)的极值轨线, 是 邻域中的一条容许轨线,如图(4-2)所示 . 与 之间有下列关系:*( )x t*( )x t*( )x t( )x t( )x t*( )( )( )( )( )( )x tx tx tx tx tx t

10、( 41 8 )( 41 9 )( )x tfx0 x00tftxx*x以及*000*()()()()fffx txtxx txtx式中 是 的一次变分, 是 的一次变分.( )x t( )x t( )x t( )x t将式(4-18)和式(4-19)代入泛函(4-15),则有0*()(,)fttJxLxxxx t d t(420)因为被积函数 连续可微,所以泛函 连续可微.只要 任意逼近 ,必可求出使泛函(4-20)取极值的必要条件.( )L ( )J x( )x t*( )x t定理4-6 对于问题4-1,使性能泛函(4-15)取极值的必要条件,是轨线 满足下列欧拉方程:( )x t0Ld

11、Lxdtx(421)证明 对于式(4-20),由于 及 连续可微,故可将 在极值轨线 处展成泰勒级数( )L ( )x t( )L *( )x t*(, )(, )()()TTx xx xLLL xx xx tL x x txxHOTxx式中HOT代表泰勒展开式中的高阶项.于是,泛函增量可表示为0*( )()( ) (, )( , )fttJ xJ xxJ xL xx xx tL x x t dt0()()ftTTtLLxxHOT dtxx由定义4-13知,泛函变分是泛函增量的线性主部,故0()()ftTTtLLJxx dtxx(422)利用分部积分公式,式(4-22)中的第二项为000()(

12、)()TfffTTttttttLLdLxdtxxdtxxdtx(423)于是,式(4-22)可写为00()()ffttTTttLdLLJxdtxxdtxx(424)由定理4-3知,泛函取极值的必要条件是 .再由变分定理4-5知,由于 任意,故式(4-24)为零等价于0Jx0LdLxdtx(425)以及000()()()()( )0fTftTTft tt ttLLLxx tx txxx(426)式(4-25)即为要求证的欧拉方程,或称欧拉-拉格朗日方程,而式(4-26)则是求解时变非线性二阶欧拉方程(4-25)所需要的两点边界值.对于问题4-1,因为两端固定,必有0( )0,()0fx tx t

13、因此式(4-26)自然成立.求解式(4-25)所需的两点边界值就是问题4-1中已知的端点条件: 和00( )x tx()ffx tx式(4-26)一般称为横截条件例 4-2 设泛函2220( )( )( )J xx tx t dt边界条件(0)0, ()22xx求使泛函达到极值的极值轨线 .*( )xt解 对于本例22( , , )L x x txx根据欧拉方程(4-25),得0 xx其通解为12( )cossinx tctct代入已知边界条件,求出 因此,泛函极值只能在下列极值轨线上实现 120,2cc*( )2sinx tt4.2.2 有等式约束的泛函极值的必要条件在求解实际系统的最优控制

14、问题时,要求使性能泛函取极值的极值轨线,同时满足系统的微分方程式.因此控制系统的最优问题,是要求确定在微分方程等式约束条件下的泛函极值,即条件极值的变分问题在讨论条件极值的变分问题时,先考虑两端固定问题.设性能泛函为拉格郎日问题,系统运动微分方程取为( , , )0f x x t (427)式中 , 为 维向量函数.于是,有等式(4-27)约束的泛函极值问题可以描述如下.nxR( )f n问题 4-2 有等式约束的泛函极值问题为0min( )( , , )fttxJ xg x x t dt(428). st( , , )0f x x t (429)式中 及 在 上连续可微, 及 固定.已知 ,

15、 , , .求满足式(4-28)及式(4-29)的极值轨线 .( , , )g x x t( )x t0 ,ft t0tft00( )x tx()ffx tx( )nfR nxR*( )x t如果引入拉格朗日乘子向量,可以把有约束的泛函极值问题化为无约束的泛函极值问题,则由定理4-6立即可得条件泛函极值的必要条件定理 4-7 对于问题4-2,在约束条件(4-29)下,使泛函(4-28)取极值的必要条件,是轨线 满足方程( )x t0LdLxdtx(430)式中( , , , )( , , )( ) ( , , )TL x xtg x x tt f x x t(431)在式(4-31)中, ,为

16、待定拉格 朗日乘子向量. nR证:设 为待定拉格朗日乘子,构造广义泛函( )ntR0 ( , , )( ) ( , , )ftTatJg x x tt f x x t dt令拉格朗日函数( , , , )( , , )( ) ( , , )TL x xtg x x tt f x x t则广义泛函可表示为0( , , , )ftatJL x xt dt于是,原性能泛函的条件极值问题转化为广义泛函的无条件极值问题.根据定理4-6,立即得到式(4-30).由于两端固定,因此求解欧拉方程(4-30)的两点边界值,就是问题4-2中已知的两点边界条件, 及00( )x tx()ffx tx在应用定理4-7

17、时,若将式(4-31)代入式(4-30),则欧拉方程形式为() () 0TTgfdgfxxdtxx(432)如果问题4-2中的约束方程为( , )0f x t 则欧拉方程(4-32)简化为() 0Tgfdgxxdtx(433)例4-3 设人造地球卫星姿势控制系统的状态方程为010( )( )( )001x tx tu t 性能泛函取为2201( )2Jut d t边界条件1(0 )1x 0(2 )0 x求使性能泛函取极值的极值轨线 和极值控制*( )xt*( )ut解 由题意212gu1122010001xxfuxx 令12则拉格朗日标量函数2121221( , , , )()()2TL x

18、utgfuxxux欧拉方程1110LdLxdtx12220LdLxdtx20LdLuudtu解得1a2atb uatb式中常数a,b待定.由状态约束方程2( )x tuatb2121( )( )2x tx tatbtc32111( )62x tatbtctd221( )2x tatbtc式中积分常数 将待定.代入已知边界条件,求得 , c d3,3.5,1,1abcd于是,极值轨线*32117( )124xtttt *2237( )122xttt极值控制*( )33.5utt最优乘子*2( )33.5tt *1( )3t泛函极值22*01( )15.52Jut dt4.2.3 泛函极小值的充分

19、条件欧拉方程只是泛函取极值的必要条件.为了确定极值的性质,需要给出泛函取极小值的充分条件.(1)无约束情况定理 4-8 对于问题4-1,使性能泛函(4-17)成立的充分条件是:欧拉方程应成立,下列等价勒德让条件之一应成立:(保证 )12222220()TLLxx xLLx xx (434)20J2222220,0LdLLxdtx xx (435)3222220,0LdLLxdtx xx (436)证明 泛函增量*( )()( *)J xJ xxJ x0* (, )(, )fttL xx xx tL xx t dt在极值轨线处,泰勒级数展开式22*21(, )(, )()()2TTTTLLLLL

20、 xx xx tL x x txxxxxxxxxx x 222()TTTLLxxxxx xx (437)将式(4-37)代入 ,取二次项,得泛函 的二次变分JJ0222222122ftTTTtLLLJxxxxxx dtxx xx (438)式(4-38)为二次型积分式,可改写为0222222212()ftTTtTLLxxx xJxxdtxLLx xx (439)由定理4-4知,在式(4-17)成立时,泛函取极小值的充分条件是 ,因此本定理结论1成立.20J若对式(4-38)被积函数的第二项进行分部积分,因dxxdt(440)故002222ffttTTttLLxxdtxd xx xx x 002

21、22ffttTTttdLLxxdtxxdtx xx x (441)由于两端固定, ,所以将式(4-41)代入式(4-38)得0( )()0fx tx t0022222211()22ffttTTTttLdLLJxxdtxxdtxdtx xx (442)由式(4-42)可见,当本定理结论2或3成立时,必有20J(2)有约束情况定理 4-9 对于问题4-2 ,在约束条件(4-29)下,使性能泛函(4-28)成立的充分条件是:除欧拉方程应成立外,下列等价勒德让条件之一应成立:12222220()TLLxx xLLx xx (443)2222220,0LdLLxdtx xx (444)3222220,0

22、LdLLxdtx xx (445)式中 满足式(4-31), 为 维拉格朗日乘子向量.( , , , )Lx xtn证明 令 ,构造广义泛函( )ntR0( , , , )ftatJL x xt dt式中 满足式(4-31).因为 连续可微,故在极值轨线处,可将广义泛函 展开成泰勒级数,类似于定理4-8的证明过程,立即证得本定理结论( , , , )L x xt( , , , )L x xtaJ例 4-4 设性能泛函为22 21( )()J xx tx dt边界条件(1)1, (2)2xx求使性能泛函 为极小值的最优轨线( )J x*( )xt解 本题为两端固定,无约束泛函的极小值问题.先求泛

23、函极值.由题意2( , , )L x x txx算得20,1 2LLxtxx 22220,2LLtx xx 由定理4-6,欧拉方程为2(12)0LdLdxtxdtxdt 于是2122112,2ccxtc xtt 式中11(1)2cc为待定常数.不难解得极值轨线*12( )cx tct代入已知的边界条件,解出常数122,3cc 故使泛函为极值的极值轨线*2( )3xtt然后,利用定理4-8判断泛函 在 上是否为极小值.因为( )J x*( )x t2220LdLxdtx x 22220,1,2Lttx 所以满足勒德让条件2,求出的 为最优轨线,相应的泛函极小值 *( )x t2*216( *)3

24、Jxdtt4.3 横截条件求解欧拉方程,需要提供两点 边界值.两端固定且初始时刻和末端时刻同时固定只是最简单的情况.在多数控制工程中,初始时刻往往是固定的.本节讨论末端时刻固定和末端时刻自由时的各种横截条件.并简要介绍初始时刻自由时的横截条件.4.3.1 末端时刻固定时的横截条件当末端时刻固定时,由泛函极值的必要条件可知,横截条件的一般表达式为(4-26),即00()()()()0fTTfttLLx tx txx只要不是两端固定时,宗量变分 和 不可能同时为零,使泛函一次变分 所缺少的条件,就应当由极值的基本 必要条件来补足:或是 ,或是 .如果把初始状态称为起点,把末端状态称为终点,则因:

25、()fx t0()x t0J()0fTtLx0()0TtLx起点固定时,000( ),( )0;x txx t起点自由时,0( )0;x t终点固定时,(),()0;fffx txx t终点自由时,()0;fx t表4-1 末端时刻固定时的横截条件(由4-26)序号名 称横截条件1 固定起点和终点2 自由起点和终点3 自由起点和固定终点4 固定起点和自由终点00( ), ()ffx txx tx00, ()fftLx txx00( ),0ftLx txx00,0fttLLxx在工程问题中, 一般表示运动轨迹,如飞机或导弹的飞行轨迹( )x t000()()()()0fTTfttLLJx tx

26、txx4.3.2 末端时刻自由时的横截条件末端自由是指末端时刻 不固定,末端 状态或自由、或受约束,属于变动端点问题ft在变端点问题中,可以证明,极值仅在欧拉方程的解 上 达到, 其中 和 为求解欧拉方程的待定系数,由横截条件给出,因此,泛函极值由 一类函数 确定12( , ,)xx t c c1c2c12(, , )x xt c c例如敌机按预定轨迹 飞行,我防空导弹从 时刻发射追击敌机,末端时刻 是无法事先规定的,但要求 以 保证击落敌机.这就是 自由、末端受约束的变分问题( )c t0tft()()ffx tc tft如图 4-3所示.在图4-3中, 为极值轨线, 为 邻域内的任一条容许

27、轨线, 表示起点,点 到点 则表示变动端点, 表示端点约束曲线, 表示末端时刻变分,为微变量.*( )xt( )x t*( )xt00(, )x t(,)ffxt(,)ffffxx tt( )c tft( )x t*( )ffxtx*()fxt0( )x t0( )c tfx()fx t( )x t*( )xtft0tftfftt由图4-3知,在末端受约束时,存在如下近似关系式( )( )ffffx txx tt (446)和()fffxc tt (447)如果末端自由,由于约束曲线 不存在,则仅存在近似关系式(4-46)( )c t通过点 的容许轨线形成一个容许轨线束 ,泛函 在该束曲线上转

28、换成 常数 和末端时刻 的函数.因为容许轨线束 在所考虑的极值曲线 的邻域内形成一个中心场所以00(, )x t1 ( ,)J x t c1cft1( , )xx t c1( , )xx t c*( )xt可由 和 的值求出束中的极值曲线 ,求得泛函极值ftfx*( )xt设性能泛函如式(4-15)所示, 与 之间关系如式(4-18)和式(4-19)所示,当末端由 位置移动到 位置时,产生如下泛函增量:( )x t*( )xt(,)ffxt(,)ffffxxtt00( *, *, )( *, *, )ffftttttJL xx xx t dtL xxt dt0( *, *, ) ( *, *,

29、 )( *, *, )fffftttttL xx xx t dtL xx xx tL x x t dt(448)式(4-48)右端第一项,根据积分中值定理可变换为( *, *, )( *, *, )fffffttft tttL xx xx t dtL xx xx tt式中 由于函数 是连续的,因此 01( )L 1( *, *, )( *, *, )ffft tttL xx xx tL xxt当 , ,有 ,故0ft0fx101( *, *, )( *, *, )ffffttffttL xx xx t dtL xx ttt (449)对于(4-48)右端第二项,将被积函数在极值轨线出展开成泰勒

30、级数,有00 ( *, *, )( *, *, )()()ffttTTttLLL xx xx tL x x t dtxx HOT dtxx(450)对式(4-50)中的第二项进行分部积分,得000()()()ffftttTTTtttLLd Lxdtxxdtxxdt x(451)将式(4-51)代入式(4-50),所得结果代入式(4-48),同时将式(4-49)代入式(4-48),取泛函增量的线性主部,得泛函的一次变分00()()( *, *, )fffttTTftttLd LLJxdtxL x x ttxdt xx由定理(4-3),令 ,得末端变动, 自由时泛函极值的必要条件0Jft0Ld L

31、xdt x(452)00()( ) ()( )( *, *, )0ffTTfftttLLx tx tL x x ttxx以及(453)式(4-52)称为欧拉方程,可见 自由、末端变动时的欧拉方程形式与 固定时的欧拉方程完全相同,这一结论同样适用于有等式约束的泛函极值问题ftft式(4-53)称为横截条件,除提供求解欧拉方程所需的两点边界值外,还提供了一个确定最优末端时刻 所需的边界条件。*ft末端时刻自由、末端状态变动时的横截条件,可分为如下两种情况讨论。(1)起点固定,末端自由由于 ,故 。在末端自由情况下,由式(4-46)知00( )x tx0( )0 x t( )( )ffffx txx

32、 tt 将上式及 代入式(4-53),得0( )0 x t()()( *, *, )0ffTffffttLxx ttL xxttx整理得()()0ffTTffttLLLxtxxx(454)在式(4-54)中,因 及 任意,故横截条件为ftfx( )0fTtLLxtx()0ftLx 00( )x tx(2)起点固定,末端受约束设末端约束方程为()()ffx tc t此时, 不能任意。由式(4-47)知fx()fffxc tt 于是在式(4-54)基础上,横截条件进一步演化为( )()( )()0fffTTTfffftttLLLLxttc ttLcxtxxx(456)在式(4-56)中,因 任意,

33、故横截条件为ft()0fTtLLcxx()()ffx tc t00( )x tx(4-57)4.3.3 初始条件自由时的横截条件初始时刻自由问题的实质是:末端固定 ,初始时刻 不 固定,初始状态 或自由或受约束.()ffx tx0t0( )x t例如 空对地导弹的极值控制,就属于起点受约束而终点固定的变分问题当飞机发射导弹攻击地面固定军事目标时,为了提高命中率并躲避敌方地面防空炮火,应沿某一条飞行轨迹 飞行,故在发射导弹的初始时刻 ,导弹的运动轨线 与飞机俯冲轨线 之间关系如下:0( )t0( )t0t( )x t00( )( )x tt(458)设初始时刻自由时的变分问题如图4-4所示。图中

34、 表示极值轨线, 为 邻域内的任一条容许轨线。*( )xt( )x t*( )xt点 到点 表示初始端变动范围, 表示初始时刻变分,为微变量00(, )x t0000(,)xx tt0t( )x t00*( )xtx0*( )xt()fx t00 x0( )x t0( ) t( )x t*( )xt00tt0tftt初始时刻自由的变分问题由图4-4可以看出,当起点受约束时,存在如下近似关系式:0000( )( )x txx tt (459)和0000( )xtt (460)如果起点自由,因为约束方程(4-58)不存在,故仅存在近似关系式(4-59)。设性能泛函如式(4-15)所示, 与 之间关

35、系如式(4-18)和(4-19)所示,当起点由 位置移动到 位置时,产生泛函增量:( )x t*( )xt00(, )x t0000(,)xx tt000( *, *, )( *, *, )fftttttJL xx xx t dtL xxt dt0000( *, *, ) ( *, *, )( *, *, )ftttttL xx xx t dtL xx xx tL xxt dt取上式的线性主部,得泛函的一次变分(参考4-48)00000-t( *, *, )()()ffttTTtttLdLLJL xx xx ttxdtxxdtxx令 ,考虑到 是任意的,故泛函极值的必要条件为0Jx0LdLxd

36、tx(461)以及0000()()()( )( *, *, )0fTTftttLLx tx tL xxttxx(462)式中(4-61)为欧拉方程,其形式与式(4-25)、式(4-30)及式(4-52)完全相同;式(4-62)为初始时刻自由时的横截条件,可分为如下两种情况讨论。(1)末端固定,起点受约束由于末端固定,故有 。在式(4-62)中,代入式(4-59)及式(4-60),得()0fx t000()0TtLLxtx因为 任意,所以起点受约束时的横截条件为0t00()0TtLLxx000( )( ) (x tt起点受约束)()ffx tx(2) 末端固定,起点自由将式(4-59)及 代入式

37、(4-62),得()0fx t(4-63)0000()()0TTttLLLxtxxx在起点自由情况下, 和 是任意的,故横截条件为0 x0t0()0TtLLxx0()0tLx()ffx tx(464)末端时刻或初始时刻自由的横截条件如表4-2所示表4-2 初始时刻或末端时刻自由时的横截条件序号名称横截条件1起点固定,末端自由()0fTtLLxx()0ftLx 00()x tx2起点固定,末端受约束()0fTtLLcxx()()ffx tc t00()x tx3末端固定,起点受约束00()0TtLLxx000()()x tt()ffx tx4末端固定,起点自由0()0TtLLxx0()0tLx

38、()ffx tx(初始时刻与末端时刻自由)(初始时刻与末端时刻自由)(初始时刻固定末端时刻自由)(初始时刻固定末端时刻自由)例4-5 已知初始时刻 ,初始状态 ,末态要求00t (0)1x()()2fffx tc tt2 1 20(1)ftJxdt式中末端时刻 自由。求使泛函ft为极值的最优轨线 以及相应的 和*( )xt*ft*J解 本题属于 自由、 起点固定、末端受约束的变分问题, 约束方程为ft( )2c tt122( , , )(1)L x x tx如图4-5所示。图中 为一条任意的容许轨线。由题意( )x t根据欧拉方程0LdLxdtx求得201dxdtx积分上式并整理得( )x t

39、atb式中 和 为待定常数ab22110( )x tt( )x t*( )xt*ft根据横截条件(4-57),不难求得1,1ab令 ,得 。将 及 代入 ,得 。于是,本题的最优解为( )( )ffx tc t1*2ft*ft*( )xtJ2*2J *( )1xtt 1*2ft2*2J 最优轨线 已画在图4-5之中, 与 正好相交。因此,对积分型性能泛函而言,横截条件又称为正交条件。*( )xt*( )xt( )c t4.4 用变分法解最优控制问题用变分法解最优控制问题4.4.1 可用变分法求解地最优控制问题可用变分法求解地最优控制问题设控制系统的状态方程为下列时变非线性向量微分方设控制系统的

40、状态方程为下列时变非线性向量微分方程:程:ttutxftx),(),()(4-65初始条件初始条件)0()(0 xtx4-66式中式中 为为 维状态向量,维状态向量, 为为 维维 控制向量。控制向量。)(tun)(txn4-67fttffdttuxLttxJ0),(),(性能函数取为性能函数取为式中控制向量式中控制向量 不受拘束,且在不受拘束,且在 区间上连区间上连续;末端时刻续;末端时刻 可以固定,也可以自由;末端状可以固定,也可以自由;末端状态态 或固定或自由或受约束;在时间区间或固定或自由或受约束;在时间区间上,标量函数上,标量函数 和和 连续且二次可微,向量函连续且二次可微,向量函数数

41、 连续且可微。连续且可微。)(tuftt ,0ft)(ftxftt ,0)()(L)(f设要求的目标集为设要求的目标集为0),(ffttx4-68式中式中 。nrRr,最优控制问题是:寻求最优解最优控制问题是:寻求最优解 和和 ,使系,使系统(统(4-65)从已知初态()从已知初态(4-66)转移到要求的目标集转移到要求的目标集(4-68),并使给定的性能泛函(并使给定的性能泛函(4-67)达到极值。)达到极值。)(*tx)(*tu4.4.2 末端时刻固定时的最优解末端时刻固定时的最优解当当 固定时,以式固定时,以式 (4-65)(4-68)表达的最优控制表达的最优控制问题可以归纳如下一般形式

42、:问题可以归纳如下一般形式:0)()(,0)(),(.),(),(min00)(0fttfftutxxtxtxtuxftsdttuxLttxfft为了把泛函条件极值问题转化为无条件泛函极值问为了把泛函条件极值问题转化为无条件泛函极值问题,引入两个拉格朗日乘子向量,题,引入两个拉格朗日乘子向量,rnRtRt)(,)(构造如下广义泛函:构造如下广义泛函:0(),( )(),( , , )( )( , , )( )fTafffftTtJx tttx ttL x u ttfx u tx tdt4-69定义如下哈密顿函数定义如下哈密顿函数),()(),(),(tuxfttuxLtuxHT4-70将式(将

43、式(4-70)代入式代入式(4-69),得,得fttTfTfadttxttuxHtxttxJ0)()(),()()()(000( ) ( )( ) ( )( ) ( )ffftttTTTtttt x t dtt x tt x t dt fttTTffTfTffadttxttuxHtxttxttxtttxJ0)()(),()()()()()()(),(004-71对式(对式(4-71)取一次变分,注意到待定乘子向量)取一次变分,注意到待定乘子向量和和 不变分(?),以及不变分(?),以及dtuuHxxHtttxtxtxJfttTTfffTffTa0)()()()()(4-72)(t)(t0)(0

44、tx根据泛函极值的必要条件,令式(根据泛函极值的必要条件,令式(4-72)为零,考虑)为零,考虑到向量变分到向量变分 、 和和 的任意性,得广的任意性,得广义泛函取极值得必要条件义泛函取极值得必要条件)(tx)(tu)(ftx欧拉方程欧拉方程xHt)(0uH4-734-74横截条件横截条件)()()()(ffTffttxtxt4-75引进哈密标量函数(引进哈密标量函数(4-70)后,使得极值必要条件中)后,使得极值必要条件中的如下两个方程具有正则形式的如下两个方程具有正则形式),()(tuxfHtxxHt)(4-764-77取哈密顿函数对时间的全导数,得取哈密顿函数对时间的全导数,得tHtHt

45、uuHtxxHdtdHTTT)()()(4-78在最优轨线在最优轨线 上,有上,有 *,uuxxxHuHHx,0,则式(则式(4-78)可写为)可写为tHdtdHdHtHtHfttf)()(两边在两边在 上积分上积分4-794-80若哈密顿函数不显含若哈密顿函数不显含 ,则有,则有ftttconsttH,)(0t哈密顿函数的性质:沿最优轨线,哈密顿函数的性质:沿最优轨线, 对时间的全导对时间的全导数与对时间的偏导数相等;当数与对时间的偏导数相等;当 不显含不显含 时,时, 沿最优轨线保持为常数。沿最优轨线保持为常数。tHHH ,ft t 实际上,上述泛函极值的必要条件,亦可实际上,上述泛函极值

46、的必要条件,亦可由式写出欧拉方程直接导出。由式写出欧拉方程直接导出。即即 00000dd0dd0dd00ffttttuHxHxHxHuHtuHHtHxHtxH(5-17)将上述结果归纳为如下定理将上述结果归纳为如下定理(1)末端时刻固定时最优解的必要条件)末端时刻固定时最优解的必要条件定理定理4-10 对于如下最优控制问题对于如下最优控制问题0( )00(),( , , ),min. .( )( , , ),()()0 ftffftu tfx ttL x u t dtts tx tfx u tx txx t 固定(末端受约束)1) 末端受约束情况。末端受约束情况。最优解的必要条件是最优解的必要条件是 和和 满足下列正则方程:满足下列正则方程:xHHx)(tx)(t式中式中),()(),(),(tuxfttuxLtuxHT状态方程状态方程协态方程协态方程边界条件边界条件0)()()()()()(00fffTfftxttxtxtxtx极值条件极值条件0uH(横截条件)(横截条件)(末端约束)(末端约束)(控制方程)(控制方程)2)末端自由情况。)末端自由情况。00)()(),()(.,),(),(min0 xtxtuxftxtsdttuxLttxfttfftu式中,式中, 固定,固定, 自由。自由。ft)(ftx最优解的必要条件是最优解的必要条件是 和和 满足下列正则方程:满足下列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论