




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、会计学1但是,实际工程问题中,控制变量往往是受到一定限制,容许控制集合是一个m维有界闭集,这时,控制变分 在容许集合边界上就不能任意选取,最段控制的必要条件 变不存在了。若最优控制解(如时间最小问题)落在控制集的边界上,一般便不满足 ,就不能再用古典变分法来求解最优控制问题了。u/0Hu 第1页/共62页本章介绍的极小值原理是控制变量 受限制的情况下求解最优控制问题的有力工具。它是由苏联学者庞特里亚金于1956年提出的。极小值原理从变分法引伸而来,它的结论与古典变分法的结论极为相似,但由于它能应用于控制变量 受边界限制的情况,并不要求哈密尔顿函数H对u连续可微,因此其适用范围扩大了。 u t
2、u tL.S.Pontryagin第2页/共62页第一节 连续系统的极小值原理设连续系统动态方程为: (8-1)边界条件可以固定、自由或受轨线约束,控制变量 属于m维有界闭集U,即 (8-2)性能指标为: (8-3) x tf x tu tt, mu tUR u t 0fffFdtttJx ttx tu tt,第3页/共62页则使性能指标 达到极小的最优控制 及最优状态轨线 必须满足以下条件:J *ut *xt 正则方程 *aHxt *aH t(8-4)(8-5)这里, 为哈密尔顿函数, 为协态变量,其定义与在变分法中相同。H第4页/共62页 哈密尔顿函数对应最优控制时为极小值,即: *min
3、*u UHHxtu tttxtu ttt,(8-5)或 *u UHHxtu tttxtu ttt,(8-6)当不受边界限制时,则上式与等效。 根据不同的边界情况, 及 满足相应的边界条件及横截条件,它们与变分法中所应满足的边界条件及横截条件完全相同。 *t *xt第5页/共62页比较上述极小值原理与变分法所得的结果,可以发现两者的差别仅在。极小值原理的严格证明很复杂,下面的证明将重于物理概念的阐述,尽量避免烦琐的数学推导。设系统动态方程为: fx tx tu tt,(8-7)边界条件为: ,为简单起见,假设终端时刻 及终端状态 均为自由。控制变量 受有界闭集约束,即 00txxft fx t
4、t uU u t(8-8)第6页/共62页求最优控制 使性能指标 *ut 0fffFdtttJx ttx tu tt,(8-9)为极小。设对应于最优情况的性能指标为 ,仅考虑由于 偏离 时的性能指标为,则按最优的定义,下式必然成立 *J u u t *ut J u *0J uJ uJ 设偏离足够小 *u tutu t *ut u t(8-10)第7页/共62页则由此引起的的增量可以由下式表示*JJuuuuuu,(8-11)这里, 表示二阶及二阶以上的高阶项, 是 的线性主部,它与 成线性关系。当 时 这时可以由泛函变分 来近似代替泛函的实际增量 设有控制变量 ,在时间区间 内只能在容许范围内变
5、化,如图8-1所示。设对应取极小时之最优控制为 (见图8-1),它由三个区间组成: 在 及 区间内, 处在容许集内,由于 可以任取, 均处在容许集内,这种情况下,泛函达极小值的必要条件为: * uu,*Juu,Ju0u*0uu,*Juu,*Juu, u t0ftt, *ut01tt,0ftt, *utu *u tutu第8页/共62页*0Juu,(8-12)图8-1 的容许域 u t第9页/共62页 在 区间内, 处在容许集的边界上, 不能任取,它只能取负值,这时泛函为极小值的必要条件应为:12tt, *utu*0Juu,这说明对 的任何容许偏离都会引起泛函 比其足够小的邻区内的值 要小,故有
6、可能为极小。*J u*Juu, *ut(8-13)下面,根据以上结论来求泛函极小的具体条件。首先,用拉格朗日乘子法建立增广泛函 0fTaffFfdtttJx ttxutxutx , , ,(8-14)第10页/共62页定义哈密尔顿函数THFfxutxutxut, , , , ,则得0faffHdtttJx ttxutx , , ,下面求泛函 的变分。这里,假设终端时刻 及终端状态 均自由。经过同变分法中的类似推导,最后得aJfx tft(8-16)(8-15)第11页/共62页 0fTffafffffffffffTTTJHHHHdtttx tttx tx tx ttx tu tttttxutx
7、utxuxuxutx, , , , , , ,(8-17)(8-18)根据泛函存在极值的必要条件的结论可知,当 不受限制时,应满足 u t0aJ第12页/共62页由于各个变量的变分是独立的,因此,必须同时满足*0H xutx, , ,*0H xutx, , ,*0H xutu, , ,*0ffffxtttx t,*0fffffffHxttxtutttt,(8-20)(8-23)(8-22)(8-21)(8-19)这里,式(8-19)、式(8-20)为正则方程,式(8-21)为控制方程,式(8-22),式(8-23)为横截条件,这与第六章变分法中所得结论完全相同。第13页/共62页当 受边界限制
8、时,泛函极小的必要条件是: 0aJ u t为了寻找 与 的关系,在式(8-16)中可令除含有 项以外的各项均为零,则泛函极小必要条件式(8-23)变成 0*0fTaHJdtttxutuuuu, , ,(8-24)(8-25)uaJu这里,被积函数为哈密尔顿函数对于控制变分引起的增量的线性主部。当 足够小时,可用它来一次近似代替实际增量,即 u第14页/共62页*(, )TH x utHHuHH uuuxuutxutuu, , , ,代入式(8-24),得:0*0fTaJHuHdtttuuxutxut, , , ,以上条件应对 出现的容许 都满足,由此可得以下结论:使指标泛函达极小的最优控制的必
9、要条件是: *HtttHtttxutxut,0fttt,u(8-27)(8-26)(8-28)第15页/共62页我们对式(8-27)作一些简单解释,假定控制变分 出现在 区间的某一小区 内,而在其它区间内部为最优控制 则如果式(8-27)不满足,即存在 ,指标泛函变分式可表示成: 10122121*0aJHHdtHHdtHHdtHHdtttttttttuuxutxutxutxutxutxutxutxut, , , , , , , , , , , , , , , , ,12tt,u0ftt, *ut*HHxutxut, , , , ,(8-29)第16页/共62页显然,这与 矛盾。同时,小区间
10、可能出现在 区间的任何位置,因此要求整个区间 内均满足以下条件*HHxutxut, , , , ,0aJ12tt,0ftt,0ftt,到此,极小值原理得证。极小值原理同时还给出以下条件,即:如果哈密尔顿函数不显含变量 ,则哈密尔顿函数 沿最优轨线保持为常数,即 *0fHtttcxutttt,tH(8-31)(8-30)第17页/共62页如果终端时刻 自由,则ft *00fHtttxutttt,这里需要指出:极小值原理只是最优控制应满足的必要条件。但实际问题中由极小值原理给出的经常是单值的最优控制,而最优控制又确实存在,这种情况下,求出的最优控制也就满足了充分条件。有时可能给出非单值的最优控制,
11、这就要根据问题性质作进一步判断。(8-32)第18页/共62页第二节 离散系统的极小值原理设离散系统状态方程为: 10, 1,1kfkkkkNxxu,这里, 为n维状态向量, 为m维控制向量,k为步数,N为总参数。设初始状态 ,终端状态 自由。控制变量受限制,即 k uU系统的性能指标为: 10NkJNNFkkkxxu, kx ku 00 xxNx第19页/共62页要求寻找最优控制序列 ,使性能 为极小。我们同样可用极小值原理来求解最优控制问题。首先,用拉格朗日乘子法建立增广指标泛函 *kuJ 10101011111NkTNkNTkJNNFkkkkfkkkkNNHkkkkkkxxuxuxxxu
12、x,等式右边最后一项可表示成第20页/共62页 101101100NNTTkkNTTTkkx kkkkkNNxxxx代入式(8-34) 1000NTakTTJNNHkkkkkNNxxuxxx,求的一阶变分,得第21页/共62页 10101111TaTNkTNkNNJNNNHkkkkkkkHkkkkkkk xxxxuxxxux,当控制变量受限制时,性能指标 达极小值的必要条件为aJ0aJ第22页/共62页由此可得,使 达极小的最优控制必须满足以下条件:J 满足正则方程 *111Hkkkkkkfkkkxuxxu, *1Hkkkkkkxux, 相对于最优控制,哈密尔顿函数达极小值,即 *11Hkkk
13、kHkkkkxuxu,第23页/共62页 及满足以下边界条件及横截条件 *00NNNNxxxx,同理,对不同的边界情况,只需选取相应的边界条件及横截条件,条件1、2不变。当控制变量不受限制时,则条件2与控制方程 *10Hkkkkkxuu,等效。第24页/共62页第三节 极小值原理解最短时间控制问题一般情况下,非线性受控系统的最短时间控制问题的解析解是很困难的,本节只讨论线性定常受控系统的最短时间控制问题导弹舵面的打开时间。R-73的栅格舵的栅格舵AIMAIM9L9L导弹导弹的舵面第25页/共62页 00ffx tAx tBu tx txx tx, 为n维状态向量, 为m维控制向量,并受以下不等
14、式约束 x t u tuM 设线性受控系统状态方程为第26页/共62页寻找最优控制 使性能指标 *u t00ftftJdttt为最小。我们应用极小值原理来求解。这时哈密尔顿函数为 1TTH xutt Ax tt Bu t, ,故得正则方程为 *xtAxtBut *T tAt第27页/共62页根据极小值原理可得 *11TTTT t Axtt Butt Axtt Bu t即 *TTt Butt Bu t将 阵表示成如下形式12mBb bb这里, 为 阵的第 列数组, ,则得 *11,2,mTTiiiimt Bu tt b utBibBi1,2,im第28页/共62页这里, 为 第 个分量。设各控制
15、分量互相独立,则不等式(8-51)对相应分量应该成立,即 iu t u ti *TTiiiit b utt b ut tubttubtiiT*iiT* tubttubtiiT*iiT*由此可得最优控制规律为 *001,2,0TiTiiTiMMim t butt bt b当当不定当设求得 的解如图8-2,则相应的最优控制规律示于图8-2。 *Tit b第29页/共62页图8-2 的关系* Tiiuttb与第30页/共62页由图可见: 时,可以找出确定的 来,并且它们都为容 控制的边界值。 当 通过零点时, 由一个边界值换向另一个边界值。 如果 出现在某一时间区间内保持为零,则 为不确定值,称这种
16、情况为奇异问题或非平凡问题,相应的时间区段称为奇异区段。关于奇异区段内的最段控制问题将在下节中作简单介绍。当整个时间区间内不出现奇异区段时,则称为非奇异瓿或平凡问题,本节的讨论仅限于平凡问题。为了便于研究,我们首先不加证明地介绍几个有关的定义及定理。 *0Tit b *iut *Tit b *iut *Tit b *iut第31页/共62页1.砰-砰(bang-bang)原理设线性系统(8-44)如果属于平凡情况,则其最短时间控制为: *signTMBt ut 的各个分量都是时间的分段恒值函数,并均取边界值,称此为bang-bang原理。bang-bang原理不仅适用于线性定常系统,同时也适用
17、于如下一类非线性系统: *ut x ta x ttB x tu tt,上式可以包含状态的非线性项,但只包含控制变量的线性项。第32页/共62页2.最短时间控制存在定理 设线性定常系统(8-44)为完全可控,并系统阵 的特征值均具有非正实部,控制变量满足不等式约束 ,则最短时间控制存在。3.最短时间控制的唯一性定理 设线性定常系统(8-44)属于平凡情况,则若时间最优控制存在,它必定是唯一的。4.开头次数定理 设线性定常系统(8-44)属于平凡情况,控制变量满足不等 式 约束,并系统阵A的特征值全部为实数,则如果最短时间控制存在,必为bang-bang控制,并每个控制分量在两个边界值之间的切换次
18、数最多不超过n-1次。 A u tM u tM第33页/共62页下面,以二阶双积分装置为例,应用极小值原理来求解最短时间控制问题。设系统状态方程为 122xtxtxtu t边界条件为000fx txx t,控制变量的不等式约束为 1u t性能指标为00ftftJdt tt寻求最优控制使为最小。第34页/共62页由于010001 AB, 具有两个零特征值,满足非正实部要求,并A01rankrank210BAB系统完全可控,因此最短时间控制存在,如果系统平凡情况,则最优控制解是唯一的,开头换向次数至多只有一次。列写哈密尔顿函数1 221Hxu 第35页/共62页得正则方程为*xAxBu*10*21
19、 根据极小值原理可得*11211211 xuxu即*22uu由此可得最优控制规律为: *2*2*210100 ut当当不定当第36页/共62页下面,首先讨论系统是否存在着在某区段中 的奇异段。根据正则方程,可以解得:*20 *11ct *212cctt这里, 为积分常数。如果存在奇异段,则应满足在某区段内 ,这时要求 。代入哈密尔顿函数,则得 12cc、*201200cc,*10H 不满足极小值原理的必要条件,由此证明本例不存在奇异段。因此,最优控制规律只有两种情况,即 *2sign utt第37页/共62页它确是bang-bang形式。可能的控制方案有四种,如图8-3所示。将 代入状态方程,
20、可解得相应的状态轨线。由状态方程 得 1 u2xu图8-3 可能的控制方案21 x 第38页/共62页积分后得 23 xttc代入状态方程 得 213412 xttc tc这里, 为积分常数,式中符号“+”对应 ,符号“-”对应 。消去式(8-76)、式(8-77)中的 ,可得 12xx34cc、1 u1 ut2221234251111222 xxccxcu当2221234261111222 xxccxcu当第39页/共62页这里, 为积分常数。这是两族抛物线,如图8-4,箭头方向为时间增加的方向。 56cc、图8-4 时的状态轨迹1 u第40页/共62页现在来讨论对应于不同初始状态 的最优控
21、制方案 (a)如 处在 曲线上,则可在 作用下,不需换向就将 转移至原点 。因此,这时的最优控制为: , (见图8-5)。 (b) 如 处在 曲线上,同理,可在 的作用下,不需换向就将 转移至原点 。因此,这时的最优控制为: , (见图8-5)。 (c) 如 处在 曲线的下方,则状态转移将分两段进行,首先,在 作用下,由 沿式(8-78)的抛物线转移至B-0曲线上的某点,然后再沿曲线转移至原点。因此,这时的最优控制为0 x0 x0 x0 x0 x0 x0B1 u*1 u0A1 u*1 u0fx t0fx t0fttt,0fttt,0BA0 x1 u第41页/共62页*01*111f utttu
22、ttt,这里, 为两段轨迹交接处的时刻。由此可见,这时控制作用产生1次换向。(见图8-5)。 (d)如 处在 曲线的上方,则同理,状态将首先在 的作用下同 转移至曲线上的某点,然后再在 的作用下沿曲线 转移至原点,相应 同样,这时控制作用产生一次换向。(见图8-5)。*01*111f utttuttt,1t0BA1 u0 x0 x0A1 u第42页/共62页通过以上讨论,可得以下结论: 最优控制为bang-bang控制,换向次数最多1次, 为开头换向曲线,其表示式为 段对应于由 向 的换向线, 段为由 向 的换向线。 最优控制 与状态轨迹之间的关系为0BA 12212 xtxt xt0A1 u
23、1 u0B1 u1 u *ut第43页/共62页 1221212212*12221212221211201120110201102000BABABA xtxt xtxxxtxt xtxxutxtxt xtxtxxxtxt xtxtxxx t当,即,点处在线之右上方当,即,点处在线之左下方当,并,即,点处在段上当,并,即,点处在段上当第44页/共62页由此我们得到了很重要的特性,即最优控制可以由状态的非线性反馈来形成,从而可以实现闭环控制,这在工程上是十分有用的。图8-6给出了本例最优控制工程实现的可能方案之一,它包括一个两位置式继电器及一个二次函数发生器。这里遇到的一个原理上的困难是当处在开关
24、曲线上时,继电器输入信号为零,因而不能实现换向,但是由于继电器总是具有一定惯性,所以继电器的实际换向都不会准确地发生在输入信号的过零处,而是超过一点,这时由于输入信号不再为零,因此换向是可以实现的。图8-6 最优控制的工程实现第45页/共62页在前节讨论最短时间控制问题时,我们应用了极小值原理的必要条件 来确定最优控制 与最优状态及协态轨线之间的关系。但是我们遇到了这样的情况,当在某个时间区间 内, ,上述必要条件没有提供有关 与 及 之间相互关系的任何信息,因此就无法由此求出 与 、 之间的确定关系式,我们称这类问题为奇异情况或非平凡情况,出现奇异情况的时间区间 称为奇异区间。存在奇异情况时
25、并不意味着最优控制一定不存在,它只是说明应用极小值原理必要条件,即 *HHxtutttxtu ttt, *ut12ttt,*0Tb *xt *ut *t *ut *xt *t12tt,*HH第46页/共62页或 0Hu无法确定最优控制。如果奇异段内存在最优控制,则称此为奇异最优控制,相应的状态轨线称为奇异轨线或奇异弧。显然,这时为了确定最优控制,就得进一步探讨能够提供确定最优控制的有效信息的补充条件,当然它们必须满足极小值原理。奇异最优控制问题是一个十分复杂的问题,有些问题如奇异最优控制的充分条件等至今没有完全解决。下面,通过简单例子对奇异情况存在的条件和奇异最优控制的求解两个问题作概要的讨论
26、。第47页/共62页一、线性定常系统(单输入)最短时间控制问题中奇异区段存在的条件 在前节讨论二阶积分装置的最短时间控制时,曾利用极小值原理必要条件( 自由及H不是t的显函数)来判断是否存在奇异情况,下面,我们将在更普遍的意义上来讨论这个问题。设系统状态方程为ft*0H tttxAxbu第48页/共62页这里,x(t)为n维状态变量,u(t)为一维控制变量,因此b为 维向量,控制不等式约束为:性能指标为: 自由 寻求最优控制 使性能指标J为最小。建立哈密尔顿函数根据极小值原理1n 1u t00ftfftdttttJ *ut1TTH Axbu*11TTTT AxbuAxbu第49页/共62页即由
27、此可知,当 则 为奇异区段。出现这种情况可能有三种原因:(1)将 代入哈密尔顿函数可得 显然它不满足极小值原理必要条件 ,由此可知, 的情况不可能出现。*TTbubu*120,Tbttt,12tt,*120,ttt,*10 H*0*0H*120ttt,第50页/共62页(2)当 时,这说明控制作用根本不能影响系统,这时系统是不可控的。 ,由于求解 是复杂的两点边值问题,下面只用间接的方法来判断。如果存在由于可以建立下列方程组0b0b*12000Tbbttt,但, *t*120,1,2,kTkdkdt bttt,*kkTTkTkkdddtdtbb bb第51页/共62页*12*10000TTTn
28、Tbbbtttb,根据建立下列方程组可解得: *Ttt A *TttecA *TTtTt bec bA第52页/共62页代入正则方程得对正则方程求一次导数得:按此类推,可得:将以上结果代入式(8-95),则得 *tTTTtec AA *TTTTTTtttecec AAbAbAb *tTTTTTtec AAA A *2TTTttTTkTTAAebet bA AccA b *10,1,TtTkk TAkek t bcA b第53页/共62页120000TtTtTtTntTATATATAeeeecbcAbcA bcA b第54页/共62页式(8-105)可表示成如下形式上式两转置得这里, 210, 0, 0TtTAnecb Ab A bAb 210TtTnAeb Ab A bAbc 100,0,0Tn第55页/共62页可以看出,式(8-107)乃是未知向量为 的齐次方程组(n个方程)。已知 即具有非零解,根据线性代数的有关定理,未知数具有非零解的充要条件是系数行列式为零,即故显然,这意味着系统是不可控的。由此可得结论:线性定常系统(单输入)最短时间控制问题存在奇
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论