第三章变分法泛函极值问题_第1页
第三章变分法泛函极值问题_第2页
第三章变分法泛函极值问题_第3页
第三章变分法泛函极值问题_第4页
第三章变分法泛函极值问题_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

章用变分法解最优控制

—泛函极值问题

2021/6/271本章主要内容3.1变分法基础3.2无约束条件的泛函极值问题3.3有约束条件的泛函极值——动态系 统的最优控制问题3.4小结返回主目录2021/6/272

在动态系统最优控制问题中,性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果,大部分不加证明,但读者可对照微分学中的结果来理解。2021/6/2733.1变分法基础

如果对某一类函数中的每一个函数,有一个实数值与之相对应,则称为依赖于函数的泛函,记为粗略来说,泛函是以函数为自变量的函数。1、泛函:先来给出下面的一些定义。2021/6/274

若对任给的,存在当时,就有则称在处是连续的。

2、泛函的连续性:

2021/6/275

满足下面条件的泛函称为线性泛函这里是实数,和是函数空间中的函数。

3、线性泛函:

2021/6/2764、自变量函数的变分:

自变量函数的变分是指同属于函数类中两个函数、之差

这里,t看作为参数。当为一维函数时,可用图3-1来表示。2021/6/277图3-1自变量函数的变分2021/6/278

这里,是的线性泛函,若时,有,则称是泛函的变分。是的线性主部。

当自变量函数有变分时,泛函的增量为

5、泛函的变分:2021/6/2796、泛函的极值:

若存在,对满足的 一切X, 具有同一符号,则称在处有极值。2021/6/2710

定理:

在处有极值的必要条件是对于所有容许的增量函数(自变量的变分),泛函在处的变分为零为了判别是极大还是极小,要计算二阶变分。但在实际问题中根据问题的性质容易判别是极大还是极小,故一般不计算。2021/6/27113.2无约束条件的泛函极值问题3.2.1泛函的自变量函数为标量函数的情况

为简单起见,先讨论自变量函数为标量函数(一维)的情况。我们要寻求极值曲线,使下面的性能泛函取极值(3-1)2021/6/2712于是泛函J的增量可计算如下(以下将*号省去)上式中是高阶项。为此,让自变量函数、在极值曲线、附近发生微小变分、,即2021/6/2713

根据定义,泛函的变分是的线性主部,即对上式第二项作分部积分,按公式可得(3-2)2021/6/2714

J取极值的必要条件是等于零。因是任意的,要使(3-2)中第一项(积分项)为零,必有(3-3)上式称为欧拉——拉格朗日方程。(3-2)式中第二项为零的条件要分两种情况来讨论:2021/6/2715

1、固定端点的情况

这时,它们不发生变化,所以。而(3-2)中第二项可写成当时,(3-4)式自然为零。(3-4)2021/6/27162、自由端点的情况

这时和可以发生化,,而且可以独立地变化。于是要使(3-2)中第二项为零,由(3-4)式可得(3-6)(3-5)2021/6/2717

因为这里讨论是标量函数的情况,和也是标量,且是任意的,故(3-5)、(3-6)可化为(3-7)、(3-8)称为横截条件。(3-8)(3-7)2021/6/2718

当边界条件全部给定(即固定端点)时,不需要这些横截条件。当 给定时,不要(3-8)。当 给定时,不要(3-7)。2021/6/27193.2.2泛函的自变量函数为向量函数的情况

现在,将上面对是标量函数时所得到的公式推广到是n维向量函数的情况。这时,性能泛函为(3-9)(3-10)式中2021/6/2720

向量欧拉——拉格朗日方程为(3-11)式中泛函变分由(3-2)式改为2021/6/2721

(当和时)横截条件为(自由端点情况)2021/6/2722

例3-1

取极值的轨迹。求通过点(0,0)及(1,1)且使2021/6/2723

即它的通解形式为

式中:这是固定端点问题,相应的欧拉——拉格朗日方程为2021/6/2724

由初始条件,可得A=0。再由终端条件,可得,因而极值轨迹为2021/6/2725

例3-2

求使指标

取极值的轨迹,并要求,但对没有限制。2021/6/2726解即常数于是是常数,则是时间的线性函数,令

由可得,又终端是自由的,由式(3-7)可得横截条件为这是终端自由的情况。欧拉—拉格朗日方程为2021/6/2727容易验证时,对应局部极小;时,,对应局部极大。由上式解得或。时的极值轨迹为;时的极值轨迹为。

即2021/6/27283.3有约束条件的泛函极值

——动态系统的最优控制问题前面讨论泛函极值问题时,对极值轨迹没有附加任何约束条件。但在动态系统最优控制问题中,极值轨迹必须满足系统的状态方程,也就是要受到状态方程的约束。考虑下列系统(3-13)2021/6/2729这是综合指标。我们要求出最优控制和满足状态方程的极值轨迹,使性能指标取极值。式中,为维状态向量,为维控制向量(这里假定不受限制.否则不能用变分法求解,而要用极小值原理或动态规划法求解)是n维连续可微的向量函数。性能指标如下:(3-14)2021/6/2730

在下面的讨论中,假定初始时刻和初始状态 是给定的,终端则可能有几种情况。我们将就几种常见的情况来讨论,即给定,自由和自由,属于一个约束集。2021/6/27313.3.1终端时刻给定,终端状态自由(3-16)(3-15)与有约束条件的函数极值情况类似,引入待定的n维拉格朗日乘子向量函数

将状态方程(3-13)写成等式约束方程的形式2021/6/2732

与以前不同的是,在动态问题中拉格朗日乘子向量是时间函数。在最优控制中经常将称为伴随变量,协态(协状态向量)或共轭状态。引入后可作出下面的增广泛函(3-17)2021/6/2733

于是有约束条件的泛函的极值问题化为无约束条件的增广泛函的极值问题。(3-18)再引入一个标量函数它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用2021/6/2734

于是可写成(3-19)对上式积分号内第二项作分部积分后可得2021/6/2735

设、相对于最优值、的变分分别为和 因为自由,故还要考虑变分。下面来计算由这些变分引起的泛函的变分 。2021/6/2736

为极小的必要条件是:对任意的、、,变分等于零。由(3-18)及(3-20)可得下面的一组关系式2021/6/2737(协态方程)(3-21)(状态方程)(3-22)(控制方程)(3-23)(横截条件)(3-24)2021/6/2738

(3-21)~(3-24)即为取极值的必要条件,由此即可求得最优值,,。

(3-22)式即为状态方程,这可由的定义式(3-18)看出,实际解题时无需求,只要直接用状态方程即可,这里为形式上对称而写成(3-22)式。(3-21)与(3-22)一起称为哈密顿正则程。2021/6/2739

(3-23)是控制方程,它表示在最优控制处取极值。注意,这是在为任意时得出的方程,当有界且在边界上取得最优值时,就不能用这方程,这时要用极小值原理求解。

(3-24)是在固定、自由时得出的横截条件。当固定时,,就不需要这个横截条件了。横截条件表示协态终端所满足的条件。2021/6/2740

在求解(3-21)~(3-24)时,我们只知道初值和由横截条件(3-24)求得的协态终端值,这种问题称为两点边值问题,一般情况下它们是很难求解的。

因为不知道,如果假定一个,然后正向积分(3-21)~(3-24),则在时的值一般与给定的不同,于是要反复修正的值,直至与给定值的差可忽略不计为止。2021/6/2741

非线性系统最优控制两点边值问题的数值求解是一个重要的研究领域。对于线性系统两点边值问题的求解,则可寻找缺少的边界条件并只要进行一次积分,下面的例3-4给出了求解过程。

2021/6/2742例3-3

设系统状态方程为的边界条件为。求最优控制,使下列性能指标为最小。2021/6/2743

这里、均给定,故不需要横截条件(3-24)式。作哈密顿函数则协态方程和控制方程为即2021/6/2744

故可得正则方程对正则方程进行拉氏变换,可得(3-25)(3-26)(3-27)由(3-25)式可求得2021/6/2745

于是,解出为(3-28)代入(3-26),即得2021/6/2746(3-29)反变换可求得2021/6/2747

将(3-28)代入(3-26)可得

故2021/6/2748

由,从上式可得把代入(3-29),可得,而最优控制为2021/6/2749设系统的状态方程为要求确定最优控制,使指标泛函例3-4初始条件为取极小值终端条件为自由2021/6/2750

这里是自由的,所以要用到横截条件(3- 24)式,因终端指标

解:作哈密顿函数由(3-21)~(3-23)可求得所以(3-30)(3-31)2021/6/2751将代入状态方程,可得

即得(3-32)2021/6/2752边界条件为(3-37)(3-36)(3-35)(3-34)(3-33)2021/6/2753

(3-39)(3-38)(3-40)(3-41)

可见这是两点边值问题,对正则方程(3-33)~(3-36)进行拉氏变换,可得2021/6/2754代入初始条件,,可得故由(3-38)~(3-41)可解出2021/6/2755

同样可解得

利用终端条件,,由(3-42)、(3-43)可得(3-43)(3-42)2021/6/2756

由上二式可解出

由(3-42)式可得最优状态轨迹2021/6/2757

由(3-43)式可得最优协态

由(3-32)式可得最优控制同理还可求出2021/6/2758图3-2最优控制和最优状态轨迹解2021/6/2759

注意,这个系统是线性定常系统,这种线性两点边值问题的解可以通过寻找缺少的边界条件,并且进行一次积分而求得其解。

对非线性两点边值问题,则要借助于迭代方法产生一个序列,来多次修正缺少的初始条件的试探值,直到满足两点边值的条件。图3-2是最优解的轨迹曲线。2021/6/27603.3.2终端时刻自由,终端状态受约束

设终端状态满足下面约束方程(3-46)(3-45)(3-44)性能指标为其中2021/6/2761

引入n维拉格朗日乘子向量函数和维拉格朗日乘子向量,作出增广性能泛函

将代入(3-47),可得(3-49)(3-48)(3-47)引入哈密顿函数2021/6/2762

与固定时的情况不同,现在由、、和所引起。这里不再为零,而可计算如下(参见图3-3):(3-51)则(3-50)令2021/6/2763图3-3各种变分的表示2021/6/2764(3-52)令2021/6/2765一是在时函数相对的变化.另一是因的变化所引起的函数值的变化量后者可用它的线性主部来近似。注意,这里和不同,故*号不能省去。上式表明由两部分组成:2021/6/2766

现在来计算(只计算到一阶小量)。2021/6/2767

上式中方括号外的下标*表示、、是最优值、、。是上式的线性主部,故2021/6/2768

对第三项作分部积分,可得2021/6/2769

第四项可表示为(忽略二阶小量)2021/6/2770

上式最后一个等号用到了(3-52)式。表示的自变量取最优值时的值。根据上面的结果可得2021/6/2771

取极值的必要条件为因、、、为任意,故得(省去*号)(协态方程)(3-53)(状态方程)(3-54)(控制方程)(3-55)(横截方程)(3-56)2021/6/2772

与固定情况相比,这里多了一个方程,,用它可求出最优终端时间。

(3-57)2021/6/2773要求确定最优控制,使最小。例3-5设系统状态方程为边界条件为自由性能指标为2021/6/2774

解这是自由问题。终端状态固定,是满足约束集的特殊情况,即作哈密顿函数2021/6/2775正则方程是控制方程是2021/6/2776将代入,可得因边界条件全部给定,故不用横截条件。确定最优终端时刻的条件(3-57)式为2021/6/2777

因为由正则方程,所以,于是最优控制再由正则方程,可得由上式求得2021/6/2778

由初始条件,求得,故最优轨迹为以终端条件代入上式,即求得最优终端时刻2021/6/2779

火箭发射最优程序问题。设火箭在垂直平面内运动,加速度与水平面夹角为,是控制作用,见图3-4。令

例3-6(水平速度)(垂直速度)(水平距离)(垂直高度)2021/6/2780图3-4火箭发射示意图2021/6/2781

忽略重力和空气阻力时,系统的状态方程和初始条件为(3-58)2021/6/2782要求选择最优控制程序,使性能指标自由终端状态为为最小。2021/6/2783

因为要求最小,故是自由问题。由给 定的终端状态可得三个约束方程为解(3-59)2021/6/2784

作哈密顿函数协态方程为(3-60)2021/6/2785

横截条件为即2021/6/2786上式右端矩阵中的自变量已省略。由(3-59)式求出上式中的偏导数,可得协态的终值为(3-61)2021/6/2787

常数积分协态方程可得常数2021/6/2788代入协态终值条件后,得故(3-62)2021/6/2789由控制方程,得(3-63)即2021/6/2790

下面来积分状态方程(3-58),为此将自变量变成。由(3-63)式得

为了确定最优程序,还需确定拉格朗日未定常数、。2021/6/2791将上面关系代入状态方程,即得积分上面两式得2021/6/2792由初始条件可求得(3-64)(3-65)2021/6/2793

将上面的和代入状态方程(3-58)的后两式,积分并经较复杂运算得

(3-66)(3-67)2021/6/2794

(注:另一解为,但这时由(3-67)式可得出与给定终端条件不符,故略去的解)由终端条件和(3-65)式得

故(3-68)2021/6/2795由(3-63)式得于是(3-70)故(3-69)2021/6/2796

将终端条件和(3-69)式代入(3-64)式,可得(3-71)2021/6/2797

将终端条件,(3-69)式和(3-71)式代入(3-67)式可得(3-72)2021/6/2798

现在归纳一下所得的结果:由(3-72)式可确定,由(3-71)式确定最短时间,由(3-70)式即可求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论