最优控制变分法_第1页
最优控制变分法_第2页
最优控制变分法_第3页
最优控制变分法_第4页
最优控制变分法_第5页
已阅读5页,还剩166页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

最优控制变分法第一页,共一百七十一页,编辑于2023年,星期三

一、泛函和变分如绪论中所述,泛函是一个(或一些)函数的函数,它的函数值取决于这个(或这些)函数的选取。更确切地说:如果有一类函数集,对每一个都有一个确定的值与之对应记作 。比如说,旋转体在流体中运动时受到的阻力取决于它的几何形状。用数学的话来说,就是如果我们把它的几何形状用函数来描述,那么,是的函数。旋转体可以加工成各式各样的形状,因而函数同t之间存在着无限多种可能的函数关系,形成一个函数的集合,如图1—

1所示。这里便是一个泛函。第二页,共一百七十一页,编辑于2023年,星期三第三页,共一百七十一页,编辑于2023年,星期三如果要求选择一种形状使旋转体受到的阻力最小,这就意味若要求从这一族函数中寻找出使达到最小的来。这就是一个求泛函的极小值问题,也是一个变分问题。这个问题是牛顿在1686年提出的,它是变分法所解决的最早的一个问题。变分法中有3类基本问题,即拉格郎(Lagrange)问题、马耶耳(Mayer)问题和波尔札(Bo1sa)问题。这3类问题在最优控制问题中都遇到,它们之间的主要区别在于性能泛函的形式不同。(1)拉格朗问题拉格朗问题的泛函表示为

式中,是n维矢量;是m维矢量;是独立变量;是、和连续函数。绪论中基于性能指标(0—2)、(0—10)和(0—1)的最优控制问题是拉格郎问题的实例。第四页,共一百七十一页,编辑于2023年,星期三(2)马耶耳问题马耶尔问题的泛函表示为绪论中基于性能指标(0—9)的最短时间控制问题和基于性能指标(0—15)的最优推力方向角选择问题就是马耶耳问题的一个特例。(3)波尔扎问题波尔扎问题的性能泛函是

图1-1所示的最小阻力弹头形状问题就是波尔扎问题的一个实例在高超音速中零攻角下旋转体在流体中受到的压阻力可以精确地表示为

其中,表示旋转体各处半径; ;是旋转体最大半径;是旋转体的长度;为常数。

第五页,共一百七十一页,编辑于2023年,星期三从上面的分析可以看出,拉格朗问题的性能泛函是一个积分,马耶尔问题的性能泛函是关于初始状态时间、初始状态和终端时间、终端状态的某个函数,而波尔扎问题的性能泛函则是两者之和。可见,波尔扎问题具有更一般的形式。但是,这3类问题之间常可互相转化。比如,把泛函改写成第六页,共一百七十一页,编辑于2023年,星期三就把一个马耶耳问题转化成一个拉格郎问题,反之亦然。变分问题是研究泛函的极值路问题;而求某个泛函的极大值等价于求它的负值的极小值。因此,我们主要讨论极小值问题。在讨论泛函的极小值以前,首先回顾普通函数的极小值。给出函数,假设它在区间上连续。如果在该区间上有,对于一切,有

则是函数在区间上的总体极小值。总体极小值是唯一的,而达到总体极小值的不一定唯一,比如图1-2所示的函数在和两处都达到总体极小

第七页,共一百七十一页,编辑于2023年,星期三第八页,共一百七十一页,编辑于2023年,星期三如果是的一个局部极小值,则有且(1.1—1)条件(1.1—1)是局部极小值的必要条件,但不是充分条件。比如函数在处满足条件(1.1–1),但是不是极小值,如图1—3所示。

第九页,共一百七十一页,编辑于2023年,星期三第十页,共一百七十一页,编辑于2023年,星期三如果且(1.1—2)

则是一个局部极小值。条件(1.1—2)是局部极小值的充分条件。给出泛函,如果在容许函数(即一切使泛函存在的函数)中,有函数,对一切容许的有则是的总体极小值。为了定义泛函的局部极小值,需要引出函数空间的“邻域”的概念:考虑区间上两个连续可微的函数和,如果对于每一个,两函数值都互相接近,则函数:和是在零阶意义下接近的;如果对于每一个,不但值同值接近,而且它的导数值值同值接近;则称函数同函是在一阶意义上接近的。第十一页,共一百七十一页,编辑于2023年,星期三

如果在容许函数的集合函数集合中,对一切同零阶接近的,有

则称是泛函的一个强局部极小值;如果对一切同 一阶接近的,有

则称是泛函的一个弱局部极小值。容易看出,在定义泛函的总体极小值、强局部极小值和弱局部极小值时,函数是分别同数目逐次减少的函数的集合相比较的。因此,若局部极小值的必要条件也是强局部极小值的必要条件,强局部极小值的必要条件也是总体极小值的必要条件,反之则不尽然。第十二页,共一百七十一页,编辑于2023年,星期三

二、固定端点时间、无约束条件的变分问题这一节,我们讨论一类最简单的变分问题,即无约束条件、端点时间固定,只有一个自变量函数的拉格郎问题。通过这个问题来引出欧拉方程和横截条件。求解变分问题,就是要把使泛函达到极值的那个自变量函数找出来,这就需要利用欧拉方程和横截条件。因此,欧拉方程和横截条件是求解变分问题的基础。在推导欧拉方程和横截条件时要使用一个定理,这个定理叫作变分法的基本颈备定理。本节首先介绍基本预备定理,接着推导欧拉方程,然后讨论横截条件,最后讨论泛函取极值的充分条件。第十三页,共一百七十一页,编辑于2023年,星期三

1.变分法的基本预备定理

基本预备定理的内容是:如果函数在区间上是连续的,而且对于只满足某些一般条件(例如一阶或若干阶可微,在上的端点处,或且等)的任意选定的函数,有

(1·2—1)则在区间上

下面我们来证明这个定理。由于函数,是任意选定的,因此,可以取(1.2—2)其中的是任一满足条件

第十四页,共一百七十一页,编辑于2023年,星期三的函数,式中c为某个函数,它在区间上各点的函数值及其导数值可以选得任意小。因此,这样选择的满足定理要求的一切条件。把方程(1·2—2)代入(1·2—1),得

式中被积函数是非负的。一个非负函数的积分等于零,只能是被积函数恒等于零,而是满足某些条件的任意函数。因此,要使上式成立,必有

进而,如果有

其中是互相独立,并满足基本预备定理要求的任意选定的函数,那么,可以轮流令除以外的其它()都为零,再使用基本预备定理,可得,上述结果可以应用到包含有多个自变量函数的泛函。第十五页,共一百七十一页,编辑于2023年,星期三

2.欧拉方程现在,我们来推导欧拉方程和相应的横截条件。首先讨论固定端点问题,然后讨论未定端点问题。考虑最简单的泛函(1·2—3)的极值。其中是二次可微函数;,是变量和连函函数,并且有连续二阶偏导数,端点时间和固定。首先研究容许函数(或曲线)端点固定的情况,即规定和。图1—4示出了一族容许函数。现在的的问题是要从这一族容许函数(或曲线)中找出使泛函J取极值的函数(或曲线),即极值函数或极值曲线。第十六页,共一百七十一页,编辑于2023年,星期三假设是极值曲线是任一邻近于它的容许曲线,如图1—5所示。令

(1·2—4)和

(1·2—5)是的连续可微函数,叫做的变分。是一个小参数。选择不同的和就能够把邻近的容许函数表示出来。因此,式(1.2—5)表示了邻近的任意一族容许函数。特别地,当时,;当时,。这一族函数都起始于,终止于。第十七页,共一百七十一页,编辑于2023年,星期三第十八页,共一百七十一页,编辑于2023年,星期三第十九页,共一百七十一页,编辑于2023年,星期三

将式(1·2—5)两边对求导,可得(1·2—6)将式(1·2—5)、(1·2—6)代入式(1·2—3),又得(1·2—7)在式(1·2—7)中,每选择一个,都可作一条曲线。选择各式各样的容许的,可以作出一族曲线,如图1—6所示。因为

所以有

因此,所有曲线都在上达到极值。于是,在极值函数上,有(1·2—8)这就是泛函J取极值的必要条件。·将式(1·2—7)的右边对参数求导,再令结果中的,便可求出极值函数。泛函对参数求导遵守以下法则:假设是变量的函数,而又都是独立变量的可微函数,则第二十页,共一百七十一页,编辑于2023年,星期三

将方程(1·2—7)两边对求偏导,得到

已知被积函数L具有二次连续偏导数,因此,上式右边的求导和积分可交换顺序,于是得到

利用泛函对参数求导法则,有

把它代入上式,则第二十一页,共一百七十一页,编辑于2023年,星期三把它代入上式,则

·在上式中令,则式(1·2—8)便可写成

(1.2—9)由于式中和彼此相关,因此,暂时还不能使用基本预备定理。对上式积分号下第二项使用分积分,可得 (1.2—10)将式(1·2—10)代入(1·2—9),得到必要条件:第二十二页,共一百七十一页,编辑于2023年,星期三

前面假设端点是固定的,即,因此,,于是,方程(1·2—11)变成

式是连续函数,而是—任意函数,且,,具备了基本预备定理的全部条件。因此,在极值函数上,有

第二十三页,共一百七十一页,编辑于2023年,星期三方程(1·2—12)叫作欧拉方程。欧拉方程的积分曲线是一族曲线,这一族曲线叫作极值函数或极值曲线。只有在极值函数上,泛函

才能达到极值。方程(1·2—12)是二阶微分方程,它的解包含两个积分常数。这两个积分常数要利用边界条件和来确定。只有满足欧拉方程同时又满足条件的函数,才能在满足给定端点条件下使泛函到达它的极值。因此,求解变分或寻找泛函的极值函数问题归结为求解欧拉方程。在前面我们假设边界条件和是预先规定的。现在假设边界条件未规定,和是任意的。这样的容许函数就更多了,的邻域里包含的函数也更多了。它除包含前面讨论的有公共端点的函数(比如外,还包含没有公共端的函数(比如),如图1—7所示。第二十四页,共一百七十一页,编辑于2023年,星期三第二十五页,共一百七十一页,编辑于2023年,星期三不难理解,如果函数能在未定端点问题中使泛函(1·2—3)达到极值,那么,·对于同有公共端点的更狭窄的一类函数来说,必然也能使泛函(1.2—3)达到极值。也就是说,同样是欧拉方程(2—12)的解。在这里和未规定是任意的。因此,必要条件(1.2—11)包括了下面两个方程:(1.2—13)和(1·2—14)

上述结果可以解释:既然和是任意的,那么,当它们同时为零时,方程(1.2—11)必须成立,于是得出该式左边第一项,即积分项为零,进而利用变分法的基本预备定理得出式(1.2—13)。另外,当和不为零时式(1·2—11)也必须成立,于是得出条件(1.2—14)。方程(1.2—13)就是未定端点问题的欧拉方程,方程(1.2—14)叫做横截条件。这两个方程一起是泛函(1.2—3)取极值的必要条件。然而,满足必要条件的函数是否确使泛函取得极值,以及其极值究竟是极大值还是极小值还要利用后面将要讨论的充分条件。3.对于横截条件的说明

求极值函数,不但需要解欧拉方程,还需要正确地使

第二十六页,共一百七十一页,编辑于2023年,星期三第二十七页,共一百七十一页,编辑于2023年,星期三第二十八页,共一百七十一页,编辑于2023年,星期三第二十九页,共一百七十一页,编辑于2023年,星期三

(1)固定端点问题起始条件和终端条件预先规定为和。一切容许函数都必须经过两个固定端点和,如图1—8所示。在这种情况下横截条件(1·2—14)利用==0来满足。边界条件是和(2)固定始端、未定终端问题初始条件固定,终端条件未定,其容许函数如图1—9所示。这里=0,可任意选择。于是,横截条件(1·2—14)变成和(3)未定始端、固定终端问题终端条件规定为,初始状态未规定,其容许函数如图l—10所示,相应的横截条件是和(4)未定端点问题端点状态末规定,容许函数如图1—11所示。假设、互不相关,条件(1.2—14)可写成和又知道和任意,于是得到横截条件 和第三十页,共一百七十一页,编辑于2023年,星期三例1.2—1求泛函

在边界条件,下的极值曲线。解:这个问题的欧换方程是

其通解为

利用边界条件,可求得,。因此,极值曲线是

例1·2—2求泛函

的极值曲线。

第三十一页,共一百七十一页,编辑于2023年,星期三

解:这个问题的欧拉方程是

它的一次积分为

引入参数,令,代入上式可得

式中。对上式两边微分,得

于是得到

对上式积分,得 或于是得到极值曲线参数方程:,消去,得到

这是中心位于纵坐标轴上的一族圆。第三十二页,共一百七十一页,编辑于2023年,星期三4.充分条件

在前面我们根据泛函取极值的必要条件

和基本预备定理导出了欧拉方程和横截条件。如前所述,只有满足必要条件的函数才能使泛函取得极值。但是,究竟是确使泛函达到极值,还是一个驻点?如果是极值,那么,是极大值还是极小值?仅仅依靠必要条件还不能确定。要回答上述问题还必须研究极值的充分条件。我们知道,普通函数求极值时极值的性质是用该函数在一阶导数等于零的点上二阶导数的符号判断的。如果二阶导数为正则极值为极小值;若二阶导数为负,则极值为极大值;如果二阶导数的符号不定则表明是一个驻点(或鞍点)。同样,要确定泛函极值的性质,还需要研究泛函对参数关于的二阶导数。根据前面的分析,对于泛函

第三十三页,共一百七十一页,编辑于2023年,星期三这也是一个泛函。利用泛函对参数求导法则,可得

令,得到第三十四页,共一百七十一页,编辑于2023年,星期三或写成二次型积分

要使取得极小(极大)值,还必须

这是使取极小(极大).的另一个必要条件。如果

则J肯定为极小(极大)值。上述条件是使泛函J取极小值。(极大握i)的自充分条件。容易看出,如果式(1·2—16)中被积函数内的矩阵是正定或半正定(负定或半负定)的,只要在区间上被积函数不恒等于零,它的积分总大于(小于)零。由此可以得出结论,使泛函

第三十五页,共一百七十一页,编辑于2023年,星期三取极小(极大)的充分条件是:在条件下,二次型矩阵是正定或半正定(负定或半负定)的。

小结总结以上分析,得到如下结果:给定泛函

其中是的二次可微函数,是变量和的连续函数,且有连续二阶偏导数,端点时间固定。那么,使泛函取极值的函数必须满足欧拉方程和横截条件

使极小(极大)值的充分条件是下列二次型矩阵,

是正定或半正定(负定或半负定)的。第三十六页,共一百七十一页,编辑于2023年,星期三

例1·2—3试求从点到线间弧长最短的曲线。解:这是一个固定始点、未定终点问题。首先建立泛函的数学表达式,定义微分弧长为,则

于是,曲线弧长为

这里,,因此,这个问题的欧拉方程是

它的一次积分为

c为积分常数。把上式展开,可得,把上式再积分,得到极值曲线

积分常数a和b利用横截条件来确定。这个问题的横截条件是第三十七页,共一百七十一页,编辑于2023年,星期三第三十八页,共一百七十一页,编辑于2023年,星期三 和即 和由此可得阿a=0,b=1。于是我们得到从点到线间具有最短弧长的曲线是直线,如图1—12所示。在这个例子中,,因此有 ,,二次型矩阵

半正定。这就从数学上证明了我们求出的极值确是极小值。第三十九页,共一百七十一页,编辑于2023年,星期三例1.2—4求泛函

在自由端点条件下的极值曲线。解:这个问题的欧拉方程是

欧拉方程的积分曲线是

横裁条件是 ,或 , ,解上面两个代数方程,得,。因此,极值曲线为

第四十页,共一百七十一页,编辑于2023年,星期三第四十一页,共一百七十一页,编辑于2023年,星期三布什总统就美国决定退出《反导条约》发表电视讲话布什的讲话:

早上好,我们刚刚结束了国家安全委员会的一次会议。我们回顾了我与我的朋友——俄罗斯总统普京,在过去几个月的多次会议上的会谈情况。美国人民需要放弃1972年达成的《反弹道导弹条约》。

今天,我已正式通告俄罗斯,美国要从这个存在了将近30多年的条约中退出。我们认为,《反弹道导弹条约》妨碍了我们政府寻求保护民众的新途径所做的努力,阻碍了保护民众免遭恐怖分子和流氓国家的导弹袭击的努力。……..第四十二页,共一百七十一页,编辑于2023年,星期三NMD─美國國家導彈防御系統介紹改迸的預警雷達,它們是NMD系統的"眼睛",能預警到4000-4800千米遠的目標。美國除要改進現有部署在阿拉斯加的地地彈預警雷達以及部署在加州与馬薩諸塞州的"鋪路爪"雷達外,還要在亞洲地區新建一個早期預警雷達。地基雷達是一种X波段、寬頻帶、大孔徑相控陣雷達,將地基攔截彈導引到作戰空域。地基攔截彈是NMD的核心,由助推火箭和攔截器(彈頭)組成,前者將攔截器送到目標鄰近,后者能自動調整方向和高度,在尋找和鎖定目標后与之相撞,將它擊落在太空上。

第四十三页,共一百七十一页,编辑于2023年,星期三

美国国防部高级官员近日透露,将从今年夏天开始部署用于导弹防御系统的拦截武器,这一计划比白宫原定的“秋季期限”有所提前。美国导弹防御局发言人里克·莱纳说:“也许6、7月前后第一枚拦截导弹将进入发射井。”布什政府的导弹防御系统是克林顿提出的国家导弹防御系统的延伸与扩展,从以陆基中段拦截导弹为主发展到陆基、海基和空基多层次导弹防御体系的结合。美国心急火燎地宣布将提前启动该系统,引起了人们的广泛置疑和揣测

美急于部署导弹防御系统的背后

第四十四页,共一百七十一页,编辑于2023年,星期三中国日报网站消息:据俄罗斯国际文传电讯报道,俄罗斯国防部长伊万诺夫11月29日告诉俄罗斯总统普京,俄罗斯已经成功测试了一个经过改进的反弹道导弹系统。

第四十五页,共一百七十一页,编辑于2023年,星期三机动型“白杨-M”的战术技术性能优势显著。导弹采用主动姿态控制系统等先进制导技术,飞行过程中弹体平稳,不会发生翻转。导弹飞行距离超过1万公里时,其命中精度误差小于90米。此外,为了提升突防能力,“白杨-M”具有额外机动能力,可连续变更自己的位置,变化莫测、防不胜防,且能从机动路途中的任意一个点发射,可以说是美国国家导弹防御系统的克星俄试射新型导弹对抗NMD第四十六页,共一百七十一页,编辑于2023年,星期三发射中的以色列“箭”式反导导弹

以色列美国成功进行“箭”式反导系统试验中新网7月30日电据法新社报道,以色列和美国星期四(29日)在加利福尼亚州的一个靶场成功地进行了“箭”式反导系统实弹拉截实验。这种反导系统是目前唯一的一种现役反导系统。第四十七页,共一百七十一页,编辑于2023年,星期三发射升空的以色列“箭”式反导导弹

以色列时间下午8点25分,一枚美国从伊拉克没收的飞毛腿”导弹从美国海军的一个空战中心发射升空,“箭”式系统的雷达“绿松”发现并确定了这枚导弹的方位,并引导一枚“箭”式导弹拦截了这枚飞毛腿导弹。

第四十八页,共一百七十一页,编辑于2023年,星期三中国日报网站消息:遭遇了一连串的败绩后,美国的导弹防御系统试验终于在2月24日重现一丝曙光。当天美军从夏威夷附近海域的舰艇上发射拦截导弹,一举摧毁了“来袭”的模拟敌方导弹。美国国防部导弹防御局发言人理查德·莱纳两个多月来第一次宣布了一条“获胜”的消息。他在五角大楼的新闻发布会上兴奋地表示:“我们成功地进行了一次拦截-摧毁防御试验。”第四十九页,共一百七十一页,编辑于2023年,星期三7月6日,日本防卫厅长官石破茂前往首相办公室参加内阁会议。在当天石破茂向内阁会议提交的2004年《防卫白皮书》中,“专守防卫”和“禁止出口武器”两大军事限制被束之高阁,并声称要耗资100亿美元在7年内建成导弹防御系统

日本计划在7年内建成弹道导弹防御系统

第五十页,共一百七十一页,编辑于2023年,星期三第五十一页,共一百七十一页,编辑于2023年,星期三第五十二页,共一百七十一页,编辑于2023年,星期三第五十三页,共一百七十一页,编辑于2023年,星期三第五十四页,共一百七十一页,编辑于2023年,星期三

三、未定终端时间、无约束条件的变分问题前一节研究泛函

(1·3一1)的极值时,都假设初始的间和终端时间是固定不变的。这问题称为固定端点时间问题。但是,在最优控制中经常还会遇另一类问题,·它的终端时间未规定,称为未定终端时间问题。绪论中曾经提到的最短时间问题就是未定终端时间问题的一个实例。假设终端时间未规定,但不是任意的,它受终端状态约束,而又取决于给定的终端曲线。规定了终端状态与终端时间之间的关系。如果终端状态分别是、、,则相应的终端时间就只能分别是、、,如图1—13所示。第五十五页,共一百七十一页,编辑于2023年,星期三第五十六页,共一百七十一页,编辑于2023年,星期三研究未定终端时间问题的任务是:寻找一条连续可微的极值曲线,它由给定的起始点出发,”在终端时间到达给定的终端曲线,即(1.3—2)使性能泛函(1·3—1)达到极小(或极大)。仿照固定端点时间问题分析方法,我们用表示极值函数或曲线,用(1.3—3)表示与邻近的一族曲线。这里是的变分。再用 (1·3—4)表示与曲线族相对应的一切终端时间的集合。表示与极值曲线或最优轨线相对应的终端时间,称为最优终端时间。是的变分将式(1·3—3)两边对t求导,得到(1.3—5)第五十七页,共一百七十一页,编辑于2023年,星期三将式(1·3—3)一(1·3—5)代入式(1·3—1),可得(1·3—6)如前所述,泛函J取极值的必要条件是

对于式(1·3—6),可得

(1·3—7)上式等号右边第一项相当于固定端点时间问题,利用第二节的结果,有第五十八页,共一百七十一页,编辑于2023年,星期三 式(1·3—7)等号右边第二项,先用积分中值定理,再让它对求导,然后令,则变为将式(1.3—8)、(1·3—9)代入式(1·3—7),再令结果等于零,可得到(1.3—10)在终端处,终端时间和终端状态受终端界线方程(1·3—2)约束,因此,变分同彼此相关,只允许其中之一可以任意选择,一但确定了其中的一个,则另一个必须按照方程(1·3—2)确定。将式(1.3—3)、(1.3—4)代入式(1,3—2),得(1·3—11)将.上式两边对求偏导,再令,得(1.3—12)其中, ,于是得到同之间的关系,即为(1.3—13)下面用图解方法对方程(1·3—l3)稍加解释。在图1—14中,第五十九页,共一百七十一页,编辑于2023年,星期三第六十页,共一百七十一页,编辑于2023年,星期三表示最优轨线,是一条容许的邻近曲线,由图可知:

于是得出

这个近似等式就是方程(1.3—13),它同精确等式之间只相差一个高阶无穷小。将方程(1.3—13)代入式(1.3—10),得 (1.3—14)在方程(1·3—14)中,同互不相关,且任意选择,也是任意的。也就是说,该式左边分别同、、有关的3项是互不相关的,要使该式成立,必然是上述3项分别等于零。由此得出第六十一页,共一百七十一页,编辑于2023年,星期三

(1.3—15)

(1.3—16) (1.3—17)方程(1·3—15)是未定终端时间问题的欧拉方程。方程(1·3—16)、(1·3—17)是横截条件,式中应有连续二阶导数,L至少二次连续可微,连续一阶导数。如果始端固定,则,初始条件是;若未规定,则始端条件是。因为可任意选择,则由方程(1·3—17)可得

此外,在求解这类变分问题时还必须在终端时刻满足约束条件(1.3—2)。

第六十二页,共一百七十一页,编辑于2023年,星期三

小结综合以上讨沦,得到如下结果:如果函数是在给定初始时间从某个容许初始点出发,到达给定终端约束曲线上的某一点,并且使性能泛函

取极值的极值函数,那么,它同最优终端时间一起,必须满足:1)欧拉方程

2)横截条件

第六十三页,共一百七十一页,编辑于2023年,星期三

例1·3—1试求在t—x平面上由点到曲线具有最短弧长的曲线方程(假设只取正值)。解:由题意,所示问题的性能泛函是,未规定参照例1·2—3,这个问题的极值曲线方程是

联立求解这3个方程,可得;;于是得到极值曲线和最优终端时间为 和如图l—15所示。

第六十四页,共一百七十一页,编辑于2023年,星期三第六十五页,共一百七十一页,编辑于2023年,星期三四、无条件变分问题的进一步讨论这一节继续研究无约束条件的变分问题,把它从只有一个自变量函数的情况推广到具有n个自变量函数的泛函。首先讨论欧拉方程和横截条件的矢量形式,然后讨论变分方法。1.欧拉方程和横截条件的矢量形式到这里为止,我们研究的性能泛函只包含一个自变量函数现在讨论性能泛函包含有多个自变量函数的情况,导出它的欧拉方程和横截条件,然后再用状态空间法把它们写成矢量形式。假设性能泛函 (1·4—1)是自变量函数的函数,每一个都是独立变量的函数,具有连续的二阶导数,把它写成矢量形式,则(1·4—2)式中是一n维矢量,“T’表示矢量或矩阵的转置。(纯量函数至少二次连续可微。假设起始时间固定(也可以不规定),终端时间受一族给定的终端界线约束,具有连续一阶导数。第六十六页,共一百七十一页,编辑于2023年,星期三

下面,我们采用同前几节类似的方法来推导这类问题的欧拉方程和横截条件。假设最优轨线是相应的变分是于是,邻近的曲线族可以表示成 (1·4—3)对上式两边求导,得(1·4—4)把它们写成矢量形式(1.4—5) (1.4—6)其中 假设是最优终端时间,则(1.4—7)格式(1.4—3)、(1.4—4)和(1.4—7)代入式(1.4—1),得

(1·4—8)第六十七页,共一百七十一页,编辑于2023年,星期三同前面—样,在求泛函对参数的偏导数时要利用泛函对参数求导法则,在这里利用

这个关系,将方程(1·4—8)两边对求导,再令,得

(1.4—9)将上式右边被积函数中每一个方括弧内的第二项使用分部积分,可得

(1.4—10)第六十八页,共一百七十一页,编辑于2023年,星期三或写成矢量形式

(1.4—11)在终端时间、终端状态受终端界线族约束,即 (1.4—12)这里。因此,与彼此相关。把式(1·4—5)、(1·4—7)代入式(1·4—12),得到

将上式两端对求偏导,再令,整理以后,得

,(1·4—13)已知泛函J取极值的必要条件是第六十九页,共一百七十一页,编辑于2023年,星期三将式(1,4—13)代入式(1·4—11),并令结果等于零,得到泛函(1·4—1)取极值的必要条件:

(1.4—14)式中的每一个分量以及都浓此互不相关且任意。利用基本预备定理,得到 (1.4—15) (1.4—16)

(1.4—17)以及 (1.4—18)第七十页,共一百七十一页,编辑于2023年,星期三方程(1·4—15)和方程(1·4—16)一(1·4—18)分别是欧拉方程和横截条件的矢量形式。如果终端时间固定,则,由方程(1·4—11)可得出终端横截条件, (1·4—19)上式的展开形式是 ,如果彼此无关且任意,则上式左边项之和等于零必然是各项分别等于零,于是得出以下个条件,即第七十一页,共一百七十一页,编辑于2023年,星期三例1·4—1给定性能泛函式中。假设和固定,,在终端时间满足。试确定使泛函J取极值的横截条件。解:已知固定,由方程(1·4—19),这个问题的终端横截条件是 (1.4—20)同时,在终端时间还要求满足因此,同彼此相关,由方程(1.4—20)不能得出的左边两项分别等于零。令 (1.4—21)代入约束方程(1.4—21),得

将上式两边对求偏导,再令,得到 ,

,第七十二页,共一百七十一页,编辑于2023年,星期三上式中、之一可以任意选择,把它代入式(1.4—20),得

已知始端固定,。于是,得到两端边界条件分别为 (1·4—23)和第七十三页,共一百七十一页,编辑于2023年,星期三

例1.4—2试求从点到圆的具有最短弧长的曲线方程。解:由题意,这个问题的性能泛函是

欧拉方程是

欧拉方程的一次积分是 和或,其中 ,由此可得 ,其中 ,对以上两式分别积分,得第七十四页,共一百七十一页,编辑于2023年,星期三利用初始条件,可得和。利用式(1·4—24),·这个问题的终端横截条件是

,联立求解这两个代数方程,得 或,于是,我们得到的极值曲线为 或

图1—36是这个问题的几何说明。不难看出,从点到的具有最短弧长的曲线方程是

第七十五页,共一百七十一页,编辑于2023年,星期三第七十六页,共一百七十一页,编辑于2023年,星期三2.变分方法到目前为止,我们是用微分方法确定泛函极值的,即依据

建立的泛函取极值的必要条件,用

的符号确定极值的性质。在这一小节里,我们要介绍确定泛函极值的变分方法;用泛函的一次变分等于零建立极值的必要条件,用二次变分确定极值的性质。考虑性能泛函 (1·4—25)其中和固定。假设是极值曲线或最优轨线,用和分别代表和,并定义为和的一次变分,那么(1·4—26)表示xt(6)邻近的任意—族容许曲线,且有(1·4—27)将式(1·4—26)、(1·4—27)代入式(1·4—25)的右边,并在,上将展开成台劳级数,即第七十七页,共一百七十一页,编辑于2023年,星期三

(1.4—28)式中HOT表示关于和的高阶项。用表示的增量,即

(1.4—29)第七十八页,共一百七十一页,编辑于2023年,星期三定义的一次变分为的线性主部并令,得到

(1.4—30)对上式积分号下第二项使用分部积分,整理后得

(1.4—31)式中任意,采用同第一节类似的分析方法,运用变分法的基本预备定理,可导出 (1.4—32)和

(1.4—33)第七十九页,共一百七十一页,编辑于2023年,星期三这两个方程正是变分问题的欧拉方程和横阶条件得出结论:条件: (1.4—34)同条件

是等效的。再定义的二次变分为的二次部分,即

(1.4—35)将式(1·4—35)同式(1·2—16)相比较,可以看出它们之间的唯一差别仅在于式(1·4—35)右边增加了一个比例系数1/2。由此可以得出结论:我们也可以利用的符号来判断极值的性质。用变分方法来建立泛函取极值的必要条件和充分条件比微分方法要简明些。因此,在后面的讨论中我们都采用变分方法。第八十页,共一百七十一页,编辑于2023年,星期三

五、有约束条件的变分问题前面几节讨论的变分问题都未涉及约束条件。但是,一切实际最优控制问题都存在着各式各样的约束条件,其中包括等式约束,也包括不等式约束。在这一节里,首先讨论有等式约束的变分问题;然后,简短地介绍有不等式约束的变分问题。1.有等式约束的变分问题一切实际控制系统,其运动轨线都必须满足系统本身的运动方程式。这就是说,我们只能从满足系统运动方程式的函数的集合中来挑选使泛函取极值的。这就是一类有系统微分方程约束的条件极值问题。我们知道,在处理有等式约束的普通函数求极值问题时有一种比较方便的方法,叫做拉格郎乘子法。它通过拉格朗日乘子约束条件结合到原来求极值的函数,构成一个新函数。于是,在给定约束条件下求原来函致的条件极值问题就转化成求新函数的无条件极值问题。这个思想也可以用来处理有微分方程等式约束变分问题。·首先,考虑只有两个自变量函数的泛函,然后再推广到有个自变量函数的情况。第八十一页,共一百七十一页,编辑于2023年,星期三考虑性能泛函

(1.5—1)假设式中和固定,端点条件为

,, (1.5—2)函数、满足下列微分方程: , (1.5—3)我们的任务是:在满足端点约束条件(1·5—2)和微分,方程(1·5—3)的函数的集合{、}中,寻找出使性能泛函(1.5—1)取极值的函数。如前所述,泛函J取极值的必要条件它的一次变分等于取泛函(1·5—1)的一次变分,并令结果等于零,得到

(1.5—4)这是一个固定端点问题,式(1·5—4)中,,,第八十二页,共一百七十一页,编辑于2023年,星期三

如果积分号内和彼此无关且任意选取选,那么,我们就可以使用基本预备定理,得出积分号下两个方括弧内的函数别等于零。但是,这里和受方程(1·5,—3)约束,和有关,只允许其中之一任意选取,因此不能使用基本预备本理。假设和是任意一组满足约束方程(1·5—3)的容许函数,取方程(1.5—3)的变分,得到 (1.5—5)将上式两边乘以待定函数因子(函数拉格郎乘子),然后在到间积分,得 (1.5—6)

第八十三页,共一百七十一页,编辑于2023年,星期三将每个积分号下的第二项分别进行分部积分,并注意到、、、都为零,得到 (1.5—7)将方程(1·5—7)的每一项加到方程(1·5—4)的相应项,得

定义一个辅助泛函 (1.5—8)则上式可表示成(1.5—9)由于同彼此相关,只有其中的一个(比如)可以任意选取,另一个(比如)不是任意的,因此暂还不能对式(1·5—9)直接使用基本预备定理。’那么,怎么办呢?我们知道,函数中包含有待定函数现在我们这样来选择,使它满足第八十四页,共一百七十一页,编辑于2023年,星期三

(1.5—10) 经过这样选择的,就使方程(1·5—9)变成式中是一任意函数,且,具备使用基本预备定理的条件,于是得到 (1.5—11) 通过以上分析,可以得出如下结论:如果函数、是在微分方程(1·5—3)约束下使泛函(1.5—1)取极值的极值函数,是有关的函数拉格郎乘子,那么,、以及必须同时满足下列方程,即1)2) (1.5—12)3)第八十五页,共一百七十一页,编辑于2023年,星期三另一方面,如果利用辅助函数构成一个新泛函,即

那么,可以看做3个自变量函数、以及的函数。利用前面几节的讨论结果,可得出使取得极值的、和必须满足下列欧拉方程: 1) 2) (1.5—14)

3)或第八十六页,共一百七十一页,编辑于2023年,星期三容易看出,方程组(1·5—12)与方程组(1·5—14)完全相同。这个事实证明:如果通过函数拉格郎乘子把约束方程(1·5—3)结合到原来求极值的泛函式(1·5—1),构成一个如式(1·5—13)所示的新泛函,那么,在微分方程(1.5—3)约束下求原泛函的条件取值问题转换成求新泛函的无条件极值问题。上述结论虽然是针对只有两个自变量函数的泛函推导出来的但是进一步可以证明,这个结论也适用于具有多个自变量函数的泛函以及端点条件更为复杂的情况。

小结总结以上讨论,得到如下结果:如果给出性能泛函

其中是维矢量,要求在矢量微分方程 (1·5—16)的约束下求泛函J的极值,其中 是m维矢量函数,且m<n,那么,我们可以用一个m维矢量拉格郎乘子

将约束条件(1·5—16)结合到泛函(1·5—15)构成一个新泛函,即(1·5—17)第八十七页,共一百七十一页,编辑于2023年,星期三于是,在微分方程组(1·5—16)约束下求泛函(1·5—l5)的条件极值问题就转化成求新泛函(1·5—l7)的无条件极位问题。假设函数,使泛函取极值,那么,这n+m个函数必须满足下面n+m个方程: , (1.5—18)和,或写成矢量形式

在这里我们把辅助泛函作为依赖于n+m个自变量函数,的泛函来看待。方程(1·5—20)同方程(1·5—21)一起是它们的欧拉方程。为了说明有微分方程等式约束的变分问题的具体解法,下面分析几个例题。第八十八页,共一百七十一页,编辑于2023年,星期三

例1·5—1火箭在自由空间里的运动用下列微分方程描述 图1—17是它的状态变量图。令,可以建立状态方程 (1.5—22)其中 ,,试求控制函数,把系统(1·5—22)从初始状态

经过2秒钟转移到状态空间原点,即

且使性能指标

(1.5—23)取极小。

第八十九页,共一百七十一页,编辑于2023年,星期三第九十页,共一百七十一页,编辑于2023年,星期三

解:选择矢量拉格郎乘子,把约束条件(1·5—22)结合到性能泛函(1。5—23),构成辅助泛函

这里式中控制函数可视为泛函J’的另一个自变量函数。假设使取极值,那么,它们必须满足欧拉方程:

联立求解上述欧拉方程,可得

第九十一页,共一百七十一页,编辑于2023年,星期三

利用边界条件

可以算出4个积分常数

于是得到最优控制和最优轨线,即

图1—18示出了最优控制函数和最优轨线。第九十二页,共一百七十一页,编辑于2023年,星期三例1.5—2给定线性系统状态方程

初始条件为

终端条件为 未规定试求控制和,使性能泛函

第九十三页,共一百七十一页,编辑于2023年,星期三解:利用拉格郎乘子,建立辅助泛函

它的欧拉方程是

解欧拉方程,可得,

第九十四页,共一百七十一页,编辑于2023年,星期三利用边界条件

可求出4个积分常数为

于是得到最优控制 ,第九十五页,共一百七十一页,编辑于2023年,星期三例1.5—3给定系统方程

端点条件为

试求控制,使性能泛函 ,未规定取极小。解:利用拉格郎乘子人,建立辅助泛函

它的欧拉方程是

由以上各式可得第九十六页,共一百七十一页,编辑于2023年,星期三

由此可得

由,可得

由,可得

由,得

第九十七页,共一百七十一页,编辑于2023年,星期三由

可得

联立求解上述方程,得

于是得到

第九十八页,共一百七十一页,编辑于2023年,星期三2.有不等式约束的变分问题在最优控制问题中,除存在微分方程等式约束外,还经常遇到不等式约束。比如,在姿态控制问题中,由于喷气发动机最大推力有限,控制力只能在其绝对值不大于最大推力的范围内取值。这个关系用数学来描述,就是一个不等式约束。包含有不等式约束的变分问题一船提法是:给定性能泛函

(1.5—24)要求在微分方程

(1.5—25)和不等式

(1.5—26)的约束下,求泛函的极值。式中是维矢量,是维矢量函数,和是r维矢量,是r维矢量函数第九十九页,共一百七十一页,编辑于2023年,星期三移动机器人的导航和路径规划问题可用最优控制有不等式约束的变分方法求解第一百页,共一百七十一页,编辑于2023年,星期三本田公司研制的ASIMO人工智能机器人。据称这款机器人是世界上第一款能够在人类生活空间自由自在地移动的机器人。

第一百零一页,共一百七十一页,编辑于2023年,星期三能看懂手势、会上网的新款ASIMO

本田的双足行走机器人“ASIMO”又变聪明了。在本田制作的演示录像中,ASIMO就象一个被委派了接客任务的孩子一样,虽然动作还有些稚嫩,但也算是有板有眼地完成接待然务。这可不是科幻片,本田将从2003年1月开始出租可提供上述服务的新款ASIMO。第一百零二页,共一百七十一页,编辑于2023年,星期三跟着讲解员行走的ASIMO。利用内置CCD照相机拍摄的5帧/秒的动态图像

第一百零三页,共一百七十一页,编辑于2023年,星期三11月5日,在德國法蘭克福機場,兩名旅客從負責安全檢查的機器人旁走過。這個名叫“OFRO”的機器人是世界上第一個具有室外安全檢查功能的移動機器人,造價為5萬歐元。第一百零四页,共一百七十一页,编辑于2023年,星期三中国科学院自动化所研制基于复合机构的非结构环境移动机器人

(1)新型的轮-腿-履带复合型移动机构

(2)基于神经网络与模糊算法的控制系统

(3)多功能集成传感器信息采集、信息处理系统

功能和指标:

(1)外形尺寸:长:0.8M、宽:0.72M、高:0.48M

(2)上下楼梯:标准行人楼梯

(3)移动速度:轮式移动10M/min、履带移动

5M/min

(4)爬坡能力:不小于三十度

(5)越障能力:不大于0.28M

(6)整机重量:不大于100kg

(7)自动避碰功能

(8)自寻道路和目标功能

(9)自动上下楼梯过程中自动调偏

(10)轮、履带两种移动方式自动切换功能第一百零五页,共一百七十一页,编辑于2023年,星期三美国陆军参与实战的机器人士兵现身巴格达

3月份起,美国陆军将在伊拉克战场上首次使用18个遥控“剑”(“SWORDS”)机器人士兵。这种全名为“特种武器观测侦察探测系统”的机器人士兵,每分钟能发射1000发子弹,它们将成为美国军队历史上第一批参加与敌方面对面实战的机器人。第一百零六页,共一百七十一页,编辑于2023年,星期三美军SWORDS战斗机器人“剑”,身高0.9米,配备有5.56毫米口径的M249机枪,或者7.62毫米口径的M240机枪,外加M16系列突击步枪与M202-A16毫米火箭弹发射器,它能够连续不中断向敌方发射数百发枪弹及火箭弹。此外,每个“剑”还拥有4台摄像机、夜视镜、变焦设备等光学侦察或瞄准设备。鉴于“剑”的这种特殊装备与能力,美国军方对它寄以厚望,认为它们能1个抵上几个甚至十几个人类士兵的作用。试验表明,已经研制成功的2个手擎步枪的机器人狙击手,它们的电脑控制步枪的命中率几乎可达到100%。第一百零七页,共一百七十一页,编辑于2023年,星期三 星期一在日本爱知县举行的世界博览会彩排上,名为Astroid的机器人在接待处预演如何引领参观者入场。这些机器人能以4种语言问候参观者,还能够娱乐参观者的小孩,甚至表演饶舌音乐。这是由日本机器人公司Kokoro研制、具有人型特征的机器人Astroid。Astroid精通日文、韩文、英文和中文4种语言的4万个短语。2005年世界博览会将从本月25日起举行,一直到9月25日。(法新社)她,精通四国语言(2005-03-10)第一百零八页,共一百七十一页,编辑于2023年,星期三日本电子产品制造商日立昨天在东京展示一款如儿童般大小的双轮脚机器人“EMIEW”(Excellentmobilityandinteractiveexistenceasworkmate)。(图左)这台高130cm、重70kg的机械人能够避开障碍、对简单的声音指令作出反应及阅读天气预测。(美联社)《联合早报》(编辑:冯玉君)儿童般大小的机器人

第一百零九页,共一百七十一页,编辑于2023年,星期三机器人移动避障完成指定任务时,要进行最优导航和路径规划,这个问题可表示为具有状态空间约束的最优控制问题。第一百一十页,共一百七十一页,编辑于2023年,星期三

处理不等式约束的一种较好的方法是:首先把不等式约束化成等效的等式约束;然后,作为等式约束来处理,即使用拉郎乘子,把微分方程等式约束和由不等式转化成的等式约束结到原来的性能泛函,构成一个新的辅助泛函。于是,在给定等和不等式约束下求原泛函的条件极值问题便转化成求辅助泛函无条件极值问题。下面用一个例题来介绍这个方法。

例1·5—4给定系统状态方程

和边界条件

试在不等式

约束下求控制函数,使达到最大。假设和固定。解:使取最大,也就是使—

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论