版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1
最优控制中南大学
2008.03大家好大家好2
第二章变分法及其
在最优控制中的应用2.1变分法简介2.2泛函的变分2.3欧拉方程2.4横截条件2.5泛函局部极值的充分条件2.6等式约束条件下的变分问题2.7利用变分法求解最优控制问题小结大家好32.1变分法简介
作为数学的一个分支,变分法(calculusofvariations)的诞生,是现实世界许多现象不断探索的结果:约翰·伯努利(JohannBernoulli,1667-1748)1696年向全欧洲数学家挑战,提出一个难题:“设在垂直平面内有任意两点,一个质点受地心引力的作用,自较高点下滑至较低点,不计摩擦,问沿着什么曲线下滑,时间最短?”这就是著名的“最速降线”问题(TheBrachistochroneProblem)。大家好4
它的难处在于和普通的极大极小值求法不同,它要求出一个未知函数(曲线),来满足所给的条件。这问题的新颖和别出心裁引起了很大兴趣.罗比塔(1661-1704)、雅可比·伯努利(1654-1705)、莱布尼茨(1646-1716)和牛顿(1642—1727)都得到了解答。约翰的解法比较漂亮,而雅可布的解法虽然麻烦与费劲,却更为一般化.欧拉(EulerLonhard,1707~1783)和拉格朗日(Lagrange,JosephLouis,1736-1813)发明了这一类问题的普遍解法,从而确立了数学的一个新分支——变分学。
大家好5
有趣的是,在1690年约翰·伯努利的哥哥雅可比·伯努利曾提出著名的悬链线问题(TheHangingChainProblem),向数学界征求答案,即,固定项链的两端,在重力场中让它自然垂下,问项链的曲线方程是什么。在大自然中,除了悬垂的项链外,我們还可以观察到吊桥上方的悬垂钢索,挂着水珠的蜘蛛网,以及两根电线杆之间所架设的电线,这些都是悬链线(catenary)。大家好6
伽利略(Galileo,1564~1643)比贝努利更早注意到悬链线,他猜测悬链线是抛物线,从外表看的确象,但实际上不是。惠更斯(Huygens,1629~1695)在1646年(当时17岁),经由物理的论证,得知伽利略的猜测不对,但那时,他也求不出答案。到1691年,也就是雅可比·伯努利提出悬链线问题的第二年,莱布尼兹、惠更斯(62岁)与约翰·伯努利各自得到了正确答案,所用方法是诞生不久的微积分,具体说是把问题转化为求解一个二阶常微分方程大家好7解此方程并适当选取参数,得
即为悬链线。
悬链线问题本身和变分法并没有关系,雅可比·贝努利随后所证明的“悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的重心最低,具有最小势能”,有关悬链线的得几个结论,可以用变分法来证明!大家好8
现实生活中的许多现象可以表达为泛函求极值问题,称为变分问题。变分法是处理函数的函数的数学领域,和处理数的函数的普通微积分相对。
什么叫泛函?大家好92.1泛函的变分一、泛函的定义
如果变量J对于某一函数类中的每一个函数x(t),都有一个确定的值与之对应,那么就称变量J为依赖于函数x(t)的泛函,记为:J=J[x(t)]。
说明:由于函数的值是由自变量的选取而确定的,而泛函的值是由自变量的函数的选取而确定的,所以将泛函理解为“函数的函数”。大家好10例2.1.1函数的定积分都是泛函。因为变量J的值是由函数的选取而确定的。2.
离散系统1.连续时间系统:是泛函吗?大家好11例2.1.2在平面上连接给定两点A(ta,xa)和B(tb,xb)的曲线的弧长J是一个泛函,如图2-1所示。当曲线方程x=x(t)(满足x(ta)=xa
,x(tb)=xb
)给定后,可算出它在A、B两点间的弧长为:A(ta,xa)x(t)B(tb,xb)xot图2-1ΔtiΔxi大家好12例2.1.3函数的不定积分泛函的上述概念,可以推广到含有几个函数的泛函的情况:不是泛函。例如大家好13几点说明:
1、泛函是映射,是从函数空间到数域的映射。
2、泛函的自变量是函数,泛函的自变量称为泛函的宗量。
3、容许函数空间:满足泛函的规定条件的宗量的全体所构成的函数空间。
4、求函数的极值时,微分或导数起着重要的作用。求泛函的极值时,变分起着类似的作用。我们将求泛函的极值问题称为变分问题,其相应的方法称为变分法。大家好14从例2.1.2可以知道,连接A、B两点的曲线之弧长的泛函,其被积函数是未知函数导数的函数。在一般情况下,被积函数是自变量t,未知函数x(t)及其导数的函数。所以最简单的一类泛函可表示为:大家好15二、泛函宗量的变分(2.1.1)
泛函J[x(t)]的宗量x(t)的变分是指在同一函数类中的两个函数间的差:图2-2x(t)x0x0(t)t1t2大家好16
三、泛函的连续性
函数相近
零阶相近当函数x(t)与x0(t)之差的绝对值,即:
∣x(t)-x0(t)∣,t1
t
t2
(2.1.2)
对于x(t)的定义域中的一切t(t1
t
t2
)都很小时,称函数x(t)与函数x0(t)是相近的,也称为零阶相近。如图2-3所示。x(t)xot图2-3x0(t)t1t2大家好17一阶相近
当函数x(t)与x0(t)之差的绝对值以及它们的一阶导数和之差的绝对值,即
(2.1.3)都很小,称函数x(t)与函数x0(t)是一阶相近的,如图2-4所示。x(t)xot图2-4x0(t)t1t2注意:一阶相近的两个函数,必然是零阶相近,反之不成立。大家好18都很小时,称函数x(t)与函数x0(t)是k阶相近的。k阶接近:当(2.1.4)大家好19
在不同的函数空间,函数间的距离也不同。在函数空间C[a,b](在区间[a,b]上连续的函数的全体构成的函数空间)中,通常采用下式定义距离:
(2.1.5)函数间距离在函数空间Ck[a,b](在区间[a,b]上连续且具有连续的k阶导数的函数的全体构成的函数空间)中,任意两个函数间的距离定义为:(2.1.6)显然,式(2.1.5)定量地表示两个函数之间的零阶相近度,而式(2.1.6)定量地表示两个函数之间的k阶相近度。大家好20
如果对于任意给定的正数
,可以找到这样一个
>0,当
d[x(t),x0(t)]<
(2.1.7)
时,存在
∣J[x(t)]-J[x0(t)]∣<
(2.1.8)
那么,就说泛函J在点x0(t)处是连续的。根据所采用的函数之间距离定义的不同,是按式(2.1.5)还是式(2.1.6),其对应的泛函分别称为零阶连续泛函或k阶连续泛函。泛函的连续性大家好21四、泛函的常见形式
1、线性泛函连续泛函如果满足下列条件:
(1)J[x1(t)+x2(t)]=J[x1(t)]+J[x2(t)]
(2)J[cx(t)]=cJ[x(t)]其中,c是任意常数,就称为线性泛函。例如都满足上述两个条件,故均为线性泛函。大家好22连续泛函如果满足下列条件:(1)J[x1(t)]+J[x2(t)]=1/2[J[x1(t)+x2(t)]+J[x1(t)-x2(t)]](2)J[cx(t)]=c2J[x(t)]就称为*****二次型泛函*****。例如是关于x(t)的二次型泛函,其中F、Q均为对称矩阵。2、二次型泛函大家好23
五、泛函的变分
变分法(calculusofvariations)是处理函数的函数的数学领域,和处理数的函数的普通微积分相对。譬如,这样的泛函可以通过未知函数的积分和它的导数来构造。变分法最终寻求的是极值函数:它们使得泛函取得极大或极小值。大家好24泛函的变分的定义如果连续泛函J[x(t)]的增量可以表示为:其中,L[x(t),x(t)]是关于x(t)的线性连续泛函,而r[x(t),x(t)]是关于x(t)的高阶无穷小。L[x(t),x(t)]
称为泛函的变分,记为(2.1.9)(2.1.10)也就是说,泛函的变分是泛函增量的线性主部。当一个泛函具有变分时,即泛函的增量可以用式(2.1.9)来表示时,称该泛函是可微的。大家好25例如,泛函的增量为:于是,其变分为:
可以证明,泛函的变分是唯一的。因为,若泛函的变分不是唯一的,则泛函的增量可以写为:大家好26引理2.1.1泛函J[x(t)]的变分为:证明:如上所述,泛函J[x(t)]的增量为:其中,
(0≤
≤1)是一个参变量。由于L[x(t),
x(t)]是关于
x(t)的线性连续泛函,根据线性泛函的性质(2),有(2.1.11)大家好27又由于r[x(t),
x(t)]是关于
x(t)的高阶无穷小,所以利用上述两点结论,便得根据偏微分的定义大家好28因为泛函J[x(t)]的变分为:所以Q.E.D大家好29例2.1.5求泛函的变分
例2.1.4求泛函的变分。大家好30例2.1.4求泛函的变分。根据式(2.1.11),该泛函的变分为:大家好31根据式(2.1.11),所求泛函的变分为:例2.1.5求泛函的变分
大家好32若设则大家好33六、泛函的极值
如果泛函J[x(t)]在函数空间中点x=x0(t)的邻域内,其增量为:就称泛函J[x(t)]在点x0(t)处达到极小值;如果泛函J[x(t)]在函数空间中点x=x0(t)的邻域内,其增量为:就称泛函J[x(t)]在点x0(t)处达到极大值;x0(t)的邻域包含满足条件:的所有点x(t)的球(即以x0(t)为圆心,以
为半径的球)。大家好34注意:所采用的函数间的距离的定义的不同,点x0(t)的邻域内所包含的函数也不同。*若→强极值*若→弱极值
显然,如果泛函J[x(t)]在点x0(t)处达到强极值,那么它在点x0(t)处也一定达到弱极值。反之不成立。定理2.1.1(必要条件)若泛函J[x(t)]是连续可微的,并且在点x0(t)处达到极值,则泛函在点x0(t)处的变分等于零,即(2.1.12)大家好35证明:对于任意给定的x(t),J[x0(t)+x(t)]既是函数x(t)的泛函,又是变量
的函数。泛函J[x0(t)+x(t)]在x0(t)处达到极值,也可看成是函数J[x0(t)+x(t)]在
=0处达到极值,所以函数J[x0(t)+x(t)]对变量
的偏导数在
=0处应等于零,即而由式(1.1.11)有比较上面两式,又考虑x(t)是任意给定的,所以Q.E.D.大家好36
从定理2.1.1的推证中可见,泛函达到强极值与弱极值的必要条件是相同的。应当指出:本节所讨论的定义、引理和定理,稍加变动就可以应用于含有多个未知函数的泛函:J[x1(t),x2(t),…,xn(t)]大家好37AByx0
求平面上过两点和的最短曲线。解:设曲线方程,且。两点间弧长L
是的泛函,设本例就是要解得当泛函为极值的极端函数。例2.1.6大家好38例2.1.72.1.7大家好392.2欧拉方程
最优控制问题中,根据性能指标的类型(积分型性能指标、终值型性能指标、复合型性能指标)的不同,分别对应了古典变分法中的三类基本问题。拉格朗日(Lagrange)问题—基本问题麦耶耳(Mayer)问题波尔扎(Bolza)问题(2.2.1)(2.2.2)(2.2.3)大家好40问题描述:假定点A(t0,x0)和B(tf,xf)是所要寻求的泛函(2.2.1)的极值曲线x(t)的两个固定端点,如图2-5所示,其坐标为:x*(t)xot图2-5x(t)A(t0,x0)B(tf,xf)(2.2.4)现在的问题是:从满足边界条件(2.2.4)的二阶可微的函数中,选择使泛函(2.2.1)达到极小值的函数x(t)。固定端点的Lagrange问题大家好41解:设x*(t)是使泛函(2.2.1)达到极小值且满足边界条件(2.2.4)的极值曲线。现用(2.2.5)表示满足边界条件(2.2.4)的极值曲线x*(t)的邻域曲线。其中x(t)是泛函宗量x(t)的变分,
(0
1)是一参变量。为使x(t)是满足边界条件(2.2.4)的极值曲线x*(t)的邻域曲线,x(t)应具有连续导数且满足条件:
(2.2.6)于是,由式(2.2.5)得到(2.2.7)大家好42
由于x*(t)是极值曲线,所以泛函(2.2.1)在极值曲线x*(t)上的变分等于零(定理2.1.1),即由引理2.1.1知,泛函的变分为(2.2.8)(2.2.9)大家好43(2.2.10)将代入,得大家好44(2.2.12)利用条件x(t0)=x(tf)=0
,则上式变为(2.2.13)(2.2.11)考虑到泛函宗量的变分x(t)是任意的函数,不妨选择(2.2.14)其中w(t)是任一满足下列条件的函数:对式右端第二项进行分部积分将式(2.2.11)代入,并考虑式得变分预备定理大家好45由上式可见,一个非负的函数的定积分为零,只能是被积函数恒等于零,因此有(2.2.15)将上式左端第二项展开,可得(2.2.16)欧拉(Euler)方程欧拉方程(C为某一函数)将式代入式,可得大家好46式中若时,欧拉方程是一个二阶微分方程。大家好47定理2.2.1若给定曲线x(t)的始端x(t0)=x0和终端x(tf)=xf,则泛函达到极值的必要条件是,曲线x(t)满足欧拉方程其中x(t)应有连续的二阶导数,则至少应是二次连续可微的。为什么?大家好48几种特殊的欧拉方程(可以得到封闭形式的解)其中c是待定的积分常数。实际上,将上式左边对t求全导数,有L不显含t欧拉方程1.被积函数L不显含t,即在这种情况下,欧拉方程的首次积分为(2.2.17)大家好493.被积函数L不显含
,即在这种情况下,欧拉方程的首次积分为在这种情况下,欧拉方程的首次积分为2.被积函数L不显含x,即大家好50泛函变分的分量表示法对于大家好51在n维函数空间中,若极值曲线的始端和终端是给定的,则泛函
的每一个分量xi引起的J的变分:同理:泛函变分的向量表示法大家好52欧拉(Euler)方程大家好53
对于向量空间的泛函,也存在着欧拉方程,不过是欧拉方程组(即向量欧拉方程)。(说明了什么?)定理2.2.2在n维函数空间中,若极值曲线X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T和终端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是给定的,则泛函达到极值的必要条件是曲线X(t)满足向量欧拉方程其中X(t)应有连续的二阶导数,而则至少应是二次连续可微的。(2.2.18)大家好54例2.2.1求泛函满足边界条件的极值函数。解:由式(2.2.18)得:其特征方程为:特征根为:从而得大家好55由给定的边界条件于是得极值函数:得大家好56例2.2.2最速降线(又称捷线)问题所谓最速降线问题是:设在竖直平面内有两点A和B,它们不在同一条铅垂线上,现有一质点受重力的作用自较高的A点向较低的B点滑动,如果不考虑各种阻力的影响,问应取怎样的路径,才能使所经历的时间最短?解:在A、B两点所在的竖直平面内选择一坐标系,如图2-6所示。A点为坐标原点,水平线为x轴,铅垂线为y轴。设质点的初速度为零,则由力学的知识可知,质点在重力的作用下,不考虑各种阻力的影响,从A点向B点下滑的速度的大小为(2.2.19)xoyA(0,0)B(xf,yf)dxdydl图2-6为什么?目标泛函?大家好57由图2-6得(2.2.20)将式(2.2.20)代入式(2.2.19)中,并变换,得对上式两边进行积分,可得质点自点A(0,0)滑动到点B(xf,yf)所需的时间为(2.2.21)
设y=y(x)是连接点A(0,0)和点B(xf,yf)的任一光滑曲线,则最速降线问题的数学提法是:在XOY平面上确定一条满足边界条件(2.2.22)大家好58的极值曲线y=y(x),使泛函(2.2.23)达到极小值。这时被积函数为:不显含自变量x,由(2.2.17)知,它的首次积分为化简上式得
理由?大家好59这种方程宜于利用参数法求解,为此,令于是,又由对上式积分,得由边界条件y(0)知,c2=0,于是大家好60令最后得
这是圆滚线的参数方程。式中r是滚动圆半径,其值由另一边界条件y(xf)=yf确定。所以,最速降线是一条圆滚线。说明:圆滚线(摆线/旋轮线)是指一圆沿定直线滚动时,圆周上一定点所描绘出的轨迹。大家好61大家好622.3横截条件当极值曲线x*(t)的端点变化时,要使泛函达到极小值,x*(t)首先应当满足欧拉方程:若端点固定,可以利用端点条件:确定欧拉方程中的两个待定的积分常数。问题:若端点可变,如何确定这两个积分常数?大家好63问题描述:假定极值曲线的始端A(t0,x0)是固定的,而终端B(tf,xf)是可变的,并沿着给定的曲线(2.3.1)变动,(2.3.1)如图2-7所示。现在的问题是需要确定一条从给定的点A(t0,x0)到给定的曲线(2.3.1)上的某一点B(tf,xf)的连续可微的曲线x(t),使得泛函达到极小值。(2.3.2)txA(t0,x0)B(t*f,x*f)x*(t)x(t))(ftj图27横截条件推导过程大家好64(2.3.3)(2.3.4)由图2-7可见,每一条邻域曲线x(t)都对应一个终端时刻tf
,设极值曲线x*(t)所对应的终端时刻为tf*,则邻域曲线x(t)所对应的终端时刻tf可以表示为:(2.3.5)将式(2.3.3)~(2.3.5)代入式(2.3.2),得(2.3.6)解:设x*(t)是泛函的极值曲线。x*(t)的邻域曲线可表示为:大家好65根据泛函达到极值的必要条件则有:(2.3.7)式(2.3.7)左边第一项相当于tf固定时的泛函的变分,按照上一节推导的结果可得(2.3.8)大家好66式(2.3.7)左边第二项先利用中值定理,然后求导,则得(2.3.9)将式(2.3.8)和式(2.3.9)代入式(2.3.7),得考虑到欧拉方程和始端固定所以有(2.3.10)大家好67大家好68(2.3.11)但是,终端点沿曲线(2.3.1)变动,所以x(t*f)与dtf相关。为了进一步简化式(2.3.10),应当求出x(t*f)与dtf之间的关系。
若x(t*f)与dtf互不相关,则由上式得大家好69将上式代入式(2.3.10),可得x(t*f)与dtf之间的关系根据终端约束条件,应有将上式对
取偏导数,并令=0,利用,整理得大家好70的图解xtA(t0,x0)B(t*f,x*f)x*(t)x(t))(ftj大家好71由于dtf是任意的,所以(2.3.12)横截条件大家好72定理2.3.1
若曲线x(t)由一给定的点(t0,x0)到给定的曲线x(tf)=
(tf)上的某一点(tf,xf),则泛函达到极值的必要条件是,x(t)满足欧拉方程和横截条件其中x(t)应有连续的二阶导数,则至少应是二次连续可微的,而
(t)则应有连续的一阶导数。大家好73若极值曲线的始端不是固定的,并沿着曲线(2.3.13)变动,则同样可以推导出始端的横截条件(2.3.14)大家好74(1)t0、
tf
自由x(t0)与x(tf)受约,即x(t0)=
(t0),x(tf)=
(tf),则横截条件为:(2)当t0、
tf
自由,而x(t0)与x(tf)固定时,则横截条件为:
根据定理2.3.1和式(2.3.14),可得到端点可变时,Lagrange问题的解,除有欧拉方程外,还有横截条件:大家好75(3)当t0、
tf
固定,即始端与终端分别在t=t0、t=tf上滑动,则横截条件为:同理:大家好76(4)始端、终端时间和状态都自由时的横截条件为:定理2.3.1和以上几种情况的横截条件,都可以将其推广到n维函数向量X(t)=[x1(t),x2(t),…,xn(t)]T的泛函的情形。大家好77定理2.3.2在n维函数空间中,若曲线X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T是固定的,而终端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是可变的,且在曲面X(tf)=
(tf)上变动,则泛函达到极值的必要条件是,曲线X(t)满足向量欧拉方程和横截条件大家好78其中X(t)应有连续的二阶导数,而则至少应是二次连续可微的,而
(t)=[
1(t),
2(t),
,
n(t)]T则应有连续的一阶导数。
若曲线X(t)=[x1(t),x2(t),…,xn(t)]T的始端不是固定的,而是可变的,并在给定的曲面上变动,其中,则同样可以推导出始端的横截条件为:大家好79
采用分量的变分方式在n维函数空间中,若曲线X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T是固定的,而终端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是可变的,且在曲面X(tf)=
(tf)上变动,求泛函的极值.可用代入消去法,这时大家好80大家好81txA(t0,x0)B(t*f,x*f)x*(t)x(t))(ftj图27大家好82取极值的必要条件为:大家好83由于的任意性,所以有以下的等式成立:(横截条件)大家好84大家好85(1)始端、终端可变,即x(t0)=
(t0),x(tf)=
(tf),则横截条件为:(2)当t0、
tf
可变,而x(t0)与x(tf)固定时,则横截条件为:(3)当t0、
tf
固定,而x(t0)与x(tf)约束时,即始端与终端分别在t=t0、t=tf上滑动,则横截条件为:同理:大家好86(4)始端、终端自由的横截条件为:大家好87例2.3.1求t-x平面上由给定A(0,1)至给定直线x=2-t的弧长最短的曲线方程。o1212txA(0,1)dsx*(t)图2-8解:由图2-8,弧长根据题意,目标泛函应选为:这是一个始端固定,终端可变的泛函的变分问题。由于泛函的被积函数中不显含x(t),所以Euler方程为:大家好88由初始条件x(0)=1,得c2=1,从而有由横截条件(2.3.12),得经整理得,所以c1=1。最优轨线方程为:最优轨线与给定直线垂直。大家好89*2.4泛函局部极值的充分条件泛函二阶变分推导过程:给定泛函为其一阶变分为(2.4.1)(2.4.2)大家好90而二阶变分为大家好91(2.4.3)
于是,为使泛函(2.4.1)在曲线x(t)上达到极小(或极大)值,其一阶变分(2.4.2)应为零,而其二阶变分(2.4.3)必须为正(或负)。由此,得到下面的定理。大家好92定理2.4.1若泛函的一阶变分则J[x(t)]达到极小值的充分条件是二阶型矩阵(2.4.4)是正定的或半正定的;而J[x(t)]达到极大值的充分条件是式(2.4.4)是负定的或半负定的。
定理2.4.1可以推广到含有n个未知函数的泛函的情形。大家好93
复习与讨论1)请写出欧拉方程,并说明欧拉方程是在什么样的端点条件和性能泛函下导出?如何导出?它用来解决什么问题?2)对于拉格朗日问题有几种端点条件?使性能泛函达到极值的定解条件分别是什么?可以由哪些方法推导而来?大家好942.5等式约束条件下的变分问题一、回顾等式约束条件下函数极值问题的解法
设有函数(2.5.2)现在需要求函数Z在约束条件为(2.5.1)情况下的极值。大家好95①从方程(2.5.2)中将y解出来往往是很困难的;②对x和y这两个自变量未能平等看待。从约束条件(2.5.2)中将y解出来。用x表示y,即y=y(x)然后将y(x)代入f(x,y)中,得到
Z=f[x,y(x)](2.5.3)这样,函数Z就只含有一个自变量x了,在等式(2.5.2)约束条件下的函数(2.5.1)的极值问题,就变成无约束条件的函数(2.5.3)的极值问题了。但是,消元法存在两个问题:(1)消元法大家好96(2)拉格朗日乘子法(Lagrangefactor)步骤如下:
①作一个辅助函数F=f(x,y)+g(x,y)
式中,
是待定的常数,称为拉格朗日乘子;
②求辅助函数F的无条件极值,即令(2.5.4)
③联立求解方程(2.5.2)和(2.5.4),求出驻点(x0
,y
0)和待定常数
值;④判断(x0
,y
0)是否是函数f(x,y)的极值点。大家好97
拉格朗日乘子法对于求n元函数
y=f(x1,x2,…,xn)在多个约束方程
gi(x1,x2,…,xn)=0,i=1,2,…,m;m<n条件下的极值问题,同样适用。大家好98二、等式约束条件下泛函极值问题的解法求泛函(2.5.5)在约束方程为(2.5.6)和端点条件为(2.5.7)情况下的极值曲线。这里
X(t)=[x1(t),x2(t),…,xn(t)]T,f=[f1,f2,…,fm]T,m<n。而是x1(t),x2(t),…,xn(t)和t的标量函数。大家好99
利用拉格朗日乘子法求解上述等式约束条件下的泛函极值问题,其具体步骤为构造辅助泛函
其中
(t)=[
1(t),
2(t),…,
m(t)]T是m维待定向量乘子。令(2.5.9)
写出向量形式的欧拉方程
(2.5.10)
(2.5.8)大家好100定解条件:
检验候选函数X(t)是否使泛函达到极值以及是极大值还是极小值。得到候选函数X(t)大家好101如果将向量乘子
(t)也看做是辅助泛函的宗量,那么约束方程(2.5.6)也可以看作是辅助泛函的欧拉方程:大家好102①利用拉格朗日乘子法求得的函数X(t),如果辅助泛函达到极值,就一定是原泛函(2.5.5)的极值函数。因为由约束方程(2.5.6)和欧拉方程(2.5.10)联立解出的向量函数X(t)和
(t)一定满足约束方程(2.5.6),所以必有J0=J,另外,当将所解出的
(t)代入辅助泛函(2.5.8)时,函数X(t)将使辅助泛函(2.5.8)达到无条件极值,因为函数X(t)是辅助泛函(2.5.8)的欧拉方程(2.5.10)的解。②上面的论述仅仅指出了利用拉格朗日乘子法求出的辅助泛函(2.5.8)的无条件的极值函数,一定是原泛函(2.5.5)在等式(2.5.6)约束条件下的极值函数。但是,却没有说明原泛函(2.5.5)在等式(2.5.6)约束条件下的所有极值函数是否都能利用拉格朗日乘子法求出来?下面的定理将回答这个问题。
说明:大家好103定理2.5.1如果n维向量函数X(t)=[x1(t),x2(t),…,xn(t)]T
(2.5.11)能使泛函(2.5.15)在等式约束(2.5.12)条件下达到极值,这里f是m维向量函数,m<n,必存在适当的m维向量函数
(t)=[
1(t),
2(t),…,
m(t)]T(2.5.14)使泛函(2.5.13)大家好104达到无条件极值。即函数X(t)是泛函(2.5.15)的欧拉方程(2.5.16)的解,其中而X(t)和
(t)由欧拉方程(2.5.16)和约束方程共同确定。大家好105说明:
①定理2.5.1表明,泛函(2.5.12)在等式(2.5.13)约束条件下的极值函数X(t),同时也使泛函(2.5.15)达到无条件极值。这就进一步说明泛函(2.5.12)在等式(2.5.13)约束条件下的极值函数X(t)都可通过拉格朗日乘子法求得。
②如果不仅将X(t),而且连函数
(t)在内,都看成是泛函(2.5.15)的宗量,那么,约束方程(2.5.13)也可以看成是泛函(2.5.15)的欧拉方程。方程(2.5.13)和(2.5.16)共有n+m个方程,恰好可以解出n维和m维未知函数X(t)和
(t)。
③当约束方程中(2.5.13)中的函数f不包括有X(t)的导数时,则式(2.5.13)便成为一种代数方程约束。定理2.5.1仍然成立。大家好106例2.5.1已知受控系统的动态结构如图2-9所示。求最优控制u*(t),使目标泛函取极小值。给定的边界条件为x(t)u(t)21s图2-9双积分对象大家好107解:令则得系统的状态方程为:现在的目标泛函为应用拉格朗日乘子法,构造辅助泛函(2.5.17)令大家好108则向量形式的欧拉方程为根据状态方程(1.5.17),得大家好109利用边界条件,可得所以,最优控制大家好1102.6利用变分法求解最优控制问题
对于最优控制问题来说,当状态变量和控制变量均不受约束,即X(t)Rn,U(t)Rm时,是在等式约束条件下求泛函极值的变分问题,因此,可以利用在上一节中介绍的拉格朗日乘子法来求解。在这一节中,利用拉格朗日乘子法求解最优控制问题时,将引入哈密顿(Hamilton)函数,推导出几种典型的最优控制问题应满足的必要条件。大家好111问题2.6.1
给定系统状态方程(2.6.2)初始条件(2.6.1)终端条件:tf固定,X(tf)自由和性能泛函(2.6.3)2.6.1拉格朗日问题的解要求从容许控制U(t)
Rm中确定最优控制U*(t),使系统(2.6.1)从给定的初态X(t0)转移到某个终态X(tf),并使性能泛函(2.6.3)达到极小值。这是拉格朗日问题,又称为积分型最优控制问题。大家好112
解:将状态方程(2.6.1)改写为(2.6.4)于是,上述最优控制问题就变成为在微分方程(2.6.4)约束条件下求泛函(2.6.3)极值的变分问题。利用拉格朗日乘子法,引入n维拉格朗日乘子向量
(t)=[
1(t),
2(t),…,
n(t)]T
(t)称为协态变量,以便与状态变量相对应。构造辅助泛函(2.6.5)大家好113其中,(2.6.6)于是,求泛函(2.6.3)在等式(2.6.1)约束条件下的极值问题,就转变成为求泛函(2.6.5)的无约束条件的极值问题。定义哈密顿(Hamilton)函数为:(2.6.7)它是一标量函数,则式(2.6.6)变为
利用变分法可以写出辅助泛函(2.6.5)的欧拉方程(2.6.8)大家好114
协态方程(或共轭方程)状态方程规范方程(或正则方程)(2.6.11)(2.6.10)(2.6.9)控制方程由得大家好115(2.6.12)初始状态为由于终端时刻tf固定,终端状态X(tf)自由,所以横截条件为(2.6.13)
式(2.6.9)~(2.6.13)就是式(2.6.1)~(2.6.3)所给定的最优控制问题的解应满足的必要条件。这些条件也可以由求辅助泛函J0对状态变量X(t)和控制变量U(t)的变分中推导出来。联立求解规范方程(2.6.9)和(2.6.10)可以得到两个未知函数X(t)和
(t),其一个边界在始端(2.6.12),另一个边界在终端(2.6.13),故称为混合边界问题或两点边界值问题。考虑式,得大家好116求解两点边界值问题步骤由控制方程(2.6.11)求得
U=U[X(t),
(t),t](2.6.14)
(2.6.15)(2.6.16)利用边界条件(2.6.12)和(2.6.13)联立求解方程(2.6.15)和(2.6.16),可得唯一确定的解X(t)和
(t)。将所求得的X(t)和
(t)代入式(2.6.14)中,可求得相应的U(t)。并代入大家好117说明:
(1)对于两点边界值问题,一般难以求得其解析解,通常需要采用数值计算方法求其数值解。(2)利用引入哈密顿函数的方法求解拉格朗日型最优控制问题,是将求泛函(2.6.3)在等式(2.6.1)约束条件下对控制函数U(t)的条件极值问题转化为求哈密顿函数H对控制变量U(t)的无条件极值问题。这种方法称为哈密顿方法。大家好118定理2.6.1设系统的状态方程则为将系统从给定的初态转移到终端时刻tf固定,终端状态X(tf)自由的某个终态,并使性能泛函大家好119达到极小值的最优控制应满足的必要条件是(1)设U*(t)是最优控制,X*(t)是对应于U*(t)的最优轨线,则必存在一与U*(t)和X*(t)相对应的n维协态变量
(t)
,使得X(t)与
(t)
满足规范方程其中
(2)边界条件为大家好120
(3)哈密顿函数H对控制变量U(t)(t0
t
tf)取极值,即*沿着最优控制和最优轨线,哈密顿函数H对时间t求全导数,得若H不显含t时,则有H(t)=常数t[t0,tf];
也就是说,当H不显含t时,哈密顿函数H是不依赖于t的常数。大家好121例2.6.1已知系统方程和边界条件为求使性能泛函为极小值的最优控制函数与最优轨线。
大家好122由控制方程得解:这是一个最小能量控制问题。其哈密顿函数为协态方程为解协态方程,得大家好123于是由状态方程解得大家好124利用边界条件求得积分常数为于是,最优控制与最优轨线分别为大家好125例2.6.2已知系统方程和边界条件为求使性能泛函为极小值的最优控制函数与最优轨线。大家好126由这些边界条件求得的积分常数为解:问题的规范方程和控制方程均与例1.6.1相同,但边界条件变为大家好127于是,所求得的最优解为
由例2.6.1和例2.6.2可见,对于两个相同的最优控制问题,只是部分终端状态不相同,所得到的最优解则完全不同。大家好1282.6.2波尔扎问题的解问题2.6.2给定系统状态方程(2.6.18)初始条件(2.6.17)和性能泛函(2.6.19)要求从容许控制U(t)
Rm中确定最优控制U*(t),使系统(2.6.17)从给定的初态X(t0)转移到某个终态X(tf),并使性能泛函(2.6.19)达到极小值。这是波尔扎问题,又称为复合型最优控制问题。由于给定的端点条件不同,上述最优控制问题的解将不同。下面根据三种不同的端点条件,分别予以讨论。大家好129
1.终端时刻tf固定,终端状态X(tf)自由的情况构造辅助泛函为:若令哈密顿函数为(2.6.20)(2.6.21)并对式(2.6.20)积分号内第三项进行分部积分,则辅助泛函变为大家好130(2.6.22)求上式对状态变量X(t),X(tf)和控制变量U(t)的变分,得(2.6.24)由于泛函J0达到极值的必要条件为(2.6.23)由于
X(t0)=0,
X(tf)≠0,
X(t)≠0,
U(t)≠0,则由式(2.6.23)和(2.6.24)可得上述波尔扎型最优控制问题的解应大家好131满足的必要条件为这些关系与拉格朗日型最优控制问题的完全相同,所不同的只是横截条件,即协态变量的终端值大家好132
2.终端时刻tf固定,终端状态X(tf)受约束的情况设终端状态受到如下等式的约束(2.6.25)其中
为r(当L=0,r
n-1;当L0,r
n)维向量,即这时,终端状态X(tf)即不是固定的,也不是完全自由的,只能在终端流型(2.6.25)上变动。在构造辅助泛函时,应考虑终端约束条件(2.6.25),为此,需要引入待定的r维拉格朗日乘子向量于是,所构造的辅助泛函为大家好133考虑到哈密顿函数为(2.6.26)并对式(2.6.26)积分号内第三项进行分部积分,则辅助泛函变为大家好134求J0对状态变量X(t),X(tf)和控制变量U(t)的变分,得考虑到
J0=0,
X(t0)=0,
X(tf)≠0,
X(t)≠0,
U(t)≠0,则得到所述最优控制问题的解应满足的必要条件大家好135这些关系与1中的完全相同,所不同的是状态变量的终端约束条件和横截条件大家好136
3.终端时刻tf可变,终端状态X(tf)受约束的情况设终端状态X(tf)受到式(2.6.25)的约束条件。辅助泛函为其中这时,不仅存在最优控制和最优轨线,还存在一个最优的终端时刻。最优控制和最优轨线应满足2中的必要条件,即(2.6.27)大家好137
为了确定最优的终端时刻,令式(2.6.27)对时间t的全导数等于零,即得代入和为0大家好138(2.6.28)式(2.6.28)也称为横截条件。定理2.6.2设系统状态方程为则为将系统从给定的初态的某个终态X(tf),其中tf是可变的,并使性能泛函转移到满足约束条件达到极小值的最优控制应满足的必要条件。大家好139
(1)设U*(t)是最优控制,X*(t)是对应于U*(t)的最优轨线,则必存在一与U*(t)和X*(t)相对应的n维协态变量
(t),使得X(t)与
(t)满足规范方程其中
(2)边界条件为大家好140
(3)哈密顿函数H对控制变量取极值,即
应当指出,对于波尔扎问题来说,哈密顿函数H的性质仍然成立。当H不显含t时H(t)=常数t[t0,tf]约束条件大家好141例2.6.3给定系统状态方程初始条件:和性能泛函:要求确定最优控制u*(t),使性能泛函J达到极小值。大家好142由控制方程得解:这是一个最小能量控制问题。其哈密顿函数为协态方程为解协态方程,得大家好143横截条件端点条件边界条件大家好144由状态方程得:大家好145将边界条件代入规范方程,得解得于是,最优控制为:大家好146例2.6.4给定系统状态方程为:初始条件:终端约束条件:性能泛函:需要确定最优控制u*(t),使性能泛函J达到极小值。大家好147控制方程、规范方程为:由边界条件解:写出哈密顿函数大家好148解得五个未知数所以,最优控制为:最优轨线为:大家好149例2.6.5给定一阶系统求使系统从x(0)=1转移到x(tf)=0,tf可变,且使性能泛函达到极小值的最优控制u*(t)。其中
和
均为确定的常数。大家好150解:这是终态固定、终端时刻tf可变的最优控制问题。写出哈密顿函数控制方程、规范方程为大家好151由边界条件当
=
=1时,由此解得大家好152xoyA(0,0)B(xf,yf)dxdydl最速下降问题:大家好153大家好154大家好155圆滚线轨迹:大家好156大家好157大家好158大家好159大家好160大家好161大家好162大家好163大家好164大家好165大家好166大家好167大家好168大家好169大家好170大家好171大家好172
大家好173大家好174大家好175大家好176大家好177大家好178大家好179大家好180大家好181大家好182大家好183大家好184大家好185大家好186大家好187大家好188大家好189大家好190大家好191大家好192大家好193大家好194大家好195大家好196大家好197大家好198大家好199大家好200大家好201大家好202大家好203大家好204大家好205大家好206大家好207大家好208大家好209大家好210大家好211大家好212大家好213大家好214大家好215大家好216大家好
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030全球玉米胚芽粕行业调研及趋势分析报告
- 耐火浇注预制块行业深度研究分析报告(2024-2030版)
- 2025年晶闸管控制气体保护焊机项目可行性研究报告
- 2025年度工程总承包合同示范文本汇编(更新版)
- 2025年度半导体企业整体转让合同范本
- 2025年度冷链物流厨房设备定制合同
- 2025年度广告代理服务合同(含媒介策划)
- 2025年度海洋工程装备研发制造担保合同
- 2025年度酒店客房用品节能降耗技术研发合同
- 2025年度汽车销售与售后服务一体化服务合同
- pcn培训培训课件
- 山西省晋中市2023-2024学年高一上学期期末考试 数学 含解析
- 过错方财产自愿转让协议书(2篇)
- 监理专题安全例会纪要(3篇)
- 牧场物语-矿石镇的伙伴们-完全攻略
- ISO 22003-1:2022《食品安全-第 1 部分:食品安全管理体系 审核与认证机构要求》中文版(机翻)
- 护理部工作总结
- 农业生产质量安全风险评估与监控方案
- 人教版六年级上册解方程练习300道及答案
- 2017年湖北省黄冈市中考语文(有解析)
- 2024年广东省高考地理真题(解析版)
评论
0/150
提交评论