




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.1 第二讲第二讲 变分法与变分法与 最优控制最优控制 .2 主要内容主要内容 2.1 变分法概述 2.2 无约束最优化问题 无约束固定端点泛函极值必要条件 无约束自由端点泛函极值必要条件 2.3 等式约束最优化问题 2.4 变分法求解最优控制问题 引入哈密顿函数求解拉格朗日问题 求解综合型(波尔扎)问题 .3 2.1 变分法概述 1、泛函定义 2、泛函的连续性 3、泛函的极值 4、线性泛函 5、泛函的变分 6、泛函变分的求法 7、泛函变分的规则 8、泛函极值的条件 .4 2.1 变分法概述变分法概述 1、泛函定义、泛函定义 l定义:定义: 如果变量如果变量y对于某一函数类中的每一个函数对于某
2、一函数类中的每一个函数 x(t),都有一个都有一个确定的值确定的值与之对应,那么就与之对应,那么就 称变量称变量y为依赖于函数为依赖于函数x(t)的泛函,记为:的泛函,记为: y=J x(t)。 说明:说明:由于函数的值是由自变量的选取而确定的,而泛函 的值是由自变量的函数的选取而确定的,所以将泛函理解 为“函数的函数”。 .5 【例2.1】 是一个泛函。 变量J的值是由函数x(t) 的选取而确定。 当 时, 有 。 当 时, 有 。 .6 【例2.2】曲线的弧长 求:平面上连接给定两点A(x0,y0) 和B(x1,y1)的曲线的弧长 J。 A、B两点间的曲线方程为:y=f(x) A、B两点间
3、的弧长为: dx dx dy J x x 1 0 2 1 .7 泛函的上述概念,可以推广到含有几个函数的 泛函的情况,例如: 1 0 )()(dttytxJ dtttxtxLtxJ f t t 0 ),(),()( 求一般函数极值 微分法 求泛函极值 变分法 .8 2 2、泛函的连续性、泛函的连续性 l 函数相近(零阶相近) 当函数x(t)与 x0(t)之差的绝对值,即 x(t)-x0(t) , t1t t2 对于x(t)的定义域中的一切t( t1 t t2 )都很小时, 称函数x(t)与函数x0(t)是相近的,也称为零阶相近。 .9 l 一阶相近 当函数x(t)与 x0(t)之差的绝对值以及
4、它们的一 阶导数 和 之差的绝对值,即 t1 t t2 都很小,称函数x(t)与函数x0(t)是一阶相近的。 )(tx )( 0 tx )()()()( 00 txtxtxtx和 注意:一阶相近的两个函数,必然 是零阶相近,反之不成立。 l K阶相近 当 t1 t t2 都很小时,称函数x(t)与函数x0(t)是k阶 相近的。 )()(, )()(, )()( )( 0 )( 00 txtxtxtxtxtx kk .10 l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: l 在函数空间
5、Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: )()(max)(),( 00 txtxtxtxd bta )()(, )()(, )()(max)(),( )( 0 )( 000 txtxtxtxtxtxtxtxd kk bta 显然,式(2.1)定量地表示两个函数之间的零阶相近度, 而式(2.1)定量地表示两个函数之间的k阶相近度。 (2.1) (2.2) 零阶距离零阶距离零阶距离零阶距离 l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中
6、,通常采用下式定义距离: l 在函数空间Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: )()(max)(),( 00 txtxtxtxd bta (2.1) 零阶距离零阶距离零阶距离零阶距离 )()(, )()(, )()(max)(),( )( 0 )( 000 txtxtxtxtxtxtxtxd kk bta l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: l 在函数空间Cka,b(在区间a,b上连续且具有连续
7、的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: )()(, )()(, )()(max)(),( )( 0 )( 000 txtxtxtxtxtxtxtxd kk bta l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: l 在函数空间Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: )()(, )()(, )()(max)(),( )( 0 )( 000 txtxtxtxtxtxtxtxd
8、kk bta l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: l 在函数空间Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: )()(, )()(, )()(max)(),( )( 0 )( 000 txtxtxtxtxtxtxtxd kk bta l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: l 在函数空
9、间Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: )()(, )()(, )()(max)(),( )( 0 )( 000 txtxtxtxtxtxtxtxd kk bta l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: l 在函数空间Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: )()(, )()(, )()(max)(),( )( 0 )( 0
10、00 txtxtxtxtxtxtxtxd kk bta l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: l 在函数空间Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离 l 函数间距离 在不同的函数空间,函数间的距离定义也不同
11、。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中,通常采用下式定义距离: l 在函数空间Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: 零阶距离零阶距离零阶距离零阶距离 k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离k阶距离阶距离 l 函数间距离 在不同的函数空间,函数间的距离定义也不同。 l 在函数空间Ca,b(在区间a,b上连续的函数的全体 构成的函数空间)中
12、,通常采用下式定义距离: l 在函数空间Cka,b(在区间a,b上连续且具有连续的 k阶导数的函数的全体构成的函数空间)中,任意两个 函数间的距离定义为: .11 l 泛函的连续性 如果对于任意给定的正数,可以找到这样一个 0,当 dx(t),x0(t) 时,存在 Jx(t)Jx0(t) 那么,就说泛函J在点x0(t)处是连续的。 根据所采用的函数之间距离定义的不同,对应的 泛函分别称为零阶连续泛函(2.1)或k阶连续泛函 (2.2)。 .12 3 3、泛函的极值、泛函的极值 l如果是在与仅仅具有零阶 接近度的曲线的泛函中比较得出的极 值,称为强极值。 l如果是在与 具有一阶或一阶 以上接近度
13、的曲线 的泛函中比较得出 的极值,则称为弱极值。 )( 0 txJ )( 0 tx )(tx )( 0 txJ)( 0 tx )(tx .13 4 4、线性泛函、线性泛函 连续泛函如果满足下列条件: (1)叠加原理 : Jx1(t)+ x2(t)= Jx1(t)+ Jx2(t) (2) 齐次性: Jcx(t)=c Jx(t) 其中,c是任意常数,就称为线性泛函。 例如: 2 1 )()(sin)()( t t dttxtttxtxJ 2 1 )()()()()( t t dttxtqtxtptxJ 2 )()( t txtxJ 都满足上述两个条件,故均为线性泛函。 .14 5 5、泛函的变分、
14、泛函的变分 l 宗量的变分宗量的变分 若函数x(t)是变量J的自变量函数,则称x(t)为泛 函Jx(t)的宗量函数。 宗量的变分是指在同一函数类中的两个宗量函数间 的差: .15 )(),(txtxLJ 也就是说,泛函的变分是泛函的变分是泛函增量的线性主部泛函增量的线性主部。 当一个泛函具有变分时,称该泛函是可微的泛函是可微的。 l 泛函的变分泛函的变分 当宗量x(t)有变分时,泛函的增量可以表示为 )()()()(txJtxtxJtxJ )(),()(),(txtxrtxtxL 其中,Lx(t),x(t)是关于x(t)的线性连续泛函; rx(t),x(t)是关于x(t)的高阶无穷小; Lx(
15、t),x(t)称为泛函的变分,记为 线性线性 主部主部 .16 6 6、泛函变分的求法、泛函变分的求法 定理定理2 21 1 连续泛函J(x)的变分,等于 泛函 对的导数在=0 时的值. 即 定理定理2 22 2 连续泛函J(x)的二次变分定义为 (证明略) (证明略) .17 7 7、泛函变分的规则、泛函变分的规则 .18 求泛函 的变分。 【例2.3】 .19 8 8、泛函极值的条件、泛函极值的条件 泛函极值的泛函极值的必要条件必要条件: 定理定理2 23 3 连续可微泛函J(x) 在x0(t)上达到极值 的必要条件为:J(x)在x=x0处必有 泛函极值的泛函极值的充要条件充要条件: 定理
16、定理2 24 4 设可微泛函J(x)存在二次变分, 则在 x=x0处达到极小值的充要条件为: 同理,设可微泛函J(x)存在二次变分, 则在x=x0 处达到极大值的充要条件为: .20 主要内容主要内容 2.1 变分法概述 2.2 无约束最优化问题 无约束固定端点泛函极值必要条件 无约束自由端点泛函极值必要条件 2.3 等式约束最优化问题 2.4 变分法求解最优控制问题 引入哈密顿函数求解拉格朗日问题 求解综合型(波尔扎)问题 .21 2.2 无约束最优化问题无约束最优化问题 1 1、无约束固定端点泛函极值必要条件、无约束固定端点泛函极值必要条件 ),(),(ttxtxL 问题问题 2-12-1
17、无约束固定终端泛函极值问题为无约束固定终端泛函极值问题为: : 其中, 及x(t)在t0,tf上连续可微, t0及tf 固定, n Rtx)( 求满足上式的极值轨线x*(t)。 x(t0)= x0,x(tf)= xf, .22 f t t dtttxtxLtxJ 0 ),(),()( ),(),(ttxtxL 定理定理2 25 5 若给定曲线x(t)的始端x(t0)= x0和终端x(tf)= xf, 则泛函 达到极值的必要条件是,曲线x(t)满足欧拉方程 其中x(t)应有连续的二阶导数, 则至少应是二次连续可微的。 欧拉(Euler)方程 (证明略) 边界条件 0 xx L dt d L 或
18、.23 欧拉方程的全导数形式欧拉方程的全导数形式 在 中,第二项 为全导数 )(tx L dt d 令 ),(txxg x L dt d z x L dt d dt dt x L tdt dx x L xdt xd x L x xt L dt dx xx L dt xd x L 22 2 2 0 2 222 x L x xx L x xt L x L 0 xxxxt xx LxLxLL 得欧拉方程的全导数形式 或 .24 【例2.4】 求泛函 在边界条件 下的极值曲线及极值. .25 几种特殊的欧拉方程(可以得到封闭形式的解)几种特殊的欧拉方程(可以得到封闭形式的解) 被积函数L不依赖于 ,即
19、 被积函数L不依赖于x, 即 被积函数L不依赖于t, 即 在这种情况下,欧拉方程的首次积分为 其中c是待定的积分常数。实际上,将上 式左边对t求全导数,有 x ),(txLL ),(txLL ),(xxLL cLxL x xxxxxxxx LxxLxLxLxLxLxL dt d 2 )( 0)( xxxxx LxLxLx cLxL x x xtxtxL),(),( 0 xxxxt xx LxLxLL 被积函数L 线性地依赖于 ,即 .26 【例2.5】 最速降线(又称捷线)问题 设在竖直平面内有两点A和B, 它们不在同一条铅垂线上。现有 一质点受重力的作用自较高的A 点向较低的B点滑动,如果不
20、考 虑各种阻力的影响,问应取怎样 的路径,才能使所经历的时间最 短? 在A、B两点所在的竖直 平面内选择一坐标系, 如上图所示。A点为坐 标原点,水平线为x轴, 铅垂线为y轴。 结论:最速降线是一条圆滚线。 .27 对于向量空间的泛函,也存在着欧拉方程,不 过是欧拉方程组(即向量欧拉方程)。 定理定理2 26 6 在n维函数空间中,若极值曲线 X(t)=x1(t),x2(t),xn(t)T的始端X(t0)=x1(t0),x2(t0),xn(t0)T和终端 X(tf)=x1(tf),x2(tf),xn(tf)T是给定的,则泛函 f t t dtttXtXLtXJ 0 ),(),()( 达到极值的
21、必要条件是曲线X(t)满足向量欧拉方程 0 X X L dt d L 其中X(t)应有连续的二阶导数,而 则至少应是 二次连续可微的。 ),(),(ttXtXL 向量欧拉方程向量欧拉方程 或 0 X L dt d X L .28 向量欧拉方程 向量欧拉方程向量欧拉方程 可写成标量方程组 0 X L dt d X L 0 0 0 22 11 nn x L dt d x L x L dt d x L x L dt d x L .29 【例2.6】 求泛函 满足边界条件 的极值函数。 2 0 2 2 2 12121 )2()(),( dtxxxxtxtxJ 1) 2 (, 0)0(, 1) 2 (,
22、 0)0( 2211 xxxx 思考:能否利用MATLAB符号工具箱求解微分方程组? .30 当极值曲线x*(t)的端点变化时,要使泛函 达到极小值, x*(t)首先应当满足欧拉方程: f t t ttxtxLtxJ 0 ),(),()( 0 xx L dt d L 若端点固定,可以利用端点条件: ff xtx xtx )( )( 00 确定欧拉方程中的两个待定的积分常数。 问题:问题:若端点可变,如何确定这两个积分常数?若端点可变,如何确定这两个积分常数? 2.2 无约束最优化问题无约束最优化问题 2、无约束自由端点泛函极值必要条件(横截条件)、无约束自由端点泛函极值必要条件(横截条件) .
23、31 图形分析图形分析 , 都固定,图a 即 )( 0 tx )()( * ff txtx 即 0)( 0 tx0)( f tx 固定, 自由 图 b )()( 00 * txtx 0)( 0 tx即 因为 自由 所以0)( f tx 0 )( f t x 终端仅在 上滑动 f tt 求出最优 许多状态轨线 )( f tx )()( 00 * txtx )( 0 tx )( f tx )(tx )( 0 tx )( f tx )( f tx )(tx )( f tx )( 0 tx)( f tx .32 自由, 固定 ,图c 则横截条件变为: f x ff xtx)( 0 )( 0 t x 始
24、端仅在 上滑动 0 tt 端点变动的情况: 自由端点,无约束条件的变分,如图: 始点 在曲线 上变动 0 x)(tx 终点 在曲线 上变动 f x)(tx )( 0 tx)( f tx t )( f tx )( 0 tx )(tx )(t 0 x f x f ftt 0 t 0 0tt f t )(0th )(t )(tx )()(thtx )(th )(fth )(tx 0)( * 0 tt x LxL 0)( * f tt x LxL .33 问题描述:问题描述:假定极值曲线的始端A(t0,x0)是固定的, 而终端B(tf,xf)是可变的,并沿着给定的曲线 )()( ff ttx 现在的问
25、题是:需要确定 一条从给定的点A(t0,x0)到 给定的曲线 上的某一 点B(tf,xf)的连续可微的曲 线x(t) ,使得泛函 f t t ttxtxLtxJ 0 ),(),()( 达到极小值。 变动,如右下图所示。 )( f t .34 横截条件 定理定理2-72-7 若曲线x(t)由一给定的点(t0,x0)到给定的曲线 x(tf)=(tf)上的某一点(tf,xf),则泛函 f t t ttxtxLtxJ 0 ),(),()( 达到极值的必要条件必要条件是, x(t)满足欧拉方程 0 xx L dt d L 和横截条件 0)( * f tt x LxL 其中x(t)应有连续的二阶导数, 则
26、至少应是二 次连续可微的,而(t) 则应有连续的一阶导数。 ),(),(ttxtxL (证明略) .35 若极值曲线的始端不是固定的,并沿着曲线 )()( 00 ttx 变动,则同样可以推导出始端的横截条件 0)( * 0 tt x LxL 定理定理2-72-7扩展扩展 .36 根据定理定理2-7和上式,可得到端点可变时,Lagrange 问题的解,除有欧拉方程外,还有横截条件: (1)始端、终端可变,即x(t0)=(t0), x(tf)=(tf),则横截条 件为: 0)( * 0 tt x LxL 0)( * f tt x LxL (2) 当t0、 tf 可变,而x(t0) 与x(tf)固定
27、时,则横截条件为: , 0 * 0 tt x LxL 0 * f tt x LxL (3)当t0、 tf 固定,而x(t0) 与x(tf)可变时,即始端与终端分 别在t=t0、t=tf上滑动,则横截条件为: 0 * 0 tt x L 0 * f tt x L 横截条件总结横截条件总结 .37 定理2-7和以上几种情况的横截条件,都可以将其推广 到n维函数向量X(t)=x1(t),x2(t),xn(t)T的泛函的情形。 定 理定 理 2 - 82 - 8 在n维 函 数 空 间 中 , 若 曲 线 X(t)=x1(t),x2(t),xn(t)T 的始端 X(t0)=x1(t0),x2(t0),x
28、n(t0)T是 固定的,而终端X(tf)=x1(tf), x2(tf), xn(tf)T是可变的,且 在曲面X(tf)=(tf)上变动,则泛函 f t t dtttXtXLtXJ 0 ),(),()( 达到极值的必要条件是,曲线X(t)满足向量欧拉方程 0 XX L dt d L 和横截条件 0)( * f tt X T LXL .38 若曲线X(t)=x1(t),x2(t),xn(t)T的始端不是固定的,而 是可变的,并在给定的曲面 )()( 00 ttX 上变动,其中 ,则同 样可以推导出始端的横截条件为: T n tttt)(,),(),()( 002010 0)( * 0 tt X L
29、XL .39 【例2.7】 泛函求极值 若x(0)与x(2)任意,求极值曲线x*及极值 J(x*). dtxxxxxxJ x 2 0 2 2 1 )(min .40 【例2-8】求固定点A(0,1)到给定直线 的弧长最短的曲线方程tt 2)( .41 主要内容主要内容 2.1 变分法概述 2.2 无约束最优化问题 无约束固定端点泛函极值必要条件 无约束自由端点泛函极值必要条件 2.3 等式约束最优化问题 2.4 变分法求解最优控制问题 引入哈密顿函数求解拉格朗日问题 求解综合型(波尔扎)问题 .42 回顾等式约束条件下函数极值问题的解法 设有函数),(yxgZ (2.2) 现在需要求函数Z在以
30、下约束条件下的极值。 0),(yxf (2.1) (1)消元法:从约束条件(2.2)中将y解出来。 用x表示y,即 y=y(x) 然后将y(x)代入g(x,y)中,得到 Z=gx, y(x) (2.3) 这样,函数Z只含有一个自变量x. 等式等式(2.2)约束条件下的函数约束条件下的函数(2.1)极值问题极值问题 无约束条件的函数无约束条件的函数(2.3)极值问题极值问题 存在两个问题: 从方程(2.2) 中将y解出来往 往很困难; 对x和y这两 个自变量未能 平等看待。 .43 (2)拉格朗日乘子法(Lagrange factor) 步骤如下: 作一个辅助函数 F=g(x,y)+f(x,y)
31、 式中, 是待定常数,称为拉格朗日乘子; 0, 0 y F x F (2.4) 联立求解方程(2.2)和(2.4),求出驻点( x0 , y 0)和待定常数值; 判断( x0 ,y 0)是否是函数g(x,y)的极值点。 (2.2)0),(yxf 约束条件约束条件 求辅助函数F的无条件极值,即令 Lagrange函数函数 等式约束条件下的函数极值问题等式约束条件下的函数极值问题 无约束条件的函数极值问题无约束条件的函数极值问题 .44 (2)拉格朗日乘子法(Lagrange factor) 扩展:扩展: 1、拉格朗日乘子法对于求n元函数 Z=g(x1,x2,xn) 在约束条件下的极值问题,同样适
32、用。 2、拉格朗日乘子法对于求在多个约束方程 fi(x1,x2,xm) =0, i=1,2, ,m; 下的极值问题,同样适用。 3、m n是必要的。 向量向量函数函数 向量向量方程约束方程约束 .45 2.3 等式约束最优化问题等式约束最优化问题 1 1、等式约束固定终端泛函极值必要条件、等式约束固定终端泛函极值必要条件 问题问题 2-22-2等式约束固定端点泛函极值问题为等式约束固定端点泛函极值问题为: : 情况下的极值轨线X*(t)。 (2.5) 求泛函 f t t dtttXtXgJ 0 ),(),( 在约束方程为, 0),(),( 0f tttttXtXf 和端点条件为 ff XtX
33、XtX )( )( 00 (2.6) 向量形式向量形式 .46 【解决方法】 引入拉格朗日向量乘子,将等式约束泛函极值问题 转化为无约束泛函极值问题。 步骤如下: (1)构造辅助泛函 其中(t)= 1(t), 2(t), m (t)T是m维待定向量乘子。 (2.7) 无约束条件的泛函(无约束条件的泛函(2.72.7)极值问题)极值问题 有约束条件(有约束条件(2.62.6)的泛函()的泛函(2.52.5)极值问题)极值问题 dtttXtXftttXtXgJ f t t T 0 ),(),()(),(),( 0 .47 (2)令 写出欧拉方程 0 X X L dt d L ),(),()(),(
34、),(ttXtXftttXtXgL T (3)联立求解欧拉方程(2.8)和约束方程 (2.6),可以得到n维向量函数X(t)和m维向量乘 子 (t)。 (4)利用端点条件确定欧拉方程解中的2n个积分 常数,得到候选函数X*(t) 。 (5)检验候选函数X*(t)是否使泛函(2.7)达到极 值,以及是极大值还是极小值。 (2.8) .48 定理2-92-9 如果n维向量函数 X(t)=x1(t),x2(t),xn(t)T 能使泛函 f t t dtttXtXgJ 0 ),(),( 在等式约束 , 0),(),( 0f tttttXtXf 条件下达到极值,这里f是m维向量函数, m n,必存在适当
35、的 m维向量函数 (t)= 1(t), 2(t), m (t)T 使泛函 dtttXtXftttXtXgJ f t t T 0 ),(),()(),(),( 0 达到无条件极值。即函数X (t)是上述泛函J0的欧拉方程 0 X X L dt d L 的解,其中),(),()(),(),(),(ttXtXfttttXtXgL T 而X (t)和(t)由欧拉方程和约束方程共同确定。 .49 无约束条件的泛函无约束条件的泛函J J0 0极值问题极值问题 有约束条件的泛函有约束条件的泛函J J极值问题极值问题 等价等价 证明:证明: .50 2 0 2 )( 2 1 dttxJ 取极小值。给定的边界条
36、件为 0)2(, 1)0(, 0)2(, 1)0(xxxx 例例2-92-9 已知受控系统的动态结构如图所示。求最优 控制u*(t)及最优轨线x*(t) ,使目标泛函 .51 2.3 等式约束最优化问题等式约束最优化问题 2 2、等式约束自由端点泛函极值必要条件、等式约束自由端点泛函极值必要条件 如何求解?如何求解? .52 主要内容主要内容 2.1 变分法概述 2.2 无约束最优化问题 无约束固定端点泛函极值必要条件 无约束自由端点泛函极值必要条件 2.3 等式约束最优化问题 2.4 变分法求解最优控制问题 引入哈密顿函数求解拉格朗日问题 求解综合型(波尔扎)问题 .53 2.4 变分法求解
37、最优控制问题变分法求解最优控制问题 当状态变量和控制变量均不受约束,即 X(t)Rn,U(t) Rm时,最优控制问题是个在 等式约束条件下求泛函极值的变分问题,因 此,可以利用在上一节中介绍的拉格朗日乘 子法来求解。 在这一节中,利用拉格朗日乘子法求解 最优控制问题时,将引入哈密顿(Hamilton) 函数,推导出几种典型的最优控制问题应满 足的必要条件。 .54 2.4 变分法求解最优控制问题变分法求解最优控制问题 1 1、引入哈密顿函数求解拉格朗日问题、引入哈密顿函数求解拉格朗日问题 ),(),()(ttUtXftX (2.10) 初始条件 00) (XtX (2.9) 终端条件:tf固定
38、,X(tf)自由和性能泛函 f t t dtttUtXLJ 0 ),(),(2.11) 给定系统状态方程 要求从容许控制U(t) Rm中确定最优控制U*(t),使系统(2.9) 从给定的初态X(t0)转移到某个终态X(tf) ,并使性能泛函(2.11) 达到极小值。这是拉格朗日问题,又称为积分型最优控制问题。 问题问题 2-32-3 .55 解:将状态方程 (2.9)改写为 0)(),(),(tXttUtXf (2.12) 最优控制问题 微分方程(2.12)在约束 条件下求泛函 极值的变分 问题。 f t t dtttUtXLJ 0 ),(),( ),(),()(ttUtXftX .56 利用
39、拉格朗日乘子法,引入n维拉格朗日乘子向量 (t)= 1(t), 2(t), n (t)T (t)称为协态变量,以便与状态变量相对应。 f t t T dttXttUtXftttUtXLJ 0 )(),(),()(),(),( 0 (2.13) dtttUttXtXF f t t 0 ),(),(),(),( 求泛函 在等式 约束条件下的极值问题 求泛函(2.13)J0 的无约束条件的极值问题。 f t t dtttUtXLJ 0 ),(),( 构造辅助泛函:构造辅助泛函: 0)(),(),(tXttUtXf .57 定义定义哈密顿(哈密顿(HamiltonHamilton)函数)函数为:为:
40、),(),()(),(),(),(),(),(),(ttUtXftttUtXLttUttXtXH T )()(),(),(),(),(),(),(),(tXtttUttXHttUttXtXF T )()(),(),(),(ttXttUttXH T )(),(),()(),(),(),(),(),(),(tXttUtXftttUtXLttUttXtXF T 辅助泛函辅助泛函 标量函数标量函数 哈密顿函数与辅助函数之间关系为:哈密顿函数与辅助函数之间关系为: .58 0 0 0 U F dt d U F F dt dF X F dt d X F 将 代入欧拉方程,得 0 ),(),()( )( U
41、 H ttUtXf H tX X H t 协态方程 (共轭方程) 状态方程 规范方程 (正则方程) 控制方程 l利用变分法写出辅助泛函利用变分法写出辅助泛函 的欧拉方程的欧拉方程 ),(),(),(),(ttUttXtXF )()(),(),(),(),(),(),(),(tXtttUttXHttUttXtXF T .59 初始状态为 00) (XtX 由于终端时刻tf固定,终端状态X(tf)自由,所以横截条件为 0 f tt X F 得 0)( f t l联立求解规范方程联立求解规范方程 可以得到两个未知函数X(t)和 (t)。 l由边界条件确定积分常量:由边界条件确定积分常量:混合边界问题
42、或两点边界值问题。 ),(),()( )( ttUtXf H tX X H t .60 求解两点边值问题步骤: l 由控制方程由控制方程 求得求得 U=UX(t),(t),t ; l 将上式代入规范方程消去其中的将上式代入规范方程消去其中的U(t),得到得到 l 利用边界条件联立求解方程以上方程,可得唯一确定的解利用边界条件联立求解方程以上方程,可得唯一确定的解 X(t)和和(t); l 将所求得的将所求得的X(t)和和(t)代入代入U=UX(t),(t),t ,求得相应的,求得相应的 U(t)。 ,),(),(),()(ttttXUtXftX ,),(),(),()(ttttXUtXH X
43、t 0 U H 说明:利用引入哈密顿函数的方法求解拉格朗日型最优控制 问题,是将求泛函在等式约束条件下对控制函数在等式约束条件下对控制函数U(t)的条件极的条件极 值问题值问题转化为求哈密顿函数求哈密顿函数H H对控制变量对控制变量U(t)的无条件极值问的无条件极值问 题题。这种方法称为哈密顿方法哈密顿方法。 .61 定理定理2-102-10 设系统的状态方程为设系统的状态方程为 ),(),()(ttUtXftX 为将系统从给定的初态为将系统从给定的初态 00) (XtX 转移到终端时刻转移到终端时刻 tf固定,终端状态固定,终端状态X(tf)自由的某个终自由的某个终 态,并使性能泛函态,并使
44、性能泛函 f t t dtttUtXLJ 0 ),(),( 达到极小值的最优控制应满足的必要条件是:达到极小值的最优控制应满足的必要条件是: .62 (1 1)设)设U*(t)是最优控制,是最优控制, X*(t)是对应于是对应于U*(t)的最优轨线,则的最优轨线,则 必存在一与必存在一与U*(t)和和X*(t)相对应的相对应的n维协态变量维协态变量 (t) ,使得使得X(t)与与 (t) 满足规范方程满足规范方程 ),(),()(ttUtXf H tX X H t )( 其中其中 ),(),()(),(),(ttUtXftttUtXLH T (2 2)边界条件为)边界条件为 00) (XtX
45、0)( f t (3 3)哈密顿函数)哈密顿函数H H对控制变量对控制变量U(t)(t0ttf)取极值,即取极值,即 0 U H .63 * * 沿着最优控制和最优轨线,哈密顿函数沿着最优控制和最优轨线,哈密顿函数H H对时间对时间t t求求 全导数,得全导数,得 U U HH X X H t H dt dH TTT U U H X HHH X H t H TTT t H 若H不显含t时,则有 H(t)=常数 tt0,tf; 也就是说,当H不显含t时,哈密顿函数H是不依赖于t 的常数。 .64 2 0 2 )( 2 1 dttxJ 取极小值。给定的边界条件为 0)2(, 1)0(, 0)2(,
46、 1)0(xxxx 解法解法2 2:哈密顿方法:哈密顿方法 例例2-92-9 已知受控系统的动态结构如图所示。求最优 控制u*(t)及最优轨线x*(t) ,使目标泛函 .65 2 0 2 )( 2 1 dttxJ 取极小值。给定的边界条件为 )2(, 1)0(, 0)2(, 1)0(xxxx 自由 例例2-102-10 已知受控系统的动态结构如图所示。求最 优控制u*(t)及最优轨线x*(t) ,使目标泛函 .66 11 )(ct 212 )(ctct 21 )(ctctu 32 2 12 2 1 ctctcx 43 2 2 3 11 2 1 6 1 ctctctcx 由例由例2-92-9哈密
47、顿方法:哈密顿方法: 由协态方程得:由协态方程得: 由控制方程得:由控制方程得: 由状态方程得:由状态方程得: .67 例例2-112-11 已知 系统方程和边界条件为 uxx xx 22 21 1)0( 1)0( 2 1 x x 0) 1 ( 0) 1 ( 2 1 x x (1)求使性能泛函 1 0 2 )( 2 1 dttuJ 为极小值的最优控制函数与最优轨线。 可以利用MATLAB符号工具箱求解微分方程 (2)若终端条件为x1(1)=0,x2(1)自由,求该最优控制 问题。 .68 2.4 变分法求解最优控制问题变分法求解最优控制问题 2 2、求解综合型(波尔扎)问题、求解综合型(波尔扎
48、)问题 ),(),()(ttUtXftX (2.10) 初始条件 00) (XtX (2.9) 和性能泛函 (2.14) 给定系统状态方程 要求从容许控制U(t) Rm中确定最优控制U*(t),使系统(2.9) 从给定的初态X(t0)转移到某个终态X(tf) ,并使性能泛函(2.14) 达到极小值。这是波尔扎问题,又称为复合型最优控制问题。 问题问题 2-42-4 f t t ff dtttUtXLttXJ 0 ),(),(),( 注意:注意:给定的端点条件不同,上述最优控制问题的解将不同。给定的端点条件不同,上述最优控制问题的解将不同。 .69 1. 1. 终端时刻终端时刻tf固定,终端状态
49、固定,终端状态X(tf) 自由的情况自由的情况 构造构造辅助泛函辅助泛函为:为: ),( 0ff ttXJ f t t TT dttXtttUtXftttUtXL 0 )()(),(),()(),(),( 若令哈密顿函数哈密顿函数为 ),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHH T (2.15) (2.16) 并对式(2.15)积分号内第三项进行分部积分,则辅助泛函变 为 f f t t T t t T ff tXt dttXtttUttXHttXJ 0 0 )()( )()(),(),(),(),( 0 .70 dtXtttUttXH tXttXt
50、ttX f t t T T ff T ff 0 )()(),(),(),( )()()()(),( 00 (2.17) 求上式对状态变量X(t)和控制变量U(t)的变分,得 f t t T TT T ff T f T f ff dtXU U H X X H tXttXttX tX ttX J 0 )()()()()( )( ),( 000 (2.19) 由于泛函J0达到极值的必要条件为 0 0 J (2.18) 由于X(t0)=0, X(tf)0, X(t)0, U(t)0,则由式(2.18) 和(2.19)可得上述波尔扎型最优控制问题的解应 .71 终端时刻终端时刻tf固定,终端状态固定,终
51、端状态X(tf) 自由的波尔扎型最优自由的波尔扎型最优 控制问题的解应满足的控制问题的解应满足的必要条件必要条件为:为: 00) ( ),(),()( 0 )( XtX ttUtXf H tX U H X H t 这些关系与拉格朗日型最优控制问题的完全相同,所不同的这些关系与拉格朗日型最优控制问题的完全相同,所不同的 只是只是横截条件横截条件,即,即协态变量的终端值协态变量的终端值 )( ),( )( f ff f tX ttX t .72 2.2.终端时刻终端时刻tf固定,终端状态固定,终端状态X(tf) 受约束的情况受约束的情况 设终端状态受到如下等式的约束 0),( ff ttX (2.
52、20) 其中为r(当L=0,rn-1;当L0,rn)维向量,即 T r , 21 这时,终端状态X(tf)即不是固定的,也不是完全自由的,只 能在终端流型(2.20)上变动。在构造辅助泛函时,应考虑 终端约束条件(2.20),为此,需要引入待定的拉格朗日乘引入待定的拉格朗日乘 子向量子向量 T r , 21 .73 ),(),( 0ff T ff ttXttXJ f t t TT dttXtttUtXftttUtXL 0 )()(),(),()(),(),( 考虑到考虑到哈密顿函数哈密顿函数为:为: ),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHH T
53、(2.21) 并对式(2.21)积分号内第三项进行分部积分,则 辅助泛函变为 dtXH tXttXtttXttX dtXHtXtttXttXJ f f f t t T T ff T ff T ff t t T t t T ff T ff 0 0 0 )()()()(),(),( )()(),(),( 00 0 构造的构造的辅助泛函辅助泛函为:为: .74 求J0对状态变量X(t)和控制变量U(t)的变分,得 f f t t T TT T ff T T f ff T T f ff t t T TT T ff T f T f ff T f T f ff dtXU U H X X H tXt tXt
54、 tX ttX tX ttX dtXU U H X X H tXttXt tX tX ttX tX tX ttX J 0 0 )()( )()( )( ),( )( ),( )()()()( )( )( ),( )( )( ),( 00 00 0 考虑到 J0=0, X(t0)=0, X(tf)0, X(t)0, U(t)0,则得到 所述最优控制问题的解应满足的必要条件 .75 00) ( ),(),()( 0 )( XtX ttUtXf H tX U H X H t 这些关系与1中的完全相同,所不同的是状态变量的终端约束条状态变量的终端约束条 件和横截条件:件和横截条件: f tt T f
55、ff XX t ttX )( 0),( 终端时刻终端时刻tf固定,终端状态固定,终端状态X(tf) 受约束的最优控制问受约束的最优控制问 题的解应满足的必要条件:题的解应满足的必要条件: .76 3. 终端时刻终端时刻tf可变,终端状态可变,终端状态X(tf) 受约束的情况受约束的情况 设终端状态设终端状态X(tf)受到式(受到式(2.20)的约束条件:)的约束条件: ),(),( 0ff T ff ttXttXJ f t t TT dttXtttUtXftttUtXL 0 )()(),(),()(),(),( f f t t T tt T dtXHttXttX 0 )(),(),( ),(),()(),(),(),(),(),(ttUtXftttUtXLttUttXHH T 其中,其中,哈密顿函数哈密顿函数为:为: 这时,不仅存在这时,不仅存在最优控制和最优轨线最优控制和最优轨线,还存在一个,还存在一个最优的终端最优的终端 时刻时刻。 (2.22) 0),( ff ttX 辅助泛函为辅助泛函为 .77 00) ( 0 XtX U H f tt T f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 预防甲流中班教案
- 贵州省安顺市2024-2025学年高三下学期第四次监测考试地理试题
- 2025届天津杨村一中高三-历史试卷
- 2025届福建省泉州市高三毕业班下学期质量监测(三模)历史试题
- 特许金融分析师考试展望未来试题及答案
- 高龄产妇的妊娠期护理
- 高脂血症的预防与护理
- 特许金融分析师考试的重要复习资源试题及答案
- 创业基本知识
- 石家庄市辛集中学高二上学期第三次阶段考试英语试题
- 射频消融治疗腰椎间盘突出
- 第八单元写作指导 统编版高中语文必修下册
- 儿童外科微创手术介绍
- 2024-2029年中国中医四诊仪行业市场现状分析及竞争格局与投资发展研究报告
- (高清版)DZT 0305-2017 天然场音频大地电磁法技术规程
- 消化道出血的PBL教学查房
- 放射诊疗设备的辐射安全防护设计
- 人音版四年级音乐下册全册教学设计教案表格式
- 计算机应用基础(Windows10+Office2016)(第3版)-教案 情境5、6 Word2016基本操作、实验 Word 2016基本操作
- 《铁路建设项目质量安全红线管理规定》
- 叉车培训课件模板
评论
0/150
提交评论