第18章 变分法模型_第1页
第18章 变分法模型_第2页
第18章 变分法模型_第3页
第18章 变分法模型_第4页
第18章 变分法模型_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-218-第十八章 动态优化模型动态过程的另一类问题是所谓的动态优化问题,这类问题一般要归结为求最优控制函数使某个泛函达到极值。当控制函数可以事先确定为某种特殊的函数形式时,问题又简化为求普通函数的极值。求解泛函极值问题的方法主要有变分法和最优控制理论方法。§1 变分法简介变分法是研究泛函极值问题的一种经典数学方法,有着广泛的应用。下面先介绍变分法的基本概念和基本结果,然后介绍动态系统最优控制问题求解的必要条件和最大值原理。1.1 变分法的基本概念1.1.1 泛函设S 为一函数集合,若对于每一个函数S t x (有一个实数J 与之对应,则称J 是对应在S 上的泛函,记作 (t x J

2、 。S 称为J。例如对于xy 平面上过定点, (11y x A 和 , (22y x B 的每一条光滑曲线 (x y ,绕x 轴旋转得一旋转体,旋转体的侧面积是曲线 (x y 的泛函 (x y J 。由微积分知识不难写出dx x y x y x y J x x (' (2 (212+= (1) 容许函数集可表示为 ( , (, (| (2211211y x y y x y x x C x y x y S = (2) 最简单的一类泛函表为=21 , , ( (t t dt x x t F t x J & (3) 被积函数F 包含自变量t ,未知函数x 及导数x &。(1)

3、式是最简泛函。1.1.2 泛函的极值泛函 (t x J 在S t x (0取得极小值是指,对于任意一个与 (0t x 接近的S t x (,都有 ( (0t x J t x J 。所谓接近,可以用距离< (, (0t x t x d 来度量,而距离定义为| ( (|, ( (|max (, (00021t x t x t x t x t x t x d t t t &&= (0t x 称为泛函的极值函数或极值曲线。1.1.3 泛函的变分如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为泛函的自变量,函数 (t x 在 (0t x 的增量记为( ( (

4、0t x t x t x =也称函数的变分。由它引起的泛函的增量记作( ( (00t x J t x t x J J +=如果J 可以表为-219-(, ( (, (00t x t x r t x t x L J +=其中L 为x 的线性项,而r 是x 的高阶项,则L 称为泛函在 (0t x 的变分,记作 (0t x J 。用变动的 (t x 代替 (0t x ,就有 (t x J 。泛函变分的一个重要形式是它可以表为对参数的导数:0 ( ( (=+=t x t x J t x J (4) 这是因为当变分存在时,增量, ( , ( ( (x t x r x t x L t x J x t x

5、J J +=+=根据L 和r 的性质有, ( , (x t x L x t x L =0 , (lim , (lim 00=x xx t x r x t x r 所以 ( (lim (00x J x x J x x J +=+= ( , ( , ( , (lim 0x J x x L x x r x x L =+= 1.1.4 极值与变分利用变分的表达式(4)可以得到泛函极值与变分的关系:若 (t x J 在 (0t x 达到极值(极大或极小),则0 (0=t x J (5) 这是因为对任意给定的x , (0x x J +是变量的函数,该函数在0=处达到极值。根据函数极值的必要条件知0 (00

6、=+=x x J 于是由(4)式直接得到(5)式。1.1.5. 变分法的基本引理引理 , (21x x C x ,, (211x x C x ,0 ( (21=x x ,有210 ( (x x dx x x ,则, , 0 ( 21x x x x 。1.2 无约束条件的泛函极值求泛函=ft t dt t x t x t F J 0 (, (, (& (6)的极值,一般是用泛函极值的必要条件去寻找一条曲线 (t x ,使给定的二阶连续可微函数F 沿该曲线的积分达到极值。常称这条曲线为极值曲线(或轨线),记为 (*t x 。 1.2.1 端点固定的情况设容许曲线 (t x 满足边界条件-2

7、20-00 (x t x =,f f x t x = ( (7) 且二次可微。首先计算(6)式的变分:0 ( (=+=t x t x J J =+=f t t dt t x t x t x t x t F 00 ( (, ( (, (&& +=ft t x x dt x xx t F x x x t F 0 , , ( , , (&&&& (8) 对上式右端第二项做分布积分,并利用0 ( (0=f t x t x ,有 =f ft t x t t x xdt x x t F dt d dt x xx t F 00 , , ( , , (&

8、&&&&, 再代回到(8)式,并利用泛函取极值的必要条件,有 =f t t x x xdt F dtd F J 00& 因为x 的任意性,及0 ( (0=f t x t x ,所以由基本引理得到著名的欧拉方程 0=x x F dtd F & (9) 它是这类最简泛函取极值的必要条件。(9)式又可记作0=x F x F F F x x x x x t x &&&&&&& (10) 通常这是 (t x 的二阶微分方程,其通解的两个任意常数由(7)式中的两个端点条件确定。1.2.2 最简泛函的几种

9、特殊情形(i F 不依赖于x&,即 , (x t F F = 这时0x F &,欧拉方程为0 , (=x t F x ,这个方程以隐函数形式给出 (t x ,但它一般不满足边界条件,因此,变分问题无解。(ii F 不依赖x ,即 , (xt F F &= 欧拉方程为0 , (=x t F dtd x && 将上式积分一次,便得首次积分1 , (c x t F x =&&,由此可求出 , (1c t x =&,积分后得到可能的极值曲线族(dt c t x =1, (iii F 只依赖于x&,即 (x F F &= 这

10、时0, 0, 0=x x x t x F F F &&,欧拉方程为0=x x F x &&&&由此可设0=x &&或0=x x F &&,如果0=x &&,则得到含有两个参数的直线族21c t c x +=。-221-另外若0=x x F &&有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数c 的直线族c kt x +=,它包含于上面含有两个参数的直线族 21c t c x += 中,于是,在(xF F &=情况下,极值曲线必然是直线族。 (iv)F 只依赖于x

11、和x&,即 , (x x F F &= 这时有0=x t F &,故欧拉方程为0=x x x x x F x F x F &&&&&&此方程具有首次积分为1c F x F x =&&事实上,注意到F 不依赖于t ,于是有0 ( (=+=x x x x x x x F dtd F x F dt d x F x x F x F F x F dt d &&&&&&&&&&&&&。 例1 (最速降线问题 最速降线

12、问题是历史上变分法开始发展的第一个问题。它是约翰·贝努里(J. Bernoulli)于1696年提出的。问题的提法是这样的:设A 和B 是铅直平面上不在同一铅直线上的两点,在所有连结A 和B 的平面曲线中,求一曲线,当质点仅受重力作用,且初速为零,沿此曲线从A 滑行至B 时,使所需时间最短。解 将A 点取为坐标原点,x 轴水平向右,y 轴垂直向下,B 点为 , (22y x B 。根据能量守恒定律,质点在曲线 (x y 上任一点处的速度dtds 满足(s 为弧长) mgy dt ds m =221 将dx x y ds (' 2+=代入上式得 dx gyy dt 2'

13、 12+= 于是质点滑行时间应表为 (x y 的泛函dx gyy x y J x +=2022' 1 ( 端点条件为22 (, 0 0(y x y y =最速降线满足欧拉方程,因为yy y y F 2' 1 ' , (+= 不含自变量x ,所以方程(10)可写作0' ' ' ' ' ' =y F y F F y y yy y等价于0 ' (' =y F y F dxd 作一次积分得-222- 12 ' 1(c y y =+令 , 2' ctg y =则方程化为cos 1(22sin '

14、; 112121=+=c c y c y 又因d c ctg d c y dy dx cos 1(22cos sin ' 11= 积分之,得 21 sin (2c c x += 由边界条件0 0(=y ,可知02=c ,故得=. cos 1(2 sin (211c y c x 这是摆线(圆滚线)的参数方程,其中常数1c 可利用另一边界条件22(y x y =)来确定。例2 最小旋转面问题dx x y x y x y J x x (' (2 (212+= ( , (, |2211211y x y y x y x x C y y S = 解 因 ' 2y y F +=不包含

15、x ,故有首次积分 122' ' ' ' ' ' c y y yy y y F y F y =+=化简得 21' y c y += 令sht y =' ,代入上式, cht c t sh c y 121=+= 由于 dt c shtshtdt c y dy dx 11' =积分之,得 21c t c x +=消去t ,就得到121c c x ch c y = 。 这是悬链线方程。1.2.3 最简泛函的推广最简泛函取极值的必要条件可以推广到其它情况。 ()含多个函数的泛函-223-使泛函=21' , , '

16、, , ( (, (x x dx z z y y x F x z x y J取极值且满足固定边界条件. (, (, (, (22112211z x z z x z y x y y x y = 的极值曲线 (, (x z z x y y =必满足欧拉方程组=00' 'z z y y F dx d F F dx d F (ii )含高阶导数的泛函使泛函 =21" , ' , , ( (x x dx y y y x F x y J取极值且满足固定边界条件 11 (y x y =, 221122' (' , ' (' y x y y x

17、 y y x y =,)(的极值曲线 (x y y =必满足微分方程0" 22' =+y y y F dxd F dx d F (iii ) 含多元函数的泛函设D y x c y x z , (, , (2,使泛函 =Dy xdxdy z zz y x F y x z J , , , , ( , (取极值且在区域D 的边界线l 上取已知值的极值函数 , (y x z z =必满足方程 0=y x z z z F yF x F 上式称为奥式方程。1.2.4 端点变动的情况(横截条件)设容许曲线 (t x 在0t 固定,在另一端点f t t =时不固定,是沿着给定的曲线(t x

18、=上变动。于是端点条件表示为= ( ( (00t t x x t x 这里t 是变动的,不妨用参数形式表示为f f dt t t +=寻找端点变动情况的必要条件,可仿照前面端点固定情况进行推导,即有 0 , , (00=+=dt x xx x t F J ff dt t t && f t t t t x t t x x dt F x F xdt F dtdF ff f=+=&&0( (11)-224-再对(11)式做如下分析:(i )对每一个固定的f t , (t x 都满足欧拉方程,即(11)式右端的第一项积分为零;(ii )为考察(11)式的第二、第三项,建

19、立f dt 与ft t x =之间的关系,因为( ( (f f f f f f dt t dt t x dt t x +=+ 对求导并令0=得f f t t f f dt t x dt t xf( (&&=+= 即f f f t t dt t x t x f( (&&= (12)把(12)代入(11)并利用f dt 的任意性,得0 (=+=f t t x F x F &&& (13)(13)式就是确定欧拉方程通解中另一常数的定解条件,称为横截条件。横截条件有两种常见的特殊情况:(i )当 (t x =是垂直横轴的直线时,f t 固定, (

20、f t x 自由,并称 (f t x 为自由端点。此时(11)式中0=f dt 及ft t x =的任意性,便得自由端点的横截条件0=ft t x F &(14)(ii )当 (t x =是平行横轴的直线时,f t 自由, (f t x 固定,并称 (f t x 为平动端点。此时0=&,(13)式的横截条件变为 0=ft t x F x F && (15)注意,横截条件与欧拉方程联立才能构成泛函极值的必要条件。1.3 有约束条件的泛函极值 在最优控制系统中,常常要涉及到有约束条件泛函的极值问题,其典型形式是对动态系统(, (, ( (t u t x t f t

21、x =& (16)寻求最优性能指标(目标函数)+=ft t f f dt t u t x t F t x t t u J 0(, (, ( (, ( ( (17)其中 (t u 是控制策略, (t x 是轨线,0t 固定,f t 及 (f t x 自由,nR t x (,mR t u ((不受限,充满mR 空间),F f , , 连续可微。下面推导取得目标函数极值的最优控制策略 (*t u 和最优轨线 (*t x 的必要条件。采用拉格朗日乘子法,化条件极值为无条件极值,即考虑+=ft t T f f dt x u x t f t u x t F t x t u x J 0 , , (

22、, , ( (, ( , , (1& (18)的无条件极值,首先定义(16)式和(17)式的哈密顿(Hamilton )函数为, , ( ( , , ( , , , (u x t f t u x t F u x t H T+= (19)将其代入(18)式,得到泛函-225-+=ft t T f f dt x u x t H t x t u x J 0 , , , ( (, ( , , (1& (20)下面先对其求变分( (, (1f f f f t x t x dt t J +=0( ( , , , (0=+dt x xu u x x t H T dt t t f f &

23、;& f f f f t t T T f t t T f t T f t x Tf x dt u x t H dt dt t x =+= ( ( , , , ( ( ( ( (& dt x xH H u H x T T T u T x T t t f ( ( ( (0&&+ ( , , , ( (f f f t x T f t t t T f t x t u x t F dt +=+=ff f t t T t t f T t t T T u T x T dt x x t dt x H H u H x 0( ( ( ( ( (&& 注意到 (f t

24、 t t x xf=,f f f t t dt t xt x xf( (&=,因而 ffft t x T f t t t T f t x u x t H dt J =+= ( , , , ( (1+ft t u T T x T dt H u x H H x 0 ( ( ( ( (&& 再令01=J ,由, , , (, u x t x dt f f 的任意性,便得(i )*, x 必满足正则方程: 状态方程 , , (u x t f H x=& 协态方程 xH =&。 (ii )哈密顿函数 , , , (*u x t H 作为u 的函数,也必满足 0=u

25、 H 并由此方程求得*u 。(iii )求*, , u x 时,必利用边界条件 00 (x t x =, (用于确定*x ) ( (ft x f t =, (用于确定*)fft t t u x t H = , , , (, (确定f t )1.4 最大(小)值原理如果受控系统, , (u x t f x=&,00 (x t x = 其控制策略 (t u 的全体构成有界集U ,求U t u (,使性能指标 +=ft t f f dt u x t F t x t t u J 0, , ( (, ( (达到最大(小)值。最大(小)值原理:如果 , , (u x t f , (, (f f t

26、 x t 和 , , (u x t F 都是连续可微的,-226-那么最优控制策略 (*t u 和相应的最优轨线 (*t x 由下列的必要条件决定:(i )最优轨线 (*t x ,协态向量 (*t 由下列的必要条件决定:, , (u x t f dt dx=,U t u (, xHdt d =. (ii )哈密顿函数, , ( ( , , ( , , , (*u x t f t u x t F u x t H T+= 作为 (t u 的函数,最优策略 (*t u 必须使, , , (max , , , (*u x t H u x t H Uu =或使, , , (min , , , (*u x

27、 t H u x t H Uu =(最小值原理(iii )满足相应的边界条件 若两端点固定,则正则方程的边界条件为 0 0(x x =,f f x t x = (。 若始端固定,终端f t 也固定,而 (f t x 自由,则正则方程的边界条件为 0 0(x x =, (, ( ( (f f t x f t x t t f =。 若始端固定,终端 (, f f t x t 都自由,则正则方程的边界条件为 0 0(x x =, (, ( ( (f f t x f t x t t f =, 0 (, ( (, (, (, (=+f f t f f f f t x t t t u t x t H f

28、。§2 生产设备的最大经济效益某工厂购买了一台新设备投入到生产中。一方面该设备随着运行时间的推移其磨损程度愈来愈大,因此其转卖价将随着使用设备的时间增加而减小;另一方面生产设备总是要进行日常保养,花费一定的保养费,保养可以减缓设备的磨损程度,提高设备的转卖价。那么,怎样确定最优保养费和设备转卖时间,才能使这台设备的经济效益最大。 2.1 问题分析与假设(i )设备的转卖价是时间t 的函数,记为 (t x 。 (t x 的大小与设备的磨损程度和保养费的多少密切相关。记初始转卖价0 0(x x =。(ii )设备随其运行时间的推移,磨损程度越来越大。t 时刻设备的磨损程度可以用t 时刻转

29、卖价的损失值来刻画,常称其为磨损函数或废弃函数,记为 (t m 。(iii )保养设备可以减缓设备的磨损速度,提高转卖价。如果 (t u 是单位时间的保养费, (t g 是t 时刻的保养效益系数(每用一元保养费所增加的转卖价),那么单位时间的保养效益为 ( (t u t g 。另外,保养费不能过大(如单位时间保养费超过单位时间产值时,保养失去了意义),只能在有界函数集中选取,记有界函数集为W ,则W t u (。 (iv )设单位时间的产值与转卖价的比值记为p ,则 (t px 表示在t 时刻单位时间的产值,即t 时刻的生产率。-227-(v )转卖价 (t x 及单位时间的保养费 (t u

30、都是时间t 的连续可微函数。为了统一标准,采用它们的贴现值。对于贴现值的计算,例如转卖价 (t x 的贴现值计算,如果它的贴现因子为(经过单位时间的单位费用贴现),那么由 =1 ( (111t x t x dt t dx 解得(11 (t t et x =令01=t ,便得t 时刻单位费用的贴现(称贴现系数)为te,所以设备在t 时刻转卖价(t x 的贴现为t e t x (。仿此计算, (t u 的贴现为t e t u (,单位时间产值的贴现为t e t px (。(vi )欲确定的转卖时间f t 和转卖价 (f t x 都是自由的。2.2 模型构造根据以上的分析与假设可知:考察的对象是设备

31、在生产中的磨损保养系统;转卖价体现了磨损和保养的综合指标,可以选作系统的状态变量;在生产中设备磨损的不可控性强,其微弱的可控性也是通过保养体现,加之保养本身具有较强的可控性,所以选单位时间的保养费 (t u 作为控制策略。这样,生产设备的最大经济效益模型可以构成为在设备磨损保养系统的(转卖价)状态方程=+=00( ( ( (x x t u t g t m dt t dx (21)之下,在满足U t u (0的函数集W 中寻求最优控制策略 (*t u ,使系统的经济效益这一性能指标+=fft t t f dt e t u t px et x t u J 0( ( ( ( (22)为最大,其中 (

32、, f f t x t 都是自由的。2.3 模型求解首先写出问题的哈密顿函数 ( ( ( (t m t g t m et u t px H t += (23)再由协态方程及边界条件求出 (t ,即由=ff t t x f tx et peH dt t d ( ( ( 解得t t e pe pt f+= 1( (下面利用最大值原理求 (*t u 。先将(23)式改变为H = px(t e t m(t + g (t e t u(t 显然, H 是对 u 的线性函数,因此得到 U , g ( t e t > 0 u * (t = g ( t e t < 0 0, 或 (24) U, *

33、u (t = 0, * p t p (1 e f + e t g (t e t > 0 (1 e p t f + p (25) e t g (t e * t <0 在上式中, 还需解决两个问题: 一是 u (t = U 与 u (t = 0 的转换点 t s 在什么位置, * 即 t s 等于多少?二是 u (t 是由 U 到 0 ,还是由 0 到 U 。 转换点 t s 应满足 p t p (1 e f + e t g (t e t = 0 即 p p ( t t f ( 1e g (t 1 = 0 (26) 从而可解出 t s 。 因为 g (t 是时间 t 的减函数,所以(26)式的左端也是时间 t 的减函数,也就是说 u (t 随时间应由 U 到 0。于是最优控制策略的具体表达式为 0 t < ts U , u* = ts < t t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论