




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
最优控制动态规划第1页,课件共52页,创作于2023年2月最短路线问题问题:要求从A地到F地,选择一条最短的线路。12345678965411354524244957第2页,课件共52页,创作于2023年2月为了便于分析,引入几个符号:N:从某点到终点之间的级数;x:表示在任一级所处的位置,称为状态变量;SN(x):决策变量,表示当处于状态x,还有N级时,所选取的下一个点;WN(x):表示从状态x到终点F的N级过程的最短距离;d(x,SN):表示从状态x到点SN的距离。第3页,课件共52页,创作于2023年2月从最后一级开始计算:12345678965411354524244957从哪下手?SN(x):决策变量,表示当处于状态x,还有N级时,所选取的下一个点;WN(x):表示从状态x到终点F的N级过程的最短距离;第4页,课件共52页,创作于2023年2月同理所以,最短路线为最短距离为14一个N级最优过程,不管第一级决策如何,其余N-1级,决策过程至少必须依据第一级决策所形成的状态组成一个N-1级最优过程,在此基础上,在选择第一级决策,使总的N级过程为最优。12345678965411354524244957第5页,课件共52页,创作于2023年2月这种递推关系可以用下列递推方程式来表达:是不是穷举法?
再看一个例子第6页,课件共52页,创作于2023年2月最短时间问题
问题:设有人要从A点开车到E站,中间要经过任意三个中间站,站名在图中圆圈内表示。站与站之间称为段,每段路程所需时间(小时)标在段上。现要问,这人应如何选择路线才能最快到达目的地?第7页,课件共52页,创作于2023年2月什么是穷举法?
从走到一共有六条路线,每条路线由四段组成。这六条路线和对应的行车时间如下第8页,课件共52页,创作于2023年2月
路线行车时间(小时)
第9页,课件共52页,创作于2023年2月
这里每条路线由四段组成,也可以说是四级决策。为了计算每条路线所花时间,要做三次加法运算,为了计算六条路线所花的时间要作3×6=18次运算。这种方法称为“穷举法”。显然当段数很多时,计算量是很大的。这种方法的特点是从起点站往前进行,而且把这四级决策一起考虑。应注意从到下一站所花的时间为1,而到所花时间为3,但最优路线却不经过。这说明只看下一步的“眼前利益”来作决策是没有意义的。第10页,课件共52页,创作于2023年2月为将问题表达得清楚,引进下面的术语(写法并不完全一样)。令表示由某点到终点的段数(如到为2段,。令表示当前所处点的位置(如),称为状态变量。对比一下最开始的例子第11页,课件共52页,创作于2023年2月令为决策(控制)变量,它表示当处在位置而还有段要走时,所要选取的下一点。例如,从出发,下一点为时,则表示为。令表示在位置,向终点还有段要走时,由到终点的最短时间。例如,从C2到E的最短时间为4,可表示为T2(C2)=4。第12页,课件共52页,创作于2023年2月令表示从点到点的时间。例如,从到的时间为有了这些术语后,就可用动态规划来解这个例子。从最后一段出发进行计算,并将计算出的最短时间用括号表示在相应的点处(见图6-1)。第13页,课件共52页,创作于2023年2月n=1
(倒数第一段)
考虑从和到的路线,由定义可知,最短时间分别为第14页,课件共52页,创作于2023年2月n=2(倒数第二段)考虑从到的路线。由到有两种路线:,。两种路线中的最短时间由下式确定:最优决策为。第15页,课件共52页,创作于2023年2月由到只有一种路线,其时间为由到E也只有一种路线,其时间为
EDC23第16页,课件共52页,创作于2023年2月n=3(倒数第三段)
从B2到E有两种路线:和第17页,课件共52页,创作于2023年2月最优决策最短时间为:第18页,课件共52页,创作于2023年2月n=4(倒数第四段)从A到E的路线有两种:和。最优决策为第19页,课件共52页,创作于2023年2月
至此求出了A到E的最短时间为9,最优路线为。在图中用粗线表示。这里,为决定最优路线进行了10次加法,比穷举法的18次少了8次。当段数n更多时,节省计算将会更多。第20页,课件共52页,创作于2023年2月
以上面的最短时间问题为例,如把当作初始状态,则余下的决策对来讲是最优策略;如把当初始状态,则余下的决策对来讲也构成最优策略。一般来说,如果一个最优过程用状态来表示,最优决策为,则对状态来讲,必定是最优的,这可用图6-2来表示。第21页,课件共52页,创作于2023年2月图6-2最优性原理示意图第22页,课件共52页,创作于2023年2月动态规划的特点:一是它从最后一级反向计算;二是其将一个N级决策问题化为N个单级决策问题。好处:将一个复杂问题化为多个简单问题加以求解。第23页,课件共52页,创作于2023年2月最优性原理
贝尔曼的最优性原理可叙述如下:“一个多级决策问题的最优决策具有这样的性质:当把其中任何一级及其状态作为初始级和初始状态时,则不管初始状态是什么,达到这个初始状态的决策是什么,余下的决策对此初始状态必定构成最优策略。”第24页,课件共52页,创作于2023年2月在多数实际问题中,级决策的性能指标取如下形式
是由某级状态和决策决定的性能函数,要求寻找决策使J取极小值。第25页,课件共52页,创作于2023年2月最优性原理可表示为
第26页,课件共52页,创作于2023年2月根据上式就可证明最优性原理的正确性。若以为初态时,余下的决策不是最优的,那么就存在另一决策序列所决定的指标值,于是这与是极小值发生矛盾,所以余下的决策必须是最优的。第27页,课件共52页,创作于2023年2月6-2离散最优控制问题设控制系统的状态方程为式中x(k)是k时刻的几维状态向量,u(k)是k时刻的p维容许控制向量,设系统在每一步转移中的性能指标为F[x(k),u(k)]如在u(0)的作用下在u(1)的作用下对N级决策过程第28页,课件共52页,创作于2023年2月性能指标要求选择控制序列使性能指标达到极小根据最优性原理解上述递推方程,即可获得最优控制序列。第29页,课件共52页,创作于2023年2月例6-1设一阶离散系统的状态方程为初始条件为x(0),控制变量u不受约束,性能指标为求最优控制u*(t),使J达最小,为简便起见,设N=2解设在u(0)、u(1)作用下,系统状态为x(0)、x(1)、x(2)先考虑从x(1)到x(2)的情况,控制为u(1)第30页,课件共52页,创作于2023年2月再考虑从x(0)到x(1)的情况,控制为u(0)最优控制序列为最优性能指标为第31页,课件共52页,创作于2023年2月
连续系统的动态规划
设系统的状态方程和性能指标为
(6-19)
(6-20)
受约束,可写成为某一闭集。要寻找满足此约束且使最小的最优控制。第32页,课件共52页,创作于2023年2月
设时间在区间内,则根据最优性原理,从到这一段过程应当是最优过程。把这段最优指标写成,则(6-21)显然满足终端条件通常假定对及的二阶偏导数存在且有界。第33页,课件共52页,创作于2023年2月现在,考虑系统从出发,到分两步走:先从到,再从到,是小量,则(6-23)根据最优性原理,从也应是最优过程。
第34页,课件共52页,创作于2023年2月因故这样,式(6-23)可写成(6-24)第35页,课件共52页,创作于2023年2月注意到,上式右边括号中表示最优指标,其中为最优控制,不需再选择,也与选择无关。故从上式两端消去,除以,再令,可得
(6-25)第36页,课件共52页,创作于2023年2月引用以前使用过的哈密顿函数
(6-26)
(6-27)则(6-25)可写成
(6-28)第37页,课件共52页,创作于2023年2月(6-25)或(6-28)称为哈密顿—雅可比—贝尔曼方程,边界条件是:哈密顿—雅可比—贝尔曼方程在理论上很有价值,但它是的一阶偏微分方程并带有取极小的运算,因此求解是非常困难的,一般情况得不到解析解,只能用计算机求数值解。对于线性二次问题,可以得到解析解,而且求解结果与用极小值原理或变分法所得结果相同。这时,哈密顿——雅可比——贝尔曼方程可归结为黎卡提方程。在实际计算线性二次问题时,一般用直接求解黎卡提方程来求最优控制。第38页,课件共52页,创作于2023年2月例6-3设系统状态方程为初始状态不受约束,性能指标为求最优控制u*(t),使性能指标J为最小。解由于因为系统是时不变的,并且性能指标的被积函数不是时间的显函数,故第39页,课件共52页,创作于2023年2月解由于因为系统是时不变的,并且性能指标的被积函数不是时间的显函数,故解得第40页,课件共52页,创作于2023年2月引用以前使用过的哈密顿函数
(6-26)
(6-27)则(6-25)可写成
(6-28)第41页,课件共52页,创作于2023年2月思考题HJB方程与极小值原理的区别和联系?第42页,课件共52页,创作于2023年2月动态规划与极小值原理
动态规划和极小值原理是最优控制理论的两大基石,它们都可以解决有约束的最优控制问题,虽然在形式上和解题方法上不同,但却存在着内在的联系。下面我们从动态规划来推演极小值原理,不过要说明这种推演是基于最优指标对和两次连续可微这个条件的。第43页,课件共52页,创作于2023年2月最优性能指标与状态方程为(6-29)要求确定U(t)使性能指标
(6-30)极小。其中,固定,自由,可以有约束,也可以没有。第44页,课件共52页,创作于2023年2月1、(状态方程)(6-31)2、(协态方程)(6-32)3、(边界方程)(6-33)4、(横截条件)(6-34)5、(极值条件)(6-35)第45页,课件共52页,创作于2023年2月用动态规划求解的结果已在上节中得到,现在归纳一下:在动态规划中协态变量满足哈密顿—雅可比—贝尔曼方程(6-28)本身说明了哈密顿函
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 八年级地理上册 第二章 中国的自然环境 第二节气候 第2课时 东西干湿差异显著教学实录 (新版)新人教版
- 第24课《他们那时候多有趣》教学设计2024-2025学年统编版(五四学制)语文六年级上册
- Unit 4What's the best movieSectionB (1a~1e) 听说课教学设计-2024-2025学年人教版八年级英语上册
- 五年级品德与社会上册 集体的事谁说了算教学实录 人教新课标版
- 2023七年级英语下册 Unit 3 How do you get to school教学实录 (新版)人教新目标版
- DB6107-T 63-2024 小麦化肥减施增效技术规程
- 6 我们神圣的国土(教学设计)2024-2025学年统编版道德与法治五年级上册
- DB1311T 051-2024设施黄瓜减排施肥技术规程
- 2024年高中化学 专题2 化学反应速率与化学平衡 第二单元 化学反应的方向和限度 第3课时 化学平衡常数教学实录 苏教版选修4
- 饮用水源地生态修复企业制定与实施新质生产力战略研究报告
- 房屋市政工程生产安全重大事故隐患判定标准(2024版)宣传画册
- 2024年云南省中考物理真题含解析
- 《员工质量意识培训》课件
- 完整版物流商业中心装饰装修工程施工方案
- 再生医学服务行业现状分析及未来三至五年行业发展报告
- 国民经济行业分类和代码表(电子版)
- 【初中道法】认识生命说课课件-2024-2025学年统编版道德与法治七年级上册
- GB/T 44823-2024绿色矿山评价通则
- 2024年官方兽医牧运通考试题库(含答案)
- 计算机三级网络技术真题单选题100道及答案
- 分光光度法测定破壁灵芝孢子粉中总三萜含量研究
评论
0/150
提交评论