第二节 最优化原理与动态规划_第1页
第二节 最优化原理与动态规划_第2页
第二节 最优化原理与动态规划_第3页
第二节 最优化原理与动态规划_第4页
第二节 最优化原理与动态规划_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二节最优化原理与动态规划第1页,课件共32页,创作于2023年2月一、动态规划方法导引

1.全枚举法或穷举法。共有18条可能路线,进行比较,求得最优路线Q→A3→B1→C1→T。QTA1A2A3B1B2B3C1C224374642442514633334第2页,课件共32页,创作于2023年2月2.“局部最优路径”法:选择当前最短途径,“逢近便走”。所取决策必是Q→A1→B2→C2→T,全程长度是13。QTA1A2A3B1B2B3C1C224374642442514633334第3页,课件共32页,创作于2023年2月◆全枚举法计算工作量将会十分庞大。◆局部最优求出的解不一定是最优解。第4页,课件共32页,创作于2023年2月3.动态规划方法就是从终点逐段向始点方向寻找最短路线的方法。解题步骤如下:●把问题划分为几个阶段。●按阶段顺序首先考虑最后阶段如第四阶段的最优决策,也就是走哪条路线最短。●按阶段顺序依次考虑第三、第二,第一阶段的最优决策,为此只需确定每一阶段上各初始点的最优决策即可。第5页,课件共32页,创作于2023年2月◆用动态规划方法逐段求解时,每个阶段上的求优方法基本相同,而且比较简单,每一阶段的计算都要利用上一阶段的计算结果,因而减少了很多计算量。阶段数愈多,这种效果愈明显。

第6页,课件共32页,创作于2023年2月二、动态规划解题

标号法:最短路径:Q→A3→B1→C1→TQTA1A2A3B1B2B3C1C224374642442514633334阶段1阶段2阶段3阶段40,T3,T4,T4,C17,C26,C111,B1,B28,B18,B111,A3第7页,课件共32页,创作于2023年2月三、动态规划的基本概念。1.阶段(stage)和阶段变量。把所给问题恰当地划分为若干个相互联系又有区别的子问题,称之为多段决策问题的阶段。QTA1A2A3B1B2B3C1C224374642442514633334第8页,课件共32页,创作于2023年2月用以描述阶段的变量叫作阶段变量,一般以k表示阶段量.阶段数k的编号法有两种:(1)顺序编号;(2)逆序编号法。QTA1A2A3B1B2B3C1C224374642442514633334第9页,课件共32页,创作于2023年2月2.状态(state)、状态变量和可能状态集(1)状态与状态变量。QTA1A2A3B1B2B3C1C224374642442514633334第10页,课件共32页,创作于2023年2月(2)动态规划维数。(3)可能状态集:用S(sk)表示。QTA1A2A3B1B2B3C1C224374642442514633334第11页,课件共32页,创作于2023年2月3.决策(decision)、决策变量和允许决策集合(1)决策。QTA1A2A3B1B2B3C1C224374642442514633334第12页,课件共32页,创作于2023年2月(2)决策变量:xk=xk(sk)决策变量xk(sk)的允许决策集用Dk(sk)表示,xk(sk)∈Dk(sk)允许决策集合实际是决策的约束条件。QTA1A2A3B1B2B3C1C224374642442514633334第13页,课件共32页,创作于2023年2月4.策略和允许策略集合策略(Policy)全过程策略指具有n个阶段全部过程,简称策略。表示为

{x1(s1),x2(s1),…,xn(sn)}。k后部子过程策略,表示为pk(xk)QTA1A2A3B1B2B3C1C224374642442514633334第14页,课件共32页,创作于2023年2月(2)允许策略集合记作P。最优策略:从允许策略集中,找出的具有最优效果的策略。QTA1A2A3B1B2B3C1C224374642442514633334第15页,课件共32页,创作于2023年2月5.状态转移方程(状态转移律):多阶段决策过程的发展就是用阶段状态的相继演变来描述的。或简写为第16页,课件共32页,创作于2023年2月6.指标函数(1)阶段指标函数(也称阶段收益)vk(sk,xk)简记为vk

。(2)过程指标函数(指标函数)。Vk,n(sk,xk,sk+1,xk+1,…,sn,xn)。简记为Vk,n。第17页,课件共32页,创作于2023年2月◆动态规划求解的问题的过程指标函数(指标函数),必须具有关于阶段指标的可分离形式(和、积或其他形式):

表示某种运算,可为加、减、乘、除、开方等。第18页,课件共32页,创作于2023年2月◆常见有:和第19页,课件共32页,创作于2023年2月相应的子策略称为sk状态下的最优子策略,记为pk*(sk);而构成该子策赂的各段决策称为该过程上的最优决策,记为7.最优指标函数:fk(sk)

有简记为第20页,课件共32页,创作于2023年2月8.概念的关系。状态sk阶段kT(sk,xk)决策xk(sk)vk(sk,xk)状态sk+1阶段k+1T(sk+1,xk+1)决策xk+1(sk+1)vk+1(sk+1,xk+1)状态sk+2第21页,课件共32页,创作于2023年2月四、最优化原理与动态规划的数学模型1.最优化原理(贝尔曼最优化原理)

若某一全过程最优策略为:

则第22页,课件共32页,创作于2023年2月2.动态规划的数学模型(逆序法时)(8.3a)(8.3b)第23页,课件共32页,创作于2023年2月(8.3c)(8.3d)或(8.3b)和(8.3d)称为边界条件。第24页,课件共32页,创作于2023年2月五、动态规划方法的基本步骤1.阶段的划分2.正确地定义状态变量sk第25页,课件共32页,创作于2023年2月(1)要能够正确地描述受控过程的变化特征。

(2)包含到达这个状态前的足够信息,且满足无后效性。

(3)要满足可知性。第26页,课件共32页,创作于2023年2月3.正确地定义决策变量及各阶段的允许决策集合Dk(sk)

4.能够正确地写出状态转移方程,至少要能正确反映状态转移规律。第27页,课件共32页,创作于2023年2月5.根据题意,正确地构造出指标函数,应满足下列性质:(1)可分性,。(2)为了进行动态规划计算满足递推性,或6.确立边界条件写出动态规划函数基本方程。第28页,课件共32页,创作于2023年2月阶段1阶段2阶段k阶段k+1阶段n……状态S1决策x1状态S2v1决策x2状态S3v2决策xk状态Sk+1vk决策xk+1vk+1决策xnvn寻求最优解的方向第29页,课件共32页,创作于2023年2月六、动态规划的分类离散决策过程连续决策过程根据多阶段决策过程的时间参量根据决策过程的演变确定性决策过程随机性决策过程离散确定性决策过程连续确定性决策过程离散随机性决策过程连续随机性决策过程第30页,课件共32页,创作于2023年2月七、学习方法建议第一步先看问题,充分理解问题的条件、情况及求解目标。第二步分析针对该动态规划问题的“四大要素、一个方程”。第三步动手把求解思路整理出来,或者说,把该问题作为习题独立的来做。第31页,课件共32页,创作于2023年2月第四步把自己的求解放到一边,看书中的求解方法,要充分理解教材中的论述。第五步对照自己的求解,分析成败。◆动态规划的四大要素①状态变量及其可能集合sk

Sk

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论