动态规划方法_第1页
动态规划方法_第2页
动态规划方法_第3页
动态规划方法_第4页
动态规划方法_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

动态规划方法2023/5/251第一页,共三十九页,编辑于2023年,星期五

动态规划(DynamicProgramming)同前面介绍过的线性规划方法不同,它不是一种算法,而是考察问题的一种途径。动态规划是一种求解多阶段决策问题的系统技术。由于动态规划不是一种特定的算法,因而它不像线性规划那样有一个标准的数学表达式和明确定义的一组规则,动态规划必须对具体问题进行具体的分析处理。动态规划在自然科学和社会科学等各个领域都有着广泛的应用,并且获得了显著的效果。2023/5/252第二页,共三十九页,编辑于2023年,星期五1最短路径问题

2贝尔曼最优化原理

3WinQSB软件应用动态规划2023/5/253第三页,共三十九页,编辑于2023年,星期五动态规划是解决多阶段决策问题的一种方法.1951年,美国数学家贝尔曼(R.Bellman,1920~1984)研究了一类多阶段决策问题的特征,提出了解决这类问题的基本原理。在研究、解决了某些实际问题的基础上,他于1957年出版了《动态规划》这一名著。本章将简要介绍动态规划的思想方法及其应用。2023/5/254第四页,共三十九页,编辑于2023年,星期五——动态规划解决问题的基本思路是:把整体比较复杂的大问题划分成一系列较易于解决的小问题,通过逐个求解,最终取得整体最优解。这种“分而治之,逐步调整”的方法,在一些比较难以解决的复杂问题中已经显示出优越性。2023/5/255第五页,共三十九页,编辑于2023年,星期五——所谓多阶段决策过程是指这样一类活动过程:一个决策过程可以分为若干个相互联系的阶段,每个阶段都需要作一定的决策,但是每个阶段最优决策的选择不能只是孤立地考虑本阶段所取得的效果如何,必须把整个过程中的各个阶段联系起来考虑,要求所选择的各个阶段决策的集合——策略,能使整个过程的总效果达到最优。2023/5/256第六页,共三十九页,编辑于2023年,星期五1最短路径问题

2023/5/257第七页,共三十九页,编辑于2023年,星期五1最短路径问题

【例1】设在E城的某公司要从S城运送一批货物,两城之间有公路相连(见图1(a)),其中是可以供选择的途经站点,各点连线上的数字表示相邻站点间的距离。现在的问题是选择一条由S到E的路径,使得所经过的路径最短。2023/5/258第八页,共三十九页,编辑于2023年,星期五1最短路径问题(a)(b)2023/5/259第九页,共三十九页,编辑于2023年,星期五1最短路径问题分析:如果用枚举法,将有12条不同的路径,每条路径对应一个由S到E的路径距离,其中最小值所对应的路径即为最短路径。本问题的最短路径有3条,路程均为21个单位:第1条:第2条:第3条:2023/5/2510第十页,共三十九页,编辑于2023年,星期五1最短路径问题当段数很多时,枚举法的计算量将极其庞大。现在换个思路,寻找由S到E的最短路径。先把最短路径问题所考虑的过程分为4个阶段:由S到为第1阶段;由

到为第2阶段;由

到E为第4阶段。由

到为第3阶段;2023/5/2511第十一页,共三十九页,编辑于2023年,星期五1最短路径问题我们称由某点到终点的阶段数k为阶段变量,如由到E的阶段数为1(这时记由C到E的阶段数为1,它与第1阶段是不同的概念),由到E的阶段数为2(这时记由B到E的阶段数为2),等等。可见阶段变量的取值正好与实际进行的阶段相反(图(b))。(b)2023/5/2512第十二页,共三十九页,编辑于2023年,星期五1最短路径问题在任一阶段开始时所处的位置称为状态变量,在阶段k的状态变量记为,例如为阶段3的状态变量,可以取为中任意一个。当某一个状态给定后,需要做出决策以确定下一步的状态,描述决策的变量称为决策变量,在阶段k的决策变量记为。例如在阶段2的状态取时的决策变量记为,可取为。若,则表示由到,从而决定了下一步的状态是。2023/5/2513第十三页,共三十九页,编辑于2023年,星期五1最短路径问题为了寻找由起点S到E终点的最短路径,我们考察前面用枚举法找到的第1条最短路径:容易看出:子路径“”也应是从出发到终点E的所有路径中最短的一条。这个现象启发我们从阶段1开始,逐段逆向地求出各点到终点E的最短路径,最后求得由起点S到终点E的最短路径,这就是动态规划的基本思想。2023/5/2514第十四页,共三十九页,编辑于2023年,星期五1最短路径问题

以表示在阶段k的状态变量为、决策变量为时点与间的距离;记为在阶段k由点到终点E的最短路径的长度。本例中要求的是。在阶段1:可以取中任意一个,对应的有在阶段2:可以取中任意一个,对应的有2023/5/2515第十五页,共三十九页,编辑于2023年,星期五1最短路径问题从出发到终点E最短路径为“”,决策变量;在阶段3:可以取中任意一个,对应的有从出发到终点E最短路径为“”,决策变量;2023/5/2516第十六页,共三十九页,编辑于2023年,星期五1最短路径问题从出发到终点E最短路径为“”,决策变量;从出发到终点E最短路径为“”,决策变量;从出发到终点E最短路径为“”,决策变量或;最后,在阶段4:只可以取S,于是2023/5/2517第十七页,共三十九页,编辑于2023年,星期五1最短路径问题因此,由起点S到终点E的最短路径为最短路径长度为21单位长度。2023/5/2518第十八页,共三十九页,编辑于2023年,星期五1最短路径问题由上述计算过程可知,对有n个阶段的最短路径问题,可以逐段逆向地求出各点到终点的最短路径,且在求解的每一步都利用阶段k和阶段k-1间的递推关系:此关系被称为求最短路径的动态规划基本方程。求解最短路径问题的过程,本质上是解上述基本方程的过程。2023/5/2519第十九页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理

2023/5/2520第二十页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理

将求解最短路径问题的思路推广到一般多阶段决策问题时,可以表述成:贝尔曼最优化原理:一个过程的最优策略具有这样的性质,即无论其初始状态和初始决策如何,今后的诸决策,对以第一个决策所形成的状态作为初始状态的过程而言,必须构成最优策略。这个原理是动态规划的理论基础。2023/5/2521第二十一页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理应用动态规划方法解决一般多阶段决策问题时,其求解过程如下:(1)把实际问题适当地划分成k个阶段,阶段变量为;(2)在每个阶段k,确定状态变量为及此阶段可能的状态集合;(3)确定决策变量及每个阶段k的允许决策集合;(4)列出递推关系即动态规划基本方程并计算:2023/5/2522第二十二页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理【例2】(石油输送管道铺设优选问题)某石油公司计划从A地到E地铺设一条石油输送管道,为此在A地与E地之间必须建立三个油泵加压站,如图2所示,其中分别为必须建站的地区,而分别为可供选择的各站点,各点连线上的数字表示相邻站点间铺设输送管道所需费用.问:如何铺设石油输送管道,能使总费用最少?2023/5/2523第二十三页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理(a)(b)2023/5/2524第二十四页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理解划分成4个阶段:阶段变量依次为4,3,2,1,如图2所示.设阶段k的状态变量为。在阶段1:在阶段2:可以取中任意一个,对应的有2023/5/2525第二十五页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理从出发到终点E最短路径为“”,决策变量;从出发到终点E最短路径为“”,决策变量;从出发到终点E最短路径为“”,决策变量;2023/5/2526第二十六页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理在阶段3:可以取中任意一个,于是2023/5/2527第二十七页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理从出发到终点E最短路径为“”或决策变量或;从出发到终点E最短路径为“”,决策变量;从出发到终点E最短路径为“”或决策变量或;在阶段4:2023/5/2528第二十八页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理因此,由起点A到终点E的费用最少路径有3条:此3条路径对应的总费用均为11单位金额。2023/5/2529第二十九页,共三十九页,编辑于2023年,星期五2贝尔曼最优化原理动态规划为我们提供了一种优秀的决策思想:战略上追求全局优化,战术上稳扎稳打、步步为营。这深刻地揭示了局部与全局的统一关系。动态规划在实际中得到广泛应用,如可应用于背包问题、资源分配问题、生产与存储问题、设备更新问题等。需要指出的是:动态规划是一种求解思路,注重决策过程,而不是一种算法,不同的问题模型各异。2023/5/2530第三十页,共三十九页,编辑于2023年,星期五3WinQSB软件应用2023/5/2531第三十一页,共三十九页,编辑于2023年,星期五本节结合最短路径问题、背包问题介绍WinQSB软件的应用,其他问题的求解可参考本章参考文献.求解动态规划问题,需要调用WinQSB软件中的子程序“DynamicProgramming”.方法:点击“开始”“程序”“WinQSB”“DynamicProgramming”,屏幕显示如图3.3所示.该程序有3个子模块:最短路问题(StagecoachProblem),背包问题(KnapsackProblem),生产与存储问题(ProductionandInventoryScheduling).

3WinQSB软件应用2023/5/2532第三十二页,共三十九页,编辑于2023年,星期五

3WinQSB软件应用2023/5/2533第三十三页,共三十九页,编辑于2023年,星期五1.最短路问题【例3】用WinQSB软件求解例1.解(1)调用WinQSB软件中的子程序“DynamicProgramming”,建立新问题.在图3.3中选择第一项,输入标题和站点数.(2)输入数据.按照图3.1从左到右将相邻站点间的距离输入表3.1中,其中表示图3.1中从左到右的第k

个站点,k=1,2,…,9表3.1

3WinQSB软件应用2023/5/2534第三十四页,共三十九页,编辑于2023年,星期五(3)求解.点击菜单栏“SolveandAnalyze”“SolvetheProblem”,得到图3.4.再点击“Solve”键,得到计算结果,见表3.2.可见由起点到终点的最短路径为

3WinQSB软件应用2023/5/2535第三十五页,共三十九页,编辑于2023年,星期五表2

3WinQSB软件应用2023/5/2536第三十六页,共三十九页,编辑于2023年,星期五2.背包问题背包问题的一般提法是:设有一位旅行者携带背包去登山,已知

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论