版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
运筹学课件动态规划第一页,共四十三页,编辑于2023年,星期二2511214106104131112396581052C1C3D1AB1B3B2D2EC2最短路径问题求从A到E的最短路径从起点A到终点E要经过A、B、C、D、E五站,每一站可以在不同的备选地点停留。每一站的备选地点,每个地点和下一站的各备选地点之间的距离如下图。第二页,共四十三页,编辑于2023年,星期二动态规划用一种全新的思路来考虑这样的问题。首先,把一个复杂的问题归结为若干个与原问题性质完全相同,但规模较小的子问题,每一个子问题又可以递归地归结为性质相同,规模更小的下层子问题。如此不断进行,一直到子问题非常简单,可以解决为止。然后,从这些最简单的子问题出发,依次计算上一层子问题的最优解,直到求出原问题的最优解。以最短路径问题为例,来说明动态规划的基本思想。第三页,共四十三页,编辑于2023年,星期二从A到E的最短路径S(A),可以转化为三个性质完全相同,但规模较小的子问题,即分别从B1、B2、B3到E的最短路径,记为S(B1),S(B2),S(B3)。121410B1131112B36104B2396581052C1C3D1D2EC2251A第四页,共四十三页,编辑于2023年,星期二A2121410B11131112B356104B2396581052C1C3D1D2EC2第五页,共四十三页,编辑于2023年,星期二121410B1131112B36104B2396581052C1C3D1D2EC2同样,计算S(B1)、S(B2)、S(B3)又可以归结为性质完全相同,但规模更小的问题,即分别求C1,C2,C3到E的最短路径问题S(Ci)(i=1,2,3)。第六页,共四十三页,编辑于2023年,星期二121410B1396581052C1C3D1D2EC2第七页,共四十三页,编辑于2023年,星期二6104B2396581052C1C3D1D2EC2第八页,共四十三页,编辑于2023年,星期二131112B3396581052C1C3D1D2EC2第九页,共四十三页,编辑于2023年,星期二39C1810C352D1D2E65C2计算S(Ci)又可以归结为求从D1和D2到E的最短路径S(D1)和S(D2)这两个子问题。第十页,共四十三页,编辑于2023年,星期二39C152D1D2E第十一页,共四十三页,编辑于2023年,星期二52D1D2E65C2第十二页,共四十三页,编辑于2023年,星期二810C352D1D2E第十三页,共四十三页,编辑于2023年,星期二S(D1)和S(D2)是已知的,它们分别是:S(D1)=5,S(D2)=2。因而,可以从这两个值开始,逆向递归计算S(A)的值。5D12D2E第十四页,共四十三页,编辑于2023年,星期二[引例]马车驿站问题124833538667863235AB2B1D2D1C3C2C4C1EA—B—C—D—E阶段1阶段2阶段3阶段44个阶段EED1
D2D1
D2D1
D2D1
D2C2
C3
C4C1
C2
C31D1E1D2E2C4D1
C4D22C3D1
C3D22C2D1
C2D22C1D1
C1D23B2C2
B2C3
B2C43B1C1
B1C2
B1C3B1
B22AB1
AB2AB2B1C4C3C2C1D1D24321终点路线数可选路线起点阶段一共有2×3×2×1=12条不同的路线f(E)=0f(D1)=2f(D2)=1f(C1)=8f(C2)=5f(C3)=4f(C1)=5f(B1)=8f(B2)=11f(A)=13回顾分析过程:1.将分析对象划分成4阶段;2.每阶段始点状态与终点状态有关,而不考虑始终点状态如何形成(无记忆性);3.每阶段各始点状态为终点状态与始点至终点距离之和的最小值(状态转移)这种最优化方法称为动态规划,由美国数学家贝尔曼等人于20世纪50年代创立.第十五页,共四十三页,编辑于2023年,星期二13.1.1动态规划的基本概念1.阶段:把所给问题的过程,恰当地分为若干个相互联系的阶段,以便能按一定的次序去求解。描述阶段的变量称为阶段变量,常用k表示。[导入案例]中k=1,2,3,42.状态变量:每个阶段开始所处的自然状况或客观条件(用点集表示).如引例:
第1阶段的状态就是起点A,记为s1={A};
第2阶段有2个状态{B1,B2},记为s2={B1,B2};
第3阶段有4个状态{C1,C2,C3,C4},记为s3={C1,C2,C3,C4};
第4阶段有2个状态{D1,D2},记为s4={D1,D2};3.决策变量:在某一阶段的某个状态时的不同选择,如引例中B1状态下有3种选择:
B1—C1,B1—C2,B1—C3
这3种选择构成了允许决策的集合。不同状态下允许决策的集合也不同,故决策变量是状态变量的函数,即xk(sk)∈D(sk)124833538667863235AB2B1D2D1C3C2C4C1EA—B—C—D—E阶段1阶段2阶段3阶段44个阶段4.策略按顺序排列的决策组成的集合,由过程的第k阶段开始到终止状态为止的过程(或k子过程),k子过程的策略称子策略,记为Pk,n(sk),即Pk,n(sk)={xk(sk),xk+1(sk+1),…,xn(sn)}当k=1时,即为全过程的一个策略。如引例中:D—E,即4到5过程起始有2个状态,D1和D2,因此有P4,5={D1—E,D2—E}5.状态转移方程确定过程是由一个状态到另一个状态的演变过程。第k阶段状态变量值给定后,如果确定决策变量,第k+1阶段状态变量值就完全确定。即:sk+1=T(sk,xk)如引例中:若对A—B1,A—B2选择了A—B1,则s2=5,B1到C有3种选择:B1—C1、B1—C2、B1—C3,若选择了B1—C2,则s3=s2+d(B1,C2)=86.指标函数用来衡量所实现过程优劣的一种数量指标。其基本方程有加法和乘法两种形式,通常加法形式用的较多,其公式为:7.边界条件起始或终止条件。第十六页,共四十三页,编辑于2023年,星期二13.1.2动态规划的基本原理124833538667863235AB2B1D2D1C3C2C4C1EA—B—C—D—E阶段1阶段2阶段3阶段44个阶段最优化原理
(Optimalityprinciple):最优策略具备这样的性质:无论初始状态与初始决策如何,以后诸决策对以第一个决策所形成的状态作为初始状态的过程而言,必然构成最优策策略.通俗地说:最优策略的子策略也是最优的.例如,在导入案例中,最优策略是A—B1—C2—D1—E,最短距离为13,其子策略:B1—C2—D1—E,C2—D1—E,D1—E也是最优的。依据这一原理,从后往前推各阶段最优子过程,从而得到全程最优过程。设f(i)表示从点i到终点E的最短距离,d(i,j)表示点i,j之间的距离.显然f(E)=0,为该问题的边界条件.k=4决策:D1Ek=3决策:D2E决策:C1D1决策:C2D1k=2决策:C3D2决策:C4D2决策:B1C2决策:B2C3k=1决策:AB1最短路线:AB1C2D1E最短路长:13第十七页,共四十三页,编辑于2023年,星期二动态规划用一种全新的思路来考虑这样的问题。首先,把一个复杂的问题归结为若干个与原问题性质完全相同,但规模较小的子问题,每一个子问题又可以递归地归结为性质相同,规模更小的下层子问题。如此不断进行,一直到子问题非常简单,可以解决为止。然后,从这些最简单的子问题出发,依次计算上一层子问题的最优解,直到求出原问题的最优解。第十八页,共四十三页,编辑于2023年,星期二Bellman最优性原理“作为整个过程的最优策略具有这样的性质:无论过去的状态和决策如何,相对于前面决策所形成的状态,余下的决策必然形成最优子策略”一个最优策略的子策略总是最优的。第十九页,共四十三页,编辑于2023年,星期二划分阶段确定状态变量及允许状态集合确定决策变量及决策空间确定状态转移方程确定最优指标函数并建立递归方程
13.2.1动态规划模型的建立第二十页,共四十三页,编辑于2023年,星期二例:最短路径问题找出A到E的最短路径
第二十一页,共四十三页,编辑于2023年,星期二(1)分为四阶段,k=1,2,3,4。(2)令Sk
(k→n)为k阶段初所处的位置。(3)令决策变量xk为处于某阶段某位置时,选择下一个位置。(4)状态转移方程
(5)递归方程(k→n)第二十二页,共四十三页,编辑于2023年,星期二1、划分为4个阶段2、用点集表示各阶段的状态S1={A};s2={B1,B2,B3},s3={C1,C2,C3};s4={D1,D2}3、指标函数:Vk,4(i)为第k阶段第i点到E点的距离4、最优值函数fk(i)为i点到E的最短距离5、决策变量xk=d[i,j]为第k阶段第i状态的选择6、边界条件:f5(E)=07、基本方程:fk(i)=min{d[i,j]+fk+1(j)}(k=1,2,3,4)第二十三页,共四十三页,编辑于2023年,星期二模型求解逆序法已知边界条件终点顺序法已知始点边界条件第二十四页,共四十三页,编辑于2023年,星期二逆序法求解k=4第二十五页,共四十三页,编辑于2023年,星期二
k=3第二十六页,共四十三页,编辑于2023年,星期二
k=2第二十七页,共四十三页,编辑于2023年,星期二k=1最优路径为最短距离为19第二十八页,共四十三页,编辑于2023年,星期二最优解第二十九页,共四十三页,编辑于2023年,星期二总结:逆序法最优值函数f(k):从k阶段到E的最短距离;阶段指标函数,即该阶段选择不同路线的距离。从后向前推。S1={A}S2={B1,B2}S3={C1,C2,C3,C4}S4={D1,D2}S5={E}f5(E)=0同理f4(D1)=2,f4(D2)=1同理f3(C2)=5,f3(C3)=4,f3(c4)=5同理f2(B2)=11124833538667863235AB2B1D2D1C3C2C4C1EA—B—C—D—E阶段1阶段2阶段3阶段4第三十页,共四十三页,编辑于2023年,星期二13.2.2动态规划问题的解法:顺序法124833538667863235AB2B1D2D1C3C2C4C1EA—B—C—D—E阶段1阶段2阶段3阶段4最优值函数f(k):从A到k阶段的最短距离;阶段指标函数,即该阶段选择不同路线的距离。从前向后推。S0={A}S1={B1,B2}S2={C1,C2,C3,C4}S3={D1,D2}S4={E}最优值函数:f0(A)=0f1(B1)=5,f2(B2)=3f2(C1)=7,f3(C2)=8,f3(C3)=10,f3(c4)=9f3(D1)=11,f4(D2)=13第三十一页,共四十三页,编辑于2023年,星期二案例---资源分配解把生产第k种产品看成是第k阶段,划分为n个阶段.设sk表示第k阶段初资源可用量(状态变量)
xk表示分配给第k阶段资源的数量(决策变量),显然有:允许决策集合
sk+1=sk-xk
(状态转移方程)s1=a
(边界条件)指标函数:若fk(sk)表示数量为sk资源分配给第k种产品时,从第k阶段到第n阶段总收益,则有:设某公司有某种原料,其数量为a,用于生产n种产品。若分配数量xi用于生产第i种产品,其收益为gi(xi)。问应如何分配,才能使生产n种产品的总收入最大?第三十二页,共四十三页,编辑于2023年,星期二例1资源分配问题5台设备分配给3个工厂,盈利表如下,如何分配可使获利最大?
台数工厂012345甲乙丙00045389711119111211111212分析3个工厂看成3个阶段.阶段变量k(k=1,2,3);状态变量sk表示为分配给第k个工厂至第n个工厂的设备台数;决策变量xk
表示分配给第k个工厂的设备台数;则有sk+1=sk-xk;Pk(xk)表示为xk
台设备分配到第k个工厂所得赢利值;fk(sk)表示为台设备分配给第k个工厂至第n个工厂所得到的最大赢利值。则有:第三十三页,共四十三页,编辑于2023年,星期二k=3x3s3P3(x3)f3(s3)x3*0123450123450379111203791112012345k=2x2s2P2(x2)+f3(s2-x2)f2(s2)x2*01234501234500+30+70+90+110+125+05+35+75+95+119+09+39+79+911+011+311+712+012+312+00591216180121,222,3k=1x1s1P1(x1)+f2(s1-x1)f1(s1)x1*01234550+184+168+1211+911+511+0201,2,3012345甲乙丙00045389711119111211111212方案一:1,2,2方案二:2,1,2方案三:2,2,1方案四:3,2,0第三十四页,共四十三页,编辑于2023年,星期二案例2设备负荷问题某种机器可在高低两种不同的负荷下进行生产,设机器在高负荷下生产的产量函数为g=9x,其中x为投入生产的机器数量,季度完好率为a=0.65,在低负荷下生产的产量函数为h=4y,其中y为投入生产的机器数量,季度完好率为b=0.95。设资源拥有量100.解4季度看成4阶段
sk第k季初拥有完好机器数
xk第k季分配给高负荷机器数,则低负荷分配数sk-xk
下季度初完好机器数sk+1=0.65xk+0.95(sk-xk)
第k季产量vk=6xk+4(sk-xk)第三十五页,共四十三页,编辑于2023年,星期二k=4f4是x4的增函数,故最大值解为x4*=s4,相应地有f4(s4)=9s4k=3f3是x3的增函数,故最大值解为x3*=s3,相应地有f3(s3)=14.85s3第三十六页,共四十三页,编辑于2023年,星期二k=2f2是x2的增函数,故最大值解为x2*=s2,相应地有f2(s2)=18.6525s2k=1f1是x1的减函数,故最大值解为x1*=0,相应地有f1(s1)=21.719875s1=2172反向推算,由s1=100,x1﹡=0,知s2=95,x2﹡=95,s3=61.75,x3﹡=61.75,s4=40.14,x4﹡=40.14,s5=26.09。即第1季度设备100%全部分配给低负荷第2季度初完好设备为95%,全部分配给高负荷第3季度完好设备为61.75%,全部分配给高负荷第4季度完好设备为40.14%,全部分配给高负荷。全年结束后,设
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信息时代背景下的教师管理课件
- 班主任工作范文四年级班级工作计划
- 宾馆装修合同范本(5篇)
- 【政治】历久弥新的思想理念课件-+2024-2025学年统编版道德与法治七年级下册
- 小红书翡翠玉石文玩行业营销通案【互联网】【通案】
- 离婚协议书简单起草,只写房子和孩子分割
- 合同示范文本 住建部
- 《金融危机下的》课件
- 《电力变压器习题》课件
- 《脑出血诊治进展》课件
- 消防法知识课件
- 【职教高考】专题复习卷《建筑识图与构造》 专题一 制图基本知识 解析版
- 《工贸行业重大事故隐患判定标准》专题培训
- 电力系统调频辅助服务市场交易实施细则
- 男模合同模板
- 外资企业技术合作合同模板
- 混血豺王课件
- 村民活动中心组织设计方案
- 2024年制冷空调系统安装维修工(五级)鉴定考试题库(浓缩500题)
- 2024年度企业形象策划与市场营销合同
- 低血糖护理新技术新进展
评论
0/150
提交评论