




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数学建模
动态规划动态规划问题实例动态规划的基本概念与原理动态规划应用举例动态规划是解决多阶段决策过程最优化的一种方法。该方法是由美国数学家贝尔曼(R.E.Bellman)等人在20世纪50年代初提出的。他们针对多阶段决策问题的特点,提出了解决这类问题的“最优化原理”,并成功地解决了生产管理、工程技术等方面的许多问题,从而建立了运筹学的一个新的分支,即动态规划。Bellman在1957年出版了《DynamicProgramming》一书,是动态规划领域中的第一本著作。动态规划问题及实例动态规划是解决多阶段决策问题的一种方法,是现代企业管理中的一种重要决策方法,可用于最优路径问题、资源分配问题、生产计划和库存问题、投资问题、装载问题、排序问题及生产过程的最优控制等。动态规划模型的分类:以“时间”角度可分成:离散型和连续型。从信息确定与否可分成:确定型和随机型。从目标函数的个数可分成:单目标型和多目标型。一、多阶段决策过程多阶段决策过程是指这样一类特殊的活动过程,他们可以按时间顺序分解成若干相互联系的阶段,在每个阶段都要做出决策,全部过程的决策是一个决策序列,所以多阶段决策过程也称为序贯决策过程。这种问题就称为多阶段决策问题。
二、多阶段决策问题的特点过程可分为若干个相互联系的阶段;每一阶段都对应着一组可供选择的决策;每一决策的选定即依赖于当前面临的状态,又影响以后总体的效果。三、具体实例1、最短路线问题给定一个线路网络,要从A向F铺设一条输油管道,各点间连线上的数字表示距离,问应选择什么路线,可使总距离最短?2、生产与存储问题:某工厂每月需供应市场一定数量的产品。供应需求所剩余产品应存入仓库,一般地说,某月适当增加产量可降低生产成本,但超产部分存入仓库会增加库存费用,要确定一个每月的生产计划,在满足需求条件下,使一年的生产与存储费用之和最小。动态规划的基本概念与原理动态规划的基本概念阶段;状态;决策和策略;状态转移方程;指标函数。一、基本概念阶段:是指问题需要做出决策的步数。阶段总数常记为n,相应的是n个阶段的决策问题。阶段的序号常记为k,称为阶段变量,k=1,2,…,n.k即可以是顺序编号也可以是逆序编号,常用顺序编号。状态:各阶段开始时的客观条件,第k阶段的状态常用状态变量表示,状态变量取值的集合成为状态集合,用表示。例如,案例1中,AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143第1阶段第2阶段第3阶段第4阶段第5阶段状态1状态2状态3状态4状态5状态6决策:是指从某阶段的某个状态出发,在若干个不同方案中做出的选择。表示决策的变量,称为决策变量,用表示。表示第k阶段当状态处于sk时的决策变量。例如:表示走到C阶段,当处于C2路口时,下一步奔D1.时的允许决策集合记为,例如:决策变量允许的取值范围称为允许决策集合,第k阶段状态为状态转移方程:是从上一阶段的某一状态值转变为下一阶段某一状态值的转移规律,用表示。策略:一个按顺序排列的决策组成的集合。由每段的决策按顺序排列组成的决策函数序列称为k子过程策略。简称子策略,记为。即当k=1时,此决策函数序列成为全过程的一个策略,简称策略,记为:在实际问题中,可供选择的策略有一定的范围,此范围称为允许策略集合,用P表示。指标函数:阶段指标函数和过程指标函数。阶段指标函数是指第k阶段从状态出发,采取决策时的效益,用表示。而过程指标函数是从第k阶段的某状态出发,采取子策略效益之和:最优指标函数:表示从第k阶段状态为时采用最佳策略到过程终止时的最佳效益。记为时所得到的阶段其中opt可根据具体情况取max或min。基本方程:此为逐段递推求和的依据,一般为:式中opt可根据题意取max或min.例如,案例1的基本方程为:最优性原理:最优策略的子策略必为最优。不管过去的状态和决策如何,从眼下直到最后的诸决策必构成最优子策略。动态规划的优点:可把一个N维优化问题化成N个一维优化问题求解。求得最优解以后,可得所有子问题的最优解。动态规划的缺点:“一个”问题,“一个”模型,“一个”求解方法。且求解技巧要求比较高,没有统一处理方法。状态变量维数不能太高,一般要求小于6。动态规划应用举例例1最短路线问题基本思想:如果起点A经过B1,C1,D1,E1而到终点F,则由C1出发经D1,E1到F点这条子路线,是从C1到F的最短路线。所以,寻找最短路线,应该从最后一段开始找,然后往前递推。状态变量:各路线的位置决策变量:第k阶段当状态处于时,决定下一个状态的位置状态转移方程:上一阶段到下一阶段的转移规则指标函数:从状态出发,采取决策时的路程距离最优指标函数:第k阶段状态为时且采用最佳走线策略,使从k位置及以后的路线最短。逆序递推方程:(1)k=5时,状态它们到F点的距离即为最短路。AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143(2)k=4时,状态它们到F点需经过中途点E,需一一分析从E到F的最短路:先说从D1到F的最短路有两种选择:经过E1,E2,比较最短。AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143这说明由D1到F的最短距离为7,其路径为相应的决策为:这说明由D2到F的最短距离为5,其路径为相应的决策为:AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143即D3到F的最短距离为5,其路径为相应的决策为:(3)k=3时,状态这说明由C1到F的最短距离为12,相应的决策为AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143即由C2到F的最短距离为10,相应的决策为即由C3到F的最短距离为8,相应的决策为即由C4到F的最短距离为9,相应的决策为AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143(4)k=2时,状态这说明由B1到F的最短距离为13,相应的决策为即由B2到F的最短距离为15,相应的决策为AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143(1)k=1时,只有一个状态点A,则即由A到F的最短距离为17,相应的决策为所以最优路线为:AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143再按计算顺序反推可得最优决策序列:顺序递推方程:AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143例1:1阶段2阶段3阶段4阶段5阶段行走方向AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143K=1时注意到:所以K=2时AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143K=3时AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143或类似地,可算出:最优策略:AB1B2C1C2C3C4D1D2D3E1E2F452368775845348435623143或最短路径:最短路长:注:顺序解法与逆序解法无本质区别,一般来说,当初始状态给定时用逆序解法,当终止状态给定时用顺序解法。若问题给定了一个初始状态与一个终止状态,则两种方法均可使用。例2资源分配问题(离散型)例:设有6万元资金用于4个工厂的扩建,已知每个工厂的利润增长额同投资额的大小有关,见下表。问应如何确定对这四个工厂的投资额,使总利润增长额最大?投资额(j)工厂(i)010020030040050060010204260758590202545576570733018396178909540284765748085
表1利润增长额
(百元)解:把对四个工厂的投资依次看成4个阶段的决策过程,确定对第k个工厂的投资额看成第k个阶段的决策,k=1,2,3,4。图示如下:状态变量:可用于第k,k+1,…n个工厂的投资额。决策变量:第k阶段对第k个工厂的投资额。允许决策集:工厂1工厂2工厂3工厂4投资x1投资x2投资x3投资x4状态状态状态状态转移方程:其中阶段指标函数:第k阶段投资元时所产生的利润。(见上表)最优指标函数:第k阶段状态为且采取最佳投资策略,从第k个工厂以及以后的最大总利润。逆序法基本递推方程:工厂1工厂2工厂3工厂4投资x1投资x2投资x3投资x4状态状态状态投资额(j)工厂(i)010020030040050060040284765748085
表1利润增长额
(百元)解:(1)k=4时考虑:若到最后一个,第4个工厂投资时,还有资金,若投资于第4个工厂的资金为,则最大利润为工厂1工厂2工厂3工厂4投资x1投资x2投资x3投资x4状态状态状态投资额(j)工厂(i)010020030040050060040284765748085
表1利润增长额
(百元)(注意到此时=0)自然问:现在还有多少钱?即=?=0,100,200,300,400,500,600都有可能。下面分情况讨论:工厂1工厂2工厂3工厂4投资x1投资x2投资x3投资x4状态状态状态投资额(j)工厂(i)010020030040050060040284765748085
表1利润增长额
(百元)时,时,其他种情况类似讨论,我们把所有的结果汇总成一个表2。投资额(j)工厂(i)010020030040050060040284765748085
表1利润增长额
(百元)01002003004005006000100200300400500600002802847028476502847657402847657480028476574808502847657480850100200300400500600表2
k=4时决策表投资额(j)工厂(i)010020030040050060010204260758590202545576570733018396178909540284765748085
表1利润增长额
(百元)(2)k=3时到第三个工厂投资时,可利用的资金还有,若向第三个工厂投资(万元),则自此即以后最大利润为:
表1利润增长额
(百元)投资额(j)工厂(i)010020030040050060030183961789095同样问:=?,即现在还有多少钱?它是允许决策集上界。同理仅举一例:投资额(j)工厂(i)010020030040050060030183961789095
表1利润增长额
(百元)01002003004005006000100200300400500600002802847028476502847657402847657480028476574808502847657480850100200300400500600表2
k=4时决策表投资额(j)工厂(i)010020030040050060030183961789095表1利润增长额(百元)所有情况讨论结果汇总成下表:010020030040050060001002003004005006000+00+2818+00+4718+2839+00+6518+4739+2861+00+7418+6539+4761+2878+00+8018+7439+6561+7478+2890+00+8518+8039+7461+6578+4790+2895+0028476789108126000200300300300表3
k=3时决策表(3)k=2时仅举一例:投资额(j)工厂(i)010020030040050060020254557657073表1利润增长额(百元)010020030040050060001002003004005006000+00+2818+00+4718+2839+00+6518+4739+2861+00+7418+6539+4761+2878+00+8018+7439+6561+7478+2890+00+8518+8039+7461+6578+4790+2895+0028476789108126000200300300300表3
k=3时决策表关于的其它取值情况及相应的最优决策列于下表010020030040050060001002003004005006000+00+2825+00+4725+2845+00+6725+4745+2857+00+8925+6745+4757+2865+00+10825+8945+6757+4765+2870+00+12625+10845+8957+6765+4770+2873+002853739211413400100200100或200100200
表4k=2时决策表(4)k=1时,此时投资额(j)工厂(i)010020030040050060010204260758590表1利润增长额(百元)010020030040050060001002003004005006000+00+2825+00+4725+2845+00+6725+4745+2857+00+8925+6745+4757+2865+00+10825+8945+6757+4765+2870+00+12625+10845+8957+6765+4770+2873+002853739211413400100200100或200100200表4k=2时决策表汇一表格:0100200300400500600600134134134133138113901340或100或200表5k=1时决策表此时对应最大值134的有三个值:
所对应的最优策略分别为:时,由状态转移方程知:所对应的010020030040050060001002003004005006000+00+2825+00+4725+2845+00+6725+4745+2857+00+8925+6745+4757+2865+00+10825+8945+6757+4765+2870+00+12625+10845+8957+6765+4770+2873+002853739211413400100200100或200100200表4k=2时决策表对应的
再由状态转移方程对应的
010020030040050060001002003004005006000+00+2818+00+4718+2839+00+6518+4739+2861+00+7418+6539+4761+2878+00+8018+7439+6561+7478+2890+00+8518+8039+7461+6578+4790+2895+0028476789108126000200300300300表3
k=3时决策表所对应的
再由状态转移方程对应的
0100200300400500600010020030040050060000280284702847650284765
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 钱江大桥桥墩施工方案
- 2025年时代青春面试试题及答案
- 2025年煤矿安全规程试题及答案
- 公路干线物流自动驾驶行业研究报告
- 2025年遇到好难的面试题及答案
- 低温低浊水处理成功案例
- cc结构域蛋白互作
- 4年级上册语文19课
- ansys结构计算轴向加速度
- 树木移植的施工方案
- 全过程造价咨询服务实施方案
- 实用参考从合规到绩效:宋志平谈央企学习型董事会建设
- GB/T 912-2008碳素结构钢和低合金结构钢热轧薄钢板和钢带
- GB/T 26480-2011阀门的检验和试验
- 中共一大会址
- 云南省烟草买卖合同(标准版)
- 2023个人独资企业清算报告(精选4篇)
- 卫生统计学(全套课件)
- 2021年6月浙江省高考读后续写课件-高考英语复习备考
- 小学古诗词80首(硬笔书法田字格)
- 城市轨道交通供电技术442页完整版教学课件汇总全书电子教案
评论
0/150
提交评论