版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、管管 理理 运运 筹筹 学学1第十章第十章 动态规划动态规划1多阶段决策过程最优化问题举例多阶段决策过程最优化问题举例2基本概念、基本方程与最优化原理基本概念、基本方程与最优化原理3动态规划的应用动态规划的应用(1)4动态规划的应用动态规划的应用(2)管管 理理 运运 筹筹 学学21 1多阶段决策过程最优化问题举例多阶段决策过程最优化问题举例例例1 最短路径问题最短路径问题 下图表示从起点下图表示从起点A到终点到终点E之间各点的距离。求之间各点的距离。求A到到E的最的最短路径。短路径。BACBDBCDEC4123123123221647248386756110643751管管 理理 运运 筹筹
2、 学学31 1多阶段决策过程最优化问题举例多阶段决策过程最优化问题举例用穷举法的计算量用穷举法的计算量: 如果从如果从A到到E的站点有的站点有k个,除个,除A、E之外每站有之外每站有3个位置则个位置则总共有总共有3k-12条路径;条路径; 计算各路径长度总共要进行计算各路径长度总共要进行 (k+1) 3k-12次加法以及次加法以及3k-12-1次比较。随着次比较。随着 k 的值增加时,需要进行的加法和比较的的值增加时,需要进行的加法和比较的次数将迅速增加;次数将迅速增加; 例如当例如当 k=20时,加法次数为时,加法次数为 4.25508339662271015 次,次,比较比较 1.3726
3、0754729771014 次。若用次。若用1亿次亿次/秒的计算机计算秒的计算机计算需要约需要约508天。天。管管 理理 运运 筹筹 学学41 1多阶段决策过程最优化问题举例多阶段决策过程最优化问题举例讨论: 1、以上求从A到E的最短路径问题,可以转化为四个性质完全相同,但规模较小的子问题,即分别从Di 、Ci、Bi、A到E的最短路径问题。 第四阶段:两个始点D1和D2,终点只有一个; 表10-1分析得知:从D1和D2到E的最短路径唯一。 阶段4本阶段始点(状态)本阶段各终点(决策)到E的最短距离本阶段最优终点(最优决策) E D1 D2 10* 6 10 6 E E管管 理理 运运 筹筹 学
4、学5 第三阶段:有三个始点C1,C2,C3,终点有D1,D2,对始点和终点进行分析和讨论分别求C1,C2,C3到D1,D2 的最短路径问题: 表10-2分析得知:如果经过C1,则最短路为C1-D2-E; 如果经过C2,则最短路为C2-D2-E; 如果经过C3,则最短路为C3-D1-E。 1 1多阶段决策过程最优化问题举例多阶段决策过程最优化问题举例 阶段3本阶段始点(状态)本阶段各终点(决策)到E的最短距离本阶段最优终点(最优决策) D1 D2 C1 C2 C3 8+10=18 7+10=17 1+10=11 6+6=12 5+6=11 6+6=12 12 11 11 D2 D2 D1管管 理
5、理 运运 筹筹 学学6第二阶段:有4个始点B1,B2,B3,B4,终点有C1,C2,C3。对始点和终点进行分析和讨论分别求B1,B2,B3,B4到C1,C2,C3 的最短路径问题: 表10-3 分析得知:如果经过B1,则走B1-C2-D2-E; 如果经过B2,则走B2-C3-D1-E; 如果经过B3,则走B3-C3-D1-E; 如果经过B4,则走B4-C3-D1-E。 1 1多阶段决策过程最优化问题举例多阶段决策过程最优化问题举例 阶段2本阶段始点(状态) 本阶段各终点(决策)到E的最短距离本阶段最优终点(最优决策) C1 C2 C3 B1 B2 B3 B4 2+12=14 4+12=16 4
6、+12=16 7+12=19 1+11=12 7+11=18 8+11=19 5+11=16 6+11=17 2+11=13 3+11=14 1+11=12 12 13 14 12 C2 C3 C3 C3管管 理理 运运 筹筹 学学7第一阶段:只有1个始点A,终点有B1,B2,B3,B4 。对始点和终点进行分析和讨论分别求A到B1,B2,B3,B4的最短路径问题: 表10-4最后,可以得到:从A到E的最短路径为A B4 C3 D1 E1 1多阶段决策过程最优化问题举例多阶段决策过程最优化问题举例 阶段1本阶段始点(状态) 本阶段各终点(决策)到E的最短距离本阶段最优终点(最优决策) B1 B2
7、 B3 B4 A 4+12=16 3+13=163+14=172+12=14 12 C2管管 理理 运运 筹筹 学学8 以上计算过程及结果,可用图以上计算过程及结果,可用图2表示,可以看到,以上方表示,可以看到,以上方法不仅法不仅得到了从得到了从A到到D的最短路径,同时,也得到了从图中任一点到的最短路径,同时,也得到了从图中任一点到E的最的最短路径。短路径。 以上过程,仅用了以上过程,仅用了22次加法,计算效率远高于穷举法。次加法,计算效率远高于穷举法。BACBDBCDEC412312312332164724838675161060106121111121314144B1275121 1多阶段
8、决策过程最优化问题举例多阶段决策过程最优化问题举例管管 理理 运运 筹筹 学学9一、基本概念: 1、阶段k:表示决策顺序的离散的量,阶段可以按时间或空间划分。 2、状态sk:能确定地表示决策过程当前特征的量。状态可以是数量,也可以是字符,数量状态可以是连续的,也可以是离散的。 3、决策xk:从某一状态向下一状态过渡时所做的选择。决策是所在状态的函数,记为xk(sk)。 决策允许集合Dk(sk):在状态sk下,允许采取决策的全体。 4、策略Pk,n(sk):从第k阶段开始到最后第n阶段的决策序列,称k子策略。P1,n(s1)即为全过程策略。 5、状态转移方程 sk+1=Tk(sk, xk):某一
9、状态以及该状态下的决策,与下一状态之间的函数关系。2 2基本概念、基本方程与最优化原理基本概念、基本方程与最优化原理管管 理理 运运 筹筹 学学10 6、阶段指标函数、阶段指标函数vk(sk, xk):从状态:从状态sk出发,选择决策出发,选择决策xk所产生的所产生的第第k阶段指标。阶段指标。 过程指标函数过程指标函数Vk,n(sk, xk, xk+1, xn):从状态:从状态sk出发,选择出发,选择决策决策xk, xk+1, , xn所产生的过程指标。动态规划要求过程指标具有可分所产生的过程指标。动态规划要求过程指标具有可分离离性,即性,即 Vk,n(sk, xk, xk+1, , xn)
10、= vk(sk, xk)+Vk+1(sk+1, xk+1, , xn)称指标具有可加性,或称指标具有可加性,或 Vk,n(sk, xk, xk+1, , xn) = vk(sk, xk)Vk+1(sk+1, xk+1, , xn)称指标具有可乘性。称指标具有可乘性。二、基本方程:二、基本方程: 最优指标函数最优指标函数fk(sk):从状态:从状态sk出发,对所有的策略出发,对所有的策略Pk,n,过,过程指程指标标Vk,n的最优值,即的最优值,即 ),()(,)(nkknksDxkkPsVsfoptkkk2 2基本概念、基本方程与最优化原理基本概念、基本方程与最优化原理管管 理理 运运 筹筹 学
11、学11 对于可加性指标函数,上式可以写为对于可加性指标函数,上式可以写为 上式中上式中“opt表示表示“max或或“min”。对于可乘性指标。对于可乘性指标函数,上式可以函数,上式可以写为写为 以上式子称为动态规划最优指标的递推方程,是动态以上式子称为动态规划最优指标的递推方程,是动态规划的基本规划的基本方程。方程。 终端条件:为了使以上的递推方程有递推的起点,必终端条件:为了使以上的递推方程有递推的起点,必须要设定最须要设定最优指标的终端条件,一般最后一个状态优指标的终端条件,一般最后一个状态n+1下最优指标下最优指标fn+1(sn+1) = 0。nksfxsvsfkkkkksDxkkopt
12、kkk, 2 , 1)(),()(11)(nksfxsvsfkkkkksDxkkoptkkk, 2 , 1)(),()(11)(2 2基本概念、基本方程与最优化原理基本概念、基本方程与最优化原理管管 理理 运运 筹筹 学学12三、最优化原理三、最优化原理 作为整个过程的最优策略具有如下性质:作为整个过程的最优策略具有如下性质: 不管在此最优策略上的某个状态以前的状不管在此最优策略上的某个状态以前的状态和决策如何,对该状态来说,以后的所有决态和决策如何,对该状态来说,以后的所有决策必定构成最优子策略。就是说,最优策略的策必定构成最优子策略。就是说,最优策略的任意子策略都是最优的。任意子策略都是最
13、优的。2 2基本概念、基本方程与最优化原理基本概念、基本方程与最优化原理管管 理理 运运 筹筹 学学13一、资源分配问题一、资源分配问题 例例2. 某公司拟将某种设备某公司拟将某种设备5台,分配给所属的甲、乙、丙三个台,分配给所属的甲、乙、丙三个工工厂。各工厂获得此设备后,预测可创造的利润如表厂。各工厂获得此设备后,预测可创造的利润如表10-5所示,问这所示,问这5台设备应如何分配给这台设备应如何分配给这3个工厂,使得所创造的总利润为最大?个工厂,使得所创造的总利润为最大? 表表10-5 盈利 工厂设备台数 甲 厂 乙 厂 丙 厂 0 0 0 0 1 3 5 4 2 7 10 6 3 9 11
14、 11 4 12 11 12 5 13 11 123 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学14解:将问题按工厂分为三个阶段,甲、乙、丙三个厂分别编号为1、2、3厂。设 sk= 分配给第k个厂至第3个厂的设备台数k=1、2、3)。 xk=分配给第k个设备台数。 已知s1=5, 并有 从与的定义,可知以下我们从第三阶段开始计算。222223),(xsxsTskskx33xs 3 3 动态规划的应用动态规划的应用(1)(1)111112),(xsxsTs管管 理理 运运 筹筹 学学15 第三阶段第三阶段: 显然将台设备都分配给第显然将台设备都分配给第3工厂时,工厂
15、时,也就是时,第也就是时,第3阶段的指标值即第阶段的指标值即第3厂的盈利)厂的盈利)为最大,即为最大,即 由于第由于第3阶段是最后的阶段,故有阶段是最后的阶段,故有 其中可取值为其中可取值为0,1,2,3,4,5。其数值计算见表。其数值计算见表106。 )5 , 4 , 3 , 2 , 1 , 0(33ss).,(),(max)(333333333ssrxsrsfx3x),(),(max3333333ssrxsrx3 3 动态规划的应用动态规划的应用(1)(1)33xs 管管 理理 运运 筹筹 学学16 表表106 012345000014 4126623111134121245121253x
16、3s),(333xsr)(33sf3*x3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学17 其中表示取3子过程上最优指标值时的决策,例如在表10-6中可知当=4时,有有此时,即当时,此时取(把4台设备分配给第3厂是最优决策,此时阶段指标值(盈利为12,最优3子过程最优指标值也为12。 第二阶段: 当把台设备分配给第2工厂和第3工厂时,则对每个值,有一种最优分配方案,使最大盈利即最优2子过程最优指标函数值为 3*x)(33sf3x3s;12)4 , 4(3r,12)4(3f43*x43s43x)5 , 4 , 3 , 2 , 1 , 0(22ss2s)(),(max
17、)(33222222sfxsrsfx3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学18由于上式也可写成其数值计算如表107所示。表107 , 223xss0123450 00104 51206 54 1023011 56 110 1424012 114110 161,25012 512 116114 1102122x2s)(),(233222xsfxsr)(22sf2*x00050104101156101110)(),(max)(223222222xsfxsrsfx3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学19 其中在的这一行里,
18、当时,这里从表105中可知,把1台设备交给乙厂所得盈利数即可,知,这里从表106查即可知=11。同样可知当时,可知 ;当时,;当时,;当时, ;由于,不可能分2厂5台设备,故时,栏空着不填。从这些数值中取得最大即得,即有=16。在此行中我们在取最大值的 上面加一横以示区别,也可知这时的最优决策为1或2。42s12x16115) 3() 1 , 4() 14() 1 , 4()(),(3232223222frfrxsfxsr) 1 , 4(2r5) 1 , 4(2r)3()14(33ff)3(3f) 3(3f22x16610)2()2 , 4()24()2 , 4()(),(3232223222
19、frfrxsfxsr02x12120)04()0 , 4(32 fr32x411)34()3 , 4(32 fr42x11011)44()4 , 4(32 fr42s52x)54()5 , 4(32 fr)4(2f)4(2f)(),(223222xsfxsr2x3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学20第一阶段:第一阶段:把台设备分配给第把台设备分配给第1,第,第2,第,第3厂时,最大厂时,最大盈利为其中可取值盈利为其中可取值0,1,2,3,4,5.数值计算见表数值计算见表108 表表10-8 然后按计算表格的顺序推算,可知最优分配方案有两然后按计算表格的
20、顺序推算,可知最优分配方案有两个:个: 1.由于,根据,查表由于,根据,查表107可可知,再由知,再由 ,求得。,求得。即分配即分配给甲厂给甲厂0台,乙厂台,乙厂2台,丙厂台,丙厂3台。台。 2.由于,根据由于,根据 ,查表,查表107可可 )5(11ss),5(), 5(max)5(111111xfxrfx1x0123455 316 9+10 12+5 13+0 21 0,21x1s)5(), 5(1211xfxr210147)(1xf1*x01*x5051*12xss02*x3252*23xss333* sx21*x3251*12xss3 3 动态规划的应用动态规划的应用(1)(1)管管
21、理理 运运 筹筹 学学21知,再由 ,求得,即分配给甲厂2台,乙厂2台,丙厂1台。这两种分配方案都能得到最高的总盈利21万元。 22*x1232*23xss133* sx3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学22二、背包问题二、背包问题 设有设有n种物品,每一种物品数量无限。第种物品,每一种物品数量无限。第i种物品每种物品每件件重量为重量为wi公斤,每件价值公斤,每件价值ci元。现有一只可装载重量为元。现有一只可装载重量为W公斤的背包,求各种物品应各取多少件放入背包,使背公斤的背包,求各种物品应各取多少件放入背包,使背包中物品的价值最高。包中物品的价值最高
22、。 这个问题可以用整数规划模型来描述。设这个问题可以用整数规划模型来描述。设xi为第为第i种种物品装入背包的件数物品装入背包的件数i =1, 2, , n),背包中物品的总),背包中物品的总价值为价值为z,那么,那么 Max z = c1x1+c2x2+ +cnxn s.t. w1x1+w2x2+wnxnW x1, x2, , xn0 且为整数。且为整数。3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学23 下面用动态规划逆序解法求解它。设阶段变量k:第k次装载第k种物品k=1, 2, , n)状态变量sk:第k次装载时背包还可以装载的重量;决策变量uk = xk:
23、第k次装载第k种物品的件数;决策允许集合:Dk(sk) = xk | 0 xksk/wk,xk为整数;状态转移方程: sk+1 = sk wkxk;阶段指标: vk = ckxk;最优过程指标函数fk(sk):第k到n阶段容许装入物品的最大使用价值;递推方程: fk(sk) = max ckxk+fk+1(sk+1) = max ckxk+fk+1(sk wkxk); xDk(sk) 终端条件: fn+1(sn+1) = 0。3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学24例例3.某咨询公司有某咨询公司有10个工作日可以去处理四种类型个工作日可以去处理四种类型的
24、咨的咨询项目,每种类型的咨询项目中待处理的客户数量、处理询项目,每种类型的咨询项目中待处理的客户数量、处理每个每个客户所需工作日数以及所获得的利润如表客户所需工作日数以及所获得的利润如表109所示。显所示。显然该公然该公司在司在10天内不能处理完所有的客户,它可以自己挑选一些天内不能处理完所有的客户,它可以自己挑选一些客客户,其余的请其他咨询公司去做,应如何选择客户使得在户,其余的请其他咨询公司去做,应如何选择客户使得在这这10个工作日中获利最大?个工作日中获利最大? 表表109 咨询项目类型待处理客户数处理每个客户所需工作日数处理每个客户所获利润1234432213472811203 3 动
25、态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学25解:用动态规划来求解此题。解:用动态规划来求解此题。我们把此问题分成四个阶段,第一阶段我们决策将我们把此问题分成四个阶段,第一阶段我们决策将处理多少个第一种咨询项目类型中的客户,第二阶段决处理多少个第一种咨询项目类型中的客户,第二阶段决策将处理多少个第二种咨询项目类型中的客户,第三阶策将处理多少个第二种咨询项目类型中的客户,第三阶段、第四阶段我们也将作出类似的决策。我们设段、第四阶段我们也将作出类似的决策。我们设分配给第分配给第k种咨询项目到第四种咨询项目的所种咨询项目到第四种咨询项目的所有客户的总工作日第有客户的总工作日第
26、k阶段的状态变量)。阶段的状态变量)。 =在第在第k种咨询项目中处理客户的数量第种咨询项目中处理客户的数量第k阶段阶段的决策变量)。的决策变量)。知知10并有并有 kx1s,),(111112xsxsTsks3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学26 并从与的定义可知并从与的定义可知从第四阶段开始计算:从第四阶段开始计算:显然将个工作日尽可能分配给第四显然将个工作日尽可能分配给第四类咨询项目,即时,第四阶段的指标值为最大,类咨询项目,即时,第四阶段的指标值为最大,其中,表示取不大于的最大整数,符号为其中,表示取不大于的最大整数,符号为取整符号,故有取整符号
27、,故有由于第四阶段是最后的阶段,故有由于第四阶段是最后的阶段,故有,3),(222223xsxsTs.4),(333334xsxsTskskx447xs 4s)10, 1 , 0(4s7/44sx 7/4s7/4s ).7/,(),(max4444444ssrxsrx),7/,(),(max)(4444*44444ssrxsrsfx3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学27由于至多为由于至多为10,其数值计算见表,其数值计算见表1010。 表表10104s01000100200300400500600702018020190201100114x4s),(4
28、44xsr)(44sf4*x0000000202020203 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学28第三阶段:第三阶段:当把个工作日分配给第四类和第当把个工作日分配给第四类和第三类咨询项目时,则对每个值,都有一种最优分配方三类咨询项目时,则对每个值,都有一种最优分配方案,使其最大盈利即最优案,使其最大盈利即最优3子过程最优指标函数值为子过程最优指标函数值为 由于由于由于至多为由于至多为10,所以的取值可为,所以的取值可为0,1,2。其数值。其数值计算计算见表见表1011。)10, 3 , 2 , 1 , 0(33ss3s. )(),(max)(332222
29、22sfxsrsfx2233xss. )4(),(max)(334333333xsfxsrsfx3s3x3 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学29 表表1011 0 1 2000 1 00 200 300 40011 1 50011 1 60011 1 7 11+0 20 0 8020 11+0 22 2 9020 11+0 22 2 10020 11+0 22 23x3s)4(),(334333xsfxsr)(33sf3*x000000200011011011022022022003 3 动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学
30、学30 第二阶段:第二阶段: 同样以每个值都有一种最优分配方案,使其最大同样以每个值都有一种最优分配方案,使其最大盈利即盈利即最优最优2子过程最优指标函数值为:子过程最优指标函数值为:由于,故有由于,故有由于至多为由于至多为10,所以的取值为,所以的取值为0,1,2,3。其数值。其数值计算计算见表见表1012。. )3(),(max)(223222222xsfxsrsfx2233xss. )3(),(max)(223222222xsfxsrsfx2s2x2s3 3动态规划的应用动态规划的应用(1)(1)管管 理理 运运 筹筹 学学313 3动态规划的应用动态规划的应用(1) (1) 表表10-
31、12管管 理理 运运 筹筹 学学32 第一阶段:第一阶段: 我们已知,又因为我们已知,又因为 ,同样有,同样有 由于由于 ,故可取值为故可取值为0,1,2, ,10。其数值计算。其数值计算见表见表1013。 表表1013101s. )(),(max)(112111111xsfxsrsfx112xss.)10(),10(max)10(121111xfxrfx101s1x3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学33 从 表 1 0 1 3 可 知 , 从 而 得10010,在表1012的的这一行可知,由,查表1011的的这一行可知,最后由,查表10-10的的这
32、一行得,综上所述得最优解为:此时最大盈利为28。现在我们不妨假设该咨询公司的工作计划有所改变,只需8个工作日来处理这四类咨询项目,那么该咨询公司如何选择客户使得获利最大呢?我们不必从头开始重做这个问题,而只要在第一阶段上把改成8,重新计算就可得到结果,如表1014所示,这是动态规划的一个好处。28)10(1f01*x1*210 xs102s12*x731032*23xss73s03*x7073*34xss74s14*x0, 1, 03*2*1*xxx, 14*x4s3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学34表表1014如上一样可从表如上一样可从表1014
33、,1012,1011,1010得到两组最得到两组最优解优解如下:如下:它们的最优解即最大盈利都为它们的最优解即最大盈利都为22。一旦咨询的工作日不是减少而是增加,那么我们不仅要一旦咨询的工作日不是减少而是增加,那么我们不仅要重新计重新计算第一阶段,而且要在第二、第三、第四阶段的计算表上补算第一阶段,而且要在第二、第三、第四阶段的计算表上补上增加上增加的工作日的新的信息,也可得到新的结果。的工作日的新的信息,也可得到新的结果。3042)4321xxxx1001)4*3*2*1*xxxx3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学35 实际上,背包问题我们也可以用
34、整数规划来求解,如果实际上,背包问题我们也可以用整数规划来求解,如果背包携带物品重量的限制为背包携带物品重量的限制为W公斤,这公斤,这N种物品中第种物品中第i种物种物品的重量为,价值为,第品的重量为,价值为,第i种物品的总数量的,我们种物品的总数量的,我们可以设表示携带第可以设表示携带第i种物品的数量,则其数学模型为:种物品的数量,则其数学模型为:S.T. 且为整数。且为整数。 我们不妨用此模型去求解例我们不妨用此模型去求解例3,也一定得出同样的结果。,也一定得出同样的结果。iwicinix,max1Niiixcf0), 2 , 1(1iiiNiiixNinxWxw3 3动态规划的应用动态规划
35、的应用(1) (1) 管管 理理 运运 筹筹 学学36三、生产与存贮问题 例4.某公司为主要电力公司生产大型变压器,由于电力采取预订方式购买,所以该公司可以预测未来几个月的需求量。为确保需求,该公司为新的一年前四个月制定一项生产方案,这四个月的需求如表1015所示。生产成本随着生产数量而变化。调试费为4,除了调度费用外,每月生产的头两台各花费为2,后两台花费为1。最大生产能力每月为4台,生产成本如表1016所示。表10153 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学37 表表1016每台变压器在仓库中由这个月存到下个月的储存费为每台变压器在仓库中由这个月存到下
36、个月的储存费为1,仓库的最大储存能力为仓库的最大储存能力为3台,另外,知道在台,另外,知道在1月月1日时仓库里存日时仓库里存有一台变压器,要求在有一台变压器,要求在4月月30日仓库的库存量为零。试问该公日仓库的库存量为零。试问该公司应如何制定生产计划,使得四个月的生产成本和储存总费司应如何制定生产计划,使得四个月的生产成本和储存总费用最少?用最少?解:我们按月份来划分阶段,第解:我们按月份来划分阶段,第i个月为第个月为第i阶段:阶段:(i=1,2,3,4). 设设 为第为第k阶段期初库存量;阶段期初库存量; k=1,2,3,4 ks3 3动态规划的应用动态规划的应用(1) (1) 管管 理理
37、运运 筹筹 学学38为第为第k阶段生产量;阶段生产量; k=1,2,3,4为第为第k阶段需求量;阶段需求量; k=1,2,3,4,这已在表,这已在表10-15中告诉我们。中告诉我们。因为下个月的库存量等于上个月的库存量加上上个月的因为下个月的库存量等于上个月的库存量加上上个月的产量减去上个月的需求量,我们就得到了如下状态转移方产量减去上个月的需求量,我们就得到了如下状态转移方程:程:由于,故有由于,故有由于,故有由于,故有kxkd, 1112dxss11s, 1121dxs, 2223dxss, 3334dxss, 4445dxss05s, 4440dxs3 3动态规划的应用动态规划的应用(1
38、) (1) 管管 理理 运运 筹筹 学学39由于必须要满足需求,则有由于必须要满足需求,则有通过移项得到通过移项得到 另一方面,第另一方面,第k阶段的生产量必不大于同期的生产能力阶段的生产量必不大于同期的生产能力(4台),也不大于第台),也不大于第k阶段至第四阶段的需求之和与第阶段至第四阶段的需求之和与第k阶段阶段期初库存量之差,否则第期初库存量之差,否则第k阶段的生产量就要超过从第阶段的生产量就要超过从第k阶段阶段至第四阶段的总需求,故有至第四阶段的总需求,故有以下我们从第四阶段开始计算:以下我们从第四阶段开始计算:从以上的状态转移方程可知从以上的状态转移方程可知这样就有这样就有),4, 3
39、 ,2, 1(,kdxskkkkkksdxkx44 ,)(minkikiksdx,0444dxs,34444ssdx)3 ,(),(min)(444444444ssrxsrsfx3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学40 这里的阶段指标可以分成两部分,即生产成本与这里的阶段指标可以分成两部分,即生产成本与储存费,即为储存费,即为 由于第四阶段末要求库存为零,即有,由于第四阶段末要求库存为零,即有,这样可得这样可得 对于每个的可行值,的值列于表对于每个的可行值,的值列于表1017。 表表1017),(nnnxsr),()(),(nnnnnnnnxshxcx
40、sr001),(444xsh)3()3 ,()3()3 ,()(444444444444scsshscssrsf4s)(44sf3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学41表中当时,可知第四阶段要生产表中当时,可知第四阶段要生产台,从表台,从表1016可知总成本为可知总成本为9,同样可以算出当为,同样可以算出当为1,2,3时时的情况,结果已列于表的情况,结果已列于表1017中。中。第三阶段:第三阶段:此时有:此时有:由于以及所以有由于以及所以有例如,当第三阶段初库存量时,生产量为例如,当第三阶段初库存量时,生产量为2时,时,那么所以生产成本为那么所以生产成
41、本为8,第三阶段末库存,第三阶段末库存为为2时,储存费为,而时,储存费为,而04s3344sx4s)(1)(),()(),(3333333333333dxsxcxshxcxsr,3334dxss, 13d)() 1(1)(min)(443333)4,4min(133333sfxsxcsfsxs) 1() 1(1)(min3343333)4,4min(1333xsfxsxcsxs13s3x2121333dxs221),2()()(4333444fdxsfsf3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学42查1017表可知,这样可知,填入表1018中的栏内,其他结
42、果如表1018所示 : 表1018 第二阶段:由于所以有6) 2 (4f,16628)2()2 , 1 (43 fr2, 133xs, 422232dxssd3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学43 计算结果如表1019所示。 表1019 )(),(min)(33222)4,8min(422222sfxsrsfsxs)(),()(min3322222)4,8min(4222sfxshxcsxs)()(1)(min222322222)4,8min(4222dxsfdxsxcsxs)4()4(1)(min2232222)4,8min(4222xsfxsxc
43、sxs3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学44第一阶段:第一阶段:由于故有由于故有计算结果见表计算结果见表1020。 表表1020, 1, 2211111sdxssd)(),(min) 1 ()(22111411111sfxsrfsfx)21 ()21 (1)(min12111411xfxxcx3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学45利用递推关系可以从表利用递推关系可以从表1020,表,表1019,表,表1018和表和表1017得到两组最优解:得到两组最优解: 这时有最低总成本这时有最低总成本29。0441)4
44、321xxxx3042)4321xxxx3 3动态规划的应用动态规划的应用(1) (1) 管管 理理 运运 筹筹 学学463 3动态规划的应用动态规划的应用(1) (1) 四、系统可靠性问题 例5.某科研项目组由三个小组用不同的手段分别研究,它们失败的概率各为0.40,0.60,0.80。为了减少三个小组都失败的可能性,现决定给三个小组中增派两名高级科学家,到各小组后,各小组科研项目失败概率如下表: 问如何分派科学家才能使三个小组都失败的概率即科研项目最终失败的概率最小? 高级科学家小组12300.400.600.8010.200.400.5020.150.200.30管管 理理 运运 筹筹
45、学学473 3动态规划的应用动态规划的应用(1) (1) 解:用逆序算法。设 阶段:每个研究小组为一个阶段,且阶段123小组123管管 理理 运运 筹筹 学学483 3动态规划的应用动态规划的应用(1) (1) 计算当n=3时,当n=2时, s3 f3*(s3) x3*008001050120302 x2s2f2(s2,x2)=P2(x2) f3*(s2-x2) f2*(s2) x2*012004804801030032030020180200160162管管 理理 运运 筹筹 学学493 3动态规划的应用动态规划的应用(1) (1) 当n=1时, 最优解为 x1*=1,x2*=0,x3*=1
46、;科研项目最终失败的概率为0.060。 x1s1f1(s1,x1)=P1(x1) f2*(s1-x1)f2*(s2)x2*01220064 0060 0072 0060 1管管 理理 运运 筹筹 学学504 4动态规划的应用动态规划的应用(2)(2)* *一、连续确定性动态规划一、连续确定性动态规划 对于状态变量和决策变量只取连续值,对于状态变量和决策变量只取连续值,过程的演变方式为确定性时,这种动态规划过程的演变方式为确定性时,这种动态规划问题就称为连续确定性动态规划问题。问题就称为连续确定性动态规划问题。管管 理理 运运 筹筹 学学514 4动态规划的应用动态规划的应用(2)(2)* *机
47、器负荷分配问题机器负荷分配问题 例例1 一种机器能在高低两种不同的负荷状态下工作。设一种机器能在高低两种不同的负荷状态下工作。设机器在高负荷下生产时,产量函数为机器在高负荷下生产时,产量函数为P1=8u1,其中,其中u1为在为在高负荷状态下生产的机器数目,年完好率为高负荷状态下生产的机器数目,年完好率为a=0.7,即到年,即到年底有底有70的机器保持完好。在低负荷下生产时,产量函数的机器保持完好。在低负荷下生产时,产量函数为为P2=5u2,其中,其中u2为在低负荷状态下生产的机器数目,年为在低负荷状态下生产的机器数目,年完好率为完好率为b=0.9。设开始生产时共有。设开始生产时共有1000台完
48、好的机器,请台完好的机器,请问每年应该如何把完好机器分配给高、低两种负荷下生产,问每年应该如何把完好机器分配给高、低两种负荷下生产,才能使得才能使得5年内生产的产品总产量最高。年内生产的产品总产量最高。管管 理理 运运 筹筹 学学524 4动态规划的应用动态规划的应用(2)(2)* *解 建立动态规划模型: 分为5个阶段,每个阶段为1年。设状态变量sk表示在第k阶段初拥有的完好机器数目;k=1,2,3,4,5。 决策变量xk表示第k阶段中分配给高负荷状态下生产的机器数目;k=1,2,3,4,5。显然sk-xk为分配给低负荷状态下生产的机器数目。 状态转移方程为 sk+1=0.7xk+0.9(s
49、k-xk) 阶段指标 rk(sk,xk)=8xk+5(sk-xk) 最优指标函数 ,其中k=1,2,3,4,5。 f6(s6)=0。)()58max)(11kkkkkkksfxsxsf(kksx 0管管 理理 运运 筹筹 学学534 4动态规划的应用动态规划的应用(2)(2)* * 第5阶段: 因为f5(s5)是x5的线性单调增函数,故有x5* =s5, 于是有f5(s5)=8s5。 第4阶段: )(2 .126 .13max)(9 . 07 . 0 8)(58max8)(58max)()(58max)(44404444440544405544404444444444xsxxsxxsxsxsx
50、sfxsxsfsxsxsxsx 管管 理理 运运 筹筹 学学544 4动态规划的应用动态规划的应用(2)(2)* * 同样的,f4(s4)是x4的线性单调增函数,有x4*=s4 ,f4(s4)=13.6s4。 对前几个阶段依次类推,可得 f3(s3)=17.5s3, f2(s2)=20.75s2, f1(s1)=23.72s1。 因为期初共有完好机器1000台,故s1=1000。有f1(s1)=23.72s123720,即5年最大的产量为23720台。得最优解为 , , , 。 这意味着前两年应把年初完好机器完全投入低负荷生产,后三年应把年初完好机器完全投入高负荷生产。0*1x0*2x3*3s
51、x 4*4sx 5*5sx 管管 理理 运运 筹筹 学学554 4动态规划的应用动态规划的应用(2)(2)* * 下一步工作是确定每年初的状态,按照从前向后的顺序依次计算出每年年初完好的机器数目。已知s1=1000,根据状态转移方程,有:9009 . 0)(9 . 07 . 01*11*12sxsxs8109 . 0)(9 . 07 . 02*22*23sxsxs5677 . 0)(9 . 07 . 03*33*34sxsxs3977 . 0)(9 . 07 . 04*44*45sxsxs管管 理理 运运 筹筹 学学564 4动态规划的应用动态规划的应用(2)(2)* * 上面所讨论的最优策略
52、过程,初始端状态s1=1000台是固定的,终点状态s6没有要求。这种情况下得到最优决策称为初始端固定终点自由的最优策略。 如果终点附加一定的条件,则问题就称为“终端固定问题”。例如,规定在第5年度结束时仍要保持500台机器完好而不是278台),应如何安排生产才能使得总产量最大? 下面来分析: 根据终点条件有 可得500)(9 . 07 . 05556xsxs25005 . 455sx管管 理理 运运 筹筹 学学574 4动态规划的应用动态规划的应用(2)(2)* * 显然,由于固定了终点的状态,x5的取值受到了约束。因此有 类似的, 容易解得 ,f4(s4)=21.7s4-7500。75005
53、 .18)25005 . 4(5)25005 . 4(8max)(555555sssssf75007 . 07 .21max75005 .18)(58max)()(58max)(4405444055444044444444xssxsxsfxsxsfsxsxsx0*4x管管 理理 运运 筹筹 学学584 4动态规划的应用动态规划的应用(2)(2)* * 依次类推,得 f3(s3)=24.5s3-7500 f2(s2)=27.1s2-7500 f1(s1)=29.4s1-7500 再采用顺序方法递推计算各年的状态,有 s1=1000, 0*1*2*3xxx9009 . 0)(9 . 07 . 01
54、*11*12sxsxs8109 . 0)(9 . 07 . 02*22*23sxsxs7297 . 0)(9 . 07 . 03*33*34sxsxs6567 . 0)(9 . 07 . 04*44*45sxsxs管管 理理 运运 筹筹 学学594 4动态规划的应用动态规划的应用(2)(2)* * 可见,为了使终点完好的机器数量增加到500台,需要安排前四年中全部完好机器都要投入低负荷生产,且在第5年,也只能全部投入高负荷。 相应的最优指标为 f1(s1)=29.4s1-750021900。 可以看到,因为增加了附加条件,总产量f1(s1)要比终点自由情况下的产量要低。管管 理理 运运 筹筹
55、学学60二、离散随机性动态规划二、离散随机性动态规划 随机型的动态规划是指状态的转移律是不确定随机型的动态规划是指状态的转移律是不确定的,即的,即对给定的状态和决策,下一阶段的到达状态是具有对给定的状态和决策,下一阶段的到达状态是具有确定概率确定概率分布的随机变量,这个概率分布由本阶段的状态和分布的随机变量,这个概率分布由本阶段的状态和决策完全决策完全确定。随机型动态规划的基本结构如下图:确定。随机型动态规划的基本结构如下图: 4 4动态规划的应用动态规划的应用(2)(2)* * sk形状 xk决策概率k阶段的收益p1p2pN.k + 1 阶 段 的 状 态sk+1c1c2cN 1 2N管管
56、理理 运运 筹筹 学学614 4动态规划的应用动态规划的应用(2)(2)* * 图中N表示第k+1阶段可能的状态数,p1、p2、pN为给定状态sk和决策xk的前提下,可能达到下一个状态的概率。ci为从k阶段状态sk转移到k+1 阶段状态为i时的指标函数值。 在随机性的动态规划问题中,由于下一阶段到达的状态和阶段的效益值不确定,只能根据各阶段的期望效益值进行优化。管管 理理 运运 筹筹 学学62离散随机性动态规划离散随机性动态规划 例例2 2 某公司承担一种新产品研制任务,合同某公司承担一种新产品研制任务,合同要求三个月内交出一件合格的样品,否则将索赔要求三个月内交出一件合格的样品,否则将索赔2
57、0002000元。根据有经验的技术人员估计,试制品合元。根据有经验的技术人员估计,试制品合格的概率为格的概率为0.40.4,每次试制一批的装配费为,每次试制一批的装配费为200200元,元,每件产品的制造成本为每件产品的制造成本为100100元。每次试制的周期为元。每次试制的周期为1 1个月。问该如何安排试制,每次生产多少件,才个月。问该如何安排试制,每次生产多少件,才能使得期望费用最小?能使得期望费用最小? 管管 理理 运运 筹筹 学学63离散随机性动态规划离散随机性动态规划 解:把三次试制当作三个阶段解:把三次试制当作三个阶段k=1,2,3k=1,2,3), ,决决策变量策变量xkxk表示
58、第表示第k k次生产的产品的件数;状态变量次生产的产品的件数;状态变量sksk表示第表示第k k次试制前是否已经生产出合格品,如果次试制前是否已经生产出合格品,如果有合格品,则有合格品,则sk=0sk=0;如果没有合格品,记;如果没有合格品,记sk=1sk=1。最。最优函数优函数fk(sk)fk(sk)表示从状态表示从状态sksk、决策、决策xkxk出发的第出发的第k k阶阶段以后的最小期望费用。故有段以后的最小期望费用。故有fk(0)fk(0)0 0。 生产出一件合格品的概率为生产出一件合格品的概率为0.40.4,所以生产,所以生产xkxk件产品都不合格的概率为件产品都不合格的概率为 ,至少
59、有一件合格品,至少有一件合格品的概率为的概率为1- 1- ,故有状态转移方程为,故有状态转移方程为 kx6 . 0kkxkxkspsp6 . 01)0(6 . 0) 1(11kx6 . 0管管 理理 运运 筹筹 学学64离散随机性动态规划离散随机性动态规划 用C(xk)表示第k阶段的费用,第k阶段的费用包括制造成本和装配费用,故有 根据状态转移方程以及C(xk),可得到 0002)(kkkkxxxxC)1 (6 . 0)0()6 . 01 ()(min) 1 (11kxkxkxkffxcfkkk)1 (6 . 0)(min1kxkxfxckk管管 理理 运运 筹筹 学学65离散随机性动态规划离
60、散随机性动态规划 如果3个月后没有试制出一件合格品,则要承担2000元的罚金,因此有f4(1)=20。 当k=3时,计算如下表: x3 s3 C(x3)+20f3(s3) x3* 0 1 2 3 4 5 6 0 0 0 0 1 20 1511.2 9.32 8.59 8.56 8.93 8.56 5 0.63x管管 理理 运运 筹筹 学学66离散随机性动态规划离散随机性动态规划当k=2时,计算如下表: x2 s2 C(x2)+8.56f2(s2) x2* 0 1 2 3 4 0 0 0 0 18.56 8.14 7.08 6.85 7.11 6.85 3 0.62x管管 理理 运运 筹筹 学学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水产苗种病害防治措施
- 消防安全演练操作规程
- 港口维护脚手架租赁协议
- 展厅装修合同模板
- 赔偿协议书范本自愿赔偿
- 商务酒店无障碍设施建设指南
- 教育培训管理创新策略
- 建筑工程加固新施工合同范本
- 冷冻食品库房虫害防治策略
- 旅游公司客户隐私保密规则
- 精准医疗研究
- 电厂打磨施工方案
- 社区生鲜店的O2O模式-社区O2O电商模式研究-生鲜店为例课件
- 2023-2024学年常州溧阳市九年级上学期期中考试数学试卷(含解析)
- 第4章无人机-气象
- 冀教版四年级英语上册《Goldilocks and the Three Bears》教学课件公开课
- 干部履历表格式
- 《老年人康乐活动》课件
- 银行与信托行业营销方案
- 哈尔滨工业大学介绍
- 部编版八年级历史上册《戊戌变法》评课稿
评论
0/150
提交评论