第八章-序贯决策_第1页
第八章-序贯决策_第2页
第八章-序贯决策_第3页
第八章-序贯决策_第4页
第八章-序贯决策_第5页
已阅读5页,还剩92页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章第八章 序贯决策分析序贯决策分析广西大学数学与信息科学学院广西大学数学与信息科学学院运筹管理系运筹管理系8.1多阶段决策多阶段决策8.1.1多阶段决策问题多阶段决策问题 决策过程比较复杂;决策过程比较复杂;需要将过程分为若干个相互联系的阶段,需要将过程分为若干个相互联系的阶段,分别对每阶段都做出决策;分别对每阶段都做出决策;各阶段的决策结果前后相互衔接,彼此相各阶段的决策结果前后相互衔接,彼此相互关联,前阶段决策结果影响后阶段决策目互关联,前阶段决策结果影响后阶段决策目标,后阶段决策状态又依赖于前阶段状态设标,后阶段决策状态又依赖于前阶段状态设置;置;各个阶段决策形成一个完整的决策过程各

2、个阶段决策形成一个完整的决策过程(序列);(序列);8.1多阶段决策多阶段决策8.1.1多阶段决策问题多阶段决策问题 决策者关心的是整个决策过程的总体效应,决策者关心的是整个决策过程的总体效应,而不单是各阶段的决策结果。而不单是各阶段的决策结果。总之,若一个决策问题需要经过相互衔接、总之,若一个决策问题需要经过相互衔接、相互关联的若干阶段决策才能完成,则自然相互关联的若干阶段决策才能完成,则自然称之为多阶段决策。称之为多阶段决策。8.1多阶段决策多阶段决策8.1.2多阶段决策方法及其应用实例多阶段决策方法及其应用实例多阶段决策分析的步骤多阶段决策分析的步骤适当地划分阶段;适当地划分阶段;确定各

3、阶段的状态变量,寻找各阶段之间确定各阶段的状态变量,寻找各阶段之间的联系;的联系;从后到前用从后到前用逆序归纳法逆序归纳法进行决策分析,每进行决策分析,每一阶段决策可采用各种单阶段决策方法。一阶段决策可采用各种单阶段决策方法。主要方法是决策树方法和动态规划方法。主要方法是决策树方法和动态规划方法。8.1多阶段决策多阶段决策例例8.1 某企业考虑是否花费某企业考虑是否花费1万元购买某新产万元购买某新产品专利。若购买了专利,可进行大批生产品专利。若购买了专利,可进行大批生产( (a1) )、中批生产、中批生产( (a2) ) 或小批生产或小批生产( (a3) ),可能,可能出现的市场销售情况也分为

4、畅销出现的市场销售情况也分为畅销( (1) )、一般一般( (2) )和滞销和滞销( (3 ) )三种。其收益(利润,三种。其收益(利润,万元)矩阵如下表:万元)矩阵如下表:例例8.1为了更正确地掌握市场情况,正式投产公为了更正确地掌握市场情况,正式投产公司打算先生产少量产品试销,试销费需要司打算先生产少量产品试销,试销费需要5000元。试销结果分为产品受欢迎元。试销结果分为产品受欢迎( (H1) ),一般一般( (H2) )和不受欢迎和不受欢迎( (H3) )三种。三种。由于试销面不宽,试销结果的准确性有限。由于试销面不宽,试销结果的准确性有限。其准确度(似然分布矩阵)见下表:其准确度(似然

5、分布矩阵)见下表:例例8.1如不买此项专利,把这笔费用用在其他方如不买此项专利,把这笔费用用在其他方面,在同样的时期可获利面,在同样的时期可获利1.1万元。那么,万元。那么,该公司应该如何决策?该公司应该如何决策?(1)是否买专利?)是否买专利?(2)如果买专利,是否采取试销办法?)如果买专利,是否采取试销办法?(3)如果不试销,应大批生产,中批生产还)如果不试销,应大批生产,中批生产还是小批生产?如果试销,又应该如何根据是小批生产?如果试销,又应该如何根据试销结果决定其行动?试销结果决定其行动? 第一阶段第一阶段127买专利买专利不买专利不买专利试销试销不试销不试销3456H1H2H3891

6、0a1a2a3123(略)(略)第二阶段第二阶段第三阶段第三阶段例例8.1例例8.1 3 , 2 , 1)()/(31 ipHpHpjjjii 解:这是一个三阶段决策问题,采用解:这是一个三阶段决策问题,采用逆序归逆序归纳法进行决策分析,先要计算在一定的试销纳法进行决策分析,先要计算在一定的试销结果下的各后验概率。由全概率公式:结果下的各后验概率。由全概率公式:计算得计算得: 17. 039. 044. 0321 HpHpHp例例8.1再再由贝叶斯公式:由贝叶斯公式:计算得计算得: )()()/(/ijjiijHppHpHp 321321294. 0076. 0046. 0353. 0462.

7、 0136. 0353. 0462. 0818. 0/HHHHpij 例例8.1v当试销结果为当试销结果为 H1时:时: (万元)(万元)406. 3046. 0)3(136. 02818. 04/11 HaE (万元)(万元)77. 2046. 0)2(136. 03818. 03/12 HaE 万元)万元)( 1046. 01136. 01818. 01/13 HaE故当试销结果为故当试销结果为 H1时,应选择大批生产时,应选择大批生产a1,截,截去方案去方案a2、a3,结点结点4的值为的值为3.406万元万元。-结点结点8-结点结点9-结点结点10例例8.1v当试销结果为当试销结果为 H

8、2时:时: (万元)(万元)544. 2076. 0)3(462. 02462. 04/21 HaE (万元)(万元)62. 2076. 0)2(462. 03462. 03/22 HaE (万元)(万元)1462. 01462. 01462. 010/23 HaE故当试销结果为故当试销结果为 H2时,应选择中批生产时,应选择中批生产a2,截,截去方案去方案a1、a3 ,结点结点5的值为的值为2.62万元万元 。例例8.1v当试销结果为当试销结果为 H3时:时: (万元)(万元)236. 1294. 0)3(353. 02353. 04/31 HaE (万元)(万元) 53. 1294. 0)

9、2(353. 03353. 03/32 HaE (万万元元)1294. 01353. 01353. 01/33 HaE故当试销结果为故当试销结果为 H3时,也应选择中批生产时,也应选择中批生产a2,截去方案截去方案a1、a3 ,结点结点6的值为的值为1.53万元万元 。例例8.1v试销收益期望值:试销收益期望值: (万元)(万元)78054. 217. 053. 139. 062. 244. 0406. 3/322212321 HpHaEHpHaEHpHaEE 万元)万元)(7 . 21 . 0)3(3 . 026 . 041 aE 万万元元)(11 .013 .016 .013 aE故当不试

10、销时,应选择大批生产故当不试销时,应选择大批生产a1,截去方案,截去方案a2、a3 ,结点结点7的值为的值为2.7万元万元。v不试销的收益期望值:不试销的收益期望值: 万万元元)(5 . 21 . 0)2(3 . 036 . 032 aE-结点结点3例例8.1决策:(决策:(1)购买专利;)购买专利;(2)不试销;)不试销;(3)大批生产)大批生产a2。截去不买专利方案,截去不买专利方案,结点结点1的值为的值为1.7万元万元 。v试销收益期望值扣除试销费用试销收益期望值扣除试销费用5000元后小于元后小于不试销的收益值,截去试销方案,不试销的收益值,截去试销方案,结点结点2的值的值为为2.7万

11、元万元。第一阶段第一阶段127买专利买专利不买专利不买专利试销试销不试销不试销3456H10.44H2 0.39H3 0.178910a1a2a30.8180.1360.046(略)(略)第二阶段第二阶段第三阶段第三阶段例例8.14万元万元2万元万元3万元万元1.1万元万元3.406万万2.77万万1万万3.406万万2.62万万1.53万万2.78054万万-0.5万万2.7万万2.7万万-1万万1.7万万8.1多阶段决策多阶段决策有一类多阶段决策问题,在进行决策后又有一类多阶段决策问题,在进行决策后又产生一些新情况,需要进行新的决策,接产生一些新情况,需要进行新的决策,接着又有一些新的情况

12、,又需要进行新的决着又有一些新的情况,又需要进行新的决策。这样决策、情况、决策策。这样决策、情况、决策,就构成一,就构成一个序列,这就是个序列,这就是序列决策序列决策。特点:特点:决策次数事前并不明确,决策阶段决策次数事前并不明确,决策阶段划分次数依赖于决策过程中出现的特殊状划分次数依赖于决策过程中出现的特殊状况。况。仍可用决策树法解这类问题,关键是:仍可用决策树法解这类问题,关键是:确确定一个决策序列终止的原则。定一个决策序列终止的原则。【例【例8.2】某厂家的产品装箱出厂,每箱有产品某厂家的产品装箱出厂,每箱有产品1000件,产品的次品率有件,产品的次品率有0.01,0.40,0.90三种

13、三种可能,相应概率分别为可能,相应概率分别为 0.2,0.6,0.2。有。有两种产品检验方案:两种产品检验方案:整箱检验整箱检验(a1),检验费,检验费100元;元;不作整箱检验不作整箱检验(a),在销售中若顾客发现次,在销售中若顾客发现次品,允许调换并赔偿,每件损失品,允许调换并赔偿,每件损失0.25元。元。【例【例8.2】为了更好地选择检验方案,可先从任意一为了更好地选择检验方案,可先从任意一箱中随机地箱中随机地抽取一件抽取一件产品作为样品。产品作为样品。第一次抽样后,可继续进行第二次、第三第一次抽样后,可继续进行第二次、第三次等若干次抽样,每次抽样成本均为次等若干次抽样,每次抽样成本均为

14、4.2元,元,样本容量均为样本容量均为1。试进行序列决策:试进行序列决策:(1)是否需要抽样?(若需要,抽样几次?)是否需要抽样?(若需要,抽样几次?)(2)在抽样或不抽样的前提下,采用何种方)在抽样或不抽样的前提下,采用何种方案进行检验?案进行检验?【例【例8.2】 解:解: 1,2,3分别表示产品次品率为分别表示产品次品率为 0.01 ,0.4,0.9三种状态。对于抽样检验一件产品,三种状态。对于抽样检验一件产品,X=1和和X=0分别表示样品为次品和合格品两个分别表示样品为次品和合格品两个结果。结果值均用期望损失值表示。结果。结果值均用期望损失值表示。序列决策树图不能够一次绘制成功,而是随

15、着序列决策树图不能够一次绘制成功,而是随着决策过程序列的延伸和终止依次进行。为了简决策过程序列的延伸和终止依次进行。为了简化图形,行动方案化图形,行动方案al和和a2、可能出现的状态及、可能出现的状态及其对应的损失值均在图中略去,仅在方案枝末其对应的损失值均在图中略去,仅在方案枝末端标注上期望损失值。端标注上期望损失值。4532867抽样抽样继续抽样继续抽样a1a2A1A2A3A4不抽样不抽样X1=0X1=1停止抽样停止抽样9X2=0X2=1a1a2继续抽样继续抽样停止抽样停止抽样(略)(略)【例【例8.4】相应的损失矩阵为相应的损失矩阵为 12500005 .97)(32ijrR先进行第一次

16、抽样的后验概率计算先进行第一次抽样的后验概率计算 3111)()|0()0(jjjpxpXP 2 . 010. 06 . 060. 02 . 099. 0 578. 0 2251001001005 . 2100)(32ijqQ该问题的费该问题的费用矩阵为:用矩阵为:【例【例8.2】3426. 0578. 02 . 099. 0)0()()|0()0|(111111 XPPXpXP 6228. 0578. 06 . 060. 0)0()()|0()0|(122112 XPPXPXP 0346. 0578. 02 . 010. 0)0()()|0()0|(133113 XPPXPXP 3111)(

17、)|1()1(jjjPXPXP 2 .090.06 .040.02 .001.0 422.0 【例【例8.2】0047. 0422. 02 . 001. 0)1()()|1()1|(111111 XPPXPXP 5687. 0422. 06 . 040. 0)1()()|1()1|(122112 XPPXPXP 4265. 0422. 02 . 090. 0)1()()|1()1|(133113 XPPXPXP 第一次抽样的后验概率矩阵为第一次抽样的后验概率矩阵为 4265.05687.00047.00346.06228.03426.0)|(3211 XP01 X11 X【例【例8.2】后验行

18、动方案的期望损失值矩阵为后验行动方案的期望损失值矩阵为)|()|(11XPRXaR 4265. 05687. 00047. 00346. 06228. 03426. 012500005 .97 31.53325. 44582. 040.3321aa01 X11 X一次抽样后最满一次抽样后最满意方案分别为:意方案分别为:11)1(aXa 21)0(aXa 6.894.3250.458219.52.6933.404.3250.458253.3119.525抽样抽样a1a2a1a2a1a2A1A2A3A4S1S2不抽样不抽样X1=0X1=10.5780.4220.34260.62280.03460.

19、34260.56870.42650.00470.56870.42650.20.60.20.00470.56870.42650.20.20.697.5000012597.5000012597.50000125期望损失值(包含抽样费用)4.20 若为正品,则无若为正品,则无须检验整箱产品;须检验整箱产品; 若为次品,则整若为次品,则整箱检验。箱检验。最满意方案是,应抽取一件产品作样品检验。最满意方案是,应抽取一件产品作样品检验。【例【例8.2】在在A2上上X1=1的决策点处,由于行动方案的决策点处,由于行动方案a1的的期望损失值期望损失值0.4582已小于抽样费用已小于抽样费用4.20,所,所以第

20、二次抽样分支以第二次抽样分支S2在此处被截断,决策序在此处被截断,决策序列在该分支上终止。列在该分支上终止。而在而在Xl0的决策点处,由于行动方案的决策点处,由于行动方案al,a2。的期望损失值分别为的期望损失值分别为33.40和和4.324,均大于,均大于抽样费用抽样费用4.20,因此,在此分支上,可进行,因此,在此分支上,可进行第二次抽样,抽样结果用第二次抽样,抽样结果用X2表示。表示。X20和和X2=1分别表示第二次抽样抽取一个分别表示第二次抽样抽取一个样品为正品和次品。样品为正品和次品。 【例【例8.2】第二次抽样的后验概率计算如下:第二次抽样的后验概率计算如下:0346. 010.

21、06228. 06 . 03426. 099. 0 311212)0|()|0()0|0(jjjXPXPXXP 0346. 010. 06228. 06 . 03426. 099. 0 7163. 0 4735. 07163. 03426. 099. 0)0|(21 XP 5217. 07163. 06228. 060. 0)0|(22 XP 0048. 07163. 00346. 010. 0)0|(23 XP 【例【例8.2】 311212)0|()|1()0|1(jjjXPXPXXP 0346. 090. 06228. 040. 03426. 001. 0 2837.0 0121. 02

22、837. 03426. 001. 0)1|(21 XP 8781. 02837. 06228. 040. 0) 1|(22 XP 1098. 02837. 00346. 090. 0) 1|(23 XP 【例【例8.2】第二次抽样的第二次抽样的后验概率矩阵为后验概率矩阵为 1098. 08781. 00121. 00048. 05217. 04735. 0)|(3212 XP02 X12 X后验行动方案的期望损失值矩阵为后验行动方案的期望损失值矩阵为 )|()|(22XPRXaR 1098. 00048. 08781. 05217. 00121. 04735. 012500005 .97 73

23、.136038. 01778. 117.4621aa02 X12 X二次抽样后最满二次抽样后最满意方案分别为:意方案分别为:12)1(aXa 22)0(aXa 【例【例8.2】由于由于X2=0在的决策点处,方案在的决策点处,方案a2的期望损失值的期望损失值0.6038已小于抽样费用已小于抽样费用4.20,则序列决策的这,则序列决策的这一分支应该终止。同样,对于一分支应该终止。同样,对于X2=1决策点处,决策点处,由于方案由于方案a1的期望损失值的期望损失值1.1778也小于抽样费也小于抽样费用,则这一分枝也应终止。于是,到此决策用,则这一分枝也应终止。于是,到此决策序列全部终止。序列全部终止。

24、 【例【例8.2】4.20a1a2s1a1a2s2X1=02533.44.3254.2019.50.578a1a2s3X2=046.170.60384.200.7163a1a2s3X1=113.734.200.28371.1778a1a2s2X1=113.734.200.4220.4582A1A2A3S1S26.892.694.3250.45820.76664.3251.1778【例【例8.2】在在A3上上 X2=0的决策点处,最满意行动方案的决策点处,最满意行动方案为为a2 ,截去,截去a1和和 s3;在在 X2=1的决策点处,最满意行动方案为的决策点处,最满意行动方案为 a1,截去截去 a

25、2和和 s3。在在 s2状态点处,期望损失值为:状态点处,期望损失值为: )(7666. 02837. 01778. 17163. 06038. 0元元 【例【例8.2】在在A2上上 X1=0的决策点处,最满意行动方案的决策点处,最满意行动方案为为a2 ,截去,截去a1和和 s2;在在 X1=1的决策点处,最满意行动方案为的决策点处,最满意行动方案为 a1,截去截去 a2和和 s2。在在 s1状态点处,期望损失值为:状态点处,期望损失值为: (元元)69. 2422. 04582. 0578. 0325. 4 在在A1决策点处,最满意方案的期望损失值为:决策点处,最满意方案的期望损失值为: )

26、(89. 62 . 469. 2元元 所以截去所以截去a1和和a2。 【例【例8.2】综上所述,决策是:应该进行一次抽样检验。综上所述,决策是:应该进行一次抽样检验。v若为正品,则采取行动方案若为正品,则采取行动方案a2,即整箱产品,即整箱产品不予检验;不予检验;v若为次品,则采取行动方案若为次品,则采取行动方案a1,即整箱产品,即整箱产品予以检验,序列决策过程也可以用简化决策树予以检验,序列决策过程也可以用简化决策树图表示。图表示。6.892.694.204.3250.4582s10.5780.422a1a24.3250.46218.2马尔可夫决策马尔可夫决策研究这样的一类决策问题:研究这样

27、的一类决策问题:采取的行动已经确定,但将这个行动付诸采取的行动已经确定,但将这个行动付诸实践的过程又分为几个时期。在不同的时实践的过程又分为几个时期。在不同的时期,系统可以处在不同的状态,而这些状期,系统可以处在不同的状态,而这些状态发生的概率又可受前面时期实际所处状态发生的概率又可受前面时期实际所处状态的影响。态的影响。其中一种最简单、最基本的情形,是每一其中一种最简单、最基本的情形,是每一时期状态参数的概率分布只与这一时期的时期状态参数的概率分布只与这一时期的前一时期实际所处的状态有关,而与更早前一时期实际所处的状态有关,而与更早的状态无关,这就是所谓的马尔可夫链。的状态无关,这就是所谓的

28、马尔可夫链。8.2马尔可夫决策马尔可夫决策8.2.1马尔可夫决策问题马尔可夫决策问题马氏过程马氏过程马尔科夫(马尔科夫( M . A . Markov )提出一种描述)提出一种描述系统状态转移的数学模型,称为马尔科夫系统状态转移的数学模型,称为马尔科夫过程,简称马氏过程。过程,简称马氏过程。马氏决策马氏决策利用马氏过程分析系统当前状态并预测未利用马氏过程分析系统当前状态并预测未来状态的决策方法,称为马尔科夫决策,来状态的决策方法,称为马尔科夫决策,简称马氏决策。简称马氏决策。8.2马尔可夫决策马尔可夫决策8.2.2马尔可夫链与转移概率矩阵马尔可夫链与转移概率矩阵马尔可夫性。马尔可夫性。含义:含

29、义:8.2.2马尔可夫链与转移概率矩阵马尔可夫链与转移概率矩阵)(对所有(对所有)(对所有(对所有jipipijjij,01 8.2.2马尔可夫链与转移概率矩阵马尔可夫链与转移概率矩阵马尔可夫链定义马尔可夫链定义如果随机过程如果随机过程Xt, t=1,2, ,满足下述性质,满足下述性质,则称则称Xt是一个有限状态的马尔可夫是一个有限状态的马尔可夫(Markov)链。)链。(1)具有有限种状态;)具有有限种状态;(2)具有马尔可夫性;)具有马尔可夫性;(3)转移概率具有平稳性。)转移概率具有平稳性。8.2马尔可夫决策马尔可夫决策例:例: 某企业为使技术人员具有多方面经验,某企业为使技术人员具有多

30、方面经验,实行技术人员在技术部门、生产部门和销实行技术人员在技术部门、生产部门和销售部门的轮换工作制度。轮换办法采取随售部门的轮换工作制度。轮换办法采取随机形式,每半年轮换一次。初始状态,即机形式,每半年轮换一次。初始状态,即技术人员开始是在某部门工作的概率用技术人员开始是在某部门工作的概率用Pj(0)表示,表示,j1,2,3;pij表示处于第表示处于第i个部门个部门的技术人员在半年后转移到第的技术人员在半年后转移到第j个部门的概个部门的概率。率。8.2马尔可夫决策马尔可夫决策 025. 075. 05 . 05 . 0005 . 05 . 0333231232221131211ppppppp

31、ppP 31,31,31,)0(3)0(2)0(1)0(PPPP问某人开始在第问某人开始在第 部门工作,一年后在第部门工作,一年后在第 部门部门工作的概率是多少?一年后,技术人员在工作的概率是多少?一年后,技术人员在3个个部门工作的概率各为多少?部门工作的概率各为多少?8.2马尔可夫决策马尔可夫决策)2(ijp5 . 025. 005 . 05 . 05 . 05 . 0321322121211)2(12 ppppppp若某人开始在第一部门工作,则一年后在第二若某人开始在第一部门工作,则一年后在第二部门工作的概率是部门工作的概率是50%。8.2马尔可夫决策马尔可夫决策一年后技术人员在第一年后技

32、术人员在第j个部门工作的概个部门工作的概率为率为Pj(2) 245,2411,31125. 05 . 0375. 025. 0375. 0375. 025. 05 . 025. 031,31,31025. 075. 05 . 05 . 0005 . 05 . 031,31,31,22)0()2(3)2(2)2(1)2(PPPPPP一年后,技术一年后,技术人员在人员在3个部个部门工作的概率门工作的概率8.2马尔可夫决策马尔可夫决策312321221121)2(21331323121311)2(13321322121211)2(12311321121111)2(11pppppppppppppppp

33、pppppppppppp 从而有从而有 2)2(PPPpij 一般地,有一般地,有 nnijPp )(8.2马尔可夫决策马尔可夫决策8.2.3稳态概率稳态概率 为稳态概率。为稳态概率。 jxPPnnnjnj limlim)( jnnnnjxPixjxP lim|lim0由于初始状态对由于初始状态对n步转移后所处状态的影响随步转移后所处状态的影响随n增大而减少,故:增大而减少,故:因此我们可以从因此我们可以从n步转移矩阵的步转移矩阵的 极限取极限取得稳态概率分布得稳态概率分布 nPPPnn1 PPPnnnn1)(limlim 称称8.2马尔可夫决策马尔可夫决策得得 kkk 111Pkkk 111

34、且且 k 21 P 11 kii 此方程组称为稳态方程。此方程组称为稳态方程。记记则则8.2.4 马尔可夫应用实例马尔可夫应用实例例例8.8 某生产商标为某生产商标为A的产品的厂商为了与另的产品的厂商为了与另外两个生产同类产品外两个生产同类产品B和和C的厂家竞争,有三的厂家竞争,有三种可供选择的措施:种可供选择的措施:( (1) )发放有奖债券;发放有奖债券;( (2) )开展广告宣传;开展广告宣传;( (3) )优质售后服务。三种方案优质售后服务。三种方案分别实施以后,经统计调查可知,该类商品分别实施以后,经统计调查可知,该类商品的市场占有率的转移矩阵分别是的市场占有率的转移矩阵分别是 75

35、. 015. 010. 010. 080. 010. 0025. 0025. 095. 01P 75. 015. 010. 010. 075. 015. 005. 005. 090. 02P 70. 015. 015. 010. 080. 010. 005. 005. 090. 03P例例8.8 75. 015. 010. 010. 08 . 010. 0025. 0025. 095. 0)1(3)1(2)1(1)1(3)1(2)1(1 该类商品的月总销售量为该类商品的月总销售量为1000万件,每件可万件,每件可获利获利1元。另外,三种措施的成本费分别为元。另外,三种措施的成本费分别为150万

36、,万,40万,万,30万。为长远利益考虑,生产万。为长远利益考虑,生产商标为商标为A的产品的厂商应该采取何种措施?的产品的厂商应该采取何种措施?解:解:采取第一种措施的稳态概率采取第一种措施的稳态概率解得:解得:7121432)1(3)1(2)1(1 且且 11 kii 例例8.8112113116)3(3)3(2)3(1 解:解:同理可解出采取第二、第三种措施的稳同理可解出采取第二、第三种措施的稳态概率分别为:态概率分别为:3471743419)2(3)2(2)2(1 计算计算生产生产A的厂商采取三种方案的期望利润如的厂商采取三种方案的期望利润如下:下:因此因此生产生产A的厂商应采取的长期策

37、略为方案的厂商应采取的长期策略为方案(2)。 例例8.9 我国出口某种设备,在国际市场上的销售状我国出口某种设备,在国际市场上的销售状况有两种:畅销和滞销。畅销每年可以获利况有两种:畅销和滞销。畅销每年可以获利100万元,滞销时每年仅获利万元,滞销时每年仅获利30万元。以一万元。以一年为一个时期,如果不采用广告推广产品或年为一个时期,如果不采用广告推广产品或采取广告措施,状态的转移矩阵分别如下采取广告措施,状态的转移矩阵分别如下不采取广告措施不采取广告措施 采取广告措施采取广告措施例例8.9假定上一年处于畅销状态,每年的广告费为假定上一年处于畅销状态,每年的广告费为15万元。为了保证今后万元。

38、为了保证今后3年的利润最大化,是否年的利润最大化,是否应该采用广告措施?应该采用广告措施?解:解:(1)若不采取广告措施若不采取广告措施 376. 0624. 0312. 0688. 0,44. 056. 028. 072. 0,6 . 04 . 02 . 08 . 031211PPP上一年畅销上一年畅销情况下,三年的期望利润总和为:情况下,三年的期望利润总和为:)(56.244)312. 030688. 0100( )28. 03072. 0100()2 . 0308 . 0100(1万万元元 L例例8.9解:解:(1)若采取广告措施若采取广告措施 132. 0868. 0124. 0876

39、. 0,16. 084. 012. 088. 0,3 . 07 . 01 . 09 . 032222PPP上一年畅销上一年畅销情况下,三年的期望利润总和为:情况下,三年的期望利润总和为:)(92.230153)124. 030876. 0100( )12. 03088. 0100()1 . 0309 . 0100(2万万元元 L因此,为使三年所获期望利润最大,在上一年因此,为使三年所获期望利润最大,在上一年畅销畅销情况下,最满意的方案是不采取广告策略。情况下,最满意的方案是不采取广告策略。例例8.10上例中,若每年是否采取广告策略需要依据上上例中,若每年是否采取广告策略需要依据上一年的经营情况

40、而定,应该如何决策?一年的经营情况而定,应该如何决策?解:解:这是一个三阶段决策问题。可画决策树,这是一个三阶段决策问题。可画决策树,用逆序归纳法分析。用逆序归纳法分析。8.3群决策简介群决策简介8.3.1 群决策概念群决策概念群决策也称多人决策,是指由多人参加进行群决策也称多人决策,是指由多人参加进行行动方案的选择活动。行动方案的选择活动。在现实生活中,决策往往是群体行为。原因:在现实生活中,决策往往是群体行为。原因:公正、民主社会的要求;公正、民主社会的要求;集体领导;集体领导;社会的发展与知识的进步,使知识、信息量社会的发展与知识的进步,使知识、信息量急剧增长,决策问题愈来愈多也愈来愈复

41、杂。急剧增长,决策问题愈来愈多也愈来愈复杂。8.3.1群决策概念群决策概念群体决策理论研究的问题一般具有三个前群体决策理论研究的问题一般具有三个前提:提:自主性:自主性:决策者有独立选择机会,其行动决策者有独立选择机会,其行动不受较高层权利的支配,但不排除群体成不受较高层权利的支配,但不排除群体成员间相互影响。员间相互影响。共存性:共存性:决策成员都在已知的共同条件下决策成员都在已知的共同条件下进行选择。进行选择。共意性:共意性:群体做出的必然是所有参与者一群体做出的必然是所有参与者一致能够接受的方案。致能够接受的方案。8.3.1群决策概念群决策概念群体决策研究比个人决策研究复杂。这主要群体决

42、策研究比个人决策研究复杂。这主要由几个因素引起:由几个因素引起:优先度:优先度:集体中每个成员都有各自的目标和集体中每个成员都有各自的目标和优先观念以及不同的效用函数。优先观念以及不同的效用函数。主观概率判断:主观概率判断:群体中各成员由于信息的感群体中各成员由于信息的感受和处理方式不一样,对未来状态出现概率受和处理方式不一样,对未来状态出现概率的估计也不同。的估计也不同。 沟通:沟通:集体决策可以在完全没有沟通信息的集体决策可以在完全没有沟通信息的情况下进行,而更多的决策是在有相互沟通情况下进行,而更多的决策是在有相互沟通信息的情况下进行。信息的情况下进行。8.3.2群体决策的有效程度群体决

43、策的有效程度1、群体决策的有利因素群体决策的有利因素(相比于个人决策)(相比于个人决策)集思广益:群体决策所需运用的知识和信集思广益:群体决策所需运用的知识和信息,可从群体中取得;息,可从群体中取得;参加群体决策的决策者往往也是决策的执参加群体决策的决策者往往也是决策的执行人,因而决策就成为大家的决议,从而行人,因而决策就成为大家的决议,从而能为更多成员所接受。能为更多成员所接受。2、群体决策的不利因素群体决策的不利因素(相比于个人决策)(相比于个人决策)成员在表态时的从众心理(保持沉默,不成员在表态时的从众心理(保持沉默,不愿意提出不同意见,附和多数意见);突愿意提出不同意见,附和多数意见)

44、;突出个人左右决策;成员的出个人左右决策;成员的“固执己见固执己见” 。8.3.2群体决策的有效程度群体决策的有效程度3、群体决策与个人决策的对比、群体决策与个人决策的对比(1)决策的正确性)决策的正确性群体决策比较切合实际群体决策比较切合实际(2)决策的速度)决策的速度群体决策需要比个人决策花费更多的时间群体决策需要比个人决策花费更多的时间 (3)决策的创造性)决策的创造性个人决策具有较大的创造性个人决策具有较大的创造性(4)决策的风险性)决策的风险性会出现群体决策的极化现象会出现群体决策的极化现象8.3.3群决策的分类群决策的分类可根据群中成员的行为将群决策问题分为:可根据群中成员的行为将

45、群决策问题分为:1、集体、集体(collective)决策决策研究各成员间不存在根本利益冲突的群决研究各成员间不存在根本利益冲突的群决策问题,决策追求的是群作为整体的利益。策问题,决策追求的是群作为整体的利益。又可按群的组织结构分为:委员会和递阶的又可按群的组织结构分为:委员会和递阶的权力结构。权力结构。2、冲突分析、冲突分析研究成员间存在利益冲突的对策(博弈)研究成员间存在利益冲突的对策(博弈)问题,群中的成员追求自身的利益和与其问题,群中的成员追求自身的利益和与其他人对立的价值。他人对立的价值。群群决决策策集体集体决策决策冲突冲突分析分析委员会委员会Team Theory一般均一般均衡理论

46、衡理论组织机组织机构决策构决策一般对策论一般对策论协商与谈判协商与谈判主从对策与激励主从对策与激励仲裁与调解仲裁与调解亚对策论亚对策论社会选择社会选择专家判断和专家判断和群体参与群体参与内容及解决办法内容及解决办法投票表决投票表决社会选择函数社会选择函数社会福利函数社会福利函数: : :递阶优化递阶优化组织决策组织决策管理管理: : :8.3.4投票表决投票表决群决策中涉及面最广、最为重要的部分是社群决策中涉及面最广、最为重要的部分是社会选择。会选择。社会选择社会选择是指公众就有关的重要问题,如重是指公众就有关的重要问题,如重要职位的人选,政策的制订乃至国家政治体要职位的人选,政策的制订乃至国

47、家政治体制的确定等等,进行决策。制的确定等等,进行决策。经常采用的社会决策方法是经常采用的社会决策方法是投票表决投票表决和和市场市场机制机制。投票表决常用于政治决策投票表决常用于政治决策市场机制常用作经济决策(是投票的特殊形市场机制常用作经济决策(是投票的特殊形式式以货币投票)以货币投票)8.3.4投票表决投票表决1、非排序式选举:选票上不反映投票人对候、非排序式选举:选票上不反映投票人对候选人的偏好。选人的偏好。(1)只有一人当选的情况只有一人当选的情况采用计点式选举:每个投票人只有一票,以采用计点式选举:每个投票人只有一票,以无记名方式投给自己最中意的候选人。无记名方式投给自己最中意的候选

48、人。简单多数制(相对多数制):超过两个候选简单多数制(相对多数制):超过两个候选人时,该方法不可靠。人时,该方法不可靠。过半数代表制(可能需要二次投票或反复投过半数代表制(可能需要二次投票或反复投票)票)若第一轮投票后无人过半数还可采用取舍表若第一轮投票后无人过半数还可采用取舍表决法:每次淘汰得票数最少的候选人。决法:每次淘汰得票数最少的候选人。简单多数票法则不公平!简单多数票法则不公平!例:例:11个投票人,个投票人,4个候选人(个候选人(a、b、c、d),每个),每个投票人以各候选人的偏好次序如下:投票人以各候选人的偏好次序如下:投票人投票人偏好次序偏好次序b当选当选过半数票原则双如何?过

49、半数票原则双如何?例:例:11个投票人,个投票人,4个候选人(个候选人(a、b、c、d),每个),每个投票人以各候选人的偏好次序如下:投票人以各候选人的偏好次序如下:投票人投票人偏好次序偏好次序b当选当选二次投票的例子二次投票的例子例:例:11个投票人,个投票人,4个候选人(个候选人(a、b、c、d),每个),每个投票人以各候选人的偏好次序如下:投票人以各候选人的偏好次序如下:投票人投票人偏好次序偏好次序第一轮第一轮a、d淘汰淘汰第二轮第二轮c将当选将当选不公平的原因不公平的原因非排序式选举没有充分考虑投票人的偏非排序式选举没有充分考虑投票人的偏好次序,因此无论是按简单多数还是过半好次序,因此

50、无论是按简单多数还是过半数原则,选举结果均不可靠。数原则,选举结果均不可靠。Condorcet原则原则法国数学家康多西特(法国数学家康多西特(M.Condorcet)在)在18世纪就指出:当存在两个以上的候选人时,世纪就指出:当存在两个以上的候选人时,只有一种办法能严格而真实地反映多数成只有一种办法能严格而真实地反映多数成员的意愿员的意愿对候选人进行成对比较,若存对候选人进行成对比较,若存在某个候选人能按过半数原则击败其他所在某个候选人能按过半数原则击败其他所有候选人,则被称为有候选人,则被称为Condorcet候选人,应候选人,应由此人当选。由此人当选。8.3.4投票表决投票表决1、非排序式

51、选举:选票上不反映投票人对候、非排序式选举:选票上不反映投票人对候选人的偏好。选人的偏好。(2)同时有两人或多人当选的情况同时有两人或多人当选的情况一次性非转移式投票表决一次性非转移式投票表决每个投票人只有一票,以无记名方式投给自每个投票人只有一票,以无记名方式投给自己最中意的候选人,按简单多数法确定当选己最中意的候选人,按简单多数法确定当选者。(按得票数从高到低确定当选者)者。(按得票数从高到低确定当选者)复式投票表决复式投票表决每个投票人可投的票数等于当选人数,但对每个投票人可投的票数等于当选人数,但对每个候选人只能投一票。每个候选人只能投一票。(2) 同时有两人或多人当选的情况同时有两人

52、或多人当选的情况受限的投票表决法受限的投票表决法每个投票人可投的票数必须小于当选人数,每个投票人可投的票数必须小于当选人数,但对每个候选人最多只能投一票。但对每个候选人最多只能投一票。累加式投票表决累加式投票表决每个投票人可投的票数等于当选人数,选票每个投票人可投的票数等于当选人数,选票可任意支配,可全部投给某一候选人,也可可任意支配,可全部投给某一候选人,也可随意分配给若干候选人。随意分配给若干候选人。名单制名单制不对候选人投票,而是对政党或组织投票,不对候选人投票,而是对政党或组织投票,根据各政党的得票数分配席位。根据各政党的得票数分配席位。(2) 同时有两人或多人当选的情况同时有两人或多

53、人当选的情况可转移式投票可转移式投票每轮投票中,每个投票人只有一票。第一轮每轮投票中,每个投票人只有一票。第一轮投票后计算:投票后计算:Q投票总数投票总数/( (席位数席位数1) ),得票数得票数Q的候选人均当选,得票数最少者的候选人均当选,得票数最少者淘汰;若有剩余席位,则由未当选者在下一淘汰;若有剩余席位,则由未当选者在下一轮投票中竞争,直到选出全部当选者。轮投票中竞争,直到选出全部当选者。认可选举认可选举只要投票人愿意,他可以投票给尽可能多的只要投票人愿意,他可以投票给尽可能多的候选人,但对每个候选人最多只能投一票。候选人,但对每个候选人最多只能投一票。由得票最多的候选人当选。(若存在由

54、得票最多的候选人当选。(若存在Condorcet候选人,该方法是非排序式选举候选人,该方法是非排序式选举中唯一能定出中唯一能定出Condorcet候选人的方法)候选人的方法)8.3.4投票表决投票表决2、排序式选举:、排序式选举:选票上反映投票人对候选人选票上反映投票人对候选人的偏好,又称偏好选举。的偏好,又称偏好选举。最初由最初由C De Borda(波德)在(波德)在1770年提出年提出波德规则:波德规则:投票人在无记名投票时对各候选投票人在无记名投票时对各候选人排序,如:给其最满意的候选人标人排序,如:给其最满意的候选人标1,排,排名第二的候选人标名第二的候选人标2,投票完成后计数,投票

55、完成后计数(波德数),用以表示群对各候选人的排序。(波德数),用以表示群对各候选人的排序。Condorcet原则:原则:若群中认为候选人若群中认为候选人x优于候优于候选人选人y的人数超过认为候选人的人数超过认为候选人y优于候选人优于候选人x 的人数,则群认为的人数,则群认为x优于优于y;若两者人数相等,;若两者人数相等,则群认为则群认为x与与y无差异。无差异。波德规则波德规则波德规则在实用时亦会出现相悖的情况。波德规则在实用时亦会出现相悖的情况。例例投票人保持对原有各方案的优先顺序,投票人保持对原有各方案的优先顺序,引入不相干的预选方案可能会改变原方案引入不相干的预选方案可能会改变原方案的群排

56、序结果。的群排序结果。原因:原因:波德规则的结果和方案数相关;波德数波德规则的结果和方案数相关;波德数未提供优先强度的信息。未提供优先强度的信息。D4311232414237878Condorcet规则的投票悖论规则的投票悖论例:设例:设60个成员对三个候选人的态度是:个成员对三个候选人的态度是:23人认为人认为a b c,17人人认为认为b c a,2人认为人认为 b a c,8人人认为认为 c b a,10人认为人认为c a b。两两比较得:两两比较得:认为认为a b 的人数为的人数为33人大于人大于认为认为 b a 的人的人数数27人,故群决策人,故群决策a b ;认为认为 b c 的人

57、数为的人数为42人大于人大于认为认为 c b 的的人数人数18人,故群决策人,故群决策b c ;认为认为a c 的人数为的人数为25人小于人小于认为认为 c a 的人的人数数35人,故群决策人,故群决策c a ;群排序不再具群排序不再具有传递性,而有传递性,而是出现多数票是出现多数票循环!循环!8.3.4投票表决投票表决以上各种决策规则都反映了人们对于一种以上各种决策规则都反映了人们对于一种通用的公平的群体决策规则的追求:将个通用的公平的群体决策规则的追求:将个人优先顺序集结为一致认可的群体优先顺人优先顺序集结为一致认可的群体优先顺序。序。但在但在50年代,阿罗年代,阿罗(Arrow)等人证明

58、了社会等人证明了社会选择并不能在完全符合理性的条件下将个选择并不能在完全符合理性的条件下将个人选择顺序集结为群体的选择顺序,少数人选择顺序集结为群体的选择顺序,少数服从多数的规则并不能提供一个令人满意服从多数的规则并不能提供一个令人满意的社会选择顺序。的社会选择顺序。不存在一种能在各种环境条件下运用而不不存在一种能在各种环境条件下运用而不会产生悖论的规则。会产生悖论的规则。8.3.5 常用的群决策方法及应用实例常用的群决策方法及应用实例设群效用函数具有线性表达式:设群效用函数具有线性表达式: niiiXxxuxu1)()( 其中:其中:X为方案集,为方案集,ui(x)为第为第i个决策者已知个决

59、策者已知的效用函数。的效用函数。确定群效用函数的关键,在于确定权数向量确定群效用函数的关键,在于确定权数向量 Tn ,21 8.3.5 常用的群决策方法及应用实例常用的群决策方法及应用实例1、委托求解法、委托求解法假设假设群中各成员对选择权都负有责任;群中各成员对选择权都负有责任;群中各成员对选择权的值各有各的意见。群中各成员对选择权的值各有各的意见。委托过程还必须满足以下三点公设:委托过程还必须满足以下三点公设:(1)委托公设委托公设(2)决策公设决策公设(3)代替公设代替公设1、委托求解法、委托求解法( (1) )委托公设委托公设群的群的n个成员中的每一个人,都有一委托小组,个成员中的每一

60、个人,都有一委托小组,这个小组是由群中其余这个小组是由群中其余n-1个成员组成。成员个成员组成。成员i 对委托小组每个成员对委托小组每个成员j 指定一个权数指定一个权数Pij,有,有), 2 , 1,( , 10njipij 当且仅当当且仅当i=j时,时,pij=0 ,并且,并且 ), 2 , 1( , 11nipnjij (一)委托求解法(一)委托求解法(3) 代替公设代替公设用成员用成员i的委托小组的群效用函数去代替成员的委托小组的群效用函数去代替成员i的的效用函数,每次替代均作为委托求解的一个步效用函数,每次替代均作为委托求解的一个步骤。骤。 ( (2) )决策公设决策公设每个委托小组都

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论