随机决策上课用_第1页
随机决策上课用_第2页
随机决策上课用_第3页
随机决策上课用_第4页
随机决策上课用_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 随机型决策分析方法 Random Decision Analysis王照良数学与信息科学学院主要内容随机型决策问题 风险型决策方法 非确定型决策方法 www.hpu.河南理工大学数学与信息科学学院第一节 随机型决策问题决策的基本概念随机型决策问题www.hpu.河南理工大学数学与信息科学学院 一般来说,凡是根据预定的目标做出的任何行动决定,都可以称之为决策。 几个关于决策的概念:决策问题 在实际生产或生活问题中,对于一个需要处理的事件,面临几种客观条件,又有几种可供选择的方案,这就构成了一个决策问题。 一、决策的基本概念www.hpu.河南理工大学数学与信息科学学院行动方案 在决策问题中,那

2、些可供选择的方案就称之为行动方案,简称方案或策略,有时也称为方案变量或决策变量。 状态概率 指在决策问题中,每一种自然状态出现的概率。 自然状态 在决策问题中,决策者所面临的每一种客观条件就称之为一个自然状态,简称状态或条件,有时也称为状态变量。 www.hpu.河南理工大学数学与信息科学学院益损值 指每一种行动方案在各种自然状态下所获得的报酬或者需要付出的损失(成本、代价)。最佳决策方案 就是依照某种决策准则,使决策目标取最优值(譬如,收益最大值或者成本最小值)的那个(些)行动方案。www.hpu.河南理工大学数学与信息科学学院例1:根据自然条件,某农场可以选择种植的农作物有4种:水稻、小麦

3、、大豆、燕麦。该农场所在地区每一年可能发生的天气类型有5种:极旱年、旱年、平年、湿润年、极湿年。表1给出了每一种天气类型发生的概率,以及在每一种天气类型条件下种植各种农作物所获得的收益。该农场究竟应该种植哪一种农作物?www.hpu.河南理工大学数学与信息科学学院表1 每一种天气类型发生的概率及 种植各种农作物的收益 www.hpu.河南理工大学数学与信息科学学院 该例所描述的就是一个决策问题。在这一个决策问题中,各种天气类型就是自然状态,共有5种状态,即“极旱年”、“旱年”、“平年”、“湿润年”、“极湿年”,各状态发生的概率,即状态概率分别为0.1,0.2,0.4,0.2,0.1;各农作物种

4、类就是行动方案,共有4种方案,即“水稻”、“小麦”、“大豆”、“燕麦”;在每一种状态下,各方案的益损值就是在每一种天气类型下各种农作物的收益值。 www.hpu.河南理工大学数学与信息科学学院 二、 随机型决策问题(一)决策问题的基本类型 根据人们对决策问题的自然状态的认识程度,可以把决策问题划分为两种基本类型,即确定型决策问题和随机型决策问题。www.hpu.河南理工大学数学与信息科学学院确定型决策问题 指决策者已经完全确切地知道将发生什么样的自然状态,从而可以在既定的状态下选择最佳行动方案。 也就是说,对于确定型决策问题而言,只存在一个唯一确定的自然状态。 对于确定型决策问题,在实际工作中

5、,决策者所面临的方案数目可能是很大的,最佳决策方案的选择往往需要采用各种规划方法(如线性规划、目标规划等)才能实现。www.hpu.河南理工大学数学与信息科学学院例:某人得到一小笔奖金200 元,他可以用这些钱买一份礼物送给父母,以示孝心;或者可以给儿子买他向往已久的玩具汽车;或者可以一家三口出去吃一顿;或者还可以为自己买些资料;他作出一个决策,采用了以上的其中一条。比如买礼物送给父母,那么结果就是表示了孝心,这就是一个确定型决策。 www.hpu.河南理工大学数学与信息科学学院随机型决策问题 指决策者所面临的各种自然状态将是随机出现的。 随机型决策问题,必须具备以下几个条件:存在着决策者希望

6、达到的明确目标;存在着不依决策者的主观意志为转移的两个以上的自然状态;存在着两个以上的可供选择的行动方案;不同行动方案在不同自然状态下的益损值可以计算出来。www.hpu.河南理工大学数学与信息科学学院 随机型决策问题可进一步分为风险型决策问题和非确定型决策问题。 风险型决策问题:每一种自然状态发生的概率是已知的或者可以预先估计的。 非确定型决策问题:各种自然状态发生的概率也是未知的和无法预先估计的。www.hpu.河南理工大学数学与信息科学学院例:一家人要做出周末去公园游玩还是呆在家里看电视的决策,但对此决策有重要影响的客观条件天气,却是不受决策者控制的,这就是一个非确定型决策。 www.h

7、pu.河南理工大学数学与信息科学学院(二)决策问题的分类及特点图9.1.1 www.hpu.河南理工大学数学与信息科学学院第2节 风险型决策方法最大可能法期望值决策法及其矩阵运算树型决策法灵敏度分析法效用分析法www.hpu.河南理工大学数学与信息科学学院 对于风险型决策问题,其常用的决策方法主要有最大可能法、期望值法、灵敏度分析法、效用分析法等。 在对实际问题进行决策时,可以采用各种不同方法分别进行计算、比较,然后通过综合分析,选择最佳的决策方案,这样,往往能够减少决策的风险性。www.hpu.河南理工大学数学与信息科学学院一、最大可能法 一、最大可能法 在解决风险型决策问题时,选择一个概率

8、最大的自然状态,把它看成是将要发生的唯一确定的状态,而把其他概率较小的自然状态忽略,这样就可以通过比较各行动方案在那个最大概率的自然状态下的益损值进行决策。这种决策方法就是最大可能法。 www.hpu.河南理工大学数学与信息科学学院应用条件 在一组自然状态中,某一自然状态出现的概率比其他自然状态出现的概率大很多,而且各行动方案在各自然状态下的益损值差别不是很大。实质 在将大概率事件看成必然事件,小概率事件看成不可能事件的假设条件下,将风险型决策问题转化成确定型决策问题的一种决策方法。www.hpu.河南理工大学数学与信息科学学院例:用最大可能法对例1所描述的风险型决策问题求解表1 每一种天气类

9、型发生的概率及种植各种农作物的收益 www.hpu.河南理工大学数学与信息科学学院二、期望值决策法及其矩阵运算期望值决策法 对于一个离散型的随机变量X,它的数学期望为 式中:xi(n=1,2,n)为随机变量x的各个取值;Pi为x=xi的概率,即Pi = P(xi)。 随机变量x的期望值代表了它在概率意义下的平均值。 期望值决策法,就是计算各方案的期望益损值,并以它为依据,选择平均收益最大或者平均损失最小的方案作为最佳决策方案。 www.hpu.河南理工大学数学与信息科学学院期望值决策法的计算、分析过程 把每一个行动方案看成是一个随机变量,而它在不同自然状态下的益损值就是该随机变量的取值; 把每

10、一个行动方案在不同的自然状态下的益损值与其对应的状态概率相乘,再相加,计算该行动方案在概率意义下的平均益损值; 选择平均收益最大或平均损失最小的行动方案作为最佳决策方案。 www.hpu.河南理工大学数学与信息科学学院例:试用期望值决策法求解例1表1 每一种天气类型发生的概率及种植各种农作物的收益 解:(1) E(B4)11.80.1+13.00.2+17.00.4+ 19.00.2+21.00.1=16.48(千元/hm2)同理 E(B1)=16.92(千元/hm2)E(B2)=16.7(千元/hm2)E(B3)=18.3(千元/hm2)www.hpu.河南理工大学数学与信息科学学院表1 风

11、险型决策问题的期望值计算 (2)选择最佳决策方案。 因为E(B3)maxE(Bi)18.3(千元/hm2) 所以,种植大豆为最佳决策方案。www.hpu.河南理工大学数学与信息科学学院决策准则E-V准则E-V准则:用期望与方差(度量风险)共同判决一个方案的优劣。帕累托优:若不存在方案al,使得方案ak的期望与风险均劣于al,称ak为有效方案或帕累托优。评价函数:fi(E,V)=E(ai)+i2。反映了决策人的风险态度,0风险厌恶; =0风险中立(对应于贝叶斯准则); EV1, EV2 EV3,所以,剪掉状态结点V1和V3所对应的方案分枝,保留状态结点V2所对应的方案分枝。即该问题的最优决策方案

12、应该是从国外引进生产线。www.hpu.河南理工大学数学与信息科学学院例4:某企业,由于生产工艺较落后,产品成本高,在价格保持中等水平的情况下无利可图,在价格低落时就要亏损,只有在价格较高时才能盈利。鉴于这种情况,企业管理者有意改进其生产工艺,即用新的工艺代替原来旧的生产工艺。 现在,取得新的生产工艺有两种途径:一是自行研制,但其成功的概率是0.6;二是购买专利,估计谈判成功的概率是0.8。www.hpu.河南理工大学数学与信息科学学院 如果自行研制成功或者谈判成功,生产规模都将考虑两种方案:一是产量不变;二是增加产量。 如果自行研制或谈判都失败,则仍采用原工艺进行生产,并保持原生产规模不变。

13、 据市场预测,该企业的产品今后跌价的概率是0.1,价格保持中等水平的概率是0.5,涨价的概率是0.4。 表3给出了各方案在不同价格状态下的效益值。 试问,对于这一问题,该企业应该如何决策? www.hpu.河南理工大学数学与信息科学学院解:这个问题是一个典型的多级(二级)风险型决策问题,下面仍然用树型决策法解决该问题。 (1)画出决策树(图3)。表3 某企业各种生产方案下的效益值(单位:万元) 方案效益价格状态(概率)www.hpu.河南理工大学数学与信息科学学院www.hpu.河南理工大学数学与信息科学学院 (2) 计算期望效益值,并进行剪枝: 状态结点V7的期望效益值为 EV7(-200)

14、0.1+500.5+1500.465(万元); 状态结点V8的期望效益值为 EV8(-300)0.1+500.5+2500.495(万元)。 由于EV8EV7,所以,剪掉状态结点V7对应的方案分枝,并将EV8的数据填入决策点V4,即令EV4EV895(万元)。www.hpu.河南理工大学数学与信息科学学院 状态结点V3的期望效益值为 EV3(-100)0.1+00.5+1000.430(万元)。 所以,状态结点V1的期望效益值为 EV1=300.2+950.8=82(万元)。www.hpu.河南理工大学数学与信息科学学院 状态结点V9的期望效益值为 EV9(-200)0.1+00.5+2000

15、.460(万元); 状态结点V10的期望效益值为EV10(-300)0.1+(-250)0.5+6000.485(万元)。 由于EV10EV9,所以,剪掉状态结点V9对应的方案分枝,将EV10的数据填入决策点V5。 即令EV5EV1085(万元)。www.hpu.河南理工大学数学与信息科学学院状态结点V6的期望效益值为 EV6(-100)0.1+00.5+1000.430(万元), 所以,状态结点V2期望效益值为 EV2=300.4+850.6=63(万元)。www.hpu.河南理工大学数学与信息科学学院 由于EV1EV2, 所以,剪掉状态结点V2对应的方案分枝将EV1的数据填入决策点EV,即

16、令 EVEV182(万元)。 综合以上期望效益值计算与剪枝过程可知,该问题的决策方案应该是:首先采用购买专利方案进行工艺改造,当购买专利改造工艺成功后,再采用扩大生产规模(即增加产量)方案进行生产。www.hpu.河南理工大学数学与信息科学学院四、灵敏度分析法 对于风险型决策问题,其各个方案的期望益损值是在对状态概率预测的基础上求得的。由于状态概率的预测会受到许多不可控因素的影响,因而基于状态概率预测结果的期望益损值也不可能同实际完全一致,会产生一定的误差。 这样,就必须对可能产生的数据变动是否会影响最佳决策方案的选择进行分析,这就是灵敏度分析。 灵敏度分析www.hpu.河南理工大学数学与信

17、息科学学院例5:某企业拟扩大产品产量,现有两种方案可供选择:一是新建生产线;二是改造生产线。该企业管理者经过研究,运用期望值决策法编制出决策分析表(表4)。由于市场情况极其复杂,它受许多不可控因素的影响,因而销售状态的概率可能会发生变化。试针对这种情况,进行灵敏度分析。 表4 某企业扩大产品产量决策分析表 www.hpu.河南理工大学数学与信息科学学院解:(1)以最大期望效益值为准则确定最佳方案。 E(A1)maxE(A1),E(A2)=290万元,所以,新建生产线(B1)为最佳方案。 (2)灵敏度分析。当考虑市场销售状态中适销的概率由0.7变为0.3时,则两个方案的期望效益值的变化为 E(B

18、1)10万元, E(B2)20万元。 www.hpu.河南理工大学数学与信息科学学院 所以,在0.7与0.3之间一定存在一点P,当适销状态的概率等于P时,新建生产线方案与改造原生产线方案的期望效益值相等。P称为转移概率500P+(1-P)(-200)=300P+(1-P)(-100) P0.33 所以,当P0.33时,新建生产线(B1)为最佳方案; 当P0,(AkAl)=0(kl);j(Aj)=S。称Aj是样本空间的一个划分。则对任一事件B,有:www.hpu.河南理工大学数学与信息科学学院贝叶斯定理:已知(B|Aj)、(Aj)(先验概率) (j=1,n),求当事件B发生(随机试验的结果或观察

19、值)时Ak发生的概率(后验概率)。贝叶斯定理在决策分析中的意义:在实际决策中,我们需要准确估计的随机变量是未来的自然状态,而通过随机试验所观察到的往往是与之相关的另一个随机变量。例如,疾病诊断往往是通过观察症状如发烧、咳嗽等来判断其疾病如感冒、甲流。贝叶斯定理可以帮助我们判断当出现发烧时患甲流的概率。贝叶斯决策分析贝叶斯定理www.hpu.河南理工大学数学与信息科学学院例:经临床观察,患甲流的病人约70%发烧超过38度,患感冒的病人约40%发烧超过38度,而肺炎病人中有60%发烧超过38度。统计表明当前甲流发病率约15,感冒7 ,肺炎1 。现有一病人发烧超过38度,请诊断该病人最可能患上哪种疾

20、病。解:记发烧超过38度的事件为X;患甲流、感冒、肺炎分别记为A、B、C。先验概率分别为(A)=0.015, (B)=0.007, (C)=0.001。条件概率分别为(X|A)=0.7;(X|B)=0.4;(X|C)=0.6。则(X)=0.70.015+0.40.007+0.60.001=0.0139(A|X)=0.70.015/0.0139=75.54%(B|X)=0.40.007/0.0139=20.14%(C|X)=0.60.001/0.0139=4.32%贝叶斯决策分析贝叶斯定理www.hpu.河南理工大学数学与信息科学学院贝叶斯风险:当决策人通过随机试验得到观察值x后,需要根据观察值

21、和某种决策准则选择行动a,即a=(x)。对于自然状态及其先验概率(),采取策略时损失函数l(,(x)对随机试验结果x和自然状态的期望值称为贝叶斯风险,记为r()。r()=E(Ex(l(,(x)=xl(,(x)p(x|)()贝叶斯规则(正规型):若策略空间存在某个策略*,使得对于任意其他策略,均有r(*) r(),则称*为贝叶斯规则或贝叶斯策略。即r(*)=minr()贝叶斯决策分析贝叶斯定理www.hpu.河南理工大学数学与信息科学学院贝叶斯规则(扩展型):在实际应用中,当行动集、状态集、观察值集中的元素较多时,策略集很大,获得r()的最小值很困难,因此可对r()的计算公式进行变换:r()=x

22、l(,(x)p(x|)()=x l(,(x)p(x|)()若使 l(,(x)p(x|)()达到极小,r()必然达到最小又(x)0,所以可使 l(,(x)p(x|)()/(x)达到极小后验概率(|x)=p(x|)()/(x),因此r()的极小化问题转变为求 l(,(x)(|x)的极小化问题。贝叶斯决策分析贝叶斯定理www.hpu.河南理工大学数学与信息科学学院扩展型贝叶斯分析过程原始信息: 先验分布()追加样本信息: 观察值x贝叶斯定理: 后验概率(|x)求*: 计算r(),找出使后验期望损失最小的贝叶斯决策分析贝叶斯定理www.hpu.河南理工大学数学与信息科学学院信息的价值:随机试验获得观察

23、值x是需要成本的,而观察值x也可以帮助我们减少决策损失。那么随机试验观察到的信息有多大价值呢?假设我们未进行任何观察,那么根据贝叶斯准则,最小决策损失期望为:min E(li(,ai)若试验获得了观察值x,则最小贝叶斯风险即为最小决策损失:min r()观察信息的期望价值为: min E(li(,ai) - min r()j123E(ai)(j)a17344.1a26.5413.6a36503.7贝叶斯决策分析贝叶斯定理www.hpu.河南理工大学数学与信息科学学院例: (油井钻探问题)某公司拥有一块可能有油的土地,公司或自己开采,或以以下两种模式出租:无条件出租,租金45万

24、元;有条件出租,产量在20万桶或以上时,每桶提成5元;产量不足20万桶不提成。设钻井费用为75万元,采油设备费25万元(有油时),油价为15元/桶。假设油产量的可能状态及其先验概率分布如表。若决策人风险中立,决策人该选择什么行动?产油量50万桶20万桶5万桶无油j1234(j)50.5贝叶斯决策分析贝叶斯定理www.hpu.河南理工大学数学与信息科学学院解:公司可采取的行动有3种:a1-自己开采;a2-无条件出租;a3-有条件出租。决策表如下(单位:万元):根据贝叶斯准则,方案a1效用最大,故应自己钻井。产油量50万桶20万桶5万桶无油期望效用j1234(j)50.5a1650200-25-7551.25a24545454545a32501000040贝叶斯决策分析贝叶斯定理www.hpu.河南理工大学数学与信息科学学院如果通过地质勘探可以进一步了解该地区的产油情况,那么我们又如何决策?假设勘探成本是12万元,统计表明,产油量与地质构造(共四种类型,用xk表示)间的关系p(xk|j)如下表。产油量50万桶20万桶5万桶无油j1234p(x1|j)7/129/1611/243/16p(x2|j)1/33/161/611/48p(x3|j)1/1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论