版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五章贝叶斯决策分析§5.1贝叶斯决策的基本方法5.1.1贝叶斯决策的基本方法管理决策的两种偏向:(1)缺少调查,(2)调查费用过高。贝叶斯决策:为了提高决策质量,需要通过市场调查,收集有关状态变量的补充信息,对先验分布进行修正,用后验状态分布进行决策。贝叶斯决策的意义
贝叶斯决策可以做到少花钱多办事,提高决策分析的科学性和效益性。有关的概率公式离散情况 设有完备事件组{θj}(j=1,2,…,n),满足:则对任一随机事件H,有全概率公式:有关的概率公式贝叶斯公式:§5.1贝叶斯决策的基本方法5.1.2贝叶斯决策的基本方法补充信息(信息值) 指通过市场调查分析所获取的补充信息,
用已发生的随机事件H表示,称H为信息值。信息值的可靠程度 用在状态变量θ的条件下,信息值H的条件分布p(H/θ)表示。p129例5.1 某工厂计划生产一种新产品,产品的销售情况有畅销(θ1),滞销(θ2)两种,据以往的经验,估计两种情况发生的概率分布和利润如下表所示:状态θ畅销(θ1)滞销(θ2)概率P(θi)
0.80.2a1
利润(万元)1.5-0.5a2
利润(万元)00 为了进一步摸清市场对这种产品的需求情况,拟聘请某咨询公司进行市场调查和分析,该公司对销售情况预测也有畅销(H1)和滞销(H2)两种,对畅销预测的准确率为0.95,对滞销预测的准确率为0.9:P(Hi/θj)θ1θ2H10.950.10H20.050.90解:1、验前分析记方案a1为生产该新产品,方案a2为不生产。则: E(a1)=1.1(万元),E(a2)=0 记验前分析的最大期望收益值为E1,有:
E1=max{E(a1),E(a2)}=1.1
因此验前分析后的决策为:生产该新产品。即:
aopt=a1E1为不作市场调查的期望收益。2、预验分析:由全概率公式得:2、预验分析:再由贝叶斯公式得:2、预验分析:
用后验分布代替先验分布,计算各方案的期望收益值。当市场调查值为H1(产品畅销)时:aopt(H1)=a1即:市场调查畅销时,最优方案是生产该新产品。2、预验分析:当市场调查值为H2(产品滞销)时:aopt(H2)=a2即:市场调查滞销时,最优方案是不生产该新产品。是否该进行市场调查? 假定咨询公司收费为0.1万元。2、预验分析: 通过调查,该企业可获得的收益期望值为: 通过调查,该企业收益期望值能增加因此,只要调查费用不超过0.0300万元,就应该进行市场调查;否则,则不应进行市场调查。不应进行调查p129例5.13、验后分析:综上所述,在咨询公司收费不超过0.0300万元的情况下,进行市场调查,能使该企业新产品开发决策取得较好的经济效益;否则,不做市场调查。若调查结果是该产品畅销,则应该选择方案a1,即生产新产品;若调查结果是该产品滞销,则应该选择方案a2,即不生产新产品。5.1.2
贝叶斯决策的基本方法离散情形
若θ取n个值θj(j=l,2,…,n),H取m个值Hi(i=1,2,…,m),则信息值的可靠程度对应一个矩阵—贝叶斯决策的似然分布矩阵5.1.2贝叶斯决策的基本方法 利用市场调查获取的补充信息值Hi去修正状态变量θ的先验分布,即依据似然分布矩阵所提供的充分信息,用贝叶斯公式求出在信息值H发生的条件下,状态变量θ的条件分布p(θ/H)。先验概率—p(θ):由以往的数据分析得到的概率;后验概率—p(θ/H):在得到信息之后,重新加以修正的概率。贝叶斯决策的基本步骤1.验前分析依据数据和资料以及经验和判断,去测算和估计状态变量θ的先验分布p(θ);计算各可行方案在不同θ下的条件结果值;根据某种决策准则评价选择,找出最满意方案。2.预验分析 比较分析补充信息的价值和成本的过程。目的:判断是否值得去补充信息?贝叶斯决策的基本步骤2.预验分析判断:如果信息的价值高于其成本,则补充信息给企业带来正效益,应该补充信息.反之,补充信息大可不必。注:如果获取补充信息的费用很小,甚至可以忽略不计,本步骤可以省略,直接进行调查和收集信息,并依据获取的补充信息转入下一步骤。贝叶斯决策的基本步骤3.验后分析利用补充信息修正先验分布,得到更加符合实际的后验分布;再利用后验分布进行决策分析,选出最满意的可行方案;对信息的价值和成本作对比分析,对决策分析的经济效益情况作出合理的说明.验后分析和预验分析的异同:相同:都是通过贝叶斯公式修正先验分布不同:主要在于侧重点不同贝叶斯决策的基本步骤4.序贯分析(主要针对多阶段决策) 指把复杂的决策问题的决策分析全过程划分为若干阶段,每一阶段都包括先验分析、预验分析和验后分析等步骤,每个阶段前后相连,形成决策分析全过程.p132例5.2
某企业为开发某种新产品需要更新设备,有三种方案可供选择:引进大型设备(a1)、引进中型设备(a2)、引进小型设备(a3)。市场对该新产品的需求状态也有三种:需求量大(θ1)、需求量一般(θ2)、需求量小(θ3)。根据市场预测,企业的收益矩阵如下(单位:万元):
根据历年资料,该产品各需求状态的概率分别为p(θ1)=0.3,p(θ2)=0.4,p(θ3)=0.3。为使新产品开发产销对路,拟试销作市场调查,试销结果可能有三种:需求量大(H1)、需求量一般(H2)、需求量小(H3)。调查结果值的可靠性如下表所示:试对该企业新产品开发方案进行决策。P(Hi/θj)θ1θ2θ3H10.60.20.2H20.30.50.2H30.10.30.6解:1、验前分析E1=max{E(a1),E(a2),E(a3)}=17因此验前分析后的决策为:引进大型设备。即:
aopt=a1E1为不进行试销(市场调查)的期望收益。2、预验分析:由全概率公式得:2、预验分析:再由贝叶斯公式得:2、预验分析:
用后验分布代替先验分布,计算各方案的期望收益值。当市场调查值为H1(需求量大)时:P(θj/Hi)θ1θ2θ3H10.560.250.19H20.260.570.17H30.090.360.552、预验分析:当市场调查值为H1(需求量大)时:aopt(H1)=a1即:试销为产品需求量大时,最优方案是引进大型设备。P(θj/Hi)θ1θ2θ3H10.560.250.19H20.260.570.17H30.090.360.55当市场调查值为H2(需求量一般)时:aopt(H2)=a1即:试销为产品需求量一般时,最优方案也是引进大型设备。当市场调查值为H3(需求量小)时:aopt(H3)=a3即:试销为产品需求量小时,最优方案是引进小型设备。3、验后分析: 通过试销,该企业可获得的收益期望值为: 该企业收益期望值能增加:只要试销所需费用不超过2.99万元,就应该进行市场调查;否则,则不应进行试销。3、验后分析:在试销费用不超过2.99万元的情况下,进行试销,能使该企业新产品开发决策取得较好的经济效益;若试销费用不超过2.99万元,则不应进行试销。若试销结果是该产品需求量大或一般,则应该选择方案a1,即引进大型设备;若调查结果是该产品需求量小,则应该选择方案a3,即引进小型设备。§5.2贝叶斯决策信息的价值从前面的分析看出,利用补充信息来修正先验概率,可以使决策的准确度提高,从而提高决策的科学性和效益性。因此,信息本身是有价值的—能带来收益。但获得的情报越多,花费也更多。因此有一个获取补充信息是否有利的问题:收益与成本的比较。问题:如何衡量信息的价值?§5.2贝叶斯决策信息的价值5.2.1完全信息的价值(EVPI)完全情报:指能够提供状态变量真实情况的补充信息。即在获得补充情报后就完全消除了风险情况,风险决策就转化为确定型决策。1.完全信息值 设Hi为补充信息值,若存在状态值θ0,使得条件概率P(θ0/
Hi)=1,或者当状态值θ≠θ0时,总有P(θ/
Hi)=0。则称信息值Hi为完全信息值。(补充信息可靠性100%)5.2.1完全信息的价值(EVPI)2.完全信息值Hi的价值
设决策问题的收益函数为Q=Q(a,θ),其中a为行动方案,θ为状态变量。 若Hi为完全信息值,掌握了Hi的最满意的行动方案为a(Hi),其收益值为 Q(a(Hi),θ)=maxQ(a,θ) 验前最满意行动方案为aopt,其收益值为Q(aopt,θ),则称掌握了完全信息值Hi前后的收益值增量:为在状态变量为θ时的完全信息值Hi的价值。5.2.1完全信息的价值(EVPI)3.完全信息价值 如果补充信息值Hi对每一个状态值θ都是完全信息值,则完全信息值Hi对状态θ的期望收益值称为完全信息价值的期望值(expectedvalueofperfectinformation),简称完全信息价值,记做EVPI。5.2.1完全信息的价值(EVPI)在例5.1中 如果补充信息(咨询公司市场调查)的准确度很高,预测畅销,则100%畅销;预测滞销,则100%滞销;这时:
P(θ1/
H1)=1,P(θ2/
H1)=0
P(θ1/
H2)=0,P(θ2/
H2)=1
则H1(咨询公司预测畅销)、H2(咨询公司预测滞销)都是完全信息值(完全情报)。在例5.1中,若H1、H2都是完全信息值 验前最满意行动方案为a1
(生产新产品)完全信息值H1的价值=1.5-1.5=0完全信息值H2的价值=0-(-0.5)=0.5完全信息价值为:状态θ畅销(θ1)滞销(θ2)概率P(θi)0.80.2a1利润(万元)1.5-0.5a2利润(万元)00求例5.2中完全信息的价值5.2.2补充信息的价值(EVAI)1.补充信息价值 实际工作中取得完全情报是非常困难的。补充信息值Hi的价值:决策者掌握了补充信息值Hi前后期望收益值的增加量(或期望损失值的减少量)。补充信息价值:全部补充信息值Hi价值的期望值,称为补充信息价值的期望值。简称补充信息价值,记做EVAI(ExpectedValueofAdditionalInformation)。例5.1中:验前最满意行动方案为a1
(生产新产品)
E(aopt,θ)=E(a1,θ)=1.1(万元) a(H1)=a1,a(H2)=a2EVAI=1.13-1.1=0.03万元状态θ畅销(θ1)滞销(θ2)概率P(θi)0.80.2a1利润(万元)1.5-0.5a2利润(万元)005.2.3EVAI与EVPI的关系任何补充信息价值都是非负的,且不超过完全信息的价值。即: EVPI≥EVAI≥0信息价值对管理决策的意义任何补充信息决不会降低决策方案的经济效益。完全信息是一类特殊的补充信息,是最有价值的信息。
例
按某工程项目的合同,计划三个月完工,其施工费与工程完工期有关。假定天气是影响工程能否按期完工的决定因素。如果天气好,工程能按时完工,施工单位可获利5万元;如果天气不好,不能按时完工,施工单位就被罚款1万元;若不施工,就要损失窝工费2干元。根据过去的经验,在计划施工期内。天气好的可能性为30%。为了更好地掌握天气情况,施工单位拟从气象台获得该地区过去同一时期的天气预报资料。假定气象台对于好天气的预报正确率为80%,对于坏天气的预报正确率为90%。问应如何决策?天气好的概率:天气不好的概率:天气好而且预报天气也好的概率:天气好而预报天气不好的概率:天气不好而预报天气好的概率:天气不好而且预报天气也不好的概率:
状态收益方案θ1θ20.30.7a150000-10000a2-2023-2023设θ1表示天气好、θ2表示天气坏,H1表示预报天气好、H2表示预报天气坏。0.30.70.80.20.10.9预报天气好的概率:预报天气不好的概率:预报天气好,天气确实也好的概率:预报天气好,而天气实际上不好的概率:预报天气不好,实际上天气好的概率:预报天气不好,实际上天气也不好的概率:0.3×0.8+0.7×0.1=0.311-0.31=0.69(0.8×0.3)/0.31=0.77(0.1×0.7)/0.31=0.23(0.2×0.3)/0.69=0.09(0.9×0.7)/0.69=0.911398不要预报资料要预报资料预报天气好H1预报天气不好H2施工不施工天气好θ18000-10000
500003620036200-2023627天气不好θ21110施工不施工天气好θ1-4600-2023天气不好θ254施工不施工天气好θ1-20008000-2023天气不好θ2-202398420.30.70.770.230.090.910.310.69
50000
50000-10000-10000-2000-20002.贝叶斯决策的优点及其局限性优点:(1)贝叶斯决策能对信息的价值或是否需要采集新的信息做出科学的判断。(2)它能对调查结果的可能性加以数量化的评价,而不是像一般的决策方法那样,对调查结果或者是完全相信,或者是完全不相信。(3)如果说任何调查结果都不可能完全准确,先验知识或主观概率也不是完全可以相信的,那么贝叶斯决策则巧妙地将这两种信息有机地结合起来了。(4)它可以在决策过程中根据具体情况不断地使用,使决策逐步完善和更加科学。局限性:(1)它需要的数据多,分析计算比较复杂,特别在解决复杂问题时,这个矛盾就更为突出。(2)有些数据必须使用主观概率,有些人不太相信,这也妨碍了贝叶斯决策方法的推广使用。§5.3抽样贝叶斯决策问题:如何获取补充信息?主要途径:抽样调查5.3.1抽样贝叶斯决策的基本方法1.抽样贝叶斯决策 利用抽样信息值作为补充信息值,去修正状态变量的先验分布,得到后验分布,再依据后验分布进行的贝叶斯决策。2.抽样贝叶斯的决策步骤 验前分析、预验分析、验后分析§5.3抽样贝叶斯决策例5.8设某公司的一条生产线成批地生产某种零件,每批为800件。现将零件组装成仪器,根据过去的统计资料分析,零件的次品率及其相应的概率如表5-2。若组装成仪器调试时,发现次品零件则需要更换,每件更换的改装费为15元。若采取某种技术措施,可使每批零件的次品率降到最低为0.02,但每批要花费技术改造费500元。例5.8 进行技术改造之前,采取抽样检验,抽取20个零件,发现一个次品。试对该公司是否应该采取技术改造措施作出决策分析。表5-2状态θj(次品率)θ1=0.02θ2=0.05θ3=0.1θ4=0.15θ5=0.2概率p(θj)0.40.30.150.10.05例5.8验前分析方案: 不采取技术措施(a1), 采取技术措施(a2)E1=min{E(a1),E(a2)}=740因此验前分析后的决策为:采取技术措施。即:aopt=a2例5.8:预验分析 如果允许抽样检验,设X=“抽取个零件中所含废品个数”,则: P(X=k︱θj)=C20kθjk·
(1-θj)20-k, k=0,1,…,20,j=1,2,…,5计算得: P(X=1︱θ1)=0.2725,P(X=1︱θ2)=0.3774 P(X=1︱θ3)=0.2702,P(X=1︱θ4)=0.1368
P(X=1︱θ5)=0.0576例5.8:预验分析后验概率: P(θ1︱X=1)=0.3903,P(θ2︱X=1)=0.4053 P(θ3︱X=1)=0.1451,P(θ4︱X=1)=0.0490
P(θ5︱X=1)=0.0103两方案的期望费用值:因此抽到1个次品后的决策为:不采取技术措施。即:aopt=a1例5.8:预验分析 如果抽样20个未抽到废品 P(X=0︱θ1)=0.6676,P(X=0︱θ2)=0.3585 P(X=0︱θ3)=0.1216,P(X=0︱θ4)=0.0388
P(X=0︱θ5)=0.0115后验概率: P(θ1︱X=0)=0.6722,P(θ2︱X=0)=0.2707 P(θ3︱X=0)=0.0459,P(θ4︱X=0)=0.0098
P(θ5︱X=0)=0.0014例5.8:预验分析 如果抽样20个未抽到废品,两方案的期望费用值:因此若未抽到次品,则决策为:不采取技术措施。即:aopt=a1例5.8:预验分析 如果抽样20个抽到2个废品 P(X=2︱θ1)=0.0528,P(X=2︱θ2)=0.1887 P(X=2︱θ3)=0.2852,P(X=2︱θ4)=0.2293
P(X=2︱θ5)=0.1369后验概率: P(θ1︱X=2)=0.1406,P(θ2︱X=2)=0.3766 P(θ3︱X=2)=0.2846,P(θ4︱X=2)=0.1526
P(θ5︱X=2)=0.0456例5.8:预验分析 如果抽样20个抽到2个废品,两方案的期望费用值:决策为:采取技术措施。即:aopt=a2。同理,当抽样20个抽到的废品数超过2个时,应选择采取技术措施。抽样后决策的期望费用为:比未经抽样就进行决策,其费用可减少:p148例5.9 某公司降价销售一批某种型号的电子元件,这种元件一箱100个,以箱为单位销售。已知这批元件每箱的废品率有三种可能,即0.20,0.10,0.05,其相应概率分别是0.5,0.3,0.2。假设该元件正品的市场价格为每箱100元,废品不值钱。该公司处理价格每箱为85元,遇到废品不予更换。某乡镇企业正需要购买这种元件,该企业应如何作出决策?如果该公司允许购买前从每箱中抽取4个元件进行检验,确定所含废品个数,假定抽样是可放回的,该企业应如何作出决策。p148例5.9 验前分析 设a1,a2分别表示该企业购买和不购买这批元件的可行方案。E1=max{E(a1),E(a2)}=1因此验前分析后的决策为:购买该批产品。即:aopt=a1例5.9:预验分析 如果允许每箱抽样4个检验,设X=“抽取个零件中所含废品个数”,则: P(X=k︱θj)=C4kθjk·
(1-θj)4-k, k=0,1,…,4,j=1,2,3计算得: P(X=0︱θ1)=0.4096
P(X=0︱θ2)=0.6561
P(X=0︱θ3)=0.8145例5.9:预验分析后验概率: P(θ1︱X=0)=0.3628
P(θ2︱X=0)=0.3487 P(θ3︱X=0)=0.2885两方案的期望收益值:因此若抽样4个未抽取到废品,应购买该批产品。即:aopt=a1例5.9:预验分析 P(X=1︱θ1)=0.4069,P(X=1︱θ2)=0.2916 P(X=1︱θ3)=0.1715后验概率:
P(θ1︱X=1)=0.6271P(θ2︱X=1)=0.2679,P(θ3︱X=1)=0.1050因此若抽样4个抽取到1个废品,则不应购买该批产品。即:aopt=a2例5.9:预验分析 P(X=2︱θ1)=0.1536,P(X=2︱θ2)=0.0486 P(X=2︱θ3)=0.0135后验概率:
P(θ1︱X=1)=0.8163P(θ2︱X=1)=0.1550,P(θ3︱X=1)=0.0287因此若抽样4个抽取到2个废品,则不应购买该批产品。即:aopt=a2。同理:抽到废品3、4个时,也不应购买该批产品例5.9:验后分析
因此若抽样4个未抽取到废品,则应选择购买该批产品(a1),预期收益为2.815元;否则不应购买该批产品(a2),预期收益为0。抽样的预期收益为:比未经抽样就进行决策,其收益可增加:§5.3抽样贝叶斯决策5.3.2抽样信息的价值 当补充情报是采用抽样的方法获得时,这种补充情报价值习惯上称为抽样情报价值(ExpectedValueofSamplingInformation)记做EVSI。在例5.8中 EVSI=E1-E2=167.55(元)在例5.9中 EVSI=E2-E1=0.59(元)§5.3抽样贝叶斯决策5.3.3最佳样本容量
在抽样贝叶斯决策中,抽样所支付的费用叫抽样成本。样本容量为N时的抽样成本记为C(N)。 当样本容量N确定以后,抽样情报价值也随之而确定。抽样情报价值也是N的函数,记为EVSI(N)。抽样净收益:ENGS(N)=EVSI(N)-C(N)最佳样本容量:使ENGS(N)达到最大值的非负整数§5.4贝叶斯风险和贝叶斯原则5.4.1决策法则 从补充信息值τ(或H)的集合到行动方案集合A的单值对应称为决策法则。记作:若某个决策问题有m个行动方案,有n个补充信息值,则至多有mn个决策法则。最佳决策法则:在一个决策问题的所有决策法则中,按照某一原则选出的最佳者,称为该决策问题的最佳决策法则。5.4.1决策法则例5.1中,有两个行动方案:a1为生产该新产品,a2为不生产该新产品。 有两种补充信息:畅销(H1)和滞销(H2) 共有4种决策法则:按照期望收益值最大原则选出的最佳决策法则是δ2(H)。§5.4贝叶斯风险和贝叶斯原则5.4.2贝叶斯风险设贝叶斯决策法则δ(τ),对于状态变量θ的任一值,当补充信息值τ确定后,行动方案a=δ(τ)也就相应确定,则对应的损失值为R(δ(τ),θ),损失值越小,决策法则越优。风险函数ρ(δ,θ):损失值R(δ(τ),θ)对所有补充信息值的τ数学期望。§5.4贝叶斯风险和贝叶斯原则5.4.2贝叶斯风险 风险函数ρ(δ,θ)是在状态值θ下,决策法则δ对全部补充信息值的平均损失。例5.1中,损失矩阵为决策法则δ1(H)=a1的风险函数值为:5.4.2贝叶斯风险决策法则δ2(H)的风险函数值为:同理可求出决策法则δ3(H)和δ4(H)的风险函数值:§5.4贝叶斯风险和贝叶斯原则5.4.2贝叶斯风险贝叶斯风险B(δ) 对决策法则δ,风险函数ρ(δ,θ)对状态θ的数学期望,称为决策法则δ的贝叶斯风险。贝叶斯风险B(δ)是一个常数,表示决策法则δ,对一切补充信息值τ和状态值θ的平均损失值。5.4.2贝叶斯风险例5.1中:同理可求出决策法则B(δ2)、B(δ3)和B(δ4)§5.4贝叶斯风险和贝叶斯原则5.4.3贝叶斯原则以贝叶斯风险作为评价决策法则优劣的原则称为贝叶斯原则。 (以贝叶斯风险小的决策法则为优)最佳决策法则:在贝叶斯原则下,贝叶斯风险最小的决策法则称为最佳决策法则。如例5-1中:
B(δ2)<B(δ1)<B(δ4)<B(δ3)因此:最优决策法则为δ2,这与之前贝叶斯决策的结论完全一致。§5.4贝叶斯风险和贝叶斯原则5.4.3贝叶斯原则可以证明:贝叶
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年陕西旅客运输从业资格证考试题库
- 吉林师范大学《数字图像处理》2021-2022学年期末试卷
- 中学教育师德师风管理制度
- 体育赛事组织安全预案
- 生态修复项目施工总承包管理方案
- 吉林师范大学《传统纹饰设计应用基础》2021-2022学年第一学期期末试卷
- 吉林大学《岩土力学》2021-2022学年第一学期期末试卷
- 吉林大学《统计学原理与应用》2021-2022学年第一学期期末试卷
- 妇幼保健质量管理制度
- 旅游景点灯箱广告安装方案
- 2023年江西省书记员招聘笔试题库及答案解析
- 网电咨询绩效考核KPI
- 急性心肌梗死科普
- 乡镇落后表态发言
- 2023-2024学年广东省茂名市小学数学五年级上册期末评估考试题
- 汉服特征,形制与分类
- SMT行业PLM和MES系统整体解决方案
- 小学三年级下册综合实践活动.节约用水从我做起-(25张)ppt
- 0927高一【语文(统编版)】第三单元起始课-课件
- 丘吉尔英文介绍课件
- 数字化转型促进中心建设工程实施方案
评论
0/150
提交评论