版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章随机性决策问题的决策准则第一节引言一、决策问题的表示1、决策树将一个决策问题的相关方案、状态、结果、损益值和概率等用由一些节点和边组成的类似于“树”的图形表示出来。包括:决策点、状态点、结果点。2023/2/54:042023/2/54:04决策树表示法决策点机会点C1决策枝机会枝后果点C2C3C4后果值a1a2(1)(2)(1)(2)2、决策表将一个决策问题的自然状态、概率、行动与损益值用表格的形式表示出来,叫做决策表或者决策矩阵。若决策问题的后果是用损失表示的,也称损失矩阵。绘制决策表时需要假设:若决策人知道实际上出现的自然状态,则他就可以确定采取任何一种行动的后果。因此,假设自然只有有限种互不相容的可能的状态,决策者只有有限种可行的行动。2023/2/54:042023/2/54:04决策表表示法12
…j…n(j)(1)(2)…(j)…(n)a1c11c12…c1j…c1na2c11c12…c1j…c1n…………………aici1ci2…cij…cin…………………amcm1cm2…cmj…cmn状态行动后果(效用值、损失值、价值)二、决策问题的分类1、确定型决策问题确定型决策问题的特点是决策人在进行行动之前了解真实的自然状态,即他可以确切地知道各种行动的后果(属于运筹学中的纯量优化问题)。2、严格不确定型问题决策人只能知道哪些自然状态可能出现,他无法以任何方式量化这种不确定性。3、风险型决策决策人可以确定各种可能出现的自然状态及其概率分布。2023/2/54:04三、决策准则无论是不确定型问题还是风险型问题,都需要根据某种准则来选择决策规则,使结果最优或满意,这种准则就是决策准则。2023/2/54:04第二节严格不确定型决策问题的决策准则一、求解严格不确定型决策问题的主要决策准则1、悲观准则即极小化极大准则(Wald,
1950)决策人应选择尽可能最小化最大损失的行动或方案,或选择使最小效用(价值)最大化的行动。该准则下决策者极端保守,是悲观主义者,认为老天总跟自己作对,总是假设会发生最糟的情况会被自己遇上。2023/2/54:042、乐观主义准则决策者总是选择最小化最小损失的行动或方案,或最大化最大效用(价值)的行动或方案。Hurwitz在1951年提出,现实中很少有人绝对的悲观与乐观,因此,他提出了折衷主义准则,即决策者应根据悲观与乐观准则的加权平均值来排列行动的优劣次序,其中加权的权数称为乐观系数。2023/2/54:043、遗憾准则(后悔值极小化极大)Savage,1951年提出,真实的自然状态是决策人无法控制的,在用损失矩阵来作决策时,决策人会把采用一种行动在某一自然状态下的结果与同样的自然状态下采用不同的行动的结果加以比较。他定义了后果的后悔值,即在某一状态下采取某一行动的损失与该状态下其他行动的最佳结果之差。该准则下用后悔值表代替决策表,并选择最小化最大后悔值的行动或方案。2023/2/54:044、等可能准则Laplace认为对真实的自然状态一无所知“等价于”所有自然状态具有相同的概率,因此选择最小化期望损失值的行动或方案。2023/2/54:045、四种决策准则的比较Milnor给出了一个有4种状态,4种行动的决策问题的例子。决策问题的损失矩阵表2023/2/54:04qja1a2a3a4q1
2343q2
2301q3
4344q4
3344二、理想的决策规则应当具备的几种性质公理4.1完全的优劣次序公理4.2标号无关性公理4.3决策结果的标度无关性公理4.4强优势原则公理4.5无关方案独立性公理4.6某行中各元素加常数的无关性公理4.7某一行动的各种后果排列次序的无关性公理4.8某种状态下各种后果所在行复制的无关性2023/2/54:04四个准则满足八条公理的证明分析2023/2/54:04
WaldHurwitzSavageLaplace公理4.1完全序√√√√公理4.2标号无关性√√√√公理4.3标度无关性√√√√公理4.4强优势原则√√√√公理4.5无关方案独立性√√-√公理4.6同一状态下各后果值加常数的无关性--√√公理4.7某一行动的各种后果排列次序的无关性√√-√公理4.8某种状态下各种后果所在行复制的无关性√√√-对比分析后的结论:虽然真实自然状态是不确定的,但这种不确定与严格不确定性概念所说的不确定有本质的区别,因此现实中的决策问题都不可能是真正的严格不确定性的,于是我们要连同严格不确定性的概念一起抛弃公理4.7与4.8。研究问题的思路:为了判断某些方法的优劣,需要有一套衡量标准,这套标准以公理的形式表述,在用这些标准判断方法的优劣时还需要对标准的合理性加以权衡,甚至可以从根本上否定最初提出的基本概念的合理性。2023/2/54:042023/2/54:04第三节风险型决策问题的决策准则1、最大可能值准则决策者决策时都需要根据某种准则来选择决策方案——决策准则。准则不同,决策结果就可能不同。下面介绍风险型决策中常用的几种决策准则。最大可能值准则:(众数原则)j123E(ai)=Σi(j)cij(j)0.20.50.3a17344.1a26.5413.6a36503.7注:后果为损失值此准则在状态出现的概率差距不大时的决策效果可能很差!2023/2/54:042、贝叶斯准则:期望效用最大或期望损失最小。在实际决策中,一般先确定后果对决策人的实际价值即效用函数(若是损失则使用负效用)(称为伯努利过程),然后再应用贝叶斯准则。j123E(ai)=Σi(j)cij(j)0.20.50.3a17344.1a26.5413.6a36503.7注:后果为损失值2023/2/54:043、E-V准则:用期望与方差(度量风险)共同判决一个方案的优劣。帕累托优:若不存在方案al,使得方案ak的期望与风险均劣于al,称ak为有效方案或帕累托优。评价函数:fi(E,V)=E(ai)+i2。反映了决策人的风险态度,>0风险厌恶;=0风险中立(对应于贝叶斯准则);<0风险追求。j123E(ai)i2=Σi(cij-E(ai))2
(j)(j)0.20.50.3a17344.12.29a26.5413.63.79a36503.75.9672023/2/54:04决策准则—E-V准则2023/2/54:044、优势原则在实际决策中,主观概率的确定有时是很困难的,因此可利用优势原则进行决策。给不出准确的主观概率;任何两个行动(方案)之间都不存在绝对优;决策方法(以损失函数为例):列出方案ak最优的判别不等式组E(ak)≤E(ai),i=1,…,m求解不等式组的解即得到ak方案最优的概率分布判断这种概率分布是否可能2023/2/54:04当(1)>0.6时,方案a1最优;当(1)<0.6时方案a3最优;方案a2被称为强劣的(stronglydominated)。决策准则—优势原则j12a117a245a351注:后果为损失值2023/2/54:04第四节贝叶斯决策分析一、
贝叶斯定理条件概率:设A、B为随机试验E中的两个事件,在事件A发生条件下事件B发生的概率称为条件概率,记为(B|A),且(B|A)=(AB)/(A)。(A→B)若Aj(j=1,…,n)是样本空间S中n个互不相容的事件,且(Aj)>0,(AkAl)=0(k≠l);∪j(Aj)=S。称Aj是样本空间的一个划分。则对任一事件B,有:2023/2/54:04贝叶斯定理:已知(B|Aj)、(Aj)(先验概率)(j=1,…,n),求当事件B发生(随机试验的结果或观察值)时Ak发生的概率(后验概率)。贝叶斯定理在决策分析中的意义:在实际决策中,我们需要准确估计的随机变量是未来的自然状态Θ,而通过随机试验所观察到的往往是与之相关的另一个随机变量。例如,疾病诊断往往是通过观察症状如发烧、咳嗽等来判断其疾病如感冒、甲流。贝叶斯定理可以帮助我们判断当出现发烧时患甲流的概率。2023/2/54:04例:经临床观察,患甲流的病人约70%发烧超过38度,患感冒的病人约40%发烧超过38度,而肺炎病人中有60%发烧超过38度。统计表明当前甲流发病率约15‰,感冒7‰
,肺炎1‰
。现有一病人发烧超过38度,请诊断该病人最可能患上哪种疾病。解:记发烧超过38度的事件为X;患甲流、感冒、肺炎分别记为A、B、C。先验概率分别为(A)=0.015,(B)=0.007,(C)=0.001。条件概率分别为(X|A)=0.7;(X|B)=0.4;(X|C)=0.6。则(X)=0.7×0.015+0.4×0.007+0.6×0.001=0.0139(A|X)=0.7×0.015/0.0139=75.54%(B|X)=0.4×0.007/0.0139=20.14%(C|X)=0.6×0.001/0.0139=4.32%2023/2/54:04二、贝叶斯分析贝叶斯风险:当决策人通过随机试验得到观察值x后,需要根据观察值和某种决策准则选择行动a,即a=(x)。对于自然状态及其先验概率(),采取策略时损失函数l(,(x))对随机试验结果x和自然状态的期望值称为贝叶斯风险,记为r()。r()=E(Ex(l(,(x))))=xl(,(x))p(x|)()贝叶斯规则(正规型):若策略空间存在某个策略*,使得对于任意其他策略,均有r(*)≤r(),则称*为贝叶斯规则或贝叶斯策略。即r(*)=min{r()}2023/2/54:04贝叶斯规则(扩展型):在实际应用中,当行动集、状态集、观察值集中的元素较多时,策略集很大,获得r()的最小值很困难,因此可对r()的计算公式进行变换:r()=xl(,(x))p(x|)()=x
l(,(x))p(x|)()若使
l(,(x))p(x|)()达到极小,r()必然达到最小又(x)>0,所以可使
l(,(x))p(x|)()/(x)达到极小后验概率(|x)=p(x|)()/(x),因此r()的极小化问题转变为求
l(,(x))(|x)的极小化问题。2023/2/54:04贝叶斯决策分析—贝叶斯分析扩展型贝叶斯分析过程原始信息:先验分布()追加样本信息:观察值x贝叶斯定理:后验概率(|x)求*:计算r(),找出使后验期望损失最小的2023/2/54:04信息的价值:随机试验获得观察值x是需要成本的,而观察值x也可以帮助我们减少决策损失。那么随机试验观察到的信息有多大价值呢?假设我们未进行任何观察,那么根据贝叶斯准则,最小决策损失期望为:minE(li(,ai))若试验获得了观察值x,则最小贝叶斯风险即为最小决策损失:minr()观察信息的期望价值为:
minE(li(,ai))-minr()j123E(ai)(j)0.20.50.3a17344.1a26.5413.6a36503.72023/2/54:04例:(油井钻探问题)某公司拥有一块可能有油的土地,公司或自己开采,或以以下两种模式出租:①无条件出租,租金45万元;②有条件出租,产量在20万桶或以上时,每桶提成5元;产量不足20万桶不提成。设钻井费用为75万元,采油设备费25万元(有油时),油价为15元/桶。假设油产量的可能状态及其先验概率分布如表。若决策人风险中立,决策人该选择什么行动?产油量50万桶20万桶5万桶无油j1234(j)0.10.150.250.52023/2/54:04解:公司可采取的行动有3种:a1-自己开采;a2-无条件出租;a3-有条件出租。决策表如下(单位:万元):根据贝叶斯准则,方案a1效用最大,故应自己钻井。产油量50万桶20万桶5万桶无油期望效用j1234(j)0.10.150.250.5a1650200-25-7551.25a24545454545a325010000402023/2/54:04如果通过地质勘探可以进一步了解该地区的产油情况,那么我们又如何决策?假设勘探成本是12万元,统计表明,产油量与地质构造(共四种类型,用xk表示)间的关系[p(xk|j)]如下表。产油量50万桶20万桶5万桶无油j1234p(x1|j)7/129/1611/243/16p(x2|j)1/33/161/611/48p(x3|j)1/121/81/413/48p(x4|j)01/81/85/162023/2/54:04解:计算后验概率,即已知地质结构情况下产油状态的概率,并给出决策表。产油量50万桶20万桶5万桶无油j1234p(j|x1)0.1660.2400.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 回迁房买卖合同版怎么理解
- 标准摩托车转让协议合同范本
- 技术升级与改善服务合同
- 购销合同中的供应链金融服务风险控制
- 仓储代表合同协议案例
- 解除劳务合同协议
- 深入解析采购订单与采购合同
- 精酿啤酒代理权协议
- 保密协议与数据安全示例
- 电力供应安全承诺书
- 保安项目人员替换方案
- 国外合同协议书
- 2024学年八年级英语上册 Module 6 Animals in danger Unit 1 It allows people to get closer to them教案 (新版)外研版
- 2024年新人教版部编八年级道德与法治教材解读
- 《新视野商务英语视听说》第四版-上-U2 Jobs and Responsibilities
- 第9课《古诗三首》(同步练) 2024-2025学年四年级语文上册(统编版)
- (新版)吉林省生态环境监测专业技术人员大比武理论试题库(含答案)
- 7.4 等差数列与等比数列的应用(课件)-【中职专用】高二数学(高教版2021·拓展模块一下册)
- 2024男女双方自愿离婚协议书
- 关于大数据的职业生涯规划书课件
- 顶管工程安全措施和操作规程
评论
0/150
提交评论