大型工程决策- 随机性决策问题与效用函数_第1页
大型工程决策- 随机性决策问题与效用函数_第2页
大型工程决策- 随机性决策问题与效用函数_第3页
大型工程决策- 随机性决策问题与效用函数_第4页
大型工程决策- 随机性决策问题与效用函数_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 随机性决策问题与效用函数王仁超 天津大学本章内容1 先验信息与主观概率2 效用函数3 贝叶斯分析*4 随机优势法1 先验信息与主观概率先验信息:随机性决策问题特点:自然状态的不确定性引起后果的不确定性。为了进行科学决策,决策人在通过试验收集自然状态有关信息之前,根据自己的经验、主观估计自然状态的信息,称为先验信息,它是贝叶斯决策分析的基础。主观概率与客观概率决策人根据自己的经验所设定的自然状态发生的概率称为主观概率;通过随机试验所确定的自然状态发生概率称为客观概率。先验分布:借助先验信息确定的主观概率分布,称为先验分布主观设定先验分布的方法基础二元关系:比较两个对象某一方面属性的关系。

2、主观概率估计中,比较两个事件发生的可能性二元关系假设:连通性:A、B两个事件发生的似然性是可以比较的,且只有以下一种关系成立,即等可能AB;A比B更可能AB, B比A更可能AB。传递性: A、B、C三个事件,若AB、B C,则A C部分小于全体:设事件AB,则事件B的发生似然性A B,如A为物价上涨810,B为物价上涨812,则事件B发生的可能性至少与A一样大。主观设定先验分布的方法概率盘最为常用区间法相对似然法直方图法概率盘正面反面对应对应抽奖适用于对概率有了解的专家区间法1)把事件不确定量的区间划分为两部分,询问决策人事件发生在哪个区间可能性更大2)然后减少可能性大的区间,直至两个区间等可

3、能;3)同样还可以对两个区间记一步划分,得到1/4和3/4的点对应的区间*由于该方法误差积累,一般不再进一步划分相对似然法在事件的不确定量区间中,要求决策者首先确定“最可能”和“最不可能”的量,然后询问“最可能”量的可能性是“最不可能”量的可能性的几倍相对似然性,再对其他量进行相对似然性估计,由此得到非正常先验密度曲线(密度积分不等于1,故非正常)。例如,关于某产品明年的销售量,在100010000件之间,最可能是5000件,最不可能是9000件,最可能发生5000件的可能性是最不可能9000件的4倍,于是得到5000对9000的相对似然。继续问4000件与8000件的相对似然性。直方图法将某

4、一事件的不确定量划分为若干区间,询问决策人各个区间发生的概率,2 效用函数价值与效用:在经济学以及随机决策问题中,很多研究表明,决策人对后果的判定不完全取决于后果价值,而是价值的一个对应值,这个对应值反映决策的偏好(preference),即效用是决策人对后果值的偏好的量化。效用函数:当决策人的偏好满足一定的公理时,所有决策后果与效用的对应函数关系。展望、抽奖与抽奖的确定当量展望(prospect)或预期:决策的可能前景,它是各种后果与后果出现概率的组合,记为:Pp1,c1;p2,c2;p3,c3;pr,cr抽奖:决策树中由机会点和该机会点发出的若干机会枝的概率及其后果构成的图形,称为抽奖,若

5、决策人认为某个后果C与抽奖L p1,c1;p2,c2;p3,c3;pr,cr无差异,则称C为抽奖L的确定当量,抽奖和确定当量是确定效用函数的常用方法效用的存在性公理由Von Neumann和Morgenstern 上世纪40年代提出。连通性:P上的优先关系是连通的;传递性替代性:若P1、P2、P3P,P1P2且0 1, P1(1 )P3 P2(1 )P3,或 0 1, P1(1 )P3 P2(1 )P3连续性(偏好的有界性)若P1、P2、P3P,P1P2 P3,则存在0 1使P1(1 )P3 P2(1 )P3效用函数的数学定义集合P上的实值函数u,若它和P上的优先关系一致,即:若P1,P2P且

6、P1 P2,当且仅当u(P1) u(P2)。定理:若P上的优先关系满足公理14,则一定存在上述定义的效用函数。基数效用与序数效用基数是2、3.5、100.0等,定义在展望上的效用是基数效用,以上介绍的效用函数,为基数效用函数,基数效用的特点:既反映偏好的次序,也反映偏好强度。通常基数效用值在01之间序数,第一、第二、第三等,定义在后果集上,只反映偏好的次序,而不反映偏好强度,不涉及随机性。效用函数的构造方法偏好诱导确定当量法:给定两个后果c1、c2,通常是最差和最好的结果,假定其均以50概率出现,问决策人确定当量c为多少,cc10.5c20.5;设U(c1)0, U(c2)1,则得到C对应效用

7、为0.5,在c1和c之间和c和c2之间继续询问决策人,则可以得到若干效用值,拟和成曲线即为该决策人的效用函数。后果效用效用函数效用与风险效用函数反映决策者对风险的态度,通常分为三种类型,风险中立、风险追求和风险厌恶。例如,如果u(0)=0,u(2500)=1,如果决策人在50概率抽奖中,认为1250的效用为0.5,则该决策人是风险中立,如果认为900(或1250的效用值大于0.5)与抽奖相当,则该决策人是风险厌恶的,效用函数上凸,否则为风险追求,效用函数下凸。利用效用函数和先验信息进行决策决策准则期望效用最大利用效用进行决策的案例:例:某农场要决定一块地中选择什么作物,各种作物的收益如表1,若

8、该人的收益与效用对应关系如表2,如何决策?200060003000棉花300050002000小麦700040001000蔬菜多雨0.1正常0.7旱0.2 天气 利润方案效用决策案例收益1000200030004000500060007000效用0.150.250.350.450.550.650.850.550.470.43x2, 0.7x1, 0.2x3, 0.10.150.450.85x1, 0.2x2, 0.7x3, 0.10.250.550.35x1, 0.2x2, 0.7x3, 0.10.350.650.25a3a2a1决策点方案枝状态点概率枝后果期望效用3贝叶斯分析前言:前面我们介

9、绍了依据先验信息进行决策的方法。这些方法可能存在以下问题:先验信息难以获得;决策非常重要,要求提高决策质量对于随机决策问题要提高决策质量:最好通过试验或经验等获得新的信息,它们是对先验信息得到的主观概率的一个随机估计,由此得到关于自然状态的后验概率;决策者根据这个估计和决策规则采取行动贝叶斯分析。贝叶斯定理条件概率:A、B为随机试验的两个事件,在事件B发生条件下A发生的概率称为A关于B的条件概率,记为:P(A|B),且P(A|B)=P(AB)/P(B)全概率公式:若Aj,j1,2,。n是样本的一个划分,则贝叶斯定理贝叶斯定理解释P(Aj)称为先验概率,P(Aj|B)称为后验(或验后)概率。在随

10、机决策中,决策者对于自然状态x的出现概率主观估计是先验概率,通过试验等进一步获得自然状态估计是后验概率。损失函数统计决策理论习惯于用损失函数而非效用函数做决策分析,损失函数L(,a)表示出现自然状态情况下决策者采取行动a的损失。可以用负效用函数来表示损失函数。与期望效用最大作为决策规则,损失函数为期望损失最小也可以作为决策规则风险函数在贝叶斯分析中,决策者通过试验获得自然状态 的一组观测值X,由于试验仍可能存在其他随机因素影响,因此,X和均为随机变量。决策人当获得X后,他根据X选择行动,因此,决策人的行动应为X的一个函数,记为(X)。当自然状态为 ,观察为xX,根据x选择行动a时记为(x),相

11、应损失为L(,(x))。由于X和均为随机变量,因此L(,(X))也是随机变量,当给定,定义L(,(X))对X的期望值为风险函数记为R(,)风险函数的具体型式当X为连续的随机变量时当X为离散的随机变量时其中, 为条件概率密度函数或条件概率贝叶斯风险其实决策人决策时,并不知道真实的状态 中 哪一个会出现,他只能对出现的先验密度(概率)()做主观估计,决策分析中还需要把风险函数R(,)对 取期望,记为r(, )=E R(,)当连续随机变量当离散随机变量贝叶斯决策规则贝叶斯风险最小的策略(损失最小)正规型,扩展型扩展型贝叶斯决策问题分析步骤获得原始自然状态信息的主观概率估计获得关于原始自然状态的试验估

12、计自然状态与行动方案的损失函数确定计算后验概率或密度确定最优行动:即预测自然状态不同时的行动规则显然它是一种随机应变的。一个贝叶斯分析案例某油井公司拥有一块油田,当前该公司可以采取的措施为:a1:自己钻采; a2:无条件出租,租金45万;a3:有条件出租,租金依照产量而定,产油在20万桶或以上,每桶提成5元,产量不足20万桶不受租金。另外,自己开采钻井费用75万元,有油需要增加采用设备费25万元。油价每桶15元。油田产量分为无油、5万桶、20万桶和50万桶4种状态,主观概率为0.5、0.25、0.15、0.1。问决策人风险中立,决策人应采取什么行动。分析决策人风险中立,收益与效用成线性关系,可

13、以认为收益就是效用损失函数可以取效益的负现在问题没有涉及后验信息,但仍可以用贝叶斯决策分析方法求解决策树贝叶斯公式计算有后验信息的决策决策人如果通过地震试验可以获得该地区石油含量0,5,20,50万桶的相关信息,需要经费12万元,问进行该项试验后,决策人如何动?,p(xk|j)如表所示。X1=50X2=20X3=5X4=0507/121/31/120209/163/161/81/8511/241/61/41/803/1611/4813/485/16求全概率或预测密度与后验概率公式全概率后验概率X1=50X2=20X3=5X4=0500.1660.1290.0390200.2400.1080.0

14、870.10750.3270.2410.1460.23800.2670.5220.7280.655贝叶斯分析扩展型给定x1=50万桶,利用扩展型求得对应方案a1的期望损失同样求得对应 a2和a3的期望损失为33和5,于是预测为x1 取a1方案。同样对x2、x3、x4可以达到行动方案为a1、a2、a2考虑12万元的试验费课堂指导作业绘制贝叶斯分析扩展型的决策树。提示首先是决策是否进行试验,如果进行试验则可能以预测密度出现 x1、x2、x3、x4四种预测状态,然后对每一种状态,做决策采取那种方案。信息的价值进行贝叶斯决策分析需要后验信息,它通过试验获得,需要一定的费用,那么,就存在花费这笔费用值不

15、值的问题?获得的信息可能存在两种情况:全信息和采样(随机)信息,所谓全信息是指通过试验完全确定未来状态,所谓采样信息是指试验有一定的准确性,但仍有助于提高决策的准确性完全信息的价值试验可以完全确定自然状态,例如,假若地震试验后可以确定该地块有50万桶石油或20万桶或5万桶或无油,那么决策人就可以使随机应变,使损失最小化,这时的损失为期望最小损失:相反则为最小期望损失:完全信息的价值EVPI最小期望损失期望最小损失 采样信息的价值有采样信息时,我们是按照贝叶斯分析,利用后验信息进行决策,期望损失是贝叶斯期望损失最小没有先验信息决策同上EVSI 完全信息价值算例对于石油开采,在试验前,估计出油50

16、、20、5、0万桶的概率为0.1、0.15、0.25、0.5,当试验确定为出油50、20、5、0万桶时的损失为650、200、45、45,故期望损失为:6500.1-2000.15-450.25-450.5128.5无试验时,最小期望损失为-51.25完全信息价值EVPI51.25-(-128.5)=77.5采样信息的价值算例按照贝叶斯分析后,当试验确定为出油50、20、5、0万桶时的损失为115.5、48.275、33、33,按照各个状态全概率0.351、0.259、 0.215、 0.175,故贝叶斯期望损失为-65.91,另外由于计算损失中扣除12万元,计算信息价值时补充进来,期望损失为

17、77.91无试验时,最小期望损失为-51.25采样信息的价值EVSI-51.25-(-77.91)=26.664 随机优势法随机优势概念的产生:前面我们介绍的方法需要决策人的效用函数(偏好信息),实际决策问题中,我们往往很难获得效用函数的准确完全信息,往往只能获得部分信息,如这个决策人的效用函数类型。那么,在获得效用函数的类型后能否辅助决策者对一定的决策方案排序,确定优劣呢?这是随机优势决策产生的原因。随机优势产生与概念随机优势决策准则是基于投资决策问题研究产生的,代表人物是Markowitz,他在研究有价证券组合投资时提出。随机优势的概念:设在随机决策问题中存在两个方案a1和a2,如果在一定

18、的条件下,记为条件C(通常是决策人的效用函数属于某一个类)a1a2,则称方案a1在条件C下优势于a2,或方案a1比 a2 具有随机优势,记为a1Ca2 。两类强随机优势按状态优于如右表,若为损失函数,a1a2实际决策中很少按照EV如果一个方案a1收益的期望(均值)大于另一个方案a2,而且方差小于方案a2,则a1a2现实中这样的决策问题也很少a1a2a3147226683347不满足以上两条的能不能确定方案的随机优势呢?回答是在知道决策人效用函数类型后可以做到!第一类效用函数与随机优势第一类效用函数U1定义:u(x)是连续有界递增的,即u的定义域为Ia,b,将(a,b)定义为I0,u和u在I上连

19、续有界,在I0上u 0。这是第一类效用函数是对效用函数的最基本要求,这样的效用函数还不能分辨决策人的风险态度。如果两个方案关于第一类效用函数具有随机优势,那么,不论决策人的风险态度,两个方案之间的优势是存在的。第二类效用函数与随机优势U2u|uU1,u在Ia,b连续有界,在I0上u 0第二类效用函数可以通过r=u/u的比值判断该类决策人是厌恶风险的,即r0。现实中很多证据表明,决策人即使不是全部也是大多数是厌恶风险的。如果两个方案关于第二类效用函数具有随机优势,那么,决策人的风险态度为厌恶时,两个方案之间的优势是存在的。第三类效用函数与随机优势U3u|uU2,u在Ia,b连续有界,在I0上u 0U3描述的是:多数人对小额盈亏的态度是随着财富的积累而变化的,财富越多,他们对小额盈亏的风险厌恶程度越低,即U3为递减

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论