决策分析主观概率和先验分布_第1页
决策分析主观概率和先验分布_第2页
决策分析主观概率和先验分布_第3页
决策分析主观概率和先验分布_第4页
决策分析主观概率和先验分布_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2主观概率和先验分布

(Modelinguncertaintywithprobability

)2.1概率的基本概念2.2先验分布及其设定2.3设定主观概率的案例2.4“埃尔斯伯格悖论”(Ellsbergparadox)2.1概率的基本概念1)概率的三种定义2)主观概率的引入3)主观概率的定义4)主观/客观概率的比较5)主观概率的偏差6)主观概率的修正2.1概率的基本概念研究概率的必要性:第一章指出了决策问题的基本特点之一是自然状态的不确定性。由于自然状态的不确定性,决策人无论采取什么行动,所产生的后果都会因自然状态的不同而不同。为了能对决策进行给定量化研究、有必要定量地表达自然状态的非确定性。概率是定量表达不确定性的重要工具,我们要对设定自然状态的概率分布所涉及的问题与相应的处理方法进行分析和讨论。确定性事件与随机事件确定性事件:在同样的条件下进行一系列重复试验,必定会导致某种确定结果的事件。即事物间的联系是必然的。太阳每天从东方升起;在标准大气压下,水加热到100摄氏度就必然会沸腾。随机事件:在同样的条件下进行一系列重复试验,存在多种结果,且每次出现的结果都不能预先确定的事件。即事物间的联系是偶然的。股票的涨跌报考研究生概率与随机事件随机事件的三个特点:(1)在相同条件下可以重复进行;(2)试验前不能确定出现哪种结果;(3)试验前知道可能出现的所有结果。概率:随机事件在每次试验中的结果虽然是不确定的,但在大量重复试验下,各种不同结果出现的可能性的大小是具有规律性的,这种规律性称为概率。1)概率的三种定义(1)频率与概率(2)Laplace的概率定义(3)概率的公理化定义(1)频率与概率为了描述随机事件发生的可能件的大小,人们通常进行随机试验并观察试验结果。在相同条件下进行了n次试验,其中事件A发生的次数nA称为事件A发生的频数,比值nA

/n称为事件A发生的频率,记作人fn(A):

古典的概率(probability)的定义如下:(2)Laplace的概率定义

P(A)==k/N

式中,k为A所含基本事件数,N为基本事件总数适用条件:1.基本事件有限

2.每个基本事件等可能(3)Kormogorov公理化定义

E是随机试验,S是E的样本空间,对E的每一事件A,对应有确定实数P(A),若满足:①非负性:0≤P(A)≤1②规范性:P(S)=1③可列可加性:对两两不相容事件Ak(k=1,2…)(Ai∩Aj=φ),有:P(∪Ak)=∑P(Ak)

则称P(A)为事件A发生的概率.小结以上所述的3种概率的定义中有一个共同的特点,这就是概率是在多次重复试验中,随机事件A发生的可能性的大小的度量。2)主观概率的引入

(subjectiveprobability,likelihood)而在实际的决策问题中,自然状态的概率往往无法通过重复试验求得:(1)有的自然状态无法重复试验如:明天是否下雨、新产品销路如何、明年国民经济增长率如何、能否考上研究生(2)试验费用过于昂贵、代价过大如:洲导弹命中率、战争中对敌方下一步行动的估计2)主观概率的引入

(subjectiveprobability,likelihood)主观概率的引入:由于上述原因,需要有一种能在频率观点不适用、实际上无法进行随机试验时设定概率的方法,这就是主观概率(subjectiveprobability);与此同时,把前述的概率称为客观概率(objectiveprobability)。3)主观概率的定义Savage(1954)的观点:主观概率是一种见解,是合理的信念的测度,它是某人对特定事件会发生的可能性的信念(或意见、看法)的度量,即某人相信或认为事件将会发生的可能性的大小。主观概率:以个人信念为基础,根据确凿有效的证据对个别事件设计的概率。这里所说的证据,可以是事件过去的相对频率的形式,也可以是根据丰富的经验进行的推测。比如有人说:“阴云密布,可能要下一场大雨!”这就是关于下雨的可能性的主观概率。主观概率具有最大的灵活性,决策者可以根据任何有效的证据并结合自己对情况的感觉对概率进行调整。3)主观概率的定义主观概率的特点:主观概率是一种心理评价,判断中具有明显的主观性。对同一事件,不同人对其发生的概率判断是不同的。主观概率的测定因人而异,受人的心理影响较大,谁的判断更接近实际,主要取决于市场趋势分析者的经验,知识水平和对市场趋势分析对象的把握程度。问题:不同的决策人对同一事件会发生的可能性的度量会不同(如:能否考上研究生),决策分析时是否存在多种主观概率?主观概率与主观臆测的区别主观概率是根据经验、各方面的知识以及对客观情况的了解,利用相关信息进行分析、推理、综合判断而设定(assignment)的。主观臆测:完全凭自己的想象作决定,通俗的说就是你想啥就是啥,不以客观事实为依据的判断。

例子:日本大地震引发的武汉抢盐风波《中国日报》周五(2011.3.25)报导称,中国近期传言碘盐能防辐射,武汉一名姓郭的男子抢盐6.5吨,而如今这价值2万多元的食盐成了“烫手山芋”。曾有传言称,中国国内将出现半年以上的盐荒,导致盐价一度上涨,郭某抢购食盐260包,用了三辆卡车运回家。几天后,中国政府敦促消费者停止恐慌性抢盐,称国内不会遭到日本核辐射威胁,盐价随後大跌。《中国日报》称,郭某现在十分发愁,屋里一半多的空间放着食盐,购买加运费共花了他2.7万元。问题1:请为郭某的抢盐行为建立决策模型。问题2:郭某决策失误的主要原因是什么?3)主观概率的数学定义注意:主观概率和客观概率(objectiveprobability)有相同的定义

4)主观/客观概率的比较由于历史原因,客观概率论者习惯使用概率(probability)一词,采用记号多p(θ)表示自然状态θ的概率;而主观概率论者习惯用似然率(likelihood),采用记号π(θ)表示自然状态的θ的似然率。在本书中对概率和似然率的用法不加严格区分,但尽可能用记号π(θ)表示似然率。在实际中,主观概率与客观概率的区别是相对的,因为任何主观概率总带有客观性。例如:市场趋势分析者的经验和其他活信息是市场客观情况的具体反映,因此不能把主观概率看成为纯主观的东西。另一方面,任何客观概率在测定过程中也难免带有主观因素,因为实际工作中所取得的数据资料很难达到(大数)规律的要求。所以,在现实中,既无纯客观概率,又无纯主观概率。4)主观/客观概率的比较(一)基本属性:

O:系统的固有的客观性质,在相同条件下重复试验时频经的极限

S:概率是观察者而非系统的性质,是观察者对对系统处于某状态的信任程度

(二)抛硬币:正面向上概率为1/2

O:只要硬币均匀,抛法类似,次数足够多,正面向上的概率就是1/2,这是简单的定义。

S:这确是定义,决策者认为硬币是均匀的,正、反面出现的可能性(似然率)相同,1/2是个主观的量。(三)下次抛硬币出现正面的概率是1/2

O:这种说法不对,不重复试验就谈不上概率

S:对决策者来说,下次出现正、反是等可能的。但是他不是说硬币本身是公正的,它可能会有偏差,就他现有知识而言,没有理由预言一面出现的可能会大于另一面,但多次抛掷的观察结果可以改变他的信念。

O、S:下次抛硬币出现正面还是反面不能确定,但知道:要么是正面,要么是反面。5)主观概率的偏差在现实生活中,大量存在着主观概率与客观概率不一致的现象。例1:现实生活中,属于乐观、保守、自负等个性人群也容易导致主观概率失真。乐观的人当中如果认为酒醉驾车和不安全性行为对自己的伤害的可能性不太,那么他们一定会有人犯错。例2:有学者以“你认为中国死于糖尿病的人多还是自杀的人多?”为题进行调查,结果大多数被访者的回答是“自杀”。但实际上前者的比例是十万分之二十一点四,自杀的比例为十万分之九点九。为什么出现这种情况呢?这是因为媒体对自杀的关注影响了人们的判断。5)主观概率的偏差主观概率的系统性偏差:心理学发现,人的主观概率,会存在系统性的偏差。这种偏差,是有规律的,而且与人的性格习惯,生长环境文化,没有关系,是人类的大脑自然结构思维方式导致的。即使在面对已知的客观概率时,人对不同的概率有不同的感觉,心理上赋予它不同的权重,主观上对概率值的感觉变化,不符合客观概率本身的变化。例1:坐飞机与空难事故一个人准备坐飞机去旅行,突然看到新闻说1小时前发生了1起空难事故,机组人员乘客全部遇难。看完这个新闻后,这个旅行者对继续乘飞机旅行会重新考虑,如果他是一个很清醒理性的人,会依据“航空普遍比汽车火车安全”这个统计结果继续乘飞机。但是,他登机后肯定心情略微激动,比以前略微担心一点,最近发生的新闻事件在他心理肯定有影响,绝对不会是纷纷表示影响不大。心理学解释:最近发生的事情,会让人们高估这个事件的概率,而无视历史上长期对它的统计结果。例2:两人同一天生日问题要保证一个群体里,一定有2人在同一天生日,这个群体至少该有多少人呢?普通思路会感觉至少366(假设一年365天)人。如果要以50%的概率保证一定有2人同一天生日呢?普通思路会觉得,那就把366人概减半差不多吧。如果要以90%的概率保证一定有2人同一天生日呢?那就对366来个9折的计算,群体至少得有330人吧,差不多就这个范围上下。正其实23人的群体,就有50%以上的概率保证会有2人同一天生日;60人以上的群体则99%可能性有2人同一天生日。心理学解释:连续N个小概率事件,其最终成真全都发生的概率甚至是呈指数下降的。但是,人的大脑喜欢加减法,因为这样思维最简单,所以对于一个复合事件的概率,人们总是喜欢先预估单一事件的概率,然后再用加减法,在最初的概率基础上修正一下。6)主观概率的修正:贝叶斯法则黔驴技穷的故事黔无驴,有好事者船载以入。至则无可用,放之山下。虎见之,庞然大物也,以为神,蔽林间窥之。稍出近之,应应然,莫相知。他日,驴一鸣,虎大骇,远遁;以为且噬已也,甚恐。然往来视之,觉无异能者;益习其声,又近出前后,终不敢搏。稍近,益狎,荡倚冲冒。驴不胜怒,蹄之。虎因喜,计之曰:“技止此耳!”因跳踉大喊,断其喉,尽其肉,乃去。【出自】:唐·柳宗元《三戒·黔之驴》黔驴技穷的决策模型:决策者:老虎自然界的不确定性:驴厉害吗?决策行为:吃驴/不吃老虎的先验概率:驴厉害吗?“黔无驴,有好事者船载以入。”说明老虎对驴完全不了解,在面临一个不确定性的事情时,老虎只能通过回忆类似的事情来判断驴是否厉害,即老虎对驴的先验概率。“虎见之,庞然大物也,以为神,蔽林间窥之。稍出近之,应应然,莫相知。他日,驴一鸣,虎大骇,远遁;以为且噬已也,甚恐。”老虎通过“观其形,听其鸣”,加上以前的经验得出了先验概率。P(驴厉害)=0.9(问题:P(驴厉害)=1.0可以吗?)老虎先验概率的修正:“然往来视之,觉无异能者;益习其声,又近出前后,终不敢搏。稍近,益狎,荡倚冲冒。驴不胜怒,蹄之。”老虎不甘心,通过试探的方式,获取对驴的新的信息,以修正先去设定的先验概率。P(驴厉害|老虎靠近,驴不敢搏)=?P(驴厉害|老虎冲撞,驴蹄之)=?老虎的后验概率:“虎因喜,计之曰:“技止此耳!”老虎的先验概率:P(驴厉害)=0.9老虎的后验概率:P(驴厉害|老虎多次试探后驴的反应)<<0.9老虎的决策行为:“因跳踉大喊,断其喉,尽其肉,乃去。”

2.2先验分布及其设定1)设定先验分布时的几点假设2)离散型随机变量先验分布的设定3)连续型随机变量的先验分布的设定4)无信息先验分布5)使平均信息量极大化的先验分布设定6)利用过去数据设定先验分布2.2先验分布及其设定面临一个不确定性的事情时,人们通过回忆类似的事情,计算在以前的事情中,发生各个结果的数量,来预测当前不确定性问题的各种结果的概率。在决策分析中,尚未通过试验收集状态信息时所具有的信息叫先验信息,由先验信息所确定的概率分布叫先验分布(priordistribution)。设定先验分布是Bayes分析的需要.2.2先验分布及其设定对许多领域的实际问题,设定在相关的域上的事件的概率分布对于这些领域的专业人员来说已经是常规性和标准化的工作。这种赋值通常是模型与经验相结合,而且许多典型的问题有其相应的概率模型,如二项分布,正态分布,泊松分布等可以使用。对那些不具备典型特征的事件,要让两个人就同一个特定的概率分布的适用性取得一致意见通常都十分困难,这时概率的设定就有高度的主观性。

1)设定先验分布时的几点假设假设2.1连通性(Connectivity),又称可比性.即事件A和B发生的似然性likelihood是可以比较的:

A>LB或AL

B或B>LA,必有一种也仅有一种成立A>LB读作A发生的似然性大于B发生的似然性。AL

B读作A发生的似然性与B发生的似然性相当。1)设定先验分布时的几点假设假设2.2传递性(Transitivity)

若对事件A,B,C,A>LB,B>LC则A>LC.任何二元关系,只有满足连通性和传递性才能构成完全序。

1)设定先验分布时的几点假设1)设定先验分布时的几点假设Savage,1954指出满足假设2.1~2.5就可以保证概率分布的惟一存在性。在实际设定先验分布的时候,注意满足前三条假设就可以了,分析人员的注意力应该放在量化决策人的“信念”的准确性上。2)离散型随机变量先验分布的设定1.对各事件加以比较确定相对似然率例1.考博士生E:考取E:考不取若π(E)=2P(E),则:π(E)=2/3,π(E)=1/3.

例2.某地气候状况:正常年景θ1,旱θ2,涝θ3

正常与灾年之比3∶2,水旱灾之比1∶1.

则π(θ1)=0.6,π(θ2)=π(θ3)=0.22)离散型随机变量先验分布的设定2.打赌法设事件E发生时收入P(0<P<1),且E不发生的收入为(1-P),调整P,使决策人感到两者无差异为止,则:

π

(E)=1-P.3)连续型随机变量的先验分布的设定(1)直方图法(2)相对似然率法(3)区间对分法(4)与给定形式的分布函数相匹配(1)直方图法该法适用于自然状态θ取值是实轴的的某个区间的情况.步骤:①将区间划分子区间θi…离散化;

②设定每个子区间的似然率π(θi)…赋值;

③变换成概率密度曲线.例如:明年国民经济的增长率·缺点:①子区间的划分没有标准

②赋值不易

③尾部误差过大图2.3明年国民经济的增长率的概率分布直方图

(2)相对似然率法适用范围:同1

步骤:①离散化

②赋值:给出各区间似然的相对比值

③规范化:

(2)相对似然率法(2)相对似然率法示例4:问题同示例3,用解法a)求解。仍以每1%为子区间,并把以为上限的子区间记作首先由决策人判断似然率最大的子区间是哪一个,比如是7%,即明年国民经济增长率最大可能性在6%~7%之间。然后告诉他,把明年国民经济增长率在6%~7%之间的可能性记作10;并要求他判断明年国民经济增长率在7%~8%之间的可能性有多大,设经过交谈后定为8.5,由分析人员记入表2.1;然后再开始判断下一个子区间的相对似然率,直到所有子区间的相对似然率都设定为止。

表2.1明年国民经济增长率各子区间及似然率设定子区间23456789101112Ri0.51.5369109.56.52.510.5π(θi)0.010.030.060.120.180.200.190.130.050.020.01(3)区间对分法·适用范围:可以是开区间·步骤:①求中位

②确定上、下四分位点(quartilefractile)③由于误差积累,最多确定八分位点(Eighthfractile)

例:人口出生率·缺点:精度差(4)与给定形式的分布函数相匹配这是最常用,且常常被滥用的方法.步骤①:选择一个与先验信息匹配得最好的函数,如正态,泊松,β,e-Cauchy分布等例:a)在单位时间以恒常的平均比率入出现,则在T单位长度时间内该事件出现的次数服从Poisson分布b)若影响某一随机变量的因素很多而每一因素的作用均不显著,则该变量服从正态分布。例如,测量误差,弹落点,人的生理特征的度量,农作物产量等均服从正态分布。

c)事件A出现的概率为P,n次独立试验出现r次A的概率b(p,r,n)=步骤②参数估计:

A.矩法:N(μ,σ)Be(α,β)·缺点:尾部估计不准,但对矩的影响却很大

B.分位数:利用几个分位点和现成的概率密度函数分位数表,估计参数并检验。即服从二项分布4)无信息先验分布一、为什么要研究无信息先验贝叶斯分析法最为引人的特点是它的简明性,只要有效用(损失)函数和先验分布,贝叶斯分析就可以直接计算了。由于贝叶斯分析法的简明性,使得人们在没有先验信息时也想用它,因此希望在完全没有或只有权少自然状态Θ的先验信息时,也能设定Θ的先验概率分布。

例如,最简单的情况是Θ中只有n个元素.即只有n种自然状态,设每种状态出现的概率为1/n,这就是无信息先验分布。5)使平均信息量极大化的先验分布设定5)使平均信息量极大化的先验分布设定6)利用过去数据设定先验分布一、有θ的统计数据为能获得θ的观察值θi,i=1,…,n的数据,则可:

①通过直方图勾划出先验分布;

②选取可能的函数形式作为先验分布,再定参数;

③求频率(离散随机变量).6.利用过去数据设定先验分布二、状态θ不能直接观察时小结自然状态的概率或概率分布不是也不应当由决策分析人员来设定,而应当由决策人和有关问题专家提供基本信息,由决策分析人员协助设定。2.4“埃尔斯伯格悖论”(Ellsbergparadox)埃尔斯伯格(Ellsberg,1961)进行了如下的博彩实验。假设一个缸中有100个球,其中33个球为红色,其余67个为黑色或黄色,你若从中拿出一个球:博彩A:若球为红色,你得到1000元;博彩B:若球为黑色,你得到1000元。然后再考虑下面的博彩:博彩C:如果球不是红色的,你得到1000元;博彩D:如果球不是黑色的,你得到1000元。3367实验结果:实验结果表明,所有的人基本上严格偏好A而非B,严格偏好C而非D。但是,这种偏好关系违背了标准的主观概率理论。推导:A的期望效用:p(red)u($1000)B的期望效用:p(black)u($1000)如果人们选择A,则有:p(red)u($1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论