贝叶斯统计先验分布的确定_第1页
贝叶斯统计先验分布的确定_第2页
贝叶斯统计先验分布的确定_第3页
贝叶斯统计先验分布的确定_第4页
贝叶斯统计先验分布的确定_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章先验分布的确定3.1主观概率3.1.1概率的公理化定义定义:设Q为一个样本空间,F为Q的某些子集组成的一个事件域,如果对 任一事件AE F,定义在F上一个实值函数P(A)满足下列条件:非负性公理:对于每一事件A,有P(A)N0;正则性(规范性)公理:P(Q)=1;可列可加性(完全可加性)公理:设A1,A2,是互不相容的事件,即对于 闰,A.A.=0, i, j=1, 2,则有8P ( A )=产 P (A )iii=1i=1则称P (A)为事件A的概率(Plobability),称三元素(Q, F,P)为概率空间 (Probability space)。概率是定义在o-域F上的一个非负的

2、、正则的、可列可加的集函数。3.1.2主观概率在经典统计中,概率是用三条公理定义的:1)非负性;2)正则性;3)可 加性。概率确定方法有两种:1)古典方法;2)频率方法。实际中大量使用的是频率方法,所以经典统计的研究对象是能大量重复的随 机现象,不是这类随机现象就不能用频率的方法去确定其有关事件的概率。这无 疑把统计学的应用和研究领域缩小了 1。在经典统计中有一种习惯,对所得到的 概率都要给出频率解释,这在有些场所是难于做出的。譬如,天气预报:“明天 下雨的概率是0.8”。贝叶斯统计中要使用先验信息,而先验信息主要是指经验和历史资料。因此 如何用人们的经验和过去的历史资料确定概率和先验分布是贝

3、叶斯学派要研究 的问题。贝叶斯学派是完全同意概率的公理化定义,但认为概率也是可以用经验确 定。这是与人们的实践活动一致。这就可以使不能重复或不能大量重复的随机现 象也可谈及概率。同时也使人们积累的丰富经验得以概括和应用。贝叶斯学派认为:一个事件的概率是人们根据经验对该事件发生可能性所给 出个人信念。这样给出的概率称为主观概率。下面举几个例子:一个企业家认为“一项新产品在未来市场上畅销”的概率是0.8,这里的0.8 是根据他自己多年的经验和当时一些市场信息综合而成的个人信念。一位医生要对一位病人动手术,他认为成功的概率是0.9,这是他根据手术 的难易程度和自己的手术经验而对“手术成功”所给出的把

4、握程度。这样的例子在我们生活,生产和经济活动中也是常遇见的,他们观察的主观 概率绝不是随意的,而是要求当事人对所考察的事件有较透彻的了解和丰富的 经验,甚至是这一行的专家。并能对周围信息和历史信息进行仔细分析,在这个 基础上确定的主观概率就能符合实际。所以应把主观概率与主观臆造,瞎说一通 区别开来。主观概率要受到实践检验,要符合概率的三条公理,通过实践检验和公理验 证,人们会接受其精华,去其糟粕。主观概率是频率方法和经典方法的一种补充,有了主观概率至少使人们在频 率观点不适用时也能谈论概率,使用概率和统计方法。主观概率并不反对用频率方法确定概率,但也要看到它的局限性。313确定主观概率的方法用

5、对立事件的比较来确定主观概率(最简单的方法)例3.1一位出版商要知道一本新书畅销(事件A)的概率是多少,以决定是否与作 者签订出版合同。他在了解这本新书的内容后,根据他自己多年出书的经验认为 该书畅销的可能性较大,畅销(A)比畅销(膏)的可能性要高出一倍,即P(A) = 2P(A),由此根据概率的性质P(A) + P(A) = 1,可以推得P(A) = 2/3,即该书畅销的主观概率是2/3。(2)用专家意见来确定主观概率(最常用)例3.2有一项带有风险的生意,预估计成功(记为A)的概率。为此,决策者去拜 访这方面的专家(如董事长,银行家等),向专家提这样的问题:“如果这种生意 做100次,你认

6、为会成功几次? ”专家回答:“成功次数不会太多,大约60次。” 这时P (A) = 0.6是专家的主观概率,可此专家还不是决策者,过分谨慎的。决策 者决定修改专家的估计,把0.6提高到0.7。这样P(A) = 0.7就是决策者自己的主 观概率。(3)通过向多位专家咨询后,经修正和综合获得主观概率例3.3某公司再决定是否成产某种新产品时,想估计该产品在未来市场上的畅销 (记为A)的概率是多少,为此公司经理召集设计,财会,推销和质量管理等方 面人员的座谈会,仔细分析影响新产品销路的各种因素,大家认为此新产品质量 好,只要定价合理,畅销可能性很大,而影响销路的主要因素是市场竞争。据了 解,还有一家工

7、厂(简称外厂)亦有生产此新产品的想法,该厂技术和设备都比 本厂强。经理在听取大家的分析后,向在座各位提出二个问题:(i)假如外厂不生产此新产品本公司的新产品畅销的可能性(即概率)有 多大?(ii)假如外厂要生产此新产品本公司的新产品畅销的可能性(即概率)有 多大?在座人员根据自己的经验各写了二个数,经理在计算了二个平均值后,略加 修改,提出自己的看法:在上述二种情况下,本公司新产品畅销概率各为0.9和 0.4,这是经理在征求多位专家意见后所获得的主观概率。另根据本公司情报部 门报告,外厂正忙于另一项产品开发,很可能无暇顾及生产此新产品。经理据此 认为外厂将生产此新产品的概率为0.3,不产此新产

8、品的概率为0.7。利用上面4个主观概率,由全概率公式可得本公司生产此新产品获畅销的概率为0.9 x 0.7 + 0.4 x 0.3 = 0.75注意:1)向专家提的问题要设计好,既要使专家易懂又要使专家回答不是模棱两可。2)要对专家本人比较了解,以便做出修正,形成决策者自己的主观概率。3)通过向多位专家咨询后,经修正和综合获得主观概率,关键在于把问题设计 好,便于往后综合,即在提出问题时,就要想到如何综合。(4)假如有历史数据,要尽量利用,帮助形成初步概念,然后再做一些对比修 正,再形成个人信念。例3.4某公司经营儿童玩具好多年,今设计了一种新式玩具将投入市场。现要估计 此新式玩具在未来市场上

9、的销售情况。经理查阅了本公司过去37种新式玩具的 销售记录,得知销售状态是畅销(队)、一般(气)、滞销(气)分别有29, 6, 2种,于是算得过去新式玩具的三种销售状态的概率分别为29 = 0.784, = 0.162 , = 0.054373737考虑到这次设计玩具不仅外形新颖,而且在开发儿童智力上有显著突破,经理认 为此种新玩具会更畅销一些,滞销可能性更小,故对上述概率作了修改,提出自 己的主观概率如下:P(A ) = 0.85, P(A ) = 0.14, P(A ) = 0.01123根据经验和历史资料等先验信息给出主观概率没有什么固定的模式。但是其 所确定的主观概率都必须满足概率的三

10、条公理,即1)非负性2)正则性3)可列可加性当发现所确定的主观概率与这三条公理及其推出的性质有不和谐时,必须立 即修正,直到和谐为止。3.2利用先验信息确定先验分布在贝叶斯统计方法中关键的一步是确定先验分布。1、当总体参姬是离散时,即参数空间。只含有限个或可数个点时,可对。 中每个点确定一个主观概率。2、当总体参数。是连续时,即参数空间是实数轴或其上某个区间时,要构 造一个先验密度k(9 ),就有些困难了。当。的先验信息足够多时,下面有三个方法可供使用。321直方图法这个方法与一般的直方图法类似,步骤如下:1)把参数空间分成一些小区间。2)在每个小区间上决定主观概率或依据历史数据确定其频率。3

11、)绘制直方图。4)在直方图上做一条光滑的曲线,此曲线就是兀(0 )。下面举个例子:例3.6表3.1每周平均销售量统计表平均销售量(两)频率0,50.051(5, 100.259(10, 150.327(15, 200.224(20,250.095(25,300.044(30,350.001某药材店记录了吉林人参的每周销售量,现要寻找每周平均销售量0的概率分布。现用直方图法来确定它。1)把参数空间分成一些小区间。统计过去二年102个营业周的销售记录,每周平均销售量最高不超过35两。若以5两作为小区间长度,共分为7个小区 间。2)在每个小区间上决定主观概率或依据历史数据确定其频率。这里用的是 后者

12、,其频率见表3.1。3)绘制频率直方图。这里绘制的频率直方图见图3.1,其中纵坐标为频率/5。每周平均销售室的百方图4)在直方图上作一条光滑的曲线,此曲线就是k(9 )。在作光滑曲线时,尽 量在每个小区间上使用得曲线下的面积与直方图的面积相等。这条曲线已在图 3.1上画出,利用此曲线可求出一个单位区间上的概率,如P(20 6 21) = 1 x兀(20.5) = 0.03注意:这样得到的先验密度常常仅限于有限区间上,有时使用也不方便。下面这 种方法更为适用。322选定先验密度函数形式再估计其超参数要点:(1)根据先验信息选定6的先验密度函数的形式兀(6 )。(2)当先验分布中含有未知参数(即超

13、参数)时,给出超参数的估计值.注意:方法常用,但也极易误用。因为先验密度兀(6)的函数形式选用不当将会导 致以后推导失误。例3.7在例3.6中对周平均销售量6,选用正态分布N(日具2)作为先验分布,于是确 定先验分布问题就能转化为估计超参数口和,2的问题。这可从每周平均销售量统计表上作出估计。若对的每个小区间用其中点作代表,则可算得H和T 2的估计如下:日=2.5 x 0.051 +. + 32.5 x 0.001 = 13.4575t 2 = (2.5 -13.4574)2 x 0.051 +. + (32.5 -13.4574)2 x 0.001 = 36.0830这表明,该商店每周平均销

14、售量。的先验分布为N(13.4574,36.0830)。用此先验分 布可以算得:P(20 V0 v 21)2(21一13.4575)-(20一13.4575)=0.03506.00696.0069这个例子说明,若能从先验信息整理加工中获得前几阶先验矩,然后用其估计先 验分布的各个参数。在给定先验分布形式时决定其中先验参数的另一个方法是从 先验信息中获得几个分位数的统计值,然后选择先验分布中的参数使其尽可能地 接近这些分位数。下面再看一个例子。例3.8 设参数的取值0范围是(-8,8),它的先验分布具有正态分布形式。若从先验信 息可以得知: (1)先验中位数为0; (2)上下四分位数为-1和1,

15、即先验的0.25分位数和0.75分位数为-1和1。要确定先验分布N(四具2)中的超参数|1和T 2。对正态分布,均值和中位数相等故日=0另外由0.75分位数为1,可列出方程 P(0 1) = 0.75或P(0 / b 1/ b) = 0.75。查标准正态分布表可知1/ b= 0.675或。=1.481这样就可得先验分布为N(0,1.4812)o 另外,若设0的先验分布为柯西分布C(a, P),其密度函数为兀(0 | a, P)=k |p2 + (0 -a)2它的期望与方差都不存在,但其各分位数都有。由于柯西密度函数是关于a的对称函数,故其中位数是a。由已知条件知a= 0。另外由-1是1/4分位

16、数可得方-3-d0 = 1/4兀 P2+02由此可算得& =1。这时0的先验分布为柯西分布C(0,1)。这是标准柯西分布。这样一来,我们面临着二个先验分布都满足给定的先验信息。假如这二个先 验分布差异不大,对后验分布影响也不大,那可任选一个,假如面临着二个差异 极大的先验分布可供选择时,我们应慎重选择,因为不同的选择对后验分布影响 也会很大。如在本例中正态分布N(0,1.4812)与柯西分布C(0,1)在形状是很相似, 都是中间高,两边低,左右对称,但在二侧的尾部的粗细相差很大,正态分布的 尾部很细,柯西分布的尾部很粗,这就导致正态分布的各阶矩都存在,可柯西分 布连数学期望都不存在。因此在进一

17、步的选择前还要对先验信息进行分析,若先 验信息很分散,那就不宜选用正态分布,若先验信息较为集中,那就不宜选用柯 西分布。关于在一族先验分布中如何选择先验分布使后验分布波动不大。这个问 题被称作“稳健性”问题。323定分度法与变分度法定分度法:把参数可能取值的区间逐次分为长度相等的小区间,每次在每个 小区间上请专家给出主观概率。变分度法:该法是把参数可能取值的区间逐次分为机会相等的两个小区间, 这里的分点由专家确定。3.3利用边缘分布m确定先验密度331边缘分布m( x)设总体X的密度函数为p(x| 0),它含有未知参数。,若e的先验分布选用 形式已知的密度函数n (e),则可算得X的边缘分布(

18、即无条件分布)f p(尤10)兀(0)d。,0为连续时m=1支p(x 10)兀(0), 0为离散时(3.1)0e0当先验分布含有未知参数时,譬如n(e)=R(e|X),那么边缘分布m(x)依赖于入,可记为m(x|入)。例 3.10设总体X N( Q2),其中2已知,又设0的先验分布为N(,则可p(x 10) =exp 12冗1以算得边际分布m为N(气,; +2)(x0 )2 2 2冗(0) = - exp2 (0 七)2兀于是边际分布m( x)=二M exp1竺也 + (0 ,)2 d0 b 2时b2 = S 2 -b 2为最大点兀而若S 2 b 2时b 2 = S 2 -b 2 0则取b 2

19、 = 0为最大点71竺一2it N( ,b2),其中|! =1 Xx冗 冗冗 n ii=1,b2 = max0,S2 -b2. 713.4无信息先验分布贝叶斯统计的特点就在于利用先验信息(经验与历史数据)形成先验分布, 参与统计推断。它启发人们要充分挖掘周围的各种信息使统计推断更为有效。但 是从贝叶斯统计诞生之日开始就伴着一个“没有先验信息可利用的情况,如何确 定先验分布”。于是就有了无信息先验分布。所谓参数。的无信息先验分布是指除参数。的取值范围。和。在总体分布中的 地位之外,再也不包含。的任何信息的先验分布。3.4.1贝叶斯假设有人把“不包含。的任何信息这句话理解为对。的任何可能值,他都没有偏 爱,都是同样无知的。因此很自然地把。的取值范围上的“均匀分布看作。的先验 分布,即八一 C,0 G 0冗(0)= f C (3.9)、0,0 任 0其中是0的取值范围,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论