




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 27 卷第 2 期大 学 数 学V ol .27 , .22011 年 4 月COLLEGE M A TH EM A TICSApr .2011贝叶斯公式的几个应用杨 静1 ,陈 冬1 ,程小红2(1.北京联合大学基础部, 北京 100101 ; 2 .首都师范大学初等教育学院, 北京 100080) 摘 要介绍了贝叶斯公式的一些应用实例及分析 , 以使在教学中能帮助学生更深入地理解该公式. 关键词贝叶斯公式;应用;案例 中图分类号 O 211 文献标识码 C 文章编号1672-1454(2011)02-0166-04在一般的概率统计课程的教学中 ,都会涉及到贝叶斯公式 .遗憾的是, 多数
2、教材对该公式的探讨都点到为止.同时,教材中所涉及到的应用又都过于单调.据此, 本文拟对由贝叶斯公式得到的结论作更深入的探讨以及提供更多类型的应用.通过贝叶斯公式, 我们看到, 某些看似合理的结论却往往蕴含着不合理.1 贝叶斯公式贝叶斯公式是英国学者托马斯 贝叶斯(Thomas Bayes , 1702 -1761)最早发现的, 首次发表在 1763 年 ,当时贝叶斯已经去世 , 其结果没有受到应有的重视.1774 年 , 法国数学家拉普拉斯(P .-s . Laplace , 1749 -1827)再一次总结了这一结果 .此后 ,人们逐渐认识到这个著名概率公式的重要性.现在,它已在疾病诊断、安
3、全监控、质量控制、安全部门的招募、药剂检测等方面发挥着重要的作用.贝叶斯公式 若事件B1 ,B2 , ,Bn 是样本空间的一个划分, P(B i)0 (i =1 ,2 , , n ),A 是任一事件且 P(A)0 , 则有P(BjA)=P(Bj )P(AB j ) (j =1 ,2 , , n ),(1)P(A)其中 , P(A)可由全概公式得到 .即nP(A)= P(B i)P(AB i).i =1本文主要应用贝叶斯公式的一种简单情形,即对任意两个事件 A 和 B ,根据贝叶斯公式有P(B A)=P(B)P(A B), P(A)其中(2)(3)P(A)=P(B)P(AB)+P(B )P(AB
4、).(4)这里 ,事件 B 的概率通常是根据以往的数据分析得到的 ,叫作先验概率,而 P(B A)是在获得新的信息后对先验概率作出重新的认识 ,称为后验概率 1 .后验概率体现了已有信息带来的知识更新, 经常用来分析事件发生的原因 . 收稿日期 2008-05-26 基金项目 “ 十一五” 国家课题“ 我国高校应用型人才培养模式研究”数学类子课题项目(F IB070335 -A 2-15-C)第 2 期杨静 ,等:贝叶斯公式的几个应用1672 贝叶斯公式的应用1 .疾病诊断 .贝叶斯公式在疾病诊断方面的应用很多 ,一般教材多采用这方面的例子.在此, 我们引入两个案例.并通过第一个案例, 对最后
5、的结果进行详尽的讨论 .资料显示, 某项艾滋病血液检测的灵敏度(即真有病的人检查为阳性)为 95 %, 而对没有得病的人这种检测的准确率(即没有病的人检查为阴性)为 99 %.美国是一个艾滋病比较流行的国家, 估计大约有千分之一的人患有这种病.为了能有效地控制、减缓艾滋病的传播 ,几年前有人建议对申请新婚登记的新婚夫妇进行这种血液检查 .该计划提出后 ,征询专家意见,遭到专家的强烈反对 ,计划没有被通过.现在我们用贝叶斯公式分析专家为何反对通过这项计划.设 A =检查为阳性,B =一个人患有艾滋病.根据文中叙述可知 ,P(B)=0 .001 ,P(A B)=0 .95 ,P(B )=1 -0
6、.001 =0 .999 ,P(A B )=1 -0 .99 =0 .01 .由(4)得P(A)=0 .001 0 .95 +0 .999 0 .01 =0 .01094 .根据公式(3),得到P(B A)=0 .001 0 .95 0 .087 . 0 .01094也就是说 ,被检测患有艾滋病而此人确实患有该病的概率大约为 0 .087 .这个结果使人难以接受 ,好像与实际不符.从资料显示来看 ,这种检测的精确性似乎很高.因此 ,一般人可能猜测, 如果一个人检测为阳性 ,他患有艾滋病的可能性很大 ,估计应在 90 %左右, 然而计算结果却仅为 8 .7%.如果通过这项计划,势必给申请登记的新
7、婚夫妇带来不必要的恐慌 .因为约有 91 .3%的人并没有患艾滋病.为什么会出现与直觉如此相悖的结果呢? 这是因为人们忽略了一些基础信息,就是患有艾滋病的概率很低,仅为千分之一.因此,在检测出呈阳性的人中大部分是没有患艾滋病的 .具体的说, 若从该地随机抽取 1000 个居民, 则根据经验概率的含义, 这 1000 个居民中大约有 1 人患有艾滋病 ,999 人未换艾滋病 .检查后 ,大约有 1 0 .95 +999 0 .01 =10 .94 个人检查为阳性,而在这个群体中真正患有艾滋病却仅有 1 人 .因此有必要进行进一步的检测 .但是 ,我们也应该注意到 ,这项检测还是为我们提供了一些新
8、的信息.计算结果表明 ,一个检测结果呈阳性的人患有艾滋病的概率从最初的 0 .001 增加到了 0 .087 ,这是原来患有艾滋病概率的 87 倍.进一步的计算, 我们得到一个检查呈阴性而患有艾滋病的概率为P(B A)=P(B)P(A B)=0 .001 0 .05 0 .00006 .P(A )0 .98906因此 ,通过这项检测, 检查呈阴性的人大可放宽心 , 他患有艾滋病的概率已从千分之一降低到十万分之六 .我们再举一个心理学研究中常被引用的例子:参加常规检查的 40 岁妇女患乳腺癌的概率是 1 %. 如果一个妇女有乳腺癌, 则她有 80 %的概率将接受早期胸部肿瘤 X 射线检查 .如果
9、一个妇女没有患乳腺癌 ,也有 9 .6%的概率将接受早期胸部肿瘤X 射线检查.在这一年龄群的常规检查中某妇女接受了早期胸部肿瘤 X 射线检查, 问她实际患乳腺癌的概率是多少? 2心理学家关心的是, 一个不懂贝叶斯原理的人对上述问题进行直觉推理时的情形是什么样的 ,并将他们的判断结果与贝叶斯公式计算的结果作比较来研究推理过程的规律.结果 ,95 %的内科医生的判断介于 70 %80 %,远远偏离正确答案 .设 B =患有乳腺癌, A =早期胸部肿瘤 X 射线检查.由资料知 P(B)=0 .01 , P(B )=0 .99 , P(A B)=0 .8 , P(A B )=0 .096 .由上面公式
10、(4), 有P(A)=P(B)P(A B)+P(B )P(A B )=0 .01 0 .8+0 .99 0 .096 =0 .10304 .利用上面公式(3),有P(B A)=0 .01 0 .8 =0 .0776 . 0 .10304168大 学 数 学第 27 卷由此可知 ,在这一年龄群的常规检查中某妇女接受了早期胸部肿瘤 X 射线检查, 她实际患乳腺癌的概率是 0 .0776 .2 .说谎了吗 ?测谎仪是用来检测一个人是否说谎的仪器,经常用于征兵、安全部门的筛查、侦破、诉讼等领域 .定义事件 T =“检测为一个人在说谎”, L =“一个人真正在说谎” .根据经验 , P(T L)=0 .
11、88 , P(T L ) =0 .86 .看起来 ,测谎仪比较精确 .假设在一次试验中, 检测出被测对象在说谎.按照上面所给资料 ,也许很多人都认为这个人说谎的概率会很高, 也许在 0 .87 左右 .然而 , 在安全部门的招募筛查中, 大多数人都是诚实的, 假设 P(L) =0 .01 , 根据公式(4),有P(T)=P(L)P(TL)+P(L )P(T L )= 0 .01 0 .88 +0 .99 0 .14= 0 .1474 .应用公式(3),有P(L)P(TL) 0 .01 0 .88P(LT)=P(T)= 0 .14740 .06 .从计算结果来看 ,94 %的检测都是错误的 .如
12、果测谎试验导致被检测者逮捕或被指控 ,后果该有多么严重! 这也显示了在一般人群中使用这种筛查的危险性 .如果检验用在嫌疑犯身上,危险性将大大降低.一般嫌疑犯说谎的概率都很高 ,假设 P(L)=0 .5 , 这时我们得到 P(L T)=0 .86 ,这个概率还是可以接受的 .3 .诉讼.1981 年 3 月 30 日 ,一个大学退学学生欣克利(Jo hn Hinckley Jr .)企图对里根总统行刺.他打伤了里根、里根的新闻秘书以及两个保安.在 1982 年宣判他时, 欣克利的辩护律师以精神病为理由作为其无罪的辩护 3 .作证的医师告诉法院当给被诊断为精神分裂症的人以 CA T 扫描时 ,扫描
13、显示 30 %的案例为脑萎缩 ,而给正常人以 CA T 扫描时 ,只有 2 %的扫描显示脑萎缩.欣克利的辩护律师试图拿欣克利的 CA T 扫描结果为证据,争辩说因为欣克利的扫描显示了脑萎缩, 他极有可能患有精神病, 从而应免受到法院的起诉.让我们尝试用贝叶斯方法对欣克利是否患有精神病作出判断.一般地 ,在美国精神分裂症的发病率大约为 1 .5%.设 A =CAT 扫描显示脑萎缩;B =做扫描的人患有精神病.根据上文的叙述可知,P(B)=0 .015 ,P(A B)=0 .3 ,P(B )=1 -0 .015 =0 .985 ,P(A B )=0 .02 .由上面公式(4),得P(A)=0 .0
14、15 0 .3 +0 .985 0 .02 =0 .0242 ,再由公式(3),有P(B A)=0 .015 0 .3 =0 .186 . 0 .0242这意味着即使欣克利的扫描显示了脑萎缩,他也只有 18 .6%的可能患有精神病, 因此 CA T 扫描无法作为其无罪的证据 .4 .企业资质评判 .在市场经济条件下, 一些大的建筑工程都实行招投标制.在发包过程中, 对参加招标的施工企业的资质(含施工质量信誉等)进行调查和评定是非常重要的 .设 B =被调查的施工企业资质不好, A =被调查的施工企业资质评定为不好.由过去的资料知 P(A B)=0 .97 , P(A B )=0 .95 .现已
15、知,在被调查的施工企业当中有 6 %确实资质不好,我们来看一下评定为资质不好的施工企业确实资质不好的概率.由上面公式(4),有P(A)=P(B)P(A B)+P(B )P(A B )=0 .06 0 .97 +0 .94 0 .05 =0 .105 .第 2 期杨静 ,等:贝叶斯公式的几个应用169利用上面公式(3),有P(B A)=0 .06 0 .97 =0 .55 .0 .105由此可知, 被评为资质不好的施工企业中 ,真正不好的约占 55 %,也就是说 ,误评的可能性相当大.所以不能对评为不好的企业轻易下不发包的结论 .为了使发包工作公正合理地进行 ,一般应从其他方面对这些企业进行深入
16、了解 ,再作决定.3总结在教学中应提醒学生以下两个方面 .第一、必须注意事件的基础概率, 即事件的先验概率 .基础概率小的事件 ,即使某种条件概率 ,如 P(A Bi)较高 ,其出现的概率仍然是较小的 .如现实生活中中奖的机会就是小概率事件.第二、应该对信息的外部表征作理性的分析 ,不应被一些表面特征所迷惑 ,如条件概率的高低并不决定某一事件出现概率的高低 . 参 考 文 献 1余家林.概率论及试验统计 M .北京:高等教育出版社, 2001, 22 . 2 K ahneman D , et al .Judg eme nt unde r uncertainty :H euristics and
17、 biases M .Cambridg e :Cambridg e Univ ersity P ress, 1982 :249 . 3陈伟.欣克利行刺案与美苏冷战结束 J .书屋, 2005(10):65 -72.Some Applications of Bayesian FormulaY ANG J ing1 ,CHE N Dong 1 ,CHE NG X iao-hong2(1 .De partment o f Basic Subjects, Beijing Unio n U niv erstiy , Beijing 100101 , China ; 2.Elementary Educa tional Co lleg e , Capital No rmal
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酒店早茶承包协议书
- 邓州房屋认定协议书
- 分公司私下入股协议书
- 超市索赔和解协议书
- 转让手工工厂协议书
- 退租装修恢复协议书
- 高校帮扶县区协议书
- 金融公司代理协议书
- 餐饮经营占股协议书
- 车辆带人免责协议书
- 赛格电缆产品手册2017起草稿
- 铁塔采购评审专家培训测试试题附答案
- 义务教育生物课程标准(2022版)测试题及答案
- (公共政策导论讲稿)课件
- 【教学课件】第六章 熟悉而陌生的力 第一节 力 精品课件
- 国家开放大学(电大)《现代企业管理》形考、终考及答案
- 电力拖动自动控制系统-运动控制系统期末试卷附答案共6套
- 你好,无废校园主题班会
- DB21 3176-2019 农村生活污水处理设施水污染物排放标准
- (完整版)英语写作期末试题和答案解析
- 广西建设工程造价咨询服务行业收费参考标准
评论
0/150
提交评论