二项分布及其应用_第1页
二项分布及其应用_第2页
二项分布及其应用_第3页
二项分布及其应用_第4页
二项分布及其应用_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Department of Epidemiology and BiostatisticsSchool of Public Health, Nanjing Medical University 二项分布及其应用Binomial Distribution and Its Applications主要内容n预备知识n二项分布的概率n二项分布的性质n二项分布的图形n二项分布的应用率的区间估计两个样本率的比较样本率与总体率的比较n二项分布的应用条件预备知识n随机试验n随机事件n独立事件 乘法法则n互不相容事件 加法法则n二项展开式随机试验任何一个试验,满足:n可在相同条件下重复进行;n每次试验得到多个结

2、果;n每次试验前不能肯定这次试验将得到什么结果随机事件 随机试验的结果叫做随机事件互不相容事件 在一次随机试验中,两个事件不可能同时发生称互不相容事件。 P(A+B)=P(A)+P(B) 加法法则加法法则 A、B为互不相容事件 “A+B” 表示A发生/B发生 P(A+B)表示A发生/B发生的概率独立事件 一个事件发生的概率不受另外一个事件发生与否的影响。 P(AB)=P(A) P(B) 乘法法则乘法法则 P(AB)A发生并且B发生二项展开式11 1222111() nnnnnnXn XXnnnnnp qpC p qC pqC pqCpqq)!( !XnXnCXn 在医学上一些事物,其结局只有两

3、种互相对立的结果。如: 在毒理试验中,动物的生存与死亡; 在动物诱癌试验中,动物的发癌与不发癌; 在流行病学观察中,接触某危险因素的个体发病与不发病; 在临床治疗中,病人的治愈与未愈; 理化检验结果的阴性与阳性等等,均表现为两种互相对立的结果,每个个体的观察结果只能取其中之一。对这类事物常用二项分布(binomial distribution)进行描述。 n设小白鼠接受某种毒物一定剂量时,其死亡率为=80,则对于每只小白鼠而言,其死亡概率为=0.8,生存概率为1-=0.2。若每组各用三只小白鼠(分别计为甲、乙、丙),对每只鼠独立做实验,故各鼠的实验结果(生存或死亡)是互不影响的。观察每组小白鼠

4、存亡情况,如果计算生与死的顺序,则共有8种排列方式;如果只计生存与死亡的数目,则只有4种组合方式。 三只小白鼠存亡的排列和组合方式及其概率的计算 所有可能结果每种结果的概率死亡数生存数不同死亡数的概率甲、乙、丙XnX生 生 生0.20.20.2=0.008030.008生 生 死0.20.20.8=0.032生 死 生0.20.80.2=0.032120.096死 生 生0.80.20.2=0.032生 死 死0.20.80.8=0.128死 生 死0.80.20.8=0.128210.384死 死 生0.80.80.2=0.128死 死 死0.80.80.8=0.512300.5121.00

5、01.000( 0.2 +0.8 )3 = (0.2)3+3(0.2)2(0.8)+3(0.2)(0.8)2+(0.8)3 三生 二生一死 一生二死 三死nnnnXXnXnnnnnnnCCCC111222111)1 ()1 ( )1 ()1 ()1 ()1 ()!( !XnXnCXn1. 二项分布的概率n从阳性率为的总体中随机抽取含量为n的样本,恰有X例阳性的概率为:X=0,1,2,n 则称X服从参数为n和的二项分布(Binomial Distribution),记为:XB(n,)。其中参数 n由实验者确定,而常常是未知的。XXnXnCXP)1 ( )(2.1 二项分布的性质:均数和标准差n若

6、XB(n,),则211XXXnnn若均数与标准差不用绝对数而用率表示时 pnp)1 (nppsp)1 ( 2.2 二项分布的性质 :累积概率n累计概率(cumulative probability) n从阳性率为的总体中随机抽取n个个体,则最多有k例阳性的概率:最少有k例阳性的概率: =0,1,2,k,n。kkPPPXPkXP0)(.) 1 ()0()()( ) 1(1 )()(kXPXPkXPnkn递推公式)(11)1(XPXXnXPn例 据以往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为85,今有5个患者用该药治疗,问: 至少3人有效的概率为多少? 最多1人有效的概率为多少? 本例

7、 =0.85,l- =0.15,n =5, 至少3人有效的概率 P(X3)=P(3)+P(4)+P(5)=0.1381781250.3915046880.443705313=0.973388126 最多1人有效的概率为:P(X1)002227501. 085. 0)15. 0(15. 0) 1 ()0(15155CPP2.3 二项分布性质n在n足够大时,样本率近似服从正态分布;样本率p的均数等于;样本率p的标准差(率的标准误)1psn3. 二项分布的图形n正态分布或其它连续性分布中,常用分布曲线下的面积表示某区间的概率;n在二项分布中,则用线段的长短表示取某变量值时的概率; n以X为横坐标,以

8、P(X)为纵坐标作图,即可绘出二项分布的图形; n由图可见,给定n后,二项分布的形状取决参数的大小。 3. 二项分布的图形 4 8 12 16 0 2 4 0 2 4 6 4 8 12 16 X 0.0 0.1 0.2 0.3 0.4 n =20 =0.5 n =5 =0.3 n =10 =0.3 n =30 =0.3 P(X) 二项分布的图形n当=0.5时,分布对称;当 0.5,分布呈偏态;当0.5时分布呈负偏态;特别是当n值不是很大时,偏离0.5愈远,分布愈偏。n随着n的增大,二项分布逐渐逼近正态分布。如 =0.30,n=5和n=10时,图形呈偏态,当n=30时,图形已接近正态分布。一般地

9、说,如果n或n(1-)大于5时,常可用正态近似原理处理二项分布问题。4.1 二项分布的应用:区间估计n精确概率法,查表法,适用于n50时;n正态近似法,适用于n较大,p和1-p均不太小,如np和n(1-p)均大于5时。 此时总体率的1-可信区间如下/2/2,pppuspus二项分布的应用:区间估计n总体率的可信区间是不对称的,除非0.5;n随着样本含量n的增加,不对称性逐渐改善;n随着样本含量n的增加,可信区间的宽度逐渐变小;n对于相同的样本含量, 越接近0.5,区间越宽, 越接近0或1,区间越窄。4.2 二项分布的应用:率的假设检验n样本率与总体率的比较直接计算概率法n样本含量较小时,或样本

10、率较小时,如 np和n(1-p)均小于5正态近似法0001pun二项分布的应用:率的假设检验n新生儿染色体异常率0.01,随机抽取某地400名新生儿中有1名异常,问该地异常率是否低于一般?H0: 0.01;H1: ,不拒绝H0,尚不能认为该地异常率低于一般。400399101400!0.990.990.011! 399!0.0905P XP XP X二项分布的应用:率的假设检验n两样本率的比较正态近似法当n1,n2均较大,p1,p2,(1-p1),(1-p2)均不太小,如n1p1,n2p2,n1(1-p1),n2(1-p2)均大于5时,可用u检验。12121212111ppccppppusppnn二项分布的应用:率的假设检验n肺吸虫感染率:男生23(80),女生13(85),二者是否有差别?H0:1 = 2;H1: 1 2;=0.05n1=80,n1p1=23,n2=85,n2p2=13,pc=(23+13)/(80+85)=0.218

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论