二项分布与泊松分布_第1页
二项分布与泊松分布_第2页
二项分布与泊松分布_第3页
二项分布与泊松分布_第4页
二项分布与泊松分布_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、常用的离散型变量的概率分布和应用,二项分布和泊松分布贴喜公共卫生学院,第一节二项分布和总体率的估计,一、二项分布(一)二项分布的概念在生命科学研究中经常遇到一些,其结果可分为两种对立的类型,如一个患者微生物培养的阳性和阴性等,这些都可以根据有无某种性状的出现分为互不对立的事件。 这样的不是他的整个事件配置被称为“两项全部”。 第一节的二项分布和总体率的估计,二项分布是描述只有两个这种排他结果的离散型随机变量的规律性的概率分布。 这种分布规律是瑞士学者贝努利(伯努利)最初发现的,因此也称为贝努利分布。 二项分布有两个基本的假设:1.各事件相互独立,即是否发生任一事件,不影响其他事件的发生概率;2

2、 .各随机事件只能产生相互排斥的两个结果。 定理:几个独立事件同时发生的概率等于各独立事件的概率之积。 定理:在几个不兼容的事件中,发生任一事件的概率等于这些事件的概率之和。 抓住中的黑白的概率: P(2)=30.125=0.375,抓住中的三个黑球的概率: P(3)=0.50.50.5=0.125,分别对应于可能的结果的概率为:前例:=0. 8,1 -=0. 2,n=3,两个该事件a在n次试验中出现(二)二项分布的应用条件,一.各观察单位只有相互对立的一个结果,属于二项分类资料2 .发生某个结果的概率为,其对立结果的概率为1-。 实际工作中求出的是从大量观察中获得的比较稳定的数值,即3. n

3、个观察单位的观察结果彼此独立,即,每个观察单位的观察结果不影响其他观察单位的结果。 (3)二项分布的性质,1 .二项分布的平均数和标准偏差二项分布的平均数:=n上式的意思:进行n次独立实验,某事件的平均出现次数为n次,这一结果符合人的直观的想法。 如果男孩出生的概率是1/2的话,那么在100个新生儿中,n=1001/2=50个是男孩。 用率表示的话,=,(3)二项分布的性质,二项分布的标准偏差:标准偏差表示x取值的离散度和变异的大小。 例如,在n=5、=5/6、1-=1-5/6的情况下,(3)当二项分布的性质或二项分布的标准误差由比率或百分比表示时,标准误差成为称为速率的标准误差,并且随机采样

4、(3)二项分布的性质,二项分布的标准误差用比率和百分比表示的话,标准误差可以把:的实际工作常用的p作为的估计值得到: (3)二项分布的性质,2 .二项分布的累积概率常用的有左累积和右累积两种方法。 从整个阳性率中随机提取n个个体,(1)最大k例阳性的概率p(xk)=p(0)p(1)p(k)(2)k例阳性的概率p (xk )=p (k ) p (k1)p (n )=1- p (xk-1 )、(3)二项分布的性质,3 . 在=1- =1/2的情况下,二项分布的模式是对称的 1/2的情况下,二项分布的图形成为右偏置状态,和1- 不变的情况下,即使 1- ,随着n变大,二项分布的偏差程度逐渐降低,成为

5、对称的。二项分布整体为不同采样数时的采样分布、二项分布的应用、(一)、整体率的估计点值估计和区间估计。1调查表法: n小时,例如n50时,特别是p接近0或1时,可以直接从附表的6 %的置信区间表中检测出来。 P709 or p817例:在某地方输卵管结扎的育龄妇女通过壶腹部吻合术观察妊娠情况,发现6人怀孕,推测该吻合术女性怀孕的95%置信区间的例子: n=13,x=6调查中95%CI为19%75%。 二、二项分布的应用、(一)、总体率的估计1表法:附表中6 %的置信区间表显示了直接Xn/2的部分。 其馀部分可从n-x阴性部分的QLQU中进一步减去PLand pU PL=1-QL 1-QU例:在

6、某地方调查了儿童蛔虫感染情况,有10人的大便中有蛔虫卵,儿童蛔虫感染率的95%的置信区间是多少。 这个例子: n=50,x=10,95 % ci为10%34%。 2个分布的应用,2正规近似法:应用条件: np和n(1p )均为5 pusp例:在某地方随机提取329人,进行HBsAg检测,求出阳性率为8.81%,阳性率为95%的置信区间。 已知: p=8.81%,n=329,因此95%CI:8.811.961.56; 即,为5.75%11.87%。 另外,两个分布,下表是使用PUasp时所要求的p值和n的大小的参考数字。 pnnp0. 530150.4500.3800.20.16000.0570

7、,两种分布的应用,(2)差异显着性检查1有直接法例的医院治疗甲药病,其治愈率为70%,现在用乙药治疗该病10人,治愈9人, 众所周知,如果询问甲乙两药的疗效是否有差异的=0.7,1 -=0.3,假设两药的疗效没有差异,则治愈和非治愈的概率符合两种分布。 也就是说,甲乙两药的疗效没有差异的话,用甲药的治愈率(70% )用乙药治疗10人就治愈7人,实际上治愈9人,有2人差异。 双侧检定计算两人和两人以上不同的总概率,即, x9和x5的概率之和:p=0. 000006.00014470.009002 535-3535-3535-3535-3535-3535-3535-3535-3535-3535 此

8、时,p=p (9) p (10 )=0. 121061.028148=0.149309 p 0.05,没有统计学意义,不能认为乙药的效果比甲药好。 3 .在研究疾病的家族聚集性病例的公司,乙肝突然流行,调查的4人家有288户,其中没有病例的167户,1例51户,2例50户,3例17户,家庭发病的3户,询问乙肝的发病是否有家族聚集性的=214/14 清单比较实际家庭数和理论家庭数的差异是否有显着意义。 由于用二项分布展开计算表、二项分布适合度的2检验、2=91. 81、=组数-2=5-2=3调查2边界值时20.01(3)=11.345,因此可以认为P50时(20时)泊松分布近似于正态分布。 Po

9、isson分布整体的平均数不同时的采样分布,(3)poisson分布的性质,在n大、p小、np=一定时,2项分布接近泊松分布。 p越小,近似度越好。 例如:根据以往的经验,新生儿染色体异常率为1%,采用二项分布和泊松分布的原理,求出新生儿100人中x例(x=1,2,3,染色体异常发生的概率。 二项分布和泊松分布的比较,由上表可知,两者的计算结果非常接近,n越大,其接近程度越好,而泊松分布的P(X )计算越简便。 5. Poisson分布的可加性是相互独立的k个随机变量遵循泊松分布时,它们的和遵循泊松分布,它们的平均数是k个随机变量的平均数的和。 这被称为泊松分布的加法性。 例如:可知,某放射性

10、物质每10分钟的放射脉冲数显示泊松分布,5次的测定结果分别为35、34、36、38、34次,50分钟的总脉冲数为177次,显示泊松分布。 因此,泊松分布数据可利用可相加原理达到20,并可用正规近似法来处理。关于Poisson分布的应用、置信区间的估计小样本资料的泊松分布置信区间的估计,可查看附表7。 p448例从混合的自来水中提取1ml水,培养了5个细菌。 请估计原水每毫升的细菌数为95%的置信区间。 附表7 :样本计数x=5,95 % ci:1.611.7。 Poisson分布的应用、置信区间的估计可以用几乎正态分布法对大样本资料(X50 )的置信区间的估计进行,即,95%置信区间为: 99

11、%置信区间:例如,将相同的样本分别用10个平盘培养,合计得到菌落数1460个本例: X=1460/10=146 (个) 95%CI :即122.32169.68。 Poisson分布的应用、泊松分布的配合例:将培养皿中的细菌稀释液放置在血球计上,计数小斗中的细菌数,共计128斗,计数结果如下表所示。 这个分布符合泊松分布吗? 计数小方眼中表细菌的分布、Poisson分布的应用、计算过程:代替求出样品平均数,由泊松分布的概率式求出x=0、1、2、3、4时的概率P(X )。 本例=1.5234,代入式: P(0)=e- x/x!=e- 1.5234(1.5234)0/0!=0. 2180 p (1

12、)=e-1.5234 (1. 5234 )1/1!=0.3321 p (2)=e-1.5234 (1.5234 )2/2!=0. 2529 p (3)=e-1.5234 (1. 5234 )3/3!=0. 1284 p (3)=e-1.5234 (1. 5234 )4/4!=0.0489,还可以用以下递归式计算:管理: P(0) P(1) P(2) P(n)=1根例子:0. 2180.3321.25290.1284.048=0. 9803各组的概率P(X )乘以n,x=0,1,1 比较理论度数和实际度数(2-test ),判断该分布是否符合泊松分布。 Poisson分布适合度检定计算表,2=(

13、A-T)2/T=1.3606因为泊松分布适合使用n和,所以=组数-2=5-2=3。 检查2阈值,20.05(3)=7.81,因此P0.05的结论:实际分布和理论分布差异无统计学意义,可认为与泊松分布符合。 Poisson分布资料的显着检查,例如:某生物制剂的异常反应发生率一般在1/万左右,现在试验该生物制剂的新产品时,每100名受试者中就有一个异常反应,问该生物制剂的异常反应率是否高于一般。 如果假设新产品反应率与一般的反应率相同,则100人中的平均反应为H0: =0 =1001/10000=0.01本例=0.0001,较大为n=100,可以通过泊松分布近似计算,100人中也没有出现1例异常反

14、应在Poisson分布资料差异显着的100人中也没有出现1例异常反应的概率为,出现1例及1例以上的概率: p (x1 )=1- p (0)=1- 0.990050=0.009950 p50,用正规近似法进行了泊松分布的验证。 H0 :两培养基菌落数相同,H1 :两培养基菌落数不同。 =0.05。 对泊松分布资料进行显着性检查时,如果两样品的观察单位数相同,则x1、x2分别为两样品的各观察单位的计数之和。 两样品的观察单位数不同,检查时显着检查下式:Poisson分布资料的差异,本例在相同条件下培养了菌落数,因此认为观察单位数相等。 如果X1=100,X2=150,那么u0.01=2.58,所以P20的条件。 因此,可以利用泊松分布的加性来整合若干观察单位。 应用Poisson分布时应注意的问题是,在比较两平均数时,注意观察单位(时间、面积、容积、人口基数等)是否相同,不同的情况下,使用相同的观察单位后进行比较。 另外,不能把大单位变成小单位,把小单位变成大单位。 例如,人口基数不足10万的结果,比例地将基数扩大到10万的结果不合适。 并且,以人口10万人为观察单位时,两样品的平均数的差有显着性,与以人口1万人为观察单位时不同,两样品的平均数的差也有显着性。 因此,确定泊松分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论