二项分布以及其应用_第1页
二项分布以及其应用_第2页
二项分布以及其应用_第3页
二项分布以及其应用_第4页
二项分布以及其应用_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于二项分布及其应用第1页,共43页,2022年,5月20日,18点7分,星期四内容提纲二项分布的概念及应用条件二项分布的性质二项分布的特点二项分布的应用 第2页,共43页,2022年,5月20日,18点7分,星期四举例:设小白鼠接受一定剂量的某种毒物染毒后死亡率为80%。若每组各用3只小白鼠(甲、乙、丙)接受该种毒物染毒,观察各组小白鼠的存亡情况。一、二项分布的概念及应用条件第3页,共43页,2022年,5月20日,18点7分,星期四概率的乘法原理:几个相互独立的事件同时发生的概率等于各事件发生概率的乘积。概率的加法原理:几个互不相容的事件至少发生其一的概率等于各事件发生概率的和。第4页,共

2、43页,2022年,5月20日,18点7分,星期四3只小白鼠存亡的排列和组合方式及其概率的计算 该例题中各种组合的概率恰好等于该二项式展开式的各项,所以将n次这种只具有两种互相对立结果中一种的随机实验成功次数的概率分布称为二项分布。第5页,共43页,2022年,5月20日,18点7分,星期四该例题中各种组合的概率恰好等于该二项式展开式的各项,所以将n次这种只具有两种互相对立结果中一种的随机实验成功次数的概率分布称为二项分布。第6页,共43页,2022年,5月20日,18点7分,星期四第7页,共43页,2022年,5月20日,18点7分,星期四例. 求前例中三只小白鼠死亡2只的概率。第8页,共4

3、3页,2022年,5月20日,18点7分,星期四一、二项分布的概念及应用条件1、概念:若试验 E 只有两种相互对立的结果(A及 ),并且 , , 把 E 独立地重复 n 次的试验称为 n 重贝努里试验(Bernoulli trial)。 n 重贝努里试验中事件A发生的次数 x 所服从的分布即为二项分布(binomial distribution),记为 x B( , n )。 例 抛硬币(正/反),患者治疗后的结局(治愈/未愈),实验动物染毒后结局(生存/死亡),。第9页,共43页,2022年,5月20日,18点7分,星期四2、应用条件: n次试验相互独立 ( n 个观察单位相互独立)。 每次

4、试验只有两种可能结果中的某一种(适用 于二分类资料)。 每次试验发生某一种结果的概率 固定不变 (要求各观察单位同质)。一、二项分布的概念及应用条件第10页,共43页,2022年,5月20日,18点7分,星期四设从概率为的总体中随机抽取样本量为n的样本,每个样本的事件发生数为x,则 x B(,n)。可以证明:若用相对数表示,即样本率的均数和标准差分别为:二、二项分布的性质(一)均数和标准差第11页,共43页,2022年,5月20日,18点7分,星期四率的标准误(standard error of rate):(理论值)(实际值)第12页,共43页,2022年,5月20日,18点7分,星期四(二

5、)二项分布的累计概率从阳性率为 的总体中随机抽取n个观察单位,则(1)最多有k例阳性的概率为 (2)最少有k例阳性的概率为 第13页,共43页,2022年,5月20日,18点7分,星期四(三)二项分布的图形xpn=5, =0.5n=10, =0.5xn=20, =0.5n=30, =0.5第14页,共43页,2022年,5月20日,18点7分,星期四n=5, =0.3n=10, =0.3n=20, =0.3n=50, =0.3第15页,共43页,2022年,5月20日,18点7分,星期四=0.2, n=50=0.2, n=20=0.2, n=5=0.2, n=10=0.2, n=20第16页,

6、共43页,2022年,5月20日,18点7分,星期四(四)二项分布的特点1、当 时,无论 n大小,其图形均呈对称分布;2、当 ,且n小时 呈偏态分布;随n不断增大,逐渐趋于对称分布;当 时,逼近正态分布。 实际工作中,只要n足够大,与1- 均不太小时(通常规定 且 与 时),可看作近似正态分布,即 或 且n小时n 50第17页,共43页,2022年,5月20日,18点7分,星期四二项分布的正态近似示意图第18页,共43页,2022年,5月20日,18点7分,星期四二项分布的累计概率:k1k2第19页,共43页,2022年,5月20日,18点7分,星期四三、二项分布的应用(一)估计总体率的可信区

7、间1、率的抽样误差 (理论值) (估计值)2、总体率的区间估计第20页,共43页,2022年,5月20日,18点7分,星期四2、总体率的区间估计(1)查表法样本量较小时(n50)例3.6 某医院皮肤科医师用某种药物治疗20名系统性红斑狼疮患者,其中8人近期有效,求该法近期有效率的95%可信区间。用n=20和x=8查附表7.2百分率的可信区间得该法近期有效率的95%可信区间为19%64%。由于附表7百分率的可信区间中值只列出了x n/2的部分,当xn/2时,应以n -x查表,再从100中减去查得的数值即为所求可信区间。三、二项分布的应用第21页,共43页,2022年,5月20日,18点7分,星期

8、四2、总体率的区间估计(2)正态近似法当样本含量足够大,且样本率p和 1-p均不太小,一般 np与n(1-p)均大于5时,样本率的抽样分布近似正态分布,即此时, 总体率的可信区间可按下式进行估计:其中,三、二项分布的应用第22页,共43页,2022年,5月20日,18点7分,星期四三、二项分布的应用(二)假设检验1、样本率与已知总体率的比较:(1)直接计算概率法:例1 根据以往长期的实践,证明某常用药的治愈率为65%。现在某种新药的临床试验中,随机观察了10名用该新药的患者,治愈8人。问该新药的疗效是否比传统的常用药好?第23页,共43页,2022年,5月20日,18点7分,星期四(1)建立假

9、设,确定检验水准。 H0: = 0,即新药治愈率与传统药物相同 H1: 0,即新药治愈率高于传统药物 = 0.05(2)根据二项分布的分布规律,计算 P 值。H0成立时,随机抽查的10人中治愈人数x 的分布第24页,共43页,2022年,5月20日,18点7分,星期四(3) 做出推断结论。本例P 0.05,按=0. 05的检验水准不拒绝H0,尚不能认为新药疗效较传统药物疗效好。第25页,共43页,2022年,5月20日,18点7分,星期四例2 据以往经验,新生儿染色体异常率一般为1,某医生观察了当地400名新生儿,发现有1例染色体异常,问该地新生儿染色体异常率是否低于一般?H0成立时, 400

10、名新生儿中染色体异常例数的概率分布第26页,共43页,2022年,5月20日,18点7分,星期四(1)建立检验假设,确定检验水准 H0: = 0,即该地新生儿染色体异常率不低于一般 H1: 0.05,按 =0.05检验水准不拒绝H0,尚 不能认为该地新生儿染色体异常率低于一般。第27页,共43页,2022年,5月20日,18点7分,星期四1、样本率与已知总体率的比较:(2) 正态近似法: 当 n0 和 n(1-0) 均大于5时, 可用正态近似法, 按下式计算检验统计量u值。 或第28页,共43页,2022年,5月20日,18点7分,星期四例3 据报道,某常规疗法对某种疾病的治愈率为65%。现某

11、医生用中西医结合疗法治疗了100例该病患者,治愈了80人。问该中西医结合疗法的疗效是否比常规疗法好?当H0成立时, 100例患者中治愈人数的概率分布第29页,共43页,2022年,5月20日,18点7分,星期四(1)建立检验假设,确定检验水准 H0: = 0,即该种中西医结合疗法疗效与常规疗法相同 H1: 0,即该种中西医结合疗法疗效好于常规疗法 = 0.05 (2) 计算检验统计量 。本例, 0 =0.65,n=100, x=80 。 (3) 确定P值,做出推断结论。 查表得, 0.0005P 0,即老年胃溃疡患者胃出血发生率高于一般患者 = 0.05 (2) 计算检验统计量 。 (3) 确

12、定P值 , 做出推断结论。查表得, P0.05,按 =0.05检验水准不拒绝H0,尚不能认为该地新生儿染色体异常率与一般人群不同。第34页,共43页,2022年,5月20日,18点7分,星期四例3* 据报道,某常规疗法对某种疾病的治愈率为65%。现某医生为了解一种中西医结合疗法的疗效,用该中西医结合疗法治疗了100例该病患者,治愈了80人。问该中西医结合疗法的疗效是否与常规疗法相同?第35页,共43页,2022年,5月20日,18点7分,星期四建立检验假设,确定检验水准: H0: = 0,即中西医结合疗法与常规疗法疗效相同 H1: 0,即中西医结合疗法与常规疗法疗效不同 = 0.05若H0成立

13、时, 100人中治愈人数 xB(0.65,100),其中p(80)=0.00044,比其更极端的情形包括x80和x49。 按正态近似法对应的概率分别为P(u3.14)和P(u -3.14)。故P=(u1)+1-(u2)=2(u1)=0.00168。P0.05,故按=0.05水准拒绝H0, 接受H1,认为中西医结合疗法与常规疗法不同。第36页,共43页,2022年,5月20日,18点7分,星期四(1)建立检验假设,确定检验水准 H0: = 0,即该种中西医结合疗法疗效与常规疗法相同 H1: 0,即该种中西医结合疗法疗效好于常规疗法 = 0.05 (2) 计算检验统计量 。本例, 0 =0.65,

14、n=100, x=80 。 (3) 确定P值,做出推断结论。 查表得, 0.001P50,n250且n1p1, n1(1-p1), n2p2, n2(1-p2)均大于5) 时,可用u检验: 其中,p1, p2 分别为两样本率, pc为两样本的合并率: 第38页,共43页,2022年,5月20日,18点7分,星期四2、两样本率的比较例5 为研究高血压病的遗传度, 某医师进行了高血压子代患病率调查。其中父母双亲有一方患高血压者调查了205人,其中高血压患者101人;父母双亲均患高血压者调查了153人,其中高血压患者112人。问双亲中只有一方患高血压与双亲均患高血压的子代中,高血压患病率是否相同?第

15、39页,共43页,2022年,5月20日,18点7分,星期四(1)建立检验假设,确定检验水准 H0:1 = 2,即两组人群中子代患病率相同 H1: 1 2,即两组人群中子代患病率不同 = 0.05 (2)计算检验统计量 。 本例, p1=101/205=0.49268, p2=112/153=0.73203, pc =(101+112)/(205+153)=0.59497 。 (3) 确定P值, 做出推断结论。 查表得P0.0005,按 = 0.05水准拒绝H0, 接受H1,认为两组子代患病率不同,父母双亲均患病者子代高血压患病率高于单亲患病者。第40页,共43页,2022年,5月20日,18点7分,星期四例6.3 某研究者在某地区随机抽取10岁儿童100人,20岁青年120人,检查发现10岁儿童中有70人患龋齿,20岁青年中有60人患龋齿,问该地区10岁儿童与20岁青年患龋齿率是否相等?2、两样本率的比较第41页,共43页,2022年,5月20日,18点7分,星期四(1)建立检验假设,确定检验水准 H0:1 = 2,即两组人群龋患率相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论