离散变量分布与应用_第1页
离散变量分布与应用_第2页
离散变量分布与应用_第3页
离散变量分布与应用_第4页
离散变量分布与应用_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主要内容 二项分布的概率及定义 二项分布的性质 二项分布的应用 率的区间估计 两个样本率的比较 样本率与总体率的比较组合(组合(Combination):从个从个n元素元素中抽取中抽取x个元素组成一组(不考虑其个元素组成一组(不考虑其顺序)的组合方式个数记为顺序)的组合方式个数记为!()!nnkk nk 10100 33!(3)(2)(1)322!(32)!(2)(1)(1) 1010!(10)(9)(8)(7)(6)5!25255!(105)!5!(5)(4)(3)(2)(1)knnCk或二项展开式二项展开式2222)(bababa3223333)(babbaaba.?)(nba 01122

2、0121 1010().nnnnnnnnnnnnnnnkn kkkaba ba ba baba ba b二项分布的概念二项分布的概念 在医学卫生领域中的许多试验(或观察)中人们感兴趣的是某事件是否发生。 例如: 用白鼠作某药物的毒性试验,感兴趣的是白鼠是否死亡; 某新疗法临床试验,感兴趣的是患者是否治愈; 某指标的化验,感兴趣的是其结果是否呈阳性。 若称感兴趣的事件A出现为“成功”,不出现为“失败”,相应的这类试验就称为“成败型”试验或称为Bernoulli试验。 Bernoulli试验序列试验序列 三个条件 (1)每次试验结果,只能是两个互斥的结果之一(A或非A)。(2)每次试验的条件不变。

3、即每次试验中,结果A发生的概率不变,均为 。(3)各次试验独立。即一次试验出现什么样的结果与前面已出现的结果无关。 二项分布(二项分布(binomial distribution)是指在只)是指在只会产生两种可能结果如会产生两种可能结果如“阳性阳性”或或“阴性阴性”之一之一的的n次独立重复试验(称为次独立重复试验(称为n重重Bernoulli试验)中试验)中,当每次试验的,当每次试验的“阳性阳性”概率保持不变时,出现概率保持不变时,出现“阳性阳性”的次数的次数X=0,1,2,n的一种概率分的一种概率分布。布。二项分布的概念概率分布 一般地构成Bernoulli试验序列的n次试验中事件A出现的次

4、数X有概率分布 二项分布的两个参数 不同的n,不同的有不同的二项分布。 knknkkXp)1 ()()(n二项分布的性质二项分布的性质 二项分布的均数与方差二项分布的均数与方差 平均数为: n 标准差为:n(1-) 二项分布的概念所有可能结果每种结果的概率死亡数 生存数不同死亡数的概率甲 乙 丙 n-生 生 生0.20.20.2030.008生 生 死 0.20.20.8生 死 生0.20.80.2120.096死 生 生0.80.20.2生 死 死0.20.80.8死 生 死0.80.20.8210.384死 死 生0.80.80.2死 死 死0.80.80.8300.51211.000(1

5、)Xn XXnC 三只小白鼠存亡的排列和组合方式及其概率的计算(1)n XX 二项展开( 0.2 +0.8 )3 = 0.23 + 30.220.8 + 30.20.82 + 0.83生存概率死亡概率 三生二生一死一生二死 三死二项分布的概率 设事件A出现的概率为。则在n次独立试验中,事件A恰好出现 k 次的概率为: 对应于二项展开式:()(1)kkn knP XkC 011110(1)(1)(1)(1) (1)(1)nnnkkn knnnnCn 二项分布示意图 n=20,=0.5 n=5,=0.3 n=10,=0.3 n=30,=0.3 二项分布的图形X 4 8 12 16 0.0 0.1

6、0.2 0.3 0.4 n =20 =0.5 P(X) 0 2 4 n =5 =0.3 0 2 4 6 n =10 =0.3 4 8 12 16 n =30 =0.3 累计概率P(Xk) = P(X=0)+P(X=1)+P(X=k)P(Xk) = P(X=k)+P(X=k+1)+P(X=n)P(Xk) = 1 P(Xk+1)二项分布的均数和方差如果XB(n,p),则:的均数:的均数:的方差:的方差:的标准差:的标准差:2(1)(1)XXXnnn 2.3 率的抽样分布及其性质 在n足够大时,样本率 p 的分布近似正态分布。 率的均数和方差XB(n, p),p=X/n样本率的均数:样本率的均数:样

7、本率的标准差:样本率的标准差:(率的标准误率的标准误) (1)ppsn 3.1 率的可信区间估计=?n, Xp=X/nn 较大时, 可用正态近似法: 率的 95%的CI: 例7.7 n=329, X=29: p=29/329=0.0881, sp=0.0156 0.08811.960.0156=(0.0575, 0.1187) (5.75%, 11.87%) (1.96, 1.96)pppspsn 较小时, 查表法(直接计算概率法) 例7.5 n=25, X=3。p=12%. (3%, 31%) 例7.6 n=10, X=8。p=80%. 先查n=10, X1=2。p1=20%. (3%, 5

8、6%) 得: (1-56%, 1-3%)=(44%, 97%)率的可信区间的不对称性 0.1 0.2 0.3 0.5n10 045 356 7651981n20 132 64412542773n30 227 83915493169n40 324 93517473466n50 322103418453665率的可信区间的性质 只有=0.5时是对称的; n越大,区间越窄; 对同一n, 越接近0.5,分布越宽,越接近0或1,分布越窄;两样本率的比较( n 较大时) 例7.9 n1=80, X1=23; p1=28.75%;n2=85, X2=13; p2=15.29%.H0: 1 = 2; H1:

9、12 , =0.05 1212ppppus 121212120.28750.15292.0920.0643411(1)()0.06434ppppccppussppnn 因为u0.05=1.96,故按0.05水准,拒绝H0,接受H1,可以认为该地区男、女肺吸虫感染率不同,男性感染率高于女性。样本率与总体率的比较( n 较小时) 例7.8 0 = 0.01,p1=1/400,H0: 1 = 0; H1: 1 0 . =0.05(单侧)P(X1)=P(X=0)+P(X=1) =0.99400 + 4000.994000.01 =0.0905 (直接计算概率法)按0.05水准,不拒绝H0,尚不能认为该

10、地新生儿染色体异常率低与一般新生儿。样本率与总体率的比较( n 较大时)(1)ppun 二项分布的应用条件 各观察单位的观察结果只能是相互对立的两种结果之一; 某事件出现的概率不变; n次试验条件相同, n个观察对象同质,且相互之间不影响(例如,无传染性、聚集性等)。Poisson 分布的概念 Poisson分布主要用于描述在单位时间(空间)中稀有事件的发生数。医学卫生领域中有些指标服从Poisson分布, 例如:放射性物质在单位时间内的放射次数;在单位容积充分摇匀的水中的细菌数;野外单位空间中的某种昆虫数等。 Poisson 分布是一种离散型分布。 用以描述罕见事件发生次数的概率分布。 在医

11、学研究中,常见的观察例数n很大,但实际发生的数目很小的情况。 Poisson分布一般记作: ()Poisson分布的正态近似分布的正态近似 =3 =5 =10 =20Poisson分布的性质分布的性质 均数均数 Poisson分布只有一个参数 。这个参数就是Poisson分布的总体均数。不同的 对应于不同的Poisson分布。 方差方差 总体均数等于总体方差,它是Poisson分布的特征。计算公式 递推公式: exxXPx!)(11xXPxxXP样本率与总体率比较 设一般人群食管癌患病率为30/10万,某研究者为了解当地食管癌患病率是否高于一般人群,随机抽查当地500人,结果6人患食管癌。请作统计推断。 39140.00000001 0860.99999986-1! 515. 0! 415. 0! 315. 0! 215. 0! 115. 0! 015. 01615

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论