卫生统计ppt课件 第四章常用概率分布_第1页
卫生统计ppt课件 第四章常用概率分布_第2页
卫生统计ppt课件 第四章常用概率分布_第3页
卫生统计ppt课件 第四章常用概率分布_第4页
卫生统计ppt课件 第四章常用概率分布_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章常用概率分布随机变量连续型取值无限不可列(通常为区间)离散型取值有限个概率分布:连续型分布和离散型分布。连续型分布:正态分布、t分布和F分布等。离散型分布:二项分布、Poisson分布和负二项分布。

常用概率分布二项分布(BinomialDistribution)泊松分布(PoissonDistribution)正态分布(NormalDistribution)第一节二项分布二项分布的概念1、二项分布:(

见书63页实验)

任意一次试验中,只有事件A发生和不发生两种可能结果,概率分别是:和1-。若在相同的条件下,进行n次独立重复试验(n重Bernoulli试验),用X表示这n次试验中事件A发生的次数,那么X服从二项分布,记做XB(n,)。

二项分布的应用条件1)、各观察单位只能具有互相独立的一种结果,如阳性或阴性,生存或死亡等。2)、已知发生某一结果的概率为π,其对立结果的概率则为(1-π)。3)n个观察单位观察结果相互独立。二项分布的概率

其他写法例4-2

临床上用针灸治疗某型头痛,有效的概率为60%,现以该法治疗3例,其中2例有效的概率是多大?治疗结果为有效和无效两类,每个患者是否有效不受其他病例的影响,有效概率均为0.6,符合二项分布条件。本例π=0.6,(1-π)=0.4,随机治疗3例,2例有效的概率是同理,有效数为各种可能情况的概率见下表4-1二项分布的特征1、二项分布的图形特征4-14-2图形特点:两个轴意义:X

、P(X)。对称性、与正态分布的关系

当π=0.5时,分布是对称的

当π

不等于0.5时,分布是偏态的,但随着n的增大,分布趋于对称。

当n足够大,且π不太靠近0或1,如nπ和n(1-π)均大于5时,二项分布则接近正态分布。2、二项分布的均数与标准差XB(n,)

X的总体均数

=

n

X的总体方差2=n(1-)

X的总体标准差:样本率的均数和标准差

例4-4已知某地钩虫感染率为6.7%,如果随机抽查150人,记样本钩虫感染率为p,求p的标准误本例n=150,π=0.067二项分布的应用1、概率估计例4-5

如果某地钩虫感染率为13%,随机观察当地150人,其中有10人感染钩虫的概率有多大?2、累计概率计算

例4-6

例4-5中某地钩虫感染率为13%,随机观察当地150人,其中至多有2人感染钩虫的概率有多大?至少有2人感染钩虫的概率有多大?至少有20人感染钩虫的概率有多大?至多有2人感染钩虫的概率为:至少有2人感染钩虫的概率为:至少有20人感染钩虫的概率为:第二节

Poisson分布

Poisson分布的概念1、Poisson分布最初用于二项分布概率的近似计算。当试验中阳性率π很小(如小于5%),n很大时,用二项分布计算阳性事件出现的概率比较麻烦,而Poisson分布有较好的近似效果。作为二项分布的一种极限情况,已发展成为描述小概率事件发生规律性的一种重要分布。盒子中装有999个黑棋子,一个白棋子,在一次抽样中,抽中白棋子的概率1/1000在100次抽样中,抽中1,2,…,10,…个白棋子的概率分别是……主要用于分析

人群中遗传缺陷、癌症等发病率很低的非传染性疾病的发病或患病人数的分布,也可用于研究单位时间内(或单位空间、容积内)某罕见事件发生次数的分布。放射性物质单位时间内的放射次数单位体积内粉尘的计数、单位空间中某种昆虫或野生动物数血细胞或微生物在显微镜下的计数、单位面积或容积内细菌计数人群中患病率很低的非传染性疾病的患病数2、Poisson分布的适用条件由于Poisson分布是二项分布的特例,所以,二项分布的三个条件也就是Poisson分布的适用条件。另外,单位时间、面积、空间或容积、人群中观察事件的分布应该均匀,否则,不符合Poisson分布。常用于描述单位时间、单位平面或单位空间中罕见“质点”总数的随机分布规律。罕见事件的发生数为X,X的概率P(X)为则X服从Poisson分布。记为:XΠ(λ)。

Poisson分布的总体均数为=λ=nπ

Poisson分布的特征1、Poisson分布的概率函数2、Poisson分布的性质1、总体均数与总体方差相等。

2、Poisson分布的可加性观察某一现象的发生数时,如果它呈Poisson分布,那么把若干个小单位合并为一个大单位后,其总计数亦呈Poisson分布。如果X1Π(λ1),X2Π(λ2),…XKΠ(λK),那么X=X1+X2+…+XK

,λ=λ1

+λ2

+…+λk,则XΠ(λ)。3、Poisson分布的图形Poisson分布的图形4-3Poisson分布的应用1、概率估计例4-7

实验显示某100cm2的培养皿平均菌落数为6个,试估计该培养皿菌落数等于3个的概率?该培养皿菌落数等于3个的概率

例4-8

如果某地居民脑血管疾病的患病概率为150/10万,那么调查该地1000名居民中有2人患脑血管疾病的概率有多大?该资料服从二项分布。由于π较小,n较大,可认为患先天性心脏病的人数近似服从Poisson分布,λ=nπ=1000×0.0015=1.52、单侧累计概率计算稀有事件发生次数至多为k的概率为稀有事件发生次数至少为k的概率为例4-9

实验显示某100cm2的培养皿平均菌落数为6个,试估计该培养皿菌落数小于3个的概率?大于1个的概率?该培养皿菌落数小于3个的概率菌落数大于1个的概率例4-10

例4-8中,至多有2人患脑血管疾病的概率有多大?至少有3人患脑血管疾病的概率有多大?至多有2人患脑血管疾病的概率至少有3人患脑血管疾病的概率第三节正态分布一、正态分布的概念:要研究某地1995年7岁男童身高分布规律,从该地随机抽取110名7岁男童测量得身高值如下。

114.4119.2124.7125.0115.0112.8120.2110.2120.9120.1125.5120.3122.3118.2116.7121.7116.8121.6115.2122.0121.7118.8121.8124.5121.7122.7116.3124.0119.0124.5121.8124.9130.0123.5128.1119.7126.1131.3123.8114.7122.2122.8128.6122.0132.5122.0123.5116.3126.1119.2126.4118.4121.0119.1116.9131.1120.4115.2118.0122.4114.3116.9126.4114.2127.2118.3127.8123.0117.4123.2119.9122.1120.4124.8122.1114.4120.5115.0122.8116.8125.8120.1124.8122.7119.4128.2124.1127.2120.0122.7118.3127.1122.5116.3125.1124.4112.3121.3127.0113.5118.8127.6125.2121.5122.5129.1122.6134.5118.3132.8身高(cm)频数112-3114-9116-9118-15120-18122-21124-14126-10128-4130-3132-2134-1361合计110110名7岁男童身高值频数表以身高为横坐标,以频数为纵坐标绘制直方图,由直条的高度反映频率的大小。当n=110,i=2cm时,绘制的直方图如下图。

1、正态分布:是一条高峰位于中央,两侧逐渐下降并完全对称,两端永远不与横轴相交的钟型曲线。2、正态密度函数:

-∞<X<+∞

3、正态分布曲线的特点

1)以为对称轴,左右完全对称。

2)在处,取最大值,在处有拐点。3)曲线下面积为1。

4、正态分布的两个参数

μ是位置参数,决定曲线在横轴上的位置。

σ是形状参数,决定曲线的形状。

用N(μ,σ)表示均数为μ,标准差为σ的正态分布。正态分布的两个参数

μ=0μ=1μ=2σ=1正态分布的两个参数

μ=-2μ=-1μ=0σ=1正态分布的两个参数

σ=2

σ=1.5σ=1μ=0二、正态曲线下面积分布规律

正态曲线下横轴上一定区间的面积占总面积的百分数,以反映该区间内的例数占总例数的百分数。面积通过积分而得:正态分布资料,理论上有:1)、μ±1σ的面积占曲线下总面积的

68.27%,即在该区间内包含68.27%的变量值。2)、μ±1.96σ的面积占曲线下总面积的

95%;即在该区间内包含95%的变量值。3)、μ±2.58σ的面积占曲线下总面积的

99%,即在该区间内包含99%的变量值。

某地110名7岁男童身高均数为121.5cm,标准差为4.72cm,利用正态曲线下面积分布规律估计其频数分布。身高范围估计频数比例%实际频数实际频率

(cm)(频率)%121.95±1(4.72)117.23—126.6768.277568.18121.95±1.96(4.72)112.70—131.2095.0010494.55121.95±2.58(4.72)121.95—134.1399.0010999.10标准正态分布

一、标准正态分布与标准化变换一切正态分布N(μ,σ)通过标准正态变换,成为服从μ=0,σ=1的标准正态分布。或

正态密度函数:式中的z称为标准正态变量。标准正态分布用N(0,1)表示。

二、标准正态分布表

本书附表1标准正态分布表,列出了标准正态曲线下-∞到z的左侧累计面积。求得z值后,查表得到标准正态曲线下的面积。

注意事项:

⑴当x、μ和σ已知时,应先求得z值后再查表。

⑵曲线下对称于0的区间,其面积相等。

⑶曲线下、横轴上的总面积为100%或1。

例4-12

某地1986年120名8岁男孩身高均数为123.02cm,标准差为4.79cm,试估计(1)该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比;(2)身高在120~128cm者占该地8岁男孩总数的百分比;(3)该地80%的男孩身高集中在哪个范围?第一问:首先计算130对应的Z值查附表1,φ(-1.46)=0.0721即理论上该地8岁男孩身高在130cm以上者占该地8岁男孩总数的7.21%。第二问:首先计算120和128对应的Z值查附表1,φ(-0.63)=0.2643。

φ(1.04)=1-φ(-1.04)=1-0.1492=0.8508正态曲线下区间(-0.63,1.04)的面积为φ(1.04)-φ(-0.63)=0.8508-0.2643=0.5865第三问:查附表1,找到左侧面积为0.1所对应的Z值,为-1.2880%的男孩身高集中在区间内,即116.9cm与129.2cm之间。

正态分布的应用一、估计频数分布:二、制定医学参考值范围:

1.参考值范围:是指医学上绝大多数正常人某项指标值的范围。

由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准,但不是“金标准”。

2.正常人:是指排除了所研究指标的疾病和有关影响因素的同质人群。3.单、双侧问题,常依据医学专业知识而定。双侧:血清总胆固醇无论过低或过高均属异常白细胞数无论过低或过高均属异常单侧上限:如:血清转氨酶、体内有毒物质过高异常(越低越好,<P95)单侧下限:如:肺活量过低异常(越高越好,>P5)

4、医学参考值范围有90%、95%、99%等,最常用的为95%

。计算医学参考值范围的常用方法:

1、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论