医学统计学第三章 常用概率分布_第1页
医学统计学第三章 常用概率分布_第2页
医学统计学第三章 常用概率分布_第3页
医学统计学第三章 常用概率分布_第4页
医学统计学第三章 常用概率分布_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章

常用概率分布1引言

在医学研究观察中,广泛存在随机现象,通常用随机变量取值描述或刻画这些随机现象。随机变量的分布常见的有三种类型:二项分布(binominaldistribution)Poisson分布(Poissondistribution)正态分布(normaldistribution)连续型变量离散型变量2连续型变量:可以在一个区间上任意取值的变量,即在忽略测量精度的情况下,连续型变量在理论上可以取到区间中的任意一个值,属于定量资料中的一种,通常含有测量单位。如身高、血糖等。离散型变量:变量的取值范围是有限个值或者一个数列,如红细胞计数、脉搏、住院天数、血型等。3【教学目的】掌握正态分布曲线的特征及应用了解正态分布的密度函数

4

第一节正态分布及其应用

【典型案例】【例1】随机调查某医院1402例待分娩孕妇,测得她们的体重。体重在各组段的频数分布见表2.1第2列,并求得体重落在各组段的频率(表2.1的第3列)。6表2.1某医院1402例分娩孕妇体重频数分布7【案例分析】

现以体重测量值为横轴,以频率与组距的比值(本例为频率/4,表2.1的第5列)为纵轴作出直方图。由于该直方图的纵轴表示在每个组段内单位长所占有的频率,相当于频率密度,因此我们将此图称为频率密度图(见图3.1)。8

图3.1体重频率密度图9一、正态分布的概念

若将各直条顶端的中点顺次连接起来,得到一条折线。当样本量n越来越大时,组段越分越细,此时直方渐进直条,这条折线就越来越接近于一条光滑的曲线(见图3.1),我们把这条呈中间高,两边低,左右基本对称的“钟型”曲

线称为正态分布曲线,近似于数学上的正态分布(高斯分布;Gauss)。10

图3.1体重频率密度图

图3.2概率密度曲线示意图11二、正态分布的密度函数

式中,μ为总体均数,σ为总体标准差,π为圆周率,e为自然对数的底,仅x为变量。当x确定后,f(x)为X相应的纵坐标高度,则X服从参数为μ和σ2的正态分布(normaldistribution),记作X~N(μ,σ2

)。12

一般地,若连续型随机变量,设其概率密度函数为,则X取值落在区间内的累积概率为概率密度曲线下位于的图形面积,等于其概率密度函数在到x上的积分,记作13

称为正态分布的分布函数。其值表示变量落在区间的概率,对应于从到x概率密度曲线下的阴影的面积(常称为左侧尾部面积),见图3.3。14图3.3正态分布的概率密度函数15

于是,利用分布函数可以计算正态分布变量取值在任意区间(a,b)的概率为

abxf(x)16P55917

1.集中性:正态曲线在横轴上方均数处最高。2.对称性:以均数为中心,左右对称。3.均匀变动性:正态曲线由均数所在处开始,以X轴为渐近线,分别向左右两侧逐渐均匀下降。

三、正态分布的特征184曲线在

处各有一个拐点,即曲线在

区间上是下凸的,在

区间

内是上凸的。5正态分布的图形由均数和标准差两个参数决定。位置参数μ;变异度参数σ。19

图3.4正态分布位置变换示意图20

图3.5正态分布形态变换示意图216.正态分布曲线下的面积分布有一定规律:正态曲线与横轴所夹的面积为1。位于内的面积为0.90;位于内的面积为0.95;位于内的面积为0.99。22图3.6正态分布曲线下面积分布规律示意图23四、标准正态分布

为了实际应用的方便,设Z=(x-μ)/σ,即将原点移到μ的位置,横轴尺度以σ为单位,使μ=0,σ=1,则将原正态分布变换为标准正态分布,N(0,1)。Z为标准正态变量或标准正态离差。24

正态分布标准正态分布25xms一般正态分布

=1Z标准正态分布26

统计学家对不同的z值编制了标准正态分布曲线下面积表(见附表1),这样一般正态分布N(μ,σ2)的概率计算问题借助于标准化变换,并通过查附表1就完全解决了。27标准正态分布的概率密度曲线与分布函数示意图28P55929

1.标准正态分布区间(-1,1)的面积占总面积的68.26%。2.标准正态分布区间(-1.96,1.96)的面积占总面积的95%。3.标准正态分布区间(-2.58,2.58)的面积占总面积的99%。标准正态分布曲线下面积规律30【例2】已知某地正常成年女子的血清总蛋白数服从正态分布,调查了该地110名正常成年女子,得样本血清总蛋白均数为72.8(g/L),标准差为3.8(g/L),试估计该地正常成年女子血清总蛋白介于66.0-75.0(g/L)之间的比例,以及110名正常成年女子中血清总蛋白介于66.0-75.0(g/L)之间的人数。31

解:本例由于是大样本,可用样本均数和样本标准差作为总体μ、σ

的估计值,即将该地正常成年女子的血清总蛋白数近似看作服从N(72.8,3.82)的正态分布。作如下标准化变换:32查标准正态分布表得:于是33

故估计该地区正常成年女子血清总蛋白介于66.0~75.0(g/L)之间的比例为68.23%。估计110名正常成年女子中血清总蛋白介于66.0~75.0(g/L)之间的人数约为人。341.制定医学参考值范围参考值范围(referencerange)是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定参考值范围时:(1)首先要确定一批样本含量足够大的“正常人(2)根据研究目的和使用要求选定适当的医学参考值范围(3)需根据专业知识确定单侧或双侧界值(4)根据资料分布特征选择合适的方法五、正态分布的应用35

双侧临界值:标准正态分布双侧尾部面积之和等于α时所对应的正侧变量值,记作Zα/2。

单侧临界值:标准正态分布单侧尾部面积等于α时所对应的正侧变量值,记作Zα。36

参考值范围的制定方法:(1)正态分布法适用于正态或近似正态分布资料;双侧界值单侧上界单侧下界37

参考值范围的制定方法:

(2)百分位数法:特别适用于偏态分布资料以及资料中一端或两端无确切数值的资料。如95%参考值范围:双侧界值:P

2.5和P

97.5

单侧上界:P

95

单侧下界:P

5

38

【例3】调查某地120名健康女性血红蛋白,直方图显示其分布近似正态分布,

试估计该地健康女性血红蛋白的95%参考值范围。39

因血红蛋白过高、过低均为异常,所以按双侧估计95%医学参考值范围:上限为:

下限为:40

注意:95%医学参考值范围仅告诉我们某特定人群中,95%的个体该指标测定值在此范围内,并不能说明在此范围内都“正常”;也不能说明凡不在此范围内都“不正常”,因此医学参考值范围在临床上只能作为参考。41表3.1常用参考值范围的制定42

【例4】

某地调查120名健康成年男性的第一秒肺通气量得均数=4.2(L),标准差S=0.7(L),试据此估计该地健康成年男子第一秒肺通气量的95%参考值范围。43

解由于该地健康成年男子第一秒肺通气量近似服从正态分布,可用正态分布法计算。因第一秒肺通气量仅过低属异常,故只需求出下限。即该地健康成年男子第一秒肺通气量的95%参考值范围为不低于3.05(L)。442.估计频数分布

45

为了控制实验中的检测误差,常以作为上下警戒值,以作为上下控制值。这里的2s和3s可视为1.96s和2.58s的约数。3.进行质量控制

4647(1)t分布、F分布、分布都是在正态分布的基础上推导出来的。(2)t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论