第二章-正态分布课件_第1页
第二章-正态分布课件_第2页
第二章-正态分布课件_第3页
第二章-正态分布课件_第4页
第二章-正态分布课件_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计方法 Medical Statistics第 二 章数值变量资料的统计描述公共卫生学系 田玉慧复习总体与样本平均数与标准差各种平均数的应用条件离散指标标准差的应用一、正态分布的概念和特征二、正态分布曲线下面积分布规律三、标准正态分布四、正态分布的应用(一)制定医学参考值范围(二)正态分布是许多统计方法的理论基础(三)质量控制9.正态分布及其应用一、正态分布(normal distribution)图2-4 频数分布与正态分布曲线示意图f(X)一、正态分布(normal distribution) 正态分布是数理统计学中最重要的理论分布。医学中许多现象如身高、体重、血压、红细胞数等的频数

2、分布服从正态分布,或近似于正态分布,或经过数据转换可使其符合正态分布。即使是偏态分布的资料,当样本量很大时,也可以近似地用正态分布来处理。 一、正态分布(normal distribution) 正态分布以均数所在处频数最多,两侧逐渐减少,但永不为零,左右完全对称。其图形为近似钟形。 正态分布的表示方法为N(,2)。其中为均数,是正态分布的位置参数;2是方差,反映了正态分布的形态。有了这两个参数,即可绘制出正态分布的图形。 一、正态分布(normal distribution) 如果以总频数为1,当变量值为x时的频数可用下式求得: 一、正态分布(normal distribution) 例 设

3、某地成年男性身高的均数为170cm,标准差为7cm,成年女性身高的均数为165cm,标准差为5cm,均符合正态分布。试绘制频数分布图并比较二者的异同。 按上式计算x取不同值时的理论频数,结果见下表。 正态分布频数计算表 男性 女性 x f(x) x f(x) 1461501541581621661701741781821861901940.0001600.0009620.0041810.0131120.0296610.0484070.0569920.0484070.0296610.0131120.0041810.0009620.000160147150153156159162165168171

4、1741771801830.0001220.0008860.0044790.0157900.0388370.0666450.0797880.0666450.0388370.0157900.0044790.0008860.000122一、正态分布(normal distribution)将表中频数绘制成频数分布图 图2-5 正态分布参数位置变化示意图实例例1:中国成年人平均身高()男性=1.7米,女性=1.59米例2:正常人平均舒张压值 =80(mmhg) 高血压病平均舒张压值 =100 (mmhg )图2-6 正态分布变异度不同变化示意图一、正态分布(normal distribution)

5、男女身高的频数分布图形的比较: 1.共同点: 男女在不同身高的频数分布均为完全对称的钟形分布,以均数所在处频数最多,两侧逐渐减少。 2.不同点: 位置不同,男性身高的均数大于女性,故图形靠右; 高低不同,男性身高的方差大于女性,故变量值更分散,图形更低平。 医学上脑血管疾病的问题临床发现脑中风病人在脑血流图(CBF)指标偏低,正常人的CBF平均为75,标准差为17,如CBF低于40,认为有中风的危险。如用CBF低于40为界限,问一个脑血流图正常(无中风)被错误诊断中风的概率为多少?求:p(x40)的概率。二、正态分布曲线下的面积 如果以曲线下的总面积为1,则从-至x的面积可用下列积分公式求得:

6、 按上式求得的F(x)即当随机变量X取值范围为-x时所对应的正态曲线下的面积占总面积的比例,F(x)实际上反映了随机变量X取值范围为-x的概率大小,因此,称该正态分布为随机变量X的概率分布。 二、正态分布曲线下的面积 例 设某地成年男性身高的均数为170cm,标准差为7cm,假设该地共有成年男性10 000人,求该地身高不超过160cm者有多少人?又该地身高在160cm180cm之间者共有多少人? 正态分布曲线下面积的计算 二、正态分布曲线下的面积即:身高不超过160cm的人数为:10 0000.0764=764(人)身高在160cm180cm之间的人数为:10 000(0.9236-0.07

7、64)= 10 0000.8472= 8 472(人) 三、标准正态分布 由于不同随机变量的概率分布不同,要求得随机变量X取值范围为-至x的概率需要经过繁琐的计算,从而给实际应用带来困难。 如果将任一正态分布转化为同一个分布,则使问题大大简化。不同正态分布的差别在于其均数和标准差不同,如果把原来的随机变量值用相对数值表示,就可以解决这一问题。 三、标准正态分布 将各变量值的离均差与标准差比较,即离均差是标准差的多少倍,此值称标准单位(u),即该变量值在平均数之上或之下多少个标准差。 例如,如果某成年男性的身高为177cm,则离均差=177-170=7(cm),恰好等于标准差,其标准单位值为1,

8、即超过均数1个标准差。又如某成年男性的身高为156cm,其标准单位值为-2,即低于均数2个标准差。 三、标准正态分布 对于任一正态分布N(,2)作下列u变换: 则u值的分布为均数为0,标准差为1的正态分布,即标准正态分布(standard normal distribution)。 由于正态分布以均数所在处频数最多,两侧逐渐减少,左右完全对称,故u值的均数为0。又由于以原变量值的标准差为单位,故u值的标准差为1 三、标准正态分布 u值的分布图形为近似钟形。如果以总频数为1,不同u值时的频数(相当于概率)可用下式求得: 如果以曲线下的总面积为1,则从-至u的面积可用下列积分公式求得: 标准正态分

9、布u 值所对应的概率和曲线下的面积 三、标准正态分布 由于标准正态分布只有唯一的1条曲线,我们可以把从-至u取不同值时所对应的曲线的面积求出,列成表格(见表9-8 标准正态分布曲线下的面积),这样我们就不需要面积的积分公式,避免了繁琐的计算过程,从而能够比较轻松地解决正态分布的问题。 三、标准正态分布 例 设某地成年男性身高的均数为170cm,标准差为7cm,假设该地共有成年男性10 000人,求该地身高不超过160cm者有多少人?又该地身高在160cm180cm之间者共有多少人? 对于本例的问题,采用标准正态分布来解决就简单多了。 首先,计算x1=160cm和x2=180cm时的u值:标准正

10、态分布曲线下面积的计算 三、标准正态分布查表9-8(标准正态分布曲线下的面积)得:(-1.43)=0.0764身高不超过160cm的人数=10 0000.0764=764(人)由于标准正态分布左右完全对称,因此:(u)=1-(-u)(1.43)=1-0.0764=0.9236从u1至u2所对应的曲线下的面积=1-2(-u) 故身高在160cm180cm之间的人数为: 10 000(1-20.0764)=8472(人) 正态分布的特征正态曲线在横轴上方,且以均数所在处最高;越远离中心,曲线越接近X轴,曲线下的面积越小。正态分布以均数为中心,左右对称;X取值范围为-X, X离越远, f(X)越小,

11、但不会等于0。 正态分布的特征正态分布有两个参数: (位置参数):决定曲线在X轴上的位置(见图3-3)。 (变异参数):决定曲线的形态(见图3-4)。 正态分布的特征正态分布曲线下的面积有一定规律 (见图3-2)。 占95%的面积,即包含95% 的变量值占99%的面积,即包含99% 的变量值占68.27%的面积,即包含68.27%的变量值u= ( -1.96,1.96)区间内面积同理:u=(-2.58,2.58)区间的面积为0.99例3:如规定尾部面积各为5%时,其对应的u值为多少? 解: u=1.65u0.05/2=1.96 (双侧) u0.01/2=2.58(双侧)u0.05=1.64 (

12、单侧) u0.01=2.33(单侧)统计中常用尾部面积为的u值,记 ,称为u界值。表2-7 u界值表变量值分布 单侧 双侧范围(%) u值 u值80 0.84 1.2890 1.28 1.6495 1.64 1.9699 2.33 2.58变量值分布的范围表达X占的百分比(%)68.2795.0099.00 任意正态分布变量值(X)理论上分布规律医学常用的三个X 分布范围及u界值(1)X值分布范围四、正态分布的应用(一)估计频数分布(二)制定参考值范围(三)质量控制(四)正态分布是许多统计方法的理论基础四、正态分布的应用(三)利用正态分布进行质量控制 由于随机测量误差的分布符合以0为中心的正态

13、分布,假如对同一份样品采用同样的方法多次重复测定同一个指标,则所有测量值的分布符合以真实值为中心的正态分布。实验室检测质量控制 在实验室检测质量控制中,通常以 作为上下警戒值,以 作为上下控制值。这里2s和3s分别作为1.96s和2.58s的近似值。如果某个测量值超出了警戒值,该值与真实值之差仅由随机测量误差所致的可能性小于5%,这时需要对仪器、试剂等进行检查和校正,以消除可能导致系统误差的因素。如果某个测量值超出了控制线,该值与真实值之差仅由随机测量误差所致的可能性小于1%(具体地说是0.26%),可以认为存在系统误差,该测量值应当舍弃。 实验室检测质量控制质量控制图 (示意) 实验室检测质

14、量控制 临床实验室检测的质量控制也可以采用正常值均数质控图来进行。以血糖测定为例,根据大量正常血糖测量值计算得: =5.10 mmol/L,s =0.51 mmol/L,并绘制质控图。然后,在每天工作结束时,从当天测量结果在正常范围内的测量值中连续抄录510个值并计算均数,观察该均数是否超出警戒线或控制线。 实验室检测质量控制血糖测定的正常值均数质控图 四、正态分布的应用(四)正态分布是许多统计方法的理论基础1.其它一些分布在一定条件下也可以按正态分布做近似计算。如二项分布、泊松分布的极限形式就是正态分布。2.统计学中一些分布就是由正态分布推导出的,如统计学中常用的三大分布2分布、t 分布、F

15、分布等。3.许多资料都可经过转换成近似正态分布10、正常值范围 一、正常值的意义和制定步骤 正常参考值范围(normal reference ranges)是指正常人群中一些解剖、生理、生化指标及组织代谢产物含量等数据的正常波动范围 。 个体差异 生理变异二、医学参考值制定时注意问题1.确定诊断指标为“定性”或“定量”2.计量数据要确定其分布(正态或偏态)3.计量资料考虑制定单侧诊断界值还是双侧诊断界值4.有足够的样本例数(一般不低于100例) 1.从正常人总体中随机抽样 这里的“正常人”并非是指没有任何疾病的人,只要排除那些对所研究指标有影响的疾病或有关因素的人即可。例如,制定血压正常值范围

16、时,应将高血压病人及相关疾病的患者排除于研究对象之外,同时,研究对象在研究期间内不能有对血压有影响的因素,如情绪激动、大量运动等,也不能服用对血压有影响的药物。 另外,样本量要足够,每个人群组在100例以上。2.控制测量误差 测量方法、仪器、试剂、精密度、操作熟练程度等应统一。 一般应选用测量结果准确、可靠,并能为大多数医疗单位采用的检测仪器或方法。3.明确所研究指标的总体分布:(1)是否正态分布:正态检验(2)是否通过数据转换后成为近似正态分布(3)是否需要分组制定参考值范围,如男女红细胞分布不同,(4)再考虑其它方法:偏态时,用百分位数4.确定采用单侧界值还是双侧界值 如果该指标升高或降低

17、均有病理学意义,则需要制定双侧界值,如红细胞数、白细胞数等; 如果该指标升高时有病理学意义,而降低时无意义,只需要制定一个正常值上限,如尿铅值; 如果该指标降低时有病理学意义,而升高时无意义,只需要制定一个正常值下限,如肺活量。 5.选定适当的百分界限 即确定发生错误的概率()。一般取=0.05,即95%正常值范围,该范围将包含95%的正常观察值,也就是说有5%的正常观察值将被排除于该范围之外。 如果临床上要求尽量减少误诊,则应取较高的百分界限,如95%或99%;如果临床上要求尽量减少漏诊,则应取较低的百分界限,如90%或80%。三、正常值范围的正态分布法 如果所研究指标的总体分布符合正态分布

18、或近似于正态分布,可根据正态分布曲线下的面积分布规律,计算包含95%的观察值范围,即为95%正常值范围。计算公式为:三、正常值范围的正态分布法 表3-3 正态分布法计算医学参考值范围百分范围(%)单侧双侧下限上限下限上限9599如果所研究指标的总体分布符合正态分布或近似于正态分布,可根据正态分布曲线下的面积分布规律,单双侧正常值范围示意图 例 已知健康人群中血糖含量的频数分布近似于正态分布,今测定某地健康成人500名,得血糖均数为5.10 mmol/L,标准差为0.51 mmol /L,试估计该地健康成人血糖含量95%正常值范围。 本例需计算双侧正常值范围:上限: = 5.10+1.960.51=4.10(mmol/L)下限: = 5.10-1.960.51=6.10(mmol/L)即估计该地健康成人血糖含量95%正常值范围为: 4.106.10 mmol/L。 正常值范围的估计方法对数正态分布法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论