3变异程度的统计描述课件_第1页
3变异程度的统计描述课件_第2页
3变异程度的统计描述课件_第3页
3变异程度的统计描述课件_第4页
3变异程度的统计描述课件_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章变异程度的统计描述.1主要内容:第一节衡量变异程度的指标第二节正态分布及应用第三节医学参考值范围.2例3.1对甲乙2名高血压患者连续观察5天,测得的收缩压分别为:甲患者(mmHg):162145178142186乙患者(mmHg):164160163159166

.3两者收缩压之间的离散程度乙甲.4第一节衡量变异程度(或离散程度)的指标衡量变异程度大小的指标大体可以分为两类:按间距计算:

极差、四分位数间距按平均距离计算:离均差平方和、方差、标准差和变异系数.5一、极差和四分位数间距(一)极差(Range)也称全距,用符号R表示。R=最大值-最小值甲乙患者收缩压的极差分别为:

R甲=186-142=42(mmHg)R乙=166-159=7(mmHg)简单,仅仅利用了两端点的数据值,稳定性差。甲患者(mmHg):162145178142

186

乙患者(mmHg):164160163159

166

.6(二)四分位数间距(quartile,Q)把所有的观察值从小到大排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的25%,取中间50%观察值的数据范围。用符号Q表示,Q=P75-P25。最大值P25P75最小值25%25%50%四分位数间距.7例题:50-60岁正常女性血清甘油三酯含量的四分位数(教材13页)。Q=1.357-0.632=0.725(mg/dl)偏态分布资料、频数分布两端无确定数值时;资料的分布情况不明.8.9二、离均差平方和、方差、标准差和变异系数(一)平均偏差.10间接反映全体观察值的总偏差,表示离散程度。(二)离均差平方和(sumofsquare,SS)为了克服平均偏差不便于进一步运算的缺点,可以不通过去绝对值,而是通过取平方来正负抵消。.11反映一组数据的平均离散水平,平均每例变异的大小。(三)方差(meanofsquare,MS/Variance)n-1

为自由度(degreeoffreedom,df).12样本标准差用S表示,其度量单位与均数和原始值一致,所以最常用。(四)标准差(standarddeviation,SD或S)样本标准差.13标准差的公式还可以写成:利用频数表计算标准差的公式为:∑f=n.14对于例3.1(见教材16页)说明甲患者血压波动比乙患者血压波动大。.15红细胞数(×1012/L)组中值频数(f)fxfx23.8~3.9027.8030.424.00~4.10624.60100.864.20~4.301147.30203.394.40~4.5025112.50506.254.60~4.7032150.40706.884.80~4.9027132.30648.275.00~5.101786.70442.175.20~5.301368.90365.175.40~5.50422.00121.005.60~5.70211.4064.985.8~6.005.9015.9034.81合计140669.803224.20140名正常成年男子红细胞计数的标准差计算表.16标准差的意义和用途意义:说明资料的离散趋势(或变异程度),标准差的值越小,说明变异程度越小,均数对个体观测值的代表性越好。适合于对称分布尤其是正态分布资料。用途:1、用于计算变异系数;2、用于计算标准误;3、结合均值与正态分布的规律,估计参考值的范围。.17(五)变异系数(CoefficientofVariation,CV)主要用于度量单位不同的变量间;或均数差别较大的变量间变异程度的比较。.18例3.3测得某地成年人舒张压的均数为77.5mmHg,标准差为10.7mmHg;收缩压的均数为122.9mmHg,标准差为17.1mmHg。试比较舒张压和收缩压的变异程度。可见两种指标的变异度几乎没有什么差别。.19变异指标小结1.极差较粗,适合于任何分布;2.标准差与均数的单位相同,最常用,适合于正态分布;3.四分位数间距用于各类型分布的资料,但更适合偏态分布资料;4.变异系数主要用于单位不同或均数相差悬殊资料。平均指标和变异指标分别反映资料的不同特征,常配套使用正态分布:均数、标准差;偏态分布:中位数、四分位数间距。.20高斯(CarlFriedrichGauss)(1777年4月30日—1855年2月23日),德国著名数学家、物理学家、天文学家、大地测量学家。高斯被认为是最重要的数学家,有数学王子的美誉,并被誉为历史上伟大的数学家之一,和阿基米德、牛顿、欧拉并列,同享盛名。高斯第二节正态分布及应用.21高斯的肖像已经被印在从1989年至2001年流通的10德国马克的纸币上。.22.23正态曲线特征:是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。该曲线的函数表达式f(x)称为正态分布密度函数(probabilitydensityfunction,pdf)。一、正态分布.24习惯上用N(μ,σ2)表示均数为μ,标准差为σ的正态分布。.25.26(二)主要特征:1、正态分布以均值μ为中心,左右对称。2、正态分布中,曲线下面积集中在以均值μ为中心的中心部分,越远离中心,曲线越接近X轴,曲线下面积越小,超过一定范围以外的面积可以忽略。3、正态分布曲线下的面积分布是有规律的。.27累积面积可通过对概率密度函数f(X)积分求得(累积)分布函数:.28正态曲线下的面积规律-1.96+1.962.5%2.5%95%.29正态曲线下的面积规律-1.64+1.645%5%90%.30正态曲线下的面积规律-2.58+2.580.5%0.5%99%.31曲线下的面积有以下规律:曲线下横轴上的总面积为100%或1;μ±σ包含的面积为68.3%;μ±1.96σ包含的面积为95%;μ±2.58σ包含的面积为99%。.324、正态分布曲线完全由参数μ和σ决定。

μ是位置参数,决定分布曲线在横轴的偏移位置。

σ是变异参数,决定分布曲线的形态。.33方差相等、均数不等的正态分布图示312.34均数相等、方差不等的正态分布图示213.35二、标准正态分布(standardnormaldistribution)均数为0、标准差为1的正态分布。习惯上用N(μ,σ2)表示正态分布,那么标准正态分布可以表示为N(0,12)。Phi.36标准正态分布(累积)分布函数为:.37对于任何参数μ和σ的正态分布,都可以通过一个简单的变量变换化成标准正态分布,即:标准化.38X1u1.39为了方便,统计学家编制了标准正态分布曲线下面积分布表,通过查表可以得到u值左侧的面积。(见附表1)u-∞.40曲线下总面积为100%或1;±1包含的面积为68.3%;±1.96包含的面积为95%;±2.58包含的面积为99%。.41例题:成年男子的红细胞数近似服从正态分布,均数为4.78,标准差为0.38。若需要求出在4-5.5范围内所占的比例。(教材22页).420.2.4.6.81y34567x5.5.43.44三、正态分布的应用1、制定医学参考值范围2、质量控制正常情况下,测量误差服从正态分布。所以,一般以X±2S作为上、下警戒值,以X±3S作为上下控制值。3、多种统计方法的理论基础Χ2分布、t分布和F分布都是在正态分布的基础上推倒出来的,t分布、二项分布和Poisson分布的极限形式均为正态分布。.45第三节医学参考值范围医学参考值范围(referencevaluerange):指正常人体的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

由于存在生物个体变异,因此同属正常人也不能以某一个测量数据作为标准,而必须确定一个波动范围,但不是“金标准”。使用参考值的目的:一基于临床实践二基于预防医学实践一、医学参考值范围的概念.46二、医学参考值范围的制定方法(一)选择足够数量的正常人作为参照样本“正常人”的健康水平应有明确的界定,所谓正常不是指机体任何器官、组织的形态和功能都正常的人,而是指符合特定健康水平要求的人。例如:研究某市成人血铅的参考值范围,是以留住该市一年以上、无明显肝肾疾病,无铅作业或接触史的成人作为被研究的正常人总体。参照样本含量的确定没有统一的规则,一般认为至少应在120例以上。.47(二)对选定的正常人进行标准的测定严格控制检测误差;必须对测量条件做出统一的规定和说明。(三)决定取单侧范围还是双侧范围值.48

单侧下限---过低异常单侧上限---过高异常双侧---过高、过低均异常

单侧下限异常正常单侧上限异常正常异常正常双侧下限双侧上限异常如肺活量如尿铅值如体重.49(四)选择适当的百分范围最常用的百分界限是95%,也可以选80%、90%、99%等。.50.51正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图

.52正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图.53(五)估计参考值范围的界限方法:正态分布法和百分位数法1、正态分布法适用于正态或近似正态分布的资料。2、百分位数法适用于任何分布型的资料,特别是适用于偏态分布的资料。.54.55常用参考值范围

正态分布法百分位数法概率(%)双侧单侧双侧单侧下限上限下限上限90X±1.64SX-1.28SX+1.28SP5~P95P10P9095X±1.96SX-1.65SX+1.65SP2.5~P97.5P5P9599X±2.58SX-2.33SX+2.33SP0.5~P99.5P1P99.56例3.4若以算得某地正常成年男子红细胞数的均数为4.78×1012/L,标准差为0.38×1012/L,试估计该地成年男子红细胞数的95%参考值范围。分析:资料近似服从正态分布——选择正态分布法红细胞数过多过少均为异常———双侧参考值范围下限:X-1.96S=4.78-1.96×0.38=4.04(×1012/L)上限:X+1.96S=4.78+1.96×0.38=5.52(×1012/L)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论