2 定量资料的统计描述课件_第1页
2 定量资料的统计描述课件_第2页
2 定量资料的统计描述课件_第3页
2 定量资料的统计描述课件_第4页
2 定量资料的统计描述课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章医学资料的统计描述

2定量资料的统计描述2定量资料的统计描述第一节定量资料的统计描述

2定量资料的统计描述教学目的和要求了解频数分布表/图的编制方法及用途;掌握定量资料集中趋势和离散趋势常用的统计描述指标及各自的适用条件。2定量资料的统计描述一、频数分布表与频数分布图二、集中趋势的统计描述三、离散趋势的统计描述讲授内容2定量资料的统计描述频数(率)分布表:将各变量值出现的频数(率)列表即称为频数(率)分布表。频数(率)分布图:将各变量值出现的频数(率)以图形的形式展现即称为频数(率)分布图。一、频数分布表与频数分布图

2定量资料的统计描述例3-1某单位132名正常成年女性血清总胆固醇(mmol/L)的测量结果如下:试对该定量资料的规律进行分析。2定量资料的统计描述2定量资料的统计描述1.求MAX、MIN、R

R=MAX-MIN

R=5.8-2.9=2.9(mmol/)2.求“组段”数,组段和组距

(1)“组段”数一般取10个左右;

(2)组距=R/预计的组段数;

(3)第一组段要包括MIN,最末组段包括MAX,并同时写出上下限。

本例i=R/10=0.29→0.33.列表划计2定量资料的统计描述表3-1132名正常成年女性血清总胆固醇(mmol/L)频数分布表2定量资料的统计描述图3-1132名正常成年女性血清总胆固醇频数分布图我一眼就看出,成年女性血清总胆固醇含量在4.1-4.4之间的人数最多!2定量资料的统计描述频数表的用途

1.揭示资料的分布类型对称分布:高峰位于中部,左右两侧的频数大体对称。正态分布为最常见的一种。偏态分布:正偏态分布—儿童疾病年龄分布;负偏态分布—老年疾病年龄分布。2定量资料的统计描述对称分布偏态分布正偏负偏频数分布高峰位于中部,左右两恻的频数大体对称。高峰偏于右侧,长尾向左侧延伸,则为负偏态。高峰偏于左侧,长尾向右侧延伸,则为正偏态2定量资料的统计描述表3-2某市238名健康人发汞含量图3-2238名健康人发汞频数分布图2定量资料的统计描述表3-3101名正常人血清肌红蛋白含量分布表图3-3101名正常人血清肌红蛋白频数分布图2定量资料的统计描述2描述分布的集中趋势和离散趋势集中趋势(centraltendency)

离散趋势(tendencyofdispersion)

当集中趋势与离散趋势结合起来时能全面反映频数的分布。3便于发现某些特大或特小的可疑值4图示法正态性判定

2定量资料的统计描述概念:集中趋势是指一组定量资料集中位置的特征值,反应一组观测值的平均水平。包括算术均数、几何均数、中位数、众数。二、集中趋势的统计描述2定量资料的统计描述均数(mean)1.概念:均数是算术均数(arithmeticmean)的简称,指n个性质相同的定量数据之和除以n所得的结果。总体均数用希腊字母μ表示,样本均数用表示。2定量资料的统计描述2.均数的计算(1)直接法:适用于观察值的个数较少时。2定量资料的统计描述例3-2某医师测得10名正常成年女性的总胆固醇(mmol/L)分别为3.52、5.48、4.39、4.21、3.56、3.87、5.69、4.69、4.25、3.82,求其平均总胆固醇水平。(mmol/L)2定量资料的统计描述(2)加权法:适用于样本例数较多时或者频数表资料。

各组段的频数组中值(下限+上限)/22定量资料的统计描述例3-3利用加权法计算表3-1资料的算术均数。表3-4某单位132名正常成年女性血清总胆固醇(mmol/L)(mmol/L)2定量资料的统计描述3.算术均数的应用场合:均数能反映全部观察值的平均数量水平,因而应用甚广。它适用于对称分布,特别是正态分布的定量资料。

2定量资料的统计描述4.均数的特性:(1)离均差总和等于零,即各变量值与均数差之和等于零。(2)离均差平方和最小。

2定量资料的统计描述几何均数G

1.概念:对n个性质相同的定量数据分别取对数变换后,按算术均数计算,然后再求其反对数所得的结果,叫几何均数。2定量资料的统计描述

2.计算(1)直接法:适用于观察值个数较少时。方法:将n个观察值(X1,X2,X3,……Xn)直接相乘再开n次方。

公式:几何均数:变量对数值的算术均数的反对数。2定量资料的统计描述例设有5份血清样品,滴度分别为:1:1,1:10,1:100,1:1000,1:10000求其平均滴度。2定量资料的统计描述

或G=lg-1((lg1+lg10+lg100+lg1000+lg10000)/5)=lg-1((0+1+2+3+4)/5)=lg-12=100即:平均滴度为1:100。2定量资料的统计描述(2)加权法用于样本量较大的频数表资料。可用下式计算:G=lg-1(ΣflgX/Σf)例有95名麻疹易感儿童,接种麻疹疫苗一个月后,血凝抑制抗体滴度见表3.4。试求平均滴度。

2定量资料的统计描述2定量资料的统计描述G=lg-1(ΣflgX/Σf)=lg-1(145.0948/95)=33.68

即:95名易感儿童接种疫苗一个月后,血凝抑制抗体的平均滴度为1:33.682定量资料的统计描述3.几何均数的应用场合几何均数适用于经对数转换后成对称分布的资料,或者说是等比资料,如抗体的滴度,血清效价等。

2定量资料的统计描述4.几何均数的特征(1)同一组资料计算的几何均数小于算术均数。(2)由于零和负数没有对数,含零或负数的资料不能直接计算几何均数。2定量资料的统计描述中位数和百分位数

1.概念:(1)中位数(median):把一组变量值从小到大排列,位于中间位置的变量值叫中位数,用M表示。(2)百分位数(percentile):为一种位置指标,一个PX将总体或样本的全部观察值分为两部分,理论上有X%的观察值比它小,(100-X)%的观察值比它大,P50分位数即是中位数。

MP50MinP0MaxP100PxX%(100-X)%2定量资料的统计描述2.计算方法:(1)直接由原始数据计算中位数n为奇数时n为偶数时2定量资料的统计描述2定量资料的统计描述(2)用频数表计算中位数及百分位数步骤:

按所分组段,由小到大计算累计频数和累计频率根据公式计算中位数及其它百分位数2定量资料的统计描述Px

所在组段的组距Px

所在组段的下限Px

所在组段的频数∑fL

为小于

L

的各组段累计频数计算中位数时,X=50,即M=P50。2定量资料的统计描述2定量资料的统计描述例3-8居住某市3年以上的常住人口中238名健康人的发汞含量见表3-5第(1)、(2)栏,试计算238名健康人平均的发汞含量,P25和P75。2定量资料的统计描述P50P752定量资料的统计描述2定量资料的统计描述3.应用(1)中位数(median):可用于任何分布的资料集中趋势的统计描述,但更常用于偏态分布资料、分布的一端或两端无确定数值时集中趋势的描述。2定量资料的统计描述(2)百分位数:

A、用于描述数据某一百分位的位置,最常用的是P50,即中位数;也可用两个百分位数的结合来描述一组资料的分布特征。B、用于确定参考值范围:

WBC95%参考值范围:P2.5—P97.5过高过低均异常肺活量95%参考值范围:P5过低异常尿铅95%参考值范围:P95过高异常。2定量资料的统计描述众数(mode):是一组数据中出现频率最高的那个数;一组数据的众数可以是1个,也可能有多个。2定量资料的统计描述无众数

原始数据:10591268一个众数

原始数据:65

9855多于一个众数

原始数据:2528283642422定量资料的统计描述中位数、算术均数和众数的关系

众数中位数算术均数众数中位数算术均数算术均数中位数众数正偏态分布对称分布负偏态分布2定量资料的统计描述例3-10某医师测量得8名男婴、8名女婴出生体重(kg)如下:男婴3.03.13.13.23.23.53.63.7女婴2.83.03.23.23.33.43.54.0平均水平相同,但变异程度不同三、离散趋势的统计描述

2定量资料的统计描述盘编号甲乙丙14404804902460490495350050050045405105055560520510合计250025002500均数500500500

例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)甲乙丙2定量资料的统计描述极差(Range,R)计算:R=极大值-极小值优点:简单明了缺点:1、R只考虑最大值和最小值之差,不能反映组内其它观察值的变异度;2、样本例数越多,抽到极大值和极小值的可能性越大,故例数悬殊时不易比较极差。2定量资料的统计描述四分位数间距(inter-quartilerange,

IQR

)计算:

意义及特点:类似R值,但比其稳定,考虑了中间50%观察值的变异度。缺点:未考虑全部观察值的变异度。P25P50P7525%25%25%25%2定量资料的统计描述2定量资料的统计描述方差(Variance)概念:1总体方差:一组性质相同的定量数据中的每一个与其总体算术均数的差的平方和除以数据个数,所得的结果叫做总体方差。2样本方差:一组性质相同的定量数据中的每一个与其样本算术均数的差的平方和除以数据个数与1的差值,所得的结果叫做样本方差。2定量资料的统计描述总体方差样本方差自由度,表示随机变量能自由取值的个数。2定量资料的统计描述

意义及特点:克服了R值的不足,考虑了每个变量值的离散情况并消除了N的影响。其单位是原度量单位的平方。2定量资料的统计描述标准差(Standarddeviation)概念:方差的单位为原单位平方,不便使用。为了应用的方便,对总体方差开平方——标准差。2定量资料的统计描述例3-11求例3-10中,8名男、女婴儿出生体重的标准差。2定量资料的统计描述例3-12计算例3-1中132名正常成年女性血清总胆固醇的标准差。2定量资料的统计描述标准差的应用:(1)表示变量分布的离散程度;(2)概略估计正态分布资料的频数分布;(3)结合样本含量,计算标准误;(4)结合均数,计算变异系数。2定量资料的统计描述变异系数(Coefficientofvariation,CV)概念:又叫变异度或离散系数,是同一组资料的标准差与均数之比。2定量资料的统计描述应用:CV为相对数,无单位,主要用于比较度量衡单位不同或均数相差悬殊的资料的变异度。其数值越小,说明观察值的变异度越小,均数的代表性越好。2定量资料的统计描述例某地7岁男孩身高的均数为123.10cm,标准差为4.71cm;体重的均数为22.29kg,标准差为2.26kg。试比较身高、体重何者变异度大。2定量资料的统计描述身高体重

由此可见,7岁男孩体重的变异度大于身高的变异度或者说身高比体重稳定。2定量资料的统计描述集中趋势

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论