二章节常用统计指标计量资料统计描述课件_第1页
二章节常用统计指标计量资料统计描述课件_第2页
二章节常用统计指标计量资料统计描述课件_第3页
二章节常用统计指标计量资料统计描述课件_第4页
二章节常用统计指标计量资料统计描述课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 常用统计指标(计量资料的统计描述)第二节 平均数指标第三节 变异指标平均数(average )指标平均数指标的概念和作用概念:平均数表示一组同质计量数据集中趋势的位置和平均水平。作用:是一组计量数据平均水平的代表值(概括统计量);可作为不同组间的比较值医学中常用的平均数指标有:算数均数、几何均数、中位数(一)算术均数( mean)简称均数,用 表示. 公式适用频数为正态或近似正态分布的计量资料.基本公式(2-1,2-2)2.加权法公式适用条件1.直接法表2、160名正常成年女性血清甘油三酯分布组段 频数(f) 组中值(X) fx0.5- 3 0.55 1.650.6- 9 0.65 5

2、.850.7- 12 0.75 9.000.8- 13 0.85 11.050.9- 17 0.95 16.051.0- 18 1.05 18.901.1- 20 1.15 23.001.2- 18 1.25 22.501.3- 17 1.35 22.951.4- 13 1.45 18.851.5- 9 1.55 13.951.6- 8 1.65 13.201.7- 3 1.75 5.25合计 160 182.30(二)、几何均数 (Geometric mean)适用条件:X值呈倍数增长或部分数据偏离过大的正偏态分布资料。计算公式:例数较少用(2-3)频数表资料用(2-4)例2-5, 7名输血

3、后感染乙肝患者从输血至出现症状的时间如下:估计输血感染出现症状的平均时间如下:30,47,54,69,78,109,194天(天)(三)、中位数(Median)中位数(Md):适用于描述偏态分布资料的平均水平。(例)计算定义:将一组变量值由小到大依次排列,居以中间位置的观察值即为中位数,为这组数据的平均数。 X: 5, 5, 6, 7, 20(d) 位次 1 2 3 4 5 Md=6中位数的计算1.例数较少(公式2-5,2-6)2.频数表资料(公式 2-7)n为偶数n为奇数表2-6 102名3岁以下儿童LgA含量的中位数计算组段(d) 频数 累计频数 位次范围 0- 29 29 1-2915-

4、 32 61 30-61 30- 18 79 62-7945- 14 93 80-9360- 4 97 94-9775- 0 97 9790- 0 97 97105- 2 99 98-99120- 1 100 100135- 2 102 101-102合计 102中位数频数表计算步骤1.在频数表上计算累计频数2.用n50%计算中位数所在组段3.确定公式(2-7)中下限值(L)、组距(i)、频数(f)、累计频数(f)4.代入公式计算中位数。本例结论:某地102名3岁以下儿童lgA含量的中位数为25.3(ug/ml)。(四)、应用平均数的注意事项(见讲义16页)三、变异指标 描述计量数据间离散程度

5、的 指标 变异指标几个常用的变异指标(一)、极差(Range)或全距:用(R)表示,即一组数据的R=最大值 最小值意义:R值越大,表示该组数据的变异越大。缺点:数据利用不全,部分信息损失,在例数少时结果不稳定。(二)、百分位数与四分位数间距(percentile and quartile range)四分位间距:用Q表示,即一组数据用百分位数法计算的第75%位数与第25%位数之差。 Q=P75%-P25%常用于表示偏态分布的变异的指标。不同计量数据组间比较,此差距越大,表示变异越大。百分位数(PX%)法频数表计算频数表计算公式(2-8)例:P25:即第25%位数值,有25%的变量值小于P25

6、值,有75%的变量值高于P25值。表2-6 102名3岁以下儿童LgA含量的中位数计算组段(d) 频数 累计频数 位次范围 0- 29 29 1-2915- 32 61 30-61 30- 18 79 62-7945- 14 93 80-9360- 4 97 94-9775- 0 97 9790- 0 97 97105- 2 99 98-99120- 1 100 100135- 2 102 101-102合计 102例:四分位数间距计算例2-8四分位间距应用与中位数一起描述偏态分布的平均水平与变异情况。本例:四分位数间距(Q)=P75P25 =42.913.2=29.7结论:某地102名3岁以

7、下儿童lgA含量的中位数为25.3(ug/ml),四分位间距为29.7 (ug/ml)。.(三)标准差(Standard deviation)和方差(variance)用S或SD表示样本标准差,计算公式标准差的意义:表示一组数据的变异程度大小。当比较组单位相同时, S越大,表示一组数据间离散程度越大。反之越小。S2 为方差标准差的计算公式: (2-13)例数较少(2-14)频数表资料例:某检验科室三名检验人员对同一试验的5次重复结果如下: R S甲 20 21 22 23 24 22 4 1.58乙 18 20 22 24 26 22 8 3.16丙 16 19 22 25 28 22 12

8、4.74结论:三位检验员对该结果测定的平均水平为22,但测定值的稳定性(变异程度)不同,以丙测定的稳定性最差。表2-2 正常成年女性血清甘油三酯分布组段 频数(f) 组中值(X) fx fx2(1) (2) (3) (4) (3)(4)0.5- 3 0.55 1.65 0.90750.6- 9 0.65 5.85 3.78300.7- 12 0.75 9.00 6.75000.8- 13 0.85 11.05 9.39250.9- 17 0.951.0- 18 1.051.1- 20 1.151.2- 18 1.251.3- 17 1.35 . . . . . .1.7- 3 1.75 5.2

9、5合计 160 182.30 221.84某地7岁年龄组男童身高与体重 S CV(%)身高(cm)。 123.10 4.71 3.83体重(kg) 22.29 2.26 10.14结论: 7岁年龄组男童身高与体重值指标比较,体重指标的变异大于身高指标。变异指标的几点说明全距(R):可表达任意分布的变异大小。四分位间距:用于表达偏态分布的变异标准差(SD):用于正态或近似正态分布的变异(较常用的指标)。CV :主要用于单位不同时组间变异的比较。三、均数和变异指标的应用 在医学杂志中,常以 的形式列出,描述数据的平均水平和离散程度。 两组患者Pco2值的比较组别 n R CV(%) 肺心病组 12

10、 65.97 20.28 66 30.74慢支肺气肿 10 43.90 8.24 29 18.79中位数和百分位数的应用生存分析中,常用X25%、X50%、X75%做描述和比较。同一分位数越大,说明生存时间越长。例 儿科白血病患者生存时间(周) 生存分位数类型 例数 X25% X50% X75%ALL 542 32 73 146AUL 369 30 70 134AML 107 9 25 60 作业练习题(31页)习题1中的题习题4要求:计算题要求写出公式、步骤、结论。CASIO FX-100W计算器FX100计算器统计功能计算步骤 说明1. MODE MODE 1 进入统计功能模式2.SHIFT AC = 清除数据3. 55 M+ 数据输入 54 M+ 58 M+4 SHIFT 1 = 显示均数5. SHIFT 3 = 显示标准差(S)6. RCL C 显示例数7. RCL B 显示 二、频数表统计功能计算例数较多时计算均数方法1:例:X(年龄) 20 23 25 f: 10 5 3步骤同前:数据输入:20 SHIFT , 10 M+ 23 SHIFT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论