医学统计学计量资料的统计描述1_第1页
医学统计学计量资料的统计描述1_第2页
医学统计学计量资料的统计描述1_第3页
医学统计学计量资料的统计描述1_第4页
医学统计学计量资料的统计描述1_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第一篇 根本统计方法 第二章 计量资料的统计描述 第二军医大学卫生统计学教研室 孟 虹 本章的内容和重点第一节 频数分布第二节 集中趋势的描述第三节 离散趋势的描述第四节 正态分布第五节 医学参考值的制定重点: 掌握概念、方法的用途和适用条件 熟悉统计符号和公式 统计描述的意义 社会活动看似杂乱无章,对个体来说有很多不确定性,但总体上都是服从一些统计规律的。 医学工作有很多数据,统计学描述就是对这些数据进行加工和提炼,找出规律、预测未知。 统计描述是最简洁有力的语言。第二章 计量资料的统计描述概念:即用少量几个统计指标刻画出原始数据的特征称为统计描述。计量资料的统计描述方法: (单变量) 1

2、. 通过频数表描述数据特征 2.用统计指标 定量描述数据的特征。 表 100例高血压患者治疗后临床记录编号 年龄 性别 治疗组 舒张压 体温 疗效 X1 X2 X3 X4 X5 X6 1 37 男 A 11.27 37.5 显效 2 45 女 B 12.53 37.0 有效 3 43 男 A 10.93 36.5 有效 4 59 女 B 14.67 37.8 无效 100 54 男 B 16.80 37.6 无效 第一节 频数分布 一 、频数分布表频数分布表:将变量值分为不同数量的组段,清点各组段的例数。意义:概括了解变量值在各组段的分布和规律。例: 表2-1 例2-1 从某单位1999年的职

3、工体检资料中获得101名正常成年女子的血清总胆固醇mmol/L 的测量结果 2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.923.583.664.283.263.52.74.614.752.913.914.594.192.684.524.913.183.684.833.873.953.914.154.554.83.414.123.955.084.533.923.585.353.843.63.514.063.073.554.233.574.833.523.844.53.964.53.274.523.194.593.753.98

4、4.134.263.633.875.713.34.734.175.133.784.573.83.933.783.994.484.284.065.265.253.985.033.513.863.023.74.333.293.254.154.364.953.003.26 计量资料频数表的编制步骤例2-1数据 1.确定全距R=最大值 最小值2.定组数8-15组和组距:例3.写出组段的下限:第1组段值小于或等于最小变量值,并以整数0,5或2,4,6,8较好。如4.划计并计数:变量x归为L xU见表2-1组距i=全距R/组数表2-1 101名正常成年女性血清总胆固醇频数表 组段 频数f f% 合计 二

5、频数表及分布图的用途1. 通过频数表了解数据的分布特征。 X值分布情况:偏态或正态分布 取值情况:变量值取值范围 集中趋势:变量值集中位置。2.便于发现资料中的可疑值。3.组段的频率作为概率的估计。例:表2-1资料频数分布图直方图图2-1 101名正常成年女性血清总胆固醇频数分布频数血清总胆固醇正态分布图2-2 59名链球菌咽喉炎患者潜伏期正偏态分布讲义表2-4数据图2-3 负偏态分布例:某院出院患者住院天数的频数表组段天 频数f 0- 6 5- 2110- 1415- 1320- 625- 230- 335- 140及以上 13合计 79第二节 集中趋势的描述平均数指标的概念和作用概念:平均

6、数表示一组同质计量数据集中趋势的位置和平均水平。作用:是一组计量数据平均水平的代表值;可作为不同组间的比较值。医学中常用的平均数指标有:算数均数、几何均数、中位数一、算术均数( mean)简称均数,用 表示. 公式适用频数为正态或近似正态分布的计量资料.根本公式2-1,2-2加权法公式例数多适用条件表2-1 101名正常成年女性血清总胆固醇频数表 组段 频数f 组中值X fX 2.3- 1 2.45 2.9- 6 3.05 18.30 3.2- 8 3.35 合计 加权法公式计算频数f作为X值的权数二、几何均数 (Geometric mean) 适用条件:X值呈倍数增长或局部数据偏离过大偏态分

7、布正偏态资料。计算公式:直接法,例数较少用2-3加权法,(2-4)或 例2-4 某地5例微丝蚴血症患者治疗7年后用间接荧光抗体试验测得其抗体滴度分别为1/10,1/20,1/40,1/80,1/160,求几何均数。结论:平均抗体滴度为1:34几何均数法表2-5 69例RA患者血清EBV-lgG抗体测定结果滴度倒数 X 人数 f lgX flgX1041.00004.00002031.30103.903040101.602116.021080101.903119.0310160112.204124.2451320152.505137.5765640142.806239.28681280 23.1

8、072 6.2144合计69150.2778几何均数计算例2-5 :例数合计 结论:69例RA患者血清EBV-lgG抗体平均滴度为1:150.6三、中位数和百分位数一中位数 Median, M:适用于描述偏态分布资料的平均水平。如潜伏期、病程资料。计算定义: 将一组变量值由小到大依次排列,居以中间位次的观察值即为中位数,为这组数据的平均数。 X: 5, 5, 6, 7, 20d 位次 1 2 3 4 5中位数的计算1.例数较少公式2-5,2-6n为偶数n为奇数中位数优点:不受数据中极大或极小值的影响,取决于中间位置的数。二百分位数百分位数percentile是一种位置指标,用 表示。例 计算定

9、义:将一组变量值由小到大依次排列, 为第x百分位数的秩次, 其对应的变量值x为第x百分位数,记为Px。X: 1 5 8 10 48. 105秩次 1 2 3 4 50 100 x% 1% 2% 3% 4% 50% 100%一组数据(n=100),由小到大排列例:百分位数计算方法1.直接法不要求将样本值由小到大排队,用 确定Px的位次和PX。当 为带有小数位时用式: 当 为整数时 用式trunca表示对数字取其整数。 式式例:8位患者某病的住院天数: 2 2 2 3 3 4 5 6求50%位数和80%位数。解:第50%位次:nX%=80.5=4,用式 中位数=P50=3天第80%位次:nX,用公

10、式2.频数表法例数较多Lx :第X%位数所在组段的下限值ix :第X%位数所在组段的组距fx :第X%位数所在组段的频数 : 第X%位数所在组段上个组段的累计频数式中:2-9表2-5 118名链球菌咽喉炎患者的潜伏期天数人数累计频数累计频数%1241-43.424175-2117.8363222-5344.9482454-7765.360189580.5721210790.784511294.996411698.3108-2118100.0中位数所在组段计算频数表资料P25、P50和P951.计算x=25%和50%的位次2.按公式2-9计算 Px百分位数计算结果的应用1.常计算P25、P50

11、、P75、和P95,为临床治疗提供依据。例2-9:120名细菌性痢疾治愈的住院天数 P5天,即只有5%的人住院低于天。 P95=15天2.确定医学指标的参考值如P25天P50=51天中位数118名链球菌咽喉炎患者的潜伏期第三节、离散趋势的描述 描述计量资料数据间离散变异程度的指标 变异指标例2-11 三组同龄男孩的身高cm R 甲组 90 95 100 105 110 100 20 乙组 96 98 100 102 104 100 8 丙组 96 99 100 101 104 100 8 三组男孩身高值的变异一样吗?三个指标测定值分布变异不同变异的大小反映某组指标的稳定性 几个常用的变异指标一

12、、极差Range:用R表示 即 R=最大值 最小值意义: R值越大,表示该组数据的变异越大。缺点: 数据利用不全,局部信息损失,在例数少时结果不稳定。极差、四分位数间距、方差、标准差、变异系数二、四分位数间距(quartile range) 四分位数间距:常用QR表示 常计算: QR=P75%-P25% 作为变异指标比极差稳定。常用于表示偏态分布资料的变异。例:QR= P75%-P25%天表示方法:MdQR M=51天,天三、标准差和方差Standard deviation and variance公式总体方差(2)2-112-12总体标准差()样本标准差(s)2-13标准差的简化计算公式:

13、2-14例数较少2-15频数表资料例2-11 甲组5名同龄男孩的身高值cm X X2 90 8100 95 9025 100 10000 105 11025 110 12100 标准差的计算表2-1 101名正常女子血清胆固醇值组段(X) 频数(f) fX fx 22.302.45 12.45 6.002.602.75 38.25 22.692.903.05 618.30 55.823.203.35 8 .3.503.65 173.803.95 204.104.25 174.404.55 124.704.85 95.005.15 5 5.305.45 2 5.6 5.75 1 合计101统计描

14、述:某地101名正常女子血清胆固醇值平均为mmol/L,标准差为 mmol/L例2-10 三组同龄男孩的身高值cm R S甲组 乙组 丙组 标准差的意义: 反映一组变量值变异程度,组间单位相同时,S越小,表示数据的变异程度越小。四、变异系数(CV)应用:1.组间单位不同时变异程度的比较。 2.比较组单位相同,但均数相差悬殊 的组 间变异程度.意义:CV越大,表示数据变异越大。常用于衡量方法、仪器的精密度。公式:(2-16)1.单位不同时组间变异程度的比较。 某地7岁年龄组男童身高与体重 指标 S CV(%)身高体重结论: 7岁年龄组男童身高与体重值指标比较,体重指标的变异大于身高指标。 某地不

15、同年龄组男童身高cm年龄组 S CV%1-2月 5-6月 岁 岁 结论:随着年龄增加,身高的变异变小。 2.比较组单位相同,但均数相差悬殊的组间变异程度比较计量数据的统计描述小结 1. 在医学杂志中正态或近似正态的资料,常以 的形式表达,描述和比较数据的平均水平和离散程度。 两组患者年龄岁的比较组别 n 范围值试验组 12 45.9 3.7 35-57对照组 10 50.5 13.0 18-83两组患者基线情况的比较2.偏态分布或特定资料生存时间、病程、潜伏期时间等1用中位数和四分位间距描述。表达形式:M,四分位数间距QR例2-9 :118名链球菌咽喉炎患者的中位潜伏期为51天,QR为天。2用百分位数的P25%、P50%、P75%描述分布位置。3.等比数据和正偏态数据可用几何均数和几何标准差描述表达形式:GSGSHIFT 第二功能键MODE 计算模式选择键LR 计算相关回归选择键SD 统计功能选择键Min 单独数据储存键MR 取出储存数据键Kin1-6单独数据储存键Kout1-6取出储存数据键X2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论