医学统计学之描述性统计_第1页
医学统计学之描述性统计_第2页
医学统计学之描述性统计_第3页
医学统计学之描述性统计_第4页
医学统计学之描述性统计_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第一章 描述性统计统计描述的任务就是用表、图和数字的形式概括原始资料的主要信息。一、 频数表与直方图:频数表与直方图是最常用的综合描述样本资料的方法, 形象直观,可大致看出分布。1.频数表的制作: 例1.3 某地随机抽取正常成年男子120名, 其红细胞计数值(1012 /L)如下: 5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.84 4.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69试作该批样本的频数表。对计量资料则要按以下步骤制作频数表(1)找出最大和最小

2、值,计算极差。 本例最大值=6.18, 最小值=3.29,极差为R=6.183.29=2.89(2)确定组距和列出分组计划:一般设1015组;组距取整。 i= R /10=2.89/10=0.2890.30 第一组包括最小值,最后一组包括最大值。(3)将原始数据整理后,得到各组频数。2频数表的用途:(1)描述资料特征: 集中趋势与离散趋势。(2)确定变量的分布类型(3)发现异常值二、样本平均水平的度量 用更精确的一、两个数字(指标)描述原始资料的信息,对于计量资料一般用两个数字(指标)分别描述资料的平均水平和变异性。常用描述平均水平的指标有算术均数、几何均数和中位数。1. 算术均数(arith

3、metic mean),简称均数。适用:对称资料,最好是近似正态分布的资料。 计算:直接法: 例如:测量7名正常8岁女孩身高(cm)分别为: 122129 128 135 132 125 133 平均身高为:(122+ 129+128+135+132+125+133)/7=129(cm)加权法:当数据量太大时或资料已经整理成频数表时。2.几何均数适用:原始数据经对数转换后近似对称分布的资料,医学上常用于微生物学和免疫学指标。 几何均数的计算可参考算术均数的计算,唯一不同的是需要在计算前将变量取对数,最后将结果反对数转换回其真值。3. 中位数 (median) 将一组观察值从小到大排列,位置居中

4、的那个数值为中位数。适用:数据为非对称分布分布不清楚或资料未闭口的情形。计算:直接法:将原始数据,由小到大排序,例:1,1,2,2,3,4,6,9,10 ( n = 9, 为奇数) Md = 第5位 = 3例: 1 , 1 , 2 , 2 , 3 , 4 , 6 , 9 , 10 , 13 ( n=10, 为偶数) Md = 第5位和第6位的平均 = (3+4)/2频数表法:组段频数累积频数组中值1202023668645601466748194891821210.1921323920合计 239(1) 中位数的名次 n / 2 = 239 /2 = 119.5(2) 该名次所在组段 a b

5、= 5 7(3) 用插入法 : a 和 b 所对应的累积频数 fa =86 , fb = 146在a 和 b 中作插值估计三、样本变异性的度量:例:三组同年龄同性别儿童体重(kg)数据如下: 甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34常见的几种:极差或全距,四分位数差距,方差与标准差,变异系数1. 极差或全距R极差 = 最大值最小值2. 四分位数差距Q四分位数差距 = X75X25 中位数是50%位数,因此四分位数的计算类似中位数。3. 方差S2与标准差S适用:对称分布或近似正态分布资料,能充分利用全部个体的信息。离均差 = 个体

6、值总体均数 = 离均差平方和 = S ()2 总体方差 =S ()2/n 总体标准差总体均数常不知道,用样本均数代替 离均差 = 个体值样本均数 = S(离均差)2 = (变小了)样本方差: 其中,n-1 称为自由度。样本标准差的计算:4. 变异系数(coefficient of variation , CV ) 适用:当比较两组或多组资料的变异程度大小时,如果变量的度量衡单位不同或均数差别较大时,应用变异系数比较。 CV 例 : 均数标准差变异系数 男子身高 170 cm 6 cm 0.035体重 60 kg 7 kg 0.117四、相对数与率的标准化(一)比、比率和速率1比 (ratio)

7、 任意两个数之比值例: 新生儿性别比 = 男性新生儿数女性新生儿数体块指数 = 体重 ( 身高 )22比率 ( proportion ) 分子和分母均为计数值;分子是分母的一部分;无量纲;百分比;分母较大时,近似地反映某事件发生的机会大小。例 : 医治1000例病人,900例痊愈, 治愈率 = 900/1000 = 90%3速率 (rate):单位时间某事件出现的机会大小,分母含时间量纲。例: 某年死亡率= 该年死亡人数同年暴露于死亡危险的人年数 死亡率的量纲为1/年或人/人年。(二)率的标准化方法表1.9 两个地区的年龄别死亡率资料年龄组(岁)A 地区B 地区人口数(千人)死亡数(千人)死亡

8、率(1/千)人口数(千人)死亡数(千人)死亡率(1/千)040025.028813.5152000105.023814.2302000157.579456.345800810.02000189.0604001640.020007035.0758012150.030036120.0合计56806311.1561813123.3分别在各年龄组中比较死亡率较为合理,但如果各年龄组结果不一致,无法作出总的结论,标准化方法旨在产生一个可比的综合指标。1直接法标准化:适用条件:已知有稳定的年龄别死亡率,有合适的标准人口。选择“标准人口”: 统一人口或合并人口方法:估计当地年龄别死亡率应用于“ 标准人口”得

9、到标化死亡率。注意:直接标化率是以标准人口为权重的加权平均率。表1.10 两个地区的直接法标准化死亡率年龄组(岁)标准人口数(千人)甲死亡率()甲期望死亡数(千人)乙死亡率()乙期望死亡数(千人)(1)(2)(3)(4)=(2)×(3)(5)(6)=(2)×(5)06865.03.433.52.401522385.011.194.29.403027947.520.966.317.6045280010.028.009.025.2060240040.096.0035.084.0075380150.057.00120.045.00合计1129819.2216.5816.3184.202间接法标准化 适用条件:年龄别死亡率未知或年龄别死亡率不稳定,有各组实际死亡数和年龄别人口数,有合适的“标准年龄别死亡率”。方法:估计标准年龄

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论