华中科技大学第二章 定量资料的统计描述课件_第1页
华中科技大学第二章 定量资料的统计描述课件_第2页
华中科技大学第二章 定量资料的统计描述课件_第3页
华中科技大学第二章 定量资料的统计描述课件_第4页
华中科技大学第二章 定量资料的统计描述课件_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 定量资料的统计描述王增珍电话:QQ:861649417第一节 频数分布表与频数分布图一、离散型定量变量的频数分布例2-1 1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7清点各观察值的频数二、连续型定量变量的频数分布(二)描述分布的集中趋势和离散趋势集中趋势(central tendency)同一地区、同一年度、同一民族、同一年龄段、相同的性别与类似的健康状况,这些共同点(同质性)使得该人群的变量值趋向同一数值, (如:血清铁含量)如组段“18”的频数最多,为集中趋势。 离散趋势(tendency of disp

2、ersion)同一总体中的个体之间又普遍存在着各种差别。遗传、营养、行为、心理等各种因素在个体之间都不会完全相同,而是或近或远的离散在集中位置的周围,此为离散趋势。 (三)便于发现某些特大和特小的可疑值(四)便于进一步计算指标和统计分析第二节 描述集中趋势的统计指标 连续型定量变量采用:平均数(average)是应用最广泛、最重要的一个指标体系,它常用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。常用的平均数算术均数、几何均数和中位数。二、几何均数几何均数(geometric mean,G)适用于原始观察值分布不对称,但经对数转换后呈对称分布的资料,如对数正态分布资料。医学中常见的

3、抗体滴度资料,观察值间常呈倍数关系,变化范围跨越多个数量级。三、中位数中位数(median,M)是指将原始观察值从小到大或从大到小排序后,位次居中的那个数。理论上有一半的观察值低于中位数,一半的观察值高于中位数。中位数适用于各种分布的资料,特别是偏峰分布资料不适合用均数描述其集中位置时,可用中位数反映位次居中的观察值水平。由于中位数不是利用全部观察值计算出来的,它只与位次居中的观察值大小有关,因此它不受分布两端特大或特小值的影响。对分布末端无确定值的资料,不能直接计算均数和几何均数时,也可以计算中位数。4. 众数(mode) 原指总体中出现机会最高的数值。样本众数则是在样本中出现次数最多的数值

4、。例2-9 例2-1产前检查次数的众数为4(次)。描述离散趋势的统计量:极差、四分位数间距、方差、标准差和变异系数1. 极差(range,R) R = 最大值最小值极差的计算简便,仅仅利用了样本中最大值与最小值的信息,不能反映其他观察值的变异情况。一般样本量n越大,越有机会观察到偏大或偏小的数据,R可能会越大,因此样本含量相差悬殊时不宜比较极差。即使样本量相同,R也往往不够稳定。2. 四分位数间距(quartile range,Q)Q= P75-P25 Q越大意味着数据间变异越大。四分位数间距可用于各种分布的资料,特别对偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势

5、。和极差相比,四分位数间距更稳定,但是仍然未考虑资料中每个观察值的离散程度。3.方差(variance) 4. 标准差(standard deviation,s)第四节 描述分布形态的统计指标第五节 统计内容的报告与中英文表达定量资料的统计描述主要报告对称分布资料和偏峰分布资料的集中趋势和离散趋势的统计指标。箱式图也常用于定量资料的统计描述。对对称分布资料,特别是近似正态分布资料,主要用均数和标准差进行统计描述。如:120名18岁35岁健康男性居民血清铁含量(mol/L)的(均数标准差)为(18.614.34)mol/L。Serum iron values ranged from 7.42 t

6、o 29.64mol/L and had a mean (SD) of 18.61mol/L (4.34mol /L) for 120 healthy men with years of age 18 to 35.对偏峰分布资料,主要用中位数和四分位数间距进行统计描述。如:50例链球菌咽峡炎患者的潜伏期中位数(四分位数间距)为49.09(36.8272.20)(小时)。 Median latent period was 49.09 h (interquartile range = 36.82 to 72.20 h) for 50 patients with streptococcus fauc

7、itis.第八节 小结1. 为了解定量变量的分布规律,可编制频数表并绘制频数分布(或频率分布)图,用于描述资料的分布特征(集中趋势与离散趋势),以及分布类型(对称或偏峰)。2. 常用的描述定量变量集中趋势的统计指标包括算术均数、几何均数、中位数。算术均数适用于对称分布,特别是正态分布的资料;几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分布的资料。3. 常用的描述定量变量离散趋势的统计指标包括极差、四分位数间距、方差、标准差和变异系数。极差只利用最大值和最小值的信息,易受样本含量的影响,很不稳定;四分位数间距适用于各种分布的资料;方差和标准差适用于对称分布,特别是正态分布的资料;变异系数常用于量纲不同时、或均数相差较大时变量间变异程度的比较。实际应用中,常将算术均数和标准差结合对正态分布资料进行统计描述;常将中位数和四分位数间距结合对偏峰分布资料进行统计描

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论