定量数据的统计描述课件_第1页
定量数据的统计描述课件_第2页
定量数据的统计描述课件_第3页
定量数据的统计描述课件_第4页
定量数据的统计描述课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、定量数据的统计描述定量数据的统计描述定量数据的统计描述 第二章 定量数据的统计描述 第二章 定量数据的统计描述 定量数据的统计描述2015由实验或临床观察等各种方式得到的原始数据,如果是计量资料并且观察的例数较多,为了能够显示数据的分布规律,可以对数据进行分组,然后制作频数表或绘制直方图。例2-1 某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示: 如何有效地组织、整理和表达数据的信息? 4.765.024.634.524.785.054.944.444.714.975.245.504.635.274.405.044.934.814.705.344.474.735.004.

2、884.774.274.925.184.314.574.465.955.615.264.76一、频数表频数表:同时列出观察指标的可能取值区间及其在各区间内出现的频数。frequency table 1.确定组数k:通常选择在815之间 2.确定组距: 参考组距为R/k , R为全距 3.确定组限: 只含下限不含上限 4.确定频数: 54.4 22.9 32 4.60 100.0 -140合计 100.0 0.7 1 5.80 6.00 99.4 1.4 2 5.60 98.0 2.9 4 5.40 95.1 9.3 13 5.20 85.8 12.1 17 5.00 73.7 19.3 27

3、4.80 31.5 17.9 25 4.40 13.6 7.9 11 4.20 5.7 4.3 6 4.00 1.4 1.4 2 3.80 累积频率(%) 频 率(%) 频 数 红细胞数 表2-2 某地140名正常男子红细胞数的频数表 frequency table直方图:直观、形象地表示频数分布的形态和特征 图2-1 140名正常男子红细胞计数的直方图 二、直方图 Histogram三、频数表的用途 1.作为陈述资料的形式 2.便于观察数据的分布类型 3.便于发现资料中含有的异常值4.可用各组段的频率作为概率的估计值 第二节 集中趋势的统计指标描述一组观察值集中位置或平均水平的统计指标。均数

4、几何均数中位数 Average一、均数 (算术均数)应用:主要适用于对称分布或偏斜度不大的资料,尤其适合正态分布资料。Average应用:按倍数关系变化、对数变换后呈对称分布。在医学中:血清学和微生学,如抗体滴度、细菌技术、血清凝集效价等定量数据的统计描述2015定量数据的统计描述2015例2-2 测得10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度例2-3 (频数表资料)Geometric mean若观察值中有0或负数,可将所有观察值加上一个常数k,使x+k0,计算结果还原G=G-k。观察值若全是负数,计算时把负号去掉,得出结果后再加上负号。定量数据的统计

5、描述2015定量数据的统计描述2015中位数:一组观察值从小到大按顺序排列,居中心位置的数值即为。应用:明显的偏态分布或两端数值不明确时 定量数据的统计描述20151.原始资料如测得5个人的VLDL中的apo_B的含量(mmol/L)为0.0095,0.0322,0.0617,0.0970,0.1085,则 M=0.0617(mmol/L) 若测量结果:0.0095,0.0322,0.0617,0.097,则 M= (0.0322+0.0617)/2=0.0470(mmol/L) 2.频数表资料(例2-4) 表2-4 某地630名正常女性血清甘油三脂含量(mmol/L) - -630合计100

6、.0 630 13.10 99.8629 32.80 99.4626 42.50 98.7622 142.20 96.5608 281.90 92.1580 421.60 85.4538 811.30 72.5457 941.00 57.6 M3631670.70 31.11961690.40 4.3 27 270.10累积频率(%) 累积频数频数 甘油三脂MedianL、iM、fM分别为M所在组段的下限、组距和频数, fL为M所在组段之前各组段的累积频数。Median描述数据序列在某百分位置的水平。多个百分位数结合使用来描述某个问题。P25和P75可以描述数据的分散程度,用P2.5和P97.

7、5计算医学95%的参考值范围等。 定量数据的统计描述2015L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。定量数据的统计描述2015例2-5 计算例2.4的百分位数P25 、 P75 、 P90。定量数据的统计描述2015例2-6 对甲乙两名高血压患者连续观察5天,测得的收缩压(mmHg)结果如下: 可以看出:两患者收缩压的均数十分接近,但甲患者的血压波动较大,而乙患者相对稳定。通常,描述一组观察值,除需要表示其平均水平外,还要说明它的离散或变异的情况。 患者第1天第2天第3天第4天第5天均数甲患者 162145178142186162.6乙患者 16

8、4160163159166162.4定量数据的统计描述2015极差四分位数间距方差、标准差变异系数 一、极差 极差( range )也称作全距,即观察值中最大值和最小值之差,用符号R 表示。如前例甲乙两患者收缩压的极差分别为该法简单明了、容易使用,如用于说明传染病、食物中毒等的最短、最长潜伏期等;缺点是结果不稳定。定量数据的统计描述2015主要用于衡量明显偏态分布资料的变异程度。如由上一章例2.4 算出,50岁60岁正常女性血清 甘油三脂含量的百分位数P25和P75的位置分别为0.632mmol/L和1.357mmol/L,则定量数据的统计描述2015方差( variance )是将离均差平方

9、和再取平均,即 , 注意:对于样本资料,分母用的是n-1,称为自由度(degree of freedom,df )。方差的特点:便于数学上的处理,但由于有平方项,度量衡发生变化,不便于实际应用。 定量数据的统计描述2015将方差取平方根,还原成与原始观察值单位相同的变异量度即为标准差(standard deviation): 例如对于例3.1经计算有 甲患者: , , 同理乙患者:Karl Pearson 适用于正态分布与均数结合能完整表述一个正态分布定量数据的统计描述2015定量数据的统计描述2015 变异系数:用于对均数相差较大或单位不同的几组观察值的变异程度进行比较。例3.3 测得某地成年人舒张压均数为77.5mmHg,标准差10.7mmHg;收缩压均数为122.9mmHg,标准差为17.1mmHg。试比较舒张压和收缩压的变异程度。 1.运用频数表、直方图和统计指标技巧能够有效地组织、整理和表达计量资料的信息。 2.平均数是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。其中均数的应用最为广泛,几何均数则多用于血清学和微生物学中,中位数主要用于偏度较大或无两端观测值的数据分布资料。定量数据的统计描述2015 3.百分位数可用来描述资料的观察值序列在某百分位置的水平,中位数是其中的一个特例。 4.衡量变异程度大小的指标有多种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论