医学统计学ppt课件 02定量数据的统计描述2015_第1页
医学统计学ppt课件 02定量数据的统计描述2015_第2页
医学统计学ppt课件 02定量数据的统计描述2015_第3页
医学统计学ppt课件 02定量数据的统计描述2015_第4页
医学统计学ppt课件 02定量数据的统计描述2015_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章定量数据的统计描述Chapter2Descriptionsofquantitativedata频数分布集中趋势的统计指标变异程度的统计指标

第一节频数分布

Frequence

distribution

例2-1

某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表所示:

如何有效地组织、整理和表达数据的信息?

4.765.02……4.634.524.785.054.944.444.714.975.245.504.635.274.405.044.934.814.705.344.474.735.004.884.774.274.925.184.314.574.465.955.615.264.76由实验或临床观察等各种方式得到的原始数据,如果是定量资料并且观察的例数较多,为了能够显示数据的分布规律,可以对数据进行分组,然后制作频数表或绘制直方图。一、频数表频数表:同时列出观察指标的可能取值区间及其在各区间内出现的频数。1.确定组数k:通常选择在8~15之间2.确定组距:参考组距为R/k,R为全距3.确定组限:应符合专业习惯

4.确定频数:可由软件完成frequencytable54.422.9324.60~

100.0-140合计100.00.715.80~6.0099.41.425.60~

98.02.945.40~

95.19.3135.20~

85.812.1175.00~

73.719.3274.80~

31.517.9254.40~

13.67.9114.20~

5.74.364.00~

1.41.423.80~

累积频率(%)频率(%)频数红细胞数

表2-2某地140名正常男子红细胞数的频数表

frequencytable直方图:直观、形象地表示频数分布的形态和特征

图2-1140名正常男子红细胞计数的直方图

二、直方图Histogram三、频数表的用途Useoffrequencytable

1.作为陈述资料的形式2.便于观察数据的分布类型3.便于发现资料中含有的异常值4.可用各组段的频率作为概率的估计值

正偏态分布负偏态分布正态分布三、频数表的用途Useoffrequencytable

1.作为陈述资料的形式2.便于观察数据的分布类型3.便于发现资料中含有的异常值4.可用各组段的频率作为概率的估计值

平均数(Average)描述一组观察值集中位置或平均水平的统计指标。Averageincommonuse:

Mean算数均数

Geometricmean几何均数

Median中位数第二节集中趋势的统计指标

Descriptionofcentraltendency

一、算术均数(arithmeticmean)

应用:主要适用于对称分布或偏斜度不大的资料,尤其适合正态分布资料。

直接法计算:加权法:表2-2数据优点:意义很容易理解,而且结果也比较稳定,因而应用广泛。但它主要应用于对称分布或斜度不大的资料,尤其是正态分布资料。缺点:对极端值太敏感。在这种情形下,它不能代表样本点的绝大多数。在极端情形下,有时可出现只有一个观察值是在均数的一边。均数的应用二、几何均数

----适用对数对称分布例2-2

测得10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度Geometricmean例2-3

(频数表资料)应用:原始数据分布不对称(一般呈正偏态),经对数转换后呈对称分布的资料,主要用于血清学和微生物学中

三、中位数和百分位数(一)中位数

(median,M

)将一组观察值从小到大按顺序排列,居中心位置的数值即为中位数。

1.原始资料如测得5个人的VLDL中的apo_B的含量(mmol/L)为0.0095,0.0322,0.0617,0.0970,0.1085,则

M=0.0617(mmol/L)

若测量结果:0.0095,0.0322,0.0617,0.097,则M=(0.0322+0.0617)/2=0.0470(mmol/L)

2.频数表资料(例2-4)表2-4某地630名正常女性血清甘油三脂含量(mmol/L)--630合计100.0

63013.10~99.862932.80~99.462642.50~98.7622142.20~96.5608281.90~92.1580421.60~85.4538811.30~72.5457941.00~57.6M3631670.70~31.11961690.40~4.327270.10~累积频率(%)累积频数频数甘油三脂MedianL、iM、fM分别为M所在组段的下限、组距和频数,fL为M所在组段之前各组段的累积频数。Median(二)百分位数(Percentile)L:

组段的下限;iM:

组距;fx:

频数;

fL:Px所在组段之前的累积频数。例2-5计算例2.4的百分位数P25

、P75

、P90。(三)中位数和百分位数的应用

1.中位数是百分位数的特例。其特点是不易受异常值的影响,适用于描述明显偏态分布、或两端无确定数值数据的平均水平。2.描述数据序列在某百分位置的水平。多个百分位数结合使用如P25和P75可以描述数据的分散程度,用P2.5和P97.5计算医学95%的参考值范围等。

Percentile

第三节变异程度的统计指标例2-6对甲乙两名高血压患者连续观察5天,测得的收缩压(mmHg)结果如下:

两患者收缩压的均数十分接近,但甲患者的血压波动较大,而乙患者相对稳定。通常,描述一组观察值,除需要表示其平均水平外,还要说明它的离散或变异的情况。

患者第1天第2天第3天第4天第5天均数甲患者162145178142186162.6乙患者164160163159166162.4一、极差

极差(range

)也称作全距,即观察值中最大值和最小值之差,用符号R表示。如前例甲乙两患者收缩压的极差分别为该法简单明了、容易使用,如用于说明传染病、食物中毒等的最短、最长潜伏期等;缺点是结果不稳定。极差的特点(1)简单明了:最简单。意义:R↑↓→离散程度↑↓。(2)稳定性差:只受极端值影响。

且n↑↓→R↑↓

(3)不全面:未考虑极端值之外数值的影响→粗略指标。二、四分位数间距若算出,50岁~60岁正常女性血清甘油三脂含量的百分位数P25和P75的位置分别为0.632mmol/L和1.357mmol/L,则四分位数间距(quartile)受极端值的影响小,主要用于衡量明显偏态分布资料的变异程度。三、方差方差(

variance

)是将离均差平方和再取平均,即,

注意:对于样本资料,分母用的是n-1,称为自由度(degreeoffreedom,df)。方差的特点:便于数学上的处理,但由于有平方项,度量衡发生变化,不便于实际应用。

四、标准差将方差取平方根,还原成与原始观察值单位相同的变异量度即为标准差(standarddeviation):

例如对于例3.1经计算有甲患者:,,同理乙患者:KarlPearson

标准差的特点能利用所有数据的信息受极端值的影响大,常用于正态分布或近似正态分布资料。五、变异系数

变异系数(coefficientofvariation):用于对均数相差较大或单位不同的几组观察值的变异程度进行比较。

某地不同年龄组男童身高(cm)

年龄组SCV%1-2月56.32.13.735-6月66.52.23.313-3.5岁96.13.13.225-5.5岁107.83.33.06结论:随着年龄增加,身高的变异变小。

均数差别较大的变量间变异程度的比较

1.运用频数表、直方图和统计指标技巧能够有效地组织、整理和表达计量资料的信息。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论