卫生统计学:第2章-计量资料的统计描述_第1页
卫生统计学:第2章-计量资料的统计描述_第2页
卫生统计学:第2章-计量资料的统计描述_第3页
卫生统计学:第2章-计量资料的统计描述_第4页
卫生统计学:第2章-计量资料的统计描述_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1第二章计量资料的统计描述

2学习目标1、了解频数分布表的绘制2、掌握描述计量资料集中趋势、离散趋势的常用指标的概念3、掌握描述计量资料集中趋势、离散趋势的常用指标的适用范围与计算3计量资料的统计描述

统计描述:利用统计图、统计表、统计指标等来描述样本资料的特征。4

表1某医院产科某月顺产婴儿出生体长(cm)

484847425349455048524957454846424951505156445949505243495553514547474750485151534647574546514651475155475247505447544944535445484448424748505550535649505641535349444948455252465450445349474845514550535

第一节频数分布表及其用途

计量资料进行描述时,如果样本量较大,需要对原始资料进行整理,列出频数分布表,通过频数表以显示资料的分布类型。6频数与频数分布频数:某个测量值的个(例)数。频数分布表(frequencydistributiontable):又称频数表。是将原始数据值适当分组后得到各组的频数。适用样本量较大的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范围与形态。可用手工和计算机软件(如SAS、SPSS等)方便制作频数表。7一、离散型定量资料的频数分布例2-1:1998年某山区96名孕妇产前检查次数资料如下:

0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…4,7等共96个数值。8一、离散型定量变量的频数分布例2-11998年某山区96名孕妇产前检查次数检查次数频数频率(%)累计频数累计频率(%)044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5>51212.596100.0合计96100.0969图2-110

二、连续型定量资料的频数分布

例2-2抽样调查某地120名18岁~35岁健康男性居民血清铁含量(μmol/L)

7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.5211连续型定量资料频数表的划记步骤:

1、找出最大值和最小值,

2、求全距,又称极差R(Range)R=最大值-最小值

R=29.64-7.42=22.22(cm)

3、定组段数与组距:(1)确定组数K:根据样本例数n大小而定,一般分10~15组之间,如样本较小,可少于10组;如样本较大时,可大于10组,以能反映出分布规律为原则。12

(2)定组距i:组距即组与组间的距离,一般等距分组。

i=R/K(极差/组数)=22.22/10=2.222最终原则是取整、取偶数,所以本例i=2cm

(3)定组段的上下限并划记:每个组段的起点(最小值)称为该组的下限(lowlimit),终点(最大值)称为该组的上限(upperlimit)。

注意第一组段把最小值包括进去,最后一组把最大值包括进去。

4、列表:统计各组段的频数:

13

组段频数频率累计频数累计频率(1)(2)(3)(3)(4)6~10.8310.838~32.5043.3310~65.00108.3312~86.671815.0014~1210.003025.0016~2016.675041.6718~2722.507764.1720~1815.009579.1722~1210.0010789.1724~86.6711595.8326~43.3311999.1728~3010.83120100.00合计120100.00表2-2某地120名18岁~35岁健康男性居民血清铁含量(μmol/L)14频数分布图根据频数分布表,以血清铁含量为横轴,频率密度为纵轴,绘制直方图。直条的面积表示该组段的频率。15图2-216

三、频数分布表的用途1、揭示资料的分布类型:

频数分布可分为对称分布和偏态分布两种类型。

对称分布:是指各组段的频数以频数最多组段(集中位置)为中心,左右两侧大体对称。

偏态分布:是指频数最多的组段(集中位置)偏向一侧,频数分布不对称。正偏态:集中位置偏向左侧。

负偏态:集中位置偏向右侧。1718右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。

表4-115名正常成年女子血清转氨酶(mmol/L)含量分布19左偏态分布(负偏态分布):

左侧的组段数多于右侧的组段数,频数向左侧拖尾。表5101名正常人的血清肌红蛋白(umol/l)含量分布202、揭示频数分布的两个分布特征:

集中趋势和离散趋势3、便于发现特大或特小的可疑值。4、便于进一步选择方法计算统计指标。21

第二节计量变量的特征数

描述定量资料分布特征的指标有两类,一类是描述分布集中趋势的,另一类是描述分布的离散趋势的。一、集中趋势的描述

今介绍描述定量资料分布集中趋势的指标平均数(average)。平均数包括算术均数、几何均数、中位数、众数、调和均数。22

(一)、算术均数:简称均数(mean)总体均数用希腊字母μ,样本均数样本例数用n表示。一、适用资料

1、正态分布

2、近似正态分布二、计算

1、直接法

2、加权法式中X0为该组段的组中值23例2-3测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。算术均数=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8=3.9075(U/L)1、直接法24

表2-3加权法计算均数组段组中值(XO)ffXO(1)(2)(3)(4)=(2)(3)6~7178~932710~1166612~13810414~151218016~172034018~192751320~211837822~231227624~25820026~27410828~3029129合计1202228(2)加权频数表法25:计算公式为加权均数=2228/120=18.57(μmol/L)直接法均数=18.61(μmol/L)。26(二)、几何均数(geometricmean/G)一、适用资料

1、对数正态分布

原数据不呈正态分布,但取对数后呈正态分布

2、等比级数资料二、计算

1、直接法

2、加权法27例2-57名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。试计算其几何均数。28例2-652例慢性肝炎患者的HBsAg滴度数据如表2-4。试计算滴度的几何均数。表2-452例慢性肝炎患者的HBsAg滴度资料抗体滴度频数(f)滴度倒数(X)lgXf(lgX)1:162161.204122.408241:327321.5051510.536051:6411641.8061819.867981:128131282.1072127.393731:256122562.4082428.898881:51275122.7092718.96489合计52

108.0697729

52例慢性肝炎患者的HBsAg滴度的几何均数为1∶119.74705。30(三)、中位数(median,M)一、概念将观察值从小到大排列,处在中间位置的数值二、适用资料

1、偏态分布

2、开口资料

3、分布不清三、计算

1、直接法

将观察值从小到大排列偶数:为中间两个数的平均奇数:为中间数值

2、频数表资料

连续性资料31例2-8试利用表2-2的频数表求例2-2中血清铁含量的中位数。从表2-2可判断出位于“18-”这个组段。将相应数据代入式(2-8)该组血清铁资料的中位数为18.74(μmol/L)。32二、种类:

算术均数几何均数中位数计算

直接法适用资料正态分布对数正态分布偏态分布开口资料近似正态分布等比级数资料分布不清33

众数

出现次数最多的数值

调和平均数

调和平均数是总体各单位标志值倒数的算术平均数的倒数,又称为倒数平均数,由简单调和平均数和加权调和平均数。34

二、离散趋势的描述

常用的描述定量资料离散趋势的指标有极差、四分位数间距、方差、标准差、变异系数。

(一)、极差(range)

1、计算

2、优缺点优点:简便缺点:信息利用不充分。稳健性较差。35

例2-11试观察三组数据的离散状况。A组:26,28,30,32,34;B组:24,27,30,33,36;C组:26,29,30,31,34。将三组数据分别点在直线上,如图2-4所示。

三组数据的极差

A组R=34-26=8B组R=36-24=12C组R=34-26=836(二)、四分位数间距/Q

1、百分位数(percentile,Px)它表示一组观察值按升序排列,并等分为100等份,位居第x%位置的数。

X%Px1-x%

2、四分位数L—P25U—P753、四分位数间距Q=U-LP25P7537(三)、方差(variance)离均差——每一个观察值与均数之差,即X-μ,可以反映所有观察值的变异程度。

离均差平方和——方差——离均差平方的平均值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论