第二章医学资料的统计描述_第1页
第二章医学资料的统计描述_第2页
第二章医学资料的统计描述_第3页
第二章医学资料的统计描述_第4页
第二章医学资料的统计描述_第5页
已阅读5页,还剩135页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 医学资料的统计描述医学资料的统计描述 主讲:黄志碧主讲:黄志碧 本章重点本章重点1、频数分布特征和分布类型;、频数分布特征和分布类型;2、描述集中趋势和离散趋势的指标及其应、描述集中趋势和离散趋势的指标及其应用(平均数指标及变异指标);用(平均数指标及变异指标);3、常用的相对数及其注意事项;、常用的相对数及其注意事项;4、率的标准化法及其应用,直接法计算标、率的标准化法及其应用,直接法计算标准化率,应用标准化率的注意事项。准化率,应用标准化率的注意事项。统计描述统计描述用适当的统计图(表)和统计指标用适当的统计图(表)和统计指标(如均数、标准差、有效率、治愈率等)来描述(如均数

2、、标准差、有效率、治愈率等)来描述资料的资料的分布规律分布规律(图表)和(图表)和数量特征数量特征(统计指(统计指标)。标)。用直观的、简单的形式来表达数据资料所蕴藏的信息。广西人均卫生事业费在全国位次广西人均卫生事业费在全国位次(1998(1998年年) )指指 标标 广广西西(元元) 全全国国(元元) 广广西西在在全全国国位位次次 人人均均卫卫生生事事业业费费 11.24 18.52 28 人人均均医医院院经经费费 3.70 7.61 30 人人均均卫卫生生院院补补助助 2.67 3.60 28 人人均均防防治治防防疫疫事事业业费费 1.66 2.62 29 人人均均妇妇幼幼保保健健经经费

3、费 0.84 0.76 16 1999年中国农村死亡原因构成年中国农村死亡原因构成 (%)呼吸系病呼吸系病23%23%其它其它14%14%恶性肿瘤恶性肿瘤18%18%脑血管病脑血管病18%18%心脏病心脏病12%12%消化系病消化系病4%4%损伤中毒损伤中毒11%11%第一节第一节 频数分布表与频数分布图频数分布表与频数分布图一、频数分布表频数分布表 1,2,3,A 8个B 11个C 15个依次类推频数分布表原始资料分组原始资料分组计量资料频数分计量资料频数分布表布表计数资料频数分计数资料频数分布表布表按数量分组按数量分组按性质或属性分组按性质或属性分组 计数资料频数分布表计数资料频数分布表下

4、表是甲、乙两医院治疗同一种疾病的情况,比较下表是甲、乙两医院治疗同一种疾病的情况,比较甲、甲、 乙两医院的总治愈率有无差别。乙两医院的总治愈率有无差别。甲医院乙医院甲医院乙医院 病情病情治疗人数治愈人数治愈率治疗人数治愈人数治愈率()治疗人数治愈人数治愈率治疗人数治愈人数治愈率() 轻轻 100 80 80.0 300 210 70.0 重重 300 180 60.0 100 50 50.0 合计合计 400 260 65.0 400 260 65.0 甲、甲、 乙两医院某病治愈率比较乙两医院某病治愈率比较计量资料频数分布表计量资料频数分布表计量资料计量资料离散型资料离散型资料连续型资料连续型

5、资料每一育龄妇女现有的子女数;每分钟的脉搏数身高(cm)、体重(kg)、总胆固醇(mmol/L)结果结果为整为整数数结果结果有度有度量衡量衡单位单位以变量取值为标志分组,列出各组别的频数以变量取值为标志分组,列出各组别的频数(二)连续型计量资料的频数表的编制(二)连续型计量资料的频数表的编制 某医师检测了某医师检测了60例链球菌咽炎患者的潜伏期例链球菌咽炎患者的潜伏期,结果如下。结果如下。潜伏期潜伏期(小时小时) 12- 24- 36- 48- 60- 72- 84- 96- 108- 合计合计 病例数病例数 1 10 18 14 5 4 4 2 2 60分组标志分组标志频数列频数列1、求极差

6、(全距)、求极差(全距) 最大值最小值最大值最小值 4.2-2.51.7(kg) 150名男婴体重,试编频数分布表。2、确定组距和组段、确定组距和组段:相邻两个组段之间距离。:相邻两个组段之间距离。 i极差极差/101.7/100.17 0.2(也可取(也可取i=0.15) 根据例数多少来确定,以能反根据例数多少来确定,以能反映频数分布特征为原则,一般分映频数分布特征为原则,一般分8-15组。组。原则:第一组段包括最小值,最后组段包括最大值。原则:第一组段包括最小值,最后组段包括最大值。 每一组段都有上限和下限每一组段都有上限和下限下限下限:组段的起点(最小值):组段的起点(最小值)上限上限:

7、组段的终点(最大值):组段的终点(最大值)3、统计各组段的频数、统计各组段的频数将所有观察值按其数值大小归入各组。将所有观察值按其数值大小归入各组。 组段组段 划记划记 频数频数 2.5 2.7 2.9 3.1 3.3 3.5 3.7 3.94.14.32.53.9归组方法:对号入座归组方法:对号入座 表表2-2 150名男婴体重频数分布名男婴体重频数分布3.1 频数表的用途:频数表的用途:1 1、作为统计资料的表达的形式(频数表资、作为统计资料的表达的形式(频数表资料);料);2 2、揭示资料的分布特征和分布类型;、揭示资料的分布特征和分布类型;3 3、便于进一步计算指标和统计分析;、便于进

8、一步计算指标和统计分析;4 4、便于发现特大或特小的可疑值。、便于发现特大或特小的可疑值。 频数分布的特征频数分布的特征1、集中趋势集中趋势:数据向某一数值集中的倾向;:数据向某一数值集中的倾向;2、离散趋势离散趋势:数据的数值大小不等的倾向。:数据的数值大小不等的倾向。 二、频数分布图二、频数分布图 以观察变量(组段)为横轴,频数或频率为纵轴以观察变量(组段)为横轴,频数或频率为纵轴绘制统计图,可直观地反映频数分布的特征。绘制统计图,可直观地反映频数分布的特征。三、频数分布的类型三、频数分布的类型 对称分布对称分布 偏态分布偏态分布 正偏态负偏态 正态分布正态分布 1、对称分布:、对称分布:

9、集中位置(高峰)居中,左右两集中位置(高峰)居中,左右两侧频数分布大体对称,其中的正态分布是重要的侧频数分布大体对称,其中的正态分布是重要的分布形式。分布形式。 2、偏态分布、偏态分布 集中位置(高峰)不居中,偏向某一侧。集中位置(高峰)不居中,偏向某一侧。(1)正偏态:)正偏态:集中位置(高峰)偏向数值较小的集中位置(高峰)偏向数值较小的一侧。一侧。 (2)负偏态:)负偏态:集中位置(高峰)偏向数值较大集中位置(高峰)偏向数值较大的一侧。的一侧。第二节第二节 集中趋势的描述集中趋势的描述 描述计量资料分布特征的指标描述计量资料分布特征的指标集中趋势指标集中趋势指标离散趋势指标离散趋势指标平均

10、数平均数R、Q、S、S2、CV 平均数指标平均数指标 常用的平均数指标:常用的平均数指标: 算术均数、几何均数、中位数算术均数、几何均数、中位数 平均数:平均数:用于描述一组同质计量资料平均水平用于描述一组同质计量资料平均水平( (集中位置集中位置) )的指标,是一组计量资料的代表值。的指标,是一组计量资料的代表值。x 一、算术均数(均数)一、算术均数(均数)总体均数用总体均数用 表示,样本均数用表示,样本均数用表示。表示。 适用资料:适用资料:对称分布,尤其是正态分对称分布,尤其是正态分布的资料。布的资料。 算术均数:算术均数:说明一组同质计量资料在数量说明一组同质计量资料在数量上的平均水平

11、。上的平均水平。加权法:加权法:1、计算方法:、计算方法:nXnXXXxn .21直接法:直接法:ffxfffxfxfxfxnnn.212211f: 频数,频数,x 为组中值为组中值=(上限(上限+下限)下限)/ 2例例2-3 10名名12岁健康男童体重(岁健康男童体重(Kg)分别为:)分别为:39.6、33.2、32.1、29.9、43.7、33.8、35.1、37.8、32.4、38.5。求平均体重。求平均体重。)(6 .35101 .35610.5834 . 238 . 731 . 538 . 337 . 3429.91 . 232 . 3339.6kgX例例 2-4 求求150名男婴平

12、均体重(用加权法)。名男婴平均体重(用加权法)。)(.kgffxX3931502509150224682362 注意:注意:x 为组中值为组中值=(上限(上限+下限)下限)/ 2 组中值是每一个组段的平均值组中值是每一个组段的平均值 2、均数两个重要特征、均数两个重要特征、各离均差(各观察值、各离均差(各观察值X与均数之差)的总和与均数之差)的总和等于零;等于零;、离均差的平方和小于各观察值、离均差的平方和小于各观察值X与任何数与任何数a之差的平方和。之差的平方和。 说明均数是一组观察值最好的代表值。说明均数是一组观察值最好的代表值。 0)(XX 22)()(aXXX 3、均数的应用、均数的应

13、用 反映一组同质观察值的平均水平反映一组同质观察值的平均水平 描述正态分布特征的重要参数描述正态分布特征的重要参数原始数据的分布为偏态分布,但经对数变换后的分布呈正态分布二、几何均数(二、几何均数(geometric mean, 简记为简记为 G) 1、适用资料:、适用资料: (1)等比级数资料)等比级数资料 (2)对数正态分布资料)对数正态分布资料 (某些微量元素资料)(血清抗体滴度资料)(血清抗体滴度资料)2、计算方法:、计算方法:(1)直接法)直接法 )lg(lg)lg.lglg(lgnXnXXXGXXXGnnn 121121(2)加权法)加权法 fflgxlg)lglg(lg12122

14、111iiifffxfxfxfG例例2-4 8名病人的血清抗体滴度为:名病人的血清抗体滴度为:1:5、1:10、1:20、 1:40、 1:40、 1:80、1:160 、1:320 ,求平,求平均滴度。均滴度。 平均滴度为:平均滴度为:1 1:40.040.004060206011081648012532016080404020105040320160804040201051118.).(lg).(lg)lglglglglglglglg(lg. GG抗体滴度抗体滴度 人数人数f 滴度倒数滴度倒数X lgX flgx 1:8 5 8 0.9031 4.5154 1:16 11 16 1.204

15、1 13.2453 1:32 12 32 1.5051 18.0618 1:64 20 64 1.8061 36.1236 1:128 9 128 2.1072 18.9649 1:256 3 256 2.4082 7.2247 合计合计 60 98.135779表2-4 60名麻疹易感儿童血凝抑制抗体滴度24363559616013577998111.lg).(lg)lg(lg fxfG 血凝抑制平均抗体滴度为:血凝抑制平均抗体滴度为: 1:43.2。3、应用几何均数注意事项:、应用几何均数注意事项: (1)观察值不能有)观察值不能有0; (2)观察值不能同时有正负值;)观察值不能同时有正负

16、值; (3)同一资料求得的)同一资料求得的G x三、中位数(三、中位数(M)和百分位数()和百分位数(Px) (一一)、定义、定义1、中位数、中位数: 将一组观察值从小到大按顺序排将一组观察值从小到大按顺序排列列,位次居中的数值就是中位数。位次居中的数值就是中位数。 在全部观察值中,大于和小于中位数的观在全部观察值中,大于和小于中位数的观察值的个数相等。察值的个数相等。 2、百分位数:、百分位数:将一组观察值从小到大按顺序将一组观察值从小到大按顺序排列,将该数列分为一百等份,在某百分位排列,将该数列分为一百等份,在某百分位置上的值,就是百分位数,用置上的值,就是百分位数,用Px表示。表示。 一

17、个一个百分位数将全部观察值分为两部分,理论上百分位数将全部观察值分为两部分,理论上有有x的观察值比它小,有(的观察值比它小,有(100-x)的观)的观察值比它大。察值比它大。P50分位数也就是中位数。分位数也就是中位数。 (二)、中位数和百分位数的适用范围(二)、中位数和百分位数的适用范围 (1 1)偏态分布资料)偏态分布资料 (2 2)分布不明资料)分布不明资料 (3 3)分布末端无确定值资料(开口资料)分布末端无确定值资料(开口资料) 百分位数用于描述一组数据某百分位置上百分位数用于描述一组数据某百分位置上的水平。的水平。 理论上,中位数可用于描述任何分布的计量资理论上,中位数可用于描述任

18、何分布的计量资料的平均水平,料的平均水平, 但实际应用中常用于偏态分布,但实际应用中常用于偏态分布,特别是开口资料。特别是开口资料。 某市某市238名健康人发汞含量名健康人发汞含量 发汞值(发汞值(g/g) 人数人数 0.3 3 0.3 17 0.7 66 1.1 60 1.5 48 1.9 18 2.3 16 2.7 6 3.1 1 3.5 1 3.9 2 合计合计 238 总胆红素总胆红素 人数人数 (mol/L) 一般组一般组 重症组重症组 int(nx%) 时:Px= X int(nx%)+1nx%=15020%=30=int(15020%), 即 P20=(X30+X31)/2=(3

19、.2+3.2)/2=3.2(kg)例2.11 根据表2.2资料,求P20 、P75nx%=15075%=112.5int(nx%), 即即 P75=X112+1=X113=3.6(kg) 2、频数表法:适用于频数表资料、频数表法:适用于频数表资料 步骤:步骤: 从小到大计算累计频数和累计频率;从小到大计算累计频数和累计频率; 确定百分位数和中位数所在组段;确定百分位数和中位数所在组段; 计算百分位数计算百分位数Px和中位数和中位数M Lxf%xnfiLxP Lxf2nfiL50PML: Px或或M所在组段的下限所在组段的下限 i: Px或或M所在组段的组距所在组段的组距 fx: Px或或M所在

20、组段的频数所在组段的频数 :小于:小于L各组段的累计频数各组段的累计频数 Lf例例2-10 求:求:M 、P25、 P75)(9 .48)58%50120(28124850小时小时 PM)(7 .38)22%25120(36123625小时小时 P)(8 .64)86%75120(10126075小时小时 P12 2 24 20 36 36 48 28 60 10 72 2 22 58 (M) 86 96 ( 60 ) 4、中位数和百分位数的用途、中位数和百分位数的用途(1)描述一组偏态资料的集中趋势;描述一组偏态资料的集中趋势; 描述一组资料在某百分位置的描述一组资料在某百分位置的水平水平,

21、 在对称分布资料中,在对称分布资料中,(2)百分位数也用于确定医学参考值范围。)百分位数也用于确定医学参考值范围。 x M集中趋势指标的选择判断集中趋势指标的选择判断步骤步骤 资料资料 抗体滴度抗体滴度 G 否否 偏态、开口偏态、开口 M 否否 X是是是是 常用平均数的意义及其应用场合常用平均数的意义及其应用场合 平均数平均数 意意 义义 应用资料应用资料 均均 数数 平均数量水平平均数量水平 应用甚广应用甚广,最适用于对称分布最适用于对称分布, 特别是正态分布;特别是正态分布;几何均数几何均数 平均增平均增(减减)倍数倍数 (1)等比资料等比资料,(2)对数正态分布对数正态分布中位数中位数

22、位次居中的观察位次居中的观察 (1)偏态分布偏态分布,(2)分布不明分布不明,(3) 值水平。值水平。 分布末端无确定值(开口资料分布末端无确定值(开口资料)第三节第三节 离散趋势的描述离散趋势的描述 甲组甲组 26, 28, 30, 32, 34. 乙组乙组 24, 27, 30, 33, 36. 丙组丙组 26, 29, 30, 31, 34. 30 x 甲甲30 乙乙x30 丙丙x 注意:三组数据的平均水平相同,但各组数据的匀称程度(离散程度)不一样,应考虑这个问题。反映离散程度的常用指标:反映离散程度的常用指标: 1、极差、极差 2、四分位数间距、四分位数间距 3、方差、方差 4、标准

23、差、标准差 5、变异系数、变异系数一、极差(全距)一、极差(全距)R 1、计算公式计算公式:R最大值最小值最大值最小值 2、意义意义:R愈大,离散度愈大,愈大,离散度愈大, R愈小,离散度愈小。愈小,离散度愈小。 3、优点:优点:计算简单,意义明了计算简单,意义明了 4、缺点:缺点:(1)不能反映每一个观察值的变异;)不能反映每一个观察值的变异; (2)样本例数越大,)样本例数越大,R可能越大;可能越大; (3)R抽样误差大,不稳定。抽样误差大,不稳定。 二、四分位数间距(简记二、四分位数间距(简记Q) 1、计算公式:、计算公式: 四分位数间距四分位数间距QQUQL P25:下四分位数,简记下

24、四分位数,简记QL P75:上四分位数,简记上四分位数,简记QU 2、意义:反映中间一半观察值的极差、意义:反映中间一半观察值的极差,意义与意义与R相相 似。似。 3、特点:、特点:(1) 比比R稳定,但仍未考虑每一个观察稳定,但仍未考虑每一个观察 值的变异;值的变异; (2) 常用于描述偏态资料的离散度。常用于描述偏态资料的离散度。 )(9 .48)58%50120(28124850?hPM)(7 .38)22%25120(36123625?hP)(8 .64)86%75120(10126075?hP120名链球菌咽峡炎患者潜伏期,求名链球菌咽峡炎患者潜伏期,求M, QQ=P75-P25=6

25、4.8-38.7=26.1(小时)三、方差(总体方差简记三、方差(总体方差简记 ,样本方差,样本方差简记简记 ) 22s一组观察值的离均差平方和,取其均数,即一组观察值的离均差平方和,取其均数,即方差。方差。 (XX)0 (离均差和)(离均差和)(XX)20 (离均差平方和)(离均差平方和)缺点:与例数多少有关缺点:与例数多少有关1、计算公式(直接计算法):、计算公式(直接计算法): NX 22 122 nxXs2、意义、意义:方差越大,离散度越大;:方差越大,离散度越大; 方差越小,离散度越小。方差越小,离散度越小。 3、缺点、缺点:单位被平方,不便于使用:单位被平方,不便于使用四、标准差(

26、总体标准差简记四、标准差(总体标准差简记,样本标准差简,样本标准差简记记S) 方差的开平方,即标准差。方差的开平方,即标准差。 1、计算、计算公式公式: Nx 2 12 nxxs2、意义意义:与方差的:与方差的意义相同意义相同 (注:(注:n-1为自由度)为自由度) 3、计算方法计算方法: (1)直接法)直接法: NXNXNX 222 11222 nXnxXsnX(2)加权法:)加权法: NfxNfx 22 122 ffxsffxX为组中值为组中值X为组中值为组中值4、用途用途: (1)用于表示正态或近似正态分布资料的离散)用于表示正态或近似正态分布资料的离散度,说明均数的代表性;度,说明均数

27、的代表性; (2)结合均数描述正态分布的特征;)结合均数描述正态分布的特征; (3)结合均数计算变异系数,结合样本含量计)结合均数计算变异系数,结合样本含量计算标准误,估计参考值范围。算标准误,估计参考值范围。 标准差标准差甲组:甲组:262+282+302+322+342=4540乙组:乙组:242+272+302+332+362=4590丙组:丙组: 262+282+302+322+342=4534 )(92. 2155)150(45342kgs 丙丙)(74. 4155)150(45902kgs 乙乙)(16. 3155)150(45402kgs 甲甲求求150名男婴出生体重的标准差。名

28、男婴出生体重的标准差。 150 f2509. fx7617432. fx)(.).(.kgs320115015025097617432 五、变异系数(简记五、变异系数(简记CV) 1、计算公式:、计算公式: %100 xsCV2、用途:、用途: (1)比较度量衡单位不同的多组)比较度量衡单位不同的多组资料的变异度(离散度)资料的变异度(离散度) (2)比较均数相差悬殊的多组资)比较均数相差悬殊的多组资料的变异度(离散度)料的变异度(离散度) 3、特点特点:CV没有单位,是相对数,没有单位,是相对数,便于资料间的比较。便于资料间的比较。 变异系变异系数数 身高:身高: cm, s=4.95cm

29、体重:体重: kg, s=4.96kg CV身高身高= =2.98% 06.166 X72.53 X%10006.16695. 4 CV体重体重= =9.23%10072.5396. 4 100名名20岁健康男子的身高和体重的均数、标准岁健康男子的身高和体重的均数、标准差如下差如下,比较其变异度。比较其变异度。 某地不同年龄儿童身高某地不同年龄儿童身高(cm)的变异程度的变异程度 年龄组年龄组 人数人数 均数均数 标准差标准差 变异系数变异系数(%) 1-2月月 100 56.3 2.1 3.7 5-6月月 120 66.5 2.2 3.3 3-3.5岁岁 300 96.1 3.1 3.2 5

30、-5.5岁岁 400 107.8 3.3 3.1 集中趋势指标集中趋势指标 资料资料 抗体滴度抗体滴度 G、S 否否 偏态、开口偏态、开口 M、Q 否否 X、S是是是是选择判断的选择判断的步骤步骤:离散趋势指标离散趋势指标单位不同单位不同均数均数相差相差悬殊悬殊CV第四节第四节 分类资料的统计描述分类资料的统计描述 一、一、 常用的相对数常用的相对数分类资料常采用分类资料常采用相对数相对数进行描述。进行描述。 收集到的分类资料,表现为收集到的分类资料,表现为绝对数绝对数。绝对数说明事物发生的实际水平,是进行绝对数说明事物发生的实际水平,是进行统计分析的基础,但不便于事物进行深入统计分析的基础,

31、但不便于事物进行深入地分析比较。地分析比较。 例如:某年甲乙两村发病情况如下:例如:某年甲乙两村发病情况如下:甲村:发病人数甲村:发病人数 100 人。人。乙村:发病人数乙村:发病人数 300 人。人。发病情况乙村比甲村严重?发病情况乙村比甲村严重?甲村:人口数:甲村:人口数:1000人人 发病人数:发病人数:100 人人 发病率:发病率:10.0%。乙村:人口数:乙村:人口数:5000人人 发病人数:发病人数:300 人人 发病率:发病率:6.0% 。甲村比乙村严重!甲村比乙村严重!相对数:相对数:是两个有联系指标之比,说明事物是两个有联系指标之比,说明事物发生的相对水平,便于对分类资料进行

32、分析发生的相对水平,便于对分类资料进行分析和比较。和比较。 常用的相对数:率、构成比、相对比 率(率(Rate)又称频率指标,是指在一定时又称频率指标,是指在一定时间内发生某现象的观察单位数与可能发生该间内发生某现象的观察单位数与可能发生该现象的总观察单位数之比。它说明某现象发现象的总观察单位数之比。它说明某现象发生的频率或强度。生的频率或强度。 (一)、率(一)、率 K为比例基数,可以是百分率(为比例基数,可以是百分率(%)、千分率)、千分率()、万分率()、万分率(1/万)或十万分率(万)或十万分率(1/10万),万),可根据习惯或使计算出的率保持一、二位整数。可根据习惯或使计算出的率保持

33、一、二位整数。K单位总数可能发生该现象的观察数发生某现象的观察单位率 人口出生率、死亡率、自然增长率、婴人口出生率、死亡率、自然增长率、婴儿死亡率等采用千分率;儿死亡率等采用千分率; 肿瘤的死亡率采用十万分率。肿瘤的死亡率采用十万分率。 习惯用法:习惯用法: 计算率时,注意分母和时间。只有可能计算率时,注意分母和时间。只有可能发生某事件的观察单位才能做分母。时间一发生某事件的观察单位才能做分母。时间一般以年为间期,也有月、周等。般以年为间期,也有月、周等。注意注意例如:例如:麻疹发病率麻疹发病率 = 1000 某年新发麻疹病例数某年新发麻疹病例数同年麻疹易感儿总数同年麻疹易感儿总数不应该是儿童

34、总数不应该是儿童总数构成比(构成比(Proportion)又称构成指标又称构成指标,说明一说明一事物内部各个组成部分所占的比重或分布,事物内部各个组成部分所占的比重或分布,常以百分数表示,又称百分比。常以百分数表示,又称百分比。 %100 观察单位总数观察单位总数同一事物各组成部分的同一事物各组成部分的位数位数某一组成部分的观察单某一组成部分的观察单构成比构成比(二)、构成比(二)、构成比48%17%14%12%9%脑血管疾病心血管疾病恶性肿瘤意外伤害呼吸系病1999年中国农村死亡原因构成年中国农村死亡原因构成 (%)呼吸系病呼吸系病23%23%其它其它14%14%恶性肿瘤恶性肿瘤18%18%

35、脑血管病脑血管病18%18%心脏病心脏病12%12%消化系病消化系病4%4%损伤中毒损伤中毒11%11%构成比两个特点:构成比两个特点:1)一组构成比之和等于或;)一组构成比之和等于或;2)某部分构成增加或减少,则其它部分构成)某部分构成增加或减少,则其它部分构成就相应减少或增加。就相应减少或增加。 某医院某医院1980年与年与1982年各科病床情况年各科病床情况 科别科别 1980年年 1982年年 病床数病床数 构成比构成比 病床数病床数 构成比构成比 内科内科 200 50.0 300 60.0 外科外科 100 25.0 100 20.0 儿科儿科 100 25.0 100 20.0

36、合计合计 400 100.0 500 100.0 (三)、(三)、 相对比(相对比(Ratio)相对比是相对比是A、B两个有关指标之比,说明两个有关指标之比,说明A是是B的多少倍或百分之几。的多少倍或百分之几。 A与与B的性质可以相同,也可以不同。可的性质可以相同,也可以不同。可以是绝对数也可以是相对数或平均数。以是绝对数也可以是相对数或平均数。 人口密度、性比例、医护比,医技比人口密度、性比例、医护比,医技比 %)100(BA比比二、二、 应用相对数的注意事项应用相对数的注意事项 1、计算相对数的分母不宜过小、计算相对数的分母不宜过小 分母过小则计算所得的相对数不稳定,分母过小则计算所得的相

37、对数不稳定,不可靠,容易产生误解。不可靠,容易产生误解。临床资料至少临床资料至少30例才好计算率例才好计算率 动物实验动物实验10例也可以计算率!例也可以计算率!2、构成比不能代替率(分析时不能以比代率、构成比不能代替率(分析时不能以比代率 ) 在实际应用中经常出现以构成比代替率进行在实际应用中经常出现以构成比代替率进行分析的错误。分析的错误。有下表资料有下表资料年龄(岁)年龄(岁)0 102030405060 70 合计合计沙眼人数沙眼人数 47 198 330 198 128 80 38 8 1027 % 4.6 19.3 32.1 19.3 12.4 3.7 7.8 0.8 100.0

38、某文章作者根据上述资料认为,沙眼在某文章作者根据上述资料认为,沙眼在20组的患病率最高,以后随年龄增大而减组的患病率最高,以后随年龄增大而减少。少。犯了以比代率犯了以比代率的错误的错误3、正确计算合计率(总率)、正确计算合计率(总率) 对观察单位数对观察单位数不等的几个率,不能直接相加求平均率不等的几个率,不能直接相加求平均率 正确的方法:正确的方法:总的发生数除以总的观察总的发生数除以总的观察单位数。单位数。 某医院各科的病死率某医院各科的病死率 科别科别 患者数患者数 死亡数死亡数 病死率(病死率(%) 外外 科科 1500 180 12.0 内内 科科 500 20 4.0 传染科传染科

39、 400 24 6.0 合计合计 2400 224 7.3 (12.0+4.0+6.0)/3100%=7.3% 平均率平均率=224/2400100%=9.3% 决定率(或构成比)的因素很多,除所决定率(或构成比)的因素很多,除所研究的因素外,尚有许多重要的影响因素;研究的因素外,尚有许多重要的影响因素;两个或两个以上的率(构成比)相比较时,两个或两个以上的率(构成比)相比较时,其他重要的影响因素要相同或相近(即所谓其他重要的影响因素要相同或相近(即所谓的具有可比性),否则就不能直接对率进行的具有可比性),否则就不能直接对率进行比较。一般的,两个地方的出生率、死亡率、比较。一般的,两个地方的出

40、生率、死亡率、发病率,不同级别医院某病的治愈率等不能发病率,不同级别医院某病的治愈率等不能直接比较。直接比较。 4、注意资料的可比性、注意资料的可比性 率(或构成比)的比较是否具有可比性,率(或构成比)的比较是否具有可比性,通常注意以下两个方面:通常注意以下两个方面: (1)观察对象同质,研究方法相同,观察)观察对象同质,研究方法相同,观察时间相等,以及研究对象所处的地区、民族、时间相等,以及研究对象所处的地区、民族、职业、生活条件和习惯要一致;影响率的其职业、生活条件和习惯要一致;影响率的其它因素在各对比组的内部构成是否相同。它因素在各对比组的内部构成是否相同。 (2)同一地区不同时期资料的

41、相对数比较,)同一地区不同时期资料的相对数比较,应注意条件有无变化。应注意条件有无变化。 两医院乳腺癌手术后的两医院乳腺癌手术后的5年生存率(年生存率(%)腋下淋巴腋下淋巴 省医院省医院 市医院市医院结转移结转移 病例数病例数 构成构成 生存数生存数 生存率生存率 病例数病例数 构成构成 生存数生存数 生存率生存率 无无 45 6.0 35 77.77 300 78.3 215 71.67 有有 710 94.0 450 63.38 83 21.7 42 50.60 合计合计 755 100.0 485 64.24 383 100.0 257 67.10 不能直接比较两院总的生存率(应标化后再

42、比)不能直接比较两院总的生存率(应标化后再比) 两院乳腺癌病人有无淋巴结转移构成比较两院乳腺癌病人有无淋巴结转移构成比较 有转移有转移 无转移无转移省医院省医院 710/755=0.940 45/755=0.060市医院市医院 83/383=0.217 300/383=0.783 5、率或构成比的比较要遵循随机抽样、率或构成比的比较要遵循随机抽样的原则,要做假设检验。的原则,要做假设检验。即两组或多组率比较,要作假设检验再即两组或多组率比较,要作假设检验再下结论。下结论。 三、三、 率的标准化法率的标准化法 两医院乳腺癌手术后的两医院乳腺癌手术后的5年生存率(年生存率(%) 腋下淋巴腋下淋巴

43、省医院省医院 市医院市医院 结转移结转移 病例数病例数 生存数生存数 生存率生存率 病例数病例数 生存数生存数 生存率生存率 无无 45 35 77.77 300 215 71.67 有有 710 450 63.38 83 42 50.60 合计合计 755 485 64.24 383 257 67.10 不能直接比较两院总的生存率(应标化后再比)不能直接比较两院总的生存率(应标化后再比)(一)、标准化法的意义和基本思想(一)、标准化法的意义和基本思想率的标准化:率的标准化:是指在比较两个或多个总是指在比较两个或多个总率时,采用一个共同的内部构成标准,率时,采用一个共同的内部构成标准,将两个或

44、多个样本不同的内部将两个或多个样本不同的内部 部构成调部构成调整为相同的内部构成,以消除因内部构整为相同的内部构成,以消除因内部构成不同对总率产生的影响,使算得的标成不同对总率产生的影响,使算得的标准化率具有可比性。采用标准化方法计准化率具有可比性。采用标准化方法计算得到的率简称算得到的率简称标化率标化率,又,又调整率调整率。 基本思想:基本思想:采用统一的标准内部构成采用统一的标准内部构成(年龄、性别),在相同的内部构成条(年龄、性别),在相同的内部构成条件下,计算预期的发生率(死亡率);件下,计算预期的发生率(死亡率); 目的:目的:消除因内部构成不同对总率消除因内部构成不同对总率产生的影

45、响,使标化率具有可比性。产生的影响,使标化率具有可比性。 (二)、标化率的计算(二)、标化率的计算 标化率的计算,常用的有标化率的计算,常用的有直接法直接法和和间接法间接法。 1、直接法计算标化率、直接法计算标化率 )()()(232222 iiiipNNpNpNp当已知被标化组内部各小组的率时(即当已知被标化组内部各小组的率时(即pi), 采用直接法。采用直接法。为标准组的人口数为标准组的人口数 P代表标准化率,代表标准化率,Ni为标准组各个年龄为标准组各个年龄人口数,人口数,N为标准组总人口数;为标准组总人口数;pi为被标化组为被标化组各年龄组的发生率。各年龄组的发生率。 Ni pi为预期

46、发生数;为预期发生数;Ni/N为标准组年龄构成。注意:不能用为标准组年龄构成。注意:不能用Np 求出预期发生数。求出预期发生数。2、间接法计算标化率、间接法计算标化率 P为标准组总死亡率(发生率),为标准组总死亡率(发生率),Pi为标为标准组各年龄组死亡率(发生率),准组各年龄组死亡率(发生率),r为被标化为被标化组实际死亡数(发生数),组实际死亡数(发生数),r/niPi为被标化为被标化组实际死亡数与预期死亡数之比,称为标准组实际死亡数与预期死亡数之比,称为标准化死亡比,用化死亡比,用SMR表示;表示; SMRPPnrPpii 若若SMR1,说明被标化组人群死亡率高说明被标化组人群死亡率高于

47、标准组;若于标准组;若SMR1,说明其生存率高于标准组;,说明其生存率高于标准组;市医院市医院SSR1,说明其生存率低于标准组。,说明其生存率低于标准组。(七)、应用标准化率注意事项(七)、应用标准化率注意事项1、应用直接法计算标准化率时,由于所、应用直接法计算标准化率时,由于所选定的标准人口不同,算得的标准化率选定的标准人口不同,算得的标准化率也不同,因此,比较几个标准化率时,也不同,因此,比较几个标准化率时,应采用同一标准人口。应采用同一标准人口。2、当各年龄组的率出现明显交叉时,宜、当各年龄组的率出现明显交叉时,宜直接比较各年龄组的发生率,而不宜用直接比较各年龄组的发生率,而不宜用标准化

48、法标准化法 。 甲乙两厂某工种某病患病率甲乙两厂某工种某病患病率 工龄工龄 甲甲 厂厂 乙乙 厂厂 (年)工人数(年)工人数 患者数患者数 患病率(患病率(%)工人数)工人数 患者数患者数 患病率(患病率(%) 3 400 12 3.0 100 1 1.0 3 100 10 10.0 400 72 18.0 合计合计 500 22 4.4 500 73 14.6 3 3 (工龄)(工龄)20 15 10 5交叉交叉3、两样本标准化率的比较应作假设检验。、两样本标准化率的比较应作假设检验。4、采用间接法计算所得的标准化率仅能与所、采用间接法计算所得的标准化率仅能与所选标准比较,两个间接法标准化率不能互相选标准比较,两个间接法标准化率不能互相比较。比较。 5、标化后的标准化率不反映实际水平,只是、标化后的标准化率不反映实际水平,只是用于比较的相对水平。用于比较的相对水平。第五节第五节 动态数列及其分析指标动态数列及其分析指标 动态数列动态数列 是一系列按时间顺序排列起来的统是一系列按时间顺序排列起来的统计指标(绝对数、相对数、平均数),用以说计指标(绝对数、相对数、平均数),用以说明事物在时间上的变化和发展趋势。明事物在时间上的变化和发展趋势。 一个国家或地区各年的人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论