第一讲(二)统计描述_第1页
第一讲(二)统计描述_第2页
第一讲(二)统计描述_第3页
第一讲(二)统计描述_第4页
第一讲(二)统计描述_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 频数分布频数分布 计量资料的统计描述计量资料的统计描述 计数资料的统计描述计数资料的统计描述 统计图表统计图表 第一节第一节. .频数分布频数分布 频数分布表频数分布表 (frequency table)(frequency table) 用途:用于描述资料的分布特征 频数:在一批样本中,相同情形出现的次数称为该情形的 频数。 资料类型资料类型组段组段频数频数 计数和等级计数和等级观察结果的所有分类观察结果的所有分类 相同类别出现的次相同类别出现的次 数数 计量计量根据观察结果重新划根据观察结果重新划 分分 分组统计分组统计 性别性别 n M 男生男生 26 89 女生女生 24 90 合计

2、合计 50 表表B 高一班成绩表高一班成绩表 例题 100名学生的某项测验中的分数如下名学生的某项测验中的分数如下 76.0 77.5 82.0 90.5 81.0 85.5 71.0 80.5 92.5 78.0 77.0 88.0 81.0 76.5 83.0 84.0 84.0 62.0 79.0 80.5 72.0 89.0 78.0 78.0 80.0 78.5 76.5 75.0 79.5 74.5 86.0 81.5 75.0 84.0 90.0 80.0 86.0 84.5 68.5 77.0 71.0 86.0 81.5 79.5 80.5 73.0 93.0 83.0 72

3、.0 82.5 68.0 71.0 87.0 78.0 66.0 83.0 87.0 82.5 79.5 72.5 80.0 82.0 81.0 86.5 83.5 71.5 83.0 91.0 96.0 73.5 75.5 89.0 87.5 69.0 74.0 70.0 77.5 75.0 79.0 73.5 76.0 88.5 85.0 89.5 78.5 76.0 74.0 98.0 73.0 94.0 79.0 80.0 75.5 83.5 82.0 65.0 74.5 80.0 70.5 79.0 (一)频数表的编制步骤 (1 1)求)求极差极差(rangerange):即最大值与

4、最小值之差,又称为):即最大值与最小值之差,又称为 全距。全距。 本例极差:本例极差: R R=98=9862=3662=36 (2 2) 决定决定组数组数、组段组段和和组距组距:根据研究目的和样本含量:根据研究目的和样本含量 n n确定。组距确定。组距= =极差极差/ /组数,通常分组数,通常分10-1510-15个组,为方便计,个组,为方便计, 组距参考极差的十分之一组距参考极差的十分之一, , 再略加调整。再略加调整。 本例本例i i= R /12=36/12=3= R /12=36/12=3。 (3 3) 列出组段:第一组段的列出组段:第一组段的下限略小于最小值下限略小于最小值,最后一

5、,最后一 个组段个组段上限必须包含最大值上限必须包含最大值,其它组段上限值忽略。,其它组段上限值忽略。 (4 4) 划记计数划记计数:用划记法将所有数据归纳到各组段,得:用划记法将所有数据归纳到各组段,得 到各组段的频数。到各组段的频数。 分组分组 f 96 2 93 3 90 4 87 8 84 11 81 17 78 19 75 14 72 10 69 7 66 3 63 1 60 1 m 97 94 91 88 85 82 79 76 73 70 67 64 61 100 1.00 100 P .02 .03 .04 .08 .11 .17 .19 .14 .10 .07 .03 .01

6、 .01 P% 2 3 4 8 11 17 19 14 10 7 3 1 1 表表2-1 1002-1 100名学生某测验成绩频数分布表名学生某测验成绩频数分布表 ( (二二) )频数表和频数分布图用途频数表和频数分布图用途 1.描述频数分布的类型 (1)对称分布 :若各组段频数的分布以频数最多的组 段为中心左右两侧大体对称(总体则完全对称),就认为 该资料是对称分布 (2)偏态分布 右偏态分布(正偏态分布):频数最多组段右侧的组段数多于 左侧的组段数,高峰向左偏移,频数向右侧拖尾。 转氨酶含量 人 数 12 2 15 9 18 14 21 23 24 19 27 14 30 11 33 9

7、36 7 39 4 4245 3 表4- 115名正常成年女子血清转氨酶(mmol/L)含量分布 左偏态分布(负偏态分布左偏态分布(负偏态分布):): 左侧的组段数多于右侧的组段数,频数向左侧拖尾。 肌红蛋白含量 人 数 0 2 5 3 10 7 15 9 20 10 25 22 30 23 35 14 40 9 4550 2 表4- 101名正常人的血清肌红蛋白( )含量分布g/m L 血 清 肌 红 蛋 白(g / m L) 0 5 10 15 20 25 2.512.522.532.542.552.5 图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布 人 数

8、 2.2.描述计量资料分布的集中趋势和离散趋势描述计量资料分布的集中趋势和离散趋势 集中趋势集中趋势(central tendency):(central tendency):变量值集中位置。变量值集中位置。 平均水平指标平均水平指标 离散趋势离散趋势(tendency of dispersion):(tendency of dispersion):变量值围绕集中位变量值围绕集中位 置的分布情况。离置的分布情况。离“中心中心”位置越远,频数越小;且围绕位置越远,频数越小;且围绕 “中心中心”左右对称。左右对称。 变异水平指标变异水平指标 3 3便于发现一些特大或特小的可疑值便于发现一些特大或特

9、小的可疑值* * 组 段 频数 f (1) (2) 2.30 1 2.60 0 2.90 0 3.20 0 3.50 17 3.80 20 4.10 17 4.40 12 4.70 9 5.00 0 5.30 0 5.605.90 8 合 计 101 第二节 计量资料的常用统计指标 l集中趋势的描述集中趋势的描述 l离散趋势的描述离散趋势的描述 一、描述集中趋势的特征数(平均指标) 总称为平均数反映了资料的集中趋势 ( central tendencycentral tendency )。常用的有: 1.算术均数(arithmetic mean) 2.几何均数(geometric mean)

10、3.中位数 (median) 1.均数(mean) n X n XXX X n 21 112233 123 kki ki f Xf Xf Xf XfX X fffff X 符号:总体 样本 适用条件:资料呈对称分布,尤其是正态或近似正态。 计算:(1)直接法(2)频数表法 2. 几何均数(geometric mean) n X X n X XXX n X XXXX G nG n nG lg lg lg )lglg(lg 1 lg 1 21 21 为正值, 为底的反对数表示以 为底的对数;表示以 0 10lg 10lg 1 X 几何均数几何均数:变量变量 对数值的对数值的算术均算术均 数数的反对

11、数的反对数。 几何均数的适用条件与实例 适用条件适用条件:呈倍数关系的等比资料或对数正态分布(正:呈倍数关系的等比资料或对数正态分布(正 偏态)资料;如抗体滴度资料偏态)资料;如抗体滴度资料 例例 血清的抗体效价滴度的倒数倒数分别为:10、100、1000、 10000、100000,求几何均数。 1000 5 10lg10lg10lg10lg10lg lg 54321 1 G 此例的算术均数为此例的算术均数为2222222222,显然不能代表滴度的平均水,显然不能代表滴度的平均水 平。同一资料,平。同一资料,几何均数几何均数 中位数中位数 负偏态分布时:均数均数中位数中位数 小结:小结: 集

12、中趋势的描述集中趋势的描述 不同的分布使用不同的指标 (算术)均数:正态或近似正态或观察值相差不大的小样 本资料 几何均数:对数正态分布或等比级数资料 中位数 :一般偏态分布(传染病发病的潜伏期) 二、描述离散趋势的特征数 反映数据的离散度( Dispersion )。即个体观察值 的变异程度。常用的指标有: 1.极差(Range) (全距) 2.百分位数与四分位数间距 Percentile and Quartile range 3.方差 Variance 4.标准差Standard Deviation 5.变异系数 Coefficient of Variation 盘编号盘编号 甲甲乙乙丙丙

13、 1 1 440480490 2 2 460490495 3 3 500500500 4 4 540510505 5 5 560520510 合计合计250025002500250025002500 均数均数500500500500500500 例:设甲、乙、丙三人,采每人的耳垂血,然后红细例:设甲、乙、丙三人,采每人的耳垂血,然后红细 胞计数,每人数胞计数,每人数5个计数盘,得结果如下(万个计数盘,得结果如下(万/mm3) 甲乙丙 1.极差(Range) (全距) minmax XXR 1204020 符号:R 意义:反映全部变量值的变动 范围。 优点:简便, 缺点:1.只利用了两个 极端值

14、 2.n大,R也会大 3.不稳定 适用范围:任何计量资料;是 参考变异指标 2.百分位数与四分位数间距 Percentile and quartile range 百分位数百分位数 :数据从小到大:数据从小到大 排列排列; ;在百分尺度下,所占在百分尺度下,所占 百分比对应的值。记为百分比对应的值。记为P Px x。 四分位间距四分位间距: Q QP P75 75 P P25 25 quartile deviationquartile deviation:QDQD QR/2QR/2 P100(max) P75 P50(中位数中位数) P25 P0(min) Px 频数表资料的百分位数 m L

15、x x f fxn iLP xn P )%( )%( 值间的频数所在组段下限值至上限 至该下限值的累计频数 组距 所在组段下限值 下限值下限值L 上限值上限值U i; fm 百分位数百分位数Px )%( L fxn P256+6x(145x25%17)/468.51(h) P7518+6x(145x75%101)/3219.45(h) Q19.45-8.5110.94(h) 潜伏期潜伏期/h (1) 频数,频数,f (2) 累计频数累计频数 f (3) 01717 64663 1238101 1832133 246139 300139 364143 4248 合计合计 2145 145 百分位

16、数的应用 确定医学确定医学参考值范围参考值范围 (reference rangereference range):): 如如9595参考值范围参考值范围P P97.5 97.5 P P2.5 2.5; ; 表示有表示有9595正常正常个体个体的测量值在此范围。的测量值在此范围。 中位数中位数MdMd与与四分位半间距四分位半间距QDQD一起使用,描述偏态分布一起使用,描述偏态分布 资料的特征资料的特征 3.方差 方差方差 (variancevariance)也称)也称均方差均方差(mean square mean square deviationdeviation),样本观察值的离均差平方和的均

17、值。表示),样本观察值的离均差平方和的均值。表示 一组数据的平均离散情况。一组数据的平均离散情况。 N X XlSS X xx 2 2 2 )-( )-()square of sum( 0)-( 总体方差 离均差平方和 离均差和 11 )( 2 2 2 2 n nXX n XX S样本方差 样本方差为什么要除以(n1) 2 2 ()X N 总 体 方 差 数理统计证明,n代替N后,计算出的样本方差对 总体方差的估计偏小。对于样本资料,对离均差平 方和取平均时分母用n-1代替n。 2 2 2 2 () 11 XXnXX S nn 样本方差 4.标准差 2 2 2 () 11 XXnXX S nn

18、 样本标准差 标准差标准差 (standard deviationstandard deviation)即方差的正)即方差的正 平方根;其单位与原变量平方根;其单位与原变量X X的单位相同。的单位相同。 1 2 2 f ffXfX S频数表样本标准差 2 ()XX N 总体标准差 标准差的计算 盘编号盘编号 甲甲乙乙丙丙甲甲2 2乙乙2 2丙丙2 2 1 1440480490193600230400240100 2 2460490495211600240100245025 3 3500500500250000250000250000 4 4540510505291600260100255025

19、 5 5560520510313600270400260100 合计合计25002500 25002500 25002500 1260400 1251000 1250250 标准差标准差 50.9915.817.91 99.50 15 5/25001260400 1 2 2 2 甲的标准差 n nXX S 5.变异系数(coefficient of variation) %100 X S CV 符号符号:CV:CV 适用条件适用条件:观察指标单位不同,如身高、体重观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊同单位资料,但均数相差悬殊 均数均数 标准差标准差变异系数变异系数 青年男

20、子青年男子 身高身高170 cm6 cm 3.5 体重体重60 kg7 kg 11.7 意义:意义:挑选指标时变异系数越小,指标越好。 身高的差异水平:身高的差异水平:cmcm 体重的差异水平:体重的差异水平:kgkg 用用差异系数差异系数可以相互比较可以相互比较 S X 身高 身高 S X 体重 体重 可可 比比 500Skg 大象0.5Skg 免子 3500Xkg 大象2.5Xkg 免子 可比可比 变异指标小结 1.1.极差较粗,适合于任何分布极差较粗,适合于任何分布 2.2.标准差标准差与均数的单位相同,最常用,适合于近似正态分与均数的单位相同,最常用,适合于近似正态分 布布 3.3.变

21、异系数主要用于单位不同或均数相差悬殊资料变异系数主要用于单位不同或均数相差悬殊资料 4.4.平均指标和变异指标分别反映资料的不同特征,平均指标和变异指标分别反映资料的不同特征, 常配套使用常配套使用, ,如如 正态分布正态分布:均数、标准差;:均数、标准差; 偏态分布偏态分布:中位数、四分位半间距:中位数、四分位半间距 第三节 计数资料的常用统计指标 一一. .常用相对数指标常用相对数指标 二二. .应用注意事项应用注意事项 一、常用相对数 v 绝对数:通过调查或实验得到的原始数据。如某病的出绝对数:通过调查或实验得到的原始数据。如某病的出 院人数、治愈人数、死亡人数等。院人数、治愈人数、死亡

22、人数等。 但绝对数通常不具有可比性:但绝对数通常不具有可比性: 1. 1. 如甲、乙两个医院某病出院人数不同时,比较两如甲、乙两个医院某病出院人数不同时,比较两 医院该病的死亡人数没有意义医院该病的死亡人数没有意义 2. 2. 如如20022002级附二院五年制一、二大班学生人数不同级附二院五年制一、二大班学生人数不同 时,比较两班医学统计学的及格人数没有意义时,比较两班医学统计学的及格人数没有意义, ,因此需要因此需要 在绝对数的基础上计算相对数。在绝对数的基础上计算相对数。 v 相对数:两个有联系的指标之比相对数:两个有联系的指标之比, ,常用的相对数有:常用的相对数有: 一、比一、比 二

23、、比率二、比率 三、速率三、速率 v相对比简称比相对比简称比,是两个有关指标之比,说明两指,是两个有关指标之比,说明两指 标间的比例关系。标间的比例关系。 v计算公式为计算公式为 v式中两指标可以是绝对数、相对数或平均数式中两指标可以是绝对数、相对数或平均数。 (一)比(一)比(ratio) A R B 指标 指标 (一一)两个绝对数之比:两个绝对数之比: 如某年某医院出生婴儿中,男性婴儿为如某年某医院出生婴儿中,男性婴儿为370人,女人,女 性 婴 儿 为性 婴 儿 为 3 5 8 人 , 则 出 生 婴 儿 性 别 比 例 为人 , 则 出 生 婴 儿 性 别 比 例 为 370/3581

24、00 = 103,说明该医院该年每出生,说明该医院该年每出生100名名 女婴儿,就有女婴儿,就有103名男性婴儿出生,它反映了男性婴名男性婴儿出生,它反映了男性婴 儿与女性婴儿出生的对比水平。儿与女性婴儿出生的对比水平。 A R B 类发生例数 类发生例数 (二二)两个率之比:两个率之比:如相对危险度(如相对危险度(RR)。)。 例例 如某地某年龄组男性吸烟和非吸烟的冠心病如某地某年龄组男性吸烟和非吸烟的冠心病 死亡资料如表死亡资料如表7-2,试分析其相对危害度。,试分析其相对危害度。 1 2 p R p 240.5 2.139 112.4 R 说明男性吸烟组的冠心病死亡率是非吸烟组的说明男性

25、吸烟组的冠心病死亡率是非吸烟组的2.139倍。倍。 吸 烟 组 非 吸 烟 组 死 亡 数 104 12 观 察 人 年 数 43248 10673 死 亡 率 ( 1/10 万 人 年 ) 240.5 112.4 表表7-2 某地某年龄组男性吸烟和非吸烟的冠心病死亡资料某地某年龄组男性吸烟和非吸烟的冠心病死亡资料 (三三)两个相对比之比:两个相对比之比:如流行病学常用的比数比(如流行病学常用的比数比(OR)。)。 例例 服用反应停与肢体缺陷关系病例对照研究资料如表所示:服用反应停与肢体缺陷关系病例对照研究资料如表所示: 比率比率(P57): (P57): 分子分母都是绝对数,且分子必须是分母

26、的一部分。 1.1.率(率(raterate)(强度相对数)(强度相对数) 说明某现象或某事物说明某现象或某事物发生发生的的频率频率或或强度强度。 率率= =(实际发生数(实际发生数/ /可能发生总数)可能发生总数)比例基数比例基数 如如:治愈率、病死率、阳性率、人群患病率等:治愈率、病死率、阳性率、人群患病率等 比例基数比例基数:100%100%、10001000、10000/10000/万、万、100000100000(1/101/10万)等万)等 (按习(按习 惯,使结果保留惯,使结果保留1-21-2位小数)位小数) 例如:患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以例如:患病率

27、通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以 十万分率表示。十万分率表示。 (二)比率(二)比率(proportionproportion) 2.2.构成比构成比(结构相对数结构相对数)(proportionproportion):): n表示事物内部某一部分的个体数与该事物各部分个体数的 总和之比,用来说明各构成部分在总体中所占的比重或分 布。 n通常以100%为比例基数。其计算公式为 如如:教研室:教研室1616人人高级职称有高级职称有4 4人,占人,占2525; ;中级职称有中级职称有8 8 人,占人,占5050; ;初初级职称有级职称有4 4人,占人,占2525。 (三)速率(三)速

28、率(raterate):分母中含有时间量纲。):分母中含有时间量纲。 是反映单位时间内某事件出现的可能性大小,多用于面向人是反映单位时间内某事件出现的可能性大小,多用于面向人 群的出生、死亡和发病资料的统计群的出生、死亡和发病资料的统计. . 人口出生率人口出生率=(=(某年中活产总数某年中活产总数/ /该年平均人口数该年平均人口数) ) 100%100% 三、应用注意事项 1.1.计算相对数总观察单位数应足够多计算相对数总观察单位数应足够多 2.2.不能以构成比代替率。不能以构成比代替率。 3.3.进行率的对比分析时,应注意资料进行率的对比分析时,应注意资料可比性可比性。如。如 比较疗比较疗

29、 效时,比较组间应病情轻重相同,性别影响,应按性效时,比较组间应病情轻重相同,性别影响,应按性 别分组后再作比较。别分组后再作比较。 (1)观察对象是否同质,研究方法是否相同,观察时间是)观察对象是否同质,研究方法是否相同,观察时间是 否相等,以及地区、周围环境、风俗习惯和经济条件是否一否相等,以及地区、周围环境、风俗习惯和经济条件是否一 致或相近等。致或相近等。 (2)观察对象内部结构是否相同,若两组资料的年龄、)观察对象内部结构是否相同,若两组资料的年龄、 性别等构成不同,可以分别进行同年龄别、同性别的小组率性别等构成不同,可以分别进行同年龄别、同性别的小组率 比较或对总率(合计率)进行标

30、准化后再作比较。比较或对总率(合计率)进行标准化后再作比较。 率与构成比容易误用 年龄 组 受检 人数 白内障 例数 患者年龄构 成比(%) 患病率(%) =(3)/(2) 40 50 60 70 80 合计 560 441 296 149 22 68 129 135 97 19 15.18 28.79 30.13 21.65 4.24 12.14 29.25 45.61 65.10 86.36 1468448100.0030.52 4 4、正确求、正确求平均率平均率。 例:若例:若P P1 1= =x x1 1/ /n n1 1 ,P P2 2= =x x2 2/ /n n2 2 P P3

31、3= =x x3 3/ /n n3 3 P P(x x1 1+ + x x2 2+ + x x3 3)/( /( n n1 1+ + n n2 2+ + n n3 3) ( (正确正确) ) P P(P P1 1+ + P P2 2+ + P P3 3)/3/3 ( (错误错误) ) 5. 5. 样本率样本率(或构成比)同样存在(或构成比)同样存在抽样误差抽样误差,故应,故应 进行样本率(或构成比)差别的假设检验。进行样本率(或构成比)差别的假设检验。 第四节 统计图表 统计表统计表(statistical table)(statistical table)数据数据代代 替文字描述,便于统计结

32、果的替文字描述,便于统计结果的精确精确、简洁的、简洁的表表 达达和和对比分析对比分析 统计图统计图(statistical chart)(statistical chart)用用图形图形 代替数据,获得代替数据,获得直观直观、形象形象的效果的效果 一.统计表 1. 1. 统计表的结构统计表的结构 2. 2. 统计表的种类统计表的种类 标题:标题: 标目:标目: 线条:线条: 数字:无数字用数字:无数字用“”表示,缺失数字用表示,缺失数字用 “”表示,数值为表示,数值为0 0者记为者记为“0”0”,不要,不要 留空项。留空项。 备注:备注: 1、统计表的基本结构 横横标标目目名名称称 纵纵标标目

33、目名名称称 合合 计计 横横 标标 目目 数数 据据 区区 合合 计计 顶顶 线线 底底 线线 表表 名名 标标 题题 表表4-8 某省某工厂某省某工厂 1994、1998年四项检测指标异常检出率年四项检测指标异常检出率 检测检测 指标指标 1994年年1998年年 受检人数受检人数 异常人数异常人数 检出率检出率(%) 受检人数受检人数异常人数异常人数 检出率检出率(%) 血压血压 心率心率 TTT GPT 519 519 519 519 55 44 36 20 10.16 0.48 6.94 3.85 582 582 582 582 38 39 23 16 6.52 6.70 3.95 2

34、.75 :TTT(麝香草酚浊度试验), :GPT(谷丙转氨酶)。 2.2.统计表的种类统计表的种类 根据分组标目的复杂程度,统计表可大致分为简单表根据分组标目的复杂程度,统计表可大致分为简单表 和复合表。和复合表。 简单表简单表(simple table)(simple table):只按一个特征或标志分组。:只按一个特征或标志分组。 组合表组合表(combinative table) (combinative table) :按两个或两个以上特:按两个或两个以上特 征或标志结合起来分组。如表征或标志结合起来分组。如表4-84-8。 表表 2-8 某某医医院院用用两两种种疗疗法法矫矫治治假假性

35、性近近视视眼眼的的近近期期有有效效率率 矫矫治治方方法法 观观察察人人数数 近近期期有有效效人人数数 近近期期有有效效率率(%) 新新医医疗疗法法 眼眼保保健健操操 32 32 16 9 50.0 28.1 简单表示例简单表示例 分组标志为矫治方法分组标志为矫治方法 表表4-8 某省某工厂某省某工厂 1994、1998年四项检测指标异常检出率年四项检测指标异常检出率 检测检测 指标指标 1994年年1998年年 受检人数受检人数 异常人数异常人数 检出率检出率(%) 受检人数受检人数异常人数异常人数 检出率检出率(%) 血压血压 心率心率 TTT GPT 519 519 519 519 55

36、44 36 20 10.16 0.48 6.94 3.85 582 582 582 582 38 39 23 16 6.52 6.70 3.95 2.75 :TTT(麝香草酚浊度试验), :GPT(谷丙转氨酶)。 (丁建生等. 中国卫生统计 1999; 16(3):166 ) 复合表示例复合表示例 分组标志:不同年份分组标志:不同年份 不同检测指标不同检测指标 二二. .统计图统计图 统计图统计图(statistical chart (statistical chart 或或statistical statistical graph)graph)是用点、线、面等几何图形,直观形象地是用点、线、

37、面等几何图形,直观形象地 表达、描述数据或结果。表达、描述数据或结果。 1. 1. 统计图的结构统计图的结构 2. 2. 统计图的种类与绘制注意事项统计图的种类与绘制注意事项 1.统计图的结构 l标题:标题:用于简明扼要地说明资料的内容,一般位于图的用于简明扼要地说明资料的内容,一般位于图的 下方中央位置。下方中央位置。 l图域:图域:即制图空间,是整个统计图的视觉中心。除圆图即制图空间,是整个统计图的视觉中心。除圆图 外,一般都是存在于特定的坐标体系下。外,一般都是存在于特定的坐标体系下。 l标目:标目:分为纵标目和横标目,表示坐标系下纵轴与横轴分为纵标目和横标目,表示坐标系下纵轴与横轴 的

38、含义。的含义。 l图例:图例:用于识别比较的统计图中各种图形所代表的含义。用于识别比较的统计图中各种图形所代表的含义。 l刻度:刻度:即纵轴和横轴上的坐标。刻度数值按从小到大的即纵轴和横轴上的坐标。刻度数值按从小到大的 顺序,纵轴由下向上,横轴由左向右排列。顺序,纵轴由下向上,横轴由左向右排列。 2.统计图的种类与绘制注意事项 直条图直条图 百分条图百分条图 圆图圆图 线图与半对数线图线图与半对数线图 直方图直方图 箱图箱图 散点图散点图 统计地图统计地图 1. 概念 条图用等宽长条的高度表示按性质分类资料各类别的数值大小, 用于表示他们之间的对比关系。 2. 适用资料:相互独立的资料(资料有

39、明确分 组,不连续)。 3. 分类 (1)单式条图 具有一个统计指标,一个分组因素。 (2)复式条图 具有一个统计指标,两个分组因素。 1998 年世界不同地区爱滋病流行情况 北非及中东 西欧 北美洲 拉丁美洲 南亚及东南亚 成人感染率(%) 0.8 0.7 0.6 0.5 0.44 0.3 0.22 0.11 0 表表4-8 某省某工厂某省某工厂 1994、1998年四项检测指标异常检出率年四项检测指标异常检出率 检测检测 指标指标 1994年年1998年年 受检人数受检人数 异常人数异常人数 检出率检出率(%) 受检人数受检人数异常人数异常人数 检出率检出率(%) 血压血压 心率心率 TT

40、T GPT 519 519 519 519 55 44 36 20 10.16 0.48 6.94 3.85 582 582 582 582 38 39 23 16 6.52 6.70 3.95 2.75 :TTT(麝香草酚浊度试验), :GPT(谷丙转氨酶)。 (丁建生等. 中国卫生统计 1999; 16(3):166 ) 绘制条图注意事项 纵轴的刻度必须从纵轴的刻度必须从“0”0”开始,开始, 否则会改变各对比组间的比例关系。否则会改变各对比组间的比例关系。 (2)(2)横轴各直条一般按统计指标由横轴各直条一般按统计指标由 大到小排列,也可按事物本身的自然大到小排列,也可按事物本身的自然

41、顺序排列。顺序排列。 (3)(3)各直条的宽度要一致,各直条各直条的宽度要一致,各直条 应有相等的间隔,其宽度一般与直条应有相等的间隔,其宽度一般与直条 的宽度相等或为直条宽度的一半。的宽度相等或为直条宽度的一半。 1.概念 以圆形的总面积代表100%,把面积按比例分成若 干部分,以角度大小来表示各部分所占的比重。 2.适用资料:构成比资料 2002年某医院1402例孕妇分娩结果 分娩结果分娩结果例数例数 构成比()构成比() 过期产过期产2121 1 1 死产死产2121 1 1 早产早产212212 15 15 足月足月11481148 83 83 总计总100

42、(3)百分条图(percentage chart) 百分条图百分条图的作用与圆图相同。但更适用于多组百的作用与圆图相同。但更适用于多组百 分比的比较。分比的比较。 25.70%25.70% 16.07%16.07%15.04%15.04%11.56%11.56% 11.41%11.41%20.22%20.22% 020406080 100 呼吸系呼吸系 统病统病 脑血脑血 管病管病 恶性恶性 肿瘤肿瘤 损伤与损伤与 中毒中毒 心脏心脏 疾病疾病 其其 它它 图图2-18 我国部分县我国部分县1988年的死因构成比年的死因构成比 不同性别某癌三种类型的构成 分化型癌分化型癌低分化腺癌低分化腺癌未

43、分化型未分化型合计合计 男男52.352.327.827.819.919.9100100 女女30.230.218.118.151.751.7100100 a.普通线图(线图)普通线图(线图) 概念概念: :用线段的升降来表示统计指标的变化趋势。如某事用线段的升降来表示统计指标的变化趋势。如某事 物随时间的发展变化,或某现象随另一现象变迁的情况。物随时间的发展变化,或某现象随另一现象变迁的情况。 适用资料适用资料: :适用于随时间变化的连续性资料适用于随时间变化的连续性资料。 某 市 1949 1957 年 儿 童 结 核 病 和 白 喉 死 亡 率 年 份 1957 1956 1955 19

44、54 1953 1952 1951 1950 1949 死亡率(1/10 万) 160 140 120 100 80 60 40 20 0 结 核 病 白 喉 概念概念:是一种特殊的线图,其坐标纵轴是对数尺是一种特殊的线图,其坐标纵轴是对数尺 度,特别适宜作不同指标变化速度的比较。度,特别适宜作不同指标变化速度的比较。 适用资料适用资料: 适用于随时间变化的连续性资料,尤其比适用于随时间变化的连续性资料,尤其比 较数值相差悬殊的多较数值相差悬殊的多组资料时采用。组资料时采用。 分析目的分析目的: :半对数线图中线段的升降是用来表示某事半对数线图中线段的升降是用来表示某事 物物 发展速度(或者说

45、是相对比)。发展速度(或者说是相对比)。 图 某市 19491957 年儿童结核病和白喉死亡率 年份 1957 1956 1955 1954 1953 1952 1951 1950 1949 死亡率之对数值 2.5 2.0 1.5 1.0 0.5 0 结核病 白喉 普通线图(线图):纵横轴均为算术尺度,普通线图(线图):纵横轴均为算术尺度, 半对数图:纵轴为对数尺度,横轴为算术半对数图:纵轴为对数尺度,横轴为算术 尺度。尺度。 图 2-14 某市 19491957 年儿童结核病和白喉死亡率 年份 195719561955195419531952195119501949 死亡率之对数值 2.5 2.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论