统计表和统计图_第1页
统计表和统计图_第2页
统计表和统计图_第3页
统计表和统计图_第4页
统计表和统计图_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 定量资料的统计描画流行病与卫生统计学教研室 乔慧教授第五节 统计表和统计图学习目的和要求学习重点学习难点 教学方法 授课时数 根本内容本章要求:重点掌握:1.统计表的构造、制表原那么及要求;2.常用的统计图有哪些?它们分别适用于什么资料类型?熟习了解: 统计表和统计图的概念及其作用1. 统计表的正确编制;2. 根据资料的性质和分析目的选择最适宜的统计图。 重点及难点本节教学时数1学时统计分析统计描画统计推断 用统计目的、统计表、统计图等方法,对资料的数量特征及分布规律进展测定和描画。 统计表和统计图是描画资料特征、呈现统计分析结果的重要工具,广泛运用于资料的搜集、整理以及研讨结果的对比

2、分析。一概念:在研讨报告和科研论文中,常将统计分析的目的及其结果用表格的方式列出,称为统计表。1 防止繁杂的文字表达 2 使数据条理化,便于计算3 便于事物间的比较分析和了解作用:二一、 统 计 表三统计表的构造 从外形上看统计表由标题、标目包括横标目、纵标目、线条、数字及必要的文字阐明和备注五部分构成。其方式如下表所示: 顶线底线表5 -1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、

3、丙三类传染病1、标题位于统计表的上方中央;标题要注明资料搜集的时间和地点;标题内容简明扼要,不能过于简单,也不能过于繁琐,而且要与表中内容相符,通常要求标题不超越20个字。表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病2、标目横标目:位于表的左侧,用来阐明各横行数字的涵义,相当于“主语纵标目:阐明各纵栏数字的涵义,相当于 “谓语表4-1 某地区2004年婚前检查检出疾

4、病情况 疾 病病例数 百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病表4-2 某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.677.58胆结石5.885.166.586.46冠心病6.705.894.594

5、.033.线条包括三条根本线:顶线、底线、纵标目分割线,所以有时我们把统计表也称为“三线表;表格中如有合计也用横线隔开;假设在表中有总标目,在总标目和纵标目之间用短横线隔开;表的左上角不宜有斜线,表内不应有竖线,统计表的左右两那么也不应有边线。表4-2 某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.677.58胆结石5.885.166.586.46冠心病6.705.894.59

6、4.03表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病4、数字准确无误,用阿拉伯数字表示;同一目的的小数位数要一致,上下要对齐;表内不留空格,数字暂缺或未记录用“表示,无数字用“表示,数字假设是“0,那么应填写“0;有相对数时,将对应的绝对数也同时列出,以便读者了解和核算。5、备注表格普通不列备注或其他文字阐明,假设需求对某个数字或目的加以阐明,可以在数字或目的右上方

7、用“*之类的符号标注,并在统计表的下方用文字加以阐明。表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病表4-2 某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.6

8、68.677.58胆结石5.885.166.586.46冠心病6.705.894.594.03 从内容上看,每张表都有主语和谓语。主语指被研讨的事物,普通置于表的左侧横标目;谓语指阐明主语的各项目的,普通置于表的右侧纵标目,主语和谓语结合起来构成一个完好的句子。表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病四统计表的种类简单表:由一组横标目和一组纵标目组成复合表:由一

9、组横标目和两组及以上纵标目结合起来作为“主语表4-1 某地区2004年婚前检查检出疾病情况疾病病例数百分比(%)指定传染病(包括性病)*39317.18严重遗传性疾病873.80精神病90.39生殖系统疾病114950.25内科系统疾病64928.38合计2287100.00*指定传染病指我国法定的甲、乙、丙三类传染病表4-2 某地区40岁以上男女居民常见慢性病的患病率(%)疾病男性女性2004年2006年2004年2006年高血脂症33.6528.6134.5025.92高血压24.3725.7618.6020.20脂肪肝19.8722.7617.5018.08糖尿病9.858.668.67

10、7.58胆结石5.885.166.586.46冠心病6.705.894.594.03 将疾病种类、性别和时间结合起来分组,可以反映不同疾病、不同性别以及不同年代的患病率五编制统计表的本卷须知简明扼要,重点突出,即一张表只包括一个中心内容,表达一个主题合理安排主语和谓语的位置表线能否过多过密表内数据要仔细核对、准确可靠统计表制造能否良好,可以从以上几方面检查: 某医院用麦芽根糖浆治疗慢性肝炎161例,疗效资料如表4-6,指出其缺陷并加以改良。表4-6 麦芽根糖浆治疗慢性肝炎疗效察看效果总例数有效无效小计近期痊愈好转例%例%例%例%10867.17043.53823.65332.9表4-6 存在的

11、问题:1.标题过于简单;2.主谓安排不合理;3.标目组合反复;4.表内出现斜线和竖线;表4-7 某年某医院麦芽根糖浆治疗慢性肝炎的疗效察看疗效例数百分比无效5332.9好转3823.6近期痊愈7043.5合计161100.0表4-8 流行病学有关的主要要素季 节8月上旬8月中旬8月下旬9月上旬人数%人数%人数%人数%76.37063.12825.265.4年 龄15岁以下15-25-45岁以上人数%人数%人数%人数%1210.82421.67164.043.6职 业农民学生待业青年其他人数%人数%人数%人数%10695.510.932.710.9? 某地1974年111例钩端螺旋体病患者发病季

12、节、年龄和职业构成资料如表4-8所示,检查此表编制能否适宜,如不适宜,请指出并修正。 表4-8 存在问题:标题不够明确,而且未注明时间、地点。发病季节、年龄和职业三项目的无可比性,放在一同,内容繁杂。标目设计不合理,“人数、“%多次反复,不便于比较分析。表内文字和线条过多。内容较多,层次复杂,表格中数据罗列无条理,较难读懂。表4-9 某地1974年钩端螺旋体病患者发病季节分布季节人数%8月上旬76.38月中旬7063.18月下旬2825.29月上旬65.4合计111100.0表4-10 某地1974年钩端螺旋体病患者发病年龄分布年龄(岁)人数%15以下1210.8159585.645及以上43

13、.6合计111100.0表4-11 某地1974年钩端螺旋体病患者发病职业分布职业人数%农民10695.5学生10.9待业青年32.7其他10.9合计111100.0第二节 统计图statistical chart一概念:是用点的位置、线段的升降、直条的长短、面积的大小等来表达统计数据的一种方式。二作用:统计图比统计表更能直观地表达资料的特征,在科研论文中常被采用。三常用统计图:描画定量变量的统计图:直方图、累计频率分布图、箱式图描画定性变量的统计图:百分条图、圆图、线图、统计地图即可描画定量变量又可描画定性变量的统计图:直条图四绘制统计图的根本要求1.根据资料的性质和分析的目的选择适当的图形

14、。 2.每一张统计图都要有标题,简明扼要地阐明图形要表达的主要内容,必要时应注明资料搜集的时间和地点。标题普通位于图的下方。图1 2005年某地96名妇女产前检查次数分布 3.涉及坐标系的统计图条图、散点图、线图和直方图要等距阐明尺度。条图和直方图纵坐标从0开场。纵横坐标长度的比例普通为57。线图散点图直方图条图4.比较不同事物时,宜选用不同的线条或颜色表示,并附图例加以阐明。图例五 常用统计图的绘制方法及本卷须知 1、条图bar chart:适用于性质类似而不延续的资料。用等宽直条的长短表示相互独立的各项目的数值大小。 可以分为单式条图和复式条图。 1单式条图 只需一个统计目的,一个分组要素

15、 。如图4-1。其中统计目的是三甲医院数,要素指的是不同省市。纵坐标的尺度必需从0开场,否那么会改动各对比组间的比例关系。 2复式条图 有一个统计目的,两个及以上分组要素。如图4-2,按年龄分老中青三组,每组有两个直条,分别代表男女。无论男女,随着年龄的增大,高血压的患病率增高,各个年龄段男性的患病率均高于女性,但是男女之间患病率的差距随年龄的添加而减小 绘制条图时应留意: 1纵轴表示各个工程相应的数据要等距,而且尺度必需从0开场,否那么会改动各对比组间的比例关系。 2宽度:各直条的宽度应相等,各直条的间隔也应一致。条间隔应为条宽的一半或等宽。 留意:复式条图中组内各直条陈列次序要前后一致,同

16、一组内直条间不留间隙,并加以图例。2、 百分条图(percent bar graph) 百分条图:适用于构成比资料。特别适宜作多个构成比的比较,将不同组别,不同时间或不同地域的某分类目的的构成比平行地绘制成多个百分比条图,可以方便地比较其构成比的差别。用矩形长条的面积表示事物全部,而用其中各段表示各构成部分。 图8 两种零落牙再植效果的比较绘制百分条图时应留意以下几点: 1将全体数量绘制成一长条,长度和宽度可以恣意选择,将长条全长分为10格,每格代表10%,总长为100%。2绘制不断条,长度与标尺一致,以直条的长度表示数量的百分比。3将直条全长按构成比分为几段,在图上标出各部分构成比的数值,并

17、用图例阐明各部分的称号。4两种或多种类似的构成比资料相互比较时,可以绘制两个或多个长度、宽度都相等的直条,在同一同点上依次平行陈列,各直条之间留有一定空隙,普通为直条宽度的一半。 百分条图特别适宜作多个构成比的比较 图4-4 20世纪70年代和80年代某地常见恶性肿瘤发病构成比较 图4-3是根据某地20世纪70年代和80年代恶性肿瘤发病登记资料绘制成的百分比条图。由图可见不同年代主要恶性肿瘤中,肺癌明显添加,鼻咽癌和肝癌构成减少3、圆 图(pie chart)圆图:是一种构成图,适用于构成比资料。恶性肿瘤、心脏病和呼吸系统疾病为前三位死因。 绘制圆图时留意以下几点:1扇形内要注明简要文字和百分

18、比。2两种或多种类似的构成比资料相互比较时,可在同一程度线或同一竖线上作直径相等的圆图,并留意各构成部分陈列次序要一致。 图9 某地不同时期居民死因的百分比构成图图3 某地1950-1966年伤寒与结核病死亡率1/10万 变化情况 适用于延续性变量的资料。用线段的升降来表示统计目的的变化趋势,如某事物在时间上的开展变化,或某景象随另一景象变化的情况。 4、 普通线图 line chart绘制线图时应留意以下几点: 1横轴代表分组标志,纵轴代表统计目的。横轴和纵轴都是算术尺度横轴和纵轴的刻度都可以不从“0开场。 2相邻两点用直线衔接,也就是说线图应按实践数字绘制成折线,而不能恣意修正为光滑曲线。

19、 3同一图内不应绘制太多的曲线,普通不宜超越4-5条。假设有几根线,运用不同颜色或不同图线表示,并附图例阐明。 4在绘图时,一定要留意纵横轴比例,由于比例不同,给人的印象也不同。 表4-10 某地居民1950-1966年伤寒与结核病死亡率1/10万年份伤寒死亡率结核病死亡率年份伤寒死亡率结核病死亡率195031.3174.519603.871.3195222.4157.119621.659.2195418.0142.01964.846.019569.2127.219660.337.519585.697.7图3 某地1950-1966年伤寒与结核病死亡率1/10万 变化情况伤寒和结核病的死亡率均

20、逐年下降,伤寒的死亡率低于结核病 5、半对数线图semi-logarithmic line chart) 用来比较两种或多种事物的相对变化速度。在比较几组数据变化速度,特别是两组数据相差悬殊时,宜选用半对数线图。 绘制半对数线图时应留意:横轴用算数尺度表示各分组标志,纵轴用对数尺度表示目的数值的大小。图4 某地1950-1966年伤寒与结核病死亡率1/10万 变化情况图4-7 某地1950-1966年伤寒与结核病死亡率1/10万 变化情况普通线图发现两条折线坡度相差悬殊,结核病死亡率折线下降幅度大。这是对比前后死亡率绝对差值得到的印象半对数线图得到伤寒死亡率下降较快的印象,这是对前后死亡率比值

21、得到的印象算术尺度对数尺度,阐明的是事物开展的速度 图4-8为利用20对父子身高的绘制的散点图,从散点的趋势中可以看出,父亲身高和儿子身高之间有关联。普通来说,父亲个子高,儿子的个子也较高。6、 散点图(scatter diagram) 以点的密集程度和趋势来表示两种景象的相关关系。适用于双变量资料,主要用于相关回归分析。7、直方图 (histogram) 适用于延续变量的频数分布资料。常用横轴表示变量即被察看对象,纵轴表示频数或频率。直方图用矩形面积代表各组频数或频率,各矩形面积总和代表各组频数或频率的总和。绘制直方图应留意以下几点: 1纵轴的刻度必需从“0开场,而横轴的刻度可按实践范围制定

22、。 2作图时,各直条的宽度应等于组距,高度应等于该组的频数或频率。 3.各直条之间不留空隙,可用直线分隔,也可不绘制分隔直线。 8 、统计地图(statistical map) 统计地图主要用于表示某种景象在地域空间上的分布,根据不同地方某种景象的数值大小,采用不同密度的线条或不同颜色绘在地图上,有助于分析该景象的地理分布特征,为进一步研讨提供线索。 图7 2003年广东省某急性传染病发病数的地理分布 9、 箱式图box plot) 适用于描画延续型变量的分布特征,普通选用5个描画统计量最小值、P25、中位数、P75、最大值来绘制 。 由P25和P75构成箱式图的“箱体部分, P25和扣除异常值以外的最小值之间、 P75和扣除异常值以外的最大值之间分别构成“箱子的上下两条“触须。 异常值又称离群值,指大于1.5倍四分位数间距的数值,在图中常用圆圈“表示。大于3倍四分位数间距的数值称为极端值,在图中常用星号“表示。 箱式图分简单图4-11和复式图4-12两种。图4-12 1985年某省乡村120例67岁正常男童胸围cm丈量值中位数四分位间距异常值图4-13 某

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论