统计学课件 ch3 数据整理与显示_第1页
统计学课件 ch3 数据整理与显示_第2页
统计学课件 ch3 数据整理与显示_第3页
统计学课件 ch3 数据整理与显示_第4页
统计学课件 ch3 数据整理与显示_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学

Statistics黄晓莉主讲2023/2/312023/2/32第3章数据的整理与显示数据整理是将收集的各种原始数据条理化、系统化,使之符合统计分析的要求。通过整理可以大大简化数据,更有效地提供统计信息。教学内容3.1数据预处理3.2数据分组3.3频数分布3.4数据的显示学习目标1.理解数据分组的原则、分类2.熟悉并会判断频数分布的类型3.掌握并会编制组距式分布数列4.会绘制统计图表2023/2/35数据整理的程序审核统计资料对资料进行分组汇总积累、保管和公布统计资料编制统计表或绘制统计图2023/2/363.1数据预处理数据预处理是数据整理的先期步骤,它是对数据分组前所做的必要处理,内容包括数据的审核、排序等工作。3.1.1数据审核数据审核是指对原始数据的审查和核对。审核的内容主要包含以下4个方面:(一)准确性审核(二)适用性审核(三)及时性审核(四)一致性审核(一)准确性审核准确性审核主要从数据的真实性与精确性角度检查资料,其审核的重点是检查调查过程中所发生的误差。准确性审查可包括以下几个方面:1.逻辑性审核它是利用逻辑理论检查数据之间有无矛盾。2.比较审查法它是数据之间进行比较方法审查。3.设置疑问框审查一般来说,数据之间存在一定取值范围与比例关系,利用这种范围和比例关系,可以设置疑问框,从而审查数据是否有疑问。(二)适用性审核审查数据的适用性,主要是根据数据的用途,检查数据解释说明问题的程度。具体包括数据与调查主题、与目标总体的界定、与调查项目的解释等是否匹配。(三)及时性审核审查数据的及时性,主要是检查数据是否按规定时间送报,如未按规定时间送报,就需检查未按规定时间送报的原因。(四)一致性审核审查数据的一致性,主要是检查数据在不同地区或根据、在不同时间段是否具有可比性。3.1.2数据排序数据排序是按一定规则,如大小、高低、优劣等次序将数据排列,以便于研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。2023/2/3133.2数据分组(重点)将总体中所有单位按一定的标志分为性质不同但又有联系的若干部分的过程。总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进一步分析研究。(组间差异大、组内差异小)统计分组3.2.1数据分组的意义2023/2/3143.2数据分组

统计分组的原则:穷尽原则、互斥原则例:从业人员按文化程度分组小学毕业中学毕业(含中专)大学毕业文盲或识字不多小学毕业初中毕业高中毕业大专毕业本科毕业研究生及以上(×)(√)2023/2/3153.2数据分组例:某商场把服装分为男装①女装童装②成年装(男、女装)儿童装(男、女装)(√)(×)2023/2/3163.2数据分组在社会经济统计研究中,数据分组的作用在于:划分现象的类型、研究总体的结构和现象之间的依存关系。2023/2/3173.2.2数据分组标志(统计分组的种类)分组的关键问题是选择分组标志和确定各组的界限。选择分组标志——统计分组的关键问题分组标志是将总体区分为不同的组别的标准或依据。选择分组标志的原则是:结合一定的历史条件或经济条件,根据统计研究的目的和任务,选用那些最能反映现象本质特征的标志作为分组标志。2023/2/3183.2.2数据分组标志(统计分组的种类)(一)品质标志分组:按品质特征分组(二)数量标志分组:按数量特征分组3.2.3数据分组体系(一)平行分组,简单分组(二)复合分组,按两个及以上标志分组例为了了解某地区银行存款的构成,可以选用存款性质、期限两个标志分别进行分组:按存款性质分组企业存款储蓄存款财政性存款按存款期限分组活期存款定期存款简单分组复合分组存款同时按其性质及期限分组企业存款活期定期储蓄存款活期定期财政性存款活期定期例

企业职工按工龄分组:

5年以下

5~10年

10~15年

15~20年

20年以上品质标志分组数量标志分组2023/2/3192023/2/3203.3频数分布(重点)在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,称为频数分布,或次数分布。根据分组标志的特征不同,分布数列可分为属性分布数列和变量分布数列两种。

总体按某一标志所分的组两个构成要素(常用x表示)

各组次数(频数)(有两种表现形式:绝对数也称频数,用f表示相对数称为频率,用f/∑f表示)2023/2/3213.3.1属性分布数列属性分布数列是按品质标志分组所形成的分布数列,简称品质数列。(一)定类尺度的频数分布例P35-363.1(二)定序尺度的频数分布例P36-373.22023/2/3223.3.2变量数列变量分布数列是按数量标志分组所形成的分布数列,它包括定距尺度和定比尺度分组所形成的频数分布,即数值型数据频数分布。(一)种类1.单项式:适用于离散型变量且变量变动范围不大的场合。2.组距式:适用于连续型变量或者变动范围较大的离散型变量。单项式分组:一个变量值列为一组。如:对居民家庭按家庭人口数进行分组:

1人2人3人4人5人及以上组距式分组:将全部变量值依次划分为若干个区间,并将每一区间的变量值作为一组。如:工人按工资水平分组(连)

300-400400-500500-600600-700700-800适用于离散型变量,且变量值不多时。适用于连续型变量,或者变动范围较大的离散型变量。2023/2/3232023/2/324(二)组距式数列的编制(难点)1.确定组数:斯特杰斯经验公式n=1+3.3LgN2.确定组距:组距=(最大变量值-最小变量值)/(1+3.3LgN)等距数列与异距数列3.确定组限:上限与下限,组限重叠与否,分为连续组距式分组与不连续组距分组,“上组限不在内”原则4.计算组中值:缺下限开口组的组中值=上限-邻组组距/2缺上限开口组的组中值=下限+邻组组距/2①全距与组距②等距与异距③组限与组中值④开口组与闭口组⑤连续组距分组和不连续组距分组重叠组限

“上限不在内”原则关于组距式分组的几个问题例:学生按成绩分组(分)

(1)50-6060-70

70-8080-9090-100(2)60以下

60-6970-7980-89

90以上组距=80-70=10上限:80下限:70开口组闭口组组中值组中值组中值重叠组限值70归于70—80组不连续组距式分组连续组距式分组2023/2/325注:关于划分分组界限的问题

按品质标志分组,只要根据事物的性质划分界限。目前我国实践中有制定和实施的几种最重要的、基础性国家分类标准。按数量标志分组,要根据事物的数量变动来判断事物性质上的差异。注意客观界限。例:1、人口按年龄分组(岁):

0-6婴幼儿

7-17少年儿童

18-59中青年

60以上老年2023/2/3262、学生按成绩分组(分):

60以下

60-7070-8080-9090以上3、企业按产值计划完成程度分组(%):

100以下

100-110110以上例:55-6060-6565-70……95-10055-6565-7575-8585-9595以上(×)(×)95-105105-115115以上(×)2023/2/3272023/2/3285.频数计量累计频数与累计频率

1.向上累计与向下累计:向上累计频数(频率)分布,首先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向下累计频数(频率)分布,首先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。2023/2/329

2.累计频率与累计频数的特点:1)累计频数的特点第一组的累计频数等于第一组本身的频数。最后一组累计频数等于总体单位数。

2)累计频率的特点第一组的累计频率等于第一组本身的频率。最后一组累计频率等于1。2023/2/3303.4数据的显示3.4.1统计表

将统计数据按一定的顺序排列在表格上,就形成了统计表。从广义讲,统计表包括统计工作各阶段所使用的一切表格,有调查表、汇总表和分析表。本节将侧重就表现统计整理结果所用的统计表进行讨论。2023/2/3313.4数据显示(一)统计表的构成

从统计表的形式上看,可由总标题(表头)、横行标题、纵列标题和指标数值四部分组成。此外,必要时可以在统计表下方加上表外附加。2023/2/3323.4数据显示(一)统计表的构成表头应放在表的上方,它是表的名称,所说明的是表的主要内容;行标题通常安排在表的第一列,它说明数据是谁的或数据的时间,一般由研究问题的名称、分组标志和数据时间等内容构成;列标题通常在表的第一行,所要表达的是什么数据,一般由指标(变量)构成;数据资料则是指标或变量的具体数据。表外附加通常放在统计表的下方,主要包括资料来源、指标解释和必要说明等内容。3.4数据显示(二)统计表的设计:设计统计表总的要求是科学、实用、简练、美观。具体包括以下几点:1.表头应以较少的文字准确地概况出统计表的基本内容,一般应满足3W的要求,即谁的数据(who)、什么时间的数据(when)和什么数据(what)。2.表的格式开口式;上下端线要粗表内一般不打横线,但合计栏要打横线2023/2/3343.4数据显示

(二)统计表的设计:3.计量单位必须标明计量单位,若表中所有数据的计量单位相同,该计量单位标于表头右侧。若表中列标题的计量单位可写在标题旁或下方。4.填表要求表中不应有空格,小数点位数一致……5.表的注释统计表中数据的来源、指标解释等内容一般放在统计表的下方,以表示对他人劳动的尊重,备读着查阅使用。2023/2/3363.4数据显示

图1三次产业构成图3.4.2统计图

统计图是以点、线、面积、体积等图形表现数据的一种形式。对统计资料图形化处理形成统计图;(一)非数值型数据的统计图:条形图,饼图图2互联网和电话用户规模示意图(一)非数值型数据的统计图1.条形图条形图是用宽度相等、相互分离的条状图形的高度(或长度)来表示频数分布的图形。条形图有单式、复式等形式,可以横置或纵置,纵置时又称为柱形图。2.饼图饼图是以整个园的360度代表全部数据的总和,按照各组所占的百分比(频率),把一个“饼”切割为各个扇形。(二)数值型数据的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论