统计学原理课件-统计数据的整理和显示_第1页
统计学原理课件-统计数据的整理和显示_第2页
统计学原理课件-统计数据的整理和显示_第3页
统计学原理课件-统计数据的整理和显示_第4页
统计学原理课件-统计数据的整理和显示_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计数据的整理和显示教学目的要求本章重点本章难点教学方法教学时数第一节 统计数据整理概述本节重点:数据整理的概念数据预处理的方法本节难点:数据的预处理一、统计整理及其类型统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。对已整理过的资料(包括历史资料)进行再加工也属于统计整理。统计整理的意义:1、统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用。统计整理是统计调查的继续,又是统计分析的基础。2、统计整理还是积累历史资料的必要手段。统计整理的类型:定期统计报表数据的整理专题性统计数据的整理历史统计数据的整理二、统计整理的原则和内容数据整理的原则:目的性原则联系性原则简明性原则数据整理的内容审核分组汇总编制统计图表数据整理的具体步骤对搜集到的资料进行全面审核,以确保统计资料符合统计研究目的的要求,资料准确无误。根据研究目和统计分析的需要,选择整理的标志,并进行划类分组。在分组的基础上,将各项资料进行汇总,得出反映各组和总体数量特征的各种指标。统计资料的显示。即通过编制统计表和绘制统计图,将整理出的资料简捷明了、系统有序地显示出来。(5)对统计数据分门别类地系统积累。三、数据的预处理(一)数据的审核1.审核资料的完整性和及时性审核资料的完整性,就是看调查单位或填报单位是否齐全;规定的项目是否都有答案,应报资料的份数是否符合规定。审核资料的及时性,是看填报单位是否按时报送了有关资料。对不报、漏报或迟报的现象都要及时查清。2.审核资料的正确性:审核资料的正确性,是检查所填报的资料是否准确可靠。常用的审核方法有两种:(1)逻辑检查首先,从理论上或常识上检查资料是否有悖常理、有无不切实际或不符合逻辑的地方。其次,是检查各项目之间有无相互矛盾的地方。(2)计算检查即检查各项指标的计算口径、计量单位是否符合规定,并通过各种计算方法来检查各指标间的数字是否相互衔接。3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方

法和分组条件与规定的要求是否一致。一

般可以从调查资料的历史背景、调查者搜

集资料的目的以及资料来源等,来判断资

料的可靠程度,也可以从指标间的相互关

系以及指标的变动趋势来检查它的正确性。(二)资料审核后的订正通过上述审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况作如下处理:对于可以肯定的一般错误,应及时代为更正,并通知原报单位。对于可疑之数或无法代为更正的错误,应要求原单位复查更正。如果所发现的差错在其他单位也可能发生时,应将错误情况通报所有单位,以免发生类似错误。对于严重的错误,应发还重新填报,并查明发生错误的原因,若属于违法行为,则应依法严肃处理。第二节

统计分组本节重点:统计分组的概念、作用和原则统计分组的方法本节难点:统计分组的方法一、统计分组的概念根据社会经济现象的特点和统计研究的目的要求,按照某个重要标志(或几个标志)把总体划分为若干不同性质的组,称为统计分组。二、统计分组的原则穷尽原则和互斥原则。三、统计分组的作用划分社会现象的不同类型揭示社会现象的内部结构分析社会现象之间的依存关系四、分组的类型按分组作用或目的不同类型分组结构分组分析分组四、分组的类型按分组标志的多少简单分组复合分组并列分组四、分组的类型按分组标志性质属性分组变量分组五、分组标志的选择要符合统计研究的目的和要求要选择最能说明事物本质特征的标志要考虑到现象所处的具体历史条件六、统计分组的方法(一)属性分组的方法对事物进行属性分组,其组数的多少首先取决于事物本身的特点。对于有些事物构成比较复杂,组数可多可少的情况,就需要考虑统计研究任务的具体要求(二)变量分组的方法按数量标志分组,应注意如下两个问题:首先,分组时各组数量界限的确定必须能反映事物质的差别。其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。1.单项式分组与组距式分组(1)单项式分组:就是用一个变量值(标志值)作为一组,形成单项式变量数列。单项式分组一般适用于离散型变量且变量变动范围不大的场合。(2)组距式分组:就是将变量依次划分为几段区间,一段区间表现为“从……到……”距离,把一段区间内的所有变量值归为一

组,形成组距式变量数列。区间的距离就

是组距。对于连续型变量或者变动范围较

大的离散型变量,适宜采用组距式分组。2.间断组距式分组和连续组距式分组间断组距式分组:是指组限不相连的分组。连续组距式分组:凡是组限相连(或重叠)的分组,即以同一数值作为相邻两组的共同界限的分组。统计上规定:“上限不在内”3.等距分组与异距分组等距分组:就是标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。凡是在标志值变动比较均匀的情况下,都可采用等距分组。异距分组:各组组距并不完全相等的分组,在下列情况下,就必须考虑采用异距分组:第一,标志值分布很不均匀的场合。第二,标志值相等的量具有不同意义的场合。第三,标志值按一定比例发展变化的场合。变量数列单项数列组距数列等距数列异距数列七、组距、组数与组中值(一)组距组距是各组上下限之间的距离,即各组最大标志值与最小标志值之差。(二)组数全距是总体中最大的标志值与最小的标志值之差。组数的多少直接取决于两个因素,一个是总体的全距,另一个是组距。在等距分组的条件下,组数等于全距除以组距。在组距既定的条件下,全距大则组数多,全距小则组数少;在全距既定的条件下,组距大则组数少,组距小则组数多。(三)组中值组中值:各组中点位置所对应的变量值。其计算公式为:组中值=

(适用所有闭口组)或=(适用上开口组)或=(适用下开口组)第三节频数分布本节重点:频数、频率变量数列本节难点:频数分布的编制一、频数分布及其构成要素(一)频数分布在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数称为频数分布,或次数分布。(二)频数分布的两个要素组别:总体按某标志所分的组频数(次数)和频率:各组的单位数叫频数,各组的单位数与总体单位总数之比叫频率。频率具有如下两个性质:(1)各组频率都是界于0和1之间的一个分数。即:(2)各组频率之和等于1。即(三)频数分布的种类频数分布品质频数分布变量频数分布单项数列组距数列品质频数分布:简称为品质数列,它是经过属性分组后形成的频数分布,其组别表现为一系列的概念或范畴。变量频数分布:简称为变量数列,它是经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。⑴单项数列:是以一个变量值为一组编制的变量频数分布。⑵组距数列:是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布。二、变量数列的编制(见教材60~64页)三、累计频数与累计频率向上累计频数(或频率),即先列出各组的上限,然后由标志值低的组向标志值高的组依次累计频数(或频率)。某组向上累计频数表明该组上限以下的各组单位数之和是多少,某组向上累计频率表明该组上限以下的各组单位数之和占总体单位数的比重。向下累计频数(或频率),即先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数(或频率)。某组向下累计频数表明该组下限以上的各组单位数之和是多少,某组向下累计频率表明该组下限以上的各组单位数之和占总体单位数的比重。四、频数分布的类型(一)钟型分布钟型分布的特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少,其曲线图宛如一口钟,如下图所示。(a)正态分布(b)偏态分布正偏(右偏)负偏(左偏)如图(a)所示,其分布特征是以标志变量中心为对称轴,左右两侧对称,两侧变量值分布的次数随着与中间变量值距离的增大而渐次减少。在统计学中,称这种分布为对称分布。而图(b)为非对称分布,它们各有不同方向的偏态,即左偏态分布和右偏态分布。客观实际中,许多社会现象统计总体的分布都趋于对称分布中的正态分布。正态分布是描述统计中的一种主要分布,它在社会经济统计分析中具有重要的意义。(二)U型分布U型分布的形状与钟型分布相反,靠近中间的变量值分布次数少,靠近两端的变量值

分布次数多,形成“两头大,中间小”的U型分布。如人口死亡率分布,人口总体中,幼儿和老人死亡率高,而中青年死亡率低。如下图(c)。(三)J型分布J型分布有两种类型,一种是次数随着变量的增大而增多,如投资按利润率大小分布。另一种呈反U型分布,即次数随着变量增

大而减少,如随着产品产量的增加,产品

单位成本下降。如下图(d)(c)J形分布正J形反J形(d)U形分布第四节 统计资料的显示本节重点:统计表的结构统计表的编制本节难点:统计表在编制规则一、统计表(一)统计表的定义和结构统计调查所得来的原始资料,经过整理,得到说明社会现象及其发展过程的数据,将这些数据按一定的顺序排列在表格上,就形成了统计表。广义的统计表包括统计工作各个阶段中所用的一切表格。狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表,它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。统计表的结构,可以从表式和内容两个方面来认识。1.从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。总标题是统计表的名称,它扼要地说明表的基本内容,并指明时间和范围。它置于统计表格的正上方。横行标题是横行的名称,一般放在表格的左方;纵栏标题是纵行的名称,一般放在表格的上方。横行标题和纵行标题共同说明填入表格中的统计数字所指的内容。指标数值是列在横行和纵栏的交叉处,即表格中的数字就是指标数值,用来说明总体及其组成部分的数量特征,它是填写在统计表格的核心部分2.从内容上来看,统计表是由主词栏和宾词栏两个部分组成。主词栏是统计表所要说明的总体及其组成部分,一般都列在表的左半部分;宾词栏是统计表用来说明总体数量特征的各个统计指标及其数值,一般都列在统计表的右半部分。此外,统计表还有补充资料、注解、资料来源、填表单位、填表人等附加内容。(二)统计表的分类1.按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。简单表:主词未经任何分组的统计表称为简单表。分组表:主词只按一个标志进行分组形成的统计表,又称为简单分组表。简单分组表应用十分广泛,对比简单表,它有如下作用:区分事物的类型,研究总体结构,分析现象的依存关系。复合表:主词按两个以上标志进行分组的统计表,又称为复合分组表。下表就是复合表,表中国内生产总值分别按产业和国民经济行业这两个标志进行分组。2.统计表按宾词设计不同分为宾词简单排列、分组平行排列和分组层叠排列。宾词简单排列是指宾词不加任何分组、按一定顺序排列在统计表上。宾词分组平行排列是指宾词栏中各分组标志彼此分开,平行排列。宾词分组层叠排列是指统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起,宾词的栏数等于各种分组的组数连乘积。(三)统计表的设计统计表的设计要求是:简练、明确、实用、美观,便于比较。1.统计表表式设计应注意的事项统计表应设计成由纵横交叉线条组成的长方形表格,长与宽之间保持适当的比例;线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制;表格的左右两端一般不划线,采用“开口式”。合计栏的设置。统计表各纵列须合计时,一般应将合计列在最后一行;各横行若须合

计时,可将合计列在最前一栏或最后一栏。栏数的编号。如果栏数较多,应当按顺序编号,习惯上主词栏部分分别编以“甲乙丙丁……”等序号,宾词栏编(1)(2)(3)……序号。2.统计表内容设计应注意的事项标题设计。无论是总标题,还是横栏、纵栏标题都应简明扼要,简练而又准确得表述出统计资料的内容及所属的时间和空间范围。指标数值。表中数字应填写整齐,对准位数。当数字因小而忽略不计时,可填写为

“0”;当缺某项数字资料时,可用符号

“…”表示;不应有数字时用符号“-”表示。如品质标志值的合计项目计量单位。统计表必须注明数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论