第3章 数据怎么整理_第1页
第3章 数据怎么整理_第2页
第3章 数据怎么整理_第3页
第3章 数据怎么整理_第4页
第3章 数据怎么整理_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章数据怎么整理统计整理单位标志表现文件统计整理总体统计指标统计整理的含义

根据统计研究任务的需要,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程统计整理的意义统计整理实现了从个别单位的标志表现向说明总体数量特征的指标值的过渡是人们对社会经济现象从感性认识上升到理性认识的过渡阶段统计整理的步骤审核分组汇总图表基础前提中心结果统计整理的步骤审核分组汇总图表基础前提中心结果一、统计审核准确性一致性完整性适用性时效性统计整理的步骤审核分组汇总图表基础前提中心结果二、统计分组根据统计研究任务的要求和现象总体内在的特点,把统计总体按照一定的标志划分为若干性质不同又有联系的几个部分1、统计分组的特点分组是在总体内部进行的一种定性分析分组把总体划分为一个个性质不同、范围更小的子总体分组一定是按照某一个或几个可变标志进行的总体的变异性是把总体进一步划分为性质不同的几个部分的客观依据统计分组是一切统计研究的基础统计分组对于总体是“分”,对于单位是“合”2、分组的作用——类型分组揭露社会经济现象的类型,反映各类型的特点。分组的作用——结构分组说明社会经济现象的内部结构。分组的作用——分析分组研究经济现象之间的依存关系。3、分组标志的选择选择什么样的分组标志,就会形成什么样的分组结果,因此,分组标志的选择是统计分组的关键。分组标志一旦选定,必然突出了现象总体在此标志下的性质差异,而掩盖了在其他标志下的差异因此,必须根据统计研究的目的,在对现象总体进行分析的基础上,抓住具有本质区别及反映现象内在联系的标志作为分组标志不分组会怎样?选择分组标志的原则根据研究问题的目的来选择要选择最能反映被研究现象本质特征的标志要结合现象所处的具体历史条件或经济条件来选择统计上大中小型企业划分标准4、统计分组的分类统计分组分组标志多少分组标志性质简单分组复合分组品质分组变量分组简单分组和复合分组5、统计分组方法单项式分组以每一个标志表现为一组进行的分组品质标志分组方法一班二班离散变量单项式分组如果离散变量取值不多、每一值所表示的意义不同,可将每一值作为组名进行分组,非常类似品质标志分组一班二班组距式分组组距式分组就是把变量整个变化范围根据研究目的依次划分为几个区间,变量值归并到相应区间,区间内的变量值共同组成一组组距式分组有关概念组距:区间长度;等距分组:各组区间长度均相等不等距分组:区间长度不全相等组限:区间端点a,b下限:区间左端点a上限:区间右端点b组名:区间范围a---b组数:区间间数组中值:区间中点(a+b)/2离散变量组距式分组如果离散变量的取值很多,每一个值作为一组没有什么意义,则此时要进行组距式分组找出最大值和最小值作为区间端点,并将区间分为相等或不相等的几份***********

**************离散变量组距式分组例子组限不重叠上限不在内年龄 每组人数20---2512 25—3023 30—3527 35—4031 40—4530 45—5020 50---5518 合计 161连续变量组距式分组由于连续变量的变量值不能被一一列举,故不能做单项式分组,仅能进行组距式分组也是首先找出最大值和最小值,但一般不直接用来作为区间端点+++++++

x1x2x3x4x5x6x7mM例子一班二班最低:154;最高:180最低:155;最高:187数量标志分组:

统计上大中小型企业划分标准组距式分组的特点按组距式分组会使统计资料的真实性受到损害在同一组中,所有差别全被掩盖,视为一类为突出组间差别,只有忽略组内差别因此,组距式分组所获得的统计分析结果一定是近似的组距和组数的确定组距的大或小、等或不等的确定应该全面分析资料所反映的社会经济内容以及紧扣研究目的和问题性质既不能不适当扩大,也不能不适当缩小当且仅当变量组距式组限重叠等距分组时成立下面关系:组距=全距/组数不等距分组(异距分组)

说明是要根据事物性质变化的数量界限来确定组限。对于儿童年龄的分组,必须注意到儿童不同年龄的生理及心理的变化特点婴幼儿及学龄前儿童年龄段的划分新生儿期从胎儿分娩出结扎脐带时开始,至出生后足28天,称为新生儿期婴儿期或称为乳儿期指出生后至满1周岁的年龄阶段幼儿期出生后的第2和第3年为幼儿期。学龄前期学龄前期指3~6岁或7岁,相当于"幼儿园"的阶段组限的确定连续变量分组由于连续变量的取值范围是一个区间,因此只能用分点来分组。分点既是前一组的上限,又是后一组的下限,相邻两组有公共组限,组限重叠。当变量值刚好等于公共组限时,规定将该值归并到作为下限的那一组离散变量分组可以直接用变量值作为组限,也可用变量值以外的值,组限不重叠。确定组限的方法有两种:按连续变量分组和按离散变量分组。职工人数(人)

99以下

100—199200—299300—399固定资产额(万元)

50—6060—7070—8080—90间断式确定组限适用于离散变量重叠式确定组限适用于连续变量上组限不在内组中值的计算闭口组向上开口组向下开口组组中值举例产值(万元)50以下50—6060—7070以上第一组组中值:50-(10÷2)=45最后一组组中值:70+(10÷2)=75合理确定组中值例如:第一组:50人以下第二组:50—200人按公式应定下限为0组中值的作用

组距式分组把各个单位在组内取值不尽相同的事实完全忽略,组内各个单位的具体取值不见了。但是,为了进行计算分析,必须找出一个代表值X。当然,最好的代表值一定是这些变量值的平均值,可是,组内平均值是得不到的。在这种情况下,

用组中值来代替组平均值这相当于假定变量值在组内是均匀分布的分组总结统计整理的步骤审核分组汇总图表基础前提中心结果三、分配数列在统计分组的基础上,把总体的所有单位按组归并排列,列出相应的次数和比率,形成总体中各个单位在各组间的分布,也叫次数分布分配数列=分组+分布品质分配数列和变量分配数列分配数列的分类品质分配数列变量分配数列单项式分配数列组距分配数列等距数列异距数列分配数列(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征。)1、频数和频率频数:分配数列中的各组单位数,表示变量值在各个组中出现的次数频率:各组次数占总次数的比重频数和频率示例

组别(变量)

次数(频数)频率(比率)频率:各组的频率大于0,各组的频率总和等于1或100%。2、分配数列的编制(1)品质分配数列的编制:

只需将品质标志的表现一一排列出来,然后汇总出每一种标志表现出现的次数即可。如下例:100250

合计4032208100805020

国有企业股份制企业合资企业独资企业

比重(%)

企业数

经济类型(2)变量分配数列的编制第一步:将原始资料按数值大小依次排列。第二步:确定变量的类型和分组方法(单项式分组或组距分组)。第三步:确定组数和组距。第四步:确定组限。第五步:汇总出各组的单位数,计算频率,并编制统计表。举例若将考试成绩仅分为不及格与及格两组,则可编成如下组距数列:

某班学生统计学考试成绩表若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。某班学生统计学考试成绩表(表2-10)3、(累计)频数、(累计)频率某班统计学考试成绩次数分配直方图405060708090100110折线图在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为分配数列曲线图:405060708090100110

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论