数据整理统计数据的收集与整理_第1页
数据整理统计数据的收集与整理_第2页
数据整理统计数据的收集与整理_第3页
数据整理统计数据的收集与整理_第4页
数据整理统计数据的收集与整理_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第二章 统计数据的收集与整理,第二节 统计数据整理,2,数据整理的含义,数据整理又称统计整理是指根据统计研究的任务与要求,对搜集来的各种原始资料进行科学的分类和汇总,为统计分析提供系统化、条理化的综合资料的工作过程。 统计资料整理在统计工作中处于中间阶段,它是统计调查的继续,是统计分析的前提,起着承前启后的作用。,3,数据整理的程序(课外),(一)对调查资料的审核 审核的内容主要有资料的准确性、及时性、完整性和适用性等几个方面。发现问题,及时纠正。这是统计资料处理工作中一个十分重要的问题,必须认真对待。 逻辑审查 计算审查 人机同审,4,(二)统计分组与汇总(前提和基础) 按照资料整理的要

2、求进行分组汇总,计算各组单位数和总体单位数,计算各组指标和综合指标。 (三)编制统计表或绘制统计图 统计汇总的结果一般通过统计表或统计图的形式表现出来,以简明扼要、生动形象地表达社会经济现象的数量表现和数量关系。,5,一、统计分组的含义,统计分组是根据研究任务的需要和事物内在的特点,将统计总体按照一定的标志划分为若干组成部分的一种统计方法。 总体中的各单位在某一(些)方面是相同的(即同质性),而在其他许多方面则是不同的(即差异性),统计分组的目的是把不同性质的单位分开,把性质相同的单位合在一起。因此,统计分组同时具有两方面的含义:,两层含义,对个体是“合”,对总体是“分”,6,分组标志的选择,

3、统计分组的关键在于正确选择分组标志,这是统计分组的核心问题。 1.完备性各组之和等于总体之和 2.互斥性一个单位只能归到某一个组 3.分组标志的一致性,7,统计分组的种类(课外),(一)品质标志分组和数量标志分组 按照分组标志的性质不同可分为品质标志分组和数量标志分组 1、品质标志分组就是按事物的质量属性分组。 2、数量标志分组就是按照事物的数量特征分组,8,(二)简单分组与复合分组 统计分组按分组标志的多少可以分为简单分组与符合分组 1、简单分组,就是对研究现象按一个标志进行分组。 2、复合分组,就是按两个或两个以上的标志对总体单位进行重叠分组。,9,某校教师按性别、职称复合分组表,10,二

4、、分布数列,在统计分组基础上,将总体中所有单位按组归类整理,形成总体中各个单位数在各组间的分布,叫做次数分布,又称分布数列。 分配数列 将组别与次数按一定的顺序排列所形成的数列。 次数 分布在各组的单位数叫次数,又称频数。 比率 各组次数与总次数之比叫比率,又称频率。,11,某车间工人按日产量分组表,组别 次数(频数) 比率(频率),12,(一)分布数列的种类,品质数列 单项式数列 变量数列 等距数列 组距数列 异距数列,分布数列,一个变量值就代表一组。在变量值不多且变化幅度不大的情况下采用。,两个变量值确定一组。在变量值较多,变动范围较大的情况下采用。,按品质标志分组编制的分布数列,按数量标

5、志分组编制的分布数列,各组组距相等,各组组距不等,13,某班学生按性别分组表,14,某车间工人按日产量分组表,组别 次数(频数) 比率(频率),15,某班40名学生英语测验成绩分组表,16,(二)分布数列的编制,组数 即分得的组的数目,K。 组限 确定每组距离的数值,分下限和上限。 下限 毎组起点数值。 上限 毎组终点数值 。 组距 即毎组的距离,i,等于上限与下限之差。 组中值 即各组中点的数值 。 开口组 上、下限只有一个的组。 闭口组 上限和下限都齐全的组。,17,组中值的计算,闭口组组中值=(上限+下限)/2 上限-邻组组距/2(只有上限) 开口组组中值= 下限+邻组组距/2(只有下限

6、) 组距=上限-下限 全距=最大值-最小值,18,变量数列的编制例题,课本64页 6.某班45名学生“统计学”考试成绩从低分到高分排列,19,1.将原始资料按其数值大小重新排列,找出最小值最大值计算全距 全距 R=99-50=49,20,2.确定变量数列的形式,1.编制单项式数列还是组距数列,取决于所研究变量的类型和变量变动的幅度; 2.编制等距数列还是异距数列,主要取决于现象的特点和研究目的。 3.案例中的数据特点:1)波动范围大,数据多 组距数列; 2)变动均匀 等距数列,21,3.确定组距和组数,对组距和组数,不能机械地规定先确定什么。从原则上讲,都应力求符合实际,能够反映总体分布的特点

7、。 斯透奇斯规则”(Sturges rule): K= 1 + 3.322 lgn=1+3.322*lg45=6.49 组数与组距(i)的关系是: i=R/K=49/6.497.557或8 两者成反比变化 本例中采用组距为10,组数为5,22,4.确定组限,1.组限最好用整数表示; 2.应使第一组下限不大于资料中的最小变量值,最末组上限不小于资料中的最大变量值; 3.对于连续变量,应采用重叠组限,并且习惯上按照“上限不在本组内”原则处理;而离散变量变量两种方法都可以。 本例中的组限分别为:60以下,6070,7080,8090,90以上.,23,某班45名学生统计测验成绩分组表,5.计算各组单位数,编制变量数列,24,例题,50株树苗的高度的测量结果(单位:厘米) 154 133 116 128 85 100 105 146 118 97 110 131 119 103 93 108 100 111 130 104 135 113 122 115 103 90 108 114 127 87 127 108 112 100 117 121 105 136 123 108 89 94 139 82 113 110 109 118 115 126,25,用Excel演示频数(Fr

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论