统计学数据的收集与管理.ppt_第1页
统计学数据的收集与管理.ppt_第2页
统计学数据的收集与管理.ppt_第3页
统计学数据的收集与管理.ppt_第4页
统计学数据的收集与管理.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京财经大学统计学系,第二章 数据的收集与整理,数据的收集和整理是依据统计分析的目的和要求,有组织有计划地搜集数据资料并对其进行去伪存真、去粗取精的分类整理、浓缩简化的工作过程。它是进行统计分析的必要前提,是保证统计数据客观、真实、准确、可靠的关键。,本章内容,一、 数据的收集 二、 数据的整理 三、 次数分布,数据的收集,统计资料收集是根据统计研究的目的要求,采用一定组织形式与科学方法,进行采集与研究问题有关的各类信息资料的工作过程。 1、数据的来源 (1)原始数据 (2)次级数据 统计调查 查阅文献、年鉴和数据库 2、统计调查获取原始数据的主要形式 (1)统计调查方案设计 (2)统计调查方法 (3)统计调查的组织方式,链接,统计资料的整理,统计资料的整理,是根据统计研究的目的,对所收集到的大量、分散的原始资料进行科学加工与综合,使之系统化、条理化、科学化,为统计分析提供反映事物总体综合特征资料的工作过程。 一般程序:,统计资料的审定 统计资料的分组 统计资料的汇总 编制统计表 绘制统计图,原始数据,原始数据也称为第一手资料,是反映被调查对象原始状况的资料。如原始记录、统计台帐、调查问卷答案、实验结果等。 举例:数据集03、数据集04,次级数据,次级数据也称为第二手资料,是已经存在的经他人整理分析过的资料。如期刊、报纸、广播、电视以及因特网上的资料,各级政府机构公布的资料,企业内部记录和报告等。 举例:数据集01、数据集02,链接,世界银行的数据库 /data-query/,数据中华情报分析 /DataCenter/GeneralData.asp,世界银行1,数据中华,明确调查目的 (为什么要调查) 确定调查对象和调查单位 (调查谁) 确定调查项目 (调查什么) 调查表与问卷的设计 确定调查时间和调查期限 制定调查的组织实施计划,具体关系可以作如下表示,报告单位,一览表、单一表,如何设计调查方案?,统计调查方案,统计调查方法,现场观察法 报告法 问卷法 访谈法 实验采集法,常用统计调查方法,统计调查组织方式,统计报表 普查 抽样调查 重点调查 典型调查,全面调查,非全面调查,统计调查的组织形式,统计报表,统计报表(Statistical Report Forms)是指依照国家统计局或国家各行政管理部门的规定,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间与报送程序,自下而上地逐级定期提供基本统计资料的一种调查方式。,普查,普查(Census)是对调查对象的全部个体逐一进行的调查。其特点:一次性调查,全面调查,周期较长; 普查主要用来调查属于一定时点上的现象总量。 关键词:全面调查、一次性、时点资料,美国普查局 /,美国普查局,抽样调查,抽样调查(Sampling Survey)是一种非全面调查,它是在全部调查单位中抽取一部分单位作为样本进行调查,再根据调查结果推断总体的一种调查方法。广义的抽样调查包括随机抽样与非随机抽样。,(狭义的)抽样调查可以分为,简单随机抽样(simple random sampling) 分层抽样(stratified sampling) 系统抽样(systematic sampling) 整群抽样(cluster sampling),最简单、等可能;方法,分组、按一定比例从组中抽取,等距、周期抽样;有(无)关标志排队,EXEL,总体分为若干组,然后随机整组整组的抽取,重点调查,重点调查(Key-point Survey)是指在调查对象中,选择一部分重点调查单位收集统计资料的一种非全面调查。 关键词:重点调查单位,是指这些被调查的单位在总体中数目不多,所占比重不大,但其标志值却在总量中占有很大比重,在总体中具有举足轻重的作用。,典型调查,典型调查(Model Survey)是指根据调查目的,在对所研究现象全面分析的基础上,有意识地选择有代表性的典型单位进行深入细致地调查,以便认识事物的本质与发展变化规律的一种非全面调查方法。 关键词:典型单位,是指那些能充分、集中地体现调查对象总体某些方面共性特征的最有代表性的单位。,解剖麻雀式,划类选典,数据的审定,调查资料审定的目的,就是要保证资料的准确性,尽可能地缩小调查误差。即对调查资料的准确性、完整性和及时性进行检查 。,调查必然产生误差,统计误差,登记误差是由于调查过程中各有关环节工作的失误而造成的。 代表性误差是由于非全面调查只观察总体一部分单位,这部分单位不能完全反映总体的性质而产生的误差。,数据的分组,数据分组是根据总体的内在特征和统计研究的任务需要,把总体或样本按照某一标志分成若干个不同的部分。 对总体而言是“分”,即将总体分为性质(分组标志)相异的若干组成部分;对个体而言是“合”,即将分组标志相同的个体组合起来。,注意:正确选择分组标志,数据分组的作用 反映总体内部结构 分析总体数量现象间的依存关系 数据分组的原则 穷尽原则 互斥原则 数据分组的种类 简单分组表 复合分组表 品质分组 数量分组,次数分布数列,次数分布(数列) 是统计分组的重要形式,在统计分组的基础上,把总体或样本的全部个体按组归类整理,并按一定顺序排列,形成总体或样本的每一个个体在各组间的分布。 概念:次数(频数),比率(频率) 分类: 品质数列 变量数列,单项数列组距数列,等距 异距,1、组数与组距 其确定根据经验 组限(上、下),全距R,组距 开口数列,闭口数列,开口组、闭口组 2、组中值,闭口组的组中值计算公式: 组中值=(上限下限)/2 缺下限开口组(首组)组中值 首组上限邻组组距/2 缺上限开口组(末组)组中值 末组下限邻组组距/2,组限的注意事项,首组(最小组)的下限不能大于最小变量值 最末一组(最大组)的上限不得小于最大变量值 组限应是引起事物质变的数量界限,并有利于表现总体分布的规律性。 分组变量可分为离散变量与连续变量,它们的组限表示方法也是不同的。离散变量的组限,相邻组的组限可以间断,连续变量的组限时,相邻组的组限必须重叠,并在统计次数时,一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论