第2章-统计数据收集_第1页
第2章-统计数据收集_第2页
第2章-统计数据收集_第3页
第2章-统计数据收集_第4页
第2章-统计数据收集_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学探索客观现象数量规律性的过程反映客观现象的统计数据描述统计学(统计数据的收集、整理、显示和分析)推断统计学(利用样本信息和概率论对总体数量特征进行估计并检验)概率论(分布理论、大数定律、中心极限定理)总体内在的数量规律

统计数据(又称统计资料),是进行统计分析的基础和前提,准确、及时和有效地进行统计数据的收集是统计工作的开始,如何科学、规范地收集统计数据,是统计学需要学习和研究的重要内容。《统计学基础》第二章数据收集

《统计学基础》第二章数据收集

2.1统计数据的来源

2.1.1桌面调查

2.1.2原始数据的收集2.2调查设计

2.2.1调查方案设计

2.2.2调查问卷设计

2.2.3敏感问题的随机化处理2.3统计数据质量

2.3.1统计数据的误差种类

2.3.2统计数据的质量标准统计调查(收集统计数据的过程)收集哪些数据数据从哪里来如何获得数据调查内容调查方式调查方法调查设计第2章数据收集

2.1统计数据的来源

2.1统计数据的来源《统计学基础》

第二章数据收集

从观测登记方式看

从使用者的角度看统计数据的来源科学试验、生产实验和交易活动统计调查、试验、实验和交易活动(直接的统计数据,实验式)一手别人查或登记的数据(间接的统计数据,非实验式)二手专门组织的统计调查练习:设计一次试验以获取必要的数据。在检验洗衣机洗净程度的研究中,研究人员通过实际洗涤脏衣服,来研究哪种牌子的洗衣机效果最佳。练习:举一个从观察研究中获取数据的例子。观察路口的交通流量、观察顾客在商场的购买行为和观察流水线上的产品质量(表面质量,是否残缺等)等。2.1统计数据的来源《统计学基础》

第二章数据收集2.1.1桌面调查收集加工数据的过程叫桌面调查,即二手数据的收集。

特点及加工方法见课本24页

储存管理方式有档案式管理及信息化管理。

“杜威十进位分类法”2.1统计数据的来源《统计学基础》

第二章数据收集

普查全面报表抽样调查重点调查判断调查周期性调查一次性调查普查抽样调查重点调查判断调查全面调查非全面调查连续(经常性)调查不连续调查定期报表专门调查调查范围调查时间组织形式统计调查的形式2.1统计数据的来源《统计学基础》

第二章数据收集

总体单位调查单位1.抽样调查

按随机原则抽取部分单位进行的调查。《统计学基础》

第二章数据收集

2.1统计数据的来源1.抽样调查(SamplingSurvey)/概率抽样现代的抽样调查,又称随机抽样抽样推断,是根据随机原则和具体的抽样技术的要求,从总体中抽取部分个体构成样本,并依据样本信息推断总体数量特征的非全面调查。

特点:1)非全面调查。

2)随机原则(研究随机变量)、最大抽样效果原则

3)误差可以事先估计和控制。

4)以样本指标(统计量)为依据推断总体参数或检验总体的某种假设,[表明其理论基础为概率论和数理统计的有关定理]。

5)准确性高,具有广泛适用性。

适用范围:第一,不可能或不必要进行全面调查的社会现象。第二,对普查资料进行必要的修正。2.1统计数据的来源《统计学基础》

第二章数据收集

抽样调查的作用:可以用于破坏性检验场合的调查和推断。可以用于较大规模总体或无限总体的调查和抽样。可以用于检查和补充全面调查数据。可以用于企业的全面质量控制。

2.1统计数据的来源《统计学基础》

第二章数据收集

抽样基本原则是:样本量越大,抽样误差就越小,而样本量越大,则成本就越高。常用的随机抽样方法主要有纯随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样等。纯(简单)随机抽样就是总体中每个单位在抽选时有相等的被抽中的机会,是最完全的概率抽样。但会遇到“样本可能分布不均匀”以及“没有好的抽样框”等问题。又分为有放回抽取和无放回抽取两种情况,当总体容量很大,样本量很小时,两者无差异。2.1统计数据的来源《统计学基础》

第二章数据收集

系统抽样,又称为机械抽样、或等距抽样,基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。分层抽样也称分类抽样、类型抽样,把总体各单位分成两个或两个以上的相互独立的完全的组(如男性和女性),从两个或两个以上的组中进行简单随机抽样,样本相互独立。整群抽样又称集团抽样

,从总体中成群成组地抽取调查单位

。对所抽中的群中的全部单位进行全面调查。比率抽样(PPS抽样)。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。2.1统计数据的来源《统计学基础》

第二章数据收集

总体单位调查单位2.普查(Census)

对全部单位进行的调查。《统计学基础》

第二章数据收集

2.1统计数据的来源2.1统计数据的来源2.普查(Census)普查是为了特定目的而专门组织的一次性或周期性的全面调查,调查在某一标准时间上的社会经济现象的总量。普查具有以下特点:(1)普查是一种全面调查。(2)普查是一种一次性或周期性的调查。(3)普查是一种调查在某一标准时间上的社会经济现象总量的调查。避免数据重复与遗漏。(4)耗费大量人力物力财力,一般调查基本国情、国力等特定现象。小总体可以采用普查。《统计学基础》

第二章数据收集

普查的目的:(1)在于搜集那些不能够或不适宜用其它统计调查方式搜集的统计数据,以搞清重要的国情、国力。(2)为经常性的抽样调查提供抽样框和其它辅助数据。

抽样框:又称“抽样框架”、“抽样结构”,是进行抽样调查时抽取样本的有序数据库,以确定总体的抽样范围和结构。为降低抽样误差,抽样框数据与总体的客观存在尽量保持一致。抽样框的原始数据只能来自于对总体的全面调查。因此,一般而言,抽样框就是指对所调查的总体的全部构成单位进行编号排列形成的一套清单。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。

2.1统计数据的来源《统计学基础》

第二章数据收集常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册、地图、数据包……。在没有现成的名单的情况下,可由调查人员自己编制。应该注意的是,在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生,以提高样本对总体的代表性。好的抽样框应做到:完整而不重复。例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。

2.1统计数据的来源普查的组织1、组织方式普查的基本组织方式有两种:1)组织专门的普查机构,配备一定数量的普查人员,对调查单位进行直接登记;2)利用调查单位的原始资料和核算资料,分发一定的调查表格,由调查单位进行填报。2、基本原则1)规定统一的调查标准时间2)统一调查项目3)统一调查方法和步骤4)选择调查时间《统计学基础》

第二章数据收集

2.1统计数据的来源

各个国家对普查都给予的充分的重视,甚至把普查看作是仅次于战争的“运动”。西方国家几乎没有统计报表制度,所以全面的资料只能依靠普查获得。美国有专门的普查局负责各类普查,并有专门网页提供相关信息与资料。美国普查局:/

根据国务院的决定,我国于2001年进行了第二次全国基本单位普查。国家统计局普查中心对普查结果进行了系列分析,形成了丰富的信息资源。国家统计局普查中心的分析资料:

/tjfx/ztfx/decjbdwpc/

《统计学基础》

第二章数据收集

2.1统计数据的来源3.统计报表统计报表(StatisticalReportForms)是指按照统一的表式,统一的报送时间和报送程序,自上而下统一布置,自下而上逐级上报,逐级汇总,提供基本统计数据的统计调查方式。统计报表分为国家正式报表和企业内部报表。国家正式报表是指按照国家有关法规规定,由统计主管部门正式核准的,所有单位和公民都必须依法填写和报送的统计报表。企业内部报表是现代企业管理信息采集和经营决策分析的重要工具之一,由企业按照内部核算要求和填报国家正式报表需要,自行制定,自我管理。现行的统计报表制度的内容主要包括报表目录、表式、填报说明三部分。《统计学基础》

第二章数据收集

特点:(1)逐级上报和汇总,格式相对统一。(2)经常性/连续性调查,调查项目相对稳定。(3)资料的来源是各个基层单位的原始记录。全面统计报表全面统计报表日报、旬报、季报月报、年报等基层报表综合报表报送范围报送周期报送单位统计报表报表的实施范围国家统计报表部门统计报表地方统计报表

下表是某工业行业的产品产销存月报的表式,该统计报表是根据产销存的平衡关系设计的。表2-1某工业行业产品产销存月报2.1统计数据的来源《统计学基础》

第二章数据收集

总体单位调查单位4.偶遇抽样

对一定时间、一定环境里遇到的货接触到的选入样本《统计学基础》

第二章数据收集

2.1统计数据的来源偶遇抽样又称方便抽样,是一种非随机抽样,具有很大的偶然性,代表性差。但是方便省事,常用于正式调查开始前的探索性研究,或对总体情况不甚了解时采用,比如:“街头拦截式访问”。总体单位调查单位5.重点调查

对重点单位(个数不多,但其标志量占标志总量比重较大的单位)进行的调查。《统计学基础》

第二章数据收集

2.1统计数据的来源

2.1统计数据的来源5.重点调查重点调查是在调查对象中选择一部分重点单位所进行的一种非全面调查。这些单位的标志值之和却占总体标志总量的绝大比重。通过对这些重点单位的调查,就可以了解总体的基本情况。重点调查的应用条件是在总体中必须客观存在这样的重点单位,从而可以通过对总体内少量重点单位的调查,来实现对总体基本情况的了解,达到进行统计调查的目的。重点调查的意义就在于当总体内客观存在重点单位时,我们能够利用较少的费用和较短的时间,通过对少量重点单位的统计调查,来获得能够反映总体全貌的数量特征的基本资料。《统计学基础》

第二章数据收集

2.1统计数据的来源5.重点调查举例:为了解我国工业企业发展的基本情况,我们对一些国有特大型企业进行调查,如鞍钢、首钢、上海宝钢、大庆油田、胜利油田等,它们的数量不多,但在国民经济的发展中,无论是资产总量,还是利税,都占全国所有工业企业相关指标的60﹪以上。对这些为数不多的重点单位所进行的调查,属于重点调查。判断:重点调查是抽样调查的一种形式。

重点调查不能推断总体。《统计学基础》

第二章数据收集

错,有悖随机原则正确,非随机抽取总体单位调查单位6.判断抽样

有意识地选择部分典型单位进行的调查。《统计学基础》

第二章数据收集

2.1统计数据的来源

2.1统计数据的来源5.判断抽样

又称为典型调查,是从事有关工作的专家按照一定的标准(依统计研究目的而定)有意识地在总体中选择若干有代表性的单位(即典型单位)组成样本进行调查。典型单位根据调查的目的不同,一般有三种选取办法:

一是近似地估算总体的数值,可采用“划类选典”方法(对总体进行分类的基础上,选择一部分典型单位进行调查)。

二是了解总体的一般数量表现,可采用“择中选典”方法。

三是研究成功的经验或失败的教训,可采用“优劣选典”方法(又称“解剖麻雀”式)。在一定条件下可用“划类选典”和“择中选典”的典型调查的资料补充全面调查的不足。典型调查为非概率抽样,不能计算抽样误差,即调查资料不能推断总体。《统计学基础》

第二章数据收集

典型调查的特点第一,典型调查的实质是深入细致的调查,可用来研究某些比较复杂的专门问题。第二,典型调查的单位少,因而指标可以多一些,也可节省人力、物力和财力。第三,典型调查是一种比较灵活的调查方式,典型单位的选择和确定,是根据研究任务,在对调查对象进行初步分析的基础上,有意识的加以选择的。典型调查的方法有:开调查会、个别访问法、现场观察、查阅资料等,其中开调查会是最常见的方法。2.1统计数据的来源《统计学基础》

第二章数据收集

2.1统计数据的来源2.1.2数据的搜集方法数据的搜集方法一般可以归纳如下两大类:1.询问调查:调查者与被调查者通过某种方式和某种工具进行信息交流,以采集和登记调查数据。可分为以下几类。(1)面谈访问(分为结构式和非结构式)。(2)座谈会调查。(3)电话调查。(4)邮寄调查。(5)计算机辅助调查(网络调查)。2.观察和实验(1)观察法。(2)实验法。《统计学基础》

第二章数据收集

2.1统计数据的来源《统计学基础》

第二章数据收集

观察法观察者身份标准化程度观察方式非参与观察结构式观察直接观察非结构式观察间接观察参与观察第二章数据收集

2.2统计调查设计《统计学基础》第二章数据收集

2.2统计调查设计

2.2.1统计调查方案设计

2.2.2问卷设计

2.2.1统计调查方案设计统计调查是一项复杂细致的系统工程,为了统一认识、统一内容、统一方法、统一步调,必须事先编制一个科学的统计调查方案。统计调查方案一般包括以下几方面内容:2.2统计调查设计《统计学基础》

第二章数据收集

1.调查任务和目的

2.调查对象、调查单位和填报单位3.调查项目和调查指标4.调查时间5.调查方法6.调查误差的控制方法7.调查数据的汇总处理方法8.调查表和调查问卷设计9.制定调查工作的组织实施计划1.调查任务和目的

调查任务和目的是统计调查的依据。调查目的决定着调查的对象、内容和方法。以〈第五次全国人口普查办法〉为例第一条为了科学地制定国民经济和社会发展战略与规划,制定人口政策,统筹安排人民的物质和文化生活,实现人口与资源、环境的协调发展,国务院决定于2000年进行第五次全国人口普查。根据《中华人民共和国统计法》,制定本办法。2.2统计调查设计《统计学基础》

第二章数据收集

第六次全国人口普查的目的是查清2000年以来我国人口数量、结构、分布和居住环境等方面的变化情况,为科学制定国民经济和社会发展规划,统筹安排人民的物质和文化生活,实现可持续发展战略,构建社会主义和谐社会,提供真实准确、完整及时的人口统计信息支持。

——第六次全国人口普查方案

2.调查对象、调查单位和填报单位调查对象和调查单位的确定取决于调查任务和目的。调查对象与统计总体相联系;调查单位与总体单位相联系。填报单位(又称报告单位)是负责向上级报告调查内容、提交统计资料的单位。第六条人口普查的对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人(全体为调查对象,每一公民为调查单位)。第八条人口普查以户为单位进行登记。户分为家庭户和集体户。(填报单位)2.2统计调查设计《统计学基础》

第二章数据收集

确定调查对象和调查单位时要注意:(1)严格规定调查对象的含义,比如学生(2)调查单位的确定取决于调查目的和调查对象,调查目的和对象变化了,调查单位也随之改变。(3)不同的调查方式产生不同的调查单位。

3.调查指标和调查项目调查项目就是调查中所要登记的调查单位的标志及其它有关情况。确定调查项目的依据是事先设计好的统计指标。确定调查项目时应注意的主要问题还有以下几点。

(1)资料搜集的可行性。(2)项目和指标解释的一致性。(3)保证项目和指标之间的衔接性。(4)保证项目和指标动态可比性。第六次人口普查登记的主要内容包括:姓名、性别、年龄、民族、国籍、受教育程度、行业、职业、迁移流动、社会保障、婚姻、生育、死亡、住房情况等。

2.2统计调查设计《统计学基础》

第二章数据收集

4.调查时间一是调查资料所属的时间。如果所要调查的是时期现象,就要明确规定搜集从什么时间开始到什么时间结束的资料;如果所要调查的是时点现象,就要明确规定统一的标准时点。二是调查工作的期限。指的是调查工作开始和结束的具体时间要求。第三条2000年11月1日零时,为第五次全国人口普查登记的标准时间。第十九条人口普查的现场登记工作,从2000年11月1日开始到11月10日以前结束。2.2统计调查设计《统计学基础》

第二章数据收集

5.确定样本容量、调查方式、调查方法

如果采用随机抽样调查,根据调查的置信度要求和允许误差要求计算出样本容量,并结合调查目的和调查成本以及调查对象的特点,制定出具体的抽样方案;

非随机抽样,根据研究者的经验判断和主观能力,结合调查对象的特点和调查方法,设计出详细的调查方式来。

2.2统计调查设计《统计学基础》

第二章数据收集

6.调查误差的控制方法根据所采用的不同统计调查方法,对于调查中可能出现的误差,相应地采取不同的调查误差控制方法,以提高统计调查资料的质量和可比性。例如:承诺保密、不泄漏;数据专用;审核、复查;事后质量抽查(检查和补充普查数据)第二十三条普查登记的个人资料不得作为行政管理和表彰、处罚的依据。第二十四条人口普查机构和各级普查工作人员,对各户申报的情况,必须保守秘密,不得向人口普查机构以外的任何单位和个人提供或者泄露。严禁公开个人和家庭的登记资料。2.2统计调查设计《统计学基础》

第二章数据收集

7.调查数据的汇总处理方法首先是制定调查数据的汇总方法。大多采用分级汇总与超级汇总相结合的方式。其次是制定调查数据的处理方法。大型的统计调查可以通过编制专用的调查资料汇总和数据处理软件来保证这一工作的质量和效率。第三十三条人口普查机构对普查的几项主要数字,先进行快速汇总。省、自治区、直辖市人民政府人口普查领导小组办公室将汇总结果于2000年12月31日以前报送国务院人口普查办公室。国家统计局和国务院人口普查办公室于2001年1月31日以前发布公报。2.2统计调查设计《统计学基础》

第二章数据收集

8.调查表和调查问卷设计把确定的调查项目按照一定顺序排列在表格上,就形成了调查表。第九条人口普查表分为普查表短表和普查表长表两种形式,普查表由国务院第五次全国人口普查领导小组办公室(以下简称国务院人口普查办公室)设计。普查表长表根据国家规定的办法,抽出百分之十的户填报;普查表短表由其余的户填报。调查问卷设计主要研究问卷设计,调查资料的数量化处理、调查数据的标准化处理,以及敏感问题的随机化处理等方面的问题。2.2统计调查设计《统计学基础》

第二章数据收集

2.2统计调查设计《统计学基础》

第二章数据收集

9.制定调查工作的组织实施计划在统计调查实施计划中,除了以上介绍的方面外,还包括调查工作的组织领导机构的设置和职能,调查人员的培训和组织、统计调查的宣传教育、文件印刷、调查经费的管理等内容。

第十五条各级宣传部门和新闻媒体,在人口普查登记前后,应当积极做好人口普查的宣传工作,动员群众参与人口普查。第二十八条人口普查的登记工作,由普查员承担,普查指导员负有对普查员的工作进行指导、检查的责任。基层干部和群众积极分子应当积极协助普查员作好登记工作。第二十九条普查员和普查指导员应当由具有初中以上文化水平、热心社会公益事业、身体健康、责任心强、能够胜任人口普查工作的人员担任。2.2统计调查设计《统计学基础》

第二章数据收集

《统计学基础》第二章数据收集

2.2统计调查设计

2.2.1统计调查方案设计

2.2.2问卷设计

《统计学基础》第二章数据收集

一些调查网站问道:/众意网:

问卷星:/

数据100:/

事事得:/

第一调查网:/Surveycool:http:///

知己知彼:/

专业调查-中国调查网:/

2.2.2问卷设计

问卷又称调查表,它是一种以书面形式了解被调查对象的反应和看法,并以此获得资料和信息的载体。问卷设计是依据调研与预测的目的,开列所需了解的项目,并以一定的格式,将其有序地排列,组合成调查表的活动过程。

问卷设计的程序:探索性工作-提出问题(课题,科学问题)-研究假设-概念界定-变项设计(调查项目)-指标设计-具体问题

2.2统计调查设计《统计学基础》

第二章数据收集

设计问卷时必须要明确:目的(问题)是什么?验证什么假设?用什么理论框架建构假设?如何对研究的概念下操作性定义?如何对它进行测量?设置多少个维度及亚维度以及所包含的题项,用多少个题项去测量?如何建立起各题项之间的顺序性及其他技巧,建立起整个问卷的框架。特别要注意关于被试的基本事实资料问题。决定主要和次要的收集资料的方法。如何沟通与被调查者的关系,阐述问卷资料的保密度,不署名等2.2统计调查设计《统计学基础》

第二章数据收集

2.2.2问卷设计

1.问卷设计的目标根本目标:设计出符合调研与预测需要及获取足够、适用和准确的信息资料的调查问卷。具体目标:1)便于为管理者提供必要的决策信息。任何不能提供管理或决策重要信息的问卷都应放弃或加以修改。

2)便于应答者回答。避免使用专业术语,避免尴尬,控制问卷长度(20分钟左右

,30分钟之内答完)

3)便于编辑和数据处理。编辑是指检查问卷以确保按跳问形式进行;如有可能,开放式问题应预先编码。2.2统计调查设计《统计学基础》

第二章数据收集

2.2.2问卷设计2.调查问卷的功能

●把研究目标转化为特定问题;●使问题和回答标准化;●通过措辞、问题流程与卷面设计来促进合作;●记载记录原始数据;●加快数据分析过程;●进行有效性测试。2.2统计调查设计《统计学基础》

第二章数据收集

2.2.2问卷设计

3.问卷设计的六个原则

●合理性:问卷必须紧密与调查主题相关。在问卷设计之初要找出与“调查主题相关的要素”。去除无关不仅要问题;被调查者了解所问。●一般性:即问题的设置是否具有普遍意义。这是问卷设计的一个基本要求,同时也是经常犯的常识性错误。●逻辑性:问卷的设计要有整体感,问题之间要具有逻辑性,使问卷成为一个相对完善的小系统。

●明确性:问题设置的规范性。命题准确?提问清晰明确,不拐弯抹角,便于回答;被访问者能够对问题作出明确的回答,等等。●非诱导性:问题要设置在中性位置、不参与提示或主观臆断,完全将被访问者的独立性与客观性摆在问卷操作的限制条件的位置上。●便于整理、分析

2.2统计调查设计《统计学基础》

第二章数据收集

2.2.2问卷设计

5.问卷设计的程序●(1)明确调研目的。与决策者沟通;访问行业专家;收集并分析二手资料;定性调研。●(2)确定数据收集方法,如:小组讨论法、电话访问法、邮寄访问法等。●(3)确定问题的回答方式:开放式问题、封闭式问题、量表应答式●(4)决定问题的措辞:用词必须清楚;选择词语以避免引起应答者误差;不应该诱导受访者回答特定答案;考虑到应答者回答问题的能力;考虑到应答者回答问题的意愿。2.2统计调查设计《统计学基础》

第二章数据收集

根据认识和经验(观察和陈述)获得对研究对象的一个初步的了解,或用来定义问题或寻找处理问题的途径。2.2.2问卷设计

5.问卷设计的程序●(5)确定问卷流程和编排问卷流程的基本准则如下:a.运用过滤性问题识别合格应答者;只有合格应答者参加访谈,才能得到每类合格应答者的最小数量(配额)。b.以一个令人感兴趣的问题开始访谈(用一个年龄或收入问题作为初始问题是一大错误。)。c.先问一般性问题。使人们先开始考虑有关概念、公司或产品类型,然后再问具体的问题。2.2统计调查设计《统计学基础》

第二章数据收集

2.2统计调查设计

问题的排序:典型排序:过滤性问题——热身性问题——过渡性问题——主题性问题——较复杂或难以回答的问题(1)问题的排列应具有层次性和逻辑性,符合人们思维习惯。前后相继的问题具有内在联系,反映事物的因果关系,和递进的思维层次。(2)“过滤”性问卷设计要求问题排列构成逻辑的树状结构。(3)问题的排列应先易后难。将简单、容易、直观的问题放在问卷的前面,提高被调查者的兴趣,使被调查者比较容易地进入答题角色,顺利完成问卷中所有问题的回答。(4)开放性问题的排列要从属于封闭性问题,有关全局性的开放性问题放在整个问卷主体部分的末尾;相对某类具体封闭性问题的开放性问题,放在这类封闭性问题的末尾。《统计学基础》

第二章数据收集

安排问题的次序由客观到主观由熟悉到陌生相对容易的问题放在最后内容相关的问题要排得相近开始有介绍性的语言第一个问题就切中主题2.2统计调查设计《统计学基础》

第二章数据收集

2.2.2问卷设计

5.问卷设计的程序●(6)评估问卷,获得各方的认可:专家评价、上级评价、被调查者评价、自我评价。●(7)预先测试和修订:先组织问卷的测试,如发现问题,要及时修改。●(8)准备最终的问卷文本,制表、打印和印刷问卷

在问卷评估过程中,下面一些原则应当考虑:

•问题是否必要。

•问卷是否太长。

•问句是否回答了调研目标所需的信息。

•邮寄及自填式问卷的外观设计。

•开放式总是否用了明显字体等。2.2统计调查设计《统计学基础》

第二章数据收集

2.2.2问卷设计

6.问卷结构2.2统计调查设计《统计学基础》

第二章数据收集

问卷的三部分每部分的内容一、开头问卷标题与编号、问候语、调查者身份、被调查者的基本信息,目的介绍,填写说明二、正文1、一般问题(易答)2、主要问题(实质的、细节的问题)3、敏感的、复杂的问题4、被访问者基本情况三、结尾1、开放式问题(可以缺省)2、被调查者的背景数据3、感谢语7.封闭性问题及备选答案问卷的主体由若干问题组成,其中主要形式为封闭性问题。封闭性问题及备选答案的设计是问卷设计的核心内容。(1)封闭性问题的表达要准确,内容要完整。一般可以按照6W原则检查。即按照Who(谁),Where(何处),When(何时),Why(为什么),What(是什么),How(如何)六个方面来判断。(2)封闭性问题备择答案要不重不漏。即保证封闭性问题备择答案的完备性和周延性。例如:对某一事件的态度,备则答案不能仅仅为“赞成”、“反对”,还应该根据具体的问题设置第三项,诸如“其他”、“说不定”、“弃权等”,供被调查者选择。2.2统计调查设计《统计学基础》

第二章数据收集

7.封闭性问题及备选答案

(3)封闭性问题必须使用中性语言和陈述句式。要力求杜绝任何可能干扰被调查者的价值判断和真实状态的表述,不应包含任何的情绪和倾向,不能使用任何具有感情色彩和价值判断的表述,也不能使用否定句,反问句,感叹句等可能引发某种暗示和诱导效应的封闭性问题构造方式。例如:

“您准备何时出国留学?”(A、三年级B、四年级C、大学毕业后)――这是个典型的诱导性询问,它只能让被访者在何时出国上选择,而事实上并非所有大学生都想出国。2.2统计调查设计《统计学基础》

第二章数据收集

7.封闭性问题及备选答案(4)封闭性问题的表述要简洁、通俗。为了提高问卷的回答率和数据的准确性,封闭性问题表述要简洁,真正做到一目了然。同时,封闭性问题表述应通俗易懂,尽量避免专业词汇,提高问卷的适用性。(5)封闭性问题的敏感性问题的处理。在一般问卷调查中必须避免任何的敏感性问题,以免造成被调查者顾虑或反感,影响到整个问卷调查的质量。敏感性问题的调查必须通过专门的调查技术,对敏感问题进行随机化处理之后,专项组织进行,方可以取得可信的调查数据。(问题少,还可以采取人称代换的方式提问)2.2统计调查设计《统计学基础》

第二章数据收集

2.2统计调查设计《统计学基础》

第二章数据收集

问卷设计再一次强调:明确调查目的;开头语:真实、恳切、保密语言规范/通俗,避免专业术语、缩写;问题明确简洁,避免歧义,避免问题合并;问题中立,避免诱导、暗示和倾向性;陈述句式,避免反问、感叹、疑问等句式避免敏感、尴尬、情绪性问题,智力性问题(敌意);问题之间相互关联,逻辑性强问题排列由简单到复杂,由表面直觉到深层思考问题选项完备(全集)、互斥问卷题量适中,15~20分钟能答完,不超过30分钟;回收率达到70%-75%方可认为调查问卷有效问卷名称:大学生课程满意度调查大学生课程满意度及影响因素调查导语问卷主体部分(具体的问题),例如:1.在已学习过的课程中,你印象非常深刻的课程有几门?

A没有B1—3门C4-6门D更多2.你对课时安排是否满意?

A非常满意B比较满意C一般D不太满意E非常不满意

……8.你在上课时一般都做哪些事情?

A发呆,开小差B娱乐(听音乐、打游戏、看小说)

C听课,记笔记D睡觉E其他感谢语问卷调查作业选题范围:大学生职业能力状况(职业取向、能力意愿、现有水平、获取途径……);对本校食堂满意度调查;对本班学生现状生活满意度调查;对本专业课程安排满意度调查对本校大学生消费情况的调查《统计学基础》第二章数据收集

2.2统计调查设计

2.2.1统计调查方案设计

2.2.2问卷设计

2.2.3敏感问题的随机化处理

2.2统计调查设计2.2.3敏感问题的随机化处理所谓敏感问题即涉及个人隐私、违规违约、违反社会道德规范以及影响个人利益和人际关系的一些问题。敏感问题的随机化处理是使这类调查中的回答在随机状态下进行,即采用随机化回答技术。例如,在调查某地区吸毒状况时(在这里,吸毒就是一种敏感性特征),设计外形完全相同的卡片张,其中m1张卡片上写有“你在本月内有吸毒行为”,另外m-m1张卡片上写有另一问题(在沃纳模型中,另一问题将是该问题的对立问题,即“你在本月中无吸毒行为”;在西蒙斯模型中,另一问题将是与该问题无关的其他问题,如“你是属马的”等。)。然后,让被调查者随机从中选一个卡片回答,调查者无权过问被调查者究竟回答的是哪一个问题,从而起到了为被调查者保密的效果。《统计学基础》

第二章数据收集

2.2统计调查设计2.2.3敏感问题的随机化处理随机化回答技术使调查者无法识别具体被调查者的个体信息,不能得到被调查者的倾向和回答,被调查者在其个人真实状况得到完全屏蔽,打消了其顾虑,能够真实地回答问卷中的敏感问题,从而调查者可获得敏感问题数据。从中计算出该总体中对于所调查的敏感问题次数分布的估计量。

随机化方法存在的不足之处:一是不能像问卷调查那样,进行大范围、大规模及分散的调查;二是调查费用高,调查者现场调查工作量大;三是要求调查者和被调查者具有较高的素质;四是要对调查者进行大量的培训,使其能熟练掌握模型的操作应用。《统计学基础》

第二章数据收集

2.2统计调查设计沃纳模型

该模型是1965年由Warner提出的,其设计思想是向被调查者显示两个与敏感性问题(具有特征A)有关,但完全对立的问题,让被调查者按预定的概率从中选一个回答,调查者无权过问被调查者究竟回答的是哪一个问题,从而起到了为被调查者保密的效果。其基本做法是设总体可分为两类,具有敏感性特征的一类A与不具有敏感性特征的一类。目的是估计具有敏感性特征的人在总体中所占的比例,其具体算法推倒如下:

《统计学基础》

第二章数据收集

要正确估计在校大学生考试作弊的比例πA

,在外形相同的一定数量的卡片上分别写上以下两个问题:

A:你在考试中作弊了吗?(你考试作弊,是吗?)

B:你在考试中没有作弊吗?(你考试不作弊,是吗?)作弊是一种敏感性特征,总体被分为两类:具有敏感性特征(考试作弊)的学生;不具有敏感性特征(考试不作弊)的学生。每一问题又分别对应着“是”和“不是”两个选项。将所有卡片混合后放在盒子中。随机抽取n个大学生进行调查,要求被调查者从中随机抽取一个卡片回答,若所抽到的问题与自己情况一致则回答“是”,否则,回答“不是”。设写有A问题的卡片的比例为P,统计结果中有n1个人回答“是”,

回答“是”的人的比例为

φ。2.2统计调查设计《统计学基础》

第二章数据收集2.2统计调查设计《统计学基础》

第二章数据收集即敏感特征:作弊即没有作弊2.2统计调查设计《统计学基础》

第二章数据收集随机变量X服从0-1分布(两点分布、贝努里分布)《统计学基础》

第二章数据收集

假设所有被调查者的回答都是真实的。根据全概率公式得到:

P(Xi=1)=i=1,2…n

=n1/n。则的极大似然估计为:

2.2统计调查设计第二章数据收集

2.3统计数据质量《统计学基础》第二章数据收集

2.3统计数据质量

2.3.1统计数据的误差种类

2.3.2统计数据的质量标准真值统计数据《统计学基础》

第二章数据收集

2.3统计数据质量客观数据真值?统计数据误差《统计学基础》

第二章数据收集

2.3统计数据质量客观数据真值?统计数据误差多大?研究误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平。《统计学基础》

第二章数据收集

2.3统计数据质量《统计学基础》

第二章数据收集

2.3统计数据质量2.3.1统计数据的误差种类数据的误差是指统计数据与客观事实之间的差距。可以分为登记性误差和代表性误差两类。1.登记性误差。

登记性误差是指在调查过程中由于调查者和被调查者的人为原因形成的误差。例如,调查者的人为原因主要有总体界定错误、调查单位缺失、计量和测量误差、记录失误、抄录错误、汇总差错;被调查者的人为原因主要有有意识地提供虚假数据、无意识地提供有误数据。从理论上说登记性误差属于可以消除的误差。中国的人口统计数据:公元2年(汉元始二年)59594978人公元754年(唐天宝十三载)52880488人公元1122年(宋宣和四年)46734784人公元1281年(元至元十八年)58830000人公元1578年(明万历六年)60692856人公元1711年(清康熙五十年)24621324人公元1741年(清乾隆六年)143411559人公元1763年(清乾隆二十八年)204209828人公元1790年(清乾隆五十二年)301487115人公元1835年(清道光十五年)401767053人

“圣祖出巡时获悉,有五六丁之户,仅一人缴纳钱粮,或有九丁、十丁,亦仅二三人缴纳钱粮”

康熙五十一年定“滋生人丁永不加赋”30年间增加近5倍!!!登记性误差《统计学基础》

第二章数据收集

2.3统计数据质量

2.3统计数据质量2.代表性误差P22-23

代表性误差是指利用样本数据推断总体参数时产生的误差。分为随机性误差和系统性误差。(1)随机性误差(偶然性误差、抽样误差),是由于随机性原因形成的代表性误差,它是服从于某一概率分布的随机变量。随机性误差是不可以消除的误差,只要利用样本数据推断总体参数,就必然存在着随机性误差。其取值随着样本容量的增大而减小。(2)系统性误差是由于非随机性原因形成的代表性误差。主要原因有抽样框过于陈旧导致的抽样框偏误、非随机样本、无回答问题、辅助数据偏误等。系统性误差也是在利用样本数据推断总体参数时产生的误差,但是系统性误差不会随着样本容量的增大而减小。系统性误差属于可以消除的误差。《统计学基础》

第二章数据收集

2.3统计数据质量

抽样框误差:是因不准确或不完整的抽样框而引起的误差。抽样框误差是一种非随机性误差。抽样框误差主要来自抽样框误差主要来自:a.丢失目标总体单位:抽样框没有覆盖全部目标总体单位,有些目标单位没有在抽样框中出现,没有机会被选人样本;b.包含非目标单位;c.丢失目标单位和包含非目标单位共存;d.复合连接:即抽样框单元与目标总体单元不完全一一对应,而是存在一对多、多对一或是多对多模式的现象;e.不正确的辅助信息导致“内容上的偏差”;f.抽样框老化:又被称为“抽样框过时”或“不准确的抽样框”,.《统计学基础》

第二章数据收集

《统计学基础》第二章数据收集

2.3统计数据质量

2.3.1统计数据的误差种类

2.3.2统计数据的质量标准

2.3统计数据质量2.3.2统计数据的质量标准P23

统计数据的搜集是统计活动的基础环节,所有统计数据的处理和分析都是在这个基础上进行的。对于统计数据质量的要求,具体可以归纳为统计数据的时效性,准确性、一致性三个方面的具体标准。

1.统计数据的时效性就是指及时和准时获取统计数据。及时获取统计调查资料就是要在规定的统计调查时间内完成统计调查工作。准时获取统计调查资料就是要确切地反映出统计调查对象在规定的调查时点上,或规定的调查时段中的数量特征。《统计学基础》

第二章数据收集

2.3统计数据质量2.统计数据的准确性是指确保统计数据的完整性、真实性和精确性,最大限度地降低统计数据中的各种偏误。统计调查的完整性是要保证调查对象中每一个调查单位的标志特征都要包含在统计调查的实际登记资料之中,并且仅出现一次。统计调查的真实性是要保证每一个调查单位的标志特征都要无偏差、无失真、准确无误地反映在统计调查的登记资料中。统计调查的精确性是指在抽样调查中,要保证抽样误差有效地控制在规定的许可范围内。

3.统计数据的一致性是指统计数据在时间上和空间上的连续性和可比性。统计调查的一致性就是指统计调查的具体方法、指标设置、调查体系等在时间、空间上的可比性。《统计学基础》

第二章数据收集

第二章数据收集

Excel应用单元格地址单元格的列标和行号又称为地址。地址分为三种:相对地址:仅写出列标和行号,如A5、B16。绝对地址:在列标和行号前均加入“$”符,对行和列均锁定,如$A$1、$C$20。混合地址:仅在行号或列标前加“$”符,表示行固定或者列固定。如$A5为绝对列相对行,而A$5为绝对行相对列。256列,65536行Excel应用《统计学基础》

第二章数据收集

单元格的数据输入通常Excel工作表由单元格组成,每一单元格可定义一种数据类型,如文本、数值、公式等。Excel中单元格的常用数据类型如右表所示。类型示例文本姓名、诊断…日期

2004年9月1日,2008/9/18时间5时30分数值1500.88公式=A1+B1-C2货币¥8888.00、$77,856…表Excel单元格的常用数据类型Excel应用《统计学基础》

第二章数据收集

Excel的单元格中可以输入两种数据,即常量和公式。常量:不以等号(=)开头的单元格数据,可以是日期、数字和文本。公式或由公式得出的数值都不是常量。公式:公式总是以等号(=)开头,其后为算式。(单元格内的一系列数值、单元格引用、名称、函数和操作符的集合,可以通过现有的数据计算出新的数值。)Excel应用《统计学基础》

第二章数据收集

使用引用引用的作用在于标识工作表上的单元格或单元格区域,并指明公式中所使用的数据的位置。通过引用,可以在公式中使用工作表不同部分的数据,或者在多个公式中使用同一单元格的数值。还可以引用同一工作簿不同工作表的单元格、不同工作簿的单元格、甚至可应用程序中的数据。引用类型:相对引用:A1、B2、C5…,在公式运算中有自动更新功能绝对引用:$A$1、$B$2、$C$5…

,公式运算中不变混合引用:$A1、A$1、$B2、B$2、$C5、C$5…

,公式运算中,未锁定部分自动更新Excel应用《统计学基础》

第二章数据收集

引用示例

如果要引用请使用在列A和行10中的单元格A10属于列A中行10到行20中的单元格区域A10:A20属于行15中列B到列E中的单元格区域B15:E15行5中的所有单元格5:5从行5到行10中的所有单元格5:10列H中的所有单元格H:H从列H到列J中的所有单元格H:J从A列第10行到E列第20行的单元格区域A10:E20Excel应用《统计学基础》

第二章数据收集

运算符及计算优先次序:包含四种类型的运算符,总计16个,按照优先级由高到低依次为:1.引用运算符;2.负号;3.百分比;4.乘方;5.乘除;6.加减;7.连接符;8.比较运算符。Excel应用《统计学基础》

第二章数据收集

运算符说明:(冒号)引用运算符,(逗号)(空格)1.引用运算符

(3个):包括冒号、逗号和空格Excel应用《统计学基础》

第二章数据收集

1.引用操作符(3个):包括冒号、逗号和空格冒号“:”——连续区域运算符,对两个引用之间包括两个引用在内的所有单元格进行引用。如SUM(B5:C10),计算B5到C10的连续12个单元格之和。逗号“,”——联合操作符可将多个引用合并为一个引用。如:SUM(B5:B10,D5:D10),计算B列、D列共12个单元格之和。空格——取多个引用的交集为一个引用,该操作符在取指定行和列数据时很有用。如SUM(B5:B10A6:C8),计算B6到B8三个单元格之和。Excel应用《统计学基础》

第二章数据收集

2.文本连接符(1个):使用文本连接符(&)可加入或连接一个或更多字符串以产生一长文本。例如:“2011年”&“祖国更繁荣”就产生“2011年祖国更繁荣”。(把不同单元格中的内容放在一起)Excel应用《统计学基础》

第二章数据收集

算术运算符含义示例+(加号)加,负号4+3,-13-(减号)减6-5*(星号)乘3*8/(斜杠)除12/3∧(脱字符)乘幂6^2(与6*6相同)%(百分号)百分比92%3.算术运算符(6个):其作用是完成基本的数学运算,产生数字结果等Excel应用《统计学基础》

第二章数据收集

比较运算符含义示例=(等号)等于E2=D1>(大于号)大于E2>D1<(小于号)小于E2<D1>=(大于等于号)大于等于E2>=D1<=(小于等于号)小于等于E2<=D1<>(不等于号)不等于E2<>D14.比较操作符(6个):它们的作用是可以比较两个值,结果为一个逻辑值,不是“TRUE”就是“FALSE”。Excel应用《统计学基础》

第二章数据收集

Excel函数函数是对一个或多个执行运算的数据进行指定的计算,并且返回计算值的公式.执行运算的数据称为函数的参数。参数可以是文本、数字或逻辑值。函数运行后传回来的数据称为函数的结果。

Excel中的函数通常分为常用函数、工程函数、财务函数、数学与三角函数、统计函数、查询与引用函数、数据库函数、文本函数、逻辑函数、信息函数等。函数的一般格式为:函数名(参数1,参数2,参数3…)如:SUM(Numberl,Number2,Number3…)Excel应用《统计学基础》

第二章数据收集

公式出错的原因及排除方法如果公式不能正确计算出结果,Excel将显示一错误值。出现错误值“#####!”的原因:①输入到单元格中的数值太长,单元格容纳不下。可以通过增加列宽,来纠错。②单元格公式产生的结果太长,单元格容纳不下。可以通过增加列宽,来纠错。产生错误值“#VALUE!”使用错误的参数或运算对象类型。产生错误值“#DIV/0!”公式被0(零)除。Excel应用《统计学基础》

第二章数据收集

产生错误值“#NAME?”

在公式中使用了Excel不能识别的文字。产生错误值“#N/A”

在函数或公式中没有可用数值。如果工作表中某些单元格暂时没有数值,请在这些单元格里输入“#N/A”。公式在引用这些单元格时,将不进行数值计算,而是返回“#N/A”。产生错误值“#REF!”

单元格引用无效。产生错误值“#NUM”

公式或函数中某个数字有问题。产生错误值“#NULL!”

试图为两个并不相交的区域指定交叉点。Excel应用《统计学基础》

第二章数据收集

Excel应用公式错误的排除步骤:确认所有的圆括号都成对出现。当创建公式时,输入的圆括号将以彩色显示。确认在引用单元格区域时,使用了正确的区域运算符。引用单元格区域时,使用冒号来分隔区域中的第一个单元格和最后一个单元格。公式错误的排除方法:确认已经输入了所有必选的参数。有些函数的参数是必选的,还要确认没有输入过多的参数。可以在函数中输入(或称嵌套)不超过七级的函数。如果引用的工作簿或工作表名称中包含非字母字符,必须用单引号把名称引起来。确认每个外部引用都包含工作簿名称和相应的路径。在公式中输人数字时不要设置格式。例如,即使需要输入的数值是“$1,000”,也应在公式中输入“1000”。《统计学基础》

第二章数据收集

Excel应用

假定在某大学校园对在校本科学生进行一次随机化处理的敏感问题问卷调查,调查问卷中包括了5个敏感问题。采用随机抽取卡片的方式进行了随机化处理,事先准备好的卡片注有“对”与“不对”两种,其为“对”的卡片占卡片总数的比例为0.4。该次调查一共随机抽取了100个被调查者,针对5个敏感问题和所随机抽取的卡片回答“是”和“不是”,来表明自己的态度。调查结果回答“是”的人数分别为50,48,44,53,57。试采用(2.2)式来估计在该大学同学对应每个敏感问题的态度为“对”的总体比例。即有样本容量,回答“是”的人数分别为50,48,44,53,57;随机抽取备择答案“对”的比重。请计算每个敏感问题为“对”的总体比例的估计值。《统计学基础》

第二章数据收集

结果为:图2.4估计量的计算结果Excel应用《统计学基础》

第二章数据收集

SPSS基础知识窗口介绍变量的定义数据的录入SPSS简介《统计学基础》

第二章数据收集

第二章数据收集

小结与练习

本章小结

本章介绍了统计数据来源、统计调查方法、统计调查方案设计、问卷设计技术和统计数据质量等内容。本章的重点包括普查、统计报表、抽样调查、典型调查、重点调查的特点,统计调查方案设计、问卷设计技术、统计数据误差的种类等内容。本章的难点是统计调查方案设计、问卷设计及其敏感问题的随机化处理方法,以及统计数据的误差分析。

《统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论