第七章 资料处理_第1页
第七章 资料处理_第2页
第七章 资料处理_第3页
第七章 资料处理_第4页
第七章 资料处理_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主编主编 风笑天风笑天副主编副主编 龙书芹龙书芹社会调查方法社会调查方法社会调查方法 21世纪思想政治教育专业系列教材第七章第七章 资料处理资料处理原始资料的审核与复查数据编码数据录入和清理本章内容本章内容社会调查方法 21世纪思想政治教育专业系列教材第一节第一节 原始资料的审核与复查原始资料的审核与复查 资料审核是资料处理工作的第一步。它是指研究者对调查所收资料审核是资料处理工作的第一步。它是指研究者对调查所收集到的原始资料(主要是问卷)进行初步的审查和核实,校正错填、集到的原始资料(主要是问卷)进行初步的审查和核实,校正错填、误填的答案,剔除乱填、空白和严重缺答的废卷,其目的是使得原误填的

2、答案,剔除乱填、空白和严重缺答的废卷,其目的是使得原始资料具有较好的准确性、完整性和真实性,从而为后续的资料整始资料具有较好的准确性、完整性和真实性,从而为后续的资料整理、录入和统计分析工作打下较好的基础。理、录入和统计分析工作打下较好的基础。 资料审核工作包含两方面的内容:首先是检查出问卷资料中存资料审核工作包含两方面的内容:首先是检查出问卷资料中存在的问题,接着是重新向被调查者核实。在的问题,接着是重新向被调查者核实。 资料审核工作主要有两种不同的做法。一种是实地审核;另一资料审核工作主要有两种不同的做法。一种是实地审核;另一种是集中审核种是集中审核资料审核的含义资料审核的含义社会调查方法

3、 21世纪思想政治教育专业系列教材第一节第一节 原始资料的审核与复查原始资料的审核与复查实地审核之于集中审核实地审核之于集中审核特别及时,且效果较好;特别及时,且效果较好;但调查工作的组织和安但调查工作的组织和安排要特别仔细,调查员排要特别仔细,调查员个人处理各种情况的能个人处理各种情况的能力要比较强。力要比较强。实地审核实地审核集中审核集中审核调查工作便于统一安排和调查工作便于统一安排和管理,审核工作也可以统一管理,审核工作也可以统一在研究者的指导下进行,审在研究者的指导下进行,审核的标准比较一致,检查的核的标准比较一致,检查的质量相对好一些;但整个调质量相对好一些;但整个调查工作的周期则会

4、相对拉长,查工作的周期则会相对拉长,少数个案的重新询问和核实少数个案的重新询问和核实工作有时因时间相隔较长或工作有时因时间相隔较长或调查地点较远而无法落实。调查地点较远而无法落实。社会调查方法 21世纪思想政治教育专业系列教材第一节第一节 原始资料的审核与复查原始资料的审核与复查资料的复查的含义及做法资料的复查的含义及做法所谓资料的复查,指的是在调查资料收回后,由其他所谓资料的复查,指的是在调查资料收回后,由其他人对所调查的样本中的一部分个案进行第二次调查,人对所调查的样本中的一部分个案进行第二次调查,以检查和核实第一次调查的质量。以检查和核实第一次调查的质量。复查的基本做法是:由研究者自己或

5、者由研究者重新选择另外的调查员,从原来的调查员所调查过的样本中,随机抽取5%10%的个案进行调查。一方面核实原来的调查员是否真的对个案进行过调查(有的调查员会由于各种原因自编自填问卷答案,而实际并没有发送给被调查者或访问被调查者);另一方面可将两次调查的结果进行对比,以检查第一次调查的质量。社会调查方法 21世纪思想政治教育专业系列教材第二节第二节 数据编码数据编码 编码就是给调查问卷中的每个问题及其答案赋予一个数字作为代码。单项选择题的编码在调查问卷的设计中就已经将答案的代码确定好了。单项选择题的编码在调查问卷的设计中就已经将答案的代码确定好了。A1A1你的性别:你的性别: 1 1男男 2

6、2女女 1 1A2A2你的年龄:你的年龄: 28 28 周岁周岁 28 28A3A3你的文化程度:你的文化程度: 3 31.1.小学及以下小学及以下 2. 2.初中初中 3. 3.高中及中专高中及中专 4. 4.大专及以上大专及以上A4A4你的婚姻状况:你的婚姻状况: 2 21.1.未婚未婚 2. 2.已婚已婚3.3.离婚离婚 4. 4.其他其他 编码编码社会调查方法 21世纪思想政治教育专业系列教材第二节第二节 数据编码数据编码多项选择题的编码多项选择题的编码问卷里的一个多项选择题在数据库里要转换成多个变量,变量的数问卷里的一个多项选择题在数据库里要转换成多个变量,变量的数量由该题的备选答案

7、的数量决定,有多少个备选答案,就有多少个量由该题的备选答案的数量决定,有多少个备选答案,就有多少个变量。每个备选答案的预编码(问卷设计时拟定的编码)就是相应变量。每个备选答案的预编码(问卷设计时拟定的编码)就是相应变量的代码。然后对每一个答案进行变量的代码。然后对每一个答案进行“1”1”、“0”0”编码,即被选择编码,即被选择的答案编码为的答案编码为“1”1”,未被选择的答案编码为,未被选择的答案编码为“0”0”。举例,见本书举例,见本书140140页页社会调查方法 21世纪思想政治教育专业系列教材第二节第二节 数据编码数据编码多多项项选选择择题题的的编编码码A31在下列伦理关系中,您最重视哪

8、些关系?(限选4项并排序)最重视(1),第二重视(2),第三重视(6),第四重视(12)(1)父母与子女(2)夫妇(3)兄弟姐妹(4)同事或同学(5)上级或下级(6)师生(7)与自然的关系(8)个人与社会(9)个人与政府(10)个人与工作单位 (11)网上关系(12)朋友该题中需要排序的答案的数量为4,数据库里面就设置4个变量,其代码可以分别设置为A311、A312、A313、A314。A31是问题代码,A31后面接着的数字是表示重要性程度的序号代码。A311用来指代最重视的关系,A312用来指代第二重视的关系,依此类推。A311、A312、A313、A314的编码值分别是所选答案的预编码值,

9、即1、2、6、12社会调查方法 21世纪思想政治教育专业系列教材第二节第二节 数据编码数据编码矩阵式问题的编码矩阵式问题的编码B12请对下列说法发表意见非常非常同意同意说不准不同意很不同意1.只有生儿子才能传宗接代2.生儿子是名气,生女儿是福气3.不孝有三,无后为大4.生男生女都一样,女儿也是传后人表1社会调查方法 21世纪思想政治教育专业系列教材第二节第二节 数据编码数据编码矩阵式问题的编码矩阵式问题的编码非常同意同意说不准不同意很不同意说法112345说法254321说法312345说法454321表2社会调查方法 21世纪思想政治教育专业系列教材第二节第二节 数据编码数据编码矩阵式问题的

10、编码矩阵式问题的编码表表1 1该题中列出了该题中列出了4 4个小问题,数据库里面就设置个小问题,数据库里面就设置4 4个变量,其代码可以个变量,其代码可以分别设置为分别设置为B121B121、B122B122、B123B123、B124B124。B12B12是总问题代码,是总问题代码,B12B12后面接后面接着的数字是矩阵里面各子问题的代码。着的数字是矩阵里面各子问题的代码。在资料回收之后,首先需要对回答进行后编码,特别是对于一些具有在资料回收之后,首先需要对回答进行后编码,特别是对于一些具有定序层次答案的态度问题,编码时还要特别注意它的方向性。在上例定序层次答案的态度问题,编码时还要特别注意

11、它的方向性。在上例中,对于倾向于生儿子的看法,我们按中,对于倾向于生儿子的看法,我们按1=1=非常同意,非常同意,2=2=同意,同意,3=3=说不说不准,准,4=4=不同意,不同意,5=5=很不同意来赋值;而对倾向于生女儿的看法,我们很不同意来赋值;而对倾向于生女儿的看法,我们则按则按5=5=非常同意,非常同意,4=4=同意,同意,3=3=说不准,说不准,2=2=不同意,不同意,1=1=很不同意来赋值。很不同意来赋值。这样,矩阵中四种看法的具体赋值情况如表这样,矩阵中四种看法的具体赋值情况如表2 2这样,矩阵中的子问题这样,矩阵中的子问题B121B121、B122B122、B123B123、B

12、124B124的编码值分别是的编码值分别是2 2、3 3、2 2、2 2。在数据录入时,把编码值。在数据录入时,把编码值2 2、3 3、2 2、2 2录入数据库中的相应位置录入数据库中的相应位置即可。即可。社会调查方法 21世纪思想政治教育专业系列教材第二节第二节 数据编码数据编码编码手册 由于社会研究的样本规模通常达到成百上千,而一份问卷中又包括好几十个问题,这样问卷编码的任务往往十分繁重,需要多人共同完成。为了减少编码工作的误差,保证编码数据的质量,研究者需要编制一份编码手册(也称编码簿)发给编码员,每个编码员则按照编码手册的要求,统一进行编码。在编码手册中,研究者将编码的项目和问题一一列

13、出,逐一规定它们的代码、宽度、栏码、简要名称、答案赋值方式及其他特殊规定等。整个编码手册的格式要规范统一,指示要明确,且容易理解,便于操作。社会调查方法 21世纪思想政治教育专业系列教材第三节第三节 数据录入和清理数据录入和清理数据的录入方式及工具数据的录入方式及工具数据录入的方式主要有两种:一种是直接从问卷上将编好码的数据输入数据录入的方式主要有两种:一种是直接从问卷上将编好码的数据输入计算机;另一种是先将问卷上编好码的数据转录到专门的登录表上,然计算机;另一种是先将问卷上编好码的数据转录到专门的登录表上,然后再从登录表上将数据输入计算机。后再从登录表上将数据输入计算机。直接从问卷上输入数据

14、的优点是避免了再次转录中可能出现的差错,其直接从问卷上输入数据的优点是避免了再次转录中可能出现的差错,其缺点是录入时要不断地翻动问卷,录入的速度相对要慢一些。将问卷上缺点是录入时要不断地翻动问卷,录入的速度相对要慢一些。将问卷上的数据先转录到登录表上,再输入计算机的做法,虽然可以使得计算机的数据先转录到登录表上,再输入计算机的做法,虽然可以使得计算机录入员比较方便,速度也相对较快,但它却要冒增加差错的风险。录入员比较方便,速度也相对较快,但它却要冒增加差错的风险。数据的录入既可以采用诸如数据的录入既可以采用诸如EDED、WordStarWordStar、WPSWPS、WordWord等一般的编

15、辑软等一般的编辑软件,也可以采用专门的数据库管理软件,如件,也可以采用专门的数据库管理软件,如dBasedBase、FoxBASEFoxBASE、FoxProFoxPro等。等。社会调查方法 21世纪思想政治教育专业系列教材第三节第三节 数据录入和清理数据录入和清理数据清理的方法数据清理的方法数据清数据清理的方理的方法法有效范有效范围清理围清理逻辑一逻辑一致性清致性清理理数据质数据质量抽查量抽查社会调查方法 21世纪思想政治教育专业系列教材第三节第三节 数据录入和清理数据录入和清理对于问卷中的任何一个变量来说,它的有效编码值往往都有某种范围,而当数据中的数字超出了这一范围,可以肯定这个数字一定

16、是错误的。其基本思路是依据问卷中的问题相互之间所存在的某种内在的逻辑联系,来检查前后数据之间的一致性。人们往往采用随机抽样的办法,从样本的全部个案中抽取一部分个案,进行这种形式的校对工作。用这一部分个案校对的结果,来估计和评价全部数据的质量。有效范围清理有效范围清理逻辑一致性逻辑一致性清理清理数据质量抽查数据质量抽查社会调查方法 21世纪思想政治教育专业系列教材第三节第三节 数据录入和清理数据录入和清理社会调查方法 21世纪思想政治教育专业系列教材有效范围清理:如果在数据文件的有效范围清理:如果在数据文件的“性别性别”这一变量栏这一变量栏中,出现了数字中,出现了数字5 5或者或者7 7、8 8

17、等,我们马上可以判定这是错等,我们马上可以判定这是错误的编码值。这种错误可能发生在原始问卷的填写上;误的编码值。这种错误可能发生在原始问卷的填写上;发生在编码员对问卷的编码结果上或数据录入过程中。发生在编码员对问卷的编码结果上或数据录入过程中。逻辑一致性清理:比如,在一项对青年夫妇进行的社会调逻辑一致性清理:比如,在一项对青年夫妇进行的社会调查中有这样一对相倚问题,其过滤性问题是:查中有这样一对相倚问题,其过滤性问题是:“你们有孩你们有孩子吗?子吗?”答案为答案为“有有”(编码为(编码为1 1)和)和“没有没有”(编码为(编码为2 2)。而后续性问题是:)。而后续性问题是:“请问你们的孩子今年

18、多大了?请问你们的孩子今年多大了?”那么,对于那些在前一问题中回答那么,对于那些在前一问题中回答“没有没有”的人(即编码的人(即编码为为2 2的人),在后一问题中的回答却不是空白,这时肯定的人),在后一问题中的回答却不是空白,这时肯定是出了问题。是出了问题。数数据据清清理理的的方方法法举举例例第三节第三节 数据录入和清理数据录入和清理社会调查方法 21世纪思想政治教育专业系列教材数据质量抽查:假设某个个案的数据在数据质量抽查:假设某个个案的数据在“文化程度文化程度”这一变量这一变量上输错了,问卷上填答的答案是上输错了,问卷上填答的答案是2 2(初中),编码值也是(初中),编码值也是2 2,但,但数据录入时却记录成了数据录入时却记录成了3 3(高中或中专)。由于(高中或中专)。由于3 3这个数值在有这个数值在有效的编码值范围内,因此,有效范围清理方法检查不出这一错效的编码值范

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论