第八章问卷检验与数据的录入(讲课)_第1页
第八章问卷检验与数据的录入(讲课)_第2页
第八章问卷检验与数据的录入(讲课)_第3页
第八章问卷检验与数据的录入(讲课)_第4页
第八章问卷检验与数据的录入(讲课)_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章问卷检验与数据录入第一节问卷的检验问卷调查法是营销研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析。一、信度分析

信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:1、重测信度法

这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。1、重测信度法

如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。

2、复本信度法

复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。3、折半信度法

折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。折半信度分析进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式:rtt=2rhh/(1+rhh),

求出整个量表的信度系数(ru)。4、α信度系数法

Cronbachα信度系数是目前最常用的信度系数,其公式为:

其中,K为量表中题项的总数,为第i题得分的题内方差,为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。二、效度分析

效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。效度分为三种类型:内容效度、准则效度和结构效度。效度分析有多种方法,其测量结果反映效度的不同方面。常用于调查问卷效度分析的方法主要有以下几种。1、单项与总和相关效度分析

这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。1、单项与总和相关效度分析

统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项总分的相关系数,根据相关是否显著判断是否有效。若量表中有反意题项,应将其逆向处理后再计算总分。2、准则效度分析

准则效度又称为效标效度或预测效度。准则效度分析是根据已经得到确定的某种理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准则的联系,若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显著差异,则为有效的题项。评价准则效度的方法是相关分析或差异显著性检验。在调查问卷的效度分析中,选择一个合适的准则往往十分困难,使这种方法的应用受到一定限制。3、结构效度分析

结构效度是指测量结果体现出来的某种结构与测值之间的对应程度。结构效度分析所采用的方法是因子分析。有的学者认为,效度分析最理想的方法是利用因子分析测量量表或整个问卷的结构效度。因子分析的主要功能是从量表全部变量(题项)中提取一些公因子,各公因子分别与某一群特定变量高度关联,这些公因子即代表了量表的基本结构。通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种结构。在因子分析的结果中,用于评价结构效度的主要指标有累积贡献率、共同度和因子负荷。累积贡献率反映公因子对量表或问卷的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷反映原变量与某个公因子的相关程度。第二节资料整理的一般程序问卷接收编辑和检查编码数据的分析缺失数据处理数据录入资料整理程序数据资料的处理过程是从回收第一份问卷开始的。按照事先调查方案的计划,尽量确保每份问卷都是有效问卷(所谓“有效”问卷,指的是在调查过程中按照正确的方式执行完成的问卷)。第一节数据整理的一般程序问卷接收编辑和检查编码数据的分析缺失数据处理数据录入数据整理程序一、问卷的接收对于不同地区、不同调查员交来的问卷,应当认真仔细地做好接收、登记与核对工作。首先,要对问卷进行登记与编号;其次,要将无效问卷的进行剔除;最后,还要确定补充调查。

二、编辑和检查为了增加准确性,对那些初步接收的问卷还要进一步进行检查和校订。主要检查是否清楚可认,是否完全,是否一致以及是否明确不含糊等。对于检查出来的不满意问卷,常用以下方法进行处理:1.退回去重新填写;2.按缺失数据处理;3.丢弃。三、编码编码是指用代码来表示各组数据资料使使其成为可进行计算机处理和分析的信息。编码可以按照预先编码或事后编码来进行。三、编码无论是哪种编码方式基本程序都包括以下几个方面:——确定变量——单选问题与多选问题的编码——无结构式(开放式)问题的编码——编码说明书及数据输出格式说明书

四、数据录入数据录入要求做到准确无误。控制录入误差的方法有:重复录入、预值控制、平衡检测。

五、缺失数据处理缺失数据是指由于被调查者没有给出明确的答案或调查员没有记录下他们的答案而造成未知变量值。缺失数据处理可以使用以下几种方法:1.用一个样本统计量去代替;2.用某些统计模型进行推算;3.问卷整体剔除;4.部份排除。

六、调查资料的分析1.数据分析任务书数据分析任务书一般应明确列举以下内容:——编制变量标识和变量制标识。——需要制作的统计表。——需要制作的统计图。——需要进行的统计分析。一、问卷的接收对于不同地区、不同调查员交来的问卷,应当认真仔细地做好接收、登记与核对工作。首先,要对问卷进行登记与编号;其次,要将无效问卷的进行剔除;最后,还要确定补充调查。

问卷回收以后,督导员必须按照调查的要求,仔细的检查问卷。检查问卷的目的在于将有错误填写,或者是挑出不完整或不规范的问卷,保证数据的准确性。所谓错误填写即出现了那些不合逻辑或根本不可能的结果,通过对调查员的复核,可以检查出哪些调查员没有按照调查的要求去访问,那么,该调查员完成的问卷可能存在很多问题。还有可能出现漏答了某些必须回答的问题,比如被访者的人口特征等基本情况,造成问卷回答不完整。鉴于这些情况,不管是由于调查员造成的还是被访者的原因,通常有两种方式进行补救:对于出现漏答的问卷,通常要求调查员对受访者进行重访,以补充未答的问题;如果不便于重访或重访后的问卷还有问题,数目不是很多,可以当作缺失值计。如果数量非常大,这份问卷就只能当作废卷处理,并且按照被访对象的抽样条件,补作相关的样本。二、编辑和检查为了增加准确性,对那些初步接收的问卷还要进一步进行检查和校订。主要检查是否清楚可认,是否完全,是否一致以及是否明确不含糊等。问卷的检查一般是指对回收问卷的完整性和访问质量的检查,目的是要确定哪些问卷可以接受,哪些问卷要作废。

检查的要点(1)规定详细的检查规则,一份问卷哪些问题是必须填写完整的,哪些问题出现缺失时可以容忍等,使督导员明确检查问卷的每一项流程。(2)对于每份调查员交回来的问卷必须彻底地检查,以确认调查员或者被访者是否按照相关的要求完成了访问,并且完整的记录在问卷恰当的位置。

检查的要点(3)应该将问卷分成三种类型,一种是完成的问卷,一种是作废的问卷,第三种是有问题的问卷,但是通过追访还可以利用的问卷。

(4)如果抽样中有配额的要求,那么应将完成的问卷中的配额指标进行统计分析,确定问卷是否完成配额的要求,以便及时的补充不足的样本。

检查的要点(5)通常有下面的情况的问卷是不能接受的:回收的问卷明显不完整,缺了一页或者多页;问卷中有很多内容没有填答;问卷的模式说明调查员(被访者)没有理解或者遵循访问指南回答等;问卷的答案几乎没有什么变化,如在态度的选项上全部选择第x项的情况;问卷的被访者不符合抽样要求;问卷的回收日期超过了的访问的时限等。对于检查出来的不满意问卷,常用以下方法进行处理:1.退回去重新填写;2.按缺失数据处理;3.丢弃。问卷的校订

为了加强问卷的准确性,对那些初步接受的问卷还要进行进一步的检查和校订,在校订的过程中,通常会发现问卷中存在有字迹模糊、问题漏选的、前后回答不一致的、答案模棱两可的和跳答错误的问题。

问卷的某些问题答案可能出现字迹模糊的情况,特别是碰上无结构的开放式的问题时,因为调查员记录的不好,答案不容易识别。如果发现这样的问题,必须对受访者进行追访,将积极不清楚的地方填写清楚。

对于漏选的问题处理方法也是一样,出现漏选的题目因为各种原因,无法进行补充访问事后,普通的问题,而且数目不大的情况,通常作为缺失值处理;如果涉及到是受访对象的个人特征的问题,通常只能作为废卷处理。

问卷的校订

问卷中有些问题的答案会出现不容易理解的模棱两可的情况,或者是使用了不是通用的缩写方式或词语,或者在该单选一项的问题中,圈选了两项等,都必须通过追访进行补救。另外就是回答时可能出现跳答错误的情况,这可能是因为被访对象没有很好的理解问题。如果出现这种情况,首先要核实被访对象是否符合抽样调查的条件(跳答题目往往是筛选条件),如果符合,进行追问补充,如果不符合条件,问卷只能作废,重新补充样本。

问卷的回收、检查与校订可能是非常繁琐、且工作时间很长的工作,但是却是保证数据处理过程中较少误差的重要的步骤。三、编码编码是指用代码来表示各组数据资料使使其成为可进行计算机处理和分析的信息。编码可以按照预先编码或事后编码来进行。问题025:您认为打工的外地人对北京市的社会秩序是否有影响?(单选)1□有很大影响2□有较大影响3□没有影响4□不好说4编码答案编码的步骤:1)确定变量;变量:用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。问题009:您有几个儿子?几个女儿?1□儿子_______人2□女儿________人23问题变量1变量2变量1的值变量2的值编码需要以下几个步骤2)每个需要编码的项目都必须有一份编码表,将问题和项目的代码详细的标注在编码表的顶端位置,由于事先不知道会有多少新的代码或答案出现,所以一定要预备足够的空间。

2)制作编码表直接过录0-1编码变量名:一个数据文件中,一个变量只能有一个唯一名称。码位:某一变量在数据文件中占据的栏位码数:某一变量由几位数组成。该变量是数值型(Numeric)——如定距、定比,还是字串型(String),如定类、定序。前者在统计中可以做高级运算,后者则不可以。不适于被访人回答的问题的编码。一般采用7,97,997等。被访人回答不知道时的编码。一般采用8,98,998等。被访人拒绝回答某变量时的编码。一般采用9,99,999等。问卷中出现漏答时的处理编码。一般采用9,99,999等。23100011

如果编码的工作由一个编码员完成,出现错误的可能性相对较小。但实际上,因为需要编码的问题可能很多,一个认识没有办法按时完成的,这就需要多个编码员。在这样的情况下,一定要注意多个编码员工作的协调。应该安排编码员在不同的时间,或者相同的时间相同的地点,使用同一个编码表。这样可以避免编码重复的情况。

注意事项注意事项(3)研究人员应详细制定编码的守则,指导编码员如何识别答案,并且将其归类,以及如何分配编码等等,并同时对编码的过程进行监督和检查。(4)可以对“不知道”、“无所谓”、“不清楚”、“缺失”事先规定,但是一定要注意规定的编码与实现对该问题的最大编码的预计的数量一致。

(5)编码的字迹必须清楚,如果可能的话,及时的进行计算机的录入管理。

表5.1公司年终考核表表5.2公司年终考核表编码表1.数据文件的结构数据文件是为了某一特定目的而形成的同类记录的集合,数据的组织方式及内在联系的表示方式决定着数据处理的效率,因而设计数据文件的结构是数据处理工作的主要内容之一。2.文件的格式5.1.3编码说明书编码说明书(codebood)是一份说明问卷中各个问题(即变量)及其答案与数据文件中的编码值之间一一对应关系的文件。表5.3编码明细表续表续表5.1.4预编码为了方便计算机处理,在设计问卷时就预先给这些答案设计了编码,这种编码方式称为预编码(precoding)。5.1.5后编码后编码是整理开放式问题答案并对其进行编码的有效方法。5.2表列5.2.1单向表列四、数据录入数据录入是指将问卷或编码表中的每一个项目对应的代码转化成计算机能够识别的形式的过程。这个过程需要数据录入装置(计算机)和一个存储介质(数据库软件、磁盘)。市场调查发达的国家在数据的采集中使用CATI、CAPI的方式很普遍,因此键盘录入的过程已在访问的时候就已经完成了。而且对于简单的问卷调查,使用调查卡进行光学扫描录入也能从时间上节约不少成本。但是国内目前主要还是纸面问卷调查的形式居多,所以在问卷完成后,还需要对问卷进行录入的操作。

数据录入要求做到准确无误。控制录入误差的方法有:重复录入、预值控制、平衡检测。

如将在图15-1问卷的编码中出现的问题进行录入,问卷编号,城市编码,调查员编号,Q1、Q2、Q3LLQ12-1、Q12-2、Q12-3、Q13、Q14,对应的数据库结构见图15-2。这样,输入时每份问卷按数据库中指定的位置输入相应变量的取值,一行数字就是一份问卷。结果所有问卷次依输入完毕就形成一个数据库。

(1)问卷编码是001号,城市是北京市,12号调查员完成的问卷,圈选的结果是:Q1男性;Q230岁;Q3大学专科;LLQ12圈选的235;Q13非常同意;Q14不同意;

(2)问卷编码是005号,城市是上海市,2号调查员完成的问卷,圈选的结果是:Q1女性;Q222岁;Q3大学本科;LLQ12

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论