2第2章数据收集培训教材_第1页
2第2章数据收集培训教材_第2页
2第2章数据收集培训教材_第3页
2第2章数据收集培训教材_第4页
2第2章数据收集培训教材_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二

章数据收集第一节数据的直接来源与间接来源第二节数据的收集方法第三节问卷设计第四节收集数据的误差第一节

数据来源——数据是怎样得到的?数据的间接来源

(二手数据的来源)来源特点评估二手数据的来源Internethttp//WWW.中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料二手数据的特点收集容易,采集成本低作用广泛分析所要研究的问题提供研究问题的背景帮助研究者更好地定义问题检验和回答某些疑问和假设寻找研究问题的思路和途径收集二手资料在研究中应优先考虑二手数据的评估数据是谁收集的?可信度评估为什么目的而收集的?数据是怎样收集的?什么时候收集的?数据的直接来源

(原始数据的来源)观测数据(调查数据)试验数据在自然的没有被控制的条件下观测到的在人工干预和操作的情况挖收集的数据统计调查数据统计调查方式全面调查:普查抽样调查:

主观抽样调查(典型调查,重点调查,配额抽样调查)

概率抽样调查主观(非概率)抽样非概率抽样是用主观的(非随机的)方法从总体中抽选单元,是一种快速、简易且节省的从总体中选取样本单元的方法。由于非概率抽样抽取样本有倾向性与偏差且没有一个抽样框,不可能计算出各个单元的入样概率。从而无法得到总体目标量的可靠估计值及其抽样误差估计值。主观(非概率)抽样的优点快速简便;费用相对较低;不需要抽样框;对探索性研究和调查的设计开发很有用。所以在市场调查中广泛应用主观抽样(非概率抽样)的缺点为了对总体进行推断,需要对样本的代表性做很强的假定。不可能得到可靠的估计值以及抽样误差估计值。非概率抽样的种类非概率抽样方法有:随意抽样——方便抽样自愿抽样——自我选择判断抽样配额抽样雪球抽样方便抽样——随意抽样随意抽样的样本单元的抽选以无目标、随意的方式进行,几乎没有或完全没有计划。它假定总体是同质的,即总体单元都相似。比如“街道拦截”访问法。自我选择——志愿抽样让个体自愿参加调查。被调查者都是志愿者。例如具有特定病情的人参加某些医疗实验;打电话参与广播或电视节目的人;抽选参加焦点座谈或深入访问的人。判断抽样由专家有目的地抽选有代表性的样本。它适用于探索性研究,如:抽选参加焦点座谈或深入访谈的人,但不宜用在试调查中。是方便抽样的延伸。配额抽样这是最常见的一种非概率抽样。抽样要从各个子总体中选取特定数量的单元(配额)。

总样本量:900人18-2526-3031-3536-4041-45男女比例28%17%17%19%19%50-55%50-45%雪球抽样用于感兴趣的样本特征较稀有的情况,依赖于一个目标推荐另一个目标的方法。非概率抽样的种类非概率抽样方法有:随意抽样——方便抽样自愿抽样——自我选择判断抽样配额抽样雪球抽样概率抽样概率抽样有两条基本准则:单元是随机抽取的;调查总体中的每个单元都有一个非零的入样概率,并且能计算出这些概率。概率抽样的主要优、缺点:能得到总体的可靠估计值并能计算每个估计值的抽样误差,因而能对总体进行推断。与非概率抽样相比,概率抽样比较复杂,更费时,通常也更费钱。但总的说来,其利远大于弊。概率抽样的种类概率抽样有七种:简单随机抽样,系统抽样,整群抽样,分层抽样,多级抽样,23(1)简单随机抽样

(SimpleRandomSampling)也称纯随机抽样。直接从总体单位中抽选样本单位,每个个体被选入样本的概率都相等。可分为有放回和无放回两种方式。是最基本的抽样方法,许多抽样方法都是在它的基础上发展起来的。其数学性质简单,理论也最为成熟。24有放回抽样和无放回抽样有放回抽样:也称为重复抽样,在一个单位被选入样本后,记录其编号,然后又将其放回总体中继续参与随后的抽样过程。无放回抽样:也称为不重复抽样,在一个单位被选入样本后,不再放回总体参与随后的抽样过程。问题:不重复抽样中每个个体被选中的概率相等吗?25抽选样本单位的方法从N个总体单位中抽选n个单位组成样本,可以先将N个单位编号,若抽到某个号则对应的单位入样。通常有抽签法和随机数法两种抽选方法。抽签法:用均匀同质的材料制作N个签并充分混合,然后一次抽取n个签,或一次抽取一个签但不放回,直至抽满n个签为止。随机数法:随机数表随机数骰子摇奖机计算机产生的伪随机数26随机数表的使用396576454519906964612026363162…737123709065976012119840071766…722047338451674797199840071766…751725691717952178582433457748…374879887463520634300131601027…

028908169485538329955627092443…………………27简单随机抽样最适用的场合当总体内样本单位不多,且有完备名册,可用于编号时对研究的目的而言,总内样本单位间的差异不大时无法充分获得总体信息时由于编制抽样框及抽取的样本可能过于分散等原因在实际实施中有一定困难,加之没有利用其他辅助信息提高估计的效率,所以大规模调查中很少直接采用。28(2)系统抽样

(SystematicSampling)系统抽样(也称等距抽样):将总体N个单位按某

种顺序排列,按规则确定一个随机起点,再每隔一

定间隔逐个抽取样本单位的抽样方法。直线等距抽样:将总体分成n个组,每组有k=N/n个单位。在第一组随机选择一个单位,之后每隔k个选择一个。N=64n=8k=8第一组29等距抽样的特点等距抽样可分为无关标志排队和有关标志排队。按无关标志排队:各单元的排队顺序与所研究的内容无关按有关标志排队:各单元的排队顺序与所研究的内容有关系。优点:抽取样本简便易行,易于监控。主要适用场合总体内的样本单位,对有兴趣的指标而言是随机的或按大小排列的总体内单位数过多,而抽取的样本又较多时总体内的单位数不能确定时(例如抽取学号最后一位为8的学生进行调查)

30按无关标志排队时等距抽样的特点按无关标志排队时,如果单位的排列存在周期性,而抽样间隔又恰好与周期的长度一致时,样本的代表性可能很差样本31按有关标志排队时等距抽样的特点按有关标志排队时,相应的指标数值有线性趋势,按

照普通的等距抽样方法会导致样本指标的偏大或偏小。为了避免这一问题需要采取对称等距抽样的方法。这时样本单位在总体中分布比较均匀,有利于提高估计的精度。直线等距对称等距对称等距32(3)分层抽样StratifiedSampling也称分类抽样或类型抽样。即先将总体所有单位按某种标志划分为若干层,然后从各层中随机抽取一定数目的单位构成样本,根据各层样本汇总对总体指标作出估计的一种抽样方式。男生女生样本33分层抽样的特点

可以提高样本的代表性,提高估计的精度。在估计总体参数的同时还能估计每层的参数。抽样误差只受层内方差的影响,分层时应使层间方差大、层内方差小。最适用的场合:当总体内样本单位的差异较大时;分层后能达到层间差异大,层内差异小的原则时34按比例分层抽样和不按比例分层抽样按比例分层抽样:各层的抽样比例都相等(等于n/N)。在有些情况下,为了降低抽样误差或者对各层的参数进行较好的估计,需要采用不按比例分层抽样。在不按比例的分层抽样中如果要用样本资料推断总体,需要对各层的数据资料进行加权处理。35(4)整群抽样ClusterSampling先将总体分为R个群(即次级单位或子总体),

每个群包含若干总体单位。按某种方式从中随机抽取r个群,然后对抽中的群的所有单位都进行调查的抽样方式。总体分成4个群随机选择2个群构成样本36整群抽样的特点样本单位比较集中,容易集中力量进行调查,

便于组织与管理,也节省了调查时间和费用。不需要所有总体单位的抽样框。由于样本单位不能均匀的分布在总体中,所以样本的代表性要差一些(对策:增大样本容量)。抽样误差受群间方差的影响,不受群内方差的影响。分群时应使群间方差小。最适用的场合:总体名单不易获得时为节省调查成本时群内差异大,而群间的变异小时37(5)多级段抽样先从总体中随机地抽取若干初级单位,再从初级单位中抽取若干二级单位,……如此下去直至抽取所要调查的基本单位的抽样方法。例如:[统计年鉴2004指出]2003年人口变动情况抽样调查是以全国为总体,各省、自治区、直辖市为次总体,采用分层、等距、整群概率比例抽样方法,在全国31个省、自治区、直辖市抽取了990个县(市、区)、3734个乡(镇、街道)、6544个调查小区的126万人。38多阶段抽样的特点适用于总体分布很广,不可能从总体中直接抽取样本单位的情况。不需要全部低级单位的抽样框,节省了调查费用。方法灵活多样。抽样调查的组织方式完全取决于调查研究的目的要求、调查对象的特点和客观的条件。凡是能够最经济、最省时而又能够满足预期精确度和可靠性的组织方式,便是一种好的组织方式,这也是抽样设计的最根本的原则。数据的直接来源

(原始数据的来源)观测数据(调查数据)试验数据在自然的没有被控制的条件下观测到的在人工干预和操作的情况挖收集的数据实验设计方式获得数据1.进行实验方案设计2.方案的实施3.采集数据4.进行数据的分析第二节数据的收集方法一、访问法面谈访问、电话访问、电脑辅助调查、座谈会法、个别深入访谈法二、报告法邮寄调查、日记调查、留置调查三、观察法

直观、可靠第三节调查问卷设计什么是问卷?

(questionnaires)用来搜集调查数据的一种工具调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明以及码表组成的一种调查形式不同的调查问卷在具体结构、题型、措词、版式等设计上会有所不同,但在结构上一般都由问卷的标题、开头部分(说明)、甄别部分、主体部分和背景部分(被调查者的基本情况)、编码、作业证明记载等组成

问卷的基本结构问卷的基本结构开头部分甄别部分主体部分背景部分问候语填写说明问卷编号开头部分

(问候语)××女士/小姐/先生您好!我是××市场调查公司访问员,我们正在进行一项有关公众医疗保险意识方面的调查,目的是想了解人们对医疗保险的看法和意见,以便更好地促进医疗保险事业的发展。您的回答无所谓对错,只要真实地反映了您的情况和看法,就达到了这次调查的目的。希望您能积极参与,我们对您的回答完全是保密的。调查要耽搁您一些时间,请您谅解。谢谢您的支持与合作!开头部分

(填写说明)填写要求:请您在所选择答案的题号上画圈对只许选择一个答案的问题只能画一个圈;对可选多个答案的问题,请在你认为合适的答案上画圈需填写数字的题目在留出的横线上填写对于表格中选择答案的题目,在所选的栏目内画勾对注明要求您自己填写的内容,请在规定的地方填上您的意见

开头部分

(问卷的编号)用于识别问卷、调查者、被调查者姓名和地址等便于校对检查、更正错误问卷编号001甄别部分甄别也称为过滤,它是先对被调查者进行过滤,筛选掉不需要的部分,然后针对特定的被调查者进行调查通过甄别,可以筛选掉与调查事项有直接关系的人,以达到避嫌的目的可以确定哪些人是合格的被调查者,哪些人不是甄别的目的是确保被调查者合格,能够作为该市场调查项目的代表,从而符合调查研究的需要甄别部分S1.请问您或您的家庭有没有在下列行业工作的呢?

1.广告、公关机构…………………2.市场研究、咨询、调查机构……3.电视,广播,报纸等媒介机构…终止访问

4.轿车制造…………5.轿车批发、零售…………………6.以上皆无…………继续访问S2.请问您的年龄是:

1.20岁以下………终止访问

2.20岁~30岁

3.30岁~40岁

4.40岁~50岁

5.50岁以上………终止访问主体部分是调查问卷的核心内容包括所要调查的全部问题,主要由问题和答案所组成

Q1.您在购买汽车时主要考虑哪些因素?Q2.您认为这款汽车的加速性能怎么样?背景部分通常放在问卷的最后,主要是有关被调查者的一些背景资料该部分所包含的各项问题,可使研究者根据背景资料对被调查者进行分类比较分析1.您具体做什么工作?2.您的受教育程度?背景部分

A.[出示卡片]请问您的教育程度?

(901)

没受过正式教育………

……

…………1

小学,初中…………

……

…………2

高中,职高,中专,技校……

……

……3

大专,大学或以上…

……

……

…4

B.[出示卡片]请问您的职业和职位是什么?(902)

普通职员,工人……1

部门经理负责人//高级管理人员……

…2

公司老板,厂长,总经理…………

……………3

专业人员……………

……

…………4

个体户,自营职业………………

………

………5

失业,待业………………

……

……6

学生……………………7

离退休人员…………8

其他(请注明)………9提问项目的设计

问题的主要类型和询问方式

1,提问方式:直接性的问题和间接性的问题

2,做答方式:开放性的问题和封闭性的问题

3,内容:事实性的问题、行为性问题、动机性问题、态度性问题

提问项目的设计提问的内容尽可能短用词要确切、通俗可按6W准则加以推敲。6W即Who(谁),Where(何处),When(何时),Why(为什么),What(什么事),How(如何)一项提问只包含一项内容避免诱导性提问避免否定形式的提问避免敏感性问题用词要确切、通俗请问您使用什么牌子的洗发水?请问您最近三个月使用什么牌子的洗发水?您最近一段时间使用什么品牌的化妆品?您最近一个月使用什么品牌的化妆品?您觉得这种电视机的画面质量怎么样?您认为这种电视机的画面是否清晰?

一项提问只包含一项内容您觉得这种新款轿车的加速性能和制动性能怎么样?

您觉得这种新款轿车的加速性能怎么样?

您觉得这种新款轿车的制动性能怎么样?

避免诱导性提问人们认为长虹牌彩电质量不错,你觉得怎么样?您觉得长虹牌彩电的质量怎么样?

避免否定形式的提问您觉得这种产品的新包装不美观吗?您觉得这种产品的新包装美观吗?

回答项目(答案)的设计回答的类型与方法回答的类型与方法开放性问题(自由回答型)封闭性问题(选择回答型)两项选择法多项选择法顺序选择法评定尺度法双向列联法限制选择型多项选择型单项选择型开放性问题对问题的回答未提供任何具体的答案,由被调查者根据自己的想法自由作出回答属于自由回答型优点:比较灵活,适合于搜集更深层次的信息,特别适合于那些尚未弄清各种可能答案或潜在答案类型较多的问题。而且可以使被调查者充分表达自己的意见和想法,有利于被调查者发挥自己的创造缺点:由于会出现各种各样的答案,给调查后的资料整理带来一定困难开放性问题

您认为我国目前的广告宣传中,存在的主要问题是什么?

您对这种捷达新款车有何更具体的看法?

封闭性问题对问题事先设计出了各种可能的答案,由被调查者从中选择问题的答案是标准化的,有利于被调查者对问题的理解和回答,也有利于调查后的资料整理对答案的要求较高,对一些比较复杂的问题,有时很难把答案设计周全问题的答案是选择回答型,所以设计出的答案一定要穷尽和互斥回答方法有:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法五种封闭性问题

(两项选择法)答案只有两项,要求被调查者选择其中之一来回答优点:被调查者只需在二者之中选择一项,回答比较容易;调查后的数据处理也很方便缺点:得到的信息量较少;当被调查者对两项答案均不满意时,很难作出回答

您有手机吗?

1.有2.没有

封闭性问题

(多项选择法)在设计问卷时,对一个问题给出三个或三个以上的答案,让被调查者从中选择进行回答根据要求选择的答案多少不同,有以下类型单项选择型:要求被调查者对所给出的问题答案选择其中的一项

多项选择型:要求被调查者对所给出的问题答案中,选出自己认为合适的答案,数量不受限制限制选择型:要求被调查者在所给出的问题答案中,选出自己认为合适的答案,但数量要受一定限制

封闭性问题

(单项选择法实例)

单项选择型

您觉得哪种类型的广告宣传效果最好?

(选一项)1.电视广告

2.广播广告

3.杂志广告

4.报纸广告

5.路牌广告封闭性问题

(多项选择法实例)

多项选择型

请问您在购买小轿车时,主要考虑哪些因素?

(选出您认为合适的答案)1.价格6.维修费用

2.款式7.乘坐舒适

3.品牌8.行使平稳

4.耗油量9.加速性能

5.售后服务10.制动性能

封闭性问题

(顺序选择法)问题答案有多个,要求被调查者在回答时,对所选的答案按要求的顺序或重要程度加以排列。其中,对所选的的答案数量可以进行一定的限制,也可以不进行限制问题答案不仅可以反映所要调查的内容,而且可以反映出被调查者对问题的看法,从而增加了信息量

您在购买这种牌子的电视机时,主要是考虑哪些因素?

1.产品的品牌

2.价格合理

3.售后服务

4.外形美观

5.维修方便(按重要程度进行排序)封闭性问题

(评定尺度法)

问题答案,由表示不同等级的形容词组成,并按照一定的程度排序,由被调查者依次选择

您对这种新款轿车是否感到满意?

1.非常满意;2.比较满意;3.一般

4.不太满意;5.不满意。

封闭性问题

(双向列联法)将两类不同问题综合到一起,通常用表格来表现表的横向是一类问题,纵向是另一类问题这种问题结构可以反映两方面因素的综合作用,提供单一类型问题无法提供的信息可以节省问卷的篇幅封闭性问题

(双向列联法实例)神龙富康捷

达桑塔纳1.

耗油量低2.

外观大方3.

乘坐舒适4.

整车价格合理5.

驾驶容易6.

制动性好7.

维修方便8.

零配件齐全9.

故障率低10.

售后服务周到请在您赞同项目的空格内划“√”问题顺序的设计问题顺序的设计问题的安排应具有逻辑性问题的顺序应先易后难能引起被调查者兴趣的问题放在前面开放性问题放在后面版面格式的设计问卷的结构安排要合理,问卷的主体部分要突出、醒目不要编排过密,各问题之间要留出一定的空间外表及内容的印刷要美观第四节收集数据时的误差收集数据时的误差抽样误差抽样框误差计量误差未响应误差非抽样误差响应误差误差是指估计值与真实值之间的差异。抽样误差(Samplingerror):由于抽选样本的随机性造成的误差,也称为代表性误差。——样本只是总体的一部分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论