版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
市场调查课程第七章抽样设计(二)学习目标理解抽样调查中的特点熟悉抽样的基本概念了解抽样设计的一般流程区分概率抽样与非概率抽样,以及各自的优缺点了解常用的几种概率抽样方法与非概率抽样方法理解抽样误差(样本代表性)的概念、测度和计算方法理解样本容量的影响因素,了解样本量的计算方法了解网络调查中的抽样方法
本讲内容3抽样调查的特点01抽样设计的流程和内容02概率抽样方式0304非概率抽样方式05抽样中的误差问题06样本量的确定07网络抽样非概率抽样方式045非概率抽样是指抽选样本时不是依据随机原则,而是根据方便原则或研究人员的主观判断选择样本。在市场调查中由于客观条件的限制,比如调查经费有限或没有适当的抽样框,难以采用概率抽样等等原因,总之,非概率抽样都是在对抽样误差没有要求、不必对总体参数进行区间估计的条件下使用的。非概率抽样方式方便抽样6方便抽样就是依据方便原则抽取样本,最典型的方便抽样就是拦截式调查,即在街边或居民小区内拦住行人进行调查。方便抽样操作简便,能及时取得所需要的信息,节省调查经费。方便抽样的主要局限在于:样本信息无法代表总体,即不能根据样本信息对总体进行任何推论,因而方便样本不适合描述性研究和因果关系研究,更适合探索性研究、通过调查发现问题,产生想法和假设。方便抽样也可以用于正式调查前的预调查。判断抽样7是指抽取样本时,由调查人员依据对实际情况的了解和经验,人为确定样本单位。如何确定样本单位取决于调查的目的。①欲了解总体平均水平的大体位置,则选择平均型样本;②选择众数型样本,即在调查总体中选择能够反映大多数单位情况的个体为样本。③欲分析研究特殊样本产生的原因时,则选择特殊型样本,如选择很好(高)的或很差(低)的典型单位为样本。判断抽样简便、快捷,节省费用,符合调查目的和特殊需要。但因为样本选择是主观的,所以样本的质量取决于挑选人员的经验、专业知识和对情况的了解。判断抽样的目的多在于了解总体的数量特征和对问题的深入分析,而不是利用调查结果对总体参数进行估计。配额抽样①8与分层抽样相似,配额抽样也是对总体所有单位按某种标准分层,将样本分配到各层中。但它们也有明显的区别:分层抽样是按随机原则在各层中抽取样本,属于概率抽样;而配额抽样样本的抽取不是随机的,是根据调查人员的主观判断或方便原则抽取的样本,所以配额抽样属于非概率抽样。配额抽样不需要抽样框,还能保证样本结构与总体结构的一致,所以在市场调查中得到广泛应用,同时它也具备非概率抽样方式的共有特征。配额抽样是指将总体中的各单位按一定标准划分为若干个类别,将样本数额分配到各类别中,在规定的数额内由调查人员任意抽选样本。配额抽样②9表7-2是单一变量控制的例子:在一个城市中欲采用配额抽样抽出一个n=500的样本。控制变量有年龄和性别,配额是按单个变量分别分配的。如各个年龄段上的配额和性别的配额。这种配额抽样操作比较简便,但有可能出现偏斜,例如年龄小的均为女性,年龄大的均为男性。在配额抽样中可以按单一变量控制,也可以按交叉变量控制。交叉变量控制配额可以保证样本的分布更为均匀,更具有代表性,但现场调查中操作的难度要大些。表7-2
单一变量控制配额分配表年龄人数20~30岁15030~40岁15040~50岁10050岁以上100合计500性别人数男250女250合计500表7-3
交叉变量控制配额分配表年龄性别男女合计20~30岁708015030~40岁757515040~50岁554510050岁以上5050100合计250250500自愿样本10自愿样本的样本集中于某些特定群体,只有能够接触到调查问卷的那些人才有机会参与调查;构成样本的那些单位往往对调查内容感兴趣,并愿意陈述自己的看法,所以这类调查其样本结构具有独特性,通常与总体结构相去甚远,因而调查结果不能反映总体状况。但这种自愿参与性的调查组织方便、成本低廉,且参与者大多是对调查内容的关心者,调查人员能够了解这个特定群体的意见和看法,这对于了解情况、分析问题、查找原因都是十分重要的信息。自愿样本的例子有很多,比如饭店的餐桌上的调查表,就餐者可以自愿填答;飞机上有乘务员向乘客发放调查表,乘客自愿参与调查;还有一些网络调查也是构造自愿样本的另一途径,这些都是自愿样本。自愿样本不是经过抽取,而是由自愿接受调查的单位所组成的样本。例如:在荷兰的两个相似并相邻的地区分别采取两种抽样调查方法调查青少年的健康状况。在特温特地区研究机构联系了所有的59所学校,结果有39所学校参与了该项调查,这些学校的样本学生被要求在一节课(大约45分钟)内完成在线问卷,因而该地区的样本被称为强制性样本。在艾瑟兰地区分层抽取的样本城市中,通过邮寄在线问卷链接的方式招募青少年参与调查,因而该地区的样本被称为自愿样本。调查结果显示,自愿抽样方式的无回答率很高,自我报告的健康变量——烟草消费、酒精消费、心理健康、主观健康状况等被低估。抽样中的误差问题05只要是调查就一定有误差,误差或大或小总是存在的,不可能完全避免。由于产生误差的原因不同,误差的性质不同,因此有描述误差的各种概念12描述误差的概念①估计量方差
偏差
偏差与估计量方差不同,偏差属于偏于某个方向的系统性误差;而估计量方差是随机性误差,没有系统性。且估计量方差可以随着样本量的增大而减小,而大多数的偏差(少数有偏估计量除外)并不随着样本量的增大而减小。因此如果用样本推断总体,在有偏差的情况下,无论怎样增大样本量,都不可能有效地提高估计的精确度只要是调查就一定有误差,误差或大或小总是存在的,不可能完全避免。由于产生误差的原因不同,误差的性质不同,因此有描述误差的各种概念13描述误差的概念②均方误差
抽样误差是由抽样的随机性造成的,是用样本统计量估计总体参数时出现的误差。14抽样误差①
允许误差也常用于描述抽样调查的误差。15抽样误差②
16抽样误差的影响因素抽样误差与总体分布状况有关,总体各单位之间差异越大,即总体方差越大,抽样误差就越大抽样误差与样本量有关,在其他条件相同的情况下,样本量越大,抽样误差就越小抽样误差与抽样方式和估计方式有关,例如分层抽样的估计精度高于简单随机抽样。在有辅助信息的条件下,比率估计、回归估计也可以有效地减小抽样误差。抽样误差的最大特点是它的可计算性。抽样误差虽然无法避免,但调查人员可以知道抽样误差有多大,并采用适当的方式(如增大样本量)对其进行控制。
非抽样误差是指除抽样误差以外,由其他原因引起的样本统计量与总体真值之间的差异。非抽样误差产生的原因主要有以下几种:17非抽样误差①①抽样框误差②无回答误差例如,用工商局签发的营业执照作为个体商业调查的抽样框,对个体商业单位实施抽样调查,但无照经营的个体商贩就会被漏掉,凡此种种都是由抽样框不完善造成的,故称其为抽样框误差。一类是由于随机因素造成的,减少了有效样本量。造成估计量方差增大另一类是非随机因素的影响调查的结果中只有回答者的信息,却没有无回答者的信息。这种无回答不仅造成估计量方差增大,还会带来估计偏差。③测量误差又称计量误差,主要来源于调查人员、受访者、调查问卷等原因。主要有以下几种:理解:由于问卷的原因或受访者自身的原因,让受访者在对调查问题的理解上有偏误记忆:对调查的问题,受访者记忆模糊,回答结果与事实有出入有意隐瞒:这种情况往往带来较大的偏差,对调查结果的危害最大。【误差问题小结】本节对抽样中的误差问题的讨论是从两个方面展开的。18从误差的性质上看,可以分为估计量方差、偏差和均方误差。估计量方差是一种随机性误差,描述了样本统计量的分布状况,是评价概率样本估计精度的重要指标。估计偏差则是一种系统性误差,其偏误具有特定的方向,且不会随着样本量的增大而减小(少数有偏估计量除外)。均方误差则是估计量方差与偏差平方之和。均方误差是综合评价估计量优劣的一个指标。在估计量性质的讨论范围内,如果一个估计量是无偏估计量,则该估计量的方差与均方误差相等。从误差的类型上看,可以分为抽样误差和非抽样误差。抽样误差是由抽样的随机性引起的,所以只是在概率抽样中才涉及抽样误差的问题。估计量方差是反映抽样误差的一个重要指标。此外,抽样误差也可以用抽样标准误差(估计量方差的平方根)表示。抽样误差随样本量的增大而减小,可以计量并且能够通过抽样方式和样本量加以控制。非抽样误差是除抽样误差外由其他各种因素造成的误差。非抽样误差与抽样的随机性无关,可以存在于各种类型的调查方式之中。样本量的确定0620影响样本量的因素①①调查精度②总体变异程度
总体的变异程度用总体方差表示。在其他条件相同的情况下,总体的变异程度越大,所需要的样本量越大。
③总体的规模小规模和中等规模的总体,其规模大小对样本量的需求会产生一些影响,而大规模的总体对样本量的需求则几乎没有影响。规模很小的总体逐渐扩大,为保证相同估计精度,样本量也会随之增大(但不是同比例的)。当总体规模达到很大程度时,随着规模的继续扩大,样本量却几乎可以维持不变。大规模总体中的抽样比𝑛/𝑁要远远低于小规模总体中的抽样比。21影响样本量的因素②④无回答情况⑤调查经费无回答减少了有效样本量。在无回答率较高的调查项目中,样本量要大一些,以减少无回答带来的影响。同时,调查的限定时间、实施调查的人力资源也是影响样本量的客观因素。调查经费是影响样本量的一个十分重要的因素。样本量是调查经费与调查精度之间的某种折中和平衡。22确定样本量的方法非概率抽样概率抽样非概率抽样的目的主要在于进行探索性研究,而不是用样本数据对总体进行数量上的推算。所以样本量的确定主要是根据主观判断和从事实际调查的经验,这样就具有一定的随意性。概率抽样的样本量则是在计算的基础上确定的。在其他客观条件已定情况下,样本量的确定主要在于对估计精度的要求。这取决于估计量的用途和使用者可以接受的误差范围,还需要考虑是否需要对调查的子总体进行估计。在抽样调查中,对于概率抽样和非概率抽样,确定样本量的方法是不同的:23样本量的计算①
由于概率抽样中有不同的抽样方式,对不同的抽样方式,样本量的计算方式是不同的。24样本量的计算②
25样本量的计算③
26样本量的计算④
27两个扩展阅读二维码预留二维码预留网络抽样0729是一种借助互联网采集调查数据的方式。它将具有某类特征的网民构成的总体作为研究对象,按照随机或非随机方法抽取一部分网民作为研究样本。网络调查的主要方式包括:①电子邮件方式;②网页调查方式;③在线调查方式。网络调查常用的抽样技术有:在线固定样本组抽样((onlinePanelSurvey),在线随机拦截抽样,自我选择式调查(Self-SelectedSurvey)、滚雪球抽样(SnowballSampling)和受访者驱动抽样(RespondentDrivenSampling)。网络调查30网络调查的抽样技术①指市场调查公司为其特定的在线调研目的,根据一定的方式向网民发送邀请,以招募大量的网民建立网络受访者志愿者数据库(固定样本组),志愿者网民在网上提交基本的辅助信息,以方便调查公司根据一定的原则抽选样本实施调查。在线固定样本组抽样是指调查人员在网络平台上以网页弹窗、邮件、社交媒体等形式,贴出或发送问卷链接,网民在访问该平台的过程中,根据自己的时间、对该问卷调查主题的感兴趣程度等因素决定参与或者不参与该调查自愿网络抽样可以视为两阶段抽样,在第一阶段中选择不同的网络平台,第二阶段则从选中的网络平台上选取网络样本单元。但由于入样概率无法控制,所以无法保证自愿网络样本对目标总体推断的有效性。自愿网络抽样31网络调查的抽样技术②指对网站访问者的随机选择。这种方法是依据访问者访问网站的时间、或从访问者流中随机选择,具体方法可能是简单随机抽样,随机起点固定间距的系统抽样,也可能是分层随机抽样,非概率拦截抽样等。在线随机拦截抽样
是指研究人员通过非概率抽样方法,从目标总体中选取符合研究目的且可以上网的初始受访者,然后通过网络社交工具,分享网页版调查问卷,每个被选中的初始受访者从自己的人际关系中推荐一定数量网民形成第二波受访者,第二波受访者继续推荐形成第三波受访者,直至满足一定的样本量。雪球抽样属于非概率抽样,往往受初始点的影响较大,且调查数据具有一定的群内单元相关的特征。滚雪球抽样32网络调查的抽样技术③RDS在抽样方式上沿袭了滚雪球抽样的基本形式并进行改进。RDS也是先用非概率抽样方法选取一定数量的、符合研究目的的受访者作为初始种子;对“种子”进行调查之后,给每个“种子”发放若干张招募券(通常为2或3),请其分配给与其邻接的目标总体单元;接受招募券和调查访问的样本单元成为下一轮次的招募者,以此类推,直至获取到预设的样本量。随着招募轮次的不断推进,无论种子的特征如何,经过足够多轮次的招募,样本将达到平衡状态,最终获得的样本可以看成概率样本。受访者驱动抽样(RDS)
总体样本抽取估计图7-2传统抽样方法与RDS方法的区别总体样本社会网络估计估计抽取传统抽样方法RDS方法33网络调查的特点与传统统计调查方法相比,网络调查的特点可以归纳为:使调查的空间扩大,不受时间限制,不受时差影响;大大提高调查的时效性;可以降低统计调查的成本;可以减少统计调查的故意回答误差与计量误差;使调查问卷设计灵活性大大提高、可用技巧增多。网络调查同样存在一定的局限性:绝大多数的网络调查都采用了非概率抽样,难以估计网络调查样本推断总体的数量特征的误差。网络调查的结论只反映部分总体单元,自愿样本的有偏性、自填问卷的数据真实性、网络安全因素等都可能影响调查结果的可靠性。【小结1】34抽样调查中要正确识别总体、总体参数、抽样框,,准确把握概率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年施工项目部《春节节后复工复产》工作专项方案 (3份)
- 小学数学四年级上册《你知道吗-加法交换律和交换律》知识要点
- 小学四年级数学上册全册错题集练习试题第三单元 混合运算
- 小学数学二年级加减法练习题
- 扬州会议高考语文阅读理解
- 高考语文试题分类汇编语句衔接
- 人力资源管理在酒店行业的应用
- 金融投资行业顾问心得分享
- 在变化中寻找机遇的方法计划
- 班主任工作培训总结加强教学管理及学科指导
- 矿业公司规章制度汇编
- 《高低压配电室施工工艺标准》
- 2024年太阳能光伏组件高空清洗作业人员安全保障合同3篇
- 大学学业规划讲座
- 《国家课程建设》课件
- 四川省南充市2023-2024学年高一上学期期末考试 历史 含解析
- 新教科版小学1-6年级科学需做实验目录
- 2024年贵州贵阳市贵安新区产业发展控股集团有限公司招聘笔试参考题库含答案解析
- 福建省厦门市2023-2024学年高二上学期期末考试语文试题(解析版)
- 美国RAZ分级读物目录整理
- 中科院大连化物所模板PPT课件
评论
0/150
提交评论