如何合理选择抽样样本数_第1页
如何合理选择抽样样本数_第2页
如何合理选择抽样样本数_第3页
如何合理选择抽样样本数_第4页
如何合理选择抽样样本数_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、如何合理选择抽样样本数一、研究介绍  研究背景:众所周知,抽样样本数的大小对调查结果的准确度有很大的影响,从统计上可以计算出每个抽样样本数所对应的抽样误差有多少。但大多数客户对抽样误差缺乏直观的感觉,无法清晰了解应该选择多大的抽样误差才能满足自己的实际需求,因此也就无从有效控制成本。另外,对于定性研究来说,也需要采用另外的指标来衡量多大的样本量才能满足定性研究的需求。因此,达闻通用的研究人员计划通过对现有数据的分析来帮助解决这两个问题。 研究课题:1. 定性研究应该采用多大的样本量才能有效解决问题?2. 定量研究中,采用不同数量的抽样样本,可达到怎样的研究效果?&

2、#160;研究方法:我们以过往某个调查项目的总样本数(4450样本)为母体样本,从中分别随机抽取5样本,10样本,20样本,30样本,50样本,80样本,100样本,200样本,300样本来比较其结果,为了充分了解每种样本量的抽样结果,每种样本量重复抽取30次。对比的问题指标为:不提示品牌知名度。二、 研究的主要结论:样本量特点5l 只能获得一半的答案。l 保证得到前2个主要的答案。10l 答案获得率达到70%。l 保证得到前5个主要的答案。15l 答案获得率达到80%。l 保证得到前8个主要的答案。ð 建议作为定性研究的最低样本量。20l 答案获得率达到85%。l 保证获得前10个

3、主要的答案。30l 答案获得率达到90%。l 保证获得前12个主要的答案。l 可粗略量化分辨出高、中、低结果ð 建议作为定量研究中一个细分配额的最低样本数。50l 答案获得率,精确度比30样本量要高一些。100l 答案获得率接近100%。l 抽样误差约为+10%,调查结果可以反映市场的大体情况,但数据排名仍然有一定的误差。ð 建议用于项目中各分城市的最低样本数。150l 抽样误差比100样本量略佳,调查结果更接近现实,不过差别不会太大  200l 答案获得率稳定为100%。l 抽样误差缩小至约为+7%,结果很接近真实值,但多次抽样结果仍然有结果不稳定的情况。

4、40; 建议用于市场描述性或问题诊断性研究项目,但不适合用于连续跟踪性的研究300l 抽样误差为+5.4%,调查结果基本上与现实一致,数据准确度和稳定性都很好。ð 建议作为U&A研究和各类跟踪性研究的基础样本。 三、 详细研究分析(一)定性样本需求分析1、答案获得率分析概念:答案获得率是指在调查中的答案个数与实际总体答案个数的比例。定性研究是属于探测性研究,因此不太在乎量化的数据,而会更关注能否获得足够的答案数以供进一步的定量研究,也就是说答案获得率是否足够。在本次研究中,采用的4450个母体样本中,果汁品牌共有17个,也就是说实际总体答案个数就是17个。因此,我们

5、只需要对比每种抽样样本量下的平均答案个数,就可以知道该抽样样本量的答案获得率。统计结果如下表:   从上面图表可得出,5样本的调查仅能拿到一半的答案,10样本获得七成的答案,15样本可得到80%的答案,而30样本是拐点,再得到90%的答案后,再增加样本量对答案获得率的帮助不大。 2、主要答案获得率 进一步分析,我们需要了解各种抽样样本是否能得到主要的答案。下面是17个果汁品牌的不提示知名度,不提示知名度的高低代表了这个品牌的广泛性。以下是每种样本量下的各答案获得率。从图中可以看到,5样本量只能保证获得知名度最高的两个品牌,而10样本量可以保证获

6、得不提示知名度在20%以上的5个品牌,而15样本量及30样本量可以保证获得不提示知名度在10%以上的品牌。  3、小结 综合前面两点分析,我们可得出结论:定性研究最低需要15样本或2组座谈会的量,才能获得大部分的答案并覆盖到主要的答案。如果需要对比研究细分群体,则每个细分群体也应该最少是2组座谈会放可保证效果。 (二)定量样本需求分析 (1)抽样误差分析 抽样误差是评估样本量的一个常用指标,我们的研究人员计算出了在95%的置信程度下各样本量的抽样误差,具体结果如下图:  (2)实际的调查结果分析 知道了抽

7、样误差,大多数客户仍然很难知道应该如何根据实际情况选择抽样样本数。因此,我们在这部分会用图像来展示各种抽样样本量的调查结果,去更好地了解不同样本量可达到的研究效果。 1、20样本: 调查结果与真实值相差很大,基本不能反映统计意义  2、30样本:调查结果基本可以分出高、中、低的区别,但多数值与真实值有一定的误差 3、50样本:调查结果同样可以分出高、中、低的区别,但有2-3个数值会与真实值有较大背离 4. 、100样本:调查结果开始接近现实,能反映市场大致情况,但数据排名的稳定性不够,不能作为跟踪对比的依据 5、150样本量 :调查结

8、果更接近现实,误差明显减少,但仍然不够稳定。 6、200样本量 :调查结果相当接近真实情况,30次可能会有一次与真实的排名有误差。7、300样本量:调查结果基本上与现实一致,是非常优秀的定量研究调查样本量  (3)小结30-50样本可作为量化分辨高、中、低结果的基本样本。当样本量达到100的时候,抽样的调查情况可以反映市场的大体情况,但作为排名的结果依据仍然不充分。而样本量上升至200的时候,结果很接近真实值,但多次抽样结果仍然有不稳定的情况,用于跟踪研究并不太妥当。300的样本量在准确性及稳定性都相当好,是优秀的定量研究样本量。总结综合以上所述,下表整理了我们所

9、研究的各个样本量的特点以及可以达到的研究效果: 样本量特点5l 只能获得一半的答案。l 保证得到前2个主要的答案。10l 答案获得率达到70%。l 保证得到前5个主要的答案。15l 答案获得率达到80%。l 保证得到前8个主要的答案。ð 建议作为定性研究的最低样本量。20l 答案获得率达到85%。l 保证获得前10个主要的答案。30l 答案获得率达到90%。l 保证获得前12个主要的答案。l 可粗略量化分辨出高、中、低结果ð 建议作为定量研究中一个细分配额的最低样本数。50l 答案获得率,精确度比30样本量要高一些。100l 答案获得率接近100%。l 抽样误差约为+10%,调查结果可以反映市场的大体情况,但数据排名仍然有一定的误差。ð 建议用于项目中各分城市的最低样本数。150l 抽样误差比100样本量略佳,调查结果更接近现实,不过差别不会太大  200l 答案获得率稳定为100%。l 抽样误差缩小至约为+7%,结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论