第十一章抽样设计_第1页
第十一章抽样设计_第2页
第十一章抽样设计_第3页
第十一章抽样设计_第4页
第十一章抽样设计_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第11章抽样设计

1开篇案例:两种抽样两种命运防弹钢板应焊在哪里?减少轰炸机的伤亡,就要往飞机上焊防弹钢板;但不是机身全部而是某些部分。数学家沃尔德的方法十分简单。他把统计表发给地勤技师,让他们把顺利返回的飞机上中弹弹孔的位置报上来。他自己铺开一张大纸,画出轰炸机的轮廓,再把那些小窟窿一个个地填上去。画完后大家一看,飞机浑身上下都是窟窿,只有飞行员座舱和尾翼两个地方几乎是空白。数学家沃尔德为什么要这样?防弹钢板应该焊在哪里呢?2

沃尔德告诉大家,从数学家的眼光来看,这张图明显不符合概率分布的规律,而明显违反规律的地方往往就是问题的关键。

飞行员们最终明白了数学家沃尔德这套做法的意义。飞行员座舱或者飞机尾翼中弹,轰炸机多半就会掉下来。难怪顺利返航的轰炸机只有这两处几乎没有中弹。所以:钢板应该焊在哪里呢?3案例2:《文学摘要》的厄运预测结果实际结果阿尔夫·伦敦55%阿尔夫·伦敦37%富兰克林·罗斯福41%富兰克林·罗斯福61%自1912年开始进行民意测验预测美国总统选举,其民意测验以精确性著称,因为它成功预测了美国1912年到1932年之间的历次总统选举。

1936年,美国著名的《文学摘要》杂志社为了预测总统候选人罗斯福与兰登两人谁能当选。杂志社对240万人进行了调查,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封调查信,回收200万封。在统计史上,这是少有的样本容量。花费了大量的人力、物力,预测兰登将会当选,而刚起步不久的盖洛普公司仅对5万人进行了调查,认为罗斯福将会当选。最终的调查结果证实了盖洛普的预测,不久,《文学摘要》杂志也倒闭了。4

抽样框架选择的错误。它借助了俱乐部的名单和电话号码簿,从中获得1000万人的地址,将问卷邮寄给他们,当时美国正处于经济萧条时期,拥有电话和加入俱乐部的人显然是富裕阶层,而这些人大部分是共和党的支撑者。这种抽样方式排斥了穷人进入样本的可能性,而当时罗斯福的新政是有利于穷人而非富人的,从而使样本缺乏了代表性,所以得出的结论是错误的。

失败原因:5上述两个案例都涉及同一个重要问题——抽样问题。但是处理方式不同,导致两种完全不同的结果——一个有效地解决问题,另一个被问题所拖累,破产倒闭了。

6盖洛普为什么能成功?其成功归因于他们所采用的与传统抽样方法不同的配额抽样法。配额抽样以总体特征为基础对总体进行分类,比如男性占比例,女性占比例,以及不同收入、年龄的人群又占多少比例等;然后按分类比例来选择各类人作为被调查者,比如选一定比例的富人、黑人、都市女性等。根据这样的比例来了解各类型民众的意见,就使样本具有了较高的代表性。应用这种方法,盖洛普又成功地预测了1940和1944年的美国总统大选的结果,使其声明鹊起,几乎成为民意调查的代名词。7【补充阅读资料】现代抽样方法的先驱—盖洛普盖洛普指出,当抽样计划中的调查对象涵盖广泛,涉及到不同地域、不同种族、不同经济层次的各种人时,你只需随机抽取而无需采访每个人。尽管当时他的方法不能为每个人理解和认同,但是现在,这已经被广泛使用。盖洛普通常引出一些特例来解释他自己在说什么或做什么。假设有7000个白豆子和3000个黑豆子十分均匀地混合在一起,装在一个桶里。当你舀出100个时,你大约可以拿到70个白豆子和30个黑豆子,而且你失误的机率可以用数学方法计算出来。只要桶里的豆子多于一把,那么你出错的机率就少于3%。30年代早期,盖洛普在全国很受欢迎。他从事美国东北部报刊的读者调查。1932年夏天,一家新的广告代理商电扬广告公司,邀请他去纽约创立一个旨在评估广告效果的调查部门,并制定一套调查方案。同年,他利用他的民意测验法帮助他的岳母竞选艾奥瓦州议员。这使他确信他的抽样调查方法不仅在数豆子和报刊读者调查方面有效,并有助于选举人。只要你了解到抽样范围具有广泛性,白人、黑人,男性、女性,富有、贫穷,城市、郊区,共和党、民主党,只要有一部分人代表他们所属的总体,你就可以通过采访相对少的一部分人,来预测选举结果或反映公众对其关心问题的态度。盖洛普证实,通过科学抽样,可以准确地估测出总体的指标。同时,在抽样过程中,可以节省大量资金。88.1

抽样调查与抽样设计普查获得了解某一事物比较全面、精确的数据或资料。如人口普查、工业普查、农业普查。普查原则:标准的时间点,统一调查项目,统一的步骤和方法。抽查不可能进行全面调查时。例,具有破坏性或损耗性的产品质量检验,灯泡使用寿命测量、新药疗效检验、产品的消费者测试等。不必进行全面调查时。如城乡收支调查为节省费用。对资料进行检查和修正时。98.1

抽样调查与抽样设计为什么选择抽样调查?抽样调查的相对优势①时间短、收效快。②质量高、可信程度好。③费用省、易推广。抽样调查的相对劣势不支持小区域估计不支持稀少个体的特征估计抽样误差其它考虑10抽样调查相关基本概念

总体(Thepopulation)

:根据一定研究目的而规定的所要调查对象的全体所组成的集合。是某些同质特征或共性的所有元素的集合。总体的数目一般用N表示。

样本(Thesample)是总体的一部分,由总体中按一定程序抽得的部分个体。个体是指总体中的每一个考察对象。

样本容量:样本中个体的数量。常用n表示11

市场调研

日期10.30~11.211.1~311.1~311.2~311.2~311.3~411.3~4选举结果主办机构NewYorkTimes(纽约时报)Reuter(路透社)HarrisPoll(哈里斯民意测验)ABC(美国广播公司)NBC(国家广播公司)USAToday(今日美国报)Gallup(盖洛普公司)克林顿5449515251515149多尔3541393938383840佩罗特98979999其他22122222候选人得票百分比案例:美国1996年大选调查研究总体:美国全体选民调查访问样本:2000名选民(11月5日公布)12抽样框将抽样单位按一定顺序排列编制的名单。在抽样设计时,

必须有一份全部抽样单位的资料,这份资料就是抽样框,也叫总体的数据目录或名单。是抽样设计人员用来进行抽取样本的工具,从中可以抽取到样本。具体表现形式:人员名单、企业名录、电话号码、地图和居民户籍等。

13抽样误差抽样误差是指造成调查结果偏离真实结果的不稳定因素。包括:技术性误差,指存在于测量过程中对结果造成影响的因素;包括:处理过程误差,回答误差,测量工具误差,访谈员误差等。系统误差,指抽样没有严格按照随机原则造成,样本与总体的不一致造成的误差。14【小思考】抽样调查中是否一定存在抽样误差,能否控制?答:抽样误差是客观存在和不可避免的,但误差的大小是可以控制的。可通过选定不同的抽样方法及样本数目来控制误差;另外,加强对抽样调查的组织领导,也可提高抽样调查的工作质量。15【小思考】欲调查洛阳市大学生的身高,本次调查中,总体、样本、总体单位、抽样单位、抽样框分别是什么答:全市的大学生就是总体,总体单位是每一个大学生。由于总体比较大,又缺乏全市大学生名单这一抽样框,因此,抽几个大学作为样本,这时每个大学就是抽样单位,抽样框是洛阳市的大学名单。16抽样设计抽样设计就是从一定总体抽取样本资料以前,预先确定抽样程序和方案,在保证所抽选的样本对总体有充分代表性的前提下,力求取得最经济、最有效的结果。抽样设计的任务就是依据调查的目的,在给定的人力、物力、财力等条件下,在从所要调查的总体中抽取样本资料以前,设计一个精度高且能够由样本正确推断总体的良好的抽样调查方案,力求取得最经济、最有效的结果。17

8.2抽样设计的基本程序界定调查总体选择抽样框确定抽样方法决定样本大小评估样本正误抽取样本

市场调研

18程序1.界定目标总体如果不确定调查总体,就无法明确样本是谁的部分单位,也无法说明用样本特征所要推断的是谁。目标总体是指由研究对象的全体单位构成的集合。简称总体。构成总体的每一个具体单位称为总体单位,简称个体。总体按所包含的个体数目是否有限分为有限总体和无限总体。称有限总体包含的个体数目为总体容量,记为N。例如,一家公司一年的汽车销售量、一个地区的人口等都构成有限总体,但是一个湖泊、海洋有多少尾鱼、一个森林有多少株树等,构成无限总体。市场调查所研究的总体绝大部分是有限总体。19程序1.界定目标总体

定义目标总体的四个因素:抽样单位:总体中个体类型,个人、家庭还是企业单位或其他什么类型;抽样元素:个体的特征,包括人口统计特征、行为甚至心理特征等;抽样范围:个体的地理位置,即区域范围;抽样时间:调查的标准时点或时期。例如:1999年12月31日前,所有居住在中国境内,且年龄在15岁以上的个人。20调查总体的定义例如,“在过去三年里,在中国境内,所有购买过我们产品的机关、部队、学校、企业和事业单位”例,在企业关于某商品价格的调查中,调查总体可定义为“从2013年1月15日到30日之间,洛阳市各大百货商店中每一种竞争品牌的价格。”21调研者须区分目标总体与抽样总体。

抽样总体是指从总体中抽选出来的个体所组成的集合,简称样本,构成样本的个体数目称为样本容量,记为n。样本容量n与总体容量N相比是个很小的数,往往是百分之几或千分之几,比例最大时样本容量n一般也不超过总体容量N的1/3。在统计中,一般把抽取30个以上个体,即n≧30的样本,叫做大样本,而把抽取30个以下个体,即n<30的样本,称为小样本。市场调查的抽样推断通常采用大样本。22调研者还须区分抽样单位与总体单位。

总体单位:例如,牙膏以支为单位。人数以个为单位抽样单位与总体单位在形式上可能一致也可能不一致。例:抽查时以箱为单位来检查,则抽样单位为箱。抽样时按街道来抽取,则街道就为抽样单位。按大学来抽取,则大学就是抽样单位。23

市场调研

对总体的范围与界限做明确的规定。调查总体可从以下几个方面进行描述:地域特征、人口统计学特征、产品或服务使用情况、认知特征等。(抽样元素、抽样单位、抽样范围、抽样时间)界定调查总体可通过调查表的过滤性问题确定被调查者是否属于调查总体。24

市场调研

第四节抽样调查的基本程序依据已明确界定的总体范围,收集总体中所有样本单位的名单,建立供抽样使用的抽样框。(完整、不重复)问:为了解重庆市中学生的饮料消费情况,需要从全市500所中学中抽取10所中学,再从每所抽中的中学中抽取3个班级,最后从每个抽中的班级中抽取10名中学生。需要选择哪些抽样框?答:分别收集三个不同层次的抽样框:全市500所中学的名单、每所抽中的中学里所有班级的名单、每个抽中的班级中所有学生的名单。:二、选择抽样框以合理的成本选择误差最小的抽样框25

程序2:制定抽样框架抽样框架:供抽样使用的所有调查单位的名单。抽样单元:为了便于抽样,通常把总体划分为有限个互不重迭又穷尽的部分,每个部分称为一个抽样单元。一个抽样框架应该包括下述部分或全部内容:识别资料:如姓名、家庭住址、身份证号码等;联系资料:确定个体所在位置的项目:地址/电话;分类资料:提供区分调查对象的有用信息;维护资料:像日期以及资料的变更信息等;识别和联系资料是不可少的,而分类和维护资料有助于提高抽样的效率。26抽样框架的评估

抽样框架的可能缺陷不完全涵盖过涵盖重复分类错误27

市场调研

第四节抽样调查的基本程序依据研究目的的要求、各种抽样方法的特点,以及其他限制因素决定采用哪种抽样方法。三、确定抽样方法考虑调查精确度的要求、总体性质、抽样方法和人力、财力等客观条件确定样本的大小。其原则是:“代价小,代表性高。”四、决定样本量的大小28

市场调研

第四节抽样调查的基本程序在上述几个步骤的基础上,严格按照所选定的抽样方法和数量,从抽样框中抽取一个个的样本单位,构成样本。五、抽取样本29

市场调研

第四节抽样调查的基本程序对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于样本与总体偏差过大而导致失误。

六、评估样本正误

其基本方法是:将可得到的总体资料(如人口普查资料),与样本中的同类指标进行对比。通常使用两个或两个以上的标准。总体特征男生78%女生22%本省64%外省36%样本特征男生76%女生24%本省67%外省33%308.3抽样方法0实验法

非随机抽样抽样技术

随机抽样等距抽样简单随机抽样分层随机抽样整群抽样多阶段抽样方便抽样判断抽样配额抽样滚雪球抽样31一、随机抽样

依据概率论的基本原理进行抽样,使总体中的每个样本单位都有一个已知的、均等机会被选入样本中,从而避免抽样过程的人为误差,也称为概率抽样。

市场调研

第二节抽样调查方法32

市场调研

第二节抽样调查方法(一)简单随机抽样1、含义

从总体中不加任何分组、排队,完全按照随机原则抽取样本单位,使每个样本单位被抽到的概率完全相等。又称纯随机抽样、简单任意抽样。33简单随机抽样

适应于调研总体中各个体之间差异较小且各个体数目较少的情况,或者调查对象不明,难以分组、分类时的情况。常用方法(1)抽签法:a、先编号b、再把相应号码写在卡片上c、任意抽选,直到抽足规定样本数适用于调查总数中个体数目少的情况。34

市场调研

第二节抽样调查方法2、操作办法(1)随机数表法:先将样本单位编号,再使用由0--9十个数字按完全随机顺序(采用数学公式或计算机随机)排列成的表格,抽取符合总体编号的样本单位。35

随机数表(部分)36随机数表(部分)108985776450969249852849136750696110490714759938

4460

0628

8142353672741351275831409388849266488331546535818969044396070170-------------------------------------------------37随机数表依机率抽取。

假定由2000名调查对象,以随机数表随机抽取150名样本,其抽样步骤如下:(1)将2000名调查对象,由0001编至2000等2000个连续编号。(2)由随机数表,利用抽签方法选取号码开始点。例如选取为第三行第一列。(3)由设定之起始点,选取号码,选取号码以调查对象之编号位数相同:即1475,9938,4460,0628,....,有效号码样本2000以下。(4)若抽样单位与随机数表抽样号码条件相同即为样本,大于调查编号,跳过不取。(5)若逢重复号码,亦应跳过。

(6)依上述方法,连续采用150个号码,即为完成样本选用。38(2)抽签法:对各样本单位编号,制作同等规格、不同编号的卡片,充分混匀后随手抽取卡片,所抽取卡片的编号对应的样本单位即组成样本。适合于规模较小的总体。(3)摇号法:使用专门的机器对事先编号的各样本单位进行选择。适合于规模较大的总体。

市场调研

第二节抽样调查方法393、简单随机抽样的优缺点(1)优点直观明了每个样本单位被抽取的概率相同,易估计总体指标适合与其他抽样方法结合使用(2)缺点需要所有样本单位的完整列表、逐一编号、工作量大。忽略总体已有的信息,降低样本的代表性,当调查总体内部差异性较大时就不如分组后再抽样的代表性好。

市场调研

第二节抽样调查方法404、简单随机抽样的适用性总体数量较小易获得所有样本单位的完整列表样本单位之间差异程度较小或难以分组总体在空间范围内较为集中

市场调研

第二节抽样调查方法41分析:总体单位数目为300,样本单位数目为10。利用随机数表进行抽样,其程序如下:第一步:给总体各单位编号,号码的位数要一致,都是三位,不够位的在前加“0”,总体各单位编号是从001-300。第二步:以随机数表中第二行,第三列的数字“0”作起点,往后取两位数字,构成一个与总体单位具有相同位数的号码“093”作为起始号码。第三步:从起始号码开始,从左到右依次抽取10个不重复的位于001-300之间的号码,分别是:093,240,006,120,143,254,085,047,164,148。42例2:某居民区有620户居民,拟抽取15户调查其家庭收入情况。首先需要将居民根据其门牌号码重新编号为1-620。然后确定从随机数表的第二排第三列的数组开始自上而下、自左而右取样。取得的结果是:421,281,266,435,574,520,498,578,567,345,090,149,284,206,04343二、等距抽样1、定义

系统抽样(Systematicsampling):又称等距抽样,就是先将调研总体的各个体按一定标志排列起来,然后按照固定顺序和一定间隔来抽取样本个体。2、排队标志、抽样间隔、抽样起点排队标志按与调查项目无关的标志排队。抽样间隔(距离)=调研总体数(N)/样本数(n)抽样起点确定在第一段距离中,用简单随机抽样方式抽取第一个样本。44

某地区有零售店110户,采用等距离抽样方法抽选11户进行调查。第一步,将总体调查对象(110户零售店)进行编号,即从1号至110号。第二步,确定抽样间隔。已知调查总体N=110,样本数n=11户,故抽样间隔=110/11=10(户)。第三步,确定起抽号数。用10张卡片(即抽样间隔)从1号至10号编号,然后从中随机抽取1张作为起抽数号。如果抽出的是2号,2号则为起抽号数。第四步,确定被抽取单位。从起抽号开始,按照抽样间隔选择样本。本例从2号起每隔10号抽选一个,直至抽足11个为止。计算方法是:22+10=122+10×2=22……2+10×10=102即所抽的单位是编号为2、12、22、32、42、52、62、72、82、92、102的11个零售店。45例如:从1500名居民中抽100名居民作为样本进行消费者调查。采用等距抽样,如何抽取?分析:具体的抽样程序如下:第一步,将1500名居民随机编上号码,1-1500。第二步,计算抽样距离,k=1500/100=15。第三步,确定抽样起点可以用两种方法:方法一,在1-~1500中用随机数表法抽出0862作为第一个被抽中的号码。方法二,在第一段15人(编号为1-15)中用简单随机抽样方法抽出一人,假设其编号为5。第四步,进行等距抽样可以用两种方法:方法一,以862作为起始号码,每隔15人抽取一个号码,当结果大于1500时,减去1500即为抽中的号码,则顺序依次为862,877,892,…,1492,7(1492+15-1500),22,37,…,847。方法二,以5号为起点,每隔15个人抽取一人,则下一段被抽取的号码是20,再下一段是35,依次往下,直到抽满100名(最后一名的号码是1490)为止。46使用等距抽样,有一个非常重要的前提条件,就是总体中各单位的排列顺序必须是随机的(无关标志排队),不存在任何与研究变量相关的规则分布。否则,等距抽样的结果就会产生很大的偏差,主要会导致周期性偏差和顺序偏差。思考题:从600名大学生中抽选50名大学生进行调查,用等距抽样法如何抽取?47系统抽样的优缺点

优点等距离抽样,方法简单,省却了一个个抽样的麻烦,适用于大规模调查。还能使样本均匀地分散在调查总体中,不会集中于某些层次,增加了样本的代表性。是应用最广泛的一种抽样方式。缺点(1)当抽选间隔和被调查对象本身的节奏性(或循环周期)重合时,会影响调查精度。(2)抽样误差计算较复杂。48三、分层随机抽样

1、定义分层抽样:是先将调研总体的所有个体按某一重要标志进行分类(组),然后在各类(组)中采用简单随机抽样方式或系统抽样方式抽取样本个体的一种抽样方式。分层时:层间差异性要明显。要知道各层中的个体数目和比例。分层数目不宜过多。492.分层抽样的过程抽样程序。共分以下四个阶段:1)确定分层变量。即将总体分层按照一定的标准进行,常见的如年龄、性别、行政区等。2)分层。即将总体按照分层变量分成若干层,即N1,N2,N3…,分层是互相排斥(不允许同一单位既可属于这一层,又可属于那一层)且穷尽的(每个单位都归属于一定的层),N=N1+N2+N3+…3)确定各层的样本量。即确定所需要的样本总数n和从总体的各层单位中抽取样本的数n1,n2,n3…,并令n=n1+n2+n3…。4)在各层内部进行抽样。按照随机原则,用简单随机抽样方法或等距抽样方法,从各层中抽取所需的样本数目,各层的样本之和构成了总体的样本。50分层抽样示意母群体总数样本总人数层次二层次一层次三…层次n取样一取样二取样三…取样n513、分层随机抽样的方式等比例分层抽样按各层(或各类)中的个体数目占总体数量的比例分配各层的样本数量。此方式简便易行、分配合理,适应于层内差异较小的情况。非等比例分层抽样不是按各层中个体数占总体数的比例分配样本个数。而是根据其他因素(层内均方差、抽样工作量和费用大小等)调整各层的样本个体数,即有的层可多抽些样本个体,有的可少抽些样本个体。此方式是用于各层的单位数目相差悬殊,或层内方差较大的情形。52等比例分层抽样(1)按比例分层抽样:按照各个层中单位数量占总体单位数量的多少等比例地分配各个层的样本单位数量的方法。计算公式为:

nk—每层的(单位)数量

N—母体的(单位)数量

n—总样本数

NK/N—每层占总体的比重53

市场调研

第二节抽样调查方法子样本n1180n2350n3300n4170子总体N118000N235000N330000N417000n=1000N=10000054

市场调研

第二节抽样调查方法练习

某机构要调查城市居民家用电器的潜在需求,这种商品的消费量与居民家庭收入水平相关。已知某城市有100万户家庭,且居民的收入水平差异较大,其中高收入家庭15万户,中等收入家庭65万户,低收入家庭20万户。本次调查拟抽取1000个家庭作为样本。

请问:采用分层比例抽样法,应从各层选取多少个样本单位?5556例如:某地共有居民2万户,按经济收入高低进行分类,其中高收入居民为4000户,中等收入居民为12000户,低收入居民有4000户。要从中抽出400户进行购买力调查,采用等比例分层抽样,如何抽取?具体的抽样程序如下:第一步,计算各层在总体中的比例。高收入户:4000/20000=20%中等收入户:12000/20000=60%低收入户:4000/20000=20%第二步,各层在总体中所占的比例与各层在样本中所占的比例是一样的。因此,计算样本在各层中的具体分布数目。高收入户:400×20%=80(户)中等收入户:400×60%=240(户)低收入户:400×20%=80(户)第三步,在各层中采用等距抽样方法抽取样本单位。57思考:某电视机厂要对120万用户进行抽样调查,按照用户的企业规模,可分为大、中、小三层,其中大用户36万户;中用户60万户;小用户24万户。若确定抽取1000户进行调查,则各层应抽取的样本数量为多少?(300户,500户,200户)分层比例抽样法适用于各层之间的标准差大致相近的事物,若各层之间的标准差相差很大,就不适合采用分层比例抽样法,而应采用分层最佳抽样法。58(2)纽曼分层抽样:也叫最佳分层抽样,是在各层内根据变异数大小(标准差)调整各层的样本数量,以提高样本的可信度。公式为:样本标准差的差别主要凭经验判断确定,也可通过计算公式确定。计算公式为:59

各层中的标准差估计值,反映的是各层的每一个个体值和平均值之间的差异。如果某层中的各个体特征比较接近,差异较小,那么理论上,标准差就小。因此,少抽取一些数目的样本,仍可以代表、反映该层的大致情况。如果某层内各个体差异较大,那么标准差就较大,因而要适当多选些样本才合理。60某地共有居民2万户,按经济收入高低进行分类,其中高收入居民为4000户,中等收入居民为12000户,低收入居民有4000户。要从中抽出400户进行购买力调查,如果各层样本标准差高收入为300元,中收入为200元,低收入为100元,用最佳分层抽样法,如何抽取?按照公式计算,得出各类型应抽选的样本单位数为:高收入样本单位数目为:400×(1200000÷4000000)=120(户)中收入样本单位数目为:400×(2400000÷4000000)=240(户)低收入样本单位数目为:400×(400000÷4000000)=40(户)61例如:某电视机厂要对120万用户进行抽样调查,按照用户的企业规模,可分为大、中、小三层,其中大用户36万户;中用户60万户;小用户24万户。若确定抽取1000户进行调查,设大用户的标准差为5%;中用户的标准差为2%;小用户的标准差为3%,则各层应抽取的样本数量为:大用户抽取样本数:中用户抽取样本数≈323(户)小用户抽取样本数≈193(户)62(3)德明分层抽样:又称经济抽样或最低成本抽样。当各层的调查费用有明显差异时,在不影响可信度的前提下,调整各层的样本量,使调查费用尽量减少。它兼顾了各层的差异与调查费用,计算公式为式中:Ck—各层中单位调查费用634.分层抽样的优缺点

优点:分层抽样实质上是把科学分组方法和抽样原理结合起来。从精度看,分层抽样〉系统抽样〉简单随机抽样缺点:“分层注意”64

市场调研

第二节抽样调查方法(四)整群抽样1、含义

整群抽样:将总体分为S个互不重叠的相似子群,每一个子群都可代表总体,然后从这S个群中随机抽取若干群,对选中的群内各样本单位进行普查。人为划分的群体(如销售地区)自然形成的群体(如班级、行政区)65整群抽样示意母群体总数集群二集群一集群三集群四集群五集群七集群六集群八…集群n集群一集群三…集群m母群体共分成n个集群共抽取m个集群6667

市场调研

第二节抽样调查方法2、操作办法确定分群的标准(如行政区划、班级);将总体(N)分成S个互不重叠的群;根据样本量(n)确定抽取的群数;采用简单随机抽样或系统抽样的方法,从S群中抽取确定的群数;对所抽取群的样本单位进行普查68例如:某校有学生2000名,计划从中抽160名进行调查。可将学生宿舍作为抽样单位。假设该校共有学生宿舍250个,每个宿舍住8个学生。我们可以从250个宿舍中随机抽取20个,其中男生宿舍10个,女生宿舍10个,对抽中的每个宿舍的所有学生进行调查,这20个宿舍总共160名学生就是此次抽样调查的样本。例:某街道由200个里弄,每一个里弄有50户居民。如何从该街道抽取1000户作为样本?可以从200个里弄中随机抽取20个里弄,将这20个里弄中的全部1000户居民作为调查对象。69

市场调研

第二节抽样调查方法通信公司将对某大学学生的通信消费状况进行调查,样本容量为800个。公司对该大学的学生情况不太了解,而且很难得到所有大学生的人员清单。但他们通过努力,获得了该学校所有班级的名单。为此,研究人员拟采用何种抽样方法?其步骤是?练习答:采取整群抽样法。其步骤是:

1、对该大学的学生以班级分成若干群;

2、随机抽取20个班级(群);

3、获取被抽取班级的人员清单;

4、对该20个班级进行普查,获得最终样本。70

市场调研

第二节抽样调查方法3、整群抽样的优缺点(1)优点在组织实施上简单易行节省人力、财力和时间(2)缺点样本的代表性差,抽样误差大71

市场调研

第二节抽样调查方法4、整群抽样的适用性难以获得完整的抽样框时群与群之间差异小,群内个体差异大时调查时间紧、经费少样本分布地区范围广、规模大的总体72五、多阶段抽样

1、定义多阶段抽样:在许多大规模、复杂的市场调查中,调查单位一般不是一次性直接抽取到的,而是采用两阶段或多阶段抽取的方法,即先抽大的调查单元,在大单元中抽小单元,再在小单元中抽较小单元,这种方式称多阶段抽样。2、特点

抽样单位的抽选不是一步到位,而是分阶段抽样。组织方便,对于总体单位多且分散的情况更有效。但在设计抽样方案、计算抽样误差和推断总体上比较复杂。73案例:99’尼尔森全国零售调研

0山东烟台威海荣成蓬莱

…威海枣庄济宁蓬莱商店普查…广东全国34个省市区山西河北济南第一阶段第二阶段第三阶段74随机抽样技术的技术特点优点1.随机抽样是从总体中按照随机原则抽取一部分单位进行的调查2.随机抽样技术能够计算调查结果的可靠程度不足1.对所有调查样本都给予平等看待,难以体现重点。2.抽样范围比较广,所需时间长,参加调查的人员和费用多。3.需要具有一定专业技术的专业人员进行抽样和资料分析。一般调查人员难以胜任。758.3.3非随机抽样技术非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员主观判断或仅按方便原则抽选样本。一般在如下情况采用:受客观条件限制,无法进行严格的随机抽样;为了快速获得调查结果;对调查对象不确定或无法确定的情况;总体各单位间离散程度不大且调查员具有丰富经验时采用。非随机抽样技术有四种:方便抽样、判断抽样、配额抽样、雪球抽样76一、方便抽样1、定义方便抽样(ConvientSampling):又称偶遇抽样,即从调研人员工作方便出发,在调研对象范围内随意抽选一定数量的样本进行调查。(适用于探索性调查,街头拦截式面访调查)2、两种方法街头拦人法:在街上或路口任意找某个行人,将他(她)作为被访者,进行调查。空间抽样法:对某一聚集的人群,从空间的不同方向和方位对他们进行抽样调查。3、特点简便易行,节约时间和费用;要求调研总体同质性高抽样结果偏差较大,可信度较低77街头拦截法78

市场调研

第二节抽样调查方法3、方便抽样的适用性探索性调查同质性强的总体时效性要求较高的调查流动性大的总体 79二、判断抽样1、定义判断抽样(JudgmentSampling):又叫目的抽样,即凭研究人员的主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象的一种抽样方法。前提是研究人员须对总体的有关特征有相当高的了解,此法在我国市场调研中得到广泛运用。适用于总体规模不大、样本量小及样本不易分门别类挑选。如某批发商要调查零售商销售其产品的情况,批发商根据自己的经验和判断,选定一些具有代表性的零售商作为样本进行调查。802、两种具体做法第一种情况是,选择最能代表普遍情况的调查对象,即选取“多数型”、或“平均型”的样本作为调查对象。第二种情况是,选择那些异乎寻常的个案,目的是调查造成异常的原因。3、特点简便、易行、及时易发生主观判断产生的抽样误差,且无法计算可信度81

市场调研

第二节抽样调查方法2、判断抽样的优缺点优点:充分发挥研究人员的主观能动性;简便易行;

缺点:受主观影响大;依赖研究人员的工作经验和判断能力。82

市场调研

第二节抽样调查方法3、判断抽样的适用性研究人员对总体情况比较熟悉研究人员从事过类似调研83三、配额抽样1、定义配额抽样(QuotaSampling):是非随机抽样中最流行的一种,配额抽样类似随机抽样中的分层抽样,它也是首先将总体中的所有单位按一定的标志分为若干类(组),然后在每个类(组)中用方便抽样或判断抽样方法选取样本单位。采用配额抽样,首先对总体中所有单位按其属性、特征分类,这些属性、特性称为“控制特征”,然后按各个控制特征分配样本数额。2、与分层抽样的区别84配额抽样多特征分层主观确定样本误差不可估算分层抽样单特征分层随机抽取样本误差可估算注意:配额抽样与分层抽样的区别853、配额抽样的分类独立控制配额抽样:是根据调研总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。优点:简单易行,选择余地较大;缺点:可能图一时方便,选择样本过于偏向某一组别,影响样本代表性。交叉控制配额抽样:是对调查对象的各个控制特性的样本数额交叉分配。特点:调查面较广,提高了样本代表性。86[举例]独立控制配额抽样

例如,在某项调查中,确定样本总数为180个,可单独选择消费者收入、年龄、性别三个标准中的一个进行抽样。按独立配额抽样,其各个标准样本配额比例及配额数如下表所示。87[举例]交叉控制配额抽样

88行业比例所有制比例商店规模比例饮食业40%国营25%大型10%烟酒糖业26%集体50%中型30%百货业34%个体25%小型60%合计100%合计100%合计100%大型中型小型合计国营集体个体国营集体个体国营集体个体饮食业X11X12X13X14X15X16X17X18X1940%烟酒糖X21X22X23X24X25X26X27X28X2926%百货业X31X32X33X34X35X36X37X38X3934%小计100%合计10%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论