版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三讲
样本设计SAMPLEDESIGN第三讲
样本设计
抽样的基本概念
定义目标总体非概率样本设计概率样本设计样本量的的确定不回答问题内容提要抽样的基本概念内容提要【案例】谁会是下一任美国总统?在社会科学研究中,美国大选前的民意测验对抽样方法的发展起到了重要的推动作用。《文摘》杂志于1936年进行的总统选举结果预测就是一个经典的例子。为了预测1936年美国总统选举结果,《文摘》开展了一项庞大的民意测验,向从电话号码簿和车牌登记名单中抽取的1000万人邮寄了问卷,收回了240万份问卷。该调查结果预测共和党候选人兰登(Landon)将以57%对43%击败民主党候选人罗斯福,但实际结果是兰登以38%对62%败北。这项耗资巨大的调查使该杂志因资金困难和名誉扫地而破产。这个案例告诉了我们什么?【案例】谁会是下一任美国总统?在社会科学研究中,美国大选前抽样设计培训资料
抽样(sampling)是根据一定的规则和程序,从研究总体中抽取其中的一部分样本的过程。
总体(population)
指的是享有一些共同特征、构成某项研究对象的所有个体的集合,代表总体某些特征的统计指标叫参数(parameters)。
样本(sample)
是从总体中选出来的一部份成员,样本特征叫统计量(statistics),可用来对总体参数进行推断。一、抽样的基本概念抽样(sampling)是根据一定的规则和程序,从研抽查与普查的适用条件你觉得汽车碰撞试验的有效性如何?标准抽查普查预算时间总体规模特征差异抽样误差成本非抽样误差成本测量的性质对个案的关注小短大小低高破坏性是大长小大高低非破坏性否抽查与普查的适用条件你觉得汽车碰撞试验的有效性如何?标准抽查抽样过程确定抽样框架选择抽样方法确定样本规模抽取样本定义总体抽样过程确定抽样框架选择抽样方法确定样本规模抽取样本定义总体二、定义目标总体目标总体(targetpopulation)
是某项研究所要推论的所有个体的集合,是通过研究要对其进行描述和推论的总体。抽样总体(samplingpopulation)
是从中实际抽取样本的所有个体的集合,通常依据抽样框架来加以定义。应该根据内容、范围和时间三重标准定义目标总体。二、定义目标总体目标总体(targetpopulatio讨论:目标总体的确定假如凤凰网要进行一项SUV品牌美誉度调查,请问:应当如何定义调查的目标总体与抽样总体?讨论:目标总体的确定确定抽样框架抽样框架(samplingframe)是抽样总体的可操作性定义,由一份完整的名单或一组用于识别目标总体的文字说明组成。在编制抽样框架时常见的问题如下:遗漏-遗漏部分样本单位;聚堆-缺乏个体样本单位信息;重复-同一样本单位重复出现;混杂-抽样框架中包括部分非样本总体成员。确定抽样框架抽样框架(samplingframe)是抽样总过滤问题为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。除了某项研究的特殊要求以外,营销研究通常要求研究对象:过去3个月内没有接受任何产品或广告调查;本人及家庭成员不在有关的公司工作。过滤问题为了确定某一个体是否属于抽样总体,常有必要使用过滤问【例】大中城市女性减肥品市场分层研究:目标总体目标总体:2003年中国大中城市女性减肥品的现有消费者和潜在消费者抽样总体:十个代表城市中,A公司销售人员在其产品销售终端可以接触到的年龄在20-50周岁之间的女性减肥品现有消费者和潜在消费者【例】大中城市女性减肥品市场分层研究:目标总体目标总体:20抽样设计培训资料狗粮市场需求调查的目标总体?狗粮市场需求调查的目标总体?抽样方法三、选择抽样方法非概率抽样概率抽样便捷抽样判断抽样配额抽样滚雪球抽样系统抽样分层抽样整群抽样其它
简单随机抽样抽样方法三、选择抽样方法非概率抽样概率抽样便捷抽样判断抽非概率样本设计非概率样本设计(nonprobabilitysampledesign)依赖于研究人员的个人判断而非随机原则选择样本个体,事先并不确定每个样本单位被抽中的概率。这种样本设计往往无法排除研究人员偏好对抽样的影响,也无法准确估算样本估计值的抽样误差。该方法通常用于下列情况:样本量很小时;探索性研究或研究的初始阶段;目标总体成员很少或很难寻找;无法采用概率样本时。非概率样本设计非概率样本设计(nonprobability非概率样本的种类便捷样本(conveniencesample)-选择容易接触的个体作为调查研究对象;主观样本(judgmentalsample)-根据研究者的判断,选择"有代表性"或"典型性"的样本单位;定额样本(quotasample)-将总体分层并确定每层应抽取的样本量,让调查员根据定额抽样;滚雪球样本(snowballsample)-先抽取少量的样本,然后通过滚雪球的方式扩大。非概率样本的种类便捷样本(conveniencesampl(1)独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。因此,调查员就有比较大的自由去选择总体中的样本。优点:简单易行,调查员选择余地较大;缺点:调查员可能图一时方便,选择样本过于偏向某一组别,从而影响样本的代表性。月收入人数300元以下20301~600元50601~900元70900元以上60合计200年龄人数30岁以下4030~40岁6040~50岁7050岁以上30合计200性别人数男100女100合计200例:某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄、性别三个标准分类。其各个标准样本配额比例及配额数如表。(1)独立控制配额抽样是根据调查总体的不同特性,对具(2)交叉控制配额抽样对每一个控制特性所需分配的样本数都做具体规定,调查员必须按规定在总体中抽取调查单位,由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。300元以下301-600元601-900元900元以上合计男女男女男女男女30岁以下225577664030~40岁332061016116040~50岁101341273307050岁以上5225833230合计208302037331339200(2)交叉控制配额抽样对每一个控制特性所需分配的样本数都做具入户调查的抽样过程1、建立抽样框(家庭抽样)2、确定抽样对象(户内抽样)入户调查的抽样过程1、建立抽样框(家庭抽样)抽样设计培训资料【例】大中城市女性减肥品市场分层研究:抽样方法抽样方法:配额抽样样本城市:北京、广州、深圳、昆明、贵阳、重庆、成都、沈阳、乌鲁木齐、济南样本总量:每个城市100份,共1000份配额:实行现有和潜在消费者配额,城市配额,甄选问卷对抽样配额进行控制。【例】大中城市女性减肥品市场分层研究:抽样方法抽样方法:配额抽样设计培训资料概率样本设计概率样本设计(probabilitysampledesign)采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好抽中概率。简单随机抽样系统抽样分层抽样整群抽样概率样本设计概率样本设计(probabilitysampl简单随机抽样简单随机抽样(simplerandomsampling)
是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自加权估计值。若总体为N,样本量为n,则每一抽样单位的抽中概率:p=n/N简单随机抽样简单随机抽样(simplerandomsam随机数表是将0-9十个数字用完全随机顺序排列编成的表。
28465335749213452067421520578090043628192664371555012664985671497258435789642754如要从94家上市公司中抽取12家作为调查样本,可将94家公司由1至94编号,然后从随机数表的任一行一列作为起点,如从第二排第三列的数组起从上而下、自左而右抽取,则顺序取得的样本号为:42、28、26、43、35、15、19、64、57、74、20、26、89、92随机数表是将0-9十个数字用完全随机顺序排列编成的表。28系统抽样系统抽样(systematicsampling)是随机抽取第一个样本单位,然后每隔k个单位抽取一个。系统抽样时每个样本单位抽中的概率相同,为1/k,通过系统抽样也可获得总体参数的自加权估计值。讨论:什么时候应避免采用系统抽样?系统抽样系统抽样(systematicsampling)是按标志排序计算抽样距离抽选样本例:某地区有居民110户,采用系统抽样法抽选11户。①将总体单位进行编号,即从1至110号;②确定抽样距离=③确定起抽号数:从1——10号中随机抽取,如2;④确定被抽取的单位:2,12,22,32,42,……,102。系统抽样举例按标志排序计算抽样距离抽选样本例:某地区有居民110户,采用分层抽样分层抽样(stratifiedsampling)时将总体按某些重要特征分为数个层,然后用简单随机抽样或系统抽样的办法从每层中抽取一定数量的样本。比例分层抽样非比例分层抽样如果某校有1000名本科生,400名普通硕士生和600名MBA学生,若要比较不同类别学生对教学的满意度,请问:应采用哪种抽样方法?总体满意度应如何计算?分层抽样分层抽样(stratifiedsampling)时即按各层中的单位数占总体的比例分配各层样本量。ni表示第i层要抽取的样本数;Ni表示第i层目标总体数;N表示目标总体数;n表示要抽取的样本总数。例如:某公司要预测某地区家用电器的潜在用户,这种商品的消费同收入水平有关,因而以家庭收入为分层基础。已知总体单位数为20000户,已确定的样本数为200户。家庭收入分为高、中、低三层,其中高收入层2000户,中收入层6000户,低收入层12000户。则:高收入层要调查的户数为:(1)比例分层抽样即按各层中的单位数占总体的比例分配各层样本量。ni表示第i(2)最佳分层抽样(牛曼分层抽样)根据各层样本的标准差的大小,调整各层的样本数目。即考虑各层在总体中所占的比例,又考虑到各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度。式中:Si表示第i层的标准差;m表示所分层数目;xij表示第i层第j个样本的观察值。(2)最佳分层抽样(牛曼分层抽样)根据各层样例如:在上例中则:结果对比分析:高收入层增加了30户,中收入层增加了40户,低收入层减少了70户。购买电器与收入成正比,高收入层相对大于低收入层,更加吻合,提高了准确性。例如:在上例中则:结果对比分析:(3)分层最低成本抽样(德明分层抽样或经济抽样)分层抽样小结:适用于总体单位数较多,情况复杂,且单位之间差异较大的调查对象。其不足表现在须对总体单位的情况有较多了解。兼顾了各层的差异程度与调查费用(3)分层最低成本抽样(德明分层抽样或经济抽样)分层抽样小结整群抽样整群抽样(clustersampling)是将总体分为不同的群组,然后随机抽取一定数量的群组作为样本。整群抽样可分为:一级整群抽样-在抽中群组中抽取所有个体;二级整群抽样-在抽中群组中抽取部分个体。多级抽样-将总体分为多级群组,逐级抽样。整群抽样整群抽样(clustersampling)是将总体区域抽样(areasampling)区域抽样(areasampling)
就是在地图上将一个城市划分为不同的区域并依次编号,然后随机地抽取部分区域作为样本。如果对抽中区域的全部住户进行调查,则为一级区域抽样;如果在抽中区域只随机抽一部分住户作为样本,则为二级区域调查。也可以将一个城市划分为不同区域,再将每个抽中区域进一步划分为不同小区,最后以住户为最终抽样单位,进行多级区域抽样。区域抽样(areasampling)区域抽样(area【例】上海二手房价格调查【例】上海二手房价格调查抽样方法的选择抽样方法的选择取决于:研究所处的阶段和数据的用途;总体内部的同质性;时间、经费和人力;数据收集的方法;其它实际考虑。抽样方法的选择四、样本量的确定确定样本量的方法可分为两大类:经验方法:根据业界常规来确定样本的大小统计学方法:根据统计公式计算样本量(只适合概率样本)四、样本量的确定表2市场研究中常用的样本量表2市场研究中常用的样本量确定样本量的统计学方法对于概率样本可用统计公式计算所需样本。这时样本量与下列因素有关:样本设计类型;要求的精度(D);总体内部的同质性(S);分组的详细程度。确定样本量的统计学方法对于概率样本可用统计公式计算所需样本。样本容量的确定1.调查误差调查误差是指调查的结果和客观实际情况的出入和差数,一般有两种误差存在:即非抽样误差和抽样误差。总体特征抽样误差样本结果系统性误差(非抽样误差)样本容量的确定1.调查误差调查误差是指调查的结果和客观实际情非抽样误差应答者误差管理误差不回应误差样本选择误差访问员误差故意答错误解而答错数据处理误差测量工具误差反应偏差非抽样误差应答者误差管理误差不回应误差样本选择误差访问员误差3.抽样误差(Randomsamplingerror)抽样误差:单纯由于不同的随机样本计算出的不同指标所产生的误差。只能通过增加样本量来缩小抽样误差,而无法避免这类误差。影响抽样误差的因素:总体单位标志变异程度。总体的方差越大,抽样误差就越大;反之,则抽样误差越小。抽取的样本量。抽样单位数越多,抽样误差就越小;反之,抽样误差就越大。抽样调查的组织方式。3.抽样误差(Randomsamplingerror)抽抽样误差的计算重复抽样平均数成数不重复抽样平均数成数修正系数抽样误差的计算重复抽样平均数成数不重复抽样平均数成数估计均值时样本量的确定对于简单随机抽样:1.确定允许误差D, d=±$5.002.确定置信水平CL, CL=95%3.确定与置信水平相应的z值, z=1.964.确定总体的标准差s, s=555.计算所需样本量n, n=s2z2/d2=4656.当样本量超过总体的5%时,nc=nN/(N+n-1)估计均值时样本量的确定对于简单随机抽样:估计比例时样本量的确定对于简单随机抽样:1.确定允许误差D, d=±.052.确定置信水平CL, CL=95%3.确定与置信水平相应的z值, z=1.964.估计总体的发生率P, P=0.64?5.计算所需样本量n, n=P(1-P)z2/d2=3556.当样本量超过总体的5%时,nc=nN/(N+n-1)估计比例时样本量的确定对于简单随机抽样:(3)示例某地区共有居民25万户,据第二手资料分析,高、中、低收入户分别为5万、15万、5万,标准差分别为300、200、100,现欲研究该地区家庭月消费水平。根据小样本调查得知,月消费水平的标准差为200。试问:若要求在95%的置信度下,家庭月收入水平的置信区间为真实家庭月消费水平的30元范围内,采用不重复抽样,应调查多少户家庭?各收入户应抽取多少户?(回收率R=90%,设计效应系数D=1)。解:确定总样本数确定高、中、低样本数(3)示例某地区共有居民25万户,据第二手资料分析,高、中、表3同时估计多个参数时样本量的确定
最终样本量?
表3同时估计多个参数时样本量的确定 样本量的调整确定了所需的样本量后,还要根据以下因素,调整要抽取的样本量:发生率:样本总体中符合条件的百分比完成率:完成访谈的合格对象的百分比样本量的调整提高回答率的方法五、不回答问题减少拒绝减少扑空预约激励物资刺激问卷设计追踪回访由于扑空或拒答导致的不回答问题,不仅减少了有效样本数,还可能导致样本偏差。提高回答率的方法五、不回答问题减少拒绝减少扑空预约激励物资刺为拒答做修正抽查无回答者替代趋势分析加权推算为拒答做修正学生调研项目市场营销老师给他们的学生布置了一项任务:想出一种新产品的创意,然后对此进行市场调研。学生们可以使用任何一种看起来可行的调研方法,但是在设计他们一手调研计划之前,希望学生们进行二手调研。大多数学生发现,想出产品创意很有趣,但市场调研却很困难。另一方面,他们很珍惜把自己的一些想法付诸行动的机会。共计有42项关于新产品的创意,但是有些在技术上不可行,或不能获利。然而,有一些想法却是可行的。无论如何,作业是有关调研的。而不是产品的技术设计,因此产品的可行性或其他因素与调研无关。学生进行了必要的二手调研,然后设计了自己的一手调研计划。大多数使用问卷调研方法,少数使用群组,极少数使用了深入面谈、观察、实验或其他技术。学生调研项目市场营销老师给他们的学生布置了一项任务:想出一种在某种程度上让学生自行想办法,目的是让学生从自己的错误中发现市场调研的陷阱。在大多数情况下,学生竭力想获得相当好的调研结果,但是很明显,他们中的一些人犯有严重的错误。结果表明,问卷调查是导致更多困难的调研方法之一。除了设计问卷的问题外,大多数学生犯了最基本的抽样错误,以下是一些摘自学生书面报告的实例。对下述每一个案例,你认为:抽样方法存在哪些错误?学生们应该做什么?你能做哪些额外的调研去修正抽样误差或使它们的影响最小。在某种程度上让学生自行想办法,目的是让学生从自己的错误中发现我们星期六上午在街头拦截行人,做了一个购物者的随机抽样。(新型购物筐)为了探明年轻人的观点,我们访问了大学的23名自愿者。(广播电台)我们调查了10名女士和10名男士。喜欢该产品的女士比男士多20%左右,60岁以上的人,有60%以上喜欢该产品。总计,40%的调查对象喜欢该产品。(园艺用具)对100个调查对象的电话调研表明,32%的调查对象将会购买屋顶密封帆布。遗憾的是,进一步的调查显示,8个人是家中成年的孩子而不是房屋的主人。(应急屋顶密封帆布)我们在调查中碰到的主要问题是大多数人太忙,没有时间停下来接受我们的访问,无论如何,最终我们的努力完成了70份有效的问卷。(银行服务)在托儿所进行了调研。在母亲接孩子的时候,我们给她们分发了问卷,我们将在第二天收回问卷。不幸的是,我们只收回了一半问卷,但这足以使我们得出某些结论。我们星期六上午在街头拦截行人,做了一个购物者的随机抽样。(新焦点小组的结果好多了,但仍然有很多明显的问题。我们的小组有6个男孩和2个女孩组成,年龄在18-20岁之间。我们向他们展示了产品的模型,并要求他们对模型进行评论。一开始,他们好像说的并不是很多,但经过一些鼓励后,他们便开始自由地讨论了。(汽车真空吸尘器)当我们向他们展示产品时,他们中的大多数人感到很迷惑。一组有6个家庭主妇,所有的人都来自在早上聚在一起喝咖啡的朋友群体。(割草机安全装置)我们组常常偏离主题。我们有一个具有代表性的样本,其中有三个青少年(一个男生和两个女生),两个中年人和三个退休的老年人。(地毯清洁装置)焦点小组的结果好多了,但仍然有很多明显的问题。作业1.如果中国联通委托你开展一项3G个人用户的服务需求调查,请确定:a.目标总体和抽样总体?b.抽样单位和抽样框架?d.你会考虑采用哪种抽样方法?2.假如估计有某种服务需求的顾客比例可能为70%,回答率大约为60%,要求有95%的把握保证误差不超过3个百分点,请计算需要抽取的合格样本量。作业1.如果中国联通委托你开展一项3G个人用户的服务需求调参考文献马尔霍特拉著,涂平等译:《市场营销研究—应用导向》,第5版,第11-12章,电子工业出版社,2009。巴比著,邱泽奇译:《社会研究方法》,第11版,第7章,华夏出版社,2009。Churchill,Jr.,GilbertA.,TomJ.Brown:BasicMarketingResearch,7thedition,Chapters15-17.South-Western,2010.参考文献马尔霍特拉著,涂平等译:《市场营销研究—应用导向》,演讲完毕,谢谢观看!演讲完毕,谢谢观看!第三讲
样本设计SAMPLEDESIGN第三讲
样本设计
抽样的基本概念
定义目标总体非概率样本设计概率样本设计样本量的的确定不回答问题内容提要抽样的基本概念内容提要【案例】谁会是下一任美国总统?在社会科学研究中,美国大选前的民意测验对抽样方法的发展起到了重要的推动作用。《文摘》杂志于1936年进行的总统选举结果预测就是一个经典的例子。为了预测1936年美国总统选举结果,《文摘》开展了一项庞大的民意测验,向从电话号码簿和车牌登记名单中抽取的1000万人邮寄了问卷,收回了240万份问卷。该调查结果预测共和党候选人兰登(Landon)将以57%对43%击败民主党候选人罗斯福,但实际结果是兰登以38%对62%败北。这项耗资巨大的调查使该杂志因资金困难和名誉扫地而破产。这个案例告诉了我们什么?【案例】谁会是下一任美国总统?在社会科学研究中,美国大选前抽样设计培训资料
抽样(sampling)是根据一定的规则和程序,从研究总体中抽取其中的一部分样本的过程。
总体(population)
指的是享有一些共同特征、构成某项研究对象的所有个体的集合,代表总体某些特征的统计指标叫参数(parameters)。
样本(sample)
是从总体中选出来的一部份成员,样本特征叫统计量(statistics),可用来对总体参数进行推断。一、抽样的基本概念抽样(sampling)是根据一定的规则和程序,从研抽查与普查的适用条件你觉得汽车碰撞试验的有效性如何?标准抽查普查预算时间总体规模特征差异抽样误差成本非抽样误差成本测量的性质对个案的关注小短大小低高破坏性是大长小大高低非破坏性否抽查与普查的适用条件你觉得汽车碰撞试验的有效性如何?标准抽查抽样过程确定抽样框架选择抽样方法确定样本规模抽取样本定义总体抽样过程确定抽样框架选择抽样方法确定样本规模抽取样本定义总体二、定义目标总体目标总体(targetpopulation)
是某项研究所要推论的所有个体的集合,是通过研究要对其进行描述和推论的总体。抽样总体(samplingpopulation)
是从中实际抽取样本的所有个体的集合,通常依据抽样框架来加以定义。应该根据内容、范围和时间三重标准定义目标总体。二、定义目标总体目标总体(targetpopulatio讨论:目标总体的确定假如凤凰网要进行一项SUV品牌美誉度调查,请问:应当如何定义调查的目标总体与抽样总体?讨论:目标总体的确定确定抽样框架抽样框架(samplingframe)是抽样总体的可操作性定义,由一份完整的名单或一组用于识别目标总体的文字说明组成。在编制抽样框架时常见的问题如下:遗漏-遗漏部分样本单位;聚堆-缺乏个体样本单位信息;重复-同一样本单位重复出现;混杂-抽样框架中包括部分非样本总体成员。确定抽样框架抽样框架(samplingframe)是抽样总过滤问题为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。除了某项研究的特殊要求以外,营销研究通常要求研究对象:过去3个月内没有接受任何产品或广告调查;本人及家庭成员不在有关的公司工作。过滤问题为了确定某一个体是否属于抽样总体,常有必要使用过滤问【例】大中城市女性减肥品市场分层研究:目标总体目标总体:2003年中国大中城市女性减肥品的现有消费者和潜在消费者抽样总体:十个代表城市中,A公司销售人员在其产品销售终端可以接触到的年龄在20-50周岁之间的女性减肥品现有消费者和潜在消费者【例】大中城市女性减肥品市场分层研究:目标总体目标总体:20抽样设计培训资料狗粮市场需求调查的目标总体?狗粮市场需求调查的目标总体?抽样方法三、选择抽样方法非概率抽样概率抽样便捷抽样判断抽样配额抽样滚雪球抽样系统抽样分层抽样整群抽样其它
简单随机抽样抽样方法三、选择抽样方法非概率抽样概率抽样便捷抽样判断抽非概率样本设计非概率样本设计(nonprobabilitysampledesign)依赖于研究人员的个人判断而非随机原则选择样本个体,事先并不确定每个样本单位被抽中的概率。这种样本设计往往无法排除研究人员偏好对抽样的影响,也无法准确估算样本估计值的抽样误差。该方法通常用于下列情况:样本量很小时;探索性研究或研究的初始阶段;目标总体成员很少或很难寻找;无法采用概率样本时。非概率样本设计非概率样本设计(nonprobability非概率样本的种类便捷样本(conveniencesample)-选择容易接触的个体作为调查研究对象;主观样本(judgmentalsample)-根据研究者的判断,选择"有代表性"或"典型性"的样本单位;定额样本(quotasample)-将总体分层并确定每层应抽取的样本量,让调查员根据定额抽样;滚雪球样本(snowballsample)-先抽取少量的样本,然后通过滚雪球的方式扩大。非概率样本的种类便捷样本(conveniencesampl(1)独立控制配额抽样是根据调查总体的不同特性,对具有某个特性的调查样本分别规定分配数额,而不规定必须同时具有两种或两种以上特性的样本数额。因此,调查员就有比较大的自由去选择总体中的样本。优点:简单易行,调查员选择余地较大;缺点:调查员可能图一时方便,选择样本过于偏向某一组别,从而影响样本的代表性。月收入人数300元以下20301~600元50601~900元70900元以上60合计200年龄人数30岁以下4030~40岁6040~50岁7050岁以上30合计200性别人数男100女100合计200例:某市进行空调器消费需求调查,确定样本量200名,选择消费者收入、年龄、性别三个标准分类。其各个标准样本配额比例及配额数如表。(1)独立控制配额抽样是根据调查总体的不同特性,对具(2)交叉控制配额抽样对每一个控制特性所需分配的样本数都做具体规定,调查员必须按规定在总体中抽取调查单位,由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。300元以下301-600元601-900元900元以上合计男女男女男女男女30岁以下225577664030~40岁332061016116040~50岁101341273307050岁以上5225833230合计208302037331339200(2)交叉控制配额抽样对每一个控制特性所需分配的样本数都做具入户调查的抽样过程1、建立抽样框(家庭抽样)2、确定抽样对象(户内抽样)入户调查的抽样过程1、建立抽样框(家庭抽样)抽样设计培训资料【例】大中城市女性减肥品市场分层研究:抽样方法抽样方法:配额抽样样本城市:北京、广州、深圳、昆明、贵阳、重庆、成都、沈阳、乌鲁木齐、济南样本总量:每个城市100份,共1000份配额:实行现有和潜在消费者配额,城市配额,甄选问卷对抽样配额进行控制。【例】大中城市女性减肥品市场分层研究:抽样方法抽样方法:配额抽样设计培训资料概率样本设计概率样本设计(probabilitysampledesign)采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好抽中概率。简单随机抽样系统抽样分层抽样整群抽样概率样本设计概率样本设计(probabilitysampl简单随机抽样简单随机抽样(simplerandomsampling)
是最基本的概率抽样方法。该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自加权估计值。若总体为N,样本量为n,则每一抽样单位的抽中概率:p=n/N简单随机抽样简单随机抽样(simplerandomsam随机数表是将0-9十个数字用完全随机顺序排列编成的表。
28465335749213452067421520578090043628192664371555012664985671497258435789642754如要从94家上市公司中抽取12家作为调查样本,可将94家公司由1至94编号,然后从随机数表的任一行一列作为起点,如从第二排第三列的数组起从上而下、自左而右抽取,则顺序取得的样本号为:42、28、26、43、35、15、19、64、57、74、20、26、89、92随机数表是将0-9十个数字用完全随机顺序排列编成的表。28系统抽样系统抽样(systematicsampling)是随机抽取第一个样本单位,然后每隔k个单位抽取一个。系统抽样时每个样本单位抽中的概率相同,为1/k,通过系统抽样也可获得总体参数的自加权估计值。讨论:什么时候应避免采用系统抽样?系统抽样系统抽样(systematicsampling)是按标志排序计算抽样距离抽选样本例:某地区有居民110户,采用系统抽样法抽选11户。①将总体单位进行编号,即从1至110号;②确定抽样距离=③确定起抽号数:从1——10号中随机抽取,如2;④确定被抽取的单位:2,12,22,32,42,……,102。系统抽样举例按标志排序计算抽样距离抽选样本例:某地区有居民110户,采用分层抽样分层抽样(stratifiedsampling)时将总体按某些重要特征分为数个层,然后用简单随机抽样或系统抽样的办法从每层中抽取一定数量的样本。比例分层抽样非比例分层抽样如果某校有1000名本科生,400名普通硕士生和600名MBA学生,若要比较不同类别学生对教学的满意度,请问:应采用哪种抽样方法?总体满意度应如何计算?分层抽样分层抽样(stratifiedsampling)时即按各层中的单位数占总体的比例分配各层样本量。ni表示第i层要抽取的样本数;Ni表示第i层目标总体数;N表示目标总体数;n表示要抽取的样本总数。例如:某公司要预测某地区家用电器的潜在用户,这种商品的消费同收入水平有关,因而以家庭收入为分层基础。已知总体单位数为20000户,已确定的样本数为200户。家庭收入分为高、中、低三层,其中高收入层2000户,中收入层6000户,低收入层12000户。则:高收入层要调查的户数为:(1)比例分层抽样即按各层中的单位数占总体的比例分配各层样本量。ni表示第i(2)最佳分层抽样(牛曼分层抽样)根据各层样本的标准差的大小,调整各层的样本数目。即考虑各层在总体中所占的比例,又考虑到各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度。式中:Si表示第i层的标准差;m表示所分层数目;xij表示第i层第j个样本的观察值。(2)最佳分层抽样(牛曼分层抽样)根据各层样例如:在上例中则:结果对比分析:高收入层增加了30户,中收入层增加了40户,低收入层减少了70户。购买电器与收入成正比,高收入层相对大于低收入层,更加吻合,提高了准确性。例如:在上例中则:结果对比分析:(3)分层最低成本抽样(德明分层抽样或经济抽样)分层抽样小结:适用于总体单位数较多,情况复杂,且单位之间差异较大的调查对象。其不足表现在须对总体单位的情况有较多了解。兼顾了各层的差异程度与调查费用(3)分层最低成本抽样(德明分层抽样或经济抽样)分层抽样小结整群抽样整群抽样(clustersampling)是将总体分为不同的群组,然后随机抽取一定数量的群组作为样本。整群抽样可分为:一级整群抽样-在抽中群组中抽取所有个体;二级整群抽样-在抽中群组中抽取部分个体。多级抽样-将总体分为多级群组,逐级抽样。整群抽样整群抽样(clustersampling)是将总体区域抽样(areasampling)区域抽样(areasampling)
就是在地图上将一个城市划分为不同的区域并依次编号,然后随机地抽取部分区域作为样本。如果对抽中区域的全部住户进行调查,则为一级区域抽样;如果在抽中区域只随机抽一部分住户作为样本,则为二级区域调查。也可以将一个城市划分为不同区域,再将每个抽中区域进一步划分为不同小区,最后以住户为最终抽样单位,进行多级区域抽样。区域抽样(areasampling)区域抽样(area【例】上海二手房价格调查【例】上海二手房价格调查抽样方法的选择抽样方法的选择取决于:研究所处的阶段和数据的用途;总体内部的同质性;时间、经费和人力;数据收集的方法;其它实际考虑。抽样方法的选择四、样本量的确定确定样本量的方法可分为两大类:经验方法:根据业界常规来确定样本的大小统计学方法:根据统计公式计算样本量(只适合概率样本)四、样本量的确定表2市场研究中常用的样本量表2市场研究中常用的样本量确定样本量的统计学方法对于概率样本可用统计公式计算所需样本。这时样本量与下列因素有关:样本设计类型;要求的精度(D);总体内部的同质性(S);分组的详细程度。确定样本量的统计学方法对于概率样本可用统计公式计算所需样本。样本容量的确定1.调查误差调查误差是指调查的结果和客观实际情况的出入和差数,一般有两种误差存在:即非抽样误差和抽样误差。总体特征抽样误差样本结果系统性误差(非抽样误差)样本容量的确定1.调查误差调查误差是指调查的结果和客观实际情非抽样误差应答者误差管理误差不回应误差样本选择误差访问员误差故意答错误解而答错数据处理误差测量工具误差反应偏差非抽样误差应答者误差管理误差不回应误差样本选择误差访问员误差3.抽样误差(Randomsamplingerror)抽样误差:单纯由于不同的随机样本计算出的不同指标所产生的误差。只能通过增加样本量来缩小抽样误差,而无法避免这类误差。影响抽样误差的因素:总体单位标志变异程度。总体的方差越大,抽样误差就越大;反之,则抽样误差越小。抽取的样本量。抽样单位数越多,抽样误差就越小;反之,抽样误差就越大。抽样调查的组织方式。3.抽样误差(Randomsamplingerror)抽抽样误差的计算重复抽样平均数成数不重复抽样平均数成数修正系数抽样误差的计算重复抽样平均数成数不重复抽样平均数成数估计均值时样本量的确定对于简单随机抽样:1.确定允许误差D, d=±$5.002.确定置信水平CL, CL=95%3.确定与置信水平相应的z值, z=1.964.确定总体的标准差s, s=555.计算所需样本量n, n=s2z2/d2=4656.当样本量超过总体的5%时,nc=nN/(N+n-1)估计均值时样本量的确定对于简单随机抽样:估计比例时样本量的确定对于简单随机抽样:1.确定允许误差D, d=±.052.确定置信水平CL, CL=95%3.确定与置信水平相应的z值, z=1.964.估计总体的发生率P, P=0.64?5.计算所需样本量n, n=P(1-P)z2/d2=3556.当样本量超过总体的5%时,nc=nN/(N+n-1)估计比例时样本量的确定对于简单随机抽样:(3)示例某地区共有居民25万户,据第二手资料分析,高、中、低收入户分别为5万、15万、5万,标准差分别为300、200、100,现欲研究该地区家庭月消费水平。根据小样本调查得知,月消费水平的标准差为200。试问:若要求在95%的置信度下,家庭月收入水平的置信区间为真实家庭月消费水平的30元范围内,采用不重复抽样,应调查多少户家庭?各收入户应抽取多少户?(回收率R=90%,设计效应系数D=1)。解:确定总样本数确定高、中、低样本数(3)示例某地区共有居民25万户,据第二手资料分析,高、中、表3同时估计多个参数时样本量的确定
最终样本量?
表3同时估计多个参数时样本量的确定 样本量的调整确定了所需的样本量后,还要根据以下因素,调整要抽取的样本量:发生率:样本总体中符合条件的百分比完成率:完成访谈的合格对象的百分比样本量的调整提高回答率的方法五、不回答问题减少拒绝减少扑空预约激励物资刺激问卷设计追踪回访由于扑空或拒答导致的不回答问题,不仅减少了有效样本数,还可能导致样本偏差。提高回答率的方法五、不回答问题减少拒绝减少扑空预约激励物资刺为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度物联网平台与设备采购合同
- 2024年度医疗器械采购合同:高精度医疗设备购买
- 2024年度保温砂浆生产线设备采购及安装合同
- 2024年度校园数字化建设设计与施工合同
- 2024年度专利许可使用合同关键技术参数与权益分配
- 2024年度仓储服务合同的服务条款和责任规定
- 04版公共车位销售与管理合同
- 2024年度企业员工福利IC卡发放与管理合同
- 2024年度版权许可合同:电影版权转授许可协议
- 2024年度大连二手房地产估价服务合同
- 三化一稳定严进严出专案报告
- 成人礼我们10岁了主题班会课件
- 2024至2030年中国运动控制器系统行业市场深度分析及发展策略分析报告
- 2024 CSCO BC指南三阴性晚期乳腺癌解救治疗更新解读
- 《义务教育生物学课程标准(2022年版)》新变化
- 爱国主义教育法答题题库
- 部编版六年级上册《口语交际:意见不同怎么办》课件
- 2024年离婚协议书5篇(标准版)
- 四川省宜宾市南溪区2022-2023学年七年级上学期期中历史试题
- “双碳”目标下企业绿色技术创新绩效影响评价研究
- 2024中国邮政集团公司贵州省分公司春季招聘223人(高频重点提升专题训练)共500题附带答案详解
评论
0/150
提交评论