第7章抽样设计.ppt_第1页
第7章抽样设计.ppt_第2页
第7章抽样设计.ppt_第3页
第7章抽样设计.ppt_第4页
第7章抽样设计.ppt_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 抽样设计,第一节 抽样调查的基本概念,总体是指调查所要反映的这一现象客体的的全部元素。 样本总体是指总体中抽选出年的部分元素或单位组成的小总体。 参数和统计量:总体和样本都可以用平均数、成数(比率)和标准差等综合指标来描述它们的特征。如下表,总体及样本的参数,四、概率抽样和非概率抽样,按照抽选样本的过程是否遵循随机原则,抽样方法有概率抽样和非概率抽样。 所谓随机原则就是指在抽样时,总体结构中的每一个单位被选为样本单位的概率相同,完全排除主观意向影响。所以概率抽样又叫随机抽样(Random sampling)。概率抽样有科学的统计理论基础,可以用概率理论给以解释,在营销调研中大多采用概率

2、抽样。,非概率抽样,非概率抽样与概率抽样相反,在抽样时,总体结构中的每一个单位被选为样本单位的概率是不相同或不可知的。样本可以按照调查人员设定的标准抽选。在营销调查中有时为了简单或方便也可使用非概率抽样,而且只要抽样工作适当,其准确度也会达到概率抽样的程度。,第二节抽样设计过程,一、抽样的意义 1、可以节省调查费用。 2、决策者可以尽快获取信息,进行决策。 3、对于无限总体或具有抽象的抽样结构特征的总体,同样可以进行有效地观察或调查。 4、对于破坏性的调查,只能进行抽样抽查。,二、管理上的抽样目标,从管理上看,抽样是同其他研究项目相结合的,要知道抽样只是获取预期资料数据过程的一个阶段。因此,在

3、满足管理需要方面,应关心下述四个重要方面: 1、总体的定义范围应在决策者同调查者交换意见中作出规定,抽样的资料是经营管理者所关心的代表总体的数据。抽样目标要求所选样本的特征和总体的主要特征相一致。 2、样本应足够地精确,以提供可靠的结果。 3、在时间条件许可的情况下,有可能有效地利用调查的资料来源。也就是说,抽取样本时,作为先前的资料来源的调查对象应给以优先考虑,因为他们与调查者的合作可能更有经验。 4、如果不是十分必要,一般不宜使用非常复杂的抽样方法或花费过长的抽样时间。因为这可能会造成资料到手太晚,容易失去其价值。,三、抽样设计过程,第三节非概率抽样设计,一、方便抽样:顾名思义,方便抽样就

4、是建立在抽样过程中的“方便”或“易接近”基础上的一种抽样方法。通常用于街头行人访问和柜台前的顾客访问。 适用于探索性或实验性调查,也适用于在调查的预检测阶段,如预检一下人们对问卷中问题的反应和理解程度。 方便抽样法的缺点主要是:1、样本只有在目标总体单位差异小的情况下才有代表性,否则会有很大偶然性,准确性差。2、不能用于描述性调查或因果关系调查中的对目标总体数据的估计。,一、方便抽样,在一次6点钟的播出中提出了下述问题:“你是否认为麦迪逊社区中允许喝酒的年龄应降低至18岁?”现有的法定年龄是21岁。结果那一晚几乎有4 000人拨入电话,并且78的人选择降低年龄要求!很明显,在一个18万人的社区

5、中4 000个反应“一定具有代表性”!错。可以想像,总体中的一定部分比其他人对这个问题更有兴趣。有些赞成者甚至多次拨打赞成的号码。这个样本绝对没有代表性。 而且,增加样本容量也不能说明具有代表性。样本的代表性必须由抽样程序来保证。如果由于参与者是志愿的或出于方便原因而选择该样本元素,则抽样计划不能保证样本的代表性。基于方便基础上选样的样本,不管其容量,很少能保证代表性。所以,对于描述性或因果性研究不推荐使用方便抽样。,二、配额控制抽样,所谓配额控制抽样是指按某种标准将调查总体单位分类,确定各类中分配的样本单位数,然后由调查人员按分配的比例在各类总体单位中主观判断抽取样本单位的方法。例如某一地区

6、居民区,有80%的汉民,18%的回民和2%的其他少数民族居民,采用配额控制抽样,就要按比例分配样本单位数额,按比例抽取样本单位。 配额控制抽样又分为独立控制配额抽样和相互控制配额抽样。,二、配额控制抽样,独立控制配额抽样是指调查人员按一个分类标准分配数额并抽选样本的抽样方法。例如,对某地区进行化妆品消费需求调查,确定样本容量为400名,确定年龄、性别、收入三个分类标准。于是独立控制配额抽样可设计如下(见表7一2):,二、配额控制抽样,相互控制配额抽样是指调查人员按两个或两个以上的分类标准分类并交叉配额的要求,抽取样本单位的抽样方法。比如对上例我们可重新对其进行抽样设计如表7一5。,配额控制抽样

7、的具体实施过程,(1)根据营销调查目的和要求以及总体中各单位的性质和客观条件,选定调查的分类标准,作为总体分类依据。 (2)确定各分类标准的样本分配比例。这一步一般是按选定的标准将总体分类后,再综合考虑以下四方面因素确定样本分配比例:各类单位占总体单位总量的比例;各类单位内部差异程度;在实现调查目的过程中各类单位所处的地位和作用;在各类中抽选样本和实现调查的难易程度。确定在各控制标准中的样本配额比例后,一般要列出配额比例表。 (3)确定各分类标准下的样本单位配额。 (4)配额指派,抽选样本单位(调查单位)。即由调查员根据 派到的配额范围,判断抽选出单位。,配额控制抽样法的潜在缺点,(1)有时会

8、遇到总体单位的情况不清楚,或难于确定总体的有关特征,这时确定样本配额比例难度就大,就不宜使用配额控制抽样设计,否则会影响样本的有效性或代表性。 (2)由于现场访问人员必须承担完成规定特征的人数配额的任务,有时他们是有压力的。不负责的调查人员容易敷衍了事,比如他正在寻找一位非常难找的人,而找到他进行访问即可完成配额,这时他可能急中生智用他人替代,如果这样的事多了,肯定对样本的有效性是不利的。 (3)即使样本确定符合配额中所使用的特征要求,有时一也可能由于其他因素使其在研究中失真。比如,访问员只能在白大去访问他所分配的区域,完成配额,同时恰好是要进行家庭访问。这时就往往找不到符合要求的先生或女士,

9、即在家里恭候的很少是符合特征要求的调查对象。 这种配额控制抽样方法在美国的市场营销调查中应用非常广泛,一些营销学家说:“该方法甚至比随机抽样法应用要广泛”。,三、判断抽样,判断抽样是一种经思考或主观判断来抽取样本进行调查的方法,判断抽样的样本代表性如何,完全取决于调查人员本身的知识、经验和判断能力,因为具体样本单位的抽选完全是由主观判断而定。 按照判断抽样方式的不同,又分为见解抽样法和统计判断法。,三、判断抽样,见解抽样是指由熟知总体情况的人(如专家或调查人员)来判断并决定,总体中哪些成员可构成与调查有关的合适的代表(样本单位)。 统计判断法,是指以事先明确选择标准,详细研究有关选择标准的资料

10、为基础,寻找出合乎标准规格的样本成员,进行调查的方法。因此,这里的样本单位的选择是有意识、有目的的,而不是随机的。 判断抽样的优点是操作简单、方便;在多层或多阶抽样过程中有应用价值。但其缺点是主观性、随意性强,不容易保障样本的代表性,抽样误差难以控制。因此使用判断抽样法应以严格的管理为前提。,四、雪球抽样,雪球抽样是指先利用随机方法或社会调查选出第一批受访者;抽样后,再根据原始受访者提供的信息去联系其他受访者。当总体很难寻找或十分稀少时,可采用此法。例如对单亲家庭的抽样最好使用此法,因为单亲家庭是稀少的、难寻找的现象。 目前,市场营销调查中常用的非概率抽样设计主要就是上述四种方法。,第四节概率

11、抽样设计,一、简单随机抽样 简单随机抽样又称单纯随机抽样,它是指对总体不进行任何分组、归类或排序等,而完全按随机原则抽取样本的方法。其特点是总体结构内的每个单位被抽中的概率完全相等,各单位之间相互独立,没有任何关联性和排斥性。其具体操作有两种方法: (一)抽签法 首先给总体中的每个单位编上号,然后将序号写到标签或卡片上,建立一总体构架,然后将标签搅拌均匀,再从中抽选;被抽到的号码所代表的单位即为样本的一员,直到抽足预先规定的样本容量为止。这种方法比较麻烦,工作量大。 (二)随机数表法 这种方法实际上是用随机数表代替了抽签法的标签或卡片,可以省去制作卡片的环节。随机数表是用特别编码机或电子计算机

12、编制成的数字群,完全符合随机原则,一般为查用方便编成五位一组。,二、系统抽样,系统抽样又叫等距抽样,它是在随机选取第一个样本单位以后,每隔n个单位再选取其他所有样本单位进行调查的方法。 系统抽样过程可分四步:将总体单位按一定标准有序排列,编上序号。如果排列标准采用与调查项目有关的标识,如收入高低、年龄大小等依高低次序排队,则称其为有关标识系统抽样;如果排列标准无特定标识,即与调查项目无关,如以编号、地理位、地名笔划、工商企业名录等作为排列依据,则称其为无关标识系统抽样。按随机原则确定第一个样本单位的位次并抽样。计算以第一个样本单位为起点的各样本单位间的抽样距离。公式为 其中R为抽样距离:N为总

13、体单位总量;n为样本容量。按确定的抽样距离进行实际抽取样本,直到满足样本容量。,二、系统抽样,系统抽样的优点是:它能产生比简单随机抽样更具代表性的样本。因为总体的各部分都能在一定程度上被包括到样本中,能保证被抽取的样本单位在总体中均匀分布。在调查的组织工作上有许多方便之处,便于抽样,容易实施。因此在营销调查中经常会使用系统抽样方法。 但是,系统抽样也有其缺点。当总体单位排序恰好与抽样间隔周期一致时,存在着可能选取到一个严重偏差的样本的风险。比如在以家庭为单位的市场调查中,如果按照户口簿上的名单进行系统抽样,而一连串的家庭都是一夫一妻一子女,如每隔3人或6人或9人抽一个做样本,要么全抽中丈夫,要

14、么全抽中妻子或孩子。无论哪一套起点的样本都缺乏代表性。因此,只要第一个样本单位不按随机原则抽取,那么系统抽样就成了非概率抽样。,三、分层抽样,分层抽样又称类型抽样,它是根据市场调查的目的和要求将总体单位按其属性特征分为若干层(或类型),使同层内的元素差异较小,层与层之间的元素差异较大,然后从每层(或类型)中随机挑选样本。这种抽样设计的依据是同质总体产生的样本其抽样误差小于异质总体。因此,分层抽样设计的理论目的是为了缩小抽样误差。,分层抽样,例如,我们要抽样调查家庭成员平均消费支出的情况,我们可将家庭总体按家庭人数分层(类),如表7一7。我们可以分别在各层中批取一定量家庭组成样本进行调查,用所得

15、数值推断总体水平。,分层抽样设计的关键是要解决好三个问题:,(一)选择适当的分层(类)标准 (二)科学合理地分层(类) 层(类)的划分应注意的问题是:各层之间应有清楚的界限,每一层包括什么,不包括什么,不能模棱两可;不允许既可属于这一层,又可属于那一层;而且各层单位数量之和应等于调查总体单位总量,不允许互相交叉或有遗漏;层的数目不宜太多,否则将失去层的特征,不便于在各层中抽样。 (三)确定好各层中抽选的样本单位数 这是保证样本代表性的关键:一般可根据具体情况采用两种设计方式:成比例的分层样本和不成比例的分层样本。 1.成比例的分层样本 从各层抽取多少样本单位,可以按各层总体单位数与总体单位总量

16、之比例确定,也可以不按此比例确定,而前者似乎要简单一些。成比例的分层样本也就是按照上述比例确定的样本,它的量的确定等于样本容量乘以各层所占比例的积之和。,2.不成比例的分层样本,反映各层在总体中重要性的因素,如上例中的各类食品店销售额百分比因素就属这种情况,于是连锁店应抽取104个(400 x 26 %),而小型零售占只抽取36家(400 x 9 %)即可。 各层内部单位间的差异程度大小。差异程度大的层应分配其多些样本单位;差异程度小的层应分配其少些样本单位。 各层实现抽样调查的平均费用多少。一般应按最低成本原则确定各层样本单位。,分层抽样的优点与缺点,分层抽样的优点是:它适用于总体单位数量较

17、多且单位间差异较大的调查对象;在样本容量相同时,它比简单随机抽样和系统抽样的抽样误差小,或者在抽样误差要求一定时,它比简单随机抽样和系统抽样所需样本容量小,代表性强。因此在我国的社会购买力调查、居民家庭收支调查、商品销售调查、产品产量等调查中,经常应用分层抽样法 当然,分层抽样也有其局限性。主要是它要求调查设计人员必须对总体单位的情况有较多的了解,否则难以设计出科学合理的分层样本。而要做到这一点往往是比较困难的,或者必须花费更多的时间和精力。,四、整群抽样,整群抽样是先把总体按其自然形态(一般是地域范围)分为若干群,然后随机抽选一两个或若干个群作为样本,并对已抽中的群所包括的单位进行全面调查。

18、 整群抽样与分层抽样既相同又有明显区别。整群抽样是按群体来分层,可看做是分层抽样的特殊形式。但它们之间有两点主要区别:分组要求不同。即分层抽样中要求各层间差异较大而层内差异较小;整群抽样要求群内差异大而群间差异较小。样本单位的分布不同。即分层抽样中样本单位较均匀地分布于各层内;而整群抽样中的样本单位集中于抽中的几个群体内。,整群抽样的优点与分类,整群抽样设计的优点是:它适用于没有或难以构造总体框架的总体的抽样调杳。比如某地区或城市由于某种原因难以拿出一个全面的总体单位列表;即使有,可能也已过时,这时最好使用整群抽样法。调查单位比较集中,工作方便,可以减少调查人员旅途往返时间和费用。但另一方面,

19、也正由于调查单位集中,显著地影响了一单位分布的均匀性,导致在样本容量一样情况下,整群抽样的抽样误差大于其他方法的抽样误差。所以最好在那些由情况大体类同而比较复杂的团体或群体组成的总体内使用整群抽样法,因为这时的样本代表性会强一些。 整群抽样根据总体的大小与差异程度不同、样本代表性的要求不同以及调查费用等因素,可以分为单阶段整群抽样、两阶段整群抽样和多阶段整群抽样。,(一)单阶段整群抽样,单阶段整群抽样,就是将总体分成若干群后,随机抽取一两个或若干个群作为样本,然后直接对这部分群内每个单位进行普查,用普查数据推断总体的情况。例如,假定调查人员想调查一下某市居民对洗涤剂类产品的消费情况,为企业进行

20、市场细分提供决策依据。若采取单阶段整群抽样,其具体做法是: 列出某市的全部街区。 从全部街区中按简单随机抽样法抽取n个街区,作为样本; 对n个街区内的全部家庭户用直接访问法、电话访问法或邮递访问法,调查其购买使用的洗涤剂类产品的基本情况,并估计出某市洗涤剂类产品市场的情况。在抽样过程中,只要抽到了“群”,也就等于抽到了样本单位(调查单位),所以称其为单阶段整群抽样。,(二)两阶段整群抽样,在样本容量一定情况下,为了提高样本代表性,有时可将整群抽样设计为两个阶段。即先将调查总体各单位按一定标准(一般是区域)分成若干群体作为抽样的一段群体;然后将各段群体又分成若干小的群体,作为第二段群体;再按照随

21、机原则,先抽选出若干一段群体即为一段样本群,然后再在一段样本群体中抽选出第二段样本群;最后,对第二段样本群体进行全面调查以推断总体的情况。,(二)两阶段整群抽样,(三)多阶段整群抽样,多阶段整群抽样设计就是一种从大群中抽小群的抽样方法。例如,我们可以从30个省级群体抽取部分一段群体,从部分省级群(一段群体)中分别抽取部分区、县级群体作为二段群体;从抽中的区、县级群体(二段群体)中抽取部分乡镇或街区作为三段群体;从三段群体中抽取部分村庄或居委会作为四段群体;最后从四段群体中抽取要求的家庭户组成最后的样本。,多阶段整群抽样设计,基本原则为各阶段抽样比的积等于总的抽样概率。现将上述两阶段抽样所用例子

22、改为:自200个街区中抽取部分街区;从选中的街区中抽取居委会;再从选中的居委会中选取居民户的三阶段整群抽样。假设各街区中每个街区有20个居委会,共40万个家庭;最后要抽取2000个家庭作为样本进行调查。于是总的抽样比(概率)为2000/4000001/200。按此抽样比我们可有下述三阶段抽样的多种设计方法见表7一10)。,多阶段整群抽样设计,多阶段整群抽样的优点,(1)由于多阶段抽样过程,前几个阶段都是过渡性的,直到最后一个阶段才能抽取实地调查单位,因此,多阶段抽样设计,为最后抽取调查单位提供了极大的便利。 (2)在调查总体范围大、单位非常多、情况复杂的抽样调查中,采用多阶段抽样,可以节约大量

23、人力、旅途往返费用和时间。 (3)可以使抽样方式更加灵活和多样化。这种多阶段抽样设计实际上可看做是各种抽样方式结合应用的抽样设计。,(四)概率与样本容量成比例的抽样,当遇到抽样群体大小极不相同时,最好利用抽选概率与样本容量成比例的抽样方法,简称PPS法。这种方法实际上是对前述几种方法的修正,使得原先大小不同的群体被抽中的概率相同变得不同,以保证样本容量大的群体被抽中的可能性大于样本容量小的群体。,(四)概率与样本容量成比例的抽样操作过程,1、决定在最后阶段抽取的样本总容量和调查群的平均规模。 2、列出(或估计)各群体实际包括的最终样本单位数。 3、计算出抽样构架的累计容量。(样本容量大的概率越

24、大) 4、用简单随机抽样法抽取3个居委会,即为第一段抽样。 5、检验第一阶段被抽中的群休的有关信息后,即进行第二阶段抽样。,(四)概率与样本容量成比例的抽样操作过程,(五)户转人抽样,在对整群抽样样本实施具体调查时,经常会遇到一个很重要又很具体的问题(其他抽样方式有时也会遇到),就是要准确合理地确定具体访问对象的问题。最后抽中的“群”是企业,访问对象是董事长、总经理、副总经理,还是某个部的部长?这显然是一个严肃的问题;最后抽中的“群”是家庭户,那么访问对象是这个家庭的女主人、男主人还是其他人呢?还是规定的年龄(如18周岁)以上的全部成员呢?这也是应很好地落实的问题。上述这类问题我们归结为“户转

25、人”问题。这个问题解决得如何,也直接影响着最后凋查的结果。 从理论上说,不管哪一个“群”,都应该选取有发言权、决策权的人作为直接访问对象。如企业群中在购买电脑、办公设备这些小的问题上,就没必要把总经理定为直接访问人。只询问有关部长甚至购买人员即可。在家庭群中往往确定家庭主妇或男主人为访问对象即可。但当有时难以进行这种人为判断时,最好的办法是将候选人员进行随机抽样确定。,户转人抽样,美国教授克什创造了户转人随机抽样程序表。 (1)首先确定户的编号,这个编号在问卷中即为问卷编号。 (2)确定该户中符合调查对象条件的人数,如有几个成员在18周岁以上。 (3)将符合调查对象条件的人按年龄从小到大顺序排

26、列,或从大到小顺序排列。 (4)查表,以确定何人为被调查对象。方法是:以户编号尾数为“列”,以符合条件的家庭成员人数排列为“行”,行列相交点上的号码表示该户被调查成员的顺序号和调查该户年龄排行的第几号成员。该随机抽样表见表7一12.,户转人抽样,第五节 样本容量确定,一些概念 置信区间法 正态分布 置信区间 抽样分布 样本容量 用平均数确定样本容量 用百分率确定样本容量,正态分布,正态分布的特点 是一族分布,每个分布由均值和方差决定 分布形状象一个钟,是对称的,尾端向两个方向无限延伸,理论上不会与横轴相交 一些常用的概率一个标准差内68.26%,2个标准差内95.44%,三个标准差内99.72

27、%,差标准正态分布表,置信区间,95置信区间Z=1.96 99%置信区间Z=2.58,置信区间,例如平均汽车一年的行驶里程是12000英里,标准差是3000英里。95的样本范围是 120001.96*3000=17880 12000-1.96*3000=6120 612017880是95的置信区间。,抽样分布,总体 抽样框 调查对象 有效样本,样本容量确定,样本均值的抽样分布 95置信区间,样本容量,公式推导 95可能性误差是,样本容量的确定,用平均数确定 Z标准误差的置信水平 总体标准差 E可接受的抽样误差范围,不重复抽样,用平均数确定样本容量,保险公司估计投保人的年龄的总体均值.如果要求边际误差为2年,在95%置信度水平下,应选择多少人作为样本?假设标准差为7.2年 n=1.962*7.22/22=50,用比率确定样本容量,比率p一般不知道,可以使用经验值,预期值,或令p=0.5,不重复抽样,用比率确定样本容量,某银行信用卡公司对持卡人在月末余额为0的持卡人的比率进行估计.假定希望误差不超过0.03,置信水平为98%,如果预期公司持卡人中有70%的人月末余额为0,应选择多大的样本容量,总体容量和样本容量,当样本容量占

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论