第6讲 抽样与误差_第1页
第6讲 抽样与误差_第2页
第6讲 抽样与误差_第3页
第6讲 抽样与误差_第4页
第6讲 抽样与误差_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

市场调研Marketing

Research福建工程学院管理学院

本讲内容了解抽样调查的相关概念、过程和适用条件;理解抽样技术的含义;掌握抽样技术的种类;理解非随机抽样和随机抽样的含义和实际应用;理解抽样误差的来源;掌握平均数和成数条件下误差和样本量计算方法。第6讲抽样与误差

学习导航抽样调查的概念与步骤抽样调查的含义抽样调查的适用条件抽样调查的步骤抽样技术抽样技术的类型随机抽样技术非随机抽样技术误差来源与计算误差的来源抽样误差的计算平均数条件下样本量的计算非抽样误差的计算成数条件下样本量的计算样本容量的计算★简单随机抽样★分层抽样★分群抽样★系统抽样★便利抽样★判断抽样★配额抽样★滚雪球抽样★固定样本组★随机抽样与非随机抽样的涵义★随机抽样与非随机抽样的适用条件★抽样误差★非抽样误差第6讲抽样与误差

6.1抽样调查的概念、适用条件和步骤6.1.1抽样调查的含义普查:抽样调查是相对于普查而言的,普查(census)是对构成总体的每一个体都进行调查,并从中得出有关总体特征的结论的一种调查方法。抽样调查:是抽取具有代表性的样本,测算样本结果,并以样本结果推断总体特征的一种调查方法。

第6讲抽样与误差

【小知识】

现代抽样方法的先驱—盖洛普

“一种客观测量报刊读者阅读兴趣的新方法”是乔治·盖洛普在艾奥瓦大学写博士论文时用的题目。通过对“DesMoinesRegisterandTribune”和瑞士数学家雅克布·贝努里具有200年历史的概率统计理论的研究,盖洛普在抽样技术领域取得了进展。他指出,当抽样计划中的调查对象涵盖广泛,涉及到不同地域、不同种族、不同经济层次的各种人时,你只需随机抽取而无需采访每个人。尽管当时他的方法不能为每个人理解和认同,但是现在,这已经被广泛使用。盖洛普通常引出一些特例来解释他自己在说什么或做什么。假设有7000个白豆子和3000个黑豆子十分均匀地混合在一起,装在一个桶里。当你舀出100个时,你大约可以拿到70个白豆子和30个黑豆子,而且你失误的机率可以用数学方法计算出来。只要桶里的豆子多于一把,那么你出错的机率就少于3%。30年代早期,盖洛普在全国很受欢迎。他成为Drake大学新闻系的系主任,然后转至西北大学。在此期间,他从事美国东北部报刊的读者调查。1932年夏天,一家新的广告代理商电扬广告公司,邀请他去纽约创立一个旨在评估广告效果的调查部门,并制定一套调查方案。同年,他利用他的民意测验法帮助他的岳母竞选艾奥瓦州议员。这使他确信他的抽样调查方法不仅在数豆子和报刊读者调查方面有效,并有助于选举人。只要你了解到抽样范围具有广泛性,白人、黑人,男性、女性,富有、贫穷,城市、郊区,共和党、民主党,只要有一部分人代表他们所属的总体,你就可以通过采访相对少的一部分人,来预测选举结果或反映公众对其关心问题的态度。盖洛普证实,通过科学抽样,可以准确地估测出总体的指标。同时,在抽样过程中,可以节省大量资金。

6.1.2抽样调查的适用条件

比较项目抽查普查预算小大可用时间短长总体规模大小特征差异小大抽样误差的成本低高非抽样误差的成本高低对个体案例的关注是否第6讲抽样与误差

6.1.3抽样调查的步骤定义调查总体个体编号抽选样本实施调查测算结果第6讲抽样与误差

1、定义总体总体界定的正确与否直接影响抽样调查结果应用的有效性。总体可以从以下几方面进行定义:地理因素、人口统计因素、产品或服务使用情况、认知程度等。在实际的调查中,通常可以借助调查表中的过滤性问题来判断某个个体是否属于调查总体,定义总体的因素包括:因素举例地理因素抽样调查的地域范围——顾客活动的范围,可以是一个国家,一个城市,一个县。人口统计因素根据调查目的和产品的目标市场,从人口统计的角度确定对调查结果起重大影响的那些个体。如年龄阶段、收入层次、职业群体等。产品/服务使用情况对于一些市场调查来说,它们的调查总体通常可以根据消费者对企业产品或者服务的使用情况来定义,包括是否使用以及使用频率等。第6讲抽样与误差

2、个体编号

即对所确定的调查总体中的个体进行编号。一般,只有当调查者选择随机抽样技术时,这一步骤才是必要的,其目的是为了简化抽样工作。当调查总体规模较大时,编号的工作量会增大,调查者可能会采用分层抽样或分群抽样来简化编号工作。

第6讲抽样与误差

3、抽选样本这一过程实施涉及两个方面的内容:一是要明确所采取的抽样方法;二是根据调查者对抽样精确度等要求,计算从调查总体中所要抽取的样本数量,运用事先确定的抽样方法抽选样本。第6讲抽样与误差

4、实施调查调研组织者必须密切关注调研人员是否严格按照抽样设计的方案,即按照既定的抽样方法实施调查,这直接关系到整个市场调研工作质量的优劣。5、测算结果根据抽样调查得出的信息,运用一定的统计技术和理论推断调查总体的相关特征,作为最终提出决策建议的依据。

6.2抽样技术6.2.1抽样技术的类型抽样类型随机抽样非随机抽样简单随机抽样分层随机抽样分群随机抽样等距随机抽样任意抽样判断抽样滚雪球抽样固定样本组配额抽样第6讲抽样与误差

1、随机抽样与非随机抽样的涵义随机抽样(probabilitysampling):也称作概率抽样,就是总体中的每一个体都具有相等的机会被抽取为样本单位的抽样技术。非随机抽样(non-probabilitysampling):也称非概率抽样,指调研总体中的每一个体被抽取的机会不平等,这种不平等的产生是由于调研人员根据主观设定的某些标准来选择样本。第6讲抽样与误差

2、随机抽样与非随机抽样的适用条件抉择考虑方面非随机抽样随机抽样研究的性质探索性归纳性误差非抽样误差大抽样误差大变异程度同质(低)异质(高)统计不利有利操作有利不利第6讲抽样与误差

6.2.2随机抽样技术---简单随机抽样简单随机抽样:又称纯随机抽样,是按等概率原则直接从含有N个单位的总体中随机抽取n个单位组成样本(N>n),抽样过程与调研人员的经验判断完全无关。简单随机抽样是概率抽样的最基本形式,也是其它各种随机抽样技术的基础,通常适用于总体单位之间差异程度较小和数目较少的抽样。简单随机抽样在具体操作中最常用的是抽签法和随机数表法。第6讲抽样与误差

抽签法抽签法的操作:即先把调查总体的每个个体依次编号,并将这些号码分别标记在相互独立的、完全相同、匀质物体上,然后将这些物体放入某一容器(如纸盒)搅拌均匀,然后由调研人员从中任意抽取,将与抽到的号码相对应的个体作为样本单位,如此重复数次,直到抽足预定的样本数目为止。由抽中的号码所代表的个体组成的就是一个简单随机样本。抽签法的优点在于操作简便,但当调查总体单位很多时,编号的工作量很大,搅拌均匀也比较难以做到。抽签法往往只适用于总体规模较小的市场调研。

第6讲抽样与误差

随机数表法随机数表法:又称乱数表法,其操作过程如下:先将总体中的每个个体随机编号,然后从随机数表的任一位置开始,或向左,或向右,或向上,或向下,或一定间隔向一个固定方向顺序取数,选定的数字所对应的单元即入样,重复的数字和没有对应单元的数字去掉,直至抽足所需样本量为止。要注意的是,所有号码的位数均应相同。对于总体单位很多的情形,通常采用随机数表法来抽样。

第6讲抽样与误差

随机数表法示例【例】要从94家上市公司中抽取12家作为调查样本,可先将94家公司由1至94编号N=94,然后在乱数表上任意上一点一行(或一列)中一个数字作为起点数,从这个数字按上下或左右顺序读起,每出现两个数字,即为被抽中的单位码号。假定本例是从第四行左边第八个数字向右顺序读起,则所抽取单位是:682731050372931555595635,此过程中的96因大于94,舍去不用是因为在顺序抽取的过程中,遇到比编号大的数字,应该舍去。第6讲抽样与误差

乱数表034743738697742467621676622766125685992655595635640122779439369647366142811457205650267507969668273137548246224954435582469863716242533237323290797853050372931531624309901737932378411117537161266378593321128629576017344470281712135662373518572455068816955567197864560782094727965440332038269883508775770474476798105071755242074438491745096278835103748311259347

6.2.2随机抽样技术---分层随机抽样分层随机抽样:亦称分类抽样或类型抽样,指把调查总体按照其属性不同分为若干层次或类型,然后在各层或类型按一定的比例关系随机抽取样本。分层随机抽样需要注意以下几点:(1)分层的标志必须可以把总体分隔为相互排斥的次层,而层间不能有交叉重叠;(2)分层的标志必须与关心的总体特征相关;(3)各层之间差异大,但层内差异小;(4)各层单位数目和比例必须可以获得;(5)分层的层次数量不宜太多;(6)在各层抽取样本的方法依然是简单随机抽样。分层随机抽样的类型:通常包括比例分层抽样和非比例分层抽样。比例分层随机抽样是指按各层的单位数量占总体单位数量的比例分配各层的样本数量。

第6讲抽样与误差

比例分层抽样例:根据某产品的销售统计数据,家庭用户总体为2万户,其中,低收入家庭为4000户,中等收入家庭为12000户,高收入家庭为4000户。为进一步研究该产品用户使用状况,需对200户进行抽样调查,如采用比例分层抽样,低、中、高收入家庭用户的样本容量分别为多少?抽样结果如下。

家庭收入分层户数(万)所占比例(%)各层样本容量低0.42040中1.260120高0.42040总计2100200第6讲抽样与误差

非比例分层抽样非比例分层抽样,也称最佳抽样法,是指根据其他因,如各层的标准差来分配各层所应抽取的样本数目。这种法的优点在于可以降低各层的差,提高样本的可信度。按分层标准差大小调整各层样本单位数,其计算公式为:式中:ni:第i层应抽取的样本数目;n:应抽取的样本总数;Ni:第i层的包含的单位总数;Si:第i层的标准差。第6讲抽样与误差

非比例分层抽样示例上题中,如果知道低、中、高层次收入的标准差分别为100,200和300元,请计算非比例分层抽样条件下的样本量?家庭收入分层户数标准差(元)NiSi各层样本容量低400010040000020中120002002400000120高4000300120000060总计2000-4000000200第6讲抽样与误差

注:样本标准差的差别主要凭经验判断确定,上例是假定的,也可通过计算公式确定。计算公式为:样本标准差=√离差的平方和÷样本数目按照公式计算,得出各类型应抽选的样本单位数为:高收入样本单位数目为:200×(1200000÷4000000)=60(户)中收入样本单位数目为:200×(2400000÷4000000)=120(户)低收入样本单位数目为:200×(400000÷4000000)=20(户)

6.2.2随机抽样技术---分群随机抽样分群抽样:也称整群抽样,是按一定的标准把调查总体区分为若干不同的子群体,然后按照简单随机抽样法选取部分子群体进行调查的抽样方法。分群抽样又分为单阶段分群抽样和多阶段分群抽样。运用分群抽样技术抽取样本,先要把调查总体区分为若干个群体,然后用单纯随机抽样法,从中抽取某些群体进行全面调查。如果不是对所抽取的群体进行全面调查,而是进一步划分为若干个小群体,再按随机原则抽取一个或一部分小群体来调查,称为多段分群抽样。运用分群抽样技术抽取样本,抽选工作比较简易方便,抽中的单位比较集中,但是由于样本单位集中在某些群体,而不能均匀分布在总体中的单位,如果群与群之间差异较大,则抽样误差就会增大。第6讲抽样与误差

分群抽样与分层抽样的区别比较项目分层抽样分群抽样分层标志与研究的总体特征相关与研究的总体特征无关子集间差异各层之间差异大各群间同质或差异小子集内个体差异层内个体同质或差异小各群内个体差异大抽样方式各层内分别随机抽取适当个体组成样本随机抽取一个或几个群作为样本第6讲抽样与误差

6.2.2随机抽样技术---系统随机抽样系统抽样:又称等距离抽样,指先将总体中的个体按一定标志进行排列编号,并根据总体单位数和样本单位数计算出抽样距离,然后按照相同的距离或间隔选取样本的一种抽样方法。抽样间隔=总体数(N)÷样本数(n)

它和简单随机抽样一样,需要有完整的抽样框,样本的抽取也是直接从总体中抽取个体,而无其他中间环节。等距离抽样,方法简单,省却了一个个抽样的麻烦,适用于大规模调查。还能使样本均匀地分散在调查总体中,不会集中于某些层次,增加了样本的代表性。第6讲抽样与误差

系统抽样示例【例】某连锁超市要从某地区的100个超市中抽取10个进行调查,采用系统抽样法应如何抽取。第一步,采用随机的方式将总体中的所有个体编号:1,2,3,…,100;第二步,计算抽样间隔,总体数(N)/样本数(n)=100/10=10,抽样距离为10;第三步,用简单随机抽样在抽样距离内(1至10)确定起始编号,假设抽中3;第四步,根据起始号和抽样间隔确定10个应抽取的个体,最终抽取的编号分别为:3,3+10,3+20,3+30,…,3+90,即3,13,23,33,…,93,共10个超市组成样本。第6讲抽样与误差

6.2.3非随机抽样技术---任意抽样任意抽样:也称便利抽样或方便抽样,指调研人员从工作方便出发,在调研对象范围内随意抽选一定数量的样本进行调查,通常没有严格的标准。如在超级市场和车站等进行的街头拦截调查,都属于任意抽样的范畴。操作简单、节约时间和费用是任意抽样的优点。任意抽样一般只适用于非正式的探索性调研,否则会造成较大的误差。第6讲抽样与误差

6.2.3非随机抽样技术---判断抽样判断抽样:是指由调查人员依据自己的经验抽取样本,或由某些有见解的专家选定一定数量的样本进行调研的抽样方法。判断抽样是主观的。判断抽样具体操作中有三种可供选择的方案:一是多数型;二是平均型;三是主观型。判断抽样具有抽样简便的优点,当调研项目的精确度要求不高的情况下会被经常采用。第6讲抽样与误差

6.2.3非随机抽样技术---配额抽样配额抽样:是按一定标准分配样本数额,并在规定数额内由调查人员任意抽选样本。即首先要按控制特征将总体分为若干层次,然后由调查人员主观选定样本。分层抽样与配额抽样的区别比较项目分层抽样配额抽样分层标志与研究的总体特征相关分层标志无特殊要求抽样方式分别从各层内随机抽取适当个体组成样本分别从各层内主观抽取适当个体组成样本分层目的提高样本代表性比较不同群体,解释关系或检验理论第6讲抽样与误差

配额抽样与判断抽样的区别比较项目判断抽样配额抽样抽样要求注重样本“质”的分配注重样本“量”的分配抽样方式主观判断后抽取适当个体组成样本从各层内主观抽取适当个体组成样本特点简便复杂精密第6讲抽样与误差

独立控制配额抽样独立控制配额抽样:调研人员分别独立地按照各类控制特性分配样本数额。【例】某超市需要对其顾客进行调查,选定的三个分类标准为性别、年龄、收入,确定的样本数目为360个,独立控制配额抽样情况如表所示。性别年龄收入男6016至29岁20高2430至44岁30中60女6045至59岁40低3660岁以上30合计120120120第6讲抽样与误差

非独立控制配额抽样非独立控制配额抽样:也称相互控制配额抽样,是调研人员充分考虑各层之间的交叉关系,同时对具有两种或两种以上特性的样本做出具体的规定。非独立控制配额抽样的步骤如下:首先,确定总体分类标准;其次,按确定的分类标准把总体分为若干子群体;第三,计算各子群体在总体中所占的比例;第四,根据各子群体的比例分配各子群体所应抽取的样本数目;第五,根据分配的样本数,在各群抽取相应数量的样本。第6讲抽样与误差

非独立控制配额抽样示例【例】某大学有4000名学生,其中男生占60%,女生占40%,管理类和理工类学生各占50%,大一,大二,大三,大四的学生比例分别为40%,30%,20%,10%,现要抽取500人进行调查,按非独立控制配额抽样,其情况如表6-15所示。男女管理类理工类管理类理工类年级一二三四一二三四一二三四一二三四人数60453015604530154030201040302010第6讲抽样与误差

6.2.3非随机抽样技术---滚雪球抽样滚雪球抽样的操作方法:首先选出一组最初的调查对象,通常是随机选出的,访谈之后,要求这些被访者推荐一些属于目标总体的其他人,根据这些推荐选出后续的被访者。滚雪球抽样主要是用于估计十分稀有的人物特征,例如特别的群体,如私家车的车主等。其主要优点表现在,通过对调研总体设定期望的特征,从而增强了样本个体的相似性。因此,采用这种方法所产生的抽样误差比较小,成本比较低。对于一些难以获得的样本采取这种抽样方法能取得较好的效果。第6讲抽样与误差

6.2.3非随机抽样技术---固定样本组固定样本组:选取的样本固定下来,长期进行调查。这种方法的优点在于其调查对象稳定,可以及时、全面的取得各种所需要的信息,费用低,回收率较高,这也是它在企业实践中被广泛应用的一个重要原因。但固定样本组也同时可能受到一些困扰,如被调查者是职业受访者,参加调研只是为了获取一定的利益,从而可能导致所收集信息的可靠性降低。第6讲抽样与误差

6.3误差来源与计算6.3.1误差的来源总误差抽样误差非抽样误差回答误差拒答误差研究人员误差访谈人员误差调查对象误差替代信息误差总体定义误差抽样框误差测量误差样本选择误差提问误差记录误差欺骗误差理解误差不诚实回答

回答误差回答误差研究人员误差调研人员误差被调查者误差替代信息误差测量误差总体定义误差抽样框误差样本选择误差提问误差记录误差欺骗被调查者理解误差不诚实回答

研究人员误差替代信息误差:主要是由决策人员所需的信息与调研者所搜集的信息之间的差异所导致,尤其是当研究人员对所面临的问题定义不准确时更易产生。测量误差:指市场调研所要获取的信息与调研者通过调研工具所获取的实际信息之间的差异而导致的误差,其根本原因在于研究人员对测量工具的设计不合理。总体定义误差:指与决策人员所关心问题的总体和研究人员所定义的总体之间的不一致导致的误差。抽样框误差:指由定义的总体与所使用的抽样框代表的总体之间的不一致而造成的误差。

调研人员误差样本选择误差:是由于现场调研人员没有严格按照抽样计划的要求抽取样本而导致的,如擅自将随机抽样改为便利抽样。提问误差:在实际调查或访问中,调研人员的表情、肢体语言、语调或者提问的方式都可能会导致被调查者给出不准确或不真实的答案。其原因可能是由于调研人员缺乏相关的调研技巧所导致。记录误差:一个可能的原因是调查人员或者访问人员错误理解了被调查者的答案而记录了错误的信息;另一个可能的原因是调查人员或访问人员漏记了被调查者回答的一些重要信息。欺骗:市场调研的现场工作人员可能为了获取更高的报酬或完成繁重的调研任务而产生作弊行为。这种欺骗行为可能是调研人员或访谈人员一种故意的行为,也可能是调研人员非主观意愿的行为,具体表现主要涉及篡改答案或伪造答案等。

被调查者误差被调查者理解误差:是被调查者对访问人员的提问或者问卷中的问项没有充分理解而导致的回答误差。这一误差的控制关键在于:一是访问人员的访问方式,即是否将问题转化为了被调查者能够回答的形式;二是当没有访问员参与调查的情况下,问项能否被受访者充分理解。不诚实回答:可能是被调查者有意识地对所调查的问题做出不真实的回答而造成的。其深层次的原因可能在于调查人员所问的问题涉及被调查者的隐私或一些相对比较敏感的话题,被调查者出于保护自己的需要而给出不真实的答案。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论