版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章市场调查基本技术市场普查第一节市场抽样调查技术第二节问卷设计技术第三节第一节市场普查
一、市场普查的含义和特点二、市场普查的方式三、市场普查的基本原则和作用一、市场普查的含义和特点1.市场普查的含义市场普查,又称全面市场调查,是指为了搜集一定时空范围的调查对象的全面系统的资料,对调查对象的全部个体单位所进行的一次性全面调查。实际应用中有宏观、中观、微观三大层次之分。(1)专门性(2)全面性(3)一次性(4)准确性(5)标准化程度高(6)调查费用比较高2.市场普查的特点二、市场普查的方式(一)搜集资料的方式1.上门登记2.填报表格3.查阅资料(二)组织方式1.一般市场普查一般市场普查是结合日常登记和核算资料,通过定期报表而进行的一种市场普查方式。快速市场普查是由组织领导市场普查工作的最高机关直接把市场普查任务布置到基层单位,各基层单位则把调查结果直接报送给组织领导市场普查工作的最高领导的一种市场普查方式。2.快速市场普查快速普查除了快速外,还具有如下主要特点:(1)调查采用直达方式;(2)资料汇总工作集中在组织领导市场普查的最高机关进行;(3)普查项目少。快速普查的缺点是:普查项目有限,花费较大。所以快速普查只有在特殊的情况下才采用。三、市场普查的基本原则和作用1.市场普查的基本原则(1)必须统一规定调查项目,确保调查内容的一致性;(2)必须统一规定调查的标准时点,保证调查数据时间的一致性;(3)必须统一制定各种标准,保证调查数据的标准化;(4)必须统一调查的步骤和方法,调查范围内各调查点必须统一步骤和方法。(1)通过市场普查可以获得比较全面的原始资料和可靠的数据资料,有利于宏观决策和市场决策;(2)通过市场普查可以全面反映相关市场对象的基本信息,进行不同时期的比较分析,找出市场变化的规律及其发展趋势。2.市场普查的作用第二节市场抽样调查技术
一、市场抽样调查技术的含义与特点二、市场抽样调查技术的程序和作用三、市场抽样调查技术中的基本概念四、随机抽样五、非随机抽样本节内容属课程重难点知识,主要包括以下四个方面的知识点:1.抽样调查的基本含义、特点、作用和程序;抽样调查的有关基本概念。2.抽样调查的类型。3.抽样误差的计算。4.样本容量的确定。注:针对课本内容会有增减。一、市场抽样调查技术的含义与特点引例:钢板应该焊在哪里(一)市场抽样调查技术的含义市场抽样调查技术是指调查者为了特定的调研目的,按照一定的程序从调查总体中抽取一部分单位作为样本,对样本进行分析或观察,并根据样本统计量估计总体情况的一种非全面调查方法。抽查的理论基础:概率论(非全面调查另有:重点调查典型调查)(二)市场抽样调查技术的特点1.费用低、易推广2.质量高、可信赖3.时间短、收效快二、市场抽样调查技术的程序和作用(一)抽样调查技术的程序市场抽样调查有比较严密的程序,只有按一定程序进行市场抽样调查,才能保证市场抽样调查顺利完成,取得理想的调查效果。市场抽样调查一般可分为以下几个步骤。确定市场调查总体是根据市场抽样调查目的的要求,明确市场调查对象的内涵、外延及具体的总体单位数量,并对市场调查总体进行必要的分析。(包括确定抽样框)1.确定调查总体个体单位编号是对市场调查总体的各个个体单位进行编号。在采用市场抽样调查的情况下,需要对总体中的每一个个体进行编号,以使抽样选出的个体更具有代表性。2.个体单位编号选择调查样本是在调查总体中选定具体的需要对其实施调查的样本。
选择调查样本,首先需要确定市场抽样调查的方法,即确定采用随机抽样,还是非随机抽样;其次要确定具体的抽样方法,即是采用纯随机抽样还是分层抽样,或是分群抽样,等等;再次要确定样本容量,即样本所包含的个体单位的个数。3.选择调查样本实施市场调查就是对选定的样本进行市场调查,即运用适当的市场调查技术方法对所抽取的样本单位进行逐个调查,取得第一手资料。4.实施市场调查推断总体结果就是用样本指标推断总体指标的结果,是市场抽样调查的最后一步工作,是对总体认识的过程,也是市场抽样调查的目的所在。5.推断总体结果(二)抽样调查技术的作用1.在无法或很难进行全面市场调查时,可以用市场抽样调查法来推断市场总体情况2.某些场合虽然可以采用全面市场调查,但抽样调查仍有其独到之处3.市场抽样调查适用于市场资料及时性很强的现象4.市场抽样调查可以对全面市场调查资料进行核实三、市场抽样调查技术中的基本概念1.总体与样本(1)总体,又称全及总体或母体,是所要调查研究的市场现象的全体,它是具有同质性和差异性的许多个别事物的集合体。调查对象范围内所有调查单位构成的集合。总体单位数目通常用N表示。总体可分为:有限总体无限总体总体的特征:同质性、差异性、大量性、相对性(2)样本,又称样本总体或子样,是从总体中抽出来的一部分单位的综合体。样本中包含的单位个数称为样本容量,用n表示,n一般较小。n/N称为抽样比,一般比值较小。(1)抽样框是一个包括全部总体单位的框架,用来代表总体,以便从中抽取样本。一般是一份纸面上的名单。2.抽样框与抽样单位(2)抽样单位是指样本抽取过程中的单位形式,亦即从抽样框中直接抽取的单位。抽样单位可能是总体中的基本单位,也可能是总体中的基本单位的集合。(1)样本容量是指样本的大小,即一个样本中包含的样本单位的多少,又称样本量。样本容量的大小,受抽样调查的精度要求、总体各单位的标志变异程度、抽样估计的可信程度、抽样方式方法等因素的制约。3.样本容量与样本单位(2)样本单位是构成样本的基本单位,与总体单位的形式是一致的,样本单位可以直接从总体中抽取总体单位,亦可从抽样单位中产生。(1)总体分布是总体各单位标志值的分布状况,又称总体结构。4.总体分布、样本分布与抽样分布(2)样本分布是样本中各样本单位标志值的分布状况,又称样本结构。当样本量足够大时,样本分布趋于总体分布。(3)抽样分布是从总体中抽取的所有可能的样本的统计量构成的分布。根据中心极限定量,当样本量足够大时,样本均值等统计量的分布趋近于正态分布,因而可用正态分布来作区间估计。
正态分布(normaldistribution)又名高斯分布(Gaussiandistribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ=0,σ=1的正态分布。(1)抽样方式是指抽样调查的组织方式,通常有随机抽样和非随机抽样两种。5.抽样方式与抽样方法(2)抽样方法是指在抽样调查的组织方式既定的前提下,从总体的全部单位(个体)中抽取n个单位组成样本的方法。通常有重复抽样与不重复抽样两种抽取方法,而重复抽样与不重复抽样的具体实施,又有不同的具体做法。从N个总体单位中抽取n个组成样本,有两种抽取方法。(1)重复抽样是指从总体单位中每抽出一个单位进行登记后,放回去,混合均匀后,再抽下一个,直到抽满n个为止。重复抽样有可能出现极大值或极小值组成的极端样本。6.重复抽样与不重复抽样(2)不重复抽样是指从总体单位中每次抽出一个单位进行登记后,不再放回参加下一次抽取,依次下去,直到抽满n个为止。不重复抽样可以避免极端样本出现,抽样误差比重复抽样小。(1)参数,又称总体指标或全及指标,是根据总体各单位标志值计算的指标。参数在抽样时往往是未知的,是需要进行推断的。参数通常有总体均值()(读X拔),总体标准差(),总体比率或称总体成数(P)等。总体指标:未知但确定的量7.参数与统计量总体平均数:总体所有单位指标值的平均值。(简单式)总体成数:一个现象两种表现,每种表现标志个数占总体的比重。P+Q=1
总体方差:说明总体指标变异程度。
(简单式)总体均方差:即标准差,方差去平方。(简单式)(2)统计量,又称样本指标,是根据样本各单位标志值所计算的指标。统计量随样本不同而不同,因而是一个随机变量。统计量通常有样本均值(),样本标准差(S),样本比率或称样本成数(p)等。注:样本指标通过调查,是已知的量。但由于可能的样本有很多,我们抽出来的只是其一,所以样本指标是不确定的量。样本指标公式与总体指标公式类似,不再罗列。样本可能数目样本可能数目应根据排列和组合的不同,加以确定。所谓排列就是考虑顺序,如随机抽取两个单位为一个样本,先抽到A,后抽到B和先抽到B,后抽到A,即AB和BA算两个样本;所谓组合就是不考虑顺序,如随机抽取两个单位为一个样本,先抽到A,后抽到B和先抽到B,后抽到A,只算一个样本。由此,我们有如下四种抽样数目的确定方法:
1)、考虑顺序不重复抽样:
(排列)2)、考虑顺序重复抽样:(排列)
3)、不考虑顺序不重复抽样:(组合)
4)、不考虑顺序重复抽样:(组合)例:假设1、2、3、4、5五个数字,选2个数字组成一个样本,那么样本个数:
1)考虑顺序不重复抽样的可能样本个数=
(个)
2)考虑顺序重复抽样的可能样本个数=(个)
3)不考虑顺序不重复抽样的可能样本个数=
(个)
4)不考虑顺序重复抽样的可能样本个数=(个)(1)抽样误差是抽样调查所得的结果与未知的总体指标之间的差异。调查样本从调查总体抽取出来,具有一定的代表性,但样本和总体毕竟不是一回事。调查误差登记性/工作性误差(广义抽样误差)
代表性误差系统误差
随机误差平均误差(狭义抽样误差)极限/允许误差注:登记性/工作性误差+系统误差非抽样误差8.抽样误差影响抽样误差(随机抽样)大小的因素有:A.总体单位之间的标志变异程度。即总体方差或总体均方差/标准差。
总体单位的变异程度越大,在确定样本下的抽样误差就越大;总体单位的变异程度越小,在确定样本下的抽样误差就越小。B.样本容量多少与抽样误差大小有关。
样本单位数越多,占总体的比重越大,则抽样指标的代表性就越强,抽样误差就越小;反之,样本单位数越少,占总体的比重越小,则抽样指标就不能准确地反映总体的特征,样本的代表性就越弱,抽样误差就越大。C.抽样方法的不同,抽样误差大小也不相同。
重复抽样的误差比不重复抽样的误差稍大。可由后述公式观察到。D.市场调查的组织形式。如随机抽样又有简单随机抽样﹑等距抽样﹑分层抽样和整群抽样等形式,不同的组织形式下的抽样误差相差也比较大。抽样误差是不可避免的,但对于随机抽样,我们可以预先计算出这种误差的大小,并将其控制在调查精度所要求的范围之内。至于非随机抽样,则难以计算和控制误差。我们本章所讲的抽样误差都是基于随机抽样。(2)抽样平均误差(抽样标准误差)。抽样误差的大小常用抽样平均误差来反映,而抽样平均误差是指所有可能的样本均值(或样本成数)与总体均值(或总体成数)的标准差。抽样平均误差概括地反映了所有可能的样本指标(样本平均数或样本成数)与总体指标(总体平均数或总体成数)相差的平均程度,其重要意义在于既是衡量样本对总体代表性大小的一个重要尺度,又是计算样本指标和总体指标之间变异范围的一个依据,也是在抽样调查中用来确定样本容量大小的依据之一。
原始公式为:样本平均数的抽样平均误差样本成数的抽样平均误差
式中:——代表样本平均数的抽样平均误差;——代表样本成数的抽样平均误差;
M——代表样本(可能的)个数。在实际计算中,由于调查对象的总体单位往往很多,可能的样本个数会非常大,不可能也没有必要把所有可能的样本都抽出来加以研究,所以不能运用上述的原始公式来计算平均误差。数理统计学已经证明抽样平均误差可以用下面的公司来计算:注:以下公式都是基于简单随机抽样,其他随机抽样调查形式的抽样误差计算公式有所不同,但都是在以下公式基础上转化而来。A.基于平均数的重复抽样抽样平均误差的计算公式:
式中:代表抽样平均误差
代表总体平均方差
n代表样本容量注:一般要进行换算,=或以样本标准差代替。也可以采取经验估算等等。例:对某区域上班族午餐费用进行调查,随即抽取了200人做样本,调查发现品均每天每人的午餐费用是8元,午餐费的标准差是25元.求:1)计算午餐费用的抽样平均误差。(11-12BW)B.基于平均数的不重复抽样
抽样平均误差的计算公式:
式中:N代表总体单位数
1-代表修正系数
例:从某厂生产的10000只日光灯管中随机抽取100只进行检查,假如该产品平均使用标准差为100小时,请分别计算在重复抽样条件下和不重复条件下该厂日光灯管平均使用寿命的平均误差。C.基于成数的重复抽样
抽样平均误差的计算公式
式中:代表成数(相对数)抽样误差P代表成数(相对数)n代表样本容量
例:从某厂生产的10000件产品中,随机抽取100件进行调查,测得有80件为合格产品,在重复抽样条件下,试求产品合格率的抽样平均误差?D.基于成数的不重复抽样
抽样平均误差计算公式:
在上述计算抽样平均误差的公式中,总体标准差和总体成数通常未知,可采用以下方法替代:a:用历史数据替代。可以用所掌握的以前(近期)或同类地区的同类现象总体指标来替代。如果有几个不同的替代数据,为了保证我们对抽样误差的估计有更大的把握,标准差要选用数值大的,成数要选接近0.5的。b:用样本指标来替代。样本指标往往很接近总体指标,所以在市场调查实践中往往用样本标准差和样本成数来替代相应的总体指标。如果在调查之前必须要计算抽样平均误差,可以先组织一次小规模的试验性调查来获取数据。注:当总体单位N非常大或者是无限总体时,而n往往比较小,所以修正系数(1-n/N)趋向于1,则不重复抽样的抽样平均误差计算公式可用重复抽样的抽样平均误差计算公式替代。例:某高校有在校学生10000人,从中随机抽选100人测量体重,得到的平均体重为58千克,标准差为10千克。问用这个样本的平均体重去估计全校学生的平均体重,抽样的平均误差是多少?(3)抽样极限误差抽样平均误差概括地反映了所有可能的样本的某个指标与总体相应指标的平均误差程度,但一般情况下我们不可能抽出所有样本,而只能通过一次具体的抽样来对总体进行研究。这样我们就必须要去研究一次具体的抽样误差的可能范围,这就引出了抽样极限误差的概念。
抽样极限误差也被称为允许误差,是在一定概率下抽样误差的可能范围,是样本指标与总体指标之间的离差的绝对值。符号为:在一定的概率下:
即:在一定的概率下样本指标与相应的总体指标的误差的绝对值不超过抽样极限误差。如果我们计算出了抽样极限误差,就可以推断出在一定概率条件下总体指标的数字范围:
抽样极限误差是样本指标值与总体指标值的离差的绝对值,而抽样平均误差是所有可能样本的指标值与总体指标值之间的平均离差,所以他们存在一定的联系。抽样极限误差等于概率度(t)乘以抽样平均误差。
t表示概率度,它与给定概率是一一对应的,可以通过查询正态分布概率表获得。它表达的是在一定概率下,样本指标与总体指标之间的抽样极限误差相对于抽样平均误差的倍数。
例:对某区域上班族午餐费用进行调查,随即抽取了200人做样本,调查发现品均每天每人的午餐费用是8元,午餐费的标准差是25元.求:2)以95.45%的概率保持下,试估计该区域上班族的午餐费用。例:对某电视台的节目进行收视率调查,随机抽取1000名观众,有750人收看该节目,要求以95.45%的概率保证程度估计该节目的收视率。在实际市场抽样调查中,我们总是希望抽样估计的误差(抽样极限误差)尽可能小(注:这与计算的时候把误差往大里估计不矛盾),即调查的精确度尽可能高,又希望估计的把握程度尽可能大,但这两者往往是相互矛盾的。从上述抽样极限误差的计算公式可以看出:如果其他条件不变,提高估计的把握程度(可信度)会增大允许误差(抽样极限误差),从而降低估计的精确度;缩小允许误差(抽样极限误差),即调高估计的精确度,则会降低估计的把握程度,所以,在实际市场抽样调查中要根据具体的情况来对抽样估计的精确度和把握程度进行统筹。概率表
概率度
把握程度
允许误差
1.001.501.962.003.000.68270.88640.950.95450.99731.00μ1.50μ1.96μ2.00μ3.00μ例:某电子元件厂生产了10万只某型号的电子元器件,按简单随机抽样方式抽取了2000只进行检测,检测结果合格率为95%,废品率5%。试以99.73%的把握程度计算抽样极限误差,并推算出该月生产合格率的可能范围。注:F(t)=99.73%,则t=3.009.抽样容量的确定
影响抽样数目(随机抽样)多少的因素有:(1)总体中各单位之间标志值的变异程度。即总体方差或总体均方差/标准差。总体单位的变异程度越大,则应加大抽取的样本单位数目;总体单位的变异程度越小,则可少抽。(2)允许误差的大小。抽样极限误差越大,这意味着对抽样调查的精确度要求就越低,在其他条件不变的前提下,所必须抽取的样本单位数目就越少;反之,亦然。(3)抽样估计概率F(t)。其他条件不变,要提高抽样估计的概率,即提高抽样估计的把握程度,这样抽取更多的样本单位;反之,如果抽样估计的性质决定不需要太高的把握程度,则可以适当减少所抽取的样本单位数目(4)不同的抽样方法也会影响抽样数目的多少。重复抽样比不重复抽样的误差要大,所以采用重复抽样方法要多抽取一些样本单位。不过当总体单位数很大时,1-n/N趋向于1,两种公式计算出来的结果差异可以忽略,所以在实际中,当总体单位数很大时,一般都按重复抽样的公式计算必要的样本单位的数目。(5)市场调查的组织形式。如随机抽样又有简单随机抽样﹑等距抽样﹑分层抽样和整群抽样等形式,不同的组织形式所要求的必要的样本单位数目也不相同。本知识点介绍的是在简单随机抽样形式下确定样本单位数目的公式,与其他抽样组织形式下计算样本单位数目的公式会有所区别。
非随机抽样的样本容量不能计算确定,只能由调查人员自行把握。(1)基于平均数指标重复抽样抽样容量的计算公式(组织形式为简单随机抽样):
式中::样本容量:总体方差:概率度平方:平均数允许误差平方
抽样容量的计算公式某企业准备在某城市进行商业调查,需要对该市居民收入水平进行调查,并已经从该市统计部门公布的统计资料中得知该市居民户年均收入的均方差为2000元,如果以95%的可靠程度,极限误差不超过100元,采取重复抽样,则该企业至少要对多少户居民进行调查?(已知F(t)=95%时,t=1.96)(2)基于平均数指标不重复抽样抽样容量的计算公式(组织形式为简单随机抽样):
式中::总体单位数
例:某农场进行小麦产量抽样调查,小麦播种总面积为1万亩,采用不重复简单随机抽样,从中抽选了100亩进行实割实测,测得样本平均亩产200KG,方差77KG。以95.45%的可靠性推断该农场小麦平均亩产,若要求抽样允许误差不超过1KG,问至少应该抽取多少亩作为样本?(3)基于成数指标的重复抽样抽样容量的计算公式(组织形式为简单随机抽样):
例:一稽查员对某大型公司08年度的财务状况进行审计,在审计测试中采用重复抽样的方法抽查了100张财务凭证,发现其中有12张存在问题。现在要求以95.45%的把握来推断问题的程度,允许误差不超过1%,应抽取多少张财务凭证进行审查?(4)基于成数指标不重复抽样抽样容量的计算公式(组织形式为简单随机抽样):
式中::概率度:成数:成数允许误差:抽样数目
例:一稽查员对某大型公司08年度的财务状况进行审计,在审计测试中采用不重复抽样的方法抽查了100张财务凭证,发现其中有12张存在问题。现在要求以95.45%的把握来推断问题的程度,允许误差不超过1%,应抽取多少张财务凭证进行审查?(1)点估计,也叫定值估计,当样本容量足够大时,可直接用样本均值代替总体均值,用样本比率代替总体比率,可据此计算有关总体指标,就是点估计。10.点估计与区间估计(2)区间估计是用一个取值区间及其出现的概率来估计总体参数,具体说,区间估计是用样本统计量和抽样标准误差来构造总体参数的取值范围,并用一定的概率来保证总体参数落在估计的区间内。其概率称为置信概率,概率的保证程度称为可靠性或置信度(Z),估计区间称为置信区间。如总体均值:总体比率:其中,又称为允许误差或极限误差,记作,和称为估计的相对精度。△
四、随机抽样(一)简单随机抽样(二)分层抽样(三)等距抽样(四)整群抽样(五)目录抽样(六)多阶段抽样(一)简单随机抽样是一种最简单又是最基本的抽样组织形式。1、定义是在总体单位中不进行任何有目的的选择,而是按照随机原则用纯粹偶然的方法抽取样本。2、具体操作(1)对总体的每个单位进行编号(2)在随机数码表中从任何一个编号开始,向上向下或跳跃选取编号(3)组成样本3、具体抽取方法直接抽取法;抽签法;掷骰子法;摇奖机法;随机数表法;计算机随机数法;统计软件法等表4-1乱数表034743738697742467621676622766125685992655595635640122779439369647366142811457205650267507969668273137548246224954435582469863716242533237323290797853050372931531624309901737932378411117537161266378593321128629576017344470281712135662373518572455068816955567197864560782094727965440332038269883508775770474476798105071755242074438491745096278835103748311259347
【小知识】要从94家上市公司中抽取12家作为调查样本,可先将94家公司由1至94编号N=94,然后在乱数表上任意上一点一行(或一列)中一个数字作为起点数,从这个数字按上下或左右顺序读起,每出现两个数字,即为被抽中的单位码号。假定本例是从第四行左边第五个数字向右顺序读起,则所抽取单位是:682731050372931555595635,此过程中的96因大于94,舍去不用是因为在顺序抽取的过程中,遇到比编号大的数字,应该舍去。4、简单随机抽样的优缺点(1)优点方法简单直观,并且满足概率抽样的一切必要的要求,可保证每个总体单位在抽样时都有相等的被抽中机会;计算抽样误差及对总体指标的推断比较方便。(2)缺点需要在抽样之前编制一份完整的抽样框,并给抽样框中的每一个单位赋予一个编号,这在实际工作中往往难以实现;样本在总体中较分散,使得调查的人、财、物及时间的耗费较大,使调查难以实施;某些事物无法适用简单随机抽样(二)分层抽样1、定义分层随机抽样又叫类型抽样或分类抽样,是指将调查总体所有单位按某些重要标志进行分层(类),然后在各分层(类)内部进行简单随机抽样或等距抽样来抽取样本的一种抽样方式。2、分层抽样效果的影响因素(保证)(1)分层标志:关键中央人民广播电台1992年的全国抽样调查:第一级的分层是按经济发展水平将全国467个地区分成四层:经济发达地区、经济一般发达地区、不发达地区、贫困地区。(2)分层层数:3到5层为宜。3、具体步骤(1)确认目标总体(2)决定样本单位数目(3)决定分层标志(4)将总体按照分层标志分成若干层(5)在每一层中随机抽取出足够的样本单位4、具体方法(1)等比例分层抽样(2)分层最佳抽样(非等比例分层抽样)(1)等比例分层抽样是按各分层(类型)中单位的数量占总体单位数量的比例分配各层的样本数量。这种方法适用于分层后分层群体内部差异显著较小的分层随机抽样。其计算公式如下:ni=n×Ni/N(i=1,2,…,k)
式中ni——第i个分层被分配的样本数量;n——总的样本数量Ni——第i个分层群体中个体的数量;N——总体中个体的数量例:某地共有居民20000户,,按经济收入高低进行分类,高收入居民4000户,中等的收入居民12000户,低收入居民4000户。要从中选取200户进行购买力调查。如何确定样本单位数量?
(2)非等比例分层抽样(分层最佳抽样)它不按各层中总体单位的数量占全及总体单位数量的比例分配各层的样本单位数目,而是根据各层的总体标准差的大小来调整各层样本单位数目。NiSi
ni=n·——(i=1,2,…,k)ΣNiSi
式中:K——分层的层数n——总的样本单位数量ni—第i个分层的样本单位数量Ni——第i个分层群体被分配的总体单位数量Si——第i个分层的总体标准差例:某地共有居民20000户,,按经济收入高低进行分类,高收入居民4000户,中等的收入居民12000户,低收入居民4000户。而各层总体标准差分别为:300,200,100元。要从中选取200户进行购买力调查。又如何确定样本单位数量?
调查单位数与样本标准差乘积计算表各层次(不同经济收入)各层的调查单位数(户)Ni各层的总体标准差(元)Si乘积NiSi
高中低4000120004000
30020010012000002400000400000∑NiSi200004000000
注:各层的总体标准差的差别主要凭经验判断确定,上例是假定的,也可通过调查后用计算公式确定。按照公式计算,得出各层应抽选的样本单位数为:高收入样本单位数目为:200×(1200000÷4000000)=60(户)中收入样本单位数目为:200×(2400000÷4000000)=120(户)低收入样本单位数目为:200×(400000÷4000000)=20(户)【分析提示】各层的样本单位数目是按各种经济收入下的各层的总体标准差的大小进行调整的,按计算。
(3)等比例分层抽样与非等比例分层抽样的比较样本单位数目按各层标准离差大小分配比按个体数量比例分配更精细一些,有利于进一步克服总体中个体之间的差异对抽样效果的影响。样本单位数目按各层标准离差大小的分配,更适用于分层后分层群体内部差异仍然不小的分层抽样。
5、分层抽样的优缺点(1)优点抽样精度、抽样效率高。分层抽样比简单随机抽样和等距抽样更为精确,特别是当总体较大、内部结构复杂时,分层抽样常能取得令人满意的效果;不但可估计总体的参数,也可以估计每层的参数;所得样本更具有代表性(2)缺点在实际工作中,分层并不容易,需要必要的资料,从而耗费额外的费用;分层抽样要求各层的大小都是已知的,当它们不能精确得知时,就需要通过别的手段进行估计,这不仅增加了抽样设计的难度,而且也会带来新的误差。6、分层抽样的适用范围(1)在调查中不仅需要对总体进行参数估计,也需要对各层的参数进行估计,并且考虑它们的精度;(2)要保证样本更具有代表性;(3)为使调查的组织及数据的汇总都比较方便。在实际中应用非常广泛,几乎所有的大型抽样调查项目都要用到分层抽样技术,有时与其他抽样方法结合使用。(三)等距抽样1、定义等距抽样又称机械抽样,或系统抽样法,就是先将全及总体各单位按一定标志排列起来,然后按照固定的顺序和一定的间隔来抽取样本单位。等距抽样是市场调查中应用最广的抽样方式之一。
排列所依的标准有两种:一种是按与调查项目无关的标志排队。一种是按与调查项目有关的标志排队。2、具体操作(1)将N个总体单位按一定顺序排列(2)根据总体单位数N和样本单位数n计算出抽样间隔,k=N/n(是一整数,非整数则用进一法取整)(3)在1和k之间随机选一个数字,称为随机起点r(4)根据r和k从总体中抽取n个样本单位:r,r+k,r+2k,r+3k,…r+(n-1)k,抽样完成。3、具体方法(1)随机起点等距抽样(2)循环等距抽样(3)中点等距抽样(4)对称等距抽样4、等距抽样的优缺点(1)优点简单易行,易确定样本单位。甚至可以不需要抽样框,无需编号,易为非专业人员所掌握且便于监督检查;样本单位在总体中分布均匀,有利于提高精度。(2)缺点运用等距抽样的前提是要有全及总体每个单位的有关资料,特别是按有关标志排队时,往往要有较为详细具体的资料,这是一项非常复杂和细致的工作;误差计算比较复杂;如果单位的排列存在周期性变化,而抽样者对此缺乏了解,抽出样本的代表性就很差。即当抽选间隔和被调查对象本身的节奏性相重合时,就会影响调查的精度。【观念应用】某地区有零售店110户,采用等距离抽样方法抽选11户进行调查。第一步,将总体调查对象(110户零售店)进行编号,即从1号至110号。第二步,确定抽样间隔。已知调查总体N=110,样本数n=11户,故抽样间隔=110/11=10(户)。第三步,确定起抽号数。用10张卡片(即抽样间隔)从1号至10号编号,然后从中随机抽取1张作为起抽数号。如果抽出的是2号,2号则为起抽号数。第四步,确定被抽取单位。从起抽号开始,按照抽样间隔选择样本单位。本例从2号起每隔10号抽选一个,直至抽足11个为止。计算方法是:22+10=122+10×2=22……2+10×10=102即所抽的单位是编号为2、12、22、32、42、52、62、72、82、92、102的11个零售店。【分析提示】
等距离抽样,方法简单,省却了一个个抽样的麻烦,适用于大规模调查。还能使样本单位均匀地分散在调查总体中,不会集中于某些层次,增加了样本的代表性。
(四)整群抽样1、定义整群抽样又称分群随机抽样,是指将调查总体按某种标志分割成一定数量并且与总体(或彼此)相似的子群体,用子群体作为样本单位进行纯随机抽样,然后对子群体样本内部的个体进行普查的抽样组织形式。
2、分层抽样和分群抽样的比较(1)相同之处都是先对总体中的群体再对个体进行操作;都不是完全随机地抽取样本,都涉及一定的规则:分层随机抽样涉及的规则是分层群体之间属性的差异,而分群随机抽样涉及的规则是子群体之间的相似;都能提高随机抽样的效率和改善随机抽样的结果。(2)不同之处操作的群体不同,分层抽样操作的是分层群体,层间差异大,层内差异小;而分群抽样操作的是子群体,群间差异小,群内差异大;分层抽样:先全部,再部分,即全部分层都要抽到,层内随机抽取合适数量的部分单位;分群抽样:先部分,再全部,即随机抽取合适数量的部分子群,群内所有单位全部调查。适用的总体不同,分层抽样适用于容易按属性差异进行群体划分的总体,而分群抽样适用于不容易按属性差异但容易按可见标志进行群体划分的总体。
3、分群抽样的优缺点(1)优点抽样框容易获得,且抽样框的编制得以简化;方便实施,节省费用;有时能得到较高的精度。(2)缺点易产生抽样误差。正因为以群体为单位进行抽选,抽选单位比较集中,明显影响了样本分布的均衡性。因此,分群抽样与其他抽样比较,在抽样单位数目相同的条件下抽差误差较大,代表性较低;分群大小的差异。
4、分群随机抽样影响因素(1)群的划分(2)群的规模5、适用范围(1)当缺少基本单位的名单而难以直接从总体中抽取所要调查的基本单位,但以由基本单位组成的群体作为抽样单位却有现成的名单或有明显的空间界限时,分群抽样就显得方便实用,避免了编制基本单位名单的问题;(2)对费用及时间有要求;(3)为满足抽样调查本身目的的要求;(出生率、流动率)(4)如果某些总体的各个群之间的差异不大。
6、分群抽样需注意的问题(1)分群抽样的随机性体现在群与群之间不重叠,群的抽选按概率确定;(2)分群抽样是以群为单位的纯随机抽样;(3)分群抽样对于群而言是非全面调查,而对于被抽中的群内基本单位而言则是全面调查,是“先部分,后全部”的差异组织形式与分层抽样正好相反;(4)分群抽样是多阶段抽样的前提和基础。(五)目录抽样目录抽样通常用于企业调查,首先编制一份企业目录(称为抽样框),目录中一般包括企业名称、从业人数、产值、产量、利润等以往的资料。然后,考虑总体分布是否呈偏斜状态分布,如果呈极偏斜状态分布,则将其中的大型企业单列出来作全面调查,对剩余的为数众多的小型企业则实行抽样调查。目录抽样是全面调查与抽样调查的有机结合,可以减少抽样误差,提高精确度。(六)多阶段抽样1、定义是把抽取样本的过程分成两个或多个阶段进行,即先抽取大的调查单元,在大单元中抽小单元的抽样组织形式。2、特点(1)对基本调查单位的抽选不是一步完成的;(2)组织调查比较方便,尤其对那些基本单位多且分散的总体,可以用地理区域或行政系统标志进行多阶段抽样;(3)多阶段抽样是多种抽样方法的结合产物。总结:随机抽样技术特点随机抽样技术的优点随机抽样是从总体中按照随机原则抽取一部分单位进行的调查,误差可控。随机抽样技术能够计算调查结果的可靠程度。随机抽样技术的不足对所有调查单位都给予平等看待,难以体现重点相对非随机抽样而言,随机抽样抽样范围比较广,所需时间长,参加调查的人员和费用多需要具有一定专业技术的专业人员进行抽样和资料分析。一般调查人员难以胜任。
各种各样的随机抽样有一个共同的特点:每一个样本单位被抽取的机会是相等的。但在市场调查中,调研者面对的往往是复杂的、动态不定的市场要素,在某些情况下所面临的调查对象并不具备随机抽样的条件,有时由于时间和经费的限制而不能进行随机抽样时,就只能进行非随机抽样。五、非随机抽样非随机抽样:是指抽样时不遵循随机原则,而是按照调查人员的主观判断或标准抽选样本单位的抽样技术。其基本原则是在选择样本单位时,可以加入人的主观因素,使总体中每一个个体被抽取的机会是不均等的,是一种主观的抽样方式。当总体各单位间离散程度不大,且调查人员具有丰富的调查经验时,往往采用非随机抽样。非随机抽样方式主要有四种:任意抽样、判断抽样、配额抽样和滚雪球抽样。(一)任意抽样任意抽样又称便利抽样、方便抽样、偶遇抽样,是由调查者从工作方便出发,在调查对象范围内,随意抽选一定数量的样本单位的一种抽样方法。是纯粹以便利为基础的抽样。“街头拦截法”和“空间抽样法”是方便抽样的两种最常见的方法。“街头拦截法”是在街上或路口任意找某个行人,将其作为被调查者进行调查。“空间抽样法”是对某一聚集的人群,从空间的不同方向和方位对他们进行抽样调查。实行任意抽样的基本理论依据是:认为总体中的每一个单位都是相同的,随意选取任何一个样本单位都是一样的。任意抽样的优点:任意抽样简便易行,能及时取得所需的信息资料,省时、省力、节约经费。任意抽样的缺点:抽样误差较大,结果的可信度较低。一般多在正式的市场调查之前进行准备工作时或非正式的探测性调查时采用。只有在调查总体各单位之间的差异不大时,抽取的样本才具有较高的代表性。(二)判断抽样判断抽样又称目的抽样,是凭调查人员的主观意愿、经验和知识,从总体中选择具有代表性的样本单位作为调查对象的一种抽样方法。判断抽样选取样本单位一般有两种方法:一种由专家判断决定样本单位;一种根据所掌握的统计资料,按一定标准选定样本单位,一般选择最能代表普遍情况的调查对象,常以“平均型”或“多数型”为标准,应尽量避免选择“极端型”。如某批发商要调查零售商销售其产品的情况,可根据自己的经验和判断,选定一些具有代表性的零售商作为样本单位进行调查。“判断”主要包括两方面内容:一是对总体的判断,即判断总体的规模、结构等;二是判断样本单位的代表性,即面对调查总体你认为哪些个体对总体具有代表性,并将其选出作为样本单位。判断抽样方法的优点:判断抽样简便、易行、及时,符合调查目的和特殊需要;可以充分利用调查样本单位的已知资料。判断抽样的缺点:易发生主观判断产生的抽样误差。精确性依赖于调查者对调查对象的了解程度、判断水平和对结果的解释。适用于调查总体中各调查单位的差异较小,调查单位比较少及选择的样本单位有较大的代表性的情况。(三)配额抽样1、配额抽样的概念配额抽样是非随机抽样中最流行的一种。
是将总体中的所有单位按一定的标志分为若干类(组、层),确定各类(组、层)中样本单位分配的数额,然后在每类(组、层)中用任意抽样或判断抽样方法选取样本单位的一种抽样方式。配额抽样能保证样本单位在总体中均匀分布,调查结果比较可靠。2、配额抽样的依据配额抽样认为特征相同的调查对象,其市场反应、要求大致相似,误差不大,因而不必要按随机抽样方法抽取样本。配额抽样与随机抽样中的分层抽样类似,也有非随机抽样中判断抽样的特点,是随机抽样和非随机抽样的结合。3、配额抽样的具体方法(1)独立控制配额抽样(单标志分组)(2)非独立控制配额抽样(复合标志分组)(1)独立控制配额抽样
这是分别独立地按分层特征分配样本单位数的方法。例:对某市进行化妆品消费需求调查,确定样本容量为200名,选择消费者年龄、性别、收入3个标准分类。各分类标准的样本单位配额数如下表:收入水平年龄性别高10050以上50男50中7025-50100女150低3025以下50----合计200合计200合计200(2)交叉控制配额抽样
是指对调查对象的各个特征的样本单位数额交叉分配,即同时对具有两种或两种以上控制特征的每一样本单位数目都作出具体规定。例:上例中,三种分类标准交叉分配的样本单位数的配额见下表:收入水平高中低合计性别男女男女男女年龄50以上619413265025-50133792631210025以下6195132550合计25751852723200合计1007030交叉控制配额抽样的具体步骤确定控制特征确定被调查者总体中各种“控制特征”的比例确定每层的样本单位数目配额分配,确定调查单位4、配额抽样方法的优缺点配额抽样方法的优点:简单易行,节省费用,能较快地取得调查结果;样本不至于偏重某一层只要调查的项目设计得当,分析方法正确,所取得的结果就比较可靠配额抽样方法的缺点:对可依据的资料要求高不能象随机抽样那样估计抽样误差不能对调查人员访问调查对象的方法加以规定和控制(四)滚雪球抽样滚雪球抽样又叫推荐抽样,是以滚雪球的方式抽取样本,即通过少量的样本单位以获得更多样本单位信息的抽样方法。可认为是一种非随机的多阶段抽样,调查的阶段越多,就越接近对总体的真实估计。如对某些特殊消费群体的调查具体操作步骤:选取少量样本单位,一般是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 轧饲料机市场需求与消费特点分析
- 2024年度影视制作团队聘用合同
- 电器接线盒市场需求与消费特点分析
- 动物驱逐剂市场发展现状调查及供需格局分析预测报告
- 2024年度定点物业管理服务合同:大安农场学校
- 2024年度淋浴房项目风险管理合同
- 2024年度000吨冷冻食品物流运输合同
- 2024年度工厂搬迁搬运服务合同
- 2024年度物联网应用开发与设备采购合同
- 2024届备战高考数学易错题《函数及其应用、指对幂函数》含答案解析
- 会阴血肿护理查房课件
- 太阳能供热和空气源热泵对比
- 酒店客房部服务质量不达标扣分标准
- 自身免疫性溶血性贫血最全课件
- 强化学习与大模型
- 急性酒精中毒诊治专家共识
- Unit4+Natural+Disarster+Language+points(1)+课件【知识精讲精研】高中英语人教版(2019)必修第一册
- 植树问题(二)(一等奖创新教学设计)人教版五年级上册数学
- 4.5 多边形和圆的初步认识 课件-北师大版数学七年级上册
- 电子政务的运营理念为主题论文电子政务的理念及其全球发展概况
- 《大数据思维与决策》考试复习题库(含答案)
评论
0/150
提交评论