经管营销样本设计_第1页
经管营销样本设计_第2页
经管营销样本设计_第3页
经管营销样本设计_第4页
经管营销样本设计_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节样本设计概述一、抽样的基本术语总体(population):是由市场研究目标明确规定的整个集合。其中的每一个元素称为个体。例:由负有控制虫害责任的Terminix提供服务的大城市地区的家庭的户主。分为有限总体和无限总体

有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的JJJJJJJ样本(sample):是总体的一个具有代表性的子集,样本具有不同的基本单位。样本单位:是组成样本的基本单位。抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法具有经济性、时效性强、适应面广、准确性高等特点总体JJJJJJJ随机样本JJ普查(census)

:是对整个总体的报告。为特定目的专门组织的非经常性全面调查通常是一次性或周期性的一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄总体我国的人口普查从1953年到2000年共进行了五次。从2003年开始进行调整,今后我国的普查将规范化、制度化,即:①人口普查:每逢末尾数字为“0”的年份进行人口普查;②经济普查:我国的经济普查将每10年组织两次,在逢“3”和“8”的年份进行。将第三产业普查与工业普查、基本单位普查以及建筑业普查合在一起就是经济普查;

③农业普查:每逢“6”的年份进行农业普查。抽样误差(samplingerror)

:是在调查因使用的样本而发生的任何误差。引起抽样误差的两个原因:样本选择方法(随机抽样而导致的样本结构与总体结构的差异而产生的);样本的容量。例:W市移动通信公司近期销售业绩平平,而远没有竞争对手联通公司好。他们便对客户实施了一次市场调查,希望能找出原因,提高公司业绩。为了减少成本,公司员工自己实施了调查,他们对公司周围的人及自己的亲朋好友进行了移动公司知名度、美誉度的调查。结果发现,移动公司的知名度和美誉度都远比竞争对手高。公司营销部经理对此百思不得其解。移动公司的这种调查结果可信吗?抽样框:是总体中所有样本单位的完整列表。如:如果市场研究的总体是注册会计师,则可以注册会计师协会的成员目录作为抽样框。抽样框误差:是抽样框不能解释总体的程度。抽样框误差主要来自两个方面:总体一部分成员不在抽样框内;抽样框内一部分成员不属于目标总体。抽样的原因:成本、可行性。方法评价指标抽样普查预算小大调研周期短长调研总体大小大小调研对象的特征变化小大抽样误差的成本低高非抽样误差的成本高低调研的特性有破坏性无破坏性关注个体案例是否二、开发样本计划的程序定义总体识别抽样框设计样本计划(方法、容量)抽取样本,收集数据样本有效性检验必要时再抽样定义总体市场调研活动首先要确定需要了解的问题及内容,然后明确调查对象,并将总体目标描述成相当具体的人口统计学特征或其他特征。从市场调查的范围来看,将所有调查对象的全体称为调查总体。定义总体要明确:总体的范围、性质和构成。例:某超市曾经调查了解附近的大学及周边居民日常消费品的市场状况、消费者的消费理念、消费习惯、消费偏好等,以便调整该超市的商品结构和经营行为,因此,超市周边所有消费者就是这家超市对调查总体的定义。识别抽样框抽样框就是总体单位的集合,是总体的数据目录或全部总体单位的名单。理想的抽样框应具备的条件:包含尽可能多的样本单位,尽可能地将所有样本单位都包含在这个集合之中;所有样本单位出现在这一集合中的概率相等。常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……评估抽样框误差的关键在于两个因素:判断列入抽样框中的人与总体的差异程度;估计总体中哪几类人未列入抽样框中。设计样本计划(方法、容量)样本设计阶段应综合考虑样本设计、数据收集成本和样本容量。在下述章节中详细介绍。抽取样本,收集数据分两个阶段:首先应选择组成样本的元素;其次,从这个元素中获取信息。注意:并不是所有的样本对象愿意接受调查,替代方法有三种:“舍弃”、过多抽样、再抽样。舍弃替代法在系统抽样中经常使用;过多抽样是调研者对无关联率、无反应率和不可用反应的认识的结果;再抽样是在初始抽样后利用抽样框抽取更多名字的程序。样本有效性检验样本有效性检验的实质是向客户做出保证,这个样本是决策者希望对其做出决策的总体的具有代表性的样本。方法有多种形式,其中之一是将样本的人口统计轮廓与已知的档案如人口普查资料进行比较。当对总体的人口统计轮廓存在预先了解时,可以采取上述方法;当不存在这样的预先信息时,有效性检验是不可能的,样本选择方法应能让客户相信这个样本是总体的代表。必要时再抽样样本有效性检验失败时,意味着它不能充分代表总体。进行样本替代时也可能产生这个问题。补救办法:其一,在制表和分析中使用加权方案进行补偿;其二,执行再抽样,选择更多的受访者加入样本直至达到一个令人满意的有效化水平。第二节抽样技术抽样技术可以归为两大类别:概率抽样和非概率抽样。概率抽样(probabilitysampling)也称随机抽样,是指按照随机原则并根据一个已知的概率来抽取样本单位。特点:按一定的概率以随机原则抽取样本,抽取样本时使每个单位都有一定的机会被抽中,可分为等概率抽样和不等概率抽样;每个单位被抽中的概率是已知的,或是可以计算出来的;当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。概率抽样以概率理论为依据,通过随机化的机械操作程序取得样本,所以能避免抽样过程中的人为因素的影响,保证了样本的客观性。虽然随机样本一般不会与总体完全一致,但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质、特征。非概率抽样:指抽取样本时并不遵循随机原则,而是根据主观判断有目的地挑选,或是依照方便、快捷的原则抽取。抽样效果的好坏在很大程度上依赖于抽样者的主观判断能力和经验。特点:操作简便、时效快、成本低。但无法查明样本统计量的分布或这种分布根本就不存在,无法计算抽样误差,无法对估计结果的精确性做出评价,也不能从概率的意义上控制误差,因而在理论上不具备由样本对总体进行推断的依据。一、概率抽样概率抽样的常用方法有:

1、简单随机抽样

2、系统抽样

3、整群抽样

4、分层抽样1、简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为n的样本都有相同的机会(概率)被抽中。抽取元素的具体方法有重复抽样和不重复抽样。三个实际应用:小总体、随机数字拨号和计算机化列表。特点:简单、直观,在抽样框完整时,可直接从中抽取样本。局限性当N很大时,不易构造抽样框,抽出的单位很分散,给实施调查增加了困难,没有利用其他辅助信息以提高估计的效率。2、系统抽样(systematicsampling)

系统抽样是将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度。缺点:如果在元素列表中存在自然的周期性,系统抽样可能产生有严重误差的估计。3、整群抽样(clustersampling)整群抽样是将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。特点抽样时只需群的抽样框,可简化工作量。调查的地点相对集中,节省调查费用,方便调查的实施。缺点是估计的精度较差。4、分层抽样(stratifiedsampling)分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。优点保证样本的结构与总体的结构比较相近,从而提高估计的精度。组织实施调查方便。既可以对总体参数进行估计,也可以对各层的目标量进行估计。课堂讨论:分层抽样和分群抽样的区别分群抽样与分层抽样的相似之处:它们都是根据某种标准把总体划分为若干层(群)。区别:A、分层抽样分成的各层彼此之间差异明显,而每层内部差异很小;分群抽样正好相反,分成的各群彼此差异不大,而每群之内差异明显。B、从抽取样本方式上看,分层抽样每层都按一定数目抽取样本;而分群抽样是抽总群中的若干群,抽出的群全部为样本。如示图1。示图1A群B群C群

A层B层C层高中低高中低高中低高高高中中中低低低概率抽样各种基本组织方式与特点组织方式特点简单随机抽样(也称纯随机抽样)从总体N个单位中,随机抽取n个单位作为样本,使得每个样本都有相同的机会被抽中分层抽样首先将总体分成不同的“层”,然后在每一层中进行抽样。可防止样本构成与总体构成的不一致。等距抽样(也称系统抽样)将总体所有单位按一定顺序排列,随机选择一个初始单位,然后每隔一定距离抽选一个调查单位整群抽样将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查二、非概率抽样不是按照随机原则的方式抽取样本。抽样时,总体单位的入样概率事先未知。总体单位入样与否与调查人员的主观意志有很大关系,因此,难以对样本结果的精确度进行客观评价,且所获得的估计值在统计上不能映射到总体上。非概率抽样最常见的有:方便抽样、判断抽样、参考抽样、配额抽样、自愿样本等方式。26

1、方便抽样定义:调研人员从工作方便出发,在调研对象中随意抽取一定数量的样本进行调查特点:

针对性强

-快捷节省-误差难估适用范围:探测性调查总体同质性强街头拦截式面访调查27

2、判断抽样定义:研究人员凭主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象.方法:专家判断标准样本特点:简单快捷适用范围:总体规模不大平均型众数型均衡型MarketingResearch28

定义:先将总体中所有单位按一定标志分为若干类(组),然后在每个类(组)中用方便或判断抽样选取样本.

控制特征:性别、年龄、收入、职业、文化程度特点:样本具有较高的代表性节省费用

配额抽样多特征分层主观确定样本误差不可估算分层抽样单特征分层随机抽取样本误差可估算3、配额抽样29

配额抽样的实施步骤:选择分层标志区分总体各单位类型(分层)分配样本单位(配额)抽取样本,进行调查30

4、雪球抽样定义:先随机选取一组调查对象,对他们调查后,根据他们提供的信息选择下一个调查对象特点:有针对性-样本间有联系适用范围:特殊消费群体案例:生态旅游调查5、自愿样本定义:被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。例如拨打热线电话等。自愿样本的组成常有集群性,往往集中于某类特定的人群。优点:可提供对特定类型目标的认识。不足:不能根据样本信息估计总体,其结果无法推广。非概率抽样常见的形式及其特点方便抽样它是根据调查者的方便与否来抽取样本的方法。例如街头拦截调查。判断抽样凭调查人员的主观意愿、经验及知识,有目的地从总体中选择一部分单位作样本。参考抽样通过选择一些“种子”样本点,请他们提供更多的样本点信息,调查过程持续下去,形成滚雪球效应,样本量逐渐扩大。配额抽样先将总体中的所有单位按一定标志分为若干组,然后在每个组中按照事先规定的比例或数量(即配额)采用方便抽样或判断抽样的方式抽取调查单位。自愿样本被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。例如拨打热线电话等。33

三、多阶段抽样定义:样本通过两个或以上阶段抽取,先抽取大的调查单元,在大单元中抽取小单元,再在小的单元中抽取更小的单元特点:多阶段抽样,更有代表性组织简单适合于大规模调查

第三节样本容量总体参数与样本统计量的区别样本容量与样本代表性和精确度之间的关系简单随机抽样下的样本容量分层抽样下的样本容量一、总体参数与样本统计量的区别总体参数也叫总体指标,是指反映总体数量特征的指标,记为其常用的有:总体平均数总体比例(成数)P

总体标准差总体方差想一想:这些总体参数我们都能得到吗?样本统计量样本统计量也叫样本指标,反映样本数量特征的指标,记为。其常用的形式有:总体参数与样本统计量的区别总体参数是常数;样本统计量是随机变量总体参数值唯一;样本统计量值不唯一总体参数值未知;样本统计量值可以计算二、样本容量与样本代表性和精确度之间的关系样本容量与样本对总体的代表性无关。样本的代表性是由抽样方法决定的。样本容量不决定代表性,然而影响结果的精确度。样本精确度指样本统计数据接近它所代表的总体真实值的程度。样本容量与样本统计量相对于总体真实值的精确度有直接关系。总而言之,小样本容量与代表性无关,样本容量与精确度相关。三、简单随机抽样下的样本容量1、简单随机抽样下获得的估计值是它们相应的总体值的无偏估计量。n:样本容量yi:对样本中第i个元素的某个特征的测量值:估计的平均值(总体平均值的无偏估计量):估计的样本方差(总体方差的无偏估计量)2、有限总体修正值当目标样本相对于目标总体较大(10%至20%或更多)时,就应当使用修正系数,有限总体修正系数(fpc)以[]给出。Fpc修正的方差公式是:3、样本平均值的估计标准误一个总体参数的估计值的可靠性指它的再现性——一个总体参数的估计值在给定容量的不同样本中如何重复出现。假定没有测量误差,总体参数的估计值的可靠性能以标准误来判断。与样本平均值相关的估计标准误越小,样本估计值的可靠性越大。4、用估计值的标准误构造对总体值的置信限制样本统计量所构造的总体参数的估计区间称为置信区间统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否100%包含总体参数的真值我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间包含总体参数真值的次数所占的比例称为置信水平表示为(1–α)%——α为是总体参数未在区间内的比例常用的置信水平值有99%,95%,90%——相应的

α为0.01,0.05,0.10置信区间与置信水平

均值的抽样分布(1-

)%区间包含了

%的区间未包含

1–aa/2a/2影响区间宽度的因素1.

总体数据的离散程度,用

来测度

2.样本容量,3.置信水平

(1-

),影响

z的大小区间估计的数学表达方式:区间估计基本表达(以估计为例):均值推断方法的选择n是否为大样本

是否已知是否正态总体

是否已知用S估计

用S估计

增大样本容量到30以上是是是是否否否否5、抽样容量的确定······?nN估计总体均值时样本容量的确定

(实践中一般采用大样本)估计总体比例时样本容量的确定【例7-1】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?解:

已知

=2000,E=400,1-

=95%,

z

/2=1.96

即应抽取97人作为样本

注意:计算结果有小数时一律进位。区间估计的图示

x95%的样本

-1.96

x

+1.96

x

99%的样本

-2.58

x

+2.58x

90%的样本

-1.65

x

+1.65

x

【例7-2】根据以往的生产统计,某种产品的合格率约为90%,现要求允许误差为5%,在求95%的置信区间时,应抽取多少个产品作为样本?

解:已知P=90%,

=0.05,=1.96,△=5%应抽取139个产品作为样本(进位取整!)实际中估计总体比例时计算其

抽样容量会碰到的问题1、总体方差不知时,可用样本方差代替2、若有多个可供参考的方差数值,则应选择其中的最大值来计算3、若没有任何方差资料,则可直接选用0.25来计算(想一想为什么?)影响必要抽样数目的因素有哪些?1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论