版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章 抽样设计,第一节 抽样调查概述,一、抽样调查的含义,抽样调查是按照一定的程序,从所研究对象的全体中抽取一部分单位进行调查,并在一定条件下对研究对象的数量特征进行估计和推断。抽样调查包括随机抽样调查和非随机抽样调查两种。,随机抽样调查具有如下特点: 第一,抽样推断是建立在随机取样的基础上。 第二,抽样推断是由部分推算总体的一种方法。,第三,抽样推断以概率论中的大数法则和中心极限定理为理论依据。 第四,抽样推断可以事先计算和控制抽样误差。,二、抽样调查的作用,抽样调查是市场调查中应用非常广泛的一种调查方式。它主要在以下场合应用: 1.在不可能进行市场全面调查的时候,应用抽样调查可以取得市场
2、总体全面的数据。,2.有些现象虽然可以进行全面调查,但实际做起来有困难,这时也可以采用抽样调查取得总体的全面数据。这时也可以采用抽样调查取得总体的全面数据。 3.为了节省调查的人力、费用和时间,可以采用抽样调查代替全面调查。,三、抽样调查的基本概念,1.总体和样本 2.参数、估计量和估计值 3.入样概率与抽样比 4.抽样分布 5.抽样方差和抽样标准误 6.精确性和精度 7.抽样效率与设计效果,(一)总体和样本: 总体是指研究对象的全体,它是由研究对象中的单元组成的。总体中包含单元的数目称作总体容量(或大小);样本是指抽样时按照抽样的规则所抽中的那部分单元所组成的集合。,总体,样本,抽取样本,推
3、断总体,(二)参数、估计量和估计值 反映总体特征的指标通常称为参数,如总体平均数、总体总量和总体比例等。估计量是样本观察值的函数,用它来对总体参数进行估计。根据估计量从具体样本得到的结果称作估计值。 (三)入样概率与抽样比 入样概率是指某个总体单元被选入样本的概率;抽样比是指样本量 n 与总体的容量N的比例,通常用f表示。即,(四)抽样分布 是指估计量的分布。也就是说,如果按照一定的样本容量和一定的抽样方式反复抽取样本,每个样本可以计算一个估计值,这些估计值形成的分布,就是抽样分布。 (五)抽样方差和抽样标准误 也就是估计量的方差和标准差。它表示某个抽样方案,抽样结果的离差大小,方差和标准差愈
4、小,表明估计值接近参数。,(六)精确性和精度 精确性是指在抽样中反复抽样,其结果的差别大小。差别越小,其精确性越高。因此同样也可以用抽样方差来表示精确性。精度则是一个相对的指标,它是抽样方差或标准差与相应的待估参数之比。,相对方差,相对标准误,(七)抽样效率与设计效果 在样本容量相同的情况下,抽样方差越小表明抽样效率越高。设计效果是设计方案的方差与简单随机抽样的方差之比。设计效果通常用英文字母Deff表示:,Deff=,四、抽样的一般程序,确定调查目的和总体范围,制定合适的抽样框,抽选样本容量,抽取样本,参数估计和检验,最终评估,确定抽样方法,抽样设计程序,1、定义目标总体 -用统计的术语来讲
5、,研究的总体是指我们要测量的个体的总和。 -定义一个明确的总体包含的内容 -构成分析的单位是什么?(比如家庭) -抽样的单位是什么? -什么东西指定包括在内? -时限怎么样,即要获取的信息属于哪一段时间? -空间限制如何,是哪些地区,是否限于城市或城市的繁华街区? 2、建立抽样框 抽样框是指为抽样所使用的所有调查单位的名单或清册。,示例,抽样框:,3、确定样本容量 影响样本规模的因素可分为两个方面 与满足数据的可靠性要求有关的因素(如调查经费、时间限制、人力资源 与实际操作上的限制有关的因素(如总体变异、调查精度、总体规模、抽样方式、回答率) 4、明确抽样方法 5、抽选样本 是指按指定方法抽取
6、受访者是指在某一特定地区或任何地区,按照一系列标准直接指定受访者的抽样方法。,第二节 抽样基本方法,概率抽样,简单随机抽样 等距抽样 分层抽样 整群抽样 多阶段抽样,非概率抽样,方便抽样 判断抽样 配额抽样 滚雪球抽样,抽样调查的基本方法,概率抽样 是根据一个已知概率来选取样本单位;并且不应在抽取样本时带有任何倾向性,而是随机选取样本单位。 类型:简单随机抽样、等距抽样、分层抽样、整群抽样、多阶段抽样 非概率抽样 是用一种主观的(非随机的)方法从总体中抽选样本单位。 类型:方便抽样、判断抽样、滚雪球抽样、配额抽样,一、概率抽样方法,(一)简单随机抽样 简单随机抽样是对全及总体完全按照随机原则从
7、中抽取单位加以调查的一种抽样技术形式。 特点:是在每次抽选中都能保证总体中每个单位有相等的中选机会。 方法:直接抽选项法、抽签法、随机数表法、使用计算机模拟抽取。 要求:有完整的抽样框 (名录或地域框),简单随机抽样的具体实施 抽签法 随机数法 使用统计软件直接抽取,准备2000张卡片,写上所有学生的编号,摇匀后抽出300名学生,利用随机数表,从09的第一个个位数,以及两位数,三位数符合某个规律。,SPSS,EXCEL,S-PLUS 等,随机数表,(二)等距抽样,也称机械抽样或系统抽样,首先要选择标志将调查对象的全部个体按一定顺序排队,其次要依简单随机抽样方式从总体中抽取第一个样本点,即所谓随
8、机起点,然后依据按某种固定顺序和规律依次抽取其余样本点,最终构成系统样本。,2.等距抽样的排序方法,有关标志排队法,有关标志 指用于排队的标志与所调查的项目(指标)有密切的关系。 采用有关标志排队可以利用总体的有关信息,提高样本代表性并提高抽样估计精度。,1.什么是等距抽样,无关标志排队法,无关标志指用于排队的标志与所调查的项目(指标)没有直接关系,或者关系很小。 采用无关标志排队的总体实际上是一个随机总体,因而按无关标志排队的系统抽样,可以视为不重复的简单随机抽样。,系统抽样需满足的条件,调查对象中的每个总体单位都必须而且只属于一个系统样本; 任何一个系统样本中所含总体单位数一般都相等; 任
9、何一个系统样本都具有同等被抽中的机会。,3.总体与样本间的相互关系,直线系统抽样 圆形系统抽样或循环系统抽样,它是总体容量 恰好是系统样本容量 的整数倍时的系统抽样,它是目标总体只有 ( )个容量为 的系统样本。,它是指将总体单位排列成首尾相接如同圆形的系统抽样。它是目标总体有 个容量为 的系统样本,而无需考虑总体容量与样本容量的关系。,4.常用的系统抽样方式,随机起点等距抽样。 半距起点等距抽样。 随机起点对称系统抽样。,5.系统抽样的局限性,系统抽样的前提是要有总体中每个单位的有关材料,这是一项很复杂、细致的工作。 当抽选间隔和调查对象本身的循环周期性重合时,就会影响调查的精度。 机械抽样
10、的抽样误差计算较为复杂。,(三)分层抽样,1.分层抽样与分层随机抽样,分层抽样:是先将包含N个总体单位的调查对象按某一标志划分成 个层,然后从含有 ( =1,2, ; )个个体的层中随机抽取 个样本单位组成第 层的层样本,所有这 个层的层样本汇总起来构成的总样本就是容量为 ( )的分层样本。我们也又称它为类型抽样或分类抽样。,分层随机抽样 在每一层中都采用单纯随机抽样法来抽取层样本,所得分层样本被称为分层随机样本。,要求,每个总体单位都必须属于且只属于某一层; 每一层的总体单位数已知; 在任何两层所进行的抽样都是独立的。,2.分层抽样方法,等比例抽样 不等比例抽样,3.分层抽样的特点,可同时对
11、各层的指标进行估计。 实施灵活方便,便于依托行政管理机构进行组织和实施。 可使样本在总体中分布更均匀,从而具有更好的代表性。 可缩小抽样误差,提高调查的精度。,4.分层原则,以与调查的核心项目关系密切的项目为标准。 当总体各标志值之间的差距很大,总体分布非常分散时,以引起其分散的主要原因或标识为分层标志。,(四)整群抽样,整群抽样是将调查对象按某一标志分组后形成的每个群视为单元进行随机抽样,而后对抽中的每个群进行全面调查,也称集团抽样、群体抽样。 分群原则 应选择能使群间方差尽量小,而群内方差尽量大的标志作为分群标志。,1.什么是整群抽样,3.整群抽样的特点,调查单位比较集中,进行调查比较方便
12、,可以减少调查人员与调查单位之间来往的时间和费用。 设计和组织抽样比较方便,尤其是对那些无法事先掌握总体单位情况的调查对象,采用整群抽样更为适宜。,2.整群抽样的适用性,在某些一个个地抽取样本单位不适合的情况下,不得不采用整群抽样。 即使抽样调查中能够一个个地取样,出于经济的考虑也会选择整群抽样。,(五)多阶段抽样,是按抽样单位的隶属关系或层次关系,把抽样过程分为几个阶段进行。 适用于总体规模特别大时。 步骤: 从总体中随机抽取若干大群; 再从总体中抽取若干小群; 最后抽取基本单位。,例: 1、对某县群众身体状况调查,样本单位数为500人; 2、某市有2.4万教师,分布在全市10个区的200所
13、学校中,抽样单位数为1200人,采用三个阶段抽样。下述方案哪个更好?,方案1:抽10个区,抽4所学校,抽30名教师; 方案2:抽2个区,抽20所学校,抽30名教师; 方案3:抽10个区,抽20所学校,抽6名教师; 方案4:抽8个区,抽15所学校,抽10名教师; 方案5:抽5个区,抽12所学校,抽20名教师; 方案6:抽4个区,抽10所学校,抽30名教师; 方案7:抽3个区,抽10所学校,抽40名教师; 方案8:抽2个区,抽10所学校,抽60名教师; 方案9:抽1个区,抽12所学校,抽100名教师;,抽样的样本单位数确定需考虑的因素,一是各阶段抽样中的子总体的同质性程度,同质性高的所抽的规模相对
14、小些,反之则大些。 二是考虑调查者所拥有的人力和经费,二、非概率抽样方法,非概率抽样是指在抽样时不按照随机原则,而是由调查者根据调查目的和要求,主观设立某个标准从总体中抽选样本的抽样方式。 非概率抽样在市场调查中被经常运用的原因: 受客观条件限制,无法实行随机抽样调查。 为尽快取得调查数据提高实效性。 节约调查成本。 总体各单位间差异不大,且有关的调查人员具有丰富的抽样调查经验。,(一)方便抽样:是根据调查者的方便与否,以尽可能使调查对象对总体具有代表性为原则的一种调查方法。又称偶遇抽样、任意抽样等。 如: “街头拦人”商场、车站、医院等 “邮寄式调查” “杂志内的问卷调查”,优点 操作简便,
15、能及时获得所需要的信息数据,省时省力,节省调查经费,效率较高,并能为非正式的探索性研究提供很好的数据源。 缺点 取得的样本偶然性很大,存在着选择偏差, 调查结果可信度低。,(二)判断抽样:是指市场调查者根据自己的主观判断经验和知识,从总体中选择具有典型代表性的单位作为样本的一种抽样方法。也称立意抽样、目的抽样、主观抽样或专家抽样。 两种含义: 一是主观判断 二是有目的地选择样本,优点 方便易行,问卷回答率高,适用于探索性调查。 缺点 样本质量取决于调查者的业务素质和对目标总体的了解。 适用性 适用于总体单位规模小,单位间差异也较小的情况。,确定判定样本单位的通常做法 选择最能代表普遍情况的群体
16、作为样本,常以“平均型”或“多数型”为标准。 利用总体的全面统计资料,按照主观设定的某一标准,选择样本。,(三)配额抽样:它是先按照市场调查对象的某种特征,将总体分为若干类,然后按一定的比例在各类中分配样本单位数额,并按各类数额在每类中任意或主观抽样。 分为: 独立配额、交叉配额,配额抽样法的实施步骤:,第一,选定控制特性。调查人员应先决定受访者的划分标准,如: 收入、年龄、文化教育等。 第二,确定总体中的特性比例,找出一个百分比。 第三,确定样本数目配额,即用样本总数乘以比例数。 第四,配额指派,即各样本数目确定以后,便向市场调查人员指派配额,由调查人员在指派的样本数额限度内,自由地选择调查
17、对象。,独立配额抽样是指调查人员只对样本独立规定一种特征(或一种控制特性)下的样本数额。即对具有某种特性的样本数目加以规定,而并不规定具有两种特性的样本数目。,如在消费者需求调查中,按年龄、特征,分别规定不同年龄段的样本数目,就属于独立配额抽样。 人们通常把消费者的年龄、性别、收入分别进行配额抽样而不考虑三个控制特性的交叉关系。,交叉配额抽样,对调查对象的各种特性的样本数目交叉分配,再进行抽选。 如对调查对象的收入、年龄、性别等特性均予以交叉指派,交叉控制,要调查收入情况,既划分年龄组,又指派性别数目。,独立控制配额抽样,例如,某市进行空调器消费需求调查,确定样本容量为200名,选择消费者收入
18、、年龄、性别三个标准为控制特征进行独立控制配额抽样,其各个样本配额比例及配额数如下表1所示。,例如:,交叉控制配额抽样,上例中如果采用交叉控制配额抽样,就必须对收入、年龄、性别这三项特性同时规定样本分配数额,其配额如下表2所示。,表1 独立控制配额样本的配额数,表1(1) 表1(2) 表1(3),表2 交叉控制配额样本的配额数,(四)滚雪球抽样:是通过以一触十、 以十触百,类似“滚雪球”的方式抽取样本。运用这种方法的前提是样本单位之间具有一定的联系,是在不了解总体的情况下去了解总体的一种方式。,(五)KISH抽样,调查者以家庭为分析单位,进行入户访谈,如何选择户内家庭成员的方法。 (1)确定该
19、户符合调查要求的人口数 (2)将家庭成员按顺序编号 男前女后、年龄大前年龄小后 (3)确定样本户的编号 (4)样本编号末位数所在列,和人口数所在行对应的编号的人即为抽样样本。,例:某户5人,年龄为69、67、38、32、4岁,调查对象要求1870岁,该户样本编号为5,确定该户调查人员。,(六)PPS抽样,抽取样本单位与总体规模成比例抽样的方法。 (Samling with propability proportionate to size) 例:假设从全市100家企业,共200万职工中抽取1000名职工调查, 采用多阶段与PPS抽样方法,进行比较。 假设企业规模各不相同,最大企业有16000名
20、职工,最小企业有200名职工。,1、将入选元素(企业)排列,写出规模,计算各自规模在总体中的比例,再计算累计比例,根据累计比例数依次写出每一元素所对应的选择号码范围; 2、采用随机数字表或系统抽样选择号码; 3、从每个被抽中元素中抽取50名职工。,第三节 抽样推断,一、抽样误差,1抽样误差的概念 抽样误差是指由于抽样的随机性所导致的样本指标与被它估计的总体相应指标之间的差数。,2抽样平均误差,3、抽样误差范围及其可靠程度 抽样误差范围就是变动的抽样指标与确定的总体参数之间的离差的可能范围。它是根据概率论,以一定的可靠程度保证抽样误差不超过某一给定的范围,统计上把这个给定的抽样误差范围叫做抽样极
21、限误差。,抽样误差范围的可靠程度:抽样误差范围是用一定倍数的抽样平均误差来表示的,这个倍数一般用t表示,它是以抽样平均误差为尺度来衡量的相对误差范围,我们称之为概率度。,4、影响抽样误差的因素 -样本量与总体的大小 -总体指标的变异程度 -抽样设计 -使用的估计量 -无回答的情况,二、参数估计,参数估计就是用样本的统计量作为相应的总体参数。 1、参数的点估计 点估计是指直接以样本的统计量作为相应的总体参数估计量。,2、参数的区间估计 区间估计就是对于未知的参数Q,在点估计的基础上,寻求一个区间使得参数Q落在这个区间内具有给定的可信程度。,例 1,经调查,在某地210户家庭随机抽取85户构成的样
22、本中,只有34户安装了宽带,试在95%的概率把握度下,估计该地安装宽带的家庭比例的置信区间。,第四节 抽样方案设计,一、抽样方案设计的程序,定义总体和抽样单位,制定合适的抽样框,选择抽样方法,确定总体指标估算方法,制定实施办法,二、抽样方案设计的原则,1.最佳效果原则(费用与精度相平衡的原则)。 2.现问卷甄别、数据处理相呼应的原则。 3.用户认可的原则。,三、抽样设计中的几个问题,(一)抽样精度问题 (二)抽样框问题 (三)样本容量的确定问题 (四)抽样方式的选择问题,(一)抽样精度问题,1、精度的表示方法 (1)用抽样方差或抽样误差来表示,方差或抽样误差越小精度越高; (2)用置信度和误差
23、限来表示,以 表示一个任意的估计量, 为估计标准误,一定置信度的误差限为 其中 值与置信度相对应。,(3) 一定置信度下用相对数表示精度,其中:1为置信度或可靠性 1 称做估计精度,2、确定精度需要考虑的因素 (1)允许多大的误差限? (2)是否需要对调查总体中的子总体进行估计? (3)与调查估计值有关的抽样方差有多大? (4)要在精度和费用之间进行平衡。,3、影响精度的因素 (1)总体的变异程度 (2)总体大小 (3)样本设计和估计量 (4)调查的回答率 (二)抽样框问题,(三)样本容量的确定问题,两个问题? 一是为什么要确定样本量? 由于样本量直接影响到调查的费用、完成调查所需要的时间、所
24、需调查人员的数量以及其他一些现场操作的限制条件。 二是影响样本量的因素? 估计值要求的精度;提供的经费能支持多大的样本;调查的时间要求;需要和能招聘到多少调查人员等。,(1)回答率小于100%时,确定样本量 在简单随机重复抽样条件下,用样本平均数和成数去推断总体相应指标值时所需要的必要样本容量为:,在简单随机不重复抽样条件下,用样本平均数和成数去推断总体相应指标值时所需要的必要样本容量为:,例 2,某市进行居民家庭收支调查,按照简单随机不重复抽样方式,已知N=100000, =10000,抽样平均误差为5元,在95.45%的概率把握程度下,计算所需要的样本容量。,(2)回答率小于100%时,确定样本量 步骤: 1、计算初始样本量 2、根据总体大小进行调整 3、采用设计效果进行调整 B为设计效果 4、根据无回答再次进行调整 r为预计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机械方向课程设计
- 机械小车课程设计
- 机械及其自动化课程设计
- 七年级地理上册 第五章 第二节 国际经济合作教案 (新版)湘教版
- 机械制图基础课程设计
- 2016年贵州省遵义市中考真题语文试题(解析版)
- 2024新教材高中历史 第二单元 丰富多样的世界文化 第5课 南亚、东亚与美洲的文化教案 部编版选择性必修3
- 2024秋八年级英语上册 Module 7 A famous story Unit 2 She was thinking about her cat教学设计(新版)外研版
- 机械专业不会课程设计
- 机构动态仿真课程设计
- 个人与公司签订的销售提成协议
- 危险性较大的分部分项安全管理核查表
- 2024年纪检监察综合业务知识题库含答案(研优卷)
- 第8课《用制度体系保证人民当家做作主》第2框《我国的基本政治制度》课件 2023-2024学年 中职高教版(2023)中国特色社会主义
- 手术切口感染PDCA案例
- 小学大思政课实施方案设计
- 2024年入团积极分子结业考试试题
- 供应室消防应急预案演练
- 校运会裁判员培训
- 潮湿相关性皮炎的护理
- 餐饮服务质量提升
评论
0/150
提交评论