第八章 抽样设计_第1页
第八章 抽样设计_第2页
第八章 抽样设计_第3页
第八章 抽样设计_第4页
第八章 抽样设计_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章抽样设计第一页,共五十四页,编辑于2023年,星期四返回总目录返回本章§8.1抽样调查的基本概念一、抽样调查的特点二、抽样调查的作用三、常用术语四、抽样方案设计第二页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、抽样调查的特点1.定义:

指从总体中抽取一部分单位作为样本进行调查,然后根据样本调查结果对总体情况作出推断和估计的调查法。抽样调查的理论原理是数理统计知识。总体样本样本统计量(X)总体参数估计第三页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、抽样调查的特点2.分类:按被抽取机会是否相等,可以分为:①随机抽样:按照随机原则抽取样本。随机原则:完全排除了人的主观应因素影响,使每一个单位都有同等的可能性被抽到。优点:1、抽出样本的分布情况接近总体,样本对总体研究具有充分的代表性。2、有助于调查人员准确地计算抽样误差,并有效的加以控制,从而提高调查的精度第四页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、抽样调查的特点②非随机抽样:不遵循随机原则,从方便出发或根据主观判断来抽取样本。非随机抽样简单易行,尤其适用于做探所性研究。非随机抽样无法估计和控制抽样误差,无法用样本的定量资料,采用统计方法来推断总体,优点:缺点:第五页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、抽样调查的特点3.特点:(1)经济,抽样调查节约人力、物力和财力。

(2)高效,抽样调查更节省时间。如城市住户调查。

(3)准确。第六页,共五十四页,编辑于2023年,星期四返回总目录返回本章1、作用:

(1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解决。二、抽样调查的作用

(2)在经费、人力、物力和时间有限的情况下,采用抽样调查方法可节省费用,争取时效,用较少的人力物力和时间达到满意的调查效果。

(3)运用抽样调查对全面调查进行验证。全面调查涉及面广、工作量大、花费时间和经费多,组织起来比较困难。但调查质量如何需要检查验证,这时,显然不能用全面调查方式进行。

(4)对调查主体进行连续调查。(5)可运用于企业质量管理。举例:对有破坏性或损耗性质的商品质量检验;对一些具有无限总体的调查(如对森林木材积蓄量的调查)等。第七页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、常用术语1、总体与样本总体:所要研究的对象全体。一般用“

N”表示。样本:从总体按一定程序抽取的个体或单元组合。一般用“

n”表示。某市在12万名大学生中抽出1000人进行消费结构调查。认识:总体:12万名大学生就是调查。样本:被抽到的1000名大学生。第八页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、常用术语2、总体指标和样本指标总体指标:即根据总体各个单位的标志值或属性值计算的综合指标。主要有:总体平均数、总体成数和总体方差。样本指标:即根据样本各个单位的标志值计算的综合指标。主要有:样本平均数、样本成数和样本方差。认识:方差比例平均数nN单位数样本总体第九页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、常用术语3、重复抽样与不重复抽样重复抽样又称作重置抽样、有放回抽样:即每抽一个单位,登记结果后,又重新放回参加下一次的抽取,这样连续抽足一个样本所需的单位。

抽出个体登记特征放回总体继续抽取程序:特点:

同一总体单位有可能被重复抽中,而且每次抽取都是独立进行。第十页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、常用术语不重复抽样又被称作不重置抽样、不放回抽样:即每抽一个单位后,就不再放回参加下次的抽取,每抽一次,总体的单位数就减少一个。程序:特点:

同一总体中每个单位被抽中的机会并不均等,在连续抽取时,每次抽取都不是独立进行。抽出个体登记特征继续抽取第十一页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、常用术语3、抽样框与抽样单元抽样框指对可以供抽样用的所有调查单位的名册或详细名单。

认识:例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。

常见的抽样框:大学学生花名册、城市黄页里的电话列表、工商企业名录、街道派出所里居民户籍册、意向购房人信息册……。

注意:在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。

第十二页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、常用术语抽样单元指构成抽样框的有限又不重复的个体。1、抽样单元不仅指构成抽样框的目录项,同时还表示该目录项所对应的实际总体特定的一个或一些单元。

2、抽样单元可大可小。如:在手机调查中我们抽中一栋居民楼,居民楼是一级单元,而楼中的每个居民就是二级单元。

说明:第十三页,共五十四页,编辑于2023年,星期四返回总目录返回本章四、抽样方案设计1、定义:在抽取样本资料以前,预先确定抽样程序和方案。目的:保证样本有代表性,经济、实惠。2、基本内容:明确抽样目的和任务要求确抽样框和单位选择抽样方法确定样本容量制定实施总体方案的办法和步骤确定目标量的估算方法确定抽样精度第十四页,共五十四页,编辑于2023年,星期四返回总目录返回本章3、抽样方案设计的主要程序:四、抽样方案设计定义总体和抽样单位确定所采用的抽样框选择抽样技术确定必要的样本量确定总体目标的估算方法实施抽样第十五页,共五十四页,编辑于2023年,星期四§8.2随机抽样技术一、简单随机抽样返回总目录返回本章二、等距抽样三、分层抽样四、整群抽样五、多阶段抽样第十六页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、简单随机抽样

简单随机抽样(SRS)按照随机原则,从总体中不加任何分组、划类、排序,直接地抽取调查样本。如果抽样是有放回的,则称非常简单随机抽样(VSRS

)性质:用不重复抽样方法,按随机原则从N个单位中抽取n个单位组成样本。则其样本数目

方法:抽签法或随机数法抽签法给总体各单位编号后,把号码写在结构均匀的字签上,将字签混合均匀后即可从中抽取。随机数法利用随机数表进行抽样的方法。第十七页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、简单随机抽样仅适用于规模不大、内部各单位标志值差异较小的总体应用:优点:

(1)简单、直观比较容易理解和掌握;(2)抽样框不需要其他辅助信息;(3)理论上比较成熟,有现成的方差估计公式。缺点:

(1)对样本编号困难;(2)样本分散,费用较高;(3)总体方差大时,样本代表性差;(4)有些情况不能使用,如连续生产质检。第十八页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、等距抽样又称系统抽样先把总体单位按某种顺序排列成行(或按自然顺序),用随机方法抽取第一个单位,以后每隔若干单位抽取一个单位。1、和调查项目无关,如按照门牌号排列;2、和调查项目有关,如按收入给家庭排序。排列:抽选方法:设总体单元数为N,要抽n个单元为样本,先计算抽样间隔k=N/n(取整),在1到k之间抽取一个随机起点r,则被抽中单元的顺序位置是:r,r+k,r+2k,…。当N不能被n整除时,采用圆形系统抽样方法。第十九页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、等距抽样举例:某企业对购进的10000台电视机的质量进行调查,计划抽取400台作为样本调查,总体编号为1-10000。1、样本间距为K=10000/400=25。2、然后从1-25中任意抽取一个数为样本,假定为第8台,则第2个样本为8+25=33,即抽取第33台作为第2个样本,以此类推,一直抽够400台为止。第二十页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、等距抽样

(1)若抽样间隔与总体的某种周期性变化一致,会得一个差的样本;(2)要知道有关材料,如排序标志;(3)没有一个无偏的方差估计量;误差计算复杂。优点:(1)简便易行,容易确定样本单元(2)分布比较均匀,有利于提高估计精度例如:对公路旁树木进行病虫害防治,确定每30棵树检查1棵,只要确定了起点的被检查树,每隔30棵检查1棵即可。缺点:国家统计局的调查多采用系统抽样,它便于操作。第二十一页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、分层抽样

将总体按某个主要标志进行分组,再按随机原则采用简单随机抽样方式从各组中抽取一定数目的总体单位组成样本的抽样组织方式。总体N样本n······等额抽取不等比例抽取等比例抽取描述:第二十二页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、分层抽样等比例抽样指分层后,按随机原则根据各层中单位数量占总体单位数量的比例抽取各层的样本数量。每层抽取的样本数计算公式为:式中:ni为第i层抽出的样本数

Ni为第i层的总单位数N为总体单位数n为总体样本数第二十三页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、分层抽样非等比例抽样指分层后,不按各层中单位数量占总体单位数量的比例抽取各层的样本数量。一般用最佳抽样或最低成本抽样。每层抽取的样本数计算公式为:最佳抽样:根据各层标准差的大小来调整各层样本数目的抽样方法。为第i层的标准差第二十四页,共五十四页,编辑于2023年,星期四返回总目录返回本章优点:1)在调查中不仅可对总体进行参数估计,还可对层的参数进行估计。2)使样本更具代表性。3)对不同层可以按照不同情况和条件,具体采用不同的抽样方法。4)分层抽样可以提高估计量的精度缺点:

1)对抽样框的要求比较高,必须有分层的辅助信息;2)估计值的计算比简单随机抽样复杂三、分层抽样第二十五页,共五十四页,编辑于2023年,星期四返回总目录返回本章四、整群抽样

将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位进行全面调查的抽样组织方式。ABCDEFGHIJKLMNOPLHPD样本容量示意图:第二十六页,共五十四页,编辑于2023年,星期四返回总目录返回本章四、整群抽样特点(1)总体和样本都是由“群”组成;(2)引起的抽样误差的方差是群间方差,群内方差不影响抽样误差;(3)整群抽样均为不重复抽样,可提高样本的代表性。(4)每群的数量可等可不等,而且抽样方法方便。第二十七页,共五十四页,编辑于2023年,星期四返回总目录返回本章四、整群抽样优点:简单、方便,易于组织,能节省人力、物力、财力和时间,缺点:限制了样本在总体中分配的均匀性,误差大。第二十八页,共五十四页,编辑于2023年,星期四返回总目录返回本章五、多阶段抽样先抽大的调查单位,再抽取小的调查单位的抽样方式。总体第一阶样本最终样本示意图:第二十九页,共五十四页,编辑于2023年,星期四返回总目录返回本章五、多阶段抽样例如,我国职工家计调查,则实行阶段抽样调查。第一阶段从全部城市抽选调查城市,第二阶段从中选城市的各部门抽选调查单位,第三阶段再从中选调查单位抽选职工,确定调查户,进行每月实际的家庭收支情况调查。这种分阶段进行抽样调查,称为阶段调查。特点:1、分布进行,至少分两步;2、组织方便;尤其对总体单位过于分散,在组织技术上解决进行抽样调查存在很大困难的矛盾;第三十页,共五十四页,编辑于2023年,星期四返回总目录返回本章§8.3非随机抽样技术一、方便抽样二、判断抽样三、配额抽样四、雪球抽样第三十一页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、方便抽样

根据调查者的方便与否来抽取样本的抽样方法。如:如在商店门口、街头路口、车站码头、公园广场等公共场所,随便选取某些顾客、行人、旅客、观众等

。好处:简单方便

;不足:是应答者往往不具有代表性或者无法判断他们的代表性,样本的代表性较差,具有很大的偶然性,故适用于探索性调研。第三十二页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、判断抽样

调查者根据自己的主观印象、以往的经验和对调查对象的了解来选取样本的一种方法。例如当在们对某一群体作调查时,就可以根据我们所了解的群体情况选取某些样本做研究。方法:1、选择最能代表普遍情况的调查对象,分平均型和多数型。平均型:选择代表平均水平的样本。多数型:选择代表多数水平的样本。2、根据统计资料,按一定标准选择样本。第三十三页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、判断抽样好处:样本不能分类时,用该方法具有优越性

;不足:样本的精确性和客观性不稳定。请记忆:第三十四页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、配额抽样

首先将总体按照一定标志分类,然后再在每一类中按照方便抽样或判断抽样的方法进行抽样。这些分类标志称控制特征。优点:简单易行,代表性高。基本步骤:

(1)选择控制特性作为分层标准(2)分层(3)确定各层样本额(4)配额指派根据其抽样方法可以分为:

(1)独立控制配额抽样(2)交叉控制配额抽样第三十五页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、配额抽样独立控制配额抽样:分别按照单个控制特征进行独立的控制配额抽样。优点:简单易行;缺点:样本可能过于偏向某一组。举例:收入水平年龄性别高10050以上50男50中7025-50100女150低3025以下50----合计200合计200合计200第三十六页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、配额抽样交叉控制配额抽样:对调查对象各个特征的样本数交叉分配。优点:提高了样本的代表性;缺点:操作复杂。收入水平高中低合计性别男女男女男女年龄50以上619413265025-50133792631210025以下6195132550合计25751852723200合计1007030举例:第三十七页,共五十四页,编辑于2023年,星期四返回总目录返回本章四、雪球抽样

即以少量样本为基础,逐渐扩大样本的规模,直至找出足够的样本。

优点:有针对性寻找样本;

缺点:样本之间必须保持联系。例如:我们要了解某个人经常交往的社会圈子,就可以通过这个人提供的线索找到更多与他有关联的人。

步骤:1、先找到一个或几个符合研究目的的对象,2、然后再根据这些对象所提供的线索找另外相关的对象,3、依次进行,直至达到研究目的。第三十八页,共五十四页,编辑于2023年,星期四返回总目录返回本章§8.4抽样误差与样本量一、抽样误差的种类和概念二、样本量的确定第三十九页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、抽样误差的种类和概念

调查结果和客观事实之间的出入。分非抽样误差和抽样误差。非抽样误差是基于抽样之外的许多其它原因而产生的误差,产生的原因多样,如下:非抽样误差非观察偏误观察偏误无回答覆盖不周被访者责任访问员责任不在家拒答故意错答误解而错答访问员过失访问员作弊第四十页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、抽样误差的种类和概念

抽样误差是由于抽样造成的误差,误差大小受四个因素影响:总体各单位的差异程度:

标准差

越大,抽样误差越大;样本单位数的多少:

越大,抽样误差越小;抽样方法:不重复抽样比重复抽样小;抽样组织方式:简单随机抽样最大。第四十一页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、样本量的确定意义:1、若n过大,调查工作量增大,体现不出抽样调查的优越性;2、若n过小,抽样误差会增大,抽样推断就会失去价值。样本容量指样本中含有的总体单位的数目,通常用n来表示。一般来讲:当n≥30,称为大样本;当n<30,称为小样本。第四十二页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、样本量的确定允许误差范围的大小;抽样调查的组织方式和方法;人力、财力和物力的允许条件;被调查对象标志的差异程度;结果的可靠程度。影响因素样本量的确定第四十三页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、样本量的确定1、先试验性调查,了解总体的相关特征值。2、根据计算公式和允许的误差范围计算。分类计算1.在简单随机抽样重复抽样条件下测定平均数时:

测定成数时:2.简单随机不重复抽样条件下第四十四页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、样本量的确定测定平均数时:

测定成数时:第四十五页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、样本量的确定例:假定总体为3000单位,被研究的标志方差不少于400,当抽样误差不超过3,保证机率为0.9973时,需抽取多少单位?已知:N=3000,σ2=400,△=3

t=3(因保证机率为0.9973)则:

(单位)这里因总体单位不大,故需采用不重复抽样公式。第四十六页,共五十四页,编辑于2023年,星期四返回总目录返回本章§8.5有关抽样设计的几个问题一、抽样精确度二、抽样框误差三、样本量确定四、抽样方式确定五、样本轮换六、无回答问题七、敏感性问题第四十七页,共五十四页,编辑于2023年,星期四返回总目录返回本章一、抽样精确度百分之百准确?不惜代价的准确?满足决策需要即可?太多选择,心乱如麻,如何是好?不要太完美,实用即可。第四十八页,共五十四页,编辑于2023年,星期四返回总目录返回本章二、抽样框误差1号杀手:搜集不到2号杀手:遗漏3号杀手:非总体杀!杀!杀!样本框哇!呀!呀!呀呀呀!样本框产生误差。如何是好?哈哈!哈哈!哈哈哈!如此这般!这般!即可:1、按抽样框重新定义总体!2、用加权方法调整资料!第四十九页,共五十四页,编辑于2023年,星期四返回总目录返回本章三、样本量确定问题问题1问题2…….问题n问题3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论