抽样设计的理论与方法课件_第1页
抽样设计的理论与方法课件_第2页
抽样设计的理论与方法课件_第3页
抽样设计的理论与方法课件_第4页
抽样设计的理论与方法课件_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样设计的理论与方法中国科学院数学与系统科学研究院1报告提纲首先简单介绍调查的基本概念和主要组成部分,以对抽样调查有个总体认识讲述抽样调查中的抽样设计,包括各种抽样设计与相应的估计方法以及辅助信息的利用,重点是简单随机抽样、分层抽样、整群抽样、系统抽样、多相抽样参考文献2一、调查的主要组成部分调查概述调查设计数据的收集方法调查问卷设计抽样方法抽样估计样本量的确定数据收集的实施数据处理数据发布与数据分析3调查概述调查指使用明确的概念、方法和程序,以有组织、有条理的方式,从一个总体的部分或所有单元中收集感兴趣的指标信息,并将这些信息综合编辑成有用的简要形式的所有活动。调查的重要性。调查是认识客观世界的一种手段,通过调查获取信息,了解现状,进行管理决策和预测。调查的任务。科学地反映客观情况,为解决问题、制定政策或策略提供依据,调查是为决策服务。调查设计调查前准备调查的实施调查的分析与报告4调查设计调查目标的确定调查方法的选择抽样设计的有关问题调查中各种误差及其控制51、邮寄调查:被调查者在没有访员协助下完成问卷。2、人员面访:由调查人员协助完成问卷。3、电话访问:访员通过电话协助被调查者完成问卷。4、网络调查:调查者利用网络进行调查。数据的收集方法6调查问卷设计问卷的作用与设计原则问卷结构与问题类型问卷设计的技巧问卷的度量方法7问卷的开发程序向用户和调查对象咨询参考以前相同主题的问卷草拟问题审议、测试和修改问卷试点调查和问卷的定稿8抽样方法什么是抽样抽样是通过抽取总体中的部分单元,收集这些单元的信息,用来对总体进行推断的一种手段非概率抽样概率抽样9抽样样估估计计抽样样估估计计的的基基本本原原理理加权权总体体均均值值、、比比例例及及总总量量的的简简单单估估计计辅助助信信息息的的使使用用调查查估估计计量量的的抽抽样样误误差差估估计计10样本本量量的的确确定定影响响样样本本量量的的因因素素::估计计值值要要求求的的精精度度;;提提供供的的经经费费能能支支持持多多大大的的样样本本;;调调查查的的时时间间要要求求;;需需要要和和能能招招聘聘到到多多少少调调查查人人员员等等。。11数据据收收集集的的实实施施数据据收收集集是是调调查查中中收收集集每每一一个个被被抽抽中中的的单元元个个体体数数据据的的过过程程。。必要要的的公公关关工工作作调查查前前的的准准备备数据据收收集集过过程程调查查过过程程及及调调查查质质量量的的控控制制来自自12数据据处处理理数据据处处理理的的简简要要过过程程1、、全全面面核核查查问问卷卷上上的的数数据据2、、对对问问卷卷上上的的回回答答进进行行编编码码3、、将将数数据据录录入入计计算算机机4、、详详细细审审核核、、插插补补5、进进行离离群值值的检检测6、将将数据据储存存在数数据库库中13数据处处理数据处处理的的简要要过程程1、全全面核核查问问卷上上的数数据2、对对问卷卷上的的回答答进行行编码码3、将将数据据录入入计算算机4、详详细审审核、、插补补5、进进行离离群值值的检检测6、将将数据据储存存在数数据库库中14数据发发布与与数据据分析析调查报报告统计表表和统统计图图数据分分析保密和和泄密密控制制15抽样设设计的的理论论和方方法抽样调调查中中的一一些基基本概概念总体和和样本本:总体体是指指研究究对象象的全全体`,它它是由由研究究对象象中的的单元元组成成的。。总体体中单单元的的数目目称作作总体体容量量;样样本是是指抽抽样时时按照照抽样样的规规则所所抽中中的那那部分分单元元所组组成的的集合合。总体抽取样样本推断总总体样本16研究的的目标标参数数:总体总总量、、总体体均值值、总总体比比例的的估计计及其其相应应的方方差估估计入样概概率与与抽样样比入样概概率是是指某某个总总体单单元被被选入入样本本的概概率抽样比比:指指样本本量n与与总总体的的容量量N的的比例例下面介介绍主主要抽抽样方方法与与相应应的估估计方方法::17(一))简单单随机机抽样样定义::设总总体中中有N个单单元,,不加加条件件从中中随机机抽取取n个个单元元为样样本,,每个个单元元都有有同样样的概概率被被抽中中的抽抽样方方法。。总体总量量和总体体均值(1)与(2)18样本均值值(3)总体均值值和总量量的估计计(4)(5)19估计量的的方差(6)而(7)估计量的的方差估估计(8)(9)20简单随机机抽样的的特点优点:(1)比比较容易易理解和和掌握;;(2))抽样框框不需要要其他辅辅助信息息;(3)理论论上比较较成熟,,有现成成的方差差估计公公式。缺点:(1)没没有利用用辅助信信息;((2)样样本分散散,面访访费用较较高;((3)有有可能抽抽到较差差的样本本;(4)抽选选大样本本比较费费时21(二)分层抽抽样定义:在抽样样之前将总体体分为同质的的、互不重叠叠的若干子总总体,也称为为层。然后在在每一个层独独立地随机抽抽取样本。分层抽样示意意图22首先介绍分层层抽样的的一一些符号:用下标h表示示层的编号用分分别表示总总体和样本中中第h层第i个单元指标标值;用表表示示h层的层权权用表表示示h层的抽样样比分别表示h层层(总体)均均值与样本均均值;23分别为h层的的(层内)方方差和样本方方差下面介绍分层层抽样适用的的场合和优点点1)在调查中中不仅需要对对总体进行参参数估计,也也需要对层的的参数进行估估计。2)使样本更更具代表性。。3)便于组织织管理和数据据汇总4)对不同层层可以按照不不同情况和条条件,具体采采用不同的抽抽样方法。5)分层抽样样可以提高估估计量的精度度估计量及其性性质24总体均值的估估计(10)对分层随机抽抽样,有如下下简单估计(11)总体总和的简简单估计为(12)无偏性:如果果层的估计具具有无偏性,,分层的总体体总量和总体体均值的估计计具有无偏性性。对分层随机抽抽样,的的一个无无偏估计为25(13)分层抽样的缺缺点:(1)对抽样样框的要求比比较高,必须须有分层的辅辅助信息;(2)收集或或编制抽样框框的费用比较较高;(3)若调查查变量与分层层的变量不相相关,效率可可能降低;(4)估计值值的计算比简简单随机抽样样复杂26比估计和回归归估计-利用辅助信息息比估计和回归归估计主要是是利用辅助变变量来提高估计精度度比估计及其基基本性质如果之之间大致呈正正比例关系,,采用比估计计量对简单随机抽抽样,总体均均值和总量的的比估计量为为(14)(15)有时候,调查查的目的是要要估计总体与与的的比值::27(16)对它的估计为为(17)基本性质对于简单随机机抽样,当样样本量大时28对于实际问题题的方差估计计,仍用样本本估计,用(18)估计。。对分层抽样,,比估计有分分别比和联合合比两种形式式。回归估计及其其基本性质对简单随机抽抽样,总体均均值的回归估估计定义为(19)若回归系数设设定,则回归归估计为无偏偏估计,且其其方差估计可表示为为(20)如回归系数为为1,称为差差估计量。29如回归估计量量采用样本回回归系数(21)则总体均值的的回归估计量量为(22)基本性质:当样本量较大大时,将相应应的样本估计计量代入上式式,得相应的样本估估计。对分层抽样,,有相应的分分别回归估计计和联合回归归估计。30(三三))与单单元元大大小小成成比比例例的的概概率率抽抽样样1、、定定义义::根根据据单单元元的的大大小小不不同同,,入入样样概概率率不不同同的的一一种种不不等等概概率率抽抽样样。。如如农农场场的的大大小小不不同同,,其其抽抽选选概概率率可可以以根根据据面面积积大大小小成成比比例例,,也也可可以以按按人人数数多多少少成成比比例例。。用用英英文文的的字字头头简简称称为为PPS抽抽样样。。2、、优优缺缺点点::优优点点是是当当研研究究的的变变量量与与单单元元大大小小有有关关时时,,由由于于使使用用了了辅辅助助信信息息,,可可以以提提高高抽抽样样效效率率。。但但缺缺点点是是对对抽抽样样框框需需要要有有高高质质量量的的抽抽样样框框,,成成本本较较高高;;对对于于单单元元大大小小不不相相关关的的变变量量就就不不适适用用;;估估计计量量的的抽抽样样方方差差估估计计比比较较复复杂杂。。31pps抽样样是一一种特特殊的的不等等概率率抽样样,对对放回回地不不等概率抽抽样,,介绍绍Hansen-Hurvitz估计计量。若是是按的的入样样概率率进行行的多多项抽抽样抽取的的样本本指标标值,,相应应的值值为。。则总体体总和和的估估计(Hansen-Hurvitz估计计)为为(23)是无偏偏的,,且有有方差差估计计(24)对不放放回地地不等等概率率抽样样,采采用Horvitz-Thompson估计量量32(四))整群群抽样样1、、定义义:由由若干干个有有联系系的基基本单单元组组成的的集合合称为为群,,抽样样时以以群为为抽样样单元元的抽抽样方方法就就称为为整群群抽样样。整整群抽抽样示示意图图:黄色为为总体体红色为为群白点为为基本本单元元33整群抽抽样的的优点点:(1))能大大大减减低收收集数数据的的费用用;((2))当总总体单单元自然形形成的的群时时,容容易取取得抽抽样框框,抽抽样也也更容容易;;(3))当群群内单单元差差异大大,而而不同同群之之间的的差异异小时时,可以提提高效效率。。缺点::(1))若群群内个个单元元有趋趋同性性,效效率将将会降降低;;(2)通常无无法预预先知知道总总样本本量,,因为为不知知道群群内有有多少少单元;;(3)方方差估估计比比简单单随机机抽样样更为为复杂杂可以综合利利用分层和和整群抽样样技术,采采取分层整整群抽样,比如人人体尺寸调调查,采用用分层提高高样本代表表性,采用整群抽抽样,便于于数据的收收集。34总体(五)多阶阶抽样定义:它是是由两个或或更多个连连续的阶段段抽取样本本的方法。。多多阶抽抽样示意图图:第一阶样本本最终样本35优点:(1)当群群具有同质质性时,多多阶抽样的的效率高于于整群抽样;;(2)样样本的分布布比简单随随机抽样集集中,采用面面访可以节节约时间和和费用;((3)不需需要整个总体体单元的名名录框,只只要群的名名录框和抽抽中群的单元元名录框。。缺点:(1)效率率不如简单单随机抽样样;(2))通常不能能提前知道最终的的样本量;((3)调查的的组织较整群群抽样复杂;((4)估计值值与抽样方差差的计算较为为复杂。36定义:又称等等距抽样,对对研究的总体体按一定的顺序排列,,每隔一定的的间隔抽取一一个单元的抽样方法。。抽选方法:设设总体单元数数为N,要抽抽n个单元为样本,先计计算抽样间隔隔k=N/n,在1到k之间抽取一个随机机起点r,则则被抽中单元元的顺序位置是:r,r+k,r+2k,…。。当N不能被n整除时,采用圆形系统统抽样方法。。(六)系统抽抽样372、系统抽样的的优点(1)没有抽抽样框时可代代替简单随机机抽样方法简简单;(2))不需要辅助助的抽样框信信息;(3))样本的分布布比较好;估估计值容易计计算。3、系统抽样样的缺点(1)若抽样样间隔与总体体的某种周期期性变化一致致,会得一个个差的样本;;(2)不使使用辅助信息息使抽样效率率不高;(3)使用概念念框时,不能能预先知道样样本量;(4)没有一个个无偏的方差差估计量;((5)当N不不能被n整除除时会得到样样本量不同的的样本。我们国家的国国家统计局的的调查多采用用系统抽样,,它便于操作作。38定义:在同一一个抽样框内内,先抽一个个大样本,收集基本的信信息,然后在在这个大样本本中再抽一个子样本,,收集调查的的详细信息。。多相抽样示意意图:(七)多相抽抽样。。。。。。。。。。。。。第一相样本第二相样本。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。39优点:(1)利用了了第一相样本本的信息,能能显著提高估估计值的精度;((2)适用于于某些调查指指标的数据收收集费用特别高或或给被调查者者带来较重负负担的情况。。缺点:(1)整个调调查的时间要要长;(2))调查费用要要比较高;(3))调查的组织织比较复杂;;(4)估计计值和抽样误差的的计算会相当当复杂。40主要的抽样方方法,大致就就有上述几种种,在实际中采用哪哪种抽样设计计,要根据具具体情况,灵活掌握握,当然也可可以组合起来来使用。抽样方案和参参数估计是一一体的,所以以在抽样设计时要考考虑到后续的的数据处理。。41参考书目冯士雍,施锡锡辁.抽抽样调查-理理论、方法与与实践.上上海科学技术术出版社,1996.冯士雍,倪加加勋,邹国华华.抽样样调查理论与与方法,中中国统计出出版,1998.加拿大统计局局《调查技能能》项目组编编,中国国家家统计局《调调查技能》项项目组译,冯冯士雍(审校校).调查技能教程程,中国统计计出版社,2002.赵民德,谢邦邦昌.探索索真相,中国国统计出版,2001.胡健颖,孙山山泽,抽样调调查的理论和和方法,北京京大学出版社社,2000.柯惠新,丁立立宏,市场调调查与分析,中国统计出出版社,2000.梁小筠筠,祝祝大平平.抽抽样调调查的的方法法和原原理,华东东师范范大学学出版版社,1994.42我的一一些工工作::一、可可靠性性方面面1.DanYuandJunyang,Storagereliabilityevaluationofcomplexrepairablesystem,ProceedingofEastAsianSymposiumonStatistics,2002.11。2、杨军军,于丹丹.一一种基基于可用用度的装装备贮存存模型及及其应用用,系统统工程理论论与实践践,2004.7。3、杨军军,于丹丹.修如如旧模型型中贮存存系统备备件量的的计算及及其置信信区间,中国国科学院院研究生生院学报报,2004.10。。4、于丹丹,杨军军.复杂杂系统贮贮存可靠靠性综合合评估,中国电电子学会会论文集可靠靠性分会会第十二二届学术术年会论论文选,2004.10。435、JunYang(speaker),DanYu.OnekindofCompositeRepairableModelanditsAvailabilityFiducialInference,TheJointMeetingofCSPSandIMS2005.7。6、杨军军,于丹丹.一种种可修系系统贮存存模型及及其可用用度Fiducial推断,系统科学学与数学学,2004年年接受。。7、杨军军,冯士士雍,于于丹.可可修系统统的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论