抽样技术概述 课程中心 湖南大学_第1页
抽样技术概述 课程中心 湖南大学_第2页
抽样技术概述 课程中心 湖南大学_第3页
抽样技术概述 课程中心 湖南大学_第4页
抽样技术概述 课程中心 湖南大学_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽调查样湖南大学金融与统计学院第一章抽样调查概述第一章抽样调查概述第一章抽样调查概述(导论)第二章抽样调查的基本理论第三章纯随机抽样(比率估计、回归估计)第四章分层抽样第五章等距抽样第六章整群抽样第七章多阶段抽样第八章非抽样误差分析主要内容《抽样技术》金勇进中国人民大学出版社《抽样调查的理论和方法》施锡铨上海财大出版社《抽样调查的理论和方法》冯士雍等中国统计出版社《抽样技术》[美]W·G·科克伦中国统计出版社参考书目:总体单位调查单位报表制度可以全面调查,但通常是调查限定规模以上的总体单位统计调查的组织方式《统计学》第二章统计调查总体单位调查单位普查统计调查的组织方式对全部单位进行调查《统计学》第二章统计调查总体单位调查单位重点调查只调查重点单位(单位数不多但其标志量占标志总量比重较大的单位)统计调查的组织方式《统计学》第二章统计调查总体单位调查单位典型调查对典型单位进行调查,典型单位的选择并不一定按规模统计调查的组织方式《统计学》第二章统计调查总体单位调查单位抽样调查按随机原则选择调查单位,各单位被选中的机会相同。统计调查的组织方式《统计学》第二章统计调查抽样调查是一种非全面统计调查方法。在各种调查方法中,抽样调查是当今最主要的统计调查方法。广泛应用于社会、经济的各个领域,抽样理论和方法已成为现代统计学的重要组成部分,成为其中发展最快,最为活跃的一个分支。一、抽样调查对抽样最通常的理解就是抽取样本进行调查。由于抽取样本的依据不同,广义的抽样调查可以分为两类:调查者凭借自己对调查对象的了解和主观判断,有意识地从总体中抽取具有平均水平或具有一般特性的单位作为样本。(一)目的抽样:(非概率抽样)以调查者的主观判断为依据来抽取样本。在实际应用中,有以下几种形式:1.典型抽样优点:发挥主观能动性。充分利用已掌握的有关信息,避免产生有极端的偏误。3、对调查偏误无法掌握和控制。这种抽样,事实上就是解剖麻雀式的典型调查。缺点:1、主观随意性大,不同的人有不同的判断。2、对调查结果的评价缺乏客观标准。又如:调查国人对中国举办2008奥运会的态度:在大街上某个路口随意访问。2.随意抽样指利用已有的名册、号薄或地图等资料,任意确定调查单位。优点:简便易行缺点:抽样所依据的总体(抽样总体)不能涵盖所有被研究现象总体(全及总体)。所抽取的样本常会产生较大偏差。例如《文学摘要》进行的民意测验就是一次失败的随意抽样。这样会有意无意地先择那些穿戴整齐、较为文明的人来访问,很容易产生偏差。缺点:1、仍然无法排除主观因素随意性影响。2、难以估计、控制抽样误差。3.定额抽样先对调查对象按一定标志分类,根据历史资料确定每类应抽比例,每类依主观判断抽取一定数量的单位作为样本。由美国民意调查专家盖洛普创立,比随意抽样有不少改进之处。优点:样本结构接近总体结构,提高了样本的

代表性,可使n减少,有一定的科学性。

推广较快。事实上,这种抽样是划类选典式的典型调查。对定额抽样的进一步分析定额抽样中,在每类中访问定额固定的情况下,每位访问员可以自由地访问他所愿意访问的任何人。由于定额常常是按总体有关情况而设定的,从直观上看使人感到样本很像总体,但实际情况并非如此理想看以下例子:(无意之中)于是在定额抽样中经常产生“共和党偏差”。其实,在1936、1940、1944年三次调查中,同样存在此问题,但由于当时民主党领先优势十分明显,而使这种偏差得到抑制,其结果仍然正确。但到了1948年,民主党领先的优势变得十分微弱,这种微弱的优势被定额抽样中的“共和党偏差”压倒,于是得出了共和党杜威将战胜民主党杜鲁门这一错误预测。例如:1984年,盖洛普公司的访问人员就过多地选择了共和党人作为样本,为什么???因为一般而言共和党比民主党富裕一些,受过良好的教育,他们更可能拥有电话,任在较好的地段,总之,访问他们比较容易。抽取样本时不是按照随机原则,而是根据主观判断有目的、有意识地进行,或根据方便的原则进行。目的抽样(非概率抽样)的共同特点是:采用非概率抽样方法获得的数据不能用来计算抽样误差,不能从概率的意义上控制误差并以此来保证推断的准确性。如果调查的目的是用样本数据推断总体的目标量,并以一定的把握程度保证总体目标量落在一定范围,这时非概率抽样是不适合的。(二)概率抽样(随机抽样)以概率论和随机原则为依据抽取样本。保证总体中每个单位有被抽中的机会(一定概率),不受调查者主观因素的影响,从而能充分保证样本的代表性。本课程所讨论的即为随机抽样。按随机原则,从总体中抽取部分单位作为样本,以样本特征值估计或推断总体数量特征的一种统计分析方法。抽样调查的完整概念为:随机原则就是在抽取样本时排除主观上有意识地抽取调查单位,使每个单位都有一定的机会被抽中。根据这一原则,各单位是否中选不受任何主观因素的影响,完全取决于随机因素。只有这样,才能使样本与总体结构相似,(总体的缩影),从而保证样本的代表性,所以,这是抽样调查的根本原则。(否则,抽样推断将缺乏依据)。(三)抽样调查的特点1.按一定的概率以随机原则抽取样本单位典型调查以人的主观判断选择,重点调查以在总体标志总值中所占比重大这一客观标准。注意,随机≠随意。随意或任意抽样,一般是为了图方便,省事,常常带有调人员的主观意愿。尽管其主观上不希望样本有偏,但在无意中任仍会产生意想不到的偏差。①选择样本有确定的程序②访问者没有权利自己去选择被访对象按随机原则抽样,有2个共同特点:统计研究的目的:认识现象总体的数量特征。但不一定只有全面调查才能达到这一目的。以样本→总体,是抽样调查的独特功能。总体和样本肯定有差异,但概率论与数理统计已严格证明了随机抽样下样本与总体的内在联系与抽样分布规律。如

为的渐近无偏估计,→∞,2.以样本的数量特征推断总体的数量特征。由于抽样的随机性,样本是不确定的,因为样本统计量与总体参数之间不存在象自变量和因素量那样的涵数关系,统计量的可靠性只能以一定的概率保证程度来说明,而非完全肯定。如学生身高的估计(95%)。3.运用概率估计方法当用样本对总体目标量进行估计时,要考虑该样本被抽中的概率。即估计量不仅与样本单位的观测值有关,也与其入样概率有关。样本→总体,存在一种不可避免的误差→抽样,是由随机因素引起的代表性误差。抽样误差的大小,直接反映了抽样推断效果的好坏,因此我们总希望其尽量小。做到这一点是可能的,因为样本统计量的抽样分布是可以描述的。①

大数定律:大量随机现象具有稳定的性质。即随着n的增加,则→②

中心极限定律:总体有存在有限均值的和方差,则不管分布怎样。N个,→正态分布。4.抽样误差可以计算并加以控制概率抽样与等概率抽样是两个不同的概念。当我们谈到概率抽样时,是指总体中的每个单元都有一定的非零概率被抽中,单元之间被抽中的概率可以相等,也可以不等。若是前者,称为等概率抽样;若是后者,称为不等概率抽样。注意可以依据调查结果计算抽样误差,从而得到对总体剑标量进行推断的可靠程度。从另一个方面讲,也可以按照要求的精确度,计算必要的样本单元数目。所有这些,都为对调查方案的评估提供了有力的依据。概率抽样最主要的优点:是社会经济领域中应用最为广泛的统计调查方法,如人口变动调查,农产品产量调查,城乡居民家计调查,市场调查,民意调查,产品控制和检验等,与其他方法(尤其是全面调查)相比,优点具有以下优点:二.抽样调查的优点和作用。(一)优点由于抽样单位数少,1%-1‰,因而调查的工作量大大减少。回顾一下1982年的第三次人口普查。79年底国务院人口普查小组成立,到85年11月宣布结束,历时6年,其中处理资料2年,有518万普查员,109万普查指导员,13万编码员,4000多计算机录入人员,1000多计算机工作员,以及1000多万基层干部,配合、协助。花费人民币4亿元,另联合国赞助1560万美元(工资,劳务费不计)。1.经济节约98.

6-2000.6准备2000.7-2000.9登记、质检2000.10-2002.12录入、汇总、分析、出版

以后我国人口普查逢0的年份实施,10年一次,第五次为2000年11月1日0时,由国家统计局人口与就业统计公司负责,进度安排为:2.对效性强(快速)尤其是市场调查,更强调时效性。又如,尽管人口普查10年一次,但人口变动抽样调查每年都进行。如1998年,1%的人口抽样得出98年未我国人口为1248710万人。有些调查具有很强的时效性,要求在较短的时间内完成并提供调查数据。与全面调查相比,抽样调查所调查的单元少,数据采集和汇总整理的工作量较小,因而可以更快地提供调查结果。因此,对于时效性要求比较强的调查,通常采用抽样调查的方式。有些事物或客观现象,需要通过调查掌握其数据,但又不可能进行全面调查,这时必须采用抽样调查,如居民的家庭收支状况、电视节目的收视率,以及那些观察或测试具有破坏性的项目,如显像管的寿命、种子的发芽率等,这些项目的调查只能采用抽样的方法。3.可以承担全面调查无法胜任的项目抽样调查遵循随机原则,排除人这主观因素干扰,可以保证样本的代表性,抽样误差可以通过科学方法控制在要求的范围内。而且因为调查单位少,调查人员精(专业人员),可大大减少工作性误差,因此,有较高的准确度,有些情况下甚至优于全面调查。正因为如此,在人口普查后,还要对普查结果作抽样检查,进行修正。如1964年,抽5.1%复核,重登率0.377‰,遗漏率0.391‰,净差率0.014‰。4.有助于提高调查数据的质量。五、抽样调查与普查的关系1.抽样调查作为普查的补充。2.用抽样调查对全面统计资料进行评估和

修正。3.利用抽样调查作深层次分析。4.利用抽样调查,提前获得总体目标量的

估计。5.普查为抽样框提供资料。1.用于认识那些不能或难以进行全面调查的总体。(二)抽样调查的适用范围如无限总体(大气、海洋污染情况调查),动态总体(连续生产的产品性能检验),范围过大,过于分散的有限总体(居民家计调查,江河水库中的鱼苗、森林)。2.不适宜进行全面调查的总体虽可进行全面调查,但从投入和取得的调查结果的对比上看,却可能是不必要的。这也是抽样调查的优点决定的。如破坏性检验,(灯炮、种子)3.不必要进行抽样调查的总体人口普查公布的数字是以经过抽样修正后的数字为准的。计算差错率,作为修正系数。此外,还可以对总体的特征进行假设检验,决策。4.修正全面调查可能产生的误差。(作为普查的补充)1.社会经济现象的调查。2.社会性的民意调查。3.市场调查。抽样调查在社会经济领域的应用:思考与练习六、抽样调查的发展简史1802年,法国Laplace受政府委托进行法国人口的估计与推算。抽样调查的先驱,挪威的提出“代表性抽样”的思想。英国的为抽样调查提供了理论基础。抽样调查发展史的一个里程碑。分层抽样中的最优分配、比估计、回归估计。的随机化、重复、区组三个重要原则。汉森、赫维茨和麦多于1953年合著的《抽样调查方法和理论》戴明的《商业研究中的样本设计》科克伦的《抽样技术》基什的《抽样调查》样本是总体的缩影,是总体的代表,抽样效果的好坏,依赖于样本对总体的代表性。第二节抽样调查的组织抽样调查,以它产生开始,就一直是一个理论和实践联系十分紧密的学科。必须有科学的组织原则和方案设计。一、抽样调查的组织原则1.保证样本对总体的代表性(抽样的随机性原则)①②③中,①是一个客观因素,不能人为去改变它。②③但是可以加以选择和控制的,这也是抽样调查的重要内容。

影响样本对总体代表性的因素有:①总体标志值的离散程度。在n相同的情况下,离散程度(V)越大,样本的代表性越低。②n的大小③抽样的组织方式与方法。不重复>重复,类型>随机>整群④抽样数据的准确性。样本→总体,要求样本数据比全面调查有更高的准确性,应尽可能利用直接观察法,防止出现登记性误差。2.保证抽样调查组织中的科学性。①保证抽样调查的客观性。

排除主观因素对抽样调查工作的影响。②抽样方法的随机性

保证每个单位都有相同的抽中机会。③抽样方式的合理性。

根据实际情况选择适当的抽样方式。在一定经费限制下,选用抽样误差最小的方法在一定精度情况下,选用调查经费最省的方法3.保证实现最大抽样效果的原则。为确保抽样调查的科学性以及工作的顺利进行,在抽样调查之前应进行周密的设计,做好抽样调查的总体安排和各个步骤的安排。抽样效果可用调查经费/抽样精度之比来衡量。要求:抽样调查是整个抽样调查工作的指导性文件,目的是为了统一认识、内容、方法和组织行动,保证调查工作的质量和时效性,在制定一个大的抽样调查方案时,应有以下几方面的人员参加,便方案更加合理、可行。二、抽样调查方案的设计和实施④计算机程序和数据处理人员。①调查结果的使用者。根据他们的需要确定调查研究的内容。②抽样调查专家。他们专理论上可以决定最佳抽样方案的设计。③实际调查工作的组织者。拟订抽样方案的实施步骤和措施,理论→实际。是整个调查工作的出发点和归宿。明确调查目的,也就是要明确通过调查要解决什么问题。这样,才能恰当地确定调查对象和人员调查内容,才能统一调查人员的思想和行动。抽样调查方案程序(步骤)(一)确定调查目的如大学生消费状况调查,大学生身体状况调查。根据调查目的和任务,确定在什么范围内进行抽样。也就是确定总体的范围或界限。确定调查单位,就是在总体范围内,以什么为基本单位取得数据资料。(二)确定调查对象和调查单位例如:1990年1月进行的“1989年人口变动情况抽样调查”,调查对象为全国人口,调查单位为每个人。但考虑到具体情况,当时归定,调查对象不包括现役军人和武警。就是所要调查的项目,即说明总体单位的基本标志,是调查方案的核心部分,在抽样调查,选择哪些项目和多少个项目,是至关重要的。(三)确定调查内容拟订调查项目应注意以下问题。2.能够取得确切资料。项目的设置,不能只凭主观愿望,要保证客观回答的可能性。在现实情况下,对于还不能取得答案的项目,不要勉强入。(谈恋爱电游)3.涵义清楚,标准统一。使其容易明白和掌握,以便相互配合,迅速作出准确答案,如年.期.月1.围绕调查的精选。少而精。与调查目的无关或关系不密切,将来不被分析利用的项目可不要。否则,浪费人、财、物,影响调查质量。(例如:成绩)是整体调查方案的关键部分,其任务是综合运用各种抽样技术获取一个具有优良代表性的样本,以便最有效地推断总体。主要内容:(四)抽样设计主要指总体的待估参数,以及估计量所要求达到的精度和可靠程度。例如人口变动情况抽样调查中,人口出生率(死亡率),允许误差:1988年,0.5%,可靠程度95%。1.设计参数。3.样本定量。①②确定后,可计算n。但有时还要考虑无回答率及经费。2.抽样方法增强样本的代表性,↑估计效率,↓费用。4.抽样框1.组织领导大规模抽样调查中,应确立领导员关系,成立健全的实施机构。同时还要取得有关部门及社会团体的大力协助。如学生消费(校团委,学生会)。同时做好宣传工作。(五)实施调查过程2.人员培训3.计划实施②计算方法,结果,单位上有无差错。(六)数据处理分析调查表→原始资料→整理汇总→统计整理→样本指标→总体参数。资料的审核,逻辑检查和计算检查。①内容是否合理,项目之间是否矛盾,数字充分是否平衡。如人口变动抽样调查中:一户只能有一个户主,户主的配偶与户主性别相反。六、撰写调查报告(1)主题。调查目的,调查结果的使用方式。(2)范围。指定的研究定义及调查的地理区域(3)调查对象(4)资料收集方法。遇到的所有困难及解决的方法。(5)调查期、参考期和报名期。(6)抽样设计和估计程序。抽样单元、抽样框、样本大小和抽样方法,估计时所用的公式(7)结论的描述。一览表、图例或图解。(8)精确度。(9)责任。主办机构及指挥此调查的机构。(10)参考文献。就是判断一定概率保证下的实际抽样误差是否超过方案所允许的误差。三、抽样方案的检查对总体参数作出抽样估计后,就要检查抽样方案设计中所规定的各项要求是否已经达到,即抽样设计的检查。通常可以进行以下两方面的检查。(一)准确性检查指将抽样估计的结果与已知的过去总体指标或由其他途径得到的总体标估计值比较,视其比率是否符合要求,通常要求在97%-103%或95%-105%的范围内。(二)代表性检查如果以上两种检查达不到要求,则可认为抽样方案不成功。应对方案进行检查和修正。(如改变抽样方法、增加样本容量)某县抽取5个乡进行农产品抽样调查,样本平均亩产为380公斤,而最近3年全县30个乡亩产为373公斤,则代表性比率为符合代表性要求。例:二者同时符合的抽样设计,一般可以认为是合理有效的,其抽样估计结果也值得信赖。相反,应审查调查工作的质量或增加样本容量。必要时,应调整抽样方案。第三节问卷调查又称民意调查,是以社会成员对一定社会经济现象的看法和意愿为对象,从而推断社会心态动向的一种调查。

问卷调查一般是为了特定的调查目的,以问卷形式提问,由被调查者自愿回答的一种搜集资料的方法。

适用于社会经济生活中进行探索性、解释性、描述性等各项研究。问卷调查问卷总体结构设计:问卷说明问卷主体填表说明解释调查意义、目的,有关注意事项,表达感激之情等。被调查者基本情况、调查项目、回答问题的方式等调查项目的解释、问卷填写方法、填

写要求、问卷寄送方式等问卷设计《统计学》第二章统计调查应届大学毕业生心态调查问卷亲爱的同学:您好!您在大学的学习即将结束,将要走上工作岗位。当前您最关心、最担心的问题是毕业就业问题。为了了解您在这方面有什么想法和看法、希望和要求,以便向各级党政领导及有关部门反映,以求得此问题较为合理的解决,我们开展了这次调查。填写此问卷是不记名的。希望您在填答时不要有任何顾虑,根据您的实际情况如实填写,说出您的心里话。对此我们负责保密。谢谢您的支持与合作!

****省调查队《统计学》第二章统计调查问卷说明填表说明1、请在每一问题后所给的备选答案中选择符合您情况或您同意的答案,并在所选答案后的内打“√”,或在问题的----处填写适当的内容。2、若无特殊说明,每一问题只能选择一个答案;若还要对所选多项答案排序,则请按题后说明填写。3、问卷内容较多,涉及面广,请在填答之前认真阅读一遍,然后按要求仔细填写。《统计学》第二章统计调查问卷内容设计问题的措词应注意1、提问确切,避免出现模棱两可的问题。

3、问题应以中性形式提出,不能参杂调查者的意图和观点,不能暗示、诱导2、每一个问题都应可以独立作答,不能把几个问题合并成一个问题4、针对不同的调查对象,采用合适的表达方式和恰当的措词设问5、各个问题的备选答案必须具有互斥性,不能模糊不清《统计学》第二章统计调查例1:“上个星期您总共看了几小时书?”其中“书”是否包括杂志、报刊?又如:“您每个月的收入是多少?”其中“收入”是否包括奖金、津贴和其他收入?例2:您为什么不喝牛奶而换喝豆浆?这一问句包含了三层意思:1、您为什么不喝牛奶?2、您为什么改喝豆浆而不改喝其它?3、什么原因使您更换流食?例3:“大家都认为某教师的课上得好,您的看法如何?”,“政府的收购政策大家都认为好,您的看法呢?”《统计学》第二章统计调查问卷内容设计《统计学》第二章统计调查例4:“您父母赞同您的婚姻吗?”这里父母指两个人,若遇到父亲赞成、母亲反对或母亲赞成父亲反映,应答者如何回答呢?例5:“您的职业是①企业职工;②经济管理人员;③干部;④商业服务人员;⑤农民;⑥军人;⑦学生;⑧教科文卫人员”。答案交叉重复现象很多,使应答者无所适从。问卷内容设计问卷的问题结构指问卷中问题的排列顺序,其一般规则有:

按问题的类型

按事实性问题、行为性问题、态度性问题的顺序将同类问题排列在一起,避免相互混杂按问题的难易程度

先易后难,先熟悉的问题后生疏的问题,先一般性后特殊

按问题的时间顺序

按问题的空间顺序

为了便于被调查者记忆,可以按时间先后顺序排列先近后远,由近及远

《统计学》第二章统计调查问卷的类型按问卷的结构分无结构型问卷结构型问卷问卷的内容结构较为松散或较为简单的问卷。调查者调查之前准备调查提纲,明确调查目的,拟定调查内容的项目,但不必事先列出答案格式,被调查者可以根据各自的情况自由回答。

指根据调查研究的目的和调查对象的特点而设计的具有结构的问卷。这种问卷一般都把所有拟调查的问题全部列于问卷上,并在问题的后面给出答案类型,由被调查者依照自己的认识和想法回答问题

《统计学》第二章统计调查您认为吸烟有哪些害处?①危害自身健康②影响他人健康③浪费钱财④容易引起火灾⑤破坏家庭团结封闭式问题您认为吸烟有哪些害处?开放式问题容易控制,但不易全面结构型问卷的问题类型:容易滋生腐败您认为吸烟有哪些害处?①危害自身健康②影响他人健康③浪费钱财④容易引起火灾⑤破坏家庭团结⑥其他()不易控制,但内容丰富《统计学》第二章统计调查⒈您是否吸烟(如果选②,则跳过⒉、⒊题)①吸烟②不吸⒉您每天大约吸多少支烟①5支以下②5-10支③10-15支

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论