第七章 抽样调查二_第1页
第七章 抽样调查二_第2页
第七章 抽样调查二_第3页
第七章 抽样调查二_第4页
第七章 抽样调查二_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《统计学》PPT第七章统计指数教学目的要求:通过学习,掌握抽样推断的基本原理,熟练运用误差公式进行抽样估计,并能结合实际加以灵活应用。重难点:重点是抽样误差的计算原理、区间估计及简单随机抽样的基本原理;难点是抽样误差的基本原理。计划讲授课时:8学时.第七章抽样调查本章主要内容抽样调查的一般问题总体指标的推断必要抽样数目的确定抽样误差第一节抽样调查的一般问题本节主要介绍了抽样调查概念、优点、作用、组织方式等基本理论问题。重点掌握抽样调查的概念、优点及其组织方式.一、抽样调查的概念与作用(一)抽样调查的概念所谓抽样调查是指从总体中按随机原则抽取一部分单位构成样本进行观测,然后根据这一部分单位的资料推断总体数量特征的一种方法.(二)抽样调查的特点1.按照随机原则抽取样本单位;2.抽样调查建立在随机抽样的基础上;3.抽样调查的目的就是由样本指标推断总体指标;4.抽样调查结论存在抽样误差,但可以事先计算和加以控制.(三)抽样调查的优点抽样调查的优点节省费用时效性强实用性强准确度高(四)抽样调查的作用用于不可能进行全面调查的无限总体;用于不可能进行全面调查而又需要了解其全面情况的现象;用于不必要进行全面调查的现象;用于对全面调查资料的评价与修正;用于工业生产过程的控制,等等。上述作用也可以说是抽样调查的应用范围.(五)抽样调查的理论基础1.大数法则:是关于大量的随机现象具有某种稳定性质的法则。它论证了样本平均数趋近于总体平均数的趋势,从而为抽样推断提供了重要的理论依据。2.中心极限定理:是关于研究变量和的分布序列的极限定理。它论证了在大样本的情况下,抽样误差服从于正态分布,从而为抽样误差的概率估计提供了理论基础及使用的方便。(注意:本部分内容重在逻辑思维上的理解即可,深层次的内容可参看有关数理统计方面的书籍).二、抽样调查中的几个基本概念(一)总体与样本1.总体:指要调查研究对象的全体,通常称为全及总体或母体。2.样本:指在全及总体中按随机原则抽取的那部分单位所构成的集合体,通常称为抽样总体或样本总体或子体.(二)总体体指标与样样本指标1.总体指标:指根据全及及总体各单单位标志值值计算的有有关综合指指标。由于于全及总体体是唯一确确定的,故故根据全及及总体计算算的总体指指标也是唯一确定的。常用的的总体指标标有总体单单位数、平平均数、成数、标准差及及方差等,,常用各种种大写符号号表示。2.样本指标:是根据抽样样总体各单单位标志值值计算的综综合指标。。由于从一一个全及总总体中可以以抽取许多多个不同的的样本,故故样本指标标是一个不确定的随随机变量。常用的样样本指标有有样本单位位数、平均均数、成数数、标准差差及方差等等,常用小小写符号表表示.关于成数P的有关概念念及计算问问题在抽样调查查中,成数数是针对交交替(或是是非)标志志而言的。。所谓交替标志,是指只有有两种可能能结果的标标志(是否否,或是非非)。如性性别要么是是男性,要要么是女性性;再如考考试成绩要要么及格,,要么是不不及格,等等等。所谓成数,就是指交交替标志中中具有某种种特征的单单位数占全全部总体单单位数的比比重.(1)成数的平平均数下面以以总总体成数为为例说明。。设:N表示总体单单位数;0表示不具有有某种特征征;1表示具有某某种特征。。则:表示不具有某种特征的单位数;表示具有某种特征的单位数;显然有:则:则成数的平均数为:即,成数就是指总体体中具有某某种特征的的单位数占占全部总体体单位数的的比重。(2)成数的标标准差xfxf01QP0Q1P0-P1-P=Q合计P+Qp——则:故:各种抽样基基本公式一一览表(三)重复复抽样与不不重复抽样样1.重复复抽抽样样:是指指把把从从总总体体中中抽抽中中的的单单位位,,经经登登记记调调查查后后,,再再将将其其放放回回去去,,重重新新参参加加下下一一次次的的抽抽选选,,直直到到抽抽取取n个总总体体单单位位。。又又称称为为重重置置抽抽样样或或有有放放回回抽抽样样。。显显然然,,采采用用此此方方法法抽抽取取样样本本时时,,某某个个总总体体单单位位有有重重复复抽抽中中的的可可能能,,故故其其名名。。2.不重重复复抽抽样样:是指指把把从从总总体体中中抽抽中中的的单单位位,,经经调调查查登登记记后后,,不不再再放放回回去去参参加加下下一一次次的的抽抽选选,,直直到到抽抽取取n个总总体体单单位位。。显显然然,,采采用用此此法法抽抽取取样样本本时时,,某某个个总总体体单单位位不不可可能能被被重重复复抽抽中中,,故故其其名名。。(四四))考虑虑顺顺序序与与不不考考虑虑顺顺序序1.考虑虑顺顺序序::指抽抽取取样样本本单单位位时时,,要要考考虑虑抽抽中中单单位位出出现现的的先先后后顺顺序序,,如如AB与BA是两两种种不同同的的抽抽样样组组合合。。2.不考考虑虑顺顺序序::指抽抽取取样样本本单单位位时时,,不不考考虑虑抽抽中中单单位位出出现现的的先先后后顺顺序序,,如如AB与BA只算算一一种种可能能的的样样本本组组合合。。注意意::由于于在在社社会会经经济济统统计计中中,,抽抽中中的的样样本本单单位位的的先先后后顺顺序序,,对对所所研研究究现现象象的的数数量量计计算算结结果果没没有有影影响响,,故故通通常常采采用用不不考考虑虑顺顺序序的的抽抽样样方方法法,,而而考考虑虑顺顺序序的的抽抽样样方方法法则则在在自自然然科科学学研研究究中中采采用用较较多多。。考虑虑顺顺序序与与不不考考虑虑顺顺序序抽抽样样所所得得到到的的样样本本组组合合是是不不同同的的。。各种抽样方法法下可能的样样本组合计算算公式(五)单阶段段抽样与多阶阶段抽样所谓单阶段抽样是指某次抽样样时一次就抽抽出样本单位位的抽样。所谓多阶段抽样是指需经两次次或两次以上上的抽样,最最后才抽样具具体样本单位位的抽样。如如我国职工家家计抽样调查查采用省抽→县市→区(街)→居民家庭户三三阶段抽样技技术.三、抽样调查查的组织方式式(一)简单随随机抽样1、简单随机抽抽样的概念和和特点(1)概念:是从总体全部部单位中不加加任何排队或或分类,完全全按照随机原原则抽取样本本单位进行调调查的方式。。也叫做单纯纯随机抽样或或纯随机抽样样。(2)基本特点:按随机原则的的定义直接从从总体中抽取取样本单位.(3)适用条件:简单随机抽样样适宜于总体体单位数不多多且各单位之之间差异不大大时使用。(4)优缺点:简单随机抽样样优点是最符符合随机抽样样原则;不足足是编号做签签的工作量较较大,总体单单位数较多时时无法使用且且误差往往较较大.2、简单随机抽抽样抽取样本本单位的方法法简单随机抽样样抽取样本单单位的具体方方法主要有::(1)抽签法(抓阄法)。具体作法是是:当给总体体各个单位编编号后,把号号码写在结构构均匀的签((如同等大小小的纸片等))上,将签混混合均匀后即即可以从中抽抽取。抽签法法简便易行,,然而对于较较大的总体来来说,编号、、做签条的工工作量很大,,且不易做到到混合均匀。。因此,抽签签法的应用有有一定的局限限性.(2)机械摇号法法它是先对全部部总体单位编编号,然后再再利用某种特特制的机械,,通过机械震震动产生需要要抽取调查样样本单位号码码的方法。此此法抽取的样样本单位随机机性高,但购购置设备的费费用较高,只只适宜于经常常开展抽样调调查的单位使使用.(3)随机数字表表法所谓随机数字,就是指用某某种机械方法法或电子计算算机产生的数数字序列,数数中的0,1,2,…,9这10个数字出现的的机会是等概概率的,但排排列顺序则是是随机的。将将随机产生的的数字用表格格的形式表现现出来,就是是随机数字表表。所谓随机数字表法法,就是利用随随机数字表随随机抽取样本本单位的方法法。有关随机数字字表法的具体体内容,详见见教材(略)).(二)类型抽抽样1、类型抽样的的概念和特点点(1)概念:是先将总体中中所有单位按按某一标志分分成若干组((或类),然然后再在各组组中随机抽取取样本单位的的方式。(2)基本特点:先分组,再在在各组中随机机抽取样本单单位。(3)适用用条件件:适宜于于总体体单位位多、、情况况复杂杂、差差异较较大时时使用用。(4)优缺缺点:优点是是样本本代表表性较较高、、误差差较小小;不不足是是误差差的计计算较较麻烦烦.2、抽取取样本本单位位的具具体方方法由于类类型抽抽样是是在分分组后后从各各组中中抽取取样本本单位位,因因此,,类型型抽样样条件件下抽抽取样样本单单位主主要问问题是是,在在总的的样本本容量量确定定后,,样本本数目目如何何在各各个组组之间间分配配的问问题。。类型型抽样样中,,常用用以下下两种种方法法确定定各层层间样样本单单位的的分配配比例例。(1)等比比例抽抽样:即各组组按相相同的的比例例抽取取样本本单位位。(2)不等等比例例抽样样:即各组组抽取取样本本单位位的比比例不不完全全相同同。(三))等距距抽样样1、等距距抽样样的概概念和和特点点(1)概念念:是指先先按有有关或或无关关标志志将总总体单单位按按一定定顺序序排列列,然然后再再按相相等的的距离离或间间隔抽抽取样样本单单位的的方式式,又又叫机械抽样。(2)基本特点点:先排队,再再等距抽选选样本。具具体特点有有二:一是是抽取样本单单位的方法法简便易行行;二是估计量的方方差小,样样本的代表表性较高。。(3)适用条件件:适用面广广,特别别适宜于于连续、、大批量量生产的的现象的的调查。。(4)优缺点点:优点是通通常能保保证样本本均匀分分布,减减少误差差,提高高样本的的代表性性;不足足是有时时可能有有系统((周期))性误差差.2、抽取样样本单位位的具体体方法只有不重重复抽样样方法。。关键是是第一个个样本单单位的抽抽选。先先按N/n=K求出抽样样间隔;;再在第第一组中中按简单单随机抽抽样的方方法,抽抽出第一一个样本本单位;;然后再再按抽样样间隔K随之确定定其余样样本单位位。具体体又可分分为两种种:(1)按有关标志志排队的等等距抽样样;(2)按无关标志志排队的等等距抽样样.(四)整整群抽样样1、整群抽抽样的概概念和特特点(1)概念:是先将总体全全部单位划分分为若干群(组),然后以群为为单位随机抽抽取若干群,,对抽中群内内的所有单位位全部进行调调查的方式。。(2)基本特点:先分群,再以以群为单位抽抽取样本。(3)适用条件:适宜于群内差差异较小而群群与群之间差差异较大现象象的调查。(4)优缺点:优点是抽样组组织工作较方方便;不足是是有时误差较较大,样本代代表性较低.2、抽取样本单单位的具体方方法在整群抽样中中,为避免抽抽样误差过大大,一般采用用不重复抽样样的方法;抽选群的方法法与简单随机机抽样相同.第二节抽抽样误差抽样理论是在在研究误差的的基础上逐步步发展和完善善起来的,误误差理论是抽抽样理论的核核心。本节介绍了抽抽样误差的概概念、影响因因素、抽样平平均误差的概概念及其计算算原理。重点掌握简单单随机抽样方方式下抽样平平均误差的计计算方法.一、抽样误差差的概念抽样误差是指随机抽样样所得的样本本指标与总体体指标的随机机误差。偏差随机误差抽样平均误差抽样误差抽样极限误差登记误差代表误差抽样实际误差(一)登记性性误差与代表表性误差所谓登记性误差,又称为调查查误差或工作作误差,它是是指调查人员员在调查过程程中,由于工工作不认真((如粗心大意意抄错、写错错、写漏等))或计量工具具不准确而形形成的调查结结果与实际结结果之间的差差别。这种误误差是可以尽尽量加以克服服或避免的。。所谓代表性误差,是指根据部部分(少数))单位调查的的结果去代表表(或推断))全部单位的的数量特征时时,两者之间间的差别。这这种误差通常常是不可避免免的.(二)偏差与与随机误差所谓偏差,是指在随机机抽样中调查查人员(有意意识地)破坏坏了随机原则则抽样(即不不按随机原则则抽样),由由此形成的样样本指标与总总体指标之间间的差别。在在抽样调查中中,通常所说说的抽样误差差是不包括偏偏差的,又称称为系统性误误差。所谓随机误差,是指由于随随机抽样的随随机性由此而而形成的样本本指标与总体体指标之间的的差别,通常常也叫做抽样误差.(三)抽样误误差所谓抽样误差,就是指在随随机抽样中按按随机原则从从总体中抽取取一部分单位位构成样本,,并计算出有有关样本指标标(如样本平平均数或成数数),再通过过样本指标去去推断总体有有关指标(如如总体平均数数或成数)时时两者之间存存在着的差别别。简而言之之,抽样误差差就是样本指指标与总体指指标之间的差差别。抽样误差是抽抽样调查不可可避免的误差差。因为部分分单位与全部部单位的数量量特征通常是是不可能完全全一致的.(四)抽样实实际误差所谓抽样实际误差差,是指在对某某现象实际进进行抽样时,,其样本指标标与总体指标标之间的差别别。如对某校校大学生随机机抽取100人进行身高调调查,得知这这100人的平均身高高为168公分;又知该该校全部大学学生的平均身身高为169公分,两者之之间相差1公分,这就是是抽样实际误误差。抽样实际误差差实际上是未未知的。因为为总体指标通通常是未知的的,如果总体体指标已知,,也就没有必必要进行抽样样调查了!.二、抽样平均均误差1.抽样平均误差差的概念:是指所有可能能的样本的样样本指标与总总体指标之间间的平均误差差(标准差))。2.抽样平均误差差计算方法(1)抽样平均误误差的定义公公式:根据抽样平均均误差的定义义,其平均数数与成数的计计算公式分别别为:(2)抽样平均误误差的应用公公式重复抽样不重复抽样1.测定平均数时2.测定成数时关于应用公式的几点说明:①修正系数的处理问题:当N较大时可用代替②重复抽样与不重复抽样误差的关系问题:在其它条件相同的情况下不重复抽样的误差比重复的误差小。③总体方差未知的处理问题:当总体方差()未知时,可用样本方差()、历史方差或试验方差代替.【例1】(根据定义公式式计算)设有A、B、C三个小孩的年年龄分别为1、2、3岁。现从三个个中随机抽二二个进行调查查。试根据抽抽样平均误差差的定义计算算抽样平均误误差。解:(1)计算可能的的样本数:②考虑顺序重复复抽样时:即:1、2;2、1;1、3;3、1;2、3;3、2;1、1;2、2;3、3;①考虑顺序不重重复抽样时::即:1、2;2、1;1、3;3、1;2、3;3、2;③不考虑顺序不不重复抽样时时:④不考虑顺序重重复抽样时::即:1、2;1、3;2、3;即:1、2;1、3;2、3;1、1;2、2;3、3;(2)下下面面以以不不考考虑虑顺顺序序不不重重复复抽抽样样为为例例说说明明其其计计算算方方法法::总体体平平均均数数::三个个可可能能样样本本的的样样本本平平均均数数分分别别为为::由于于三三个个样样本本的的样样本本平平均均数数与与总总体体平平均均数数的的离离差差之之和和等等于于0,故故不不能能用用离离差差的的算算术术平平均均数数的的方方法法计计算算其其平平均均离离差差,,为为避避免免离离差差的的总总和和等等于于0,其其方方法法之之一一就就是是将将离离差差平平方方,,再再求求其其平平均均的的离离差差,,由由于于分分子子平平方方了了,,故故需需再再开开方方还还原原,,即即::【例2】】(根据据应应用用公公式式计计算算)从某某乡乡1000亩稻稻田田中中随随机机抽抽取取50亩,,经经秤秤重重量量得得平平均均亩亩产产量量为为560公斤斤,,标标准准差差为为50公斤斤。。试试计计算算抽抽样样平平均均误误差差。。解:由于于总总体体方方差差未未知知,,故故用用样样本本方方差差代代替替。。则则::即抽抽样样平平均均误误差差为为6.89公斤斤.【例3】(根据应用用公式计计算)某公司从从购买的的1000件产品中中随机抽抽取160件进行检检验,发发现其中中有144件合格。。试求合合格产品品成数的的抽样平平均误差差。解:因总体体方差未未知,故故用样本本方差代代替。则则:即合格品品成数的的抽样平平均误差差为2.17%.3.其它方方式下下抽样样平均均误差差的计计算公公式(1)类型抽样重复抽样不重复抽样测定平均数时测定成数时

即=式中:称为总体平均组内方差,

表示总体成数平均组内方差,(2)等距距抽样样平均均误差差的计计算方方法一般认认为,,如果果总体体是按按无关标标志排排队的机械械抽样样,其其实质质与简单单随机机抽样样类似似,它的的抽样样误差差就十十分接接近简简单随随机抽抽样的的误差差。为简便便起见见,实实际中中常采采用简简单随随机抽抽样误误差公公式来来近似似计算算。如如果是是按有关标标志排排队的机械械抽样样,其其实质质又与类型型抽样样相接接近。因此此,从从理论论上讲讲,其其抽样样误差差可以以借助助类型型抽样样误差差公式式近似似计算算。但在实实际中中也可可按简简单随随机抽抽样误误差公公式来来近似似计算算.(3)整群抽抽样平平均误误差的的计算算方法法设:总总体单单位数数为N,将总总体的的全部部单位位数划划分为为R群,现现从R个群中中随机机抽取取r个群组组成样样本,,并对对中选选的r个群内内的全全部单单位进进行全全面调调查。。则其其估计计与推推断的的公式式分别别为::测定平均数时测定成数时重复抽样表示群间方差.式中:三、影影响抽抽样误误差的的因素素DBCA样本单位数(n)总体方差()抽样方式抽样方法影响因素四、抽抽样极极限误误差由于总总体指指标是是一个个确定定的量量,而而样本本指标标是一一个围围绕着着总体体指标标上下下波动动的随随机变变量,,即它它可能能与总总体指指标发发生正正、负负离差差,这这就产产生了了抽样样极限限误差差的概概念。。1.概念::是在一一定概概率保保证条条件下下,样样本指指标与与总体体指标标之间间抽样样实际际误差差的最最大可可能范范围。。2.计算方方法(或极限限误差差与平平均误误差、、概率率度的的关系系)3.作用:为抽样样推断断及其其可靠靠性判判断提提供依依据.五、抽抽样误误差的的分布布所谓抽样误误差分分布,是指指总体体全部部可能能样本本的抽抽样误误差的的分布布状况况。数理统统计证证明:大样样本((n≥30)的抽抽样误误差分分布为为正态态分布布。这这就为为抽样样极限限误差差的计计算提提供了了理论论上的的依据据。如如果我我们把把全部部可能能样本本的样样本平平均数数编制制成变变量数数列并并绘制制成图图形,,就可可得到到一个个钟形形的光光滑曲曲线,,即正正态分分布曲曲线。。从正态态分布布曲线线图可可总结结两个个特点点:一是样样本指指标高高于或或低于于总体体指标标的概概率分分布是是完全全对称称的;;二是是样本本指标标接近近于总总体指指标的的概率率越大大(小小)出出现的的可能能性也也就越越大((小))。在抽样样中概概率F(t)是指指抽样样估计计的可可靠性性,即即把握握程度度。概概率随随概率率度((t)的变变化而而变化化,故故概率率是概概率度度的函函数。。为了了便于于实际际使用用,通通常可可按事事先编编制好好的正正态分分布概概率表表,来来根据据事先先给定定的t值查找找出相相应的的概率率F(t).-1-0.67-0.3300.330.67160%抽样误差差分布图图示几个常用用的正态态分布概概率tF(t)1.960.9520.954530.9973第三节总总体体指标的的推断抽样调查查的目的的在于用用样本指指标去推推断总体体指标。。抽样推断断的方法法有点估估计和区区间估计计两种。。重点掌掌握区间间估计的的基本原原理.一.点估估计点估计就是用样样本指标标直接代代替(估估计)总总体指标标的方法法。例如:从某班班全部同同学抽出出10人进行调调查得知知其平均均身高为为170公分,男男生占60%;则在点点估计条条件下,,可以说说该班全全部学生生的身高高为170公分,男男生所占占比重为为60%。点估计的的优点是直观、、简单、、方便。。不足是没有考考虑估计计的误差差问题及及估计的的可靠性性。评价优良良估计量量的三大大标准:一致性;;无偏性性;有效效性.二.区间间估计区间估计计是根据根根据样本本指标确确定总体体指标的的置信区区间和置置信度。。利用抽抽样所得得的样本本平均数数((或成数数p)。即可确定估计的上限(或)和估计的下限(或)。上限和下限之间的范围称为置信区间;而落在这个范围的可靠程度叫做置信度t。区间估计必备的三要素:抽样估计值(或p)、估计的误差范围即极限误差⊿、估计的概率F(t)。区间估计计的基本本公式::区间估计计的一般般步骤根据给定的抽样资料,计算样本指标(样本平均数或样本成数p);计算抽样极限误差();计算抽样平均误差();计算确定定总体平平均数或或总体成成数的区区间:如果总体方差()资料未知,则根据抽样资料,计算样本方差(或标准差S);【例4】某大学有有4500名学生。。现采用用不重复复简单随随机抽样样方式从从中随机机抽取10%的学生,,调查其其每月生生活费用用支出情情况。抽抽样结果果显示::学生平平均每人人每月生生活费用用支出350元,标准准差80元,生活活费用支支出在500元以上的的学生占占20%。

要求求:在95.45%的概率保保证下估估计全部部学生月月平均生生活费用用支出的的可能范范围,以以及月生生活费用用在500元以上的的学生所所占比重重的可能能范围。。

解::【例5】对某企业业100名职工的的工资进进行抽样样调查得得下表资资料。试试以0.9545的概率估估计该企企业全部部职工月月平均工工资(元元)的可可能范围围。月平均工资职工人数(f)组中值(x)800以下800~900900~10001000~11001100以上15205010575085095010501150合计100—解:有关计算算如下::则以0.9545的概率估估计该企企业全部部职工的的月平均均工资在在899.9元~940.1元之间.【例6】对某批商商品按不不重复抽抽样方法法抽取200件进行检检验,其中合格格品为160件。又知知道所抽抽检商品品件数占占总件数数的1/20。试以99.73%的概率估估计该批批商品合合格率的的区间范范围。解:有关计计算如下下:故以99.73%的概率估估计全部部商品合合格率在在71.72%~88.28%之间.第四节必必要要抽样数数目的确确定必要抽样样数目的的确定,,也叫做做样本容容量的确确定。所所谓必要要,是指指以最少少的人财财物,取取得最好好的抽样样推断效效果。抽样数目目的多少少与抽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论