第6章 抽样调查_第1页
第6章 抽样调查_第2页
第6章 抽样调查_第3页
第6章 抽样调查_第4页
第6章 抽样调查_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样调查本章内容第一节抽样调查的意义第二节抽样调查的基本概念及理论依据第三节抽样平均误差第四节总体指标的推断第五节抽样方案设计1通过学习,让学生了解抽样调查的概念、特点和应用范围、全及总体与抽样总体、全及指标与抽样指标、抽样方法、抽样调查的理论依据,了解与掌握抽样误差的概念、意义、影响抽样平均误差的因素、抽样平均误差的计算等,掌握总体指标的推断和总体参数的估计。2第一节抽样调查的意义

一、抽样调查的概念

二、抽样调查的特点

三、抽样调查的作用一、抽样调查的概念抽样调查是非全面调查,它是按照随机原则从调查对(总体)中抽取一部分单位进行调查,用调查所得指标数值对调查对象相应指标数值作出具有一定可靠性的的估计和推断的一种统计调查方法。我国的抽样调查应用主要有:⒈国家和地方统计部门一系列抽样调查制度:1%人口抽样调查、城市和农村住户调查、农产量抽样调查等。三支调查队:城市社会经济调查总队、农村社会经济调查总队、企业调查总队。⒉其他政府部门、社会团体和学术团体妇女生育力调查(国家计划生育委员会)公众科学素养调查(全国科协)语言与文字使用情况调查(教育部与国家语委)⒊专业调查咨询机构央视调查咨询中心、北京华通现代信息咨询有限公司、北京零点市场调查与分析公司等。二、抽样调查的特点

⒈只抽取总体中一部分单位进行调查⒉用一部分部位的指标值去推断总体的指标值⒊抽取部分单位要遵循随机原则⒋抽样误差可以计算,并且可以控制三、抽样调查的作用

⒈有破坏性、不可能进行全面调查的事物可进行抽样调查⒉全面调查实际办不到的事物可进行抽样调查⒊节省人力、费用和时间,方式灵活⒋可对总体进行推断5对普查或全面调查统计资料的质量进行检查和修正第二节抽样调查的基本概念及理论依据一、全及总体和抽样总体二、全及指标和抽样指标三、重复抽样和不重复抽样四、抽样调查的理论依据一、

全及总体和抽样总体(总体和样本)全及总体:所要调查观察的全部事物。总体单位数用N表示。抽样总体:抽取出来调查观察的单位。抽样总体的单位数用n表示。

n≥30大样本

n<30小样本二、

全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。抽样指标:抽样总体的那些指标。样本数——指从总体中可能抽取的样本的数量。样本容量——指一个样本所包括的单位数。二、全及指标和抽样指标

1、总体指标:根据总体各单位标志值计算的、反映总体属性的指标。主要有:总体平均数总体方差总体标准差㈡抽样指标:根据样本各单位标志值计算的、反映样本属性的指标。主要有:样本平均数总体方差总体标准差在属性总体中,设N1个单位具有某种属性,N0个单位不具有某种属性,则称为总体成数

称为样本成数称为总体是非标志标准差

称为样本是非标志标准差

有些社会经济现象,只表现为两种性质上的差异,例如,产品的质量表现为合格或不合格,对某一电视节目,观众表现为收看或不收看,学生成绩表现为及格或不及格等等,这些只表现为是或否、有或无的标志称为交替标志,也称作是非标志。㈠成数。总体中,交替标志只有两种表现,我们把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数。若p和q分别表示具有与不具有某种标志的成数,则同一总体两种成数之和等于1。用公式表示为:p+q=1或q=1-p㈡交替标志的平均数。交替标志表现了现象质的区别,因此计算期平均数首先需要将交替标志的两种表现进行量化处理。用“1”表示具有某种表现,用“0”表示不具有某种表现,则:第五章抽样调查15㈢交替标志的标准差。第五章抽样调查16

XFXf

是1P1·p1-p(1-p)2(1-p)2p非01-p00-pP2P2(1-p)合计11p------(1-p)2p+p2(1-p)三、抽样方法抽样方法按抽取样本的方式不同分为重复(置)抽样和不重复(置)抽样。㈠重复(置)抽样:是从全及总体抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现后,把它放回到全及总体中去,再从全及总体中随机抽取第二个样本单位,记录它的有关标志表现后,也把它放回全及总体中去,照此下去直到抽选第n个样本单位。可见重置抽样时:①总体单位数在抽选过程中始终不变;②总体中各单位被抽中的可能性前后相同;③总体中各单位有被重复抽中的可能。

第五章抽样调查17㈡不重复抽样:是从全及总体抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回全及总体参加下一次抽选;然后,从总体N-1个单位中随机抽取第二个样本单位,记录它的有关标志表现后,该单位也不放回全及总体中去,从总体N-2个单位中抽取第三个样本单位,照此下去直到抽选出第n个样本单位。可见,不重置抽样时:①总体单位数在抽选过程中逐渐减少;②总体中各单位被抽中的可能性前后不断变化;③总体中各单位没有被重复抽中的可能。

第五章抽样调查18四、抽样调查的理论依据

大数法则:随着抽样单位数的增加,抽样平均数有接近总体平均数的趋势。中心极限定理:如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋于正态分布。第三节抽样平均误差一、抽样误差的概念二、抽样平均误差的意义三、影响抽样平均误差的因素四、抽样平均误差的计算返回本章首页一、抽样误差的概念㈠抽样误差的一般概念抽样误差是指样本指标与总体指标之间的差距。表示为、㈡统计调查误差种类按产生的原因分,统计调查误差可分为登记性误差和代表性误差。登记性误差是指统计调查时,由于主观原因在登记、汇总、计算、过录中所产生的误差。登记性误差不论全面调查或非全面调查都可能产生。

代表性误差又可分为两种:系统性误差和随机误差。系统性误差又称偏差,它是由于抽样调查没有遵循随机原则而产生的误差。只要遵循随机原则就可以避免。随机误差又称偶然的代表性误差,它是指没有登记性误差的前提下,又遵循了随机原则所产生的误差。随机误差是抽样调查固有的误差。抽样误差是指这种随机误差。第五章抽样调查22

抽样误差包括抽样实际误差和抽样平均误差两种。抽样实际误差是指某一样本指标与被它估计的总体指标产差数。抽样平均误差,从一般意义上说是所有抽样实际误差的平均水平。确切地说,抽样平均误差是所有样本指标(样本平均数和样本成数)的标准差。第五章抽样调查23二、抽样平均误差的意义抽样平均误差是一系列抽样指标的标准差。例:总体为2、3、4,从总体中按重复抽样抽出两个单位组成样本。抽样误差的影响因素:

1.全及总体标志变异程度。——正比关系2.抽样单位数目的多少。——反比关系3.不同的抽样方式。4.不同的抽样组织形式。四、抽样平均误差的计算㈠抽样平均数的抽样平均误差前面已经举例说明了直接按照可能抽样平均数求标准差的方法计算,但该方法太繁。可以证明:⒈在重复抽样下抽样平均误差σ为总体标准差,n为样本单位数,在总体标准差未知,且样本单位数较大时,可以用样本标准差代替。例:从40、50、70、80中抽取3个组成样本,在重复抽样下,求抽样平均误差。⒈求总体标准差,直接用计算器统计功能键可以求出:⒉求抽样平均误差⒈在不重复抽样下抽样平均误差σ为总体标准差,n为样本单位数,N为总体单位数。例:从40、50、70、80中抽取3个组成样本,在不重复抽样下,求抽样平均误差。⒈求总体标准差,直接用计算器统计功能键可以求出:⒉求抽样平均误差㈠抽样成数的抽样平均误差前面已经介绍过抽样成数的概念,总体成数是总体中具有某种属性的单位占所有单位的比重,用P表示,不具有某种属性的比重用Q表示;样本中具有某种属性用p表示,不具有某种属性用表示。可以证明:总体平均数=P总体标准差样本标准差求样本平均数和样本成数的抽样平均误差。⒈求灯泡平均使用时间、标准差和灯泡合格率(样本)⒉求灯泡使用时间抽样平均误差:在重复抽样下抽样平均误差:在重复抽样下抽样平均误差⒊求灯泡合格率的抽样平均误差:在重复抽样下抽样平均误差:在重复抽样下抽样平均误差第四节总体指标的推断

一、抽样极限误差

二、可信程度

三、抽样推断一、抽样极限误差㈠概念:抽样极限误差是指总体指标和抽样指标之间误差的可能范围。⒈抽样平均数的抽样极限误差⒉抽样成数的抽样极限误差㈡总体范围的估计若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计:⒈抽样平均数的范围⒉抽样成数的抽样极限误差例:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。样本成数p=190/200=95%总体成数下限=95%-2%=93%总体成数上限=95+2%=97%即该产品合格率在93%~97%之间。㈢抽样极限误差与抽样平均误差的关系抽样极限误差通常用抽样平均误差的倍数表示,即t称为概率度。二、可信程度

可信程度是表示估计的可靠程度如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t决定的。因而可靠程度与t之间有一定正比关系。概率度t与概率保证程度(可靠程度)之间的关系见表。例:若概率为0.95,查表得t=1.96概率度t与概率保证程度(可靠程度)之间的关系见表。

第五章抽样调查41概率度t误差范围(△)概率F(t)概率度t误差范围(△)概率F(t)0.50.50.38291.961.960.95001.001.000.68272.002.000.95451.501.500.86643.003.000.9973三、抽样推断

抽样推断的步骤如下:⒈计算抽样平均误差⒉给定概率保证程度,查表得概率度t⒊计算抽样极限误差

⒋估计总体指标区间

某灯泡厂某月生产5000000个灯泡,在进行质量检查中,随机抽取500个进行检验,这500个灯泡的耐用时间见下表:

试求:⑴该厂全部灯泡平均耐用时间的取值范围(概率保证程度0.9973)⑵检查500个灯泡中不合格产品占0.4%,试在0.6827概率保证下,估计全部产品中不合格率的取值范围。

求解如下:⑴①计算抽样平均误差②由概率保证程度0.9973,查表得概率度t=3③计算抽样极限误差

④估计总体指标区间⑵p=0.4%概率保证程度为0.6827时,t=1第五节样本容量的确定和对总量指标的推算一、必要样本容量的确定二、总体总量指标的推算第五章抽样调查46一、必要样本容量的确定㈠影响必要样本容量的因素⒈总体各单位标志变异程度即总体方差或p(1-p)的大小。总体标志变异程度大,要求样本容量大一些;反之,总体标志变异程度小,样本容量可以小些。

⒉允许的极限误差或的大小允许的极限误差越大,样本容量越小;反之,极限误差越小,样本容量越大。

第五章抽样调查47⒊抽样方法在其它条件相同的情况下,重置抽样比不重置抽样要抽取多一些样本单位。⒋抽样方式例如,采用类型抽样的样本容量要小于简单随机抽样的样本容量。

5.抽样推断的可靠程度即概率F(t)的大小推断的可靠程度要求越高即F(t)越大,样本容量越多;反之,推断的可靠程度要求越低,样本容量越少。48㈡必要样本容量的计算公式⒈重置抽样的必要样本容量⑴平均数的必要样本容量

由⑵成数的必要样本容量49⒈不重置抽样的必要样本容量

⑴平均数的必要样本容量

⑵成数的必要样本容量50例:从某企业400名工人中随机抽取10%进行调查,获得日产零件资料如下:51日产零件(件)工人数(人)100以下100~200200~300300以上410206合计40已知样本方差s2=300要求:⑴在不重复抽样情况下以95.45%(t=2)的可靠性估计平均每位工人的日产零件的置信区间。⑵若在其它条件不变的情况下,使极限误差减少20%,则至少应抽多少工人进行调查。已知:N=400人,n=40人,

的区间范围:[214.72,225.28]

第五章抽样调查52第六节抽样方案设计一、抽样方案设计的基本原则二、简单随机抽样三、类型抽样四、机械抽样误差五、整群抽样一、抽样方案设计的基本原则㈠保证实现抽样随机性的原则㈡保证实现最大的抽样效果原则二、简单随机抽样简单随机抽样又称纯随机抽样,是按照随机的原则直接从N个总体单位中抽取n个单位作为样本。简单随机抽样最符合随机原则。即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:1.直接抽选法;2.抽签法;3.随机数码表法;三、类型抽样类型抽样又称分类抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论