第六章抽样调查_第1页
第六章抽样调查_第2页
第六章抽样调查_第3页
第六章抽样调查_第4页
第六章抽样调查_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章抽样调查第一节抽样调查的意义第二节抽样调查的基本概念第三节抽样平均误差第四节全及指标的推断第五节抽样方案设计第六节必要抽样单位数的确定第七节假设检验第一节抽样调查的意义一、抽样调查的概念

抽样调查是按随机原则,从全部研究对象中抽取一部分单位进行观察,并根据样本的实际数据,对总体的数量特征做出具有一定可靠程度的估计和判断其中心问题是如何根据已知的部分资料来推断未知的总体情况。二、抽样调查的特点1.抽样调查是非全面调查。2.抽样调查是用样本的指标数值去推算总体的指标数值。3.抽样调查是按随机原则抽选调查单位。4.抽样调查中产生的抽样误差,可以事先计算并加以控制。

第二节抽样调查的基本概念

一、全及总体和抽样总体二、抽样方法1.重复抽样分布2.不重复抽样分布三、大数定理与中心极限定理一、全及总体和抽样总体全及总体:即总体,所要调查观察的全部事物。总体单位数用N表示。抽样总体:即样本,抽取出来调查观察的单位。抽样总体的单位数用n表示。

n≥30大样本

n<30小样本总体是唯一的、确定的,而样本是不确定的、可变的、随机的注全及指标和抽样指标全及指标:反映总体数量特征的指标。其数值是唯一的、确定的。抽样指标:根据样本分布计算的指标。是随机变量。全及指标和抽样指标平均数标准差、方差成数全及指标、2P抽样指标S、S2p总体样本

变量总体和属性总体变量总体各单位标志值可用数量表示总体成数P是指具有某种特征的单位在总体中的比重。成数是一种结构相对数,设总体单位总数目是N,总体中有该特征的单位数是N1。设x是0、1变量,则有:样本成数现从总体中抽出n个单位,如果其中有相应特征的单位数是n1,则样本成数是:P也是一个随机变量,利用样本平均数的分布性质结论,即有:样本容量与样本个数样本容量:一个样本中所包含的单位数,用n表示。样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多少与抽样方法有关。重复抽样:又称有放回抽样。不重复抽样:又称不放回抽样。例例二、抽样方法重复抽样例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数=Nn=52=25不考虑顺序时:样本个数=例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2考虑顺序时:样本个数不考虑顺序时:样本个数不重复抽样三、大数定理当样本容量n

充分大时,可以用样本平均估计总体平均。当试验次数n充分大时,可以用频率代替概率。大数定理的意义:个别现象受偶然因素影响,但是,对总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,从而使总体平均数稳定下来,反映出事物变化的一般规律。

中心极限定理

中心极限定理:1.独立同分布中心极限定理:2.德莫福-拉普拉斯中心极限定理:大样本的平均数近似服从正态分布。第三节抽样平均误差

在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。一、抽样误差的概念及其影响程度

抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。二、抽样平均误差

抽样平均误差实际上是样本指标的标准差。通常用μ表示。在N中抽出n样本,从排列组合中可以有各种各样的样本组。

抽样误差是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。

注按照定义:重复抽样分布--样本平均数的分布某班组5个工人的日工资为34、38、42、46、50元。=422=32现用重复抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。验证了以下两个结论:抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用表示。重置抽样分布--样本平均数的分布取得σ的途径有:

1.用过去全面调查或抽样调查的资料,若同时有n个σ的资料,应选用数值较大的那个;2.用样本标准差S代替全及标准差σ;3.在大规模调查前,先搞个小规模的试验性的调查来确定S,代替σ;4.用估计的方法。抽样平均误差的影响因素:

1.全及总体标志变异程度。2.抽样单位数目的多少。3.不同的抽样方式。4.不同的抽样组织形式。——正比关系——反比关系随机抽样的抽样平均误差

(一)平均数的抽样平均误差重复抽样

某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(假设为重复抽样),根据以往资料:σ=20小时,根据以往资料,产品质量不太稳定,若σ=200小时,例2.不重复抽样:(二)成数的抽样平均误差

已知:成数的方差为p(1-p)

某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例抽样误差的作用1.

在于说明样本指标的代表性大小。 误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。2.说明样本指标和总体指标相差的一般范围。第四节全及指标的推断

一、优良估计无偏性一致性有效性二、点估计点估计的含义:直接以样本指标作为相应全及指标的估计量。例三、全及指标估计概述设待估计的全及指标是,用以估计该参数的统计量是,抽样估计的极限误差是

,即:抽样极限误差是根据研究对象的变异程度和分析任务的性质来确定的在一定概率下的允许误差范围。四、区间估计区间估计的含义:根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。其中:1-α(0<α<1)称为置信度;α是区间估计的显著性水平,其取值大小由实际问题确定,经常取1%、5%和10%。参数估计的两个要求:精度:估计误差的最大范围,通过极限误差来反映。显然,Δ越小,估计的精度要求越高,Δ越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。可靠性:估计正确性的一个概率保证,通常称为估计的置信度。

根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:

抽样极限误差△=tμ,(t为概率度)68.27%的样本当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。四、全及平均数和全及成数的推断

某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。(1)求抽样平均误差;(2)以95.45%的概率保证,该农场平均亩产量的范围;(3)以99.73%的概率保证,该农场平均亩产量的范围。例1~

解:

某机械厂日产某种产品8000件,现采用纯随机重复抽样方式,从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率的范围。例2抽样一级品率:~

解:第五节

抽样方案设计

一、简单随机抽样1.简单随机抽样的含义简单随机抽样又称为纯随机抽样,必须满足下列两条要求:①代表性,即要求样本分布与总体分布相同;②独立性,即要求样本各个单位相互独立。

简单随机的抽样方法

(1)抽签法。适合用于总体单位数较少的总体。

(2)随机数表法。适合用于大规模的社会经济调查。

(3)简单随机抽样的平均误差二、类型抽样(分类抽样)

先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。

类型的划分:必须有清楚的划类界限;必须知道各类中的单位数目和比例;分类型的数目不宜太多。类型抽样的好处是:

样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。三、机械抽样(等距抽样)

先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。排列次序用的标志有两种:1.选择标志与抽样调查所研究内容无关,称无关标志排队。2.选择标志与抽样调查所研究的内容有关,称有关标志排队。研究工人的平均收入水平时,按工号排队。例研究工人的生活水平,按工人月工资额高低排队。例机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等距抽样kkkk+a2k+a(n-1)k+aak(k为抽取间隔)2.半距起点等距抽样kkkk(k为抽取间隔)3.对称等距抽样kkk2k-a2k+a4k-a4k+aak(k为抽取间隔)机械抽样的好处:

1.可以使抽样过程大大简化,减轻抽样的工作量;2.如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。四、整群抽样

整群抽样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。

整群抽样的好处:组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。第六节

必要抽样单位数的确定一、影响必要抽样数目的因素(一)简单随机抽样二、必要抽样数目的计算公式

一家公司为估计坏帐而抽出了100个坏帐,这些坏帐的标准差为285.3。如今公司希望坏帐极限误差不超过35元,置信度99.73%,则应抽取多少份坏帐?例

建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料σ=1.5,求样本数应是多少?例第7节假设检验小概率原理:即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。例1:消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?消费者协会实际要进行的是一项统计检验工作。检验总体平均=250是否成立。这就是一个原假设(nullhypothesis),通常用表示,即::=250与原假设对立的是备选假设(alternativehypothesis),备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设。二、假设检验的步骤在例1中,按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下:第一步:确定原假设与备选假设。:=250;:<250以上的备选假设是总体均值小于250毫升,因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论