抽样调查梁课件_第1页
抽样调查梁课件_第2页
抽样调查梁课件_第3页
抽样调查梁课件_第4页
抽样调查梁课件_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 抽样调查 第1页,共87页。第一节 抽样调查的意义 一、抽样调查的概念一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。第2页,共87页。二、抽样调查的特点 (一)只抽取总体中的一部分单位进行调查(二)用一部分单位的指标数值去推断总体的指标数值(三)抽选部分单位时要遵循随机原则(四)抽样调查会产生抽样误差,抽样误差可以计算,并 且可以加以控制第3页,共87页。三、抽样调查的适用范围 抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确

2、度高、成本低、速度快、应用面广等优点。第4页,共87页。1.实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;2.虽可进行全面调查观察,但比较困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:第5页,共87页。第二节 抽样调查的基本概念及理论依据 一、 全及总体和抽样总体(总体和样本)全及总体:所要调查观察的全部事物。 总体单位数用N表示。抽样总体:抽取出来调查观察的单位。 抽样总体的单位

3、数用n表示。 n 30 大样本 n 30 小样本第6页,共87页。 二、 全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。抽样指标:抽样总体的那些指标。第7页,共87页。 抽样框 即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以确定总体的抽样范围和结构。样本个数指从总体中可能抽取的样本的数量。样本容量指一个样本所包括的单位数。第8页,共87页。 三、 抽样方法和样本可能数目根据取样的方式不同,有重复抽样和不重复抽样不重复抽样:又称不放回抽样。例以上每一种组织方式又有不同的抽取样本方法(机械抽样和整群抽样没有重复抽样):重复抽样:又称有放回抽样。不重

4、复抽样:又称不放回抽样。例例第9页,共87页。1. 如果是重复抽样:例根据对样本的要求不同,抽样方法又有考虑顺序抽样和不考虑顺序抽样两种。第10页,共87页。2. 如果是不重复抽样:例例第11页,共87页。四、抽样调查的理论依据 1、大数定律2、中心极限定律第12页,共87页。第三节 抽样平均误差 一、抽样误差的概念及其影响程度在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。第13页,共87页。抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。第14页,共87页。二、抽样误差的影响因素: 1. 全及总体标志变异程度。正比关系2. 抽样单位数目的多少。反比关系3.

5、 不同的抽样方式。4. 不同的抽样组织形式。第15页,共87页。抽样误差的作用:1. 在于说明样本指标的代表性大小。 误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。2. 说明样本指标和总体指标相差的一般范围。第16页,共87页。三、抽样平均误差 抽样平均误差实际上是样本指标的标准差。通常用表示。在N中抽出n样本,从排列组合中可以有各种各样的样本组:第17页,共87页。例四、抽样平均误差的计算 第18页,共87页。1010-20 4002015-15 2253020-10 1004025 -5 255030 0 01015-15 225202

6、0-10 1003025 -5 254030 0 05035 5 251020-10 1002025 -5 253030 0 04035 5 25504010 1001025 -5 252030 0 03035 5 25404010 100504515 2251030 0 02035 5 25304010 100404515 22550 505020 400合 计-2 500接左:第19页,共87页。第20页,共87页。以上资料编成次数分配表如下:样本数f (即次数分配)101-20152-15203-10254 -5305 0354 5403 10452 15501 20合计 25 -第21

7、页,共87页。抽样误差是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。 第22页,共87页。抽取样本样本平均数离差10 2015-1522510 3020-1010010 4025 -5 2510 5030 0 020 3025 -5 2520 4030 0 020 5035 5 2530 4035 5 2530 50401010040 504515225合 计-750上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:第23页,共87页。五、纯随机抽样的抽样平均误差 (一) 平均数的抽样平均误差1.重复抽样第24页,共87页。取得的途

8、径有: 1. 用过去全面调查或抽样调查的资料,若同时有n个的资料,应选用数值较大的那个;2. 用样本标准差S代替全及标准差;3. 在大规模调查前,先搞个小规模的试验性的调查来确定S,代替;4. 用估计的方法。第25页,共87页。 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200小时,例第26页,共87页。2.不重复抽样:第27页,共87页。(二) 成数的抽样平均误差 已证明得:成数的方差为p(1-p) 第28页,共87页。 某玻璃器皿厂某日生产15000只印花玻璃杯

9、,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例第29页,共87页。例:估计某乡粮食亩产量,从5000亩中随机抽取100亩,计算得出样本平均亩产量为450公斤,方差780公斤,则粮食平均亩产量的平均抽样误差是多少? 重复抽样不重复抽样2.8公斤2.77公斤例 估计对某项措施的支持率,对职工进行5的随机抽样,调查60名员工,有45人表示支持,则支持率的平均抽样误差是多少?重复抽样:不重复抽样:5.595.45第30页,共87页。六、类型抽样的抽样平均误差 第31页,共87页。第32页,共87页。 某农场种小

10、麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷,现用类型抽样法调查1200公顷,以各种麦田占全农场面积的比重分配抽样面积数量。 麦田类型抽样的平均误差计算表类 型全场播种面积(公顷)抽样调查面积(公顷)单位面积产量不均匀程度指标(千克)符 号Ninii丘陵地区 6000600 750337500000平原地区 3600360 840254016000山 地 24002401000240000000合 计120001200-831516000例第33页,共87页。第34页,共87页。高产麦田比重的平均误差计算表类别高产田比重(%)非高产田比重(%)麦田不均匀程度指标(

11、%)抽样调查面积(公顷)pi(1-pi)ni符号pi1-pipi(1-pi)ni丘陵802016 60096.0平原9010 9 36032.4山地604024 24057.6合计-1200 186第35页,共87页。七、机械抽样(等距抽样)的抽样平均误差 第36页,共87页。1.若按无关标志排队公式用以上纯随机抽样的公式,一般采用不重复抽样公式:第37页,共87页。2. 若按有关标志排队公式用类型抽样的公式:第38页,共87页。八、整群抽样的抽样平均误差 整群抽样的抽样平均误差受三个因素影响:(1)抽出的群数(r)多少 (反比关系)(2)群间方差( ) (正比关系)第39页,共87页。计算方

12、法如下:第40页,共87页。(3) 抽样方法 第41页,共87页。 假如某一机器大量生产某一种零件,现每隔一小时抽取5分钟产品进行检验,用以检查产品的合格率,检查结果如下:合格率群数rpipir80% 20.80 1.6-0.09960.0198485% 40.85 3.4-0.04960.0098490%120.90 10.8 0.0004 (太小不计)95% 30.95 2.85 0.05040.0076298% 30.98 2.94 0.08040.01939合计24- 21.59-0.05669例第42页,共87页。以上抽样平均误差的公式归纳如下:第43页,共87页。 第四节 全及指标

13、的推断 一、点估计和区间估计第44页,共87页。(一)点估计例第45页,共87页。(二)区间估计是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。第46页,共87页。 由于区间估计所表示的是一个可能的范围,而不是一个绝对可靠的范围。就是说,推断全及指标在这个范围内只有一定的把握程度。用数学的语言讲,就是有一定的概率。 根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下: 抽样极限误差=t,(t为概率度)第47页,

14、共87页。当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);例当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3); 可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。第48页,共87页。二、全及平均数和全及成数的推断 第49页,共87页。 某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则: 例1第50页,共87页。 某机械厂日产某种产品8

15、000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率: 例2第51页,共87页。三、全及总体总量指标的推断第52页,共87页。(一) 直接推断法抽样平均数(成数)总体单位数=总体标志总量1.如果采用点估计方法:上例1中:40010000=400(万千克) 如果用区间估计方法:上例1中该农场小麦总产量的范围为: t=2: (397.62 402.38)10000=397.62 402.38(万千克) t=3: (396.43 403.57)10000=

16、396.43 403.57(万千克) 2.上例2中,全部一级品数量的范围为: (92.82% 97.18%)8000=7425.6 7774.4(件)第53页,共87页。(二) 修正系数法就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。第54页,共87页。 某村6000农户,2001年年末统计养猪头数,从下往上报的是9000头,现抽10(600户)的农户再复查一下,发现有漏报,也有重报。按600户,原来数字是890头,实际复查为935头,故总的来说,是少报。例1第55页,共87页。某市房地局,年报工资总额3218.1万元。现抽查14个单位: 年报:415.03万

17、元 多报:0.44万元 少报:1.47万元抵冲后 1.47-0.44=1.03(万元)例2第56页,共87页。 第五节 抽样调查的组织形式 通常有以下五种组织形式:第57页,共87页。一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:1.直接抽选法;2.抽签法;3.随机数码表法;第58页,共87页。二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。 第59页,共87页。类型的划分:一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例;三是分类

18、型的数目不宜太多。第60页,共87页。类型抽样的好处是:样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。第61页,共87页。两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。第62页,共87页。三、机械抽样(等距抽样) 先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。第63页,共87页。排列次序用的标志有两种:1. 选择标志与抽样调查所研究内容无关, 称无关标志排队。2. 选择标志与抽样调查所研究的内容有关, 称有关标志排队。研究工人的平均收入水平时,按工号排队。例研究工人的生活水平,按工人月工

19、资额高低排队。例第64页,共87页。机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:第65页,共87页。2.半距起点等距抽样k k kk(k为抽取间隔)示意图:第66页,共87页。3.对称等距抽样示意图:k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)第67页,共87页。机械抽样的好处: 1. 可以使抽样过程大大简化,减轻抽样的工作量;2. 如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。第68页,共87页。机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把

20、总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。第69页,共87页。四、整群抽样 整群抽样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。整群抽样的好处:组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。第70页,共87页。五、多阶段抽样 即把抽样本单位的过程分为两个或几个阶段来进行。(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲: 先抽大单位(可以用类型抽样或机械抽样), 再在大单位中抽小单位(可用整群抽样或简单随机抽样),小单位中再抽更小的单位;而不是一次就直接抽取基层的调查单

21、位。第71页,共87页。第六节 必要抽样数目的确定 一、影响必要抽样数目的因素第72页,共87页。(一) 简单随机抽样二、必要抽样数目的计算公式第73页,共87页。(二) 类型抽样第74页,共87页。(三) 整群抽样第75页,共87页。 等距抽样的抽样数目,在有总体差异程度和比重的全面资料时,可采用类型抽样的公式;没有总体的全面资料时,可采用简单随机抽样的公式。第76页,共87页。建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料=1.5,求样本数应是多少?例1第77页,共87页。 某金笔厂月产10000支金笔,以前多次抽

22、样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?例2第78页,共87页。2、在抽样调查中( ) A、全及总体是唯一确定的 B、全及指标值只有一个 C、样本是唯一确定的 D、样本指标值只能有一个思考与练习A1、在抽样调查中,无法避免的误差是( ) A、登记性误差 B、无意误差 C、系统性误差 D、随机误差 一、单 项 选 择 题D第79页,共87页。3、根据重复抽样资料,甲单位工人工资方差为25 元,乙单位为100,乙单位人数比甲单位多3倍, 则抽样平均误差( )。 A、甲单位较大 B、相同 C、乙单位较大 D、无法判断 4、某工厂连续生产,一天

23、中每隔半小时取出一分钟 的产品进行全部检查,这是( )。 A、等距抽样 B、类型抽样 C、整群抽样 D、纯随机抽样 BC第80页,共87页。5、在纯随机重复抽样的情况下,要使抽样误差减少一半, (其他条件不变),则样本单位数必须( )。 A、增加2倍 B、增加到2倍 C、增加4倍 D、增加到4倍D6、抽样平均误差与抽样极限误差的关系为( )。 A、前者小于后者 B、前者大于后者 C、前者等于后者 D、不能判定大小D第81页,共87页。 二、多 项 选 择 题 1、按抽样方法的不同,可分为( )。 A、重复抽样 B、等距抽样 C、类型抽样 D、整群抽样 E、不重复抽样2、影响抽样误差的主要因素有( )。 A、抽样单位数 B、抽样方法 C、总体单位数 D、抽样组织形式 E、总体被研究标志的变异程度ABDE3、抽样估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论