第六章抽样调查新_第1页
第六章抽样调查新_第2页
第六章抽样调查新_第3页
第六章抽样调查新_第4页
第六章抽样调查新_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节抽样调查的意义第二节抽样调查的基本概念及理论依据第三节抽样平均误差第四节全及指标的推断第五节抽样方案设计第七节假设检验主要内容第六章抽样调查1第一节抽样调查的意义抽样调查的目的及科学原理抽样调查的概念抽样调查的特点2一、抽样调查的目的及科学原理抽样调查的目的在统计调查中,为了要取得某一社会经济现象总体的综合特征,除了运用全面调查方法以外,是否能只对总体的部分单位进行调查,从而掌握总体的综合特征呢?特别是当总体的单位数众多而不便于采用全面调查,或者当某些现象总体的综合特征是要经过破坏性的测试才能取得的情况下,能否只对总体的一部分单位进行调查,即可推断总体呢?回答是肯定的。这种统计调查的方法,就是科学的抽样调查。3抽样调查的科学原理:大数定律和概率论

早在17世纪到19世纪中叶,大数定律、概率论逐步发展形成为一门数学分支,当时产生了抽样调查的统计研究方法。正是由于大数定律、概率论研究的重大进展,使抽样调查获得了充分的数学理论依据,为抽样调查的精确计算和抽样方法的实际运用,提供了现实可能性。自此以后,抽样调查这一数理统计方法广泛地运用到自然现象和社会经济统计领域之中。4二、抽样调查的概念广义的概念凡是抽取一部分单位进行观察,并根据观察结果来推断全体的都是抽样调查,其中又可分为非随机抽样和随机抽样两种。非随机抽样非随机抽样是由调查者根据自己的认识和判断,选取若干个有代表性的单位,根据这些单位进行观察的结果来推断全体,如民意测验等。随机抽样

随机抽样是根据大数定律的要求,在抽取调查单位时,应保证总体中各个单位都有同样的机会被抽中。5狭义的概念(一般性概念)严格意义上的抽样调查的概念是:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体做出数量上的推断分析。6三、抽样调查的特点只抽取总体中的一部分单位进行调查用一部分单位的指标数值去推断总体的指标数值抽选部分单位时要遵循随机原则抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制。71.实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;2.虽可进行全面调查观察,但比较困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。一般适用:8第二节抽样调查的基本概念及理论依据全及总体和抽样总体全及指标和抽样指标抽样方法和样本可能数目抽样调查的理论依据9一、全及总体和抽样总体在抽样调查中,有两种不同的总体,即全及总体和抽样总体。全及总体(简称总体)

全及总体是指所要认识对象的全体,总体是由具有某种共同性质的许多单位组成的。因此,总体也就是具有同一性质的许多单位的集合体。全及总体按其各单位标志性质不同,可以分为变量总体和属性总体两类。变量总体(无限总体和有限总体)属性总体10抽样总体(简称样本)抽样总体是从全及总体中随机抽取出来,代表全及总体部分单位的集合体。抽样总体的单位数通常用小写英文字母n表示。对于全及总体单位数N来说,n是个很小的数。一般说来,样本单位数达到或超过30个称为大样本,而在30个以下的样本则称为小样本。以很小的样本来推断很大的总体,这是抽样调查的一个特点。

如果说全及总体是唯一确定的,那么抽样总体就完全不是这样。一个全及总体可能抽取很多个抽样总体,全部样本的可能数目和每一个样本的容量有关,也和随机抽样的方法有关。11二、全及指标和抽样指标全及指标全及指标的概念全及指标是指根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标。变量总体的全及指标(三项)由于变量总体中各单位的标志可以用数量来表示,因此可以计算总体平均数。此外,全及指标还有总体标准差和总体方差,它们都是测量总体标志值分散程度的指标。

12研究总体中的数量标志总体平均数总体方差X=∑XNX=∑XF∑FΣ(X-X)

N2σ=2Σ(X-X)FΣF2σ=2研究总体中的品质标志总体成数成数方差σ2=P(1-P)P=

N1N参数13抽样指标抽样指标的概念由抽样总体各个标志值或标志特征计算的综合指标称为抽样指标。抽样指标(三项)与全及指标相对应,抽样指标也有三项,即抽样平均数、样本标准差和样本方差。用公式分别表示如下:

14

统计量研究数量标志样本平均数x=∑xnx=∑xf∑f样本方差研究品质标志样本成数成数方差np=n15统计抽样过程

(推断总量指标)总体N(抽取方式方法)样本n(计算抽样指标)(计算抽样误差)(抽样估计)16统计推断的过程总体总体均值、比例、方差样本样本统计量例如:样本均值、比例、方差17三、抽样方法和样本可能数目样本的可能数目既和每个样本的容量有关,也和抽样的方法有关。当样本容量为既定时,则样本的可能数目便决定于抽样的方法。根据取样的方式不同,抽样方法可分为重复抽样和不重复抽样。重复抽样不重复抽样18

重复抽样:从总体N个单位中要随机抽取容量为n的样本,每次从总体中抽取一个,把它当作一次试验,连续进行n次试验构成抽样样本。不重复抽样:从总体N个单位中要随机抽取容量为n的样本,每次从总体中抽取一个,连续进行n次抽选,构成抽样样本。19例某全及总体由1、2、3、4、5六个数字构成。全及总体:1、2、3、4、5。假设样本容量为3,则从全及总体中采用不考虑顺序不重复的简单随机抽样,可以抽取出10个抽样总体,这样就有10个样本平均数.1,2,31,3,41,4,52,3,42,4,51,3,51,2,53,4,51,2,42,3,520样本个数——指从总体中可能抽取的最多的样本数量。1、重复抽样:2、不重复抽样:21可能样本数目的计算公式考虑顺序不考虑顺序不重复抽样重复抽样22四、抽样调查的理论依据大数定律随着抽样单位数n的增加,抽样平均数有接近总体平均数的趋势。独立同分布大数定律贝努力大数定律中心极限定律如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋于正态分布。独立同分布中心极限定理拉普拉斯中心极限定理

23第三节抽样平均误差抽样误差的概念影响抽样平均误差的因素抽样平均误差的计算24一、抽样误差的概念抽样调查是用样本指标推断总体指标的一种调查方法,而推断的根据就是抽样误差。抽样误差实际上是指样本指标和总体指标之间数量上的差别,用数学符号表示即为:。理解抽样误差可以从以下两个方面着手:抽样误差是指由于抽样的随机性而产生的那一部分代表性误差,不包括登记误差,也不包括可能发生的偏差。登记性误差登记误差是指在调查过程中由于主、客观原因引起的登记、汇总或计算等方面的差错而造成的误差。25代表性误差代表性误差是指由于样本结构与总体结构不同(就被研究标志而言),样本不能完全代表总体而产生的样本指标与总体指标之间的误差。代表性误差有两种:一种是偏差,是指破坏了抽样的随机原则而产生的误差,如抽选到一个单位后,调查者认为它偏低或偏高,把它剔除掉而产生的偏差。这种偏差在进行抽样调查时应该设法避免,不包括在抽样误差这一概念之内;另一种是随机误差,是指遵守了随机原则但可能抽到各种不同的样本而产生的误差,抽样误差就是指这种随机误差。26随机误差有两种:抽样实际误差和抽样平均误差。抽样实际误差抽样实际误差是指某一个样本指标与总体指标之间的差别。抽样平均误差抽样平均误差是指所有可能出现的样本指标的标准差,也就是指所有抽样实际误差的平均水平。在讨论抽样误差时,我们所指的误差就是抽样平均误差。

27二、影响抽样平均误差的因素为了计算和控制抽样平均误差,需要分析影响抽样平均误差的因素。抽样平均误差大小主要受以下三个因素的影响。全及总体标志的变动程度(正比关系)全及总体标志变动程度越大,抽样平均误差就越大;反之越小。抽样单位数的多少(反比关系)在其它条件不变的情况下,抽取的单位数越多,抽样平均误差越小;反之越大。抽样组织的方式28※四、抽样平均误差的计算(一)抽样平均数的抽样平均误差μx是变量总体一系列抽样平均数对总体平均数的标准差。其理论计算公式:平均数抽样平均误差样本平均数(随机变量)总体平均数(惟一确定的,但通常是未知的)样本可能数目291.重复抽样抽样平均数的抽样平均误差μx根据数理统计理论,在重复抽样方式下,抽样平均误差与全及总体的标准差成正比关系,而与抽样总体单位数的平方根成反比关系,可推导出如下公式:平均数抽样平均误差全及总体的标准差抽样单位数抽样平均误差仅为全及总体标准差的重要30

例:有4个工人,各人每月产量分别是40、50、70、80,现在随机从其中抽取2人,试根据所给出的条件求抽样平均误差;假设从中随机抽取3人,那么抽样平均误差又应是多少?(P-)312.不重复抽样抽样平均数的抽样平均误差μx不重复抽样与重复抽样相比,样本可能数目减少,且样本变量之间不是互相独立的。因此,在重复抽样的基础上考虑一个修正系数即可。证明过程见P261-262总体单位总数样本单位总数抽样比例总体标准差重要重要32在总体单位数N很大的情况下,该公式可以近似地表示为:

33实际计算公式1.重复抽样2.不重复抽样34抽样平均误差的实际计算在上面计算抽样平均误差的转化公式里,平均数的标准差是指全及总体而言的。但是在抽样调查的实践中,全及总体的总体标准差一般都是未知的。因此,通常可以采用以下四种方法解决。用过去调查所得到的资料用样本方差的资料代替总体方差用小规模调查资料用估计的材料

35

某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时,根据以往资料σ=20小时,试求抽样平均误差。例重复抽样:不重复抽样:36

某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方法从中抽取150只进行质量检验,有147只合格,试求这批印花玻璃杯合格率的抽样平均误差。例37例某公司进口一批电子器件5000件,为了检测其寿命,抽取了500件进行检验,结果如下:分别计算重复抽样和不重复抽样方式下电子器件的抽样平均误差。寿命(千小时)器件数(只)8以下208-9709-1034010-114011以上30合计500组中值—1505953230420345474011255057.53068544103967.54524578.4167.230.13641.62122.41309.87.58.59.510.511.538重复抽样下:不重复抽样下:39例上题中,如果寿命低于9000小时的产品是不合格品,计算不合格率(合格率)的抽样平均误差。不合格率:重复抽样下:不重复抽样下:40课堂练习某超市第三次购进福临门5升装食用油,抽取30瓶进行检验。经检验,这30瓶食用油的平均容量为4.99升,以往两批食用油容量的标准差为0.12升和0.10升。1、计算这次检验的抽样平均误差。2、按规定容量≥4.9升为合格,这30瓶食用油有2瓶不合格,计算这批食用油合格率的抽样平均误差。4142抽样产品使用寿命资料表使用时间(小时)抽样检查电灯泡数(个)使用时间(小时)抽样检查电灯泡数(个)900以下21050~110084900~95041100~115018950~1000111150~120071000~1050711200以上3合计200某工厂对10000个产品进行使用寿命检验,在重复抽样条件下随机抽取2%的样本进行测试,所得资料如下:请根据以上资料计算灯泡平均使用寿命的抽样平均误差。43第四节全及指标的推断抽样推断要求抽样推断的方法抽样推断的步骤44一、抽样推断要求抽样推断的概念

抽样推断是按已经抽定的样本指标(样本平均数)来估计总体指标(总体平均数),或其所在的区间范围。抽样推断的要求(合理、优良估计)无偏性:用抽样指标估计总体指标,要求所有的可能指标的平均数等于被估计的总体指标。一致性:用抽样指标估计总体指标,要求当抽样单位数充分大时,抽样指标也充分地靠近总体指标。有效性:用抽样指标估计总体指标,要求作为优良估计量的方差应该比其他估计量的方差小。45

无偏性估计量的数学期望等于被估计的总体参数P(X)XCA无偏有偏46

一致性

随着样本容量的增大,估计量越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P(X)X47

有效性AB中位数的抽样分布均值的抽样分布XP(X)

一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量相比,样本均值是一个更有效的估计量48二、抽样推断的方法点估计点估计也叫定值估计(或直接估计),就是把样本平均数直接作为总体平均数的估计值。区间估计区间估计的意义在一定概率的保证下,用样本指标去推断总体指标,在考虑抽样误差的前提下,使得总体指标落到某一范围之内。49抽样极限误差(置信区间)抽样误差范围是指变动的抽样指标与确定的全及指标之间离差的可能范围。它是根据概率理论,以一定的可靠程度保证抽样误差不超过某一给定的范围。统计上把这个给定的抽样误差范围叫做抽样极限误差,也称置信区间。可信程度抽样平均误差μ是表明抽样估计的准确度。抽样误差范围即抽样极限误差Δ是表明抽样估计准确程度的范围。在给定的准确程度范围内的抽样估计,还要研究其估计的可靠程度,即可信程度。50

抽样极限误差(置信区间)用公式表示如下:有了抽样极限误差,则全及指标(总体平均数)的范围估计(或称区间估计)可以按下式计算:

由于全及指标是个未知的数值,而抽样指

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论