抽样调查理论与方法课件_第1页
抽样调查理论与方法课件_第2页
抽样调查理论与方法课件_第3页
抽样调查理论与方法课件_第4页
抽样调查理论与方法课件_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/6/7《统计学》第8章抽样调查理论与方法8-1统计学主编:费宇,石磊2023/6/7《统计学》第8章抽样调查理论与方法8-2第8章抽样调查理论与方法8.1抽样调查的意义8.2抽样调查的基本概念8.3抽样误差8.4抽样方案设计8.5样本容量的确定2023/6/7《统计学》第8章抽样调查理论与方法8-38.1抽样调查的意义8.1.1抽样调查的概念8.1.2抽样调查的作用8.1.3抽样调查的应用领域2023/6/7《统计学》第8章抽样调查理论与方法8-48.1.1

抽样调查的概念统计调查:是获取数据资料的一种重要手段,它又分为全面调查与非全面调查两类。●全面调查:普查●非全面调查:又称为抽样调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本进行观察,并根据观察结果来推断全体,以此达到对全体目标量的了解。这是广义的抽样调查的概念。例:调查北京市民对出租车行业的满意度调查2023/6/7《统计学》第8章抽样调查理论与方法8-5抽样调查的分类

依据样本抽取的同,抽样可以分为非概率抽样和概率抽样两类。

2023/6/7《统计学》第8章抽样调查理论与方法8-6非概率抽样(non-probabilitysampling)

与概率抽样相对的一种抽样。又称非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法。问题:

(1)其效果好坏依赖于抽样者的主观判断能力和经验

(2)无法计算和控制抽样误差。无法用样本的量化数据来推断总体。

2023/6/7《统计学》第8章抽样调查理论与方法8-7便利抽样是根据调查者的方便与否来抽取样本的一种非概率抽样方法。典型的形式是“拦截式”调查。调查过程中由调查员依据方便的原则,自行确定入抽样本的单位调查员在街头、公园、商店等公共场所进行拦截调查厂家在出售产品柜台前对路过顾客进行的调查优点:容易实施,调查的成本低缺点:样本单位的确定带有偶然性,样本无法代表有明确定义的总体,调查结果无法根据样本信息对总体进行数量特征的推断,样本不适合描述性研究和因果关系研究

2023/6/7《统计学》第8章抽样调查理论与方法8-8判断抽样是一种凭研究人员的主观意愿、经验和知识,从总体中选择具有典型意义和代表性的样本点构成样本作为调查客体的一种非概率抽样方法。

一般选择“平均型”、“众数型”、“特殊型”单元作为样本样本量小及样本不易分门别类挑选时有其较大的优越性由于其估计精度严重依赖于研究者对调查对象的了解程度、判断水平和对结果的解释情况,所以,一般不轻易地用于对总体进行数量方面的判断2023/6/7《统计学》第8章抽样调查理论与方法8-9配额抽样先将总体中的所有单元按一定的标志分为若干(组),然后在每个类(组)中按照事先规定的比例或数量(即配额)用便利抽样或判断抽样方法选取样本点分类依据通常就是总体单元的某些属性、特征,如受调查者的年龄、性别、社会阶层等方法简单易行,可以保证总体的各个类别都能包括在所抽样本之中,使得样本的结构和总体的结构类似2023/6/7《统计学》第8章抽样调查理论与方法8-10配额抽样独立控制配额抽样:根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额

●优点:方法简单易行,调查人员选择余地较大

●缺点:调查人员可能图一时方便,选择样本过于偏向某一组别,从而影响样本的代表性交叉控制配额抽样:是根据调查对象的各个特性的样本数额交叉分配●由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。2023/6/7《统计学》第8章抽样调查理论与方法8-11滚雪球抽样是以“滚雪球”的方式抽取样本,即通过一些“种子”样本点以获取更多样本点的信息,样本量逐渐扩大优点:便于有针对性找到被调查者,调查的成本也比较低缺点:要求样本单元之间必须有一定的联系并且愿意保持和提供这种关系

2023/6/7《统计学》第8章抽样调查理论与方法8-12概率抽样

(probabilitysampling)又称随机抽样,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的抽样方法特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会(概率)被抽中“随机”不等于“随便”“随机”不等于“等概率”用样本指标数值去推断总体的指标数值抽样调查会产生抽样误差,这个误差可以计算,并且可以加以控制2023/6/7《统计学》第8章抽样调查理论与方法8-13概率抽样

(probabilitysampling)概率抽样被视为狭义的抽样调查,在实践中被广泛加以采用,通常所谓的抽样调查,均指概率抽样调查。概率抽样有多种形式:简单随机抽样、分层抽样、系统抽样、整群抽样等,这些方法将在8.4节逐一介绍。2023/6/7《统计学》第8章抽样调查理论与方法8-148.1.2抽样调查的作用实际工作不可能进行全面调查,而又需要了解其全面情况的现象对虽然可以进行全面调查,但调查时范围大、单位数目多,又缺乏原始记录作依据的现象对普查资料的质量进行检查和修正抽样调查方法可以用于工业生产过程中的质量控制

2023/6/7《统计学》第8章抽样调查理论与方法8-158.1.3抽样调查的应用领域社会经济现象的调查

如:人口变动、农产量、城市居民家计、农村经济、小型工业企业生产情况、小型商业企业交易情况调查

社会性的民意调查市场调查卫生调查资源环境调查2023/6/7《统计学》第8章抽样调查理论与方法8-168.2抽样调查的基本概念

8.2.1总体与样本8.2.2总体参数与统计量8.2.3抽样单元与抽样框8.2.4抽样方法与样本可能数目8.2.5精度与费用2023/6/7《统计学》第8章抽样调查理论与方法8-178.2.1总体与样本总体:研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体(individual)所组成

1)总体的限定是人为的

2)在一项调查中,总体是唯一的,样本不是唯一的

3)总体中包含的单元数称为总体容量,记为个体:构成总体的基本单元

2023/6/7《统计学》第8章抽样调查理论与方法8-18统计总体的种类指总体中所包含的单位数目是有限的总体指总体中所包含的单位数目是无限的总体有限总体无限总体对有限总体可以进行全面调查,也可以进行非全面调查;

对无限总体只能采取非全面调查

2023/6/7《统计学》第8章抽样调查理论与方法8-19样本:是总体的一部分,从总体中按一定程序抽取的那部分抽样单元或个体组成。

1)样本也是一个集合,每个被抽中的进入样本的单元称为入样单元,

2)样本包含的单元数称为样样本容量,记为n3)样本量对总体容量之比称为抽样比,记为f=n/N(一般是一个很小的数)

4)大样本;小样本2023/6/7《统计学》第8章抽样调查理论与方法8-208.2.2总体参数与统计量总体参数:是根据总体中各单位的变量值计算出来的用于反映总体的数量特征的指标调查的目标量都是由总体的某些指标来表示的总体参数表现为一系列唯一的常数,但往往却是未知的,需要去推断和估计2023/6/7《统计学》第8章抽样调查理论与方法8-21统计量:是根据样本的n个单元的变量值计算出来一个量,也叫估计量(estimator),1)样本指标是随机变量

2)往往构成了用于估计总体参数的估计量。2023/6/7《统计学》第8章抽样调查理论与方法8-22#常见的总体参数包括:总体均值(平均数)(populationmean)总体总值(总和)(populationtotal)总体比例(proportion)总体方差(populationvariance)标准差(populationstandarddeviation)2023/6/7《统计学》第8章抽样调查理论与方法8-238.2.3抽样单元与抽样框总体是由个体组成的,可以是有限的,也可以是无限的,当从抽样角度而言,总将总体看成是有限的。将总体划分为互不重迭而又穷尽的有限多个部分,将这样的每个部分称为抽样单元(samplingunit)。

1)每个抽样单元都由或多或少的个体组成,当然也可以是一个个体。

2023/6/7《统计学》第8章抽样调查理论与方法8-242)抽样单元可大可小,可以分级。分别称为一级抽样单元(psu)、二级抽样单元(ssu),…,基本抽样单元(最小一级抽样单元)。

3)抽样单元可以是人为划分的,也可以是自然形成的。2023/6/7《统计学》第8章抽样调查理论与方法8-25包含所有抽样单元的名单或者清册,称为抽样框。

1)抽样框的形式是多样的

2)抽样框中的单元原则上既不应有重复,也不应有遗漏抽样框的种类:名录框、区域框、自然框2023/6/7《统计学》第8章抽样调查理论与方法8-268.2.4抽样方法与样本可能数目从总体中抽取样本方式的不同,构成了不同的抽样方法

1)放回抽样/回置抽样、不放回抽样

2)等概率抽样、不等概率抽样对样本开展调查,获得样本数据,形成样本指标,构造适当的统计量作为总体指标的估计是抽样调查的必要工作2023/6/7《统计学》第8章抽样调查理论与方法8-27重复抽样:指每次从总体中抽取一个单元进行观察后,再把这个单元重新放回总体,使之继续参加下次抽选(回置抽样或重置抽样)。不重复抽样:指每次从总体中抽取一个单元进行观察后,不再把这个单元重新放回总体,这个总体单元不再继续参加下次抽选(不回置抽样或不重置抽样)。2023/6/7《统计学》第8章抽样调查理论与方法8-28考虑顺序的重复抽样不考虑顺序的重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样2023/6/7《统计学》第8章抽样调查理论与方法8-298.2.5精度与费用

抽样调查的精度→误差的大小→抽样误差的大小→(可用估计量,大样本)方差或标准差大小抽样调查中,精度的估计主要就是估计量的方差估计影响方差的最重要的因素是样本量,样本量又与费用有关影响精度和费用的另一因素是抽样方法和估计方法对于一个具体的抽样设计,应尽量做到在固定费用的限制下使精度最高,或在要求达到的精度的约束下使调查费用最省,称这样的设计为最优设计2023/6/7《统计学》第8章抽样调查理论与方法8-30#对精度的讨论基于两个方向:对于某类抽样方案,构造合适的估计量并讨论这一估计量的方差估计对于既定的抽样方案,依据给定的精度要求(误差限要求)讨论方案的细节(如样本量的确定问题)2023/6/7《统计学》第8章抽样调查理论与方法8-318.3抽样误差

8.3.1抽样调查中误差的来源8.3.2抽样平均误差、方差与偏差8.3.3抽样平均误差的计算8.3.4抽样极限误差与置信度2023/6/7《统计学》第8章抽样调查理论与方法8-328.3.1抽样调查中的误差来源凡调查就一定有误差,不可能完全避免。抽样调查中误差可分为非抽样误差及抽样误差两大类。#非抽样误差(non-samplingerror):指不是由于抽样引起的,在全面普查中也存在。包括:

1)调查误差:调查所得数据与样本单元的真值不一致所造成的误差。原因包括测量误差、失真回答等。

2)不完整的抽样框误差:抽样框的重复和遗漏。

3)不回答误差(无相应误差):抽中的样本单元找不到或者拒绝回答问题或缺失所需要的信息

4)填写录入误差2023/6/7《统计学》第8章抽样调查理论与方法8-33#抽样误差(samplingerror):指由于抽样所造成的误差(用样本估计总体而产生的误差)。其根源在于样本的随机性,使得样本指标值和总体真实值之间存在差异

1)只要是抽样调查,这个误差不可避免

2)能够计量和控制,可用各种量值表示

3)通常样本量愈大,则抽样误差愈小(抽样误差与样本量的平方根成反比)2023/6/7《统计学》第8章抽样调查理论与方法8-348.3.2抽样平均误差、方差和偏差2023/6/7《统计学》第8章抽样调查理论与方法8-35均方误差可以分解:其中:称为的(抽样)方差

称为的偏差(Bias)

特别地,对于无偏估计量,满足:因此:即:对于无偏估计量,其方差可以表征抽样平均误差程度2023/6/7《统计学》第8章抽样调查理论与方法8-36均方误差的平方根称为抽样平均误差,方差的平方根称为标准差(standarddeviation)。

抽样平均误差、标准差和偏差三者之间的关系:2023/6/7《统计学》第8章抽样调查理论与方法8-378.3.3抽样平均误差的计算本章主要讨论简单随机抽样条件下,以及估计量是无偏估计量的抽样平均误差的计算(一)样本平均数的抽样平均误差1.重复抽样2023/6/7《统计学》第8章抽样调查理论与方法8-38

某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:σ=20小时,根据以往资料,产品质量不太稳定,若σ=200小时,例2023/6/7《统计学》第8章抽样调查理论与方法8-392.不重复抽样:2023/6/7《统计学》第8章抽样调查理论与方法8-40(二)样本比例的抽样平均误差

已证明得:比例的平均数就是比例本身比例的方差是

2023/6/7《统计学》第8章抽样调查理论与方法8-41

某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例2023/6/7《统计学》第8章抽样调查理论与方法8-42得取总体方差的途径有:

1.用过去全面调查或抽样调查的资料,若同时有几个方差的资料,应选用数值较大的那个;2.用样本标准差代替总体标准差;3.在大规模调查前,先搞个小规模的试验性的调查来确定总体方差;4.用估计的方法。预估计指标观测值,然后计算总体方差。2023/6/7《统计学》第8章抽样调查理论与方法8-438.3.4抽样极限误差和置信度实际问题中,估计量的精度通常采用抽样极限误差来表示或要求抽样极限误差:是根据概率理论,以一定的可靠程度保证抽样误差不超过某一给定的范围,也称作抽样允许误差。常用△表示。。意义:在一定的置信度下,估计值与真实值的差异不超过

2023/6/7《统计学》第8章抽样调查理论与方法8-44置信度:极限误差是在某种概率意义下的最大误差范围,这里的概率称为置信度一般用表示。抽样极限误差与抽样平均误差之间的关系,与估计量的分布有关有:#误差限与置信度是成对出现的,置信度越大,则相应的误差限就越大。#因此,实际问题中,只给出误差限不给出置信度或者相反,都是没有意义的。

2023/6/7《统计学》第8章抽样调查理论与方法8-458.4抽样方案设计

8.4.1抽样方案设计的基本原则8.4.2简单随机抽样8.4.3分层抽样8.4.4系统抽样8.4.5整群抽样2023/6/7《统计学》第8章抽样调查理论与方法8-468.4.1抽样方案设计的基本原则抽样方案的设计关系到调查的准确度有多高以及必要的样本数目是多少等问题。因此要科学地设计抽样调查方案。1.在抽样设计中要保证实现随机抽取的原则(随机原则是概率抽样的基础)2.在抽样设计中要保证实现最大抽样效率的原则(实现最大抽样效率是经济效益的问题)2023/6/7《统计学》第8章抽样调查理论与方法8-478.4.2简单随机抽样

(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为n的样本都有相同的机会(概率)被抽中抽取元素的具体方法有重复抽样和不重复抽样特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率2023/6/7《统计学》第8章抽样调查理论与方法8-488.4.2简单随机抽样简单随机抽选有各种不同的具体做法,如:

1.抽签法

2.使用统计软件直接抽取法

3.随机数法简单随机抽样误差的计算在重复抽样条件下:在不重复抽样条件下:2023/6/7《统计学》第8章抽样调查理论与方法8-498.4.3分层抽样

(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本例如,在居民生活水平调查中,先按职业分类,然后每种职业分别随机抽取部分居民进行调查。实质上是分组法与随机原则的结合总体N样本n等比例抽取不等比例抽取······2023/6/7《统计学》第8章抽样调查理论与方法8-50分层抽样优点1.既可以对总体参数进行估计,也可以对各层的目标量进行估计2.通过将性质相近的单位划为同一层,可以提高估计的精度3.组织实施调查灵活方便4.分层样本分别取自各层,在总体中的分布更为均匀,不会出现不平衡的情况2023/6/7《统计学》第8章抽样调查理论与方法8-51两种类型:1.等比例分配法(类型比例抽样)2.不等比例分配法(类型适宜抽样)实际工作中比较常用的是等比例分配法

2023/6/7《统计学》第8章抽样调查理论与方法8-52分层抽样抽样平均误差的计算在重复抽样条件下:其中,,在不重复抽样条件下:2023/6/7《统计学》第8章抽样调查理论与方法8-538.4.4系统抽样

(systematicsampling)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难2023/6/7《统计学》第8章抽样调查理论与方法8-54排列次序用的标志有两种:1.无关标志排队:选择标志与抽样调查所研究内容无关2.有关标志排队:选择标志与抽样调查所研究的内容有关研究工人的平均收入水平时,按工号排队。例研究工人的生活水平,按工人月工资额高低排队。例2023/6/7《统计学》第8章抽样调查理论与方法8-55根据样本抽选的方法不同,可分为:随机起点等距抽样半距起点等距抽样对称起点等距抽样······(总体单位按某一标志排序)······(总体单位按某一标志排序)······(总体单位按某一标志排序)2023/6/7《统计学》第8章抽样调查理论与方法8-56按无关标志排队的等距抽样,可按简单随机抽样来计算;按有关标志排队的等距抽样,可按分层抽样来计算。等距抽样的抽样平均误差等距抽样的抽样平均误差估计比较复杂。一般按以下方法近似计算。2023/6/7《统计学》第8章抽样调查理论与方法8-57等距抽样抽样平均误差的计算按无关标志排队一、在重复抽样条件下:二、在不重复抽样条件下:2023/6/7《统计学》第8章抽样调查理论与方法8-58按有关标志排队一、在重复抽样条件下:二、在不重复抽样条件下:在等距系统抽样时,每个组内只抽取一个单元,因此,从而所以,2023/6/7《统计学》第8章抽样调查理论与方法8-598.4.5整群抽样

(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差2023/6/7《统计学》第8章抽样调查理论与方法8-60例:总体群数R=16样本群数r=4ABCDEFGHIJKLMNOPIHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差2023/6/7《统计学》第8章抽样调查理论与方法8-61整群抽样的抽样平均误差1、抽样平均数的平均误差2、抽样成数的平均误差整群抽样一般都采用不重复抽样方法。因此,在计算抽样误差时要使用修正系数。2023/6/7《统计学》第8章抽样调查理论与方法8-628.5样本容量的确定

8.5.1影响样本容量确定的主要因素8.5.2确定抽样单元数的方法2023/6/7《统计学》第8章抽样调查理论与方法8-63

8.5.1影响样本容量确定的主要因素

总体被研究标志的变异程度调查者对推断精确度的要求抽样调查的方式和方法人力、物力和财力的允许条件2023/6/7《统计学》第8章抽样调查理论与方法8-648.5.2确定抽样单元数的方法(一)简单随机抽样

重复抽样

不重复抽样

2023/6/7《统计学》第8章抽样调查理论与方法8-658.5.2确定抽样单元数的方法(二)分层抽样

重复抽样

不重复抽样

2023/6/7《统计学》第8章抽样调查理论与方法8-668.5.2确定抽样单元数的方法(三)整群抽样

由于整群抽样一般为不重复抽样,所以按不重复抽样计算必要抽样群数不重复抽样

2023/6/7《统计学》第8章抽样调查理论与方法8-67建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料σ=1.5,求样本数应是多少?例12023/6/7《统计学》第8章抽样调查理论与方法8-68

某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?例22023/6/7《统计学》第8章抽样调查理论与方法8-69本章小结

本章介绍了抽样调查的分类、作用和应用领域以及抽样调查中涉及的基本概念和基本方法。主要分析了抽样调查中误差的来源和不同概率抽样误差的计算方法以及样本容量的确定问题。

抽样调查分为非概率抽样和概率抽样。非概率抽样有便利抽样、判断抽样、配额抽样和雪球抽样四种方法。概率抽样又称为随机抽样,有简单随机抽样、分层抽样、系统抽样和整群抽样等抽样方法,这些抽样方法各有优缺点,在实践中被广泛采用。2023/6/7《统计学》第8章抽样调查理论与方法8-70

抽样调查中涉及的基本概念有总体与样本、总体参数与统计量、抽样单元与抽样框、抽样方法与样本可能数目、精度与费用。2023/6/7《统计学》第8章抽样调查理论与方法8-71

抽样误差是由于用样本估计总体而产生的误差,它直接关系到抽样的精度。如果抽样误差大,抽样推断的精度就会低,所以要合理地控制抽样误差。而正确反映抽样误差的指标是抽样平均误差。至于如何合理地控制抽样误差,要以一定的抽样概率(置信度)作保证,才能使误差不超过某一给定的范围,这个给

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论