统计学第4章抽样调查课件_第1页
统计学第4章抽样调查课件_第2页
统计学第4章抽样调查课件_第3页
统计学第4章抽样调查课件_第4页
统计学第4章抽样调查课件_第5页
已阅读5页,还剩141页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章

抽样调查

第四章抽样调查1重点与难点:重点:抽样调查的意义抽样平均误差的意义及计算总体参数的点估计与区间估计的方法难点:抽样平均误差的计算总体参数的区间估计重点与难点:2学习内容:

一、抽样调查的基本问题二、抽样误差三、参数估计四、抽样调查的组织形式学习内容:3第一节抽样调查的基本问题

一、抽样调查的意义

一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。第一节抽样调查的基本问题一、抽样调查的意义一般所讲的41.按随机原则抽选调查单位;2.用样本推断总体;3.在调查之前可以计算和控制抽样误差。抽样调查的特点:

1.按随机原则抽选调查单位;抽样调查的特点:5抽样推断:即根据样本统计量推断总体参数的过程。也叫抽样估计。抽样调查的特点之一:由部分推断总体统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)

抽样调查(抽样推断)的概念抽样推断:即根据样本统计量推断总体参数的过程。也叫抽样估计。6

随机样本:与总体分布特征相同非随机样本:与总体分布特征不同并非所有的抽样估计都按随机原则抽取样本。也有非随机抽样。特点之二:按随机原则抽取样本随机样本:与总体分布特征相同7特点之三:存在估计误差,并可加以控制。抽样推断误差登记误差代表性误差用设计、培训、管理等方法消除用抽样方法、样本容量等手段控制特点之三:存在估计误差,并可加以控制。抽样推断误差登记误差代8抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。二、抽样调查的适用范围

抽样调查方法是市场经济国家在调查方法上的必然选择,和普查91.总体范围较广,不需要了解每一个别单位的情况;2.对破坏性或消耗性产品的质量进行检验;3.对普查或全面调查的统计资料进行检查和修正。一般适用于以下范围:1.总体范围较广,不需要了解每一个别单位的情况;2.对破坏性10三、抽样调查的几个基本概念

(一)总体和样本总体:所要调查观察的全部事物。总体单位数用N表示。总体可以分为有限总体和无限总体。样本:从总体中抽取出来那部分单位所组成的集合体。样本是总体的一个缩影。抽样总体的单位数,即样本容量,用n表示。n≥30大样本n<30小样本三、抽样调查的几个基本概念(一)总体和样本总体:所要调查11(二)参数和统计量总体参数样本统计量特征数及符号总体单位数N样本(单位数)容量n总体平均数样本平均数总体成数P样本成数p总体标准差样本标准差S总体方差样本方差参数:描述总体特征的指标。统计量:描述样本特征的指标。抽样推断的目的就是要通过对样本的平均数、成数的标准差(或方差)的测量来推断总体的相应特征值。主要统计特征数及符号

(二)参数和统计量总体参数样本统计量特总体单位数N样本(单12(三)抽样方法重置抽样:即有放回抽样。不重置抽样:即无放回抽样,每个总体只能有一次被抽中的机会。(三)抽样方法重置抽样:即有放回抽样。13样本单位的抽选方法在组织抽样调查时,根据样本单位是否重复抽取,分别有重复抽样和不重复抽样两种方法。1、重复抽样重复抽样是指每次从总体中抽取一个单位进行观察后,再把这个单位重新放回总体,使之继续参加下次抽选。这种抽选法也称为回置抽样或重置抽样。重复抽样法由于前一次抽中的单位又被放回总体中,不会影响后面的抽选,所以总体中每个单位被抽中的机会均等连续抽选各单位都是独立进行的的。样本单位的抽选方法在组织抽样调查时,根据样本单位是否142、不重复抽样不重复抽样是指每次从总体中抽取一个单位进行观察后不再把这个单位重新放回总体,这个总体单位不再继续参加下次抽选。这种抽选法也称为不回置抽样或不重置抽样。不重复抽样法由于每次抽中的单位不再放回总体中,每抽选一次,总体中的单位就减少一个,使连续抽选的各个单位不相互独立。但是总体中各单位被抽中的机会仍然是均等的!不重复抽样按是否考虑抽选样本单位的顺序,又可分为有顺序不重复抽样和无顺序不重复抽样两种。有顺序不重复抽样即通常所说的不重复排列。按这种抽样方法只要有一个单位不同,就算不同的样本。2、不重复抽样不重复抽样是指每次从总体中抽取一个单位15

抽样框——是指包含有全部总体单位及其主要指标特征的一个框架或列表。

(四)抽样框

以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。抽样框——是指包含有全部总体单位及其主要指标特征的一个框16

抽样框的形式一般有两种:

(四)抽样框

一览表:表中列出所有总体单位。

地图:在地图上将调查单位分布在各个地区,然后根据地区进行抽样。

抽样框的形式一般有两种:(四)抽样框17

样本可能数目又称样本个数,是指从一个有N个单位的总体中抽取容量为n的样本时,有可能出现的所有样本的个数。

(五)样本可能数目样本可能数目又称样本个数,是指从一个有N个单位的总体中抽取18抽样调查的理论基础

概率论大数定律中心极限定理抽样调查的理论基础概率论大数定律中心极限定理19大数定律大数定律是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是,在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会相互抵消,从而使现象的必然规律性显示出来。例如,观察个别或少数家庭的婴儿出生情况,发现有的生男,有的生女,没有一定的规律性,但是通过大量的观察就会发现,男婴和女婴占婴儿总数的比重均会趋于50%。

大数定律20中心极限定理(P97)大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。论证了:1、如果总体很大,而且服从正态分布,样本平均数的分布也同样服从正态分布。2、如果总体很大,但不服从正态分布,只要样本容量足够大,样本平均数的分布趋近于正态分布。3、样本平均数的的平均数,等于总体平均数。中心极限定理(P97)论证了:21第二节抽样误差

一、抽样误差的概念抽样误差是指在抽样调查中,由于随机抽样的偶然性因素,使样本的结构不足以代表总体的结构,而引起的样本指标与总体指标之间的绝对离差。即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。第二节抽样误差一、抽样误差的概念抽样误差是指在抽样调查中22抽样误差的影响因素:

1.总体标志变异程度。——正方向变化关系2.抽样单位数目的多少,即样本容量。——反方向变化关系3.不同的抽样方法。4.不同的抽样组织形式。抽样误差的影响因素:1.总体标志变异程度。——正方向变化23抽样误差的作用:1.在于说明样本指标的代表性大小。

误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。2.说明样本指标和总体指标相差的一般范围。抽样误差的作用:1.在于说明样本指标的代表性大小。2.说24抽样误差的意义:指所有可能样本的指标(所有的统计量)与总体指标(参数)的平均离差,反映抽样误差的一般水平。抽样误差的意义:指所有可能样本的指标(所有的统计量)与25二、抽样平均误差

抽样平均误差指所有可能样本(统计量)的指标与总体指标(参数)的平均离差。通常用μ表示。其定义为:二、抽样平均误差抽样平均误差指所有可能样本(统计量)的指标26三、抽样平均误差的计算

(一)总体平均数的抽样平均误差1.重置抽样三、抽样平均误差的计算(一)总体平均数的抽样平均误差1.27抽样平均数的平均误差例题:某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平资料如下:月平均工资(元)524534540550560580600660工人数469108643计算样本平均数和抽样平均误差。抽样平均数的平均误差例题:某工厂有1500个工人,用简单随机28解:先列表xfxf5244209612965184534632046764056540948604003600550105500100100056084480005806348040024006004240016006400660319801000030000502800052640解:先列表xfxf5244209612965184534629计算平均数即平均工资:计算平均数即平均工资:302.不重置抽样:2.不重置抽样:31(二)总体成数的抽样平均误差1.重置抽样(二)总体成数的抽样平均误差1.重置抽样322.不重置抽样:2.不重置抽样:33抽样成数的平均误差例题:某钢铁厂生产某种钢管,现从该厂某月生产的500根产品中抽取一个容量为100根的样本。已知一级品率为60%,试求样本一级品率的抽样平均误差。解:已知p=60%、n=100、N=500抽样成数的平均误差例题:某钢铁厂生产某种钢管,34四、抽样极限误差样本指标围绕总体指标左右两侧波动形成的一定范围。把可允许的误差范围叫做抽样极限误差,即

其中、分别表示抽样平均数和抽样成数的极限误差。

四、抽样极限误差样本指标围绕总体指标左右两侧波动形成的一定范35五、抽样估计的可靠程度

抽样极限误差通常要以抽样平均误差为尺度来度量,也就是说,抽样极限误差的大小相当于几个抽样平均误差,能有多大的概率保证误差不超过此范围。五、抽样估计的可靠程度抽样极36当t=1时,F(t)=0.6827;当t=1.5时,F(t)=0.8664;当t=2时,F(t)=0.9545;当t=3时,F(t)=0.9973.这就表明,抽样误差范围与可靠程度之间的数量关系。当抽样误差范围扩大时,就可以提高抽样推断的可靠程度;反之,缩小抽样误差范围,推断的可靠程度就降低。当t=1时,F(t)=0.6827;37

第三节参数估计

一、点估计和区间估计第三节参数估计一、点估计和区间估计38只要在样本代表性大,且对全及指标精确性要求不高的情况下,可采用点估计法。如能满足下列三个准则:无偏性一致性有效性就会得到合理的估计。只要在样本代表性大,且对全及指标精确性要求不高的情况39(一)点估计例(一)点估计例40(二)区间估计是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。(二)区间估计是根据样本指标和抽样误差去推断全及指标的可41

根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:

抽样极限误差△=tμ,(t为概率度)可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。可见,抽样极限误差,即扩大或缩小了以后的抽样42当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);例抽样误差范围的实际意义是要求被估计的全及指标或P落在抽样指标一定范围内,即落在或的范围内。当F(t)=68.27%时,抽样极限误差等于抽样平均误差的143二、全及平均数和全及成数的推断

二、全及平均数和全及成数的推断44某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:~

例1某农场进行小麦产量的抽样调查,该农场小麦播种面积为145

某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:~

例2某机械厂日产某种产品8000件,现采用纯随机不重复抽样46三、样本容量的确定

(一)影响样本容量的因素总体的变异程度抽样的误差范围抽样估计的置信度不同的抽样组织形式对抽样误差有影响,所以也影响了样本容量的确定。三、样本容量的确定(一)影响样本容量的因素总体的变异程度抽47(一)简单随机抽样二、简单随机抽样的样本容量的确定(一)简单随机抽样二、简单随机抽样的样本容量的确定48(二)类型抽样重复抽样:不重复抽样:(二)类型抽样重复抽样:不重复抽样:49建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料σ=1.5,求样本数应是多少?例1建筑工地打土方工人4000人,需测定平均每人工作量,要求误差50某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?例2某金笔厂月产10000支金笔,以前多次抽样调查一等品率为9051例3某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样检验,结果知道标准差是18天与20天,试问在抽样平均误差不超过1天(概率为0.9011)的要求下,至少应抽查多少双鞋子?已知:

解:即至少应抽查400双鞋子。例3某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小52

第四节抽样调查的组织形式

通常有以下四种组织形式:第四节抽样调查的组织形式通常有以下四种组织形式:53一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:1.直接抽选法;2.抽签法;3.随机数码表法;一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分54二、机械抽样(等距抽样)

先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。二、机械抽样(等距抽样)先将全及总体的所有单位按某一55

机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽56排列次序用的标志有两种:1.选择标志与抽样调查所研究内容无关,称无关标志排队。2.选择标志与抽样调查所研究的内容有关,称有关标志排队。研究工人的平均收入水平时,按工号排队。例研究工人的生活水平,按工人月工资额高低排队。例排列次序用的标志有两种:1.选择标志与抽样调查所研究内容无57机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等距抽样kkkk+a2k+a(n-1)k+aak(k为抽取间隔)示意图:机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等582.半距起点等距抽样kkkk(k为抽取间隔)示意图:2.半距起点等距抽样kk593.对称等距抽样示意图:kkk2k-a2k+a4k-a4k+aak(k为抽取间隔)3.对称等距抽样示意图:kk60机械抽样的好处:

1.可以使抽样过程大大简化,减轻抽样的工作量;2.如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。机械抽样的好处:1.可以使抽样过程大大简化,减轻抽样的工61三、类型抽样(分层抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。

三、类型抽样(分层抽样)先对总体各单位按一定标志加以分62类型的划分:一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例;三是分类型的数目不宜太多。类型的划分:一是必须有清楚的划类界限;63类型抽样的好处是:

样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。类型抽样的好处是:样本代表性高、抽样误差小、抽样调查成本64两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类65四、整群抽样

整群抽样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。

整群抽样的好处:组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。四、整群抽样 整群抽样即从全及总体中成群地抽取样本单位66一、判断对错1、在抽样调查之前无法获知抽样误差。()2、抽样误差越小,样本对总体的代表性越低,反之,代表性越高。()×课堂练习:3、无限总体是指总体单位是无限的,因此,只能采取全面调查方式获得数据。()××一、判断对错1、在抽样调查之前无法获知抽样误差。(67二、单项选择1.进行抽样调查时,样本对总体的代表性受到一些可控因素的影响,下列属于可控因素的是()A.样本数目B.样本可能数目C.总体单位数D.样本容量2.抽样推断中如果出现系统性偏差,它的表现是()A.>B:<≠D:=3.在抽取每个样本单位时,必须遵循()A、可比性原则B、准确性原则C、随机性原则D、同质性原则DCC二、单项选择1.进行抽样调查时,样本对总体的代表性受到一些可684、在调查之前可以事先加以计算和控制的误差是()A、登记误差B、抽样误差C、系统误差D、调查误差5、标准差与抽样误差的关系是()A、标准差越大,抽样误差越大B、标准差越大,抽样误差越小C、标准差小,抽样误差越大D、两者无关6、如果总体内各单位差异较大,也就是总体方差较大,则抽取的样本单位数()A、多一些B、少一些C、可多可少D、与总体各单位差异无关BAA4、在调查之前可以事先加以计算和控制的误差是(697、样本容量与抽取样本误差的关系是()A、样本容量越大,抽样误差越大B、抽样容量越大,抽样误差越小C、样本容量越小,抽样误差越小D、两者没有关系8、对500名大学生抽取15%的比例进行不重置抽样调查,其中优等生为20%,概率为95.45%(t=2),则优等生比重的抽样极限误差为()A、4.26%B、4.61%C、8.25%D、9.32%BC7、样本容量与抽取样本误差的关系是()BC70三、多项选择1.描述总体或样本的参数或统计量主要包括的数量特征值有()A.平均数B.成数C.样本容量D.标准差E.样本可能数目2、抽样调查的主要特点有()A、用样本推断总体B、按随机原则抽选调查单位C、调查前可以计算和控制抽样误差D、调查的目的在于了解总体基本情况E、抽样调查误差可以克服ABDABC三、多项选择1.描述总体或样本的参数或统计量主要包括的数量71四、填空题1、统计学中,把描述总体特征的指标为参数,把描述样本特征称为

。2、抽样调查的组织形式有简单随机抽样,等距抽样,

。3、统计调查误差可以分为

和代表性误差两种。4、样本中包括的单位数,称为

。统计量类型抽样整群抽样登记性误差样本容量四、填空题1、统计学中,把描述总体特征的指标为参数,把描述样72EndofChapter4EndofChapter473第四章

抽样调查

第四章抽样调查74重点与难点:重点:抽样调查的意义抽样平均误差的意义及计算总体参数的点估计与区间估计的方法难点:抽样平均误差的计算总体参数的区间估计重点与难点:75学习内容:

一、抽样调查的基本问题二、抽样误差三、参数估计四、抽样调查的组织形式学习内容:76第一节抽样调查的基本问题

一、抽样调查的意义

一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。第一节抽样调查的基本问题一、抽样调查的意义一般所讲的771.按随机原则抽选调查单位;2.用样本推断总体;3.在调查之前可以计算和控制抽样误差。抽样调查的特点:

1.按随机原则抽选调查单位;抽样调查的特点:78抽样推断:即根据样本统计量推断总体参数的过程。也叫抽样估计。抽样调查的特点之一:由部分推断总体统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)

抽样调查(抽样推断)的概念抽样推断:即根据样本统计量推断总体参数的过程。也叫抽样估计。79

随机样本:与总体分布特征相同非随机样本:与总体分布特征不同并非所有的抽样估计都按随机原则抽取样本。也有非随机抽样。特点之二:按随机原则抽取样本随机样本:与总体分布特征相同80特点之三:存在估计误差,并可加以控制。抽样推断误差登记误差代表性误差用设计、培训、管理等方法消除用抽样方法、样本容量等手段控制特点之三:存在估计误差,并可加以控制。抽样推断误差登记误差代81抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。二、抽样调查的适用范围

抽样调查方法是市场经济国家在调查方法上的必然选择,和普查821.总体范围较广,不需要了解每一个别单位的情况;2.对破坏性或消耗性产品的质量进行检验;3.对普查或全面调查的统计资料进行检查和修正。一般适用于以下范围:1.总体范围较广,不需要了解每一个别单位的情况;2.对破坏性83三、抽样调查的几个基本概念

(一)总体和样本总体:所要调查观察的全部事物。总体单位数用N表示。总体可以分为有限总体和无限总体。样本:从总体中抽取出来那部分单位所组成的集合体。样本是总体的一个缩影。抽样总体的单位数,即样本容量,用n表示。n≥30大样本n<30小样本三、抽样调查的几个基本概念(一)总体和样本总体:所要调查84(二)参数和统计量总体参数样本统计量特征数及符号总体单位数N样本(单位数)容量n总体平均数样本平均数总体成数P样本成数p总体标准差样本标准差S总体方差样本方差参数:描述总体特征的指标。统计量:描述样本特征的指标。抽样推断的目的就是要通过对样本的平均数、成数的标准差(或方差)的测量来推断总体的相应特征值。主要统计特征数及符号

(二)参数和统计量总体参数样本统计量特总体单位数N样本(单85(三)抽样方法重置抽样:即有放回抽样。不重置抽样:即无放回抽样,每个总体只能有一次被抽中的机会。(三)抽样方法重置抽样:即有放回抽样。86样本单位的抽选方法在组织抽样调查时,根据样本单位是否重复抽取,分别有重复抽样和不重复抽样两种方法。1、重复抽样重复抽样是指每次从总体中抽取一个单位进行观察后,再把这个单位重新放回总体,使之继续参加下次抽选。这种抽选法也称为回置抽样或重置抽样。重复抽样法由于前一次抽中的单位又被放回总体中,不会影响后面的抽选,所以总体中每个单位被抽中的机会均等连续抽选各单位都是独立进行的的。样本单位的抽选方法在组织抽样调查时,根据样本单位是否872、不重复抽样不重复抽样是指每次从总体中抽取一个单位进行观察后不再把这个单位重新放回总体,这个总体单位不再继续参加下次抽选。这种抽选法也称为不回置抽样或不重置抽样。不重复抽样法由于每次抽中的单位不再放回总体中,每抽选一次,总体中的单位就减少一个,使连续抽选的各个单位不相互独立。但是总体中各单位被抽中的机会仍然是均等的!不重复抽样按是否考虑抽选样本单位的顺序,又可分为有顺序不重复抽样和无顺序不重复抽样两种。有顺序不重复抽样即通常所说的不重复排列。按这种抽样方法只要有一个单位不同,就算不同的样本。2、不重复抽样不重复抽样是指每次从总体中抽取一个单位88

抽样框——是指包含有全部总体单位及其主要指标特征的一个框架或列表。

(四)抽样框

以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。抽样框——是指包含有全部总体单位及其主要指标特征的一个框89

抽样框的形式一般有两种:

(四)抽样框

一览表:表中列出所有总体单位。

地图:在地图上将调查单位分布在各个地区,然后根据地区进行抽样。

抽样框的形式一般有两种:(四)抽样框90

样本可能数目又称样本个数,是指从一个有N个单位的总体中抽取容量为n的样本时,有可能出现的所有样本的个数。

(五)样本可能数目样本可能数目又称样本个数,是指从一个有N个单位的总体中抽取91抽样调查的理论基础

概率论大数定律中心极限定理抽样调查的理论基础概率论大数定律中心极限定理92大数定律大数定律是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是,在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会相互抵消,从而使现象的必然规律性显示出来。例如,观察个别或少数家庭的婴儿出生情况,发现有的生男,有的生女,没有一定的规律性,但是通过大量的观察就会发现,男婴和女婴占婴儿总数的比重均会趋于50%。

大数定律93中心极限定理(P97)大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。论证了:1、如果总体很大,而且服从正态分布,样本平均数的分布也同样服从正态分布。2、如果总体很大,但不服从正态分布,只要样本容量足够大,样本平均数的分布趋近于正态分布。3、样本平均数的的平均数,等于总体平均数。中心极限定理(P97)论证了:94第二节抽样误差

一、抽样误差的概念抽样误差是指在抽样调查中,由于随机抽样的偶然性因素,使样本的结构不足以代表总体的结构,而引起的样本指标与总体指标之间的绝对离差。即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。第二节抽样误差一、抽样误差的概念抽样误差是指在抽样调查中95抽样误差的影响因素:

1.总体标志变异程度。——正方向变化关系2.抽样单位数目的多少,即样本容量。——反方向变化关系3.不同的抽样方法。4.不同的抽样组织形式。抽样误差的影响因素:1.总体标志变异程度。——正方向变化96抽样误差的作用:1.在于说明样本指标的代表性大小。

误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。2.说明样本指标和总体指标相差的一般范围。抽样误差的作用:1.在于说明样本指标的代表性大小。2.说97抽样误差的意义:指所有可能样本的指标(所有的统计量)与总体指标(参数)的平均离差,反映抽样误差的一般水平。抽样误差的意义:指所有可能样本的指标(所有的统计量)与98二、抽样平均误差

抽样平均误差指所有可能样本(统计量)的指标与总体指标(参数)的平均离差。通常用μ表示。其定义为:二、抽样平均误差抽样平均误差指所有可能样本(统计量)的指标99三、抽样平均误差的计算

(一)总体平均数的抽样平均误差1.重置抽样三、抽样平均误差的计算(一)总体平均数的抽样平均误差1.100抽样平均数的平均误差例题:某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平资料如下:月平均工资(元)524534540550560580600660工人数469108643计算样本平均数和抽样平均误差。抽样平均数的平均误差例题:某工厂有1500个工人,用简单随机101解:先列表xfxf5244209612965184534632046764056540948604003600550105500100100056084480005806348040024006004240016006400660319801000030000502800052640解:先列表xfxf52442096129651845346102计算平均数即平均工资:计算平均数即平均工资:1032.不重置抽样:2.不重置抽样:104(二)总体成数的抽样平均误差1.重置抽样(二)总体成数的抽样平均误差1.重置抽样1052.不重置抽样:2.不重置抽样:106抽样成数的平均误差例题:某钢铁厂生产某种钢管,现从该厂某月生产的500根产品中抽取一个容量为100根的样本。已知一级品率为60%,试求样本一级品率的抽样平均误差。解:已知p=60%、n=100、N=500抽样成数的平均误差例题:某钢铁厂生产某种钢管,107四、抽样极限误差样本指标围绕总体指标左右两侧波动形成的一定范围。把可允许的误差范围叫做抽样极限误差,即

其中、分别表示抽样平均数和抽样成数的极限误差。

四、抽样极限误差样本指标围绕总体指标左右两侧波动形成的一定范108五、抽样估计的可靠程度

抽样极限误差通常要以抽样平均误差为尺度来度量,也就是说,抽样极限误差的大小相当于几个抽样平均误差,能有多大的概率保证误差不超过此范围。五、抽样估计的可靠程度抽样极109当t=1时,F(t)=0.6827;当t=1.5时,F(t)=0.8664;当t=2时,F(t)=0.9545;当t=3时,F(t)=0.9973.这就表明,抽样误差范围与可靠程度之间的数量关系。当抽样误差范围扩大时,就可以提高抽样推断的可靠程度;反之,缩小抽样误差范围,推断的可靠程度就降低。当t=1时,F(t)=0.6827;110

第三节参数估计

一、点估计和区间估计第三节参数估计一、点估计和区间估计111只要在样本代表性大,且对全及指标精确性要求不高的情况下,可采用点估计法。如能满足下列三个准则:无偏性一致性有效性就会得到合理的估计。只要在样本代表性大,且对全及指标精确性要求不高的情况112(一)点估计例(一)点估计例113(二)区间估计是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。(二)区间估计是根据样本指标和抽样误差去推断全及指标的可114

根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:

抽样极限误差△=tμ,(t为概率度)可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。可见,抽样极限误差,即扩大或缩小了以后的抽样115当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);例抽样误差范围的实际意义是要求被估计的全及指标或P落在抽样指标一定范围内,即落在或的范围内。当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1116二、全及平均数和全及成数的推断

二、全及平均数和全及成数的推断117某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:~

例1某农场进行小麦产量的抽样调查,该农场小麦播种面积为1118

某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:~

例2某机械厂日产某种产品8000件,现采用纯随机不重复抽样119三、样本容量的确定

(一)影响样本容量的因素总体的变异程度抽样的误差范围抽样估计的置信度不同的抽样组织形式对抽样误差有影响,所以也影响了样本容量的确定。三、样本容量的确定(一)影响样本容量的因素总体的变异程度抽120(一)简单随机抽样二、简单随机抽样的样本容量的确定(一)简单随机抽样二、简单随机抽样的样本容量的确定121(二)类型抽样重复抽样:不重复抽样:(二)类型抽样重复抽样:不重复抽样:122建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料σ=1.5,求样本数应是多少?例1建筑工地打土方工人4000人,需测定平均每人工作量,要求误差123某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?例2某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90124例3某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样检验,结果知道标准差是18天与20天,试问在抽样平均误差不超过1天(概率为0.9011)的要求下,至少应抽查多少双鞋子?已知:

解:即至少应抽查400双鞋子。例3某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小125

第四节抽样调查的组织形式

通常有以下四种组织形式:第四节抽样调查的组织形式通常有以下四种组织形式:126一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:1.直接抽选法;2.抽签法;3.随机数码表法;一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分127二、机械抽样(等距抽样)

先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。二、机械抽样(等距抽样)先将全及总体的所有单位按某一128

机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽129排列次序用的标志有两种:1.选择标志与抽样调查所研究内容无关,称无关标志排队。2.选择标志与抽样调查所研究的内容有关,称有关标志排队。研究工人的平均收入水平时,按工号排队。例研究工人的生活水平,按工人月工资额高低排队。例排列次序用的标志有两种:1.选择标志与抽样调查所研究内容无130机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等距抽样kkkk+a2k+a(n-1)k+aak(k为抽取间隔)示意图:机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等1312.半距起点等距抽样kkkk(k为抽取间隔)示意图:2.半距起点等距抽样kk1323.对称等距抽样示意图:kkk2k-a2k+a4k-a4k+aak(k为抽取间隔)3.对称等距抽样示意图:kk133机械抽样的好处:

1.可以使抽样过程大大简化,减轻抽样的工作量;2.如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。机械抽样的好处:1.可以使抽样过程大大简化,减轻抽样的工134三、类型抽样(分层抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。

三、类型抽样(分层抽样)先对总体各单位按一定标志加以分135类型的划分:一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例;三是分类型的数目不宜太多。类型的划分:一是必须有清楚的划类界限;136类型抽样的好处是:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论