统计抽样技术(共66页).ppt_第1页
统计抽样技术(共66页).ppt_第2页
统计抽样技术(共66页).ppt_第3页
统计抽样技术(共66页).ppt_第4页
统计抽样技术(共66页).ppt_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、项项目目九九 统统计计抽抽样样技技术术项目九项目九 统计抽样技术统计抽样技术能力目标能力目标(1) 具有在实际工作中正确运用抽样方法进行样本选取的能力;具有在实际工作中正确运用抽样方法进行样本选取的能力;(2) 能够根据研究目的进行抽样框的设计;能够根据研究目的进行抽样框的设计;(3) 具有在实际工作中正确运用参数估计的方法进行抽样推断的能力;具有在实际工作中正确运用参数估计的方法进行抽样推断的能力;(4) 具有应用具有应用Excel工具进行样本抽样、样本分析的能力。工具进行样本抽样、样本分析的能力。知识目标知识目标(1) 抽样推断的基本概念;抽样推断的基本概念;(2) 抽样方法的选择;抽样方

2、法的选择;(3) 抽样误差的含义;抽样误差的含义;(4) 抽样估计的含义;抽样估计的含义;(5) 抽样估计的方法及适用条件。抽样估计的方法及适用条件。项目概述项目概述表表9-1 样本的耐用时间样本的耐用时间h编号编号耐用时间耐用时间编号编号耐用时间耐用时间编号编号耐用时间耐用时间编号编号耐用时间耐用时间编号编号耐用时间耐用时间1431000035092007958500118890001615840014610000376810084597001243920016299700168900052798008658300126589001648890021993006339500925930013

3、08950018109300264850066184009748200141097001854970027390006718600984960015019000195183002778900705910010389000154885001974970031889007598800110188001584890019909000项目分析项目分析产品的质量检测不可能对所有产品进行一一检查,产品的质量检测不可能对所有产品进行一一检查,只能从总体中抽取部分检验。通常采用从总体中只能从总体中抽取部分检验。通常采用从总体中随机抽取部分样本作为检查对象,通过样本的特随机抽取部分样本作为检查对象,通过样本的特

4、征来反映总体特征。作为这家计算机经销商需要征来反映总体特征。作为这家计算机经销商需要解决如何选择样本,即从解决如何选择样本,即从2 000件产品中如何选择件产品中如何选择40件样本,并对样本进行分析。本项目可以通过件样本,并对样本进行分析。本项目可以通过以下任务来完成:以下任务来完成:工作任务一工作任务一 统计抽样的意义统计抽样的意义工作任务二工作任务二 抽样误差抽样误差工作任务三工作任务三 抽样估计的方法抽样估计的方法工作任务四工作任务四 抽样方案的设计抽样方案的设计工作任务一工作任务一 统计抽样的意义统计抽样的意义一、统计抽样的概念与特点一、统计抽样的概念与特点统计抽样是抽样调查和抽样推断

5、统计抽样是抽样调查和抽样推断的总称,它是按照随机原则从总的总称,它是按照随机原则从总体中抽取部分单位进行调查,利体中抽取部分单位进行调查,利用这部分单位的调查资料推算总用这部分单位的调查资料推算总体数量特征的一种统计分析方法。体数量特征的一种统计分析方法。工作任务一工作任务一 统计抽样的意义统计抽样的意义一、统计抽样的概念与特点一、统计抽样的概念与特点统计抽样具有以下几个特点:统计抽样具有以下几个特点:(一一)按照随机原则抽取样本单位按照随机原则抽取样本单位(二二)根据部分推断总体根据部分推断总体(三三)运用了概率估计的方法运用了概率估计的方法(四四)抽样误差可以事先计算并加以控制抽样误差可以

6、事先计算并加以控制工作任务一工作任务一 统计抽样的意义统计抽样的意义二、统计抽样的作用二、统计抽样的作用21能够解决全面调查无法或难以解决能够解决全面调查无法或难以解决的问题的问题可以补充和订正全面调查的结果可以补充和订正全面调查的结果43可以在短期内取得时效性强的资料可以在短期内取得时效性强的资料可以应用于生产过程中产品质量的检查可以应用于生产过程中产品质量的检查和控制和控制工作任务一工作任务一 统计抽样的意义统计抽样的意义三、统计抽样中的基本概念三、统计抽样中的基本概念(一一)全及总体和样本总体全及总体和样本总体全及总体简称总体,是指根据研究的目的所确定的研究全及总体简称总体,是指根据研究

7、的目的所确定的研究事物的全体,也就是抽样调查所确定的调查对象,又叫事物的全体,也就是抽样调查所确定的调查对象,又叫母体,如前例中的母体,如前例中的30 000户职工家庭就是全及总体。全户职工家庭就是全及总体。全及总体单位数一般用及总体单位数一般用 表示。表示。样本总体简称样本,它是从全及总体中随机抽取出来的样本总体简称样本,它是从全及总体中随机抽取出来的那部分单位组成的集合体,又叫子体。如前例,抽出的那部分单位组成的集合体,又叫子体。如前例,抽出的300户职工家庭就构成一个样本总体。样本总体的单位户职工家庭就构成一个样本总体。样本总体的单位数一般用数一般用 表示。表示。工作任务一工作任务一 统

8、计抽样的意义统计抽样的意义三、统计抽样中的基本概念三、统计抽样中的基本概念(二二)全及指标和样本指标全及指标和样本指标根据全及总体计算的反映总体数量特征的指标称为全及指标,根据全及总体计算的反映总体数量特征的指标称为全及指标,又叫参数。常用的总体参数有总体平均数和总体标准差又叫参数。常用的总体参数有总体平均数和总体标准差(或总体或总体方差方差)。公式分别为:。公式分别为:XXNXFXF或22()()XXNXXFF或工作任务一工作任务一 统计抽样的意义统计抽样的意义三、统计抽样中的基本概念三、统计抽样中的基本概念(三三)样本容量和样本个数样本容量和样本个数样本容量是指一个样本总体所包含的单位数,

9、样本容量是指一个样本总体所包含的单位数,即即 。样本单位数的确定,必须结合调查任务的。样本单位数的确定,必须结合调查任务的要求以及总体各单位标志值的差异情况来综合考要求以及总体各单位标志值的差异情况来综合考虑。通常将样本单位数不少于虑。通常将样本单位数不少于30个个( 30)的样本的样本称为大样本,样本单位数不及称为大样本,样本单位数不及30个个( 30)的样本的样本称为小样本。社会经济统计中的抽样调查多属于称为小样本。社会经济统计中的抽样调查多属于大样本调查,因此,后面的有关计算和分析都是大样本调查,因此,后面的有关计算和分析都是建立大样本理论基础之上的。建立大样本理论基础之上的。工作任务一

10、工作任务一 统计抽样的意义统计抽样的意义三、统计抽样中的基本概念三、统计抽样中的基本概念(三三)样本容量和样本个数样本容量和样本个数样本个数又称样本可能数目,是指从一个总体中样本个数又称样本可能数目,是指从一个总体中可能抽取的样本总体的个数。从一个总体中可能可能抽取的样本总体的个数。从一个总体中可能抽取多少个样本,和样本容量以及抽样方法等因抽取多少个样本,和样本容量以及抽样方法等因素有很大关系。从一个总体抽取多少个样本,则素有很大关系。从一个总体抽取多少个样本,则样本指标就有多少个取值,因而就形成了样本指样本指标就有多少个取值,因而就形成了样本指标的分布。标的分布。工作任务一工作任务一 统计抽

11、样的意义统计抽样的意义三、统计抽样中的基本概念三、统计抽样中的基本概念(四四)重复抽样和不重复抽样重复抽样和不重复抽样重复抽样又称回置抽样,它是从总体中抽出一个单重复抽样又称回置抽样,它是从总体中抽出一个单位后,把结果登记下来,再放回总体中参加下一次位后,把结果登记下来,再放回总体中参加下一次抽选。抽选。重复抽样每次都是从全部总体单位中抽选,每个单重复抽样每次都是从全部总体单位中抽选,每个单位被抽中的机会在各次中是完全相同的,且有多次位被抽中的机会在各次中是完全相同的,且有多次被抽中的可能。被抽中的可能。工作任务一工作任务一 统计抽样的意义统计抽样的意义【例例9-1】总体有总体有A、B、C3个

12、单位,要从中随机重复抽取个单位,要从中随机重复抽取2个单位构成一个样本,先从个单位构成一个样本,先从3个单位中抽取个单位中抽取1个,共有个,共有3种种抽法,结果登记后再放回;然后再从相同的抽法,结果登记后再放回;然后再从相同的3个中抽个中抽1个,个,也有也有3种抽法。前后取两个单位构成一个样本,全部可能种抽法。前后取两个单位构成一个样本,全部可能抽取的样本个数为抽取的样本个数为33=9,具体的样本是,具体的样本是AA、AB、AC、BA、BB、BC、CA、CB、CC。不重复抽样又叫不回置抽样,它是指从总体中抽出一个不重复抽样又叫不回置抽样,它是指从总体中抽出一个单位之后不再放回去参加下一次抽选。

13、在不重复抽样过单位之后不再放回去参加下一次抽选。在不重复抽样过程中,总体单位数依次减少,因而每个单位被抽中的可程中,总体单位数依次减少,因而每个单位被抽中的可能性越来越大,但被抽中的机会只有一次。能性越来越大,但被抽中的机会只有一次。工作任务一工作任务一 统计抽样的意义统计抽样的意义【例例9-2】从总体从总体A、B、C3个单位中用不重复抽样方法抽个单位中用不重复抽样方法抽取取2个单位构成样本。先从个单位构成样本。先从3个单位中抽个单位中抽1个,共有个,共有3种抽法;种抽法;第二次从留下的第二次从留下的2个单位中抽个单位中抽1个,共有个,共有2种抽法。前后两种抽法。前后两个单位构成一个样本。全部

14、可能抽取的样本个数为个单位构成一个样本。全部可能抽取的样本个数为32=6个,具体样本是个,具体样本是AB、AC、BA、BC、CA、CB。根据概率论,在相同样本容量的要求下,同一个总体的根据概率论,在相同样本容量的要求下,同一个总体的重复抽样的样本个数总是大于不重复抽样的样本个数。重复抽样的样本个数总是大于不重复抽样的样本个数。工作任务二工作任务二 抽抽 样样 误误 差差一、抽样误差的意义一、抽样误差的意义误差是客观现象的统计资料与客误差是客观现象的统计资料与客观现象真值之间的差别。抽样误观现象真值之间的差别。抽样误差是指在遵循随机原则的前提下,差是指在遵循随机原则的前提下,抽取的样本指标与总体

15、真值指标抽取的样本指标与总体真值指标之间的差别或离差。如抽样平均之间的差别或离差。如抽样平均数与总体平均数之间的离差,抽数与总体平均数之间的离差,抽样成数与总体成数之间的离差等。样成数与总体成数之间的离差等。工作任务二工作任务二 抽抽 样样 误误 差差一、抽样误差的意义一、抽样误差的意义影响抽样误差大小的因素有以下几种。影响抽样误差大小的因素有以下几种。(一一)总体各单位标志值的差异程度总体各单位标志值的差异程度(二二)样本单位数的多少样本单位数的多少(三三)抽样方法抽样方法(四四)抽样调查的组织形式抽样调查的组织形式工作任务二工作任务二 抽抽 样样 误误 差差二、抽样平均误差二、抽样平均误差

16、以以 表示抽样平均数的抽样平均误差,表示抽样平均数的抽样平均误差, 表示抽样成数的抽表示抽样成数的抽样平均误差,样平均误差, M表示全部可能的样本个数,则:表示全部可能的样本个数,则:xp2()xxXM2()ppPM工作任务二工作任务二 抽抽 样样 误误 差差二、抽样平均误差二、抽样平均误差(一一)抽样平均数的抽样平均误差抽样平均数的抽样平均误差(1) 在重复抽样的条件下,计算公式为:在重复抽样的条件下,计算公式为:(2) 在不重复抽样的条件下,计算公式为:在不重复抽样的条件下,计算公式为:工作任务二工作任务二 抽抽 样样 误误 差差二、抽样平均误差二、抽样平均误差(一一)抽样平均数的抽样平均

17、误差抽样平均数的抽样平均误差不重复抽样与重复抽样两个抽样平均误差公式相比,前者比不重复抽样与重复抽样两个抽样平均误差公式相比,前者比后者多了个修正系数后者多了个修正系数 。这个系数总是小于。这个系数总是小于1的,因此,的,因此,不重复抽样的误差总是小于重复抽样的误差。当总体单位数不重复抽样的误差总是小于重复抽样的误差。当总体单位数N非常大时,非常大时,N与与N-1非常接近,因此,不重复抽样的抽样平均非常接近,因此,不重复抽样的抽样平均误差公式可以近似的简化为:误差公式可以近似的简化为:1NnN工作任务二工作任务二 抽抽 样样 误误 差差【例例9-3】设有设有4个工人,其日产量分别为个工人,其日

18、产量分别为70、90、130、150件件。这一总体的平均日产量。这一总体的平均日产量和标准差和标准差 为:为:X70901301501104XXN2XXN2222(70110)(90110)(130110)(150110)41000 =31.62(件件)=工作任务二工作任务二 抽抽 样样 误误 差差现在用不重复抽样的方法从现在用不重复抽样的方法从4个工人中抽个工人中抽2个工人求平均日个工人求平均日产量,所有可能的样本及有关资料见表产量,所有可能的样本及有关资料见表9-2。表表9-2 样本平均数及其离差计算表样本平均数及其离差计算表工作任务二工作任务二 抽抽 样样 误误 差差应用抽样平均误差的理

19、论性公式计算如下。应用抽样平均误差的理论性公式计算如下。样本平均数的平均数:样本平均数的平均数: = (件件);抽样平均误差:抽样平均误差: (件件)。现在直接用数理统计的应用性公式计算如下。现在直接用数理统计的应用性公式计算如下。抽样平均误差:抽样平均误差: (件件)。x132011012xM132011012xM2()4 00018.2612xxXM21000 4218.261241xNnnN工作任务二工作任务二 抽抽 样样 误误 差差二、抽样平均误差二、抽样平均误差(二二)抽样成数的抽样平均误差抽样成数的抽样平均误差(1) 在重复抽样条件下,计算公式为:在重复抽样条件下,计算公式为:(2

20、) 在不重复抽样条件下,计算公式为:在不重复抽样条件下,计算公式为:工作任务二工作任务二 抽抽 样样 误误 差差二、抽样平均误差二、抽样平均误差(二二)抽样成数的抽样平均误差抽样成数的抽样平均误差同理,在总体单位数同理,在总体单位数N很大时,公式可以近似地简化为:很大时,公式可以近似地简化为:工作任务二工作任务二 抽抽 样样 误误 差差【例例9-4】某电子元件厂生产某型号的电子管,根据过去某电子元件厂生产某型号的电子管,根据过去的情况,产品一级品率为的情况,产品一级品率为60%,现从,现从10000件电子管中随件电子管中随机抽取机抽取100件进行检验,求一级品率的抽样平均误差。件进行检验,求一

21、级品率的抽样平均误差。根据已知条件:根据已知条件:P=60%,N=10 000,n=100。在重复抽样条件下,一级品率的抽样平均误差为:在重复抽样条件下,一级品率的抽样平均误差为:p(1)PPn60%40%100= = =4.9%在不重复抽样条件下,一级品率的抽样平均误差为:在不重复抽样条件下,一级品率的抽样平均误差为:(1)60%40%1001110010 000PPnnNp= =4.87%工作任务二工作任务二 抽抽 样样 误误 差差三、抽样极限误差三、抽样极限误差样本指标与总体指标之间的样本指标与总体指标之间的抽样误差是客观存在的,不抽样误差是客观存在的,不可避免的。因此,以样本指可避免的

22、。因此,以样本指标估计总体指标,要达到完标估计总体指标,要达到完全准确毫无误差,几乎是不全准确毫无误差,几乎是不可能的。所以,在用样本指可能的。所以,在用样本指标估计总体指标时,应该根标估计总体指标时,应该根据所研究对象的变动程度和据所研究对象的变动程度和分析任务的要求,确定一个分析任务的要求,确定一个可允许的误差范围,在这个可允许的误差范围,在这个范围内估计的数字都算是有范围内估计的数字都算是有效的。效的。这种可允许的误差范围称这种可允许的误差范围称作抽样极限误差,又叫允作抽样极限误差,又叫允许误差。它是抽样指标和许误差。它是抽样指标和总体指标之间抽样误差的总体指标之间抽样误差的最大可能范围

23、,它等于样最大可能范围,它等于样本指标可允许变动的上限本指标可允许变动的上限或下限与总体指标之差的或下限与总体指标之差的绝对值。设绝对值。设 、 分别表示分别表示抽样平均数极限误差和抽抽样平均数极限误差和抽样成数极限误差。样成数极限误差。工作任务二工作任务二 抽抽 样样 误误 差差三、抽样极限误差三、抽样极限误差则有:则有:由于总体指标是未知的,所以,从这个意义上是无法计算由于总体指标是未知的,所以,从这个意义上是无法计算抽样极限误差的。抽样极限误差的。工作任务二工作任务二 抽抽 样样 误误 差差三、抽样极限误差三、抽样极限误差图图9-1 正态概率分布正态概率分布工作任务二工作任务二 抽抽 样

24、样 误误 差差三、抽样极限误差三、抽样极限误差表表9-3 正态概率表正态概率表(部分部分)工作任务二工作任务二 抽抽 样样 误误 差差【例例9-5】设样本粮食平均亩产量设样本粮食平均亩产量=500kg,又知抽样平均误,又知抽样平均误差差=12.5kg,求总体粮食平均亩产量,求总体粮食平均亩产量在在50025kg(即即475525)之间之间kg的估计置信度是多少?根据公式:的估计置信度是多少?根据公式:xxX25212.5xxt查正态概率表,当查正态概率表,当=2时,置信度为时,置信度为95.45%。即总。即总体平均亩产量在体平均亩产量在475525kg之间的概率保证程度为之间的概率保证程度为9

25、5.45%,也就是说还有,也就是说还有4.55%的可能性不在这个范围内。的可能性不在这个范围内。t工作任务三工作任务三 抽样估计的方法抽样估计的方法一、点估计一、点估计点估计又称定值估计,是指不考虑抽样误差而直接以样本点估计又称定值估计,是指不考虑抽样误差而直接以样本指标代替总体指标,也就是直接以抽样平均数或抽样成数指标代替总体指标,也就是直接以抽样平均数或抽样成数代替总体平均数或总体成数。用公式表示为:代替总体平均数或总体成数。用公式表示为:工作任务三工作任务三 抽样估计的方法抽样估计的方法【例例9-6】在对某乡进行的农产量调查中,样本地块的平在对某乡进行的农产量调查中,样本地块的平均亩产为

26、均亩产为350kg,以此推断该乡的平均亩产也是,以此推断该乡的平均亩产也是350kg;对;对某批产品进行质量检验,抽取的部分产品的合格率为某批产品进行质量检验,抽取的部分产品的合格率为95%,认为这批产品的合格率也是认为这批产品的合格率也是95%。点估计简便、直观,但这种估计没有表明抽样估计的误差,点估计简便、直观,但这种估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度,所以实际更没有指出误差在一定范围内的概率保证程度,所以实际工作中常常采用区间估计的方法。工作中常常采用区间估计的方法。工作任务三工作任务三 抽样估计的方法抽样估计的方法二、区间估计二、区间估计根据前面所讲的

27、抽样极限误差的概念和不等式:根据前面所讲的抽样极限误差的概念和不等式:对上面不等式,很容易得到以下两个等价的不等式:对上面不等式,很容易得到以下两个等价的不等式:工作任务三工作任务三 抽样估计的方法抽样估计的方法【例例9-7】某进出口公司出口一种名茶,规定每包重量不某进出口公司出口一种名茶,规定每包重量不低于低于150g,现在用不重复抽样的方法抽取其中的,现在用不重复抽样的方法抽取其中的1%进行检进行检验,结果见表验,结果见表9-4。表表9-4 某进出口公司出口一种名茶的抽查资料某进出口公司出口一种名茶的抽查资料工作任务三工作任务三 抽样估计的方法抽样估计的方法要求以要求以99.73%的概率估

28、计这批茶叶平均每包的重量范围,的概率估计这批茶叶平均每包的重量范围,以便确定该批茶叶是否达到重量规格的要求。以便确定该批茶叶是否达到重量规格的要求。xxff15030150.3100= = (g)S = = = =0.87(g)2xxff761000.76 = = =0.087(g)x2(1)snnN0.76(10.01)100工作任务三工作任务三 抽样估计的方法抽样估计的方法【例例9-8】某城市随机抽取某城市随机抽取400户居民进行家计调查,得每户居民进行家计调查,得每户年耐用品的消费支出的标准差为户年耐用品的消费支出的标准差为200元,试确定该市居元,试确定该市居民年平均每户耐品用的消费支

29、出在民年平均每户耐品用的消费支出在930.4969.6元之间的元之间的概率保证程度。概率保证程度。已知:已知:n =400, =200, = (元元)则有:则有: = = =10(元元) = 查正态概率表,得置信度为:查正态概率表,得置信度为:95%。该市居民年平均每户耐用品的消费支出在该市居民年平均每户耐用品的消费支出在930.4969.6元之元之间的概率保证程度为间的概率保证程度为95%。x969.6930.419.62xn20040019.61.9610 xxt工作任务三工作任务三 抽样估计的方法抽样估计的方法【例例9-9】某企业生产一批食品罐头共某企业生产一批食品罐头共60000桶,随

30、机不重桶,随机不重复抽查复抽查300桶,发现其中有桶,发现其中有6桶不合格,试以桶不合格,试以95.45%的可靠的可靠性估计这批罐头合格品率的可能范围。性估计这批罐头合格品率的可能范围。已知:已知:n =300, =6, , =2, 则有:则有: 所以这批罐头合格品率的可能范围是:所以这批罐头合格品率的可能范围是:98%1.6%,即:,即:96.4%99.6%。0n( )99.73%F t t0300698%300nnpn(1)0.980.023001130060 0000.8%pppnnN0020.81.6%Ppt 工作任务四工作任务四 抽样方案的设计抽样方案的设计一、抽样框的编制一、抽样框

31、的编制抽样框是指由现象总体的所有单位组成的一个框架,它是抽样框是指由现象总体的所有单位组成的一个框架,它是实施抽样推断的基础条件之一。实施抽样推断的基础条件之一。抽样框一般有三种形式抽样框一般有三种形式一是名录抽样框一是名录抽样框二是区域抽样框二是区域抽样框三是时间抽样框三是时间抽样框工作任务四工作任务四 抽样方案的设计抽样方案的设计二、抽取样本单位的方法二、抽取样本单位的方法抽签法抽签法12随机数表法随机数表法工作任务四工作任务四 抽样方案的设计抽样方案的设计二、抽取样本单位的方法二、抽取样本单位的方法表表9-5 随机数字表随机数字表(部分部分)78226430216145963171423

32、728150059408776818538492980390735824753183132196636883458405272776879242129075154657941360162154048987269162037250303903857492726247626516060227783210482881412120327982596569424160858457287088404226404298600494877819729971784833460097895513205522526968206436127939820746366142122983420598602167297工作任

33、务四工作任务四 抽样方案的设计抽样方案的设计二、抽取样本单位的方法二、抽取样本单位的方法【例例9-10】假设要从假设要从30人中采用不重复抽样的方法抽人中采用不重复抽样的方法抽5人人进行调查。第一步,先将进行调查。第一步,先将30人编号,如人编号,如00,01,02,28,29。第二步,确定起始点位置,假定以随机数字表的。第二步,确定起始点位置,假定以随机数字表的第第2行第行第4列数组的列数组的26916为起点数。第三步,竖着顺查,为起点数。第三步,竖着顺查,选用后两个数字,查的结果后两个数字为选用后两个数字,查的结果后两个数字为16,72,03,85,27,47,51,02,83,48,14

34、,。最后,确定样本单位,。最后,确定样本单位,查表中重复出现的号码,只需取前面出现的一个就可以,查表中重复出现的号码,只需取前面出现的一个就可以,结果最先出现的结果最先出现的29以内的数码分别为以内的数码分别为16,03,27,02,14,这就是要抽中的这就是要抽中的5个人。个人。工作任务四工作任务四 抽样方案的设计抽样方案的设计三、抽样的组织形式三、抽样的组织形式(一一)简单随机抽样简单随机抽样(二二)类型抽样类型抽样(三三)等距抽样等距抽样(四四)整群抽样整群抽样(五五)多阶段抽样多阶段抽样工作任务四工作任务四 抽样方案的设计抽样方案的设计三、抽样的组织形式三、抽样的组织形式(一一)简单随

35、机抽样简单随机抽样简单随机抽样是指对总体不作简单随机抽样是指对总体不作任何分类和排队,直接从任何分类和排队,直接从N个个单位的总体中随机抽取单位的总体中随机抽取n个单个单位组成样本的抽样组织形式,位组成样本的抽样组织形式,又称为纯随机抽样。又称为纯随机抽样。工作任务四工作任务四 抽样方案的设计抽样方案的设计三、抽样的组织形式三、抽样的组织形式(二二)类型抽样类型抽样类型抽样通常采用的是等比例类型抽样,即单位数较多的类型抽样通常采用的是等比例类型抽样,即单位数较多的组多抽一些单位,单位数较少的组少抽一些单位,以保证组多抽一些单位,单位数较少的组少抽一些单位,以保证抽样比例在各组都相等。用公式表示

36、为:抽样比例在各组都相等。用公式表示为:1212kKnnnnNNNN所以各组的样本单位数为:所以各组的样本单位数为:iinNnN工作任务四工作任务四 抽样方案的设计抽样方案的设计以抽样平均数为例来说明类型抽样组织形式下样本平均数、以抽样平均数为例来说明类型抽样组织形式下样本平均数、抽样平均误差和区间估计等有关问题的计算。抽样平均误差和区间估计等有关问题的计算。第第 组样本的抽样平均数:组样本的抽样平均数:1(1,2,)ini jjiixxiKni全样本的抽样平均数为:全样本的抽样平均数为:1kiiix nxn工作任务四工作任务四 抽样方案的设计抽样方案的设计由于类型抽样对各组进行的是全面调查,

37、因此,类型抽样由于类型抽样对各组进行的是全面调查,因此,类型抽样的抽样平均误差和组间方差无关,只取决于各组内方差的的抽样平均误差和组间方差无关,只取决于各组内方差的平均水平。平均水平。第第 组内方差为:组内方差为:i平均组内方差为:平均组内方差为:22(1,2,)ini jijiixxiKn221kiiiinn工作任务四工作任务四 抽样方案的设计抽样方案的设计样本平均数的抽样平均误差样本平均数的抽样平均误差 可按下列公式计算:可按下列公式计算:在重复抽样条件下:在重复抽样条件下:在不重复抽样条件下:在不重复抽样条件下:2ixn21ixnnN工作任务四工作任务四 抽样方案的设计抽样方案的设计【例

38、例9-11】某地区共有农村居民某地区共有农村居民3920户,分为粮食作物专户,分为粮食作物专业户、经济作物专业户和养殖专业户三种类型。用不重复业户、经济作物专业户和养殖专业户三种类型。用不重复抽样按抽样按5%的等比例抽取样本户,调查其平均收入,所计的等比例抽取样本户,调查其平均收入,所计算的有关指标见表算的有关指标见表9-6。表表9-6 某地区农村居民抽样资料某地区农村居民抽样资料农户类型农户类型总户数总户数Ni抽样户数抽样户数ni每户平均收入每户平均收入/元元收入标准差收入标准差/元元粮食作物户粮食作物户经济作物户经济作物户养殖户养殖户2160156020010878103704405004

39、0.446.838.2合计合计3920196404.4942.96工作任务四工作任务四 抽样方案的设计抽样方案的设计求样本平均收入和抽样平均误差,并以求样本平均收入和抽样平均误差,并以95.45%的概率估计的概率估计该地区所有居民平均收入的区间范围。该地区所有居民平均收入的区间范围。全样本平均数:全样本平均数:1kiiix nxn370 10844078500 10404.49()196元=平均组内方差:平均组内方差:22222140.410846.87838.210196kiiiinn =1845.43(元元)工作任务四工作任务四 抽样方案的设计抽样方案的设计抽样平均误差:抽样平均误差:21

40、845.43196(1)18.9452.99()1963920ixnnN元由于由于 =95.45%,查正态概率表得,查正态概率表得 ,所以,所以, (元元)。则以则以95.45%的概率估计该地区所有居民平均收入的区的概率估计该地区所有居民平均收入的区间范围为间范围为404.49 5.98元,即元,即398.51410.47元。元。( )F t2t 22.995.98x 工作任务四工作任务四 抽样方案的设计抽样方案的设计三、抽样的组织形式三、抽样的组织形式(三三)等距抽样等距抽样等距抽样也称机械抽样,它是等距抽样也称机械抽样,它是先按某一标志对总体各单位进先按某一标志对总体各单位进行排队,然后根

41、据一定顺序和行排队,然后根据一定顺序和间隔来抽取样本单位构成样本间隔来抽取样本单位构成样本的抽样组织形式。的抽样组织形式。工作任务四工作任务四 抽样方案的设计抽样方案的设计三、抽样的组织形式三、抽样的组织形式(四四)整群抽样整群抽样整群抽样,它是将总体各单位划分成若干群,然后从中随整群抽样,它是将总体各单位划分成若干群,然后从中随机抽取部分群,对中选群的所有单位进行全面调查的抽样机抽取部分群,对中选群的所有单位进行全面调查的抽样组织形式。组织形式。以抽样平均数为例来说明整群抽样组织形式下样本平均数、以抽样平均数为例来说明整群抽样组织形式下样本平均数、抽样平均误差和区间估计等有关问题的计算。抽样

42、平均误差和区间估计等有关问题的计算。第第i群样本平均数:群样本平均数:全样本平均数:全样本平均数:1(1,2, )Mi jjixxirM1riixxr工作任务四工作任务四 抽样方案的设计抽样方案的设计由于整群抽样是对中选群的所有单位进行的全面调查,因由于整群抽样是对中选群的所有单位进行的全面调查,因此,整群抽样的抽样平均误差仅取决于各群间方差,设此,整群抽样的抽样平均误差仅取决于各群间方差,设 为群间方差,则样本平均数的群间方差为:为群间方差,则样本平均数的群间方差为:221()riixxxr整群抽样都采用不重复抽样的方法,所以样本平均数的抽整群抽样都采用不重复抽样的方法,所以样本平均数的抽样

43、平均误差为:样平均误差为:21xxRrrR工作任务四工作任务四 抽样方案的设计抽样方案的设计【例例9-12】拟调查某县农户家禽饲养情况,从该县拟调查某县农户家禽饲养情况,从该县100个个村中随机抽取村中随机抽取10个村,对中选村所有农户的家禽饲养情况个村,对中选村所有农户的家禽饲养情况进行调查,测得平均每户饲养家禽进行调查,测得平均每户饲养家禽35只,各村的平均数的只,各村的平均数的方差为方差为16只。试以只。试以95.45%的概率估计全县平均每户家禽的的概率估计全县平均每户家禽的饲养只数。饲养只数。已知:已知: R=100,r =10, =35,2=16, , t=2抽样平均误差:抽样平均误

44、差:极限误差:极限误差: = =21.2=2.4(只只)则以则以95.45%的概率估计全县平均每户家禽饲养只数为的概率估计全县平均每户家禽饲养只数为352.4只,即在只,即在32.637.4只范围内。只范围内。x216 100101.2()1101001xxRrrR只xxt工作任务四工作任务四 抽样方案的设计抽样方案的设计三、抽样的组织形式三、抽样的组织形式(五五)多阶段抽样多阶段抽样抽样调查中,如果抽出的样本单位直抽样调查中,如果抽出的样本单位直接就是总体单位,叫单阶段抽样。接就是总体单位,叫单阶段抽样。如果将总体进行多层次分组,然后依如果将总体进行多层次分组,然后依次在各层中随机抽组,直到

45、抽取总体次在各层中随机抽组,直到抽取总体单位,称为多阶段抽样。单位,称为多阶段抽样。工作任务四工作任务四 抽样方案的设计抽样方案的设计四、必要样本单位数的确定四、必要样本单位数的确定(一一)必要样本容量的计算必要样本容量的计算(1) 在重复抽样下,平均数的极限误差公式为:在重复抽样下,平均数的极限误差公式为:2xxttn n222xt所以,必要的样本单位数:所以,必要的样本单位数:=。工作任务四工作任务四 抽样方案的设计抽样方案的设计四、必要样本单位数的确定四、必要样本单位数的确定(一一)必要样本容量的计算必要样本容量的计算(2) 在不重复抽样下,样本平均数的极限误差公式为:在不重复抽样下,样本平均数的极限误差公式为:。21xnxttnN 所以,必要的样本单位数:所以,必要的样本单位数:22222xNtnNt 工作任务四工作任务四 抽样方案的设计抽样方案的设计四、必要样本单位数的确定四、必要样本单位数的确定(一一)必要样本容量的计算必要样本容量的计算同理,成数必要样本单位数分别如下:同理,成数必要样本单位数分别如下:。(1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论