版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
抽样分布与参数估计PPT第一页,共六十三页,编辑于2023年,星期日第六章抽样分布与参数估计
学习目标:1、理解抽样分布的特点;
2、理解抽样估计的概念、特点、作用以及几个基本概念;
3、掌握抽样误差的含义和影响抽样误差的主要因素素;
4、熟练掌握抽样平均误差的计算;
5、熟练掌握总体均值和总体成数的区间估计方法;
6、掌握必要抽样数目的确定方法;
7、能够正确选择抽样组织方式。
第二页,共六十三页,编辑于2023年,星期日6.1抽样推断的概述6.1.1抽样推断的概念、特点和作用
6.1.2抽样推断相关的几个基本概念
6.1.3抽样误差
6.1.4抽样调查的理论依据第三页,共六十三页,编辑于2023年,星期日6.1.1抽样推断的概念、特点和作用
1、抽样推断的概念
抽样推断是按随机原则从全部研究对象中抽取一部分单位进行观察,根据样本资料计算样本的特征值,然后以样本的特征值,对总体的特征值做出具有一定可靠性的估计和判断,以反映总体的数量特征和数量表现的一种统计方法。所谓随机原则,即是在抽取样本时,排除人们主观意图的作用,使得总体中的各单位均以相等的机会被抽中。随机原则又称为等可能性原则。
2、抽样推断的特点(1)调查单位的确定是按随机原则从全部总体单位中抽取的。(2)用部分单位的指标数值去推断和估计总体指标数值。(3)抽样调查中的抽样误差是不可避免的,事先是可以计算并加以控制的。第四页,共六十三页,编辑于2023年,星期日6.1.1抽样推断的概念、特点和作用
3、抽样推断的作用(1)有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的方法。(2)从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办到,也要采用抽样调查。(3)抽样调查的结果可以对全面调查的结果进行检查和修正。(4)抽样调查可以用于工业生产过程的质量控制。(5)利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真伪,依决定行动的取舍。第五页,共六十三页,编辑于2023年,星期日6.1.2.1全及总体和抽样总体1、全及总体也称为总体或母体,是指所要认识的研究对象的全体,它是由所研究范围内具有某种共同性质的全体单位所组成的集合体。在本章用大写的字母N代表全及总体的单位数。
2、抽样总体就是按随机原则从全及总体中抽取的一部分单位组成的小总体。抽样总体简称样本,它也是由许多性质相同的单位组成的。本章中用小写n代表样本的单位数,样本单位数n也称为样本容量,即一个样本中所包含的单位数。组成样本的每个单位称为样本单位。注意:作为抽样推断对象的全及总体是唯一确定的,但作为观察对象的样本就不是唯一的。从一个全及总体中可以抽取很多个样本,每次抽到哪个样本是不确定的。第六页,共六十三页,编辑于2023年,星期日6.1.2.2全及指标和抽样指标
1、全及指标又称总体指标或总体参数根据总体各单位的标志值或标志属性计算的反映总体数量特征的综合指标称为全及指标,又称总体指标。常用的全及指标主要有四个:全及平均数、全及成数、总体数量标志的标准差及方差、总体是非标志的标准差及方差。
2、抽样指标又称样本指标或样本统计量根据样本总体各单位标志值计算的反映样本特征的综合指标称为抽样指标,又称样本指标或样本统计量。它是用来估计总体参数的。与总体参数相对应,常用的抽样指标也有四个指标:抽样平均数、抽样成数、样本数量标志标准差及方差、样本是非标志标准差及方差。第七页,共六十三页,编辑于2023年,星期日6.1.2.3样本容量与样本个数
1、样本容量样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。样本容量大,样本误差会小,但调查费用必须增加,反之,样本容量过小,又将导致抽样误差增大,甚至失去抽样推断的价值。样本按照样本容量的大小可以分为大样本和小样本。一般地说,n≥30为大样本,n<30为小样本。在对社会经济现象进行抽样调查时,多数采用大样本。
2、样本个数
样本可能数目又称样本个数,是指从全及总体中可能抽取多少个样本。它既和每个样本的容量有关,也和抽样的方法有关。当样本容量给定时,样本的可能数目便由抽样方法决定。第八页,共六十三页,编辑于2023年,星期日
6.1.2.4重复抽样和不重复抽样
1、重复抽样
重复抽样是从全及总体中抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放回到全及总体中去,再从全及总体中随机抽取第二个单位,记录它有关标志表现以后,也把它放回全及总体中去,照此下去直到抽选n个样本单位。一般地说,从总体N个单位中,随机重复抽取n个单位构成样本,则共有样本个数为:N×N×N×…×N=Nn个。可见,重复抽样时全及总体单位数在抽选过程中始终没有减少,而且各单位有被重复抽中的可能。
第九页,共六十三页,编辑于2023年,星期日6.1.2.4重复抽样和不重复抽样
2、不重复抽样
不重复抽样是从全及总体中抽取第一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回全及总体中参加下一次抽选。然后,从总体N-1个单位中随机抽选第二个样本单位,记录了该单位有关标志表现以后,该单位也不再放回全及总体中去,再从全及总体N-2单位中抽选第三个样本单位,照此下去直到抽选出n个样本单位。一般地说,要从总体N个单位中随机不重复抽取n个单位为:N(N-1)(N-2)…(N-n+1)=N!/(N-n)!由此可见,在相同的样本容量要求下,不重复抽样的样本总是比重复抽样的样本个数少.可见,不重复抽样时,总体单位数在抽选过程中是逐渐减少的,而且各单位没有重复被抽中可能。两种抽样方法会产生三个差别:①抽取的样本可能数目不同;②抽样误差的计算公式不同;③抽样误差的大小不同。第十页,共六十三页,编辑于2023年,星期日
6.1.3抽样误差
1、抽样误差的一般概念
抽样误差是指根据样本数据计算而得的样本统计量值与被它估计的未知的总体参数真值之间的偏差。具体地是指样本平均数与总体平均数的差(-),,样本成数p与总体成数P的差(p-P)。
2、影响抽样误差的因素
1)总体内各单位被研究标志的变异程度。
2)样本容量的大小,即样本单位数的多少。
3)抽样的组织形式。
4)抽样的方法。第十一页,共六十三页,编辑于2023年,星期日
对一个全及总体进行抽样调查时,可以抽出很多个样本。而每一个样本都可以计算抽样的平均数和抽样成数,这样,样本的平均数与总体的平均数,样本的成数与总体的成数之间的误差,也有多种多样。因此,必须用抽样平均误差来反映抽样误差的一般水平。
抽样平均误差为抽样平均数(或抽样成数)对总体平均数(或总体成数)的标准差。为了区别于通常的标准差,我们分别用表示抽样平均数的平均误差,用表示抽样成数的平均误差。用M表示样本的可能数目。则有:在实际中,作为总体的平均数和总体成数P是未知的。同时也不可能把所有样本的平均数和成数都计算出来。所以,按照上述计算抽样平均误差的方法,实际上也是办不到的。
6.1.3.3抽样平均误差第十二页,共六十三页,编辑于2023年,星期日6.1.3.3抽样平均误差A、抽样平均数的抽样平均误差a.在重复抽样的条件下
(6-3)b.在不重复抽样条件下
(6-4)第十三页,共六十三页,编辑于2023年,星期日6.1.3.3抽样平均误差B、抽样成数的抽样平均误差
a.在重复抽样的条件下
(6-5)b.在不重复抽样的条件下
(6-6)第十四页,共六十三页,编辑于2023年,星期日6.1.3.4抽样极限误差
抽样平均误差是所有可能样本指标与总体指标之间的平均离差。但是在进行抽样推断时,我们实际只抽取一个样本,用一个样本指标去推断总体指标。由于抽样是按随机原则进行的,所有不同的样本组合都可能抽到,这样所得到的每个样本实际误差可能大于抽样平均误差,也可能小于抽样平均误差,因此包括在抽样平均误差范围内的只有一部分样本,而不是所有的样本组合。但对于某一项调查来说,根据客观要求一般应有一个允许的误差范围,也就是说若抽样误差在这个范围之内就认为是可行的。这一允许的误差范围就称作抽样的极限误差。
抽样极限误差是抽样指标与总体指标之间,在一定概率保证程度下的,抽样误差的最大可能范围。总体指标虽然是一个确定的量,但它是未知的,而样本指标是一个随机变量,其取值是不定的,它是围绕着总体指标左右变动的,因此,我们只能在一定的概率保证程度下,用一定的范围来控制误差。第十五页,共六十三页,编辑于2023年,星期日6.1.3.4抽样极限误差
通常用Δ表示抽样极限误差,设Δx和Δp分别表示抽样平均数和抽样成数的可能误差范围,则有:
Δx=|-|(6-7)Δp=|p-P|(6-8)
根据概率论数理统计原理,样本平均数和样本成数分别渐进地服从于N(X,)和N(P,p(1-p))的正态分布。因此有:
P{|-|≤2·}=0.9545P{|p-P|≤2·}=0.9545
即抽样极限误差在2倍的抽样平均误差范围内的可能性为95.45%。也就是说,我们有95.45%的可靠性程度来判断,样本指标与总体指标之间的误差不超过2或者2。第十六页,共六十三页,编辑于2023年,星期日6.1.3.4抽样极限误差
抽样极限误差的计算公式为:
Δ=t·μ(6-9)
即有:
Δx=t·(6-10)Δp=t·(6-11)
式中的t表示极限误差范围为抽样平均误差的若干倍,t称为概率度。第十七页,共六十三页,编辑于2023年,星期日
6.1.3.5抽样估计的置信度
抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。因为既然抽样误差是一个随机变量,我们就不能期望抽样平均数(成数)落在一个区间内是一个必然事件,而只能给予一定的概率保证程度。所以在进行抽样估计时,不但要考虑抽样误差的可能范围有多大,而且还必须考虑到落在这一范围内的概率有多少。前者我们称为抽样估计的精确程度,后者则是抽样估计的可靠程度,也是在概率上的保证程度问题。我们称之为抽样估计的置信度。
抽样估计的置信度和抽样的极限误差有着密切联系。根据中心极限定理,当抽样误差范围增大时,抽样估计的置信度也增大,抽样估计的精确程度则降低,反之亦然。实质上,抽样估计的精确度与置信度是一对反方向运动的矛盾。科学的调查方法要合理地协调它们之间的矛盾。第十八页,共六十三页,编辑于2023年,星期日6.1.4抽样调查的理论依据
抽样调查是建立在概率论大数定律基础上的。大数定律的一系列定理为抽样调查提供了数学依据。
大数定律是阐明大量随机现象平均结果的稳定性的一系列定理的总称。它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的影响都相对的小。那么将这些大量因素加以平均,因素的个别影响将相互抵消,而呈现出共同作用的影响,使总体具有稳定的性质。第十九页,共六十三页,编辑于2023年,星期日6.2抽样分布6.2.1样本空间
6.2.2重复抽样分布
6.2.3不重复抽样分布第二十页,共六十三页,编辑于2023年,星期日6.2.1样本空间
样本分布就是样本统计量的概率分布,在一个抽样框里可以抽取多套样本,组成样本空间,每一个样本空间可以构造出多个统计量,如样本均值、样本成数、样本方差等。由随机抽样抽到的各个样本单位不同,其数据表现不同,统计量的取值也不同。在同一个总体中抽出样本容量相同的所有可能样本后,计算每个样本统计量的值和相应的概率,就组成样本统计量的概率分布,简称抽样分布。在进行随机抽样时,按样本抽取方法的不同,可分为放回的重复抽样和不放回的不重复抽样,从而形成重复抽样的样本分布和不重复抽样的样本分布。第二十一页,共六十三页,编辑于2023年,星期日6.2.2重复抽样分布
1、样本平均数的抽样分布
样本平均数分布是由所有组合样本平均数的值与其相应的概率表示。
[例6-5]某工作班组有4个工人,其小时工资分别为1、2、3、4元,则:总体平均数:总体方差:第二十二页,共六十三页,编辑于2023年,星期日
现用重复抽样的方法从4人中随机抽取2人样本,用样本的平均工资来推断总体的平均工资。按重复抽样所组成的样本平均数的空间分布列表如下:表6-1重复抽样样本小时平均工资组合(单位:元)样本变量值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.0第二十三页,共六十三页,编辑于2023年,星期日
根据上表整理的样本频数分布及样本统计量,计算如下:
表6-2样本均值及频数分布样本均值()
频数()111-1.52.252.251.523-112236-0.50.250.752.54100003390.50.250.753.5271124141.52.252.25合计1640——10第二十四页,共六十三页,编辑于2023年,星期日
根据以上资料,计算样本平均数的数学期望和抽样方差如下:抽样方差的开平方即为抽样误差,用符号μ表示,
重复抽样的样本统计量与总体参数之间存在的关系:
1、重复抽样的样本平均数的数学期望(样本总平均数)恒等于总体平均数。即
2、随机变量的抽样方差等于总体方差的1/n,即即第二十五页,共六十三页,编辑于2023年,星期日6.2.2重复抽样分布2、抽样成数的抽样分布成数是指具有某种特征现象的数量占总体数量的比重,则现用重复抽样方法抽取n个单位,计算样本成数p,应用样本平均数分布的性质推广到成数的分布,则有
其方差(6-14)(6-15)第二十六页,共六十三页,编辑于2023年,星期日6.2.3不重复抽样分布1.样本平均数的抽样分布
[例6-7]仍用前述的例子,按不重复抽样所组成的样本平均数的空间分布如下:表6-3不重复抽样的样本小时平均工资组合样本变量值12341—1.522.521.5—2.53322.5—3.542.533.5—第二十七页,共六十三页,编辑于2023年,星期日根据上表整理的样本频数分布及样本统计量计算如下:表6-4样本均值及频数分布样本均值()频数()1.523-112224-0.50.250.52.541000033260.50.250.53.527112合计1230——5第二十八页,共六十三页,编辑于2023年,星期日
根据以上资料,计算样本平均数和抽样方差如下:
不重复抽样的样本统计量与总体参数之间存在的关系:
1、不重复抽样的样本平均数的数学期望(样本总平均数)恒等于总体平均数即
2、样本变量的抽样方差等于总体方差的1/n,再乘以一个不重复抽样时的调节系数(N-n)/(N-1)即
不重复抽样与重复抽样相比,其抽样方差多了一个调节系数:(N-n)/(N-1)≈(N-n)/N=(1-n/N)
由此可见不重复抽样的抽样方差都是比重复抽样的抽样方差小。
第二十九页,共六十三页,编辑于2023年,星期日6.2.3不重复抽样分布2、抽样成数的抽样分布
不重复抽样的成数统计量,比照前述的公式,有:
[例6-8]引用前述例子,在不重复抽样情况下,产品合格率的抽样平均误差为:(N=10000)
上述计算也可看出,当N相对n很大时,不重复抽样的抽样误差与重复抽样的抽样误差很接近。第三十页,共六十三页,编辑于2023年,星期日
在重复抽样和不重复抽样的情况下,抽样平均数和抽样成数的抽样平均误差的公式列表表6-5抽样平均误差公式统计量重复抽样不重复抽样抽样平均数抽样成数第三十一页,共六十三页,编辑于2023年,星期日6.3总体参数估计6.3.1总体参数估计概述
6.3.2总体参数的点估计
6.3.3总体参数的区间估计
6.3.4样本容量的确定
6.3.5使用计算公式求必要样本容量时应注意的问题第三十二页,共六十三页,编辑于2023年,星期日6.3.1总体参数估计概述
总体参数估计就是用样本统计量去估计未知的总体参数。总体参数是一个常量,样本统计量是一个随机变量,用样本统计量去估计总体参数时,必然会产生一个随机误差。总体参数估计有两种方法:点估计和区间估计。
点估计:即直接用样本统计量的值直接估计总体参数的值。
区间估计:即用样本统计量去估计总体参数的值时存在的误差范围有多大,它要解决的是估计的精确度问题,误差范围越小,其估计的精确程度也就越高。同时还要考虑可靠性问题,即参数估计的正确性概率有多大。
在进行参数估计时,应根据所要解决问题的重要性和工作需要,综合考虑参数估计的精确度(可允许的误差区间,亦称置信区间)和可接受的估计概率(置信概率)。
精确度和精确程度是一对矛盾。第三十三页,共六十三页,编辑于2023年,星期日6.3.2总体参数的点估计
点估计又称定值估计,它是直接用样本统计量的值来估计总体参数的值,其特点是简易直观,但它并不考虑估计的误差范围和估计的可靠程度。第三十四页,共六十三页,编辑于2023年,星期日6.3.2.1点估计的三个优良标准
1、无偏性。即样本统计量的值的数字期望(平均数)等于被估计的总体参数,用符号表示为。2、一致性。即随着样本单位n的不断增大,样本统计量的值与被估计总体参数的值之间的误差越来越小,亦即原本统计量的值接近总体参数的值的可能性越来越大。
一致性要求可以从大数定律的角度来理解,用公式表示:公式中为任意小的一个数。上式公式表明,样本统计量与总体参数之间差的绝对值小于一个任意小的数,当n趋于无穷大时,其发生的概率是肯定存在的,或者说这一事实肯定会发生的。3、有效性。即作为优良估计量的方差应该比其它方差小。
例如,用随机抽样计算的统计量的值与用非随机抽样计算的统计量的值,分别估计总体参数的值,因为随机抽样的误差更小,则前者的估计比后者更有效。又如,用随机抽样统计量的样本平均数和中位数分别估计总体参数的值,由于样本平均数的抽样误差更小,则用前者的估计比后者更有效。第三十五页,共六十三页,编辑于2023年,星期日6.3.2.2矩估计法
矩估计法也称数字特征法。它是用样本各阶原点矩的函数来估计总体各阶原点矩的同一个函数,相应的总体估计量称为矩估计量。
“矩”又称为“动量”,它本来是一个物理学中力学的概念,表示作用力、力臂和与其平衡点之间的数量关系。统计学借用“矩”这概念,通过计算一系列“矩”指数的数值来描述数据的分布特征。算术平均数、方差及平均差等都可以看成是“矩”的特例。第三十六页,共六十三页,编辑于2023年,星期日矩的表现形式或
当取
时,其一阶原点的矩就是算术平均数。当取时,其二阶矩就是变量分布的方差。当取时,其一阶矩的绝对离差之和就是变量分布的平均差。通过样本数量特征的计算来估计与之相应的总体数量特征是最常用的矩估计法。第三十七页,共六十三页,编辑于2023年,星期日6.3.2.2顺序统计量法
顺序统计量即是前面有关章节已讲过的位置平均数的统计量,它用中位数来表示。样本中位数和极差R都是重要的统计量。当样本数值中含有极端数值时,样本中位数比平均数更适宜作为总体参数值的统计量,计算更简便直观。第三十八页,共六十三页,编辑于2023年,星期日对于正态总体的样本中位数渐进地服从正态分布因而对于正态总体,用估计总体是适宜的。对于总体标准差的估计,可以用样本极差来估计。与R有如下关系:一般情况下,可近似地取为:用样本极差R来估计总体标准差时,其缺点是不如用样本标准差来得可靠,当n越大,两者差别越大。当n>10时,可直接用样本标准差来估计总体标准差。(6-20)第三十九页,共六十三页,编辑于2023年,星期日6.3.3总体参数的区间估计
区间估计是指由样本统计量的值来估计总体未知参数的值的时候,其误差的区间范围有多大,并给出可靠程度的估计概率。在正态分布的情况下,估计概率(亦称置信概率)是由概率度(置信度)和相应的概率函数来表示,常用的数值如下(双侧):
表6-6在正态分布下估计概率常用数值
,概率度
11.6451.9622.583概率函数,0.68270.900.950.95450.990.9973显著性水平
——0.100.05——0.01——第四十页,共六十三页,编辑于2023年,星期日正态分布图在进行区间估计时,根据研究目的和数据分布的特征,给定估计的概率保证程度(概率度)来推算抽样误差范围,或根据给定的允许误差范围(亦称极限误差)来推断相应的概率保证程度。第四十一页,共六十三页,编辑于2023年,星期日抽样极限误差、抽样平均误差和概率度三者之间有如下关系:抽样极限误差=概率度×抽样平均误差重复抽样:
(6-21)不重复抽样:
(6-22)
第四十二页,共六十三页,编辑于2023年,星期日6.3.3.1总体平均数的区间估计1、总体方差已知时当总体方差已知,或样本容量n充分大(n≥30)时,样本数据可用正态分布的概率来估计。2、总体方差未知时当总体服从正态分布但总体方差未知时,可用样本标准差s来代替总体标准差,但这要应用t分布的统计量进行总体参数的区间估计。同时,样本容量是小样本(n<30)时,也要应用t统计量。其区间估计的公式为:重复抽样:
(6-23)不重复抽样:
(6-24)第四十三页,共六十三页,编辑于2023年,星期日
[例6-9]某地区从10000亩水稻面积中,以不重复抽样方法随机
抽取100亩耕地进行调查,实测计算平均亩产600公斤,标准差为72.6公斤,求(1)以0.9973的概率可靠程度进行其平均亩产和总产量的区间估计。(2)若要求极限误差不超过14.4公斤,则其估计的概率可靠程度是多少?
解:已知公斤,公斤,N=10000亩,n=100亩,,,Δ=14.4公斤抽样平均误差:(公斤)抽样极限误差:(公斤)平均产量的区间估计(公斤)总产量的区间估计(万公斤)
当公斤时,,则第四十四页,共六十三页,编辑于2023年,星期日
[例6-10]对某电视节目进行收视率调查,在随机抽样调查的100人中,有20人经常看该节目,求该电视节目收视率的置信度为95%的估计区间?
解:已知
抽样平均误差:
抽样极限误差:估计区间:
即该电视节目的收视率在12.16%到27.84%之间。第四十五页,共六十三页,编辑于2023年,星期日[例6-11]某企业对一批10000件产品进行质量检验,以不重复抽样方法随机抽取100件产品进行检验,发现其中有3件废品,请以90%的置信概率估计这批产品的废品率?解:已知
抽样平均误差:抽样极限误差:
估计区间:
即该批产品的废品率在0.21%到5.79%之间。第四十六页,共六十三页,编辑于2023年,星期日6.3.4样本容量的确定
样本容量的确定就是在已知估计的置信概率、允许的误差区间及样本标准差的情况下,推出必要的样本容量。第四十七页,共六十三页,编辑于2023年,星期日6.3.4.1抽样平均数的样本容量
1、重复抽样的样本容量
2、不重复抽样的样本容量
第四十八页,共六十三页,编辑于2023年,星期日6.3.4.2抽样成数的样本容量
1、重复抽样成数的样本容量2、不重复抽样成数的样本容量
第四十九页,共六十三页,编辑于2023年,星期日[例6-12]某地区开展城镇居民的家计调查,从历史资料得知该市居民的人均年收入的标准差为3000元,家庭消费中食品支出占总支出(恩格尔系数)的50%,要在95.45%的概率保证下,平均收入的极限误差不超过300元,恩格尔系数的极限误差不超过4%,求必要的样本数?(假设该城镇有10000户居民家庭)第五十页,共六十三页,编辑于2023年,星期日A:求人均收入的必要样本容量
解:在重复抽样的条件下:=(户)在不重复抽样的条件下:(户)第五十一页,共六十三页,编辑于2023年,星期日
B:求样本成数的必要样本容量
在重复抽样的条件下:(户)在不重复抽样的条件下:(户)从上述两种调查目的要求来看,在重复抽样的条件下,至少要抽取625户城镇居民进行调查;在不重复抽样的条件下,至少要抽取589户城镇居民进行调查。第五十二页,共六十三页,编辑于2023年,星期日
6.3.5使用计算公式求必要样本容量时应注意的问题
1.当调查对象总体的方差和成数未知时,可用有关资料替代:1)使用历史资料;2)使用相同条件同类现象的资料;3)在正式调查前进行若干次试调查,用试调查中的方差最大值来代替总体方差;4)当成数方差未知时,取成数方差最大值0.25代替。
2.通过计算得出小数的数值,不能适用四舍五入的法则,不管小数的值大小如何都应该入,而凑成一个整数。
3.当有两种调查目的时,分别计算平均数和成数的必要样本容量,可取一个较大的样本容量值来同时满足两种调查目的的需要。第五十三页,共六十三页,编辑于2023年,星期日
6.4抽样组织形式和误差估计
6.4.1纯随机抽样(简单随机抽样)6.4.2分层(类型)抽样6.4.3系统(等距)抽样6.4.4整群抽样6.4.5多(二)阶段抽样第五十四页,共六十三页,编辑于2023年,星期日6.4抽样组织形式和误差估计抽样组织形式有纯随机抽样、分层(类型)抽样、系统(等距)抽样、整群抽样和二(多)阶抽样。评价多种抽样组织形式的抽样效果关键是对抽样误差的控制。抽样误差越小,则抽样效果也越好。第五十五页,共六十三页,编辑于2023年,星期日影响抽样误差的几个影响因素
1、总体单位标志值的变异性,变异越大,则方差越大,抽样误差也越大;2、样本容量,抽取的样本单位数越多,抽样误差越小;3、抽样方法,不重复抽样的误差比重复抽样的小,但总体单位数N与样本单位数n相比较很大时,抽样比n/N很小时,两种抽样方法的抽样误差很接近,有时也可用重复抽样的误差代替不重复抽样的误差;4、抽样的组织形式,严格来讲,纯随机抽样形式是最符合概率抽样理论,其它各种形式的抽样计算的抽样误差都应该与纯随机抽样误差进行对比,若前者小于后者,则说明该形式的抽样效果更好。第五十六页,共六十三页,编辑于2023年,星期日6.4抽样组织形式和误差估计
考虑抽样效果,同时还得考虑抽样调查的成本费用问题。考核抽样效果有一个很重要的原则:在既定调查费用的情况下,抽样误差越小越好;在既定的抽样误差范围控制的情况下,调查费用越少越好。调查费用包括:固定费用、调查方案设计费用,调查实施费用,办公费用及数据处理费用等。对一个抽样设计而言,并不是抽样误差越小
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年食品安全合同书
- 2024影视道具租赁合同参考范本
- 工程承包合同示例文本
- 2024举办合同培训班的通知
- 2024年度销售合同智能家居产品销售合同(04版)
- 2024蔬菜超市采购合同
- 2024年度安全设备维护及更新改造合同
- 农村新建住宅协议书
- 2024天台县花生种植收购合同样书
- 2024工业生产厂房租赁合同范本
- 液化石油气充装操作规程(YSP118液化石油气钢瓶)
- 工程样板过程验收单
- 颅内动脉动脉瘤介入治疗临床路径
- 粮食仓储场建设项目可行性研究报告
- 珠宝销货登记表Excel模板
- 深基坑开挖施工风险源辨识与评价及应对措施
- 唯美手绘风花艺插花基础培训PPT模板课件
- 《现代汉语语法》PPT课件(完整版)
- 5G智慧农业建设方案
- 航海学天文定位第四篇天文航海第1、2章
- 浙江大学学生社团手册(08)
评论
0/150
提交评论