




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章抽样(Sampling)
与参数估计(Estimate)
重点:深刻理解抽样分布的概念及中心极限定理的意义,灵活掌握均值和比例的区间估计方法的应用。
难点:在不同条件下的区间估计。
抽样法的特点:随机原则部分估计总体存在误差并可以控制抽样法的应用:对某些不可能进行全面调查而又需要了解其全面情况的社会经济现象,必须应用抽样法。(破坏性试验、总体过大、单位过于分散,实际调查不可能的)统计-抽样与参数估计共62页,您现在浏览的是第1页!第1节抽样与抽样分布
一、有关抽样的基本概念
总体(母体)(Population)样本(子样)(Sample)总体指标(总体参数)(Populationparameter)样本指标(样本统计量)(Samplestatistic)统计-抽样与参数估计共62页,您现在浏览的是第2页!抽样方法
重置抽样(重复抽样)(Samplingwithreplacement)要从总体N个单位中随机抽取一个容量为n的样本,每次从总体中抽取一个单位,把顺序号登记下来之后,重新放回参加下一次抽选,连续反复抽取n次组成所要求容量的样本。不重置抽样(不重复抽样)(Samplingwithoutreplacement)要从总体N个单位中随机抽取一个容量为n的样本,每次从总体中抽取一个单位,被抽中的单位不再放回参加下一次抽选,连续进行次便组成样本。不重复抽样所得样本对总体的代表性较大,抽样误差较小,所以实践中通常采用不重复抽样。
统计-抽样与参数估计共62页,您现在浏览的是第3页!总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布
(populationdistribution)总体统计-抽样与参数估计共62页,您现在浏览的是第4页!二、抽样分布
(Samplingdistribution)
1、抽样分布的意义
对统计量的所有可能取值及其对应概率的描述,就是统计量的抽样分布,即抽样分布。抽样分布反映样本统计量的分布特征,根据抽样分布的规律,可揭示样本统计量与总体参数之间的关系,计算抽样误差,并说明抽样推断的可靠程度。
统计-抽样与参数估计共62页,您现在浏览的是第5页!例:样本均值的抽样分布
【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1、x2=2、x3=3、x4=4。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差统计-抽样与参数估计共62页,您现在浏览的是第6页!计算出各样本的均值,如下表。并给出样本均值的抽样分布
3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)X样本均值的抽样分布1.00.1.2.3P(X)1.53.04.03.52.02.5统计-抽样与参数估计共62页,您现在浏览的是第7页!2、样本均值的抽样分布
样本平均数的标准差反映了样本平均数与总体平均数的平均误差,故称之为抽样平均误差(或抽样标准差)。计算公式:(重复抽样)可见,抽样平均误差与总体标准差成正比变化,与样本容量的平方根成反比变化。当总体为正态分布时,对于任何样本容量,样本平均数的抽样分布是正态分布。若总体方差σ2未知,则可用样本方差s2取而代之。样本容量很大,无论总体分布如何,样本平均数近似服从正态分布。
统计-抽样与参数估计共62页,您现在浏览的是第8页!例:灯泡厂从10000只灯泡中随机抽取500只检查其耐用时数,结果如下表。该厂规定耐用时数在850以下为不合格。求平均耐用时数及不合格率的抽样平均误差。耐用时数灯泡数xxf800-850850-900900-950950-10001000-10501050-1100371291851024078258759259751025107530525112875171125994504100075253700003225000255000400000157500合计500——4625001475000统计-抽样与参数估计共62页,您现在浏览的是第9页!练习:1、从某大学学生中随机抽选100名调查体重,结果平均体重为58千克。根据过去的资料知道该校学生体重标准差为10千克。求抽样误差。2、某工厂共生产新型聚光灯2000只,随机抽选400只进行耐用时间调查,结果平均寿命为4800小时,标准差为300小时。求抽样误差。3、从某校学生中随机抽选400名,发现戴眼镜的有80人。计算求抽样误差。4、一批食品罐头60000桶,随机抽查300桶,有6桶不合格。求合格率的抽样误差。5、假设4个人工资分别为:400、500、700、800元,现随机抽选2人进行调查。(1)验证(2)计算重复抽样及不重复抽样的抽样平均误差。统计-抽样与参数估计共62页,您现在浏览的是第10页!二、区间估计(Intervalestimate)
抽样误差统计调查的误差,是指调查所得结果与总体真值之间的差异。误差的来源有登记性误差和代表性误差两大类。代表性误差分为系统性误差和偶然性误差。抽样估计中所谓的抽样误差,就是指这种偶然性误差或随机误差。(1)实际抽样误差。指某一特定样本的样本估计值与总体参数真值之间的离差。(2)抽样平均误差。统计学中常用标准差来衡量均值的代表性,所以抽样平均误差可以衡量样本对总体的代表性大小。(3)抽样极限误差。指一定概率条件下抽样误差的可能范围,也称允许误差。抽样极限误差的可能范围与抽样估计的可能性即概率紧密相联。统计-抽样与参数估计共62页,您现在浏览的是第11页!影响抽样误差的主要因素
1、抽样单位数的多少。在其它条件不变的情况下,抽样单位数愈多,抽样误差愈小;反之抽样单位数愈少,抽样误差就愈大。2、总体离散程度的高低。当其它条件不变时,总体离散程度愈低,抽样误差愈小;反之总体离散程度愈高,抽样误差愈大。3、抽样方法4、组织方式统计-抽样与参数估计共62页,您现在浏览的是第12页!大样本(n≥30)下总体均值的区间估计
区间估计就是根据样本求出总体未知参数的估计区间,并使其可靠程度达到预定要求。(1)
总体方差σ2已知时由于,所以对于给定的置信度1-α,有即可见,极限误差的计算公式为则总体均值的置信区间为统计-抽样与参数估计共62页,您现在浏览的是第13页!
(2)
总体方差σ2未知时
由于~t(n-1),对于给定的置信度1-α,有置信下限置信上限在大样本下,总体均值的置信区间为统计-抽样与参数估计共62页,您现在浏览的是第14页!解:在95.45%的概率保证下,=2×0.087=0.174(g)则总体平均数置信区间为即(150.126,150.474)之间说明该批茶叶达到要求。统计-抽样与参数估计共62页,您现在浏览的是第15页!例:某保险公司投保人年龄设某保险公司投保人年龄呈正态分布,现从中抽取10人,其年龄分别为:32,50,40,24,33,44,45,48,44,47岁。试以95%的置信水平估计该保险公司投保人的平均年龄。
解:当置信度为95%时,=2.26222.6544=6.00(岁)因为40.7-6.00=34.740.7+6.00=46.7所以该保险公司投保人的平均年龄的置信区间为(34.7,46.7)岁。
统计-抽样与参数估计共62页,您现在浏览的是第16页!例:总体比例的区间估计
【例】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间解:已知n=100,p=65%,1-=95%,z/2=1.96该城市下岗职工中女性比例的置信区间为55.65%~74.35%
统计-抽样与参数估计共62页,您现在浏览的是第17页!练习1、从一批产品中按不重复随机方法抽选1/20,共200件,其中废品8件。当概率保证程度为95.45%时,可否认为该批产品的废品率不超过5%?2、一电视节目主持人想了解观众对电视节目的喜欢情况,他选取500名观众作样本,结果说喜欢该节目的175人。现以95%的概率估计观众喜欢这一节目的区间范围。若该主持人希望估计极限误差不超过5%,有多大把握?3、已知炼钢厂的铁水含碳量在正常情况下服从正态分布,其方差为0.108×0.108,现测定了9炉钢水,平均含碳量4.484。按95%的可靠程度估计该厂铁水含碳量。统计-抽样与参数估计共62页,您现在浏览的是第18页!第5节样本容量的确定
在重置抽样下,
所以,必要抽样单位数在不重置抽样下,必要抽样单位数
统计-抽样与参数估计共62页,您现在浏览的是第19页!【例】拥有工商管理学士学位的大学毕业生年薪的标准差大约为2000元,假定想要估计年薪95%的置信区间,希望边际误差为400元,应抽取多大的样本容量?
解:统计-抽样与参数估计共62页,您现在浏览的是第20页!练习:1、假定总体为5000单位,被研究的标志方差不小于400,抽样极限误差不超过3。当概率为99.73%时,需要有多少不重复抽样单位?(371)2、对某型号电池进行电流强度检查,根据以往正常生产经验,电流强度的标准差为0。4安培,合格率为90%。现用重复抽样方式,要求在95.45%的置信度下,抽样平均电流强度的误差范围不超过0.08安培,抽样合格率的极限误差不超过5%,问必要的抽样单位数应为多少?(144)3、对某型号电子元件10000只进行耐用性能检查。根据以往抽样测定,求得耐用时数的均方差为51.91小时,合格率的均方差为28.62%,试计算:(1)概率保证为68.27%时,元件平均耐用时数的误差范围不超过9小时,在重复抽样的条件下,要抽查多少元件?(34)(2)概率保证为99.73%时,元件合格率的极限误差不超过5%,在重复抽样的条件下,要抽查多少元件?(295)(3)在不重复抽样的条件下,要同时满足上述(1)、(2)条件,要抽查多少元件?统计-抽样与参数估计共62页,您现在浏览的是第21页!7、某公司电话咨询服务部门在每次通话结束时都要记下通话时间,从一个由16个记录组成的随机样本得出平均一次通话时间为16分钟。已知总体服从正态分布,其标准差为0.7分钟。试以95.45%的概率推断总体均值的置信区间。8、某公司推出一种营养型豆奶,为了做好促销工作,随机地选取顾客询问喜欢此豆奶情况。若要使置信度为95%,抽样误差不超过0.05,在下列情况下,你建议样本的容量为多大?(1)假如初步估计约有60%的顾客喜欢此豆奶;(2)假如无任何资料可用来估计喜欢此豆奶的比例。9、对某砖厂产品质量进行抽样调查,要求抽样误差不超过0.01111,概率把握程度为0.9545。已知过去进行的几次同样调查所得不合格产品比例为1.25%、1.23%、1.14%,试确定必要的抽样数目。统计-抽样与参数估计共62页,您现在浏览的是第22页!第6节其它抽样方法及其抽样分布特征
一、分层抽样((Stratifiedsampling)设总体容量为N,将总体划分为k层(组或类),有N=N1+N2+…+Nk。从每层的Ni个单位中抽取ni个单位构成容量为n的样本,即n=n1+n2+…+nk。从每层中抽取样本单位时,为了保持样本结构与总体结构相同,通常采用按(等)比例取样,即按各层单位数占总体单位数的比例从中抽取样本,使各层样本单位数与各层总体单位数之比等于样本容量与总体容量之比。即
统计-抽样与参数估计共62页,您现在浏览的是第23页!总体方差未知时样本层内方差平均数抽样平均误差计算公式为(重复抽样)(不重复抽样)对于分层抽样,若总体各层为正态分布或为大样本非正态分布,则各子样本平均数、样本平均数均服从或近似服从正态分布。对于给定的置信度1-α,总体均值的置信区间为:统计-抽样与参数估计共62页,您现在浏览的是第24页!例:某电视台分别从三个县按比例抽选600户,调查晚间新闻的收视率和每周看电视时间(小时),结果如表所示。在95%的置信度下,求
(1)
三县总体收视率的置信区间;
(2)
三县住户每周看电视的平均时间置信区间。
县住户抽选户比例平均数层内方差12340000140006000400140600.270.180.1714.3518.7419.98237.24168.47131.01统计-抽样与参数估计共62页,您现在浏览的是第25页!练习:
1、某乡全部粮食耕地5000亩,按平原和山区面积比例抽取样本,容量为630亩,计算各组平均亩产和标准差如下。以95%的概率保证对全乡平均亩产作区间估计。全部面积抽样面积平均亩产标准差平原山区40001000504126960750200400合计5000630918253统计-抽样与参数估计共62页,您现在浏览的是第26页!3、从三种不同规模的工厂中,分别随机抽查1%机床,得到机床利用率如下,试以95.45%的概率确定全部机床利用率的置信区间。工厂类型金属切削机床数机床利用率(%)全部抽样小型中型大型8000250003000080250300836559统计-抽样与参数估计共62页,您现在浏览的是第27页!二、等距抽样(Systematicsampling)
如果对总体的差异程度不了解,可以按无关标志排队。这种抽样结果接近于简单随机抽样的效果,所以可采用简单随机抽样的误差计算方法,但要注意等距抽样通常都是不重置抽样。如果对总体的变异程度有所了解,可以按有关标志排队。按有关标志排队的等距抽样实质上运用了分层抽样的一些特点,有利于提高样本的代表性,与分层抽样不同的,只是分类更细致,层数更多,在各层只抽取1个单位。因此,一般可以采用不重复分层抽样的误差公式来近似计算。统计-抽样与参数估计共62页,您现在浏览的是第28页!练习1、假定对总体2000个单位进行5%的机械抽样。试确定:(1)将总体划分为多少个同等部分?(2)抽选的间隔如何?(3)每部分的单位数是多少?(4)能否说出抽取单位的号码和抽取单位的总数?2、某产品零件方差为另一同类零件方差(0.12)的3倍,若以95%的可靠性估计抽样误差不多于0.17厘米,现打算从4000件零件中做机械抽样,必须抽出多少零件做检验?统计-抽样与参数估计共62页,您现在浏览的是第29页!样本平均数平均数的群间方差比例的群间方差当总体平均数或比例未知时,可用样本指标代替计算如下:整群抽样的抽样平均误差计算公式为:当r比较大时,总体平均数和比例的1-α置信区间分别为:统计-抽样与参数估计共62页,您现在浏览的是第30页!练习:
1、某工厂对1000箱入库产品进行检验,采取整群抽样方法抽取100箱。对箱内产品进行全面检验结果如下表。根据上述资料,
(1)按68.27%的概率保证时,废品率的范围如何?
(2)概率为95.45%时,推断总体比例的存在区间。如果估计废品率不超过2.5%,确定需抽检的箱数。
(3)如果上述资料是按重复抽样方法取得,平均误差怎样计算?等于多少?废品率(%)装箱数(箱)1——22——33——4603010统计-抽样与参数估计共62页,您现在浏览的是第31页!抽样方式的选择以上几种常用的抽样方法,各有不同的特点,适用于不同的场合。在实际工作中,应根据调查对象的性质,满足抽样误差的要求,并考虑经费条件,选择适当的抽样方法。一般来讲,比较复杂的抽样方式(如分层抽样、按有关标志排队等距抽样)抽样误差较小,但需要花费较多的人力、物力和财力,而且必须事先掌握总体的有关信息以便适当地分组或排队;相反,较为简单的抽样方式,抽样误差较大,但经费较少,事先不需要了解总体的很多信息。
统计-抽样与参数估计共62页,您现在浏览的是第32页!
概率抽样的组织方式简单随机抽样:从总体中抽取样本最常用的方法。从容量为N的总体中进行抽样,如果容量为n的每个可能样本被抽到的可能性相等,则称容量为n的样本为简单随机样本。分层抽样:也称分类抽样或类型抽样,它是按某个主要标志对总体各单位进行分类,然后从各层中按随机原则分别抽取一定数目的单位构成样本。等距抽样也称机械抽样或系统抽样。它是先将总体单位按一定顺序排队,计算出抽样间隔(或抽样距离),然后按固定的顺序和间隔抽取样本单位。整群抽样:也称丛聚抽样或集团抽样。它是将总体分为若干部分(每一部分称为一个群),然后按随机原则从中一群一群地抽选,对抽中群内的所有单位进行全面调查。统计-抽样与参数估计共62页,您现在浏览的是第33页!一个样本中各观察值的分布也称经验分布当样本容量n逐渐增大时,样本分布逐渐接近总体的分布样本分布
(sampledistribution)样本统计-抽样与参数估计共62页,您现在浏览的是第34页!抽样分布
(samplingdistribution)总体计算样本统计量例如:样本均值、比例、方差样本统计-抽样与参数估计共62页,您现在浏览的是第35页!现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为
3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)统计-抽样与参数估计共62页,您现在浏览的是第36页!样本均值的分布与总体分布的比较=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(X)1.00.1.2.31.53.04.03.52.02.5X统计-抽样与参数估计共62页,您现在浏览的是第37页!3、样本比例的抽样分布
当从总体中抽出一个容量为n的样本时,样本比例服从二项分布。当n→∞时,二项分布趋近于正态分布。所以,在大样本下,若np≥5且n(1-p)≥5,样本比例p近似服从正态分布。比例的抽样平均误差(重复抽样)式中,P为总体比例,实际计算时通常采用以往经验数据或样本比例。统计-抽样与参数估计共62页,您现在浏览的是第38页!解:重复抽样条件下不重复抽样条件下统计-抽样与参数估计共62页,您现在浏览的是第39页!第2节参数估计的基本方法
参数估计——以实际观察的样本数据所计算的统计量作为未知总体参数的估计值。一、点估计(Pointestimate)点估计也称定值估计,就是直接以样本统计量作为总体参数的估计值。点估计的优点是它提供了总体参数的具体估计值,可作为决策的依据,其缺点是不能提供有关抽样误差的信息。样本均值是总体均值μ的点估计量,样本方差s2是总体方差σ2的点估计量,样本比例p是总体比例P的点估计量。优良估计量的标准:无偏性有效性一致性统计-抽样与参数估计共62页,您现在浏览的是第40页!样本平均数的抽样极限误差样本比例的抽样极限误差抽样误差与抽样可靠性的关系统计-抽样与参数估计共62页,您现在浏览的是第41页!
第3节总体均值的区间估计一、区间估计的基本原理1、大数定律大数定律主要是说明:当n足够大时,独立同分布的随机变量的算术平均数趋近于数学期望;事件发生的频率接近于其发生的概率。即样本统计量接近于总体参数。2、中心极限定理中心极限定理是说明:当n充分大时,大量的起微小作用的相互独立的随机变量之和趋于正态分布。统计-抽样与参数估计共62页,您现在浏览的是第42页!例:从某大学学生中随机抽取100名调查体重情况。经称量和计算,得到平均体重为58千克。根据过去的资料知道大学生体重的标准差是10千克。在95%的置信水平下,求该大学学生平均体重的置信区间。
解:已知=58,σ=10,zα/2=1.96,n=100=10/10=1(千克)=1.96×1=1.96(千克)
置信下限为58-1.96=57.04,置信上限为58+1.96=59.96故所求置信区间为(57.04,59.96)千克。统计-抽样与参数估计共62页,您现在浏览的是第43页!例:某进出口公司出口一种名茶,规定每包重量不低于150克。现不重复抽取1%检验,结果如下。以95.45%的概率估计这批茶叶平均每包重量范围,以确定该批茶叶是否达到要求。每包重量(克)包数xxf148——149149——150150——151151——15210205020148.5149.5150.5151.5148529907525303032.412.8228.8合计100——1503076统计-抽样与参数估计共62页,您现在浏览的是第44页!小样本下(n<30)总体均值的区间估计在小样本条件下,样本平均数的分布依赖于总体的概率分布。若总体服从正态分布,无论样本容量如何,样本平均数都服从正态概率分布。若总体不服从正态分布,必须扩大样本容量。(1)总体方差σ2已知时
总体均值的置信区间为(2)总体方差σ2未知时总体均值的置信区间为(,)统计-抽样与参数估计共62页,您现在浏览的是第45页!第4节总体比例的区间估计在大样本条件下,若np》5,n(1-p)》5,则样本比例趋近于正态分布。对于给定置信度,有总体比例的置信区间为小样本条件下,不作介绍。统计-抽样与参数估计共62页,您现在浏览的是第46页!例:某厂对一批产品进行质量检验,随机重复抽取样品100只,样本合格品率为95%,试计算把握程度为90%的合格品率置信区间。
解:已知n=100,p=95%,1-α=90%,查表得zα/2=1.645
=0.0218
Δp=zα/2=1.645×0.0218=0.0359或3.59%
95%-3.59%=91.41%,95%+3.59%=98.59%
故该批产品合格率的置信区间为(91.41%,98.59%)统计-抽样与参数估计共62页,您现在浏览的是第47页!4.某市抽查25户家庭用户电力消费量,结果如下。试以95%的概率保证,估计全市家庭用户电力平均消费量的置信区间、总消费量的置信区间及用电量在85度以上的比例。用电量(度)户数45——5555——6565——7575——8585——9525963合计25统计-抽样与参数估计共62页,您现在浏览的是第48页!例:某市进行职工家庭生活费抽样调查,已知职工家庭平均每人每月生活费收入的标准差为110元,允许误差范围10元,概率把握程度95%,试确定应抽选的户数。
解:例:某企业要调查产品合格率,已知以往的合格率曾有90%、98%、99%。现要求误差不超过1%,把握程度为95%,问需要抽选多少件产品?解:例:要调查某校大学生英语四级考试成绩,假设根据历史资料该校学生平均成绩的标准差为20分,及格率为65%。现用重复抽样方法,要求在95%的置信度下,平均分数的误差不超过2分,及格率的误差不超过4%,求必要抽样数目。解:统计-抽样与参数估计共62页,您现在浏览的是第49页!影响必要抽样数目的因素(1)允许误差范围Δ。当其它条件不变时,允许误差愈小,必要的抽样单位数就需要愈多;反之,允许误差愈大,抽样单位数就可以愈少。(2)总体方差σ2。其他条件不变的情况下,总体方差σ2愈大,总体单位的差异程度愈大,则样本单位数应愈多;反之,样本单位数可愈少。(3)抽样估计的可靠程度1-α。当其他条件不变时,抽样估计的可靠程度愈高,zα/2数值愈大,抽样数目就必须愈多;反之,抽样估计的可靠程度愈低,抽样数目就可以愈少。(4)抽样方法。相同条件下,由于采用重复抽样比不重复抽样的误差大,所以,前者应比后者多抽一些样本单位。除上述因素之外,抽样组织方式也是影响抽样单位数的一个原因。统计-抽样与参数估计共62页,您现在浏览的是第50页!4、某药厂为了检查瓶装药片数量,从成品库随机抽检100瓶,结果平均每瓶101.5片,标准差为3片。试以99.73%的概率推断成品库中该种药平均每瓶数量的置信区间。如果允许误差减少到原来的1/2,其它条件不变,问需要抽取多少瓶?5、在对一条广告效应进行的电话追踪调查中,30名被追踪者中有20名会想起广告用语。试求在看过该广告的所有人中,会想起广告语的人所占比重的置信区间。(α=5%)6、设成年男子身高呈正态分布。某地区成年男子平均身高170厘米,标准差为2厘米。(1)若抽查10人,问这10人的平均身高介于166.2——173.8厘米之间的可能性有多大?(2)如果进行一次成年男子身高的抽样调查,要求以95%的把握程度保证误差不超过3厘米,问需抽查多少人?(3)如果以95%的把握保证误差不超过1.5厘米,问需抽查多少人?这一结果与上一结果有何关系?(4)如果允许误差仍为1.5厘米,但要求保证程度提高到99.73%,问需要抽查多少人?统计-抽样与参数估计共62页,您现在浏览的是第51页!10、根据高教厅统计,某地区有17%的大学生申请免息教育贷款。假定样本容量为300。试求:(1)当地大学生中申请免息教育贷款的总体比例的95.45%的置信区间。(2)当地大学生中申请免息教育贷款的总体比例的99%的置信区间。(3)当把握程度由95.45%提高到99%时,允许误差如何变动?11、某职业研究所随机抽取100名IT行业人员了解本地人员薪金,样本均值为50124.58元,样本标准差为1685元,试分别求IT行业人员年薪的总体均值的90%、95%和99%的置信区间。当置信水平增大时,置信区间的宽度如何变化?统计-抽样与参数估计共62页,您现在浏览的是第52页!分层抽样的抽样平均误差重置抽样下,不重置抽样下,对于等比例分层抽样,其分布特征如下:
样本平均数总体层内方差平均数抽样平均误差(重复抽样)(不重复抽样)统计-抽样与参数估计共62页,您现在浏览的是第53页!比例的抽样平均误差
重置抽样不重置抽样总体比例未知时,其中,当总体服从或近似服从正态分布时,对于给定的置信度1-α,总体比例的置信区间为:统计-抽样与参数估计共62页,您现在浏览的是第54页!样本容量的确定
重复抽样不重复抽样分层抽样有如下的特点:1、由于总体方差等于组内方差与组间方差之和,所以分层抽样的误差一般小于简单随机抽样的误差。2、由于总体方差是唯一确定的数值,因此分层抽样时可以扩大层间方差,缩小层内方差,使抽样误差减小。统计-抽样与参数估计共62页,您现在浏览的是第55页!2、对某公司职工的工资进行抽样调查,共抽取600名职工,其中400名工人,200名职员,结果如下。试分别计算类型抽样和简单随机抽样的误差,并加以比较。现若采用类型抽样方式,试对该公司职工平均工资作区间估计。如果要求误差不超过1元,应至少抽选多少工人和职员?(置信度为95%)工人职员月工资人数月工资人数500——600600——700700——800100180120700——800800——900900——1000708050统计-抽样与参数估计共62页,您现在浏览的是第56
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年钦州运输从业资格证考试试题库
- 辽宁省辽阳县2025年初三下学期第一次考试语文试题含解析
- 邢台医学高等专科学校《遥感科学与技术专业外语》2023-2024学年第二学期期末试卷
- 辽宁对外经贸学院《幼儿行为观察与指导》2023-2024学年第二学期期末试卷
- 威海职业学院《环境和生物地球化学》2023-2024学年第二学期期末试卷
- 江苏省连云港市赣榆县重点中学2024-2025学年初三下学期第三次统练数学试题含解析
- 宿迁职业技术学院《翻译简史》2023-2024学年第一学期期末试卷
- 平顶山学院《地铁与隧道工程》2023-2024学年第二学期期末试卷
- 柳州铁道职业技术学院《园林与景观设计》2023-2024学年第二学期期末试卷
- 江苏省南京市江宁区2024-2025学年高三第一次十校联考生物试题含解析
- 网络设备安全配置表
- GB/T 700-2006碳素结构钢
- GB/T 28732-2012固体生物质燃料全硫测定方法
- GB/T 17214.1-1998工业过程测量和控制装置工作条件第1部分:气候条件
- 猪生殖器官(课堂PPT)
- 2023年广东学位英语试题学位英语考试真题(含答案)
- 《旅行社经营管理》考试复习题库及答案
- 粤教版五年级下册科学知识点
- 危大工程巡视检查记录表(深基坑)
- 《最好的未来》合唱曲谱
- GB∕T 36765-2018 汽车空调用1,1,1,2-四氟乙烷(气雾罐型)
评论
0/150
提交评论