抽样估计 精品课件_第1页
抽样估计 精品课件_第2页
抽样估计 精品课件_第3页
抽样估计 精品课件_第4页
抽样估计 精品课件_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、抽样估计 第1页,共81页,2022年,5月20日,14点29分,星期三问题的提出:现有10000盒火柴.欲知平均每盒火柴棍儿根数.现有10000颗螺丝钉.其中有合格品,有不合格品.欲知合格率.第2页,共81页,2022年,5月20日,14点29分,星期三第3页,共81页,2022年,5月20日,14点29分,星期三统计估计(推断)的过程样本总体样本统计量例如:样本均值、比例、方差总体均值、比例、方差第4页,共81页,2022年,5月20日,14点29分,星期三全面调查的局限性破坏性调查,不宜全面调查.无限总体或总体过大,无法全面调查.第5页,共81页,2022年,5月20日,14点29分,星

2、期三于是,人们很自然地想到,能否仅从总体中抽取部分单位,就这部分单位进行观察或调查.并就对部分单位观察或调查的结果计算出有关的指标,然后,用这一指标来估计总体的数字特征.如:从10000盒火柴中抽取100盒或30盒,点数之后,算得这100盒平均每盒根数.譬如:49根.然后用这49根,来代表10000盒火柴平均每盒根数.再如,从10000颗螺丝钉中抽取100颗或30颗或50颗.进行检测后得其合格率.如95%.然后,用这95%代表整个10000颗螺丝钉的合格率. 实际生活中人们也是这么做的.而且很有效.然后,接下来的问题是:第6页,共81页,2022年,5月20日,14点29分,星期三采用何种方法

3、来抽取部分单位?抽取多少单位?用这部分单位的指标代表总体指标,准确性如何?用这部分单位的指标代表总体指标,有多大把握?第7页,共81页,2022年,5月20日,14点29分,星期三 抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。 抽样推断的特点:它是由部分推断整体的一种认识方法抽样推断建立在随机取样的基础上抽样推断运用概率估计的方法。抽样推断的误差可以事先计算并加以控制第8页,共81页,2022年,5月20日,14点29分,星期三 参数估计 参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等

4、数量特征进行估计。 假设检验 假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。抽样推断的内容第9页,共81页,2022年,5月20日,14点29分,星期三第八章 抽样估计一、基本内容第一节 抽样估计中的几个基本概念第二节 样本平均数的分布规律第三节 抽样估计第10页,共81页,2022年,5月20日,14点29分,星期三二、学习目的与要求通过本章教学,使同学们明确抽样调查的概念和基本原理,掌握概率基础的基本运算,熟练掌握简单随机抽样和类型抽样,了解等距抽样、整群抽样和多阶段抽样。三、学习的重点与难点本章学习的重点是样本平均数的分布。难点是抽样估计。

5、四、授课课时 4-6学时第11页,共81页,2022年,5月20日,14点29分,星期三第一节 抽样估计中的几个基本概念一、总体与样本二、随机抽样与随机样本三、抽样方法四、抽样组织方式五、总体指标与样本指标六、常用的总体指标与样本指标七、抽样误差第12页,共81页,2022年,5月20日,14点29分,星期三一、总体与样本研究对象的全体称总体。从总体中随机地抽取一部分单位,称这一部分单位为一个样本。被抽取的每一个单位,称为样本单位。样本中包含样本单位的数目称为样本容量。样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。第13页,共81页,2022年,5月20日,14点29分,

6、星期三二、随机抽样与随机样本随机抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征(机会是均等的)。如此抽得的样本称为随机样本.第14页,共81页,2022年,5月20日,14点29分,星期三 三、抽样方法重复抽样是指每次随机抽取一个单位进行观察后放回去,再抽下一个,再放回去,连续随机抽取n次,构成一个容量为n的样本.不重复抽样则不将已抽取的单位放回去.(n/N30采用历史资料.如果同时有几个大小不同的历史资料,则选用数值较大者.第40页,共81页,2022年,5月20日,14点29分,星期三 例:从10000盒火柴中,随机抽取50盒,算得样本

7、平均数为49根,样本均方差为2根.求其抽样平均误差.第41页,共81页,2022年,5月20日,14点29分,星期三 从10000颗螺丝钉中,随机抽取100颗,经检测有5颗不合格.求其抽样平均误差.第42页,共81页,2022年,5月20日,14点29分,星期三 从一批灯泡中,随机抽取200个,经测算得平均寿命为4800小时,样本标准差为300小时,求其抽样平均误差.第43页,共81页,2022年,5月20日,14点29分,星期三 一批罐头中随机抽查300瓶.已知过去几次同样调查所得合格率分99%,98%.求合格率的抽样平均误差.第44页,共81页,2022年,5月20日,14点29分,星期三

8、第三节 抽样估计一、点估计二、区间估计三、样本容量的确定第45页,共81页,2022年,5月20日,14点29分,星期三抽样估计就是用样本统计量去估计总体的未知参数。例如,估计总体均值、总体方差等。第46页,共81页,2022年,5月20日,14点29分,星期三一、点估计点估计主要有矩估计法和最大似然估计法。矩估计法是样本矩去估计总体矩的一种估计法;最大似然估计法是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。第47页,共81页,2022

9、年,5月20日,14点29分,星期三为什么可以这么来估计呢? 象样本平均数,在数理统计中被称为无偏估计量.所谓无偏估计量是指样本平均数这一随机变量,其数学期望等于总体的被估计参数,即等于总体平均数.所以称其为无偏估计量.例如.我们通过前面的例子已经验证过.虽然各个可能样本的样本平均数具有随机性,可能等于总体平均数,也可能不等于总体平均数.但是平均起来看,样本平均数的平均数(数学期望)一定等于总体平均数.这种性质在数理统计中叫做无偏性.具有这一性质的估计量叫做无偏估计量.样本成数也是无偏估计量.第48页,共81页,2022年,5月20日,14点29分,星期三估计量的优良性准则(无偏性)无偏性:估

10、计量的数学期望等于被估计的总体参数。如样本平均是总体均值的一个无偏估计。 P( X )XCA无偏有偏第49页,共81页,2022年,5月20日,14点29分,星期三估计量的优良性准则(有效性)AB中位数的抽样分布均值的抽样分布XP(X )有效性:一个方差较小的无偏估计量称为一个更 有效的估计量。如,与其他估计量相比 ,样本均值是一个更有效的估计量第50页,共81页,2022年,5月20日,14点29分,星期三估计量的优良性准则(一致性)一致性: 随着样本容量的增大,估计量 越来越 接近被估计的总体参数.第51页,共81页,2022年,5月20日,14点29分,星期三一批产品2000件,抽取样本

11、进行检验得其优质品率为85%.试对这批产品的合格品率及合格品数量做出点估计.例题:第52页,共81页,2022年,5月20日,14点29分,星期三点估计的缺陷:无法说明抽样误差的大小无法说明估计结果的把握程度第53页,共81页,2022年,5月20日,14点29分,星期三二、区间估计 区间估计就是根据样本统计量及其抽样分布,以一定可靠程度推断总体参数可能范围。区间估计不是指出被估计总体参数的确切数值,而是指出它的可能范围。这种估计方法不仅以样本值为依据,而且考虑了抽样误差的大小,能说明估计结果的把握程度。第54页,共81页,2022年,5月20日,14点29分,星期三进行区间估计时,应考虑两个

12、因素:一是估计的精确程度,二是可靠性要求。精确程度就是要求估计误差必须控制在一定的范围内。允许误差的最大值可以通过极限误差来反映。极限误差越小,估计的精度越高,极限误差越大,估计的精度越低。可靠性是指结果正确的概率保证,可用置信度来反映。区间估计中的精度要求与可靠性要求常常是一对矛盾。第55页,共81页,2022年,5月20日,14点29分,星期三(一)抽样极限误差在抽样估计时,应根据所研究对象的变异程度和分析目的要求确定可允许的误差范围,我们把这种可允许的最大误差范围称为抽样极限误差。设x、p分别表示抽样平均数极限误差和抽样成数极限误差。则有:区间 称为平均数的估计区间或称平均数的置信区间。

13、区间 称为成数的估计区间或称成数的置信区间。第56页,共81页,2022年,5月20日,14点29分,星期三抽样极限误差的概率度基于概率估计的要求,抽样极限误差通常需要以抽样平均误差 或 为标准单位来衡量。把极限误差 或 分别除以 或 所得相对数t,表示误差范围为抽样平均误差的t倍。t是测量估计可靠程度的一个参数称为抽样误差的概率度。 第57页,共81页,2022年,5月20日,14点29分,星期三(三)区间估计公式第58页,共81页,2022年,5月20日,14点29分,星期三tt概率度t极限误差第59页,共81页,2022年,5月20日,14点29分,星期三概率度t概率估计区间0.50.3

14、82910.68271.50.86641.960.950020.954530.9973第60页,共81页,2022年,5月20日,14点29分,星期三落在总体均值某一区间内的样本X95.45% 的样本99.73% 的样本x- 368.27%的样本x- 2x- X+ 3X+2X+ x第61页,共81页,2022年,5月20日,14点29分,星期三总体参数的区间估计(抽样误差范围的概率保证度)在确定允许的抽样误差范围后,从主观愿望说,希望抽样调查的结果,样本指标的估计值都能够落在允许的误差范围内,但这并非都能实现的事情。由于抽样指标值随着样本的变动而变动,它本身是个随机变量,因而抽样指标和总体指标

15、的误差仍然是个随机变量,不能保证误差不超过一定范围的这件事是必然的,而只能给以一定程度的概率保证。抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。第62页,共81页,2022年,5月20日,14点29分,星期三总体参数区间的基本特点:是根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围。换句话说,对于总体的被估计指标X,找出样本的两个估计量x1和x2,使被估计指标X落在区间(x1,x2)内的概率1-,(01),为已知的。 即P(x1Xx2)=1一是给定的。我们称区间( x1,x2 )为总体指标X的置信区间,

16、称1-为估计置信度,称为显著性水平,x1是置信下限,x2是置信上限。第63页,共81页,2022年,5月20日,14点29分,星期三已知抽样误差范围,求概率保证度 计算步骤是:首先抽取样本,计算抽样指标(如计算抽样平均数或抽样成数),作为相应总体指标的估计值,并计算样本标准差以推算抽样平均误差。其次,根据给定的抽样极限误差范围,估计总体指标的下限和上限。最后,将抽样极限误差除以抽样平均误差求出概率度t值,再根据t值查正态分布概率表求出相应的置信度F(t),并对总体参数作区间估计。第64页,共81页,2022年,5月20日,14点29分,星期三 例1 对某型号的电子元件进行耐用性能检查,抽查的资

17、料分组列表如下,要求耐用时数的允许误差范围x=10.5小时,试估计该批电子元件的平均耐用时数。已知抽样误差范围, 求概率保证度(应用)耐用时数组中值元件数900以下900-950950-10001000-10501050-11001100-11501150-12001200以上875925975102510751125117512251263543931合计100第65页,共81页,2022年,5月20日,14点29分,星期三1、计算抽样平均数和标准差2、根据给定的=10.5小时,计算总体平均数的上下限,下限= 上限=3、根据t= ,查概率表得置信度 F(t)=0.9545 我们可以作如下估计

18、,即可以概率95.45%的保证程度,估计该批电子元件的耐用时数在1045-1066小时之间。第66页,共81页,2022年,5月20日,14点29分,星期三某乡水稻面积20000亩,以不重复抽样方法从中随机抽取400亩,求得样本平均亩产645公斤,标准差72.6公斤。要求抽样极限误差不超过7.2公斤,试对该乡水稻亩产和总产量作估计。第67页,共81页,2022年,5月20日,14点29分,星期三已知给定的置信度要求,推算极限误差的可能范围 计算步骤是:首先抽取样本,计算抽样指标,作为相应总体指标的估计值,并计算样本标准差以推算抽样平均误差。其次,根据给定的置信度F(t)要求,查表求得概率度t值

19、。最后,根据概率度t和抽样平均误差来推算抽样极限误差的可能范围,再根据抽样极差求出被估计总体措标的上下限,对总体参数作区间估计。第68页,共81页,2022年,5月20日,14点29分,星期三例:某纱厂某时期内生产了10万个单位的纱,以不重复抽样方法总随机抽取2000个单位检验,检验结果合格率为95%,废品率为5%,试以95%的把握程度,估计全部纱合格品率的区间范围及合格品数量的区间范围?已知:区间下限:区间上限:第69页,共81页,2022年,5月20日,14点29分,星期三从10000盒火柴中,随机抽取50盒,算得样本平均数为49根,样本均方差为2根.试以95.45%的把握程度,估计总体平

20、均每盒火柴棍根数.第70页,共81页,2022年,5月20日,14点29分,星期三从10000颗螺丝钉中,随机抽取100颗,经检测有5颗不合格.试以95%的把握程度估计这10000颗螺丝钉的合格率.第71页,共81页,2022年,5月20日,14点29分,星期三样本容量即样本所包括的样本单位数,抽样数目。如前所述,抽样平均误差与样本单位数的方根成反比.也就是说,n越大,抽样平均误差就是越小.抽样估计的准确性就越高.极端的情况:当样本单位数等于总体单位数时,就成了全面调查,那估计的结果必然是100%地准确。但是,样本单位数越大,抽样实际工作所需人力,物力,财力就越多,成本就越高.所以,不能无限制地扩大大样本容量。三、样本容量的确定第72页,共81页,2022年,5月20日,14点29分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论