参数估计课件_第1页
参数估计课件_第2页
参数估计课件_第3页
参数估计课件_第4页
参数估计课件_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章参数估计第一节参数估计概述第二节一个总体参数的区间估计第三节样本容量的确定2第一节参数估计概述一、参数估计的概念二、参数估计的分类三、评价估计量的标准31.定义:以样本统计量作为未知总体参数的估计量,并通过对样本各单位的实际观察取得样本数据,计算样本统计量的取值作为总体未知参数的估计值。估计量:用来估计总体参数的统计量的名称。估计值:用来估计总体参数时计算出来的估计量的具体数值。一、参数估计的概念4二、参数估计的分类点估计区间估计5点估计(pointestimator)点估计又称定值估计,它是直接以样本统计量作为总体参数的估计量,以样本统计量的取值作为总体参数的估计值。常用的总体参数的点估计重点注意6三、评价估计量的标准7无偏性(unbiasedness)无偏性:估计量的数学期望等于被估计的总体参数。P(X)XCA无偏有偏若,则称为的无偏估计量。都是无偏估计量8有效性(efficiency)AB中位数的抽样分布均值的抽样分布XP(X)有效性:一个方差较小的无偏估计量称为一个更有效的估计量。若,则称为比更有效的估计量9一致性(consistency)一致性:随着样本容量(n)的增大,点估计量的值越来越接近被估计的总体参数。AB较小的样本容量较大的样本容量P(X)X

若对于任意ε>0,有10例5.1

对某企业的产品进行抽样检验,设抽出100件产品,其中不合格产品5件,试估计该企业产品的合格率是多少?解:通过样本的合格率来估计企业产品的合格率。样本合格率p=95/100=95%,我们估计该企业产品的合格率是95%。

P=p=95%11例5.2

男性成人的身高X服从正态分布

,其中,是未知参数,现随机测量12名成人男性的身高(单位:米)如下:1.801.681.851.601.671.751.781.621.761.701.791.69,试求的点估计值12第二节一个总体参数的区间估计一、区间估计概述二、总体平均数的区间估计三、总体成数的区间估计13一、区间估计概述1.基本概念(1)区间估计:在点估计的基础上,给出总体参数估计的一个范围,称为参数的区间估计。(2)置信区间:由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。置信区间置信下限置信上限样本统计量

(点估计)14(3)置信水平:如果我们将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比率,称为置信水平。在构造置信区间时,我们可以用所希望的值作为置信水平。比较常用的置信水平是:90%,95%和99%,通常用1-表示置信水平,其中称为显著性水平。即区间包含总体参数真实值的可信度。15两个需要注意的问题如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。置信区间是一个随机区间,它会因样本的不同而不同,而且不是所有的区间都包含参数真值。162.抽样误差汇总(1)参数估计是以样本的指标估计总体指标,这两者之间必然存在着误差,假设只考虑由于随机因素引起的误差,则称这种误差为抽样误差。(2)允许(或可以容忍)的最大抽样误差,称为抽样极限误差。(3)所有可能的样本估计值跟总体参数的平均差异称为,抽样平均误差。173.区间估计的基本原理(1)区间估计的三个要素——点估计值、允许的抽样误差范围、置信水平(概率保证程度)。点估计值:一般为样本平均数或样本成数p允许误差范围(抽样极限误差):Δ(x±Δ)就是置信区间置信水平:F(z)=1-思考:后两者的关系18(2)区间估计的基本原理4.F(z)、z、Δ、μ之间的关系F(z)与z具有一一对应的关系,所以已知概率保证程度F(z)就可以求出概率度z;若已知z也就可以知道F(z)。19样本μ和总体参数的点估计值给定F(z)zΔ=z×μΔ/μ=z给定Δ

F(z)抽样平均误差205.区间估计的特点(1)指出总体被估计参数的上限和下限,即指出总体参数的可能范围,而不是直接给出总体参数的估计值。(2)指出置信区间包含总体参数的可信度有多大。(3)而前两者是相互矛盾的。21(二)总体平均数的区间估计

总体方差(2

)已知由抽样分布定理知道,如果总体服从正态分布,则样本平均数:如果总体正态性不成立,但是当样本容量n充分大时,近似地也有:因此,22区间估计的步骤区间估计根据给定的条件不同,有两种估计方法:⑴给出允许误差(Δ),求概率保证程度F(z)⑵给出概率保证程度F(z),求估计区间。23⑴给出Δ,求F(z)①抽取样本,计算样本指标(样本平均数、样本方差、抽样平均误差);②根据给定的抽样误差——允许误差Δ,计算估计区间的上、下限;③求出概率度z,查表得到F(z),对总体参数作区间估计。24⑵给出概率保证程度,求估计区间①抽取样本,计算样本指标(样本平均数、样本方差、抽样平均误差);②根据给定的

,查表求出z;③求出抽样极限误差Δ()和估计区间的上、下限,对总体参数作区间估计。25区间估计注意首先确定被估计总体指标的种类,是平均数还是成数;其次确定抽样方法,是重置抽样还是不重置抽样;然后再根据给定的样本资料和抽样条件(给定概率保证程度还是给定抽样极限误差),确定计算步骤,进行计算。26例5.3

某学校进行一次英语测验,为了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下:试以95.45%的可靠性估计该校学生英语考试的平均成绩的范围及该校学生成绩在80分以上的学生所占的比重的范围。27解:(1)估计该校学生英语考试的平均成绩的范围:分析:考试成绩是平均数,应选用关于的抽样计算公式;资料没有给出总体单位数N,抽样方法应选用重置抽样。当资料中没有指出抽样方法,同时也没有给出总体单位数N时,默认为重置抽样。28①计算样本指标样本平均成绩样本标准差抽样平均误差29②根据给定的F(z),查表求zF(z)=95.45%查表z=2③求出抽样极限误差Δ和估计区间的上、下限

估计区间下限:76.6-2.2754=74.32估计区间上限:76.6+2.2754=78.8930以95.45%的概率保证程度估计该校学生考试平均成绩的区间范围是:74.32≤≤78.89(2)已知

,由31例5.4

某地区的电视台委托调查公司估计地区内居民平均每日的看电视时间。调查公司随机抽取了100名居民进行调查,样本数据显示平均每人每天看电视时间是4个小时。如果已知总体的标准差σ=1.5小时。试求:(1)该地区内居民每天看电视的平均时间的置信区间(置信度是95%);(2)如果要求估计的误差不超过27分钟,这时置信度是多少?32解:(1)已知=4小时,n=100,σ=1.5小时,F(z)=95%。这时查标准正态分布表,可得z=1.96,由抽样平均误差因此,以95%置信度,估计该地区内居民每天看电视的平均时间在3.706到4.294个小时之间。33(2)要求极限误差等于27分钟,即Δ=0.45小时。这时概率度:查概率表知这时的概率是99.73%34三、总体成数的区间估计表达式其中,为抽样极限误差35步骤⒈计算样本成数:

;计算抽样平均误差:重复抽样条件下不重复抽样条件下362.计算抽样极限误差:3.确定总体成数的置信区间:37接平均数区间估计的例子

(2)估计该校学生成绩在80分以上的学生所占的比重的范围分析:学生所占比重是成数,应选用关于P的抽样计算公式;抽样方法仍为重置抽样。38①计算样本指标样本成数:抽样平均误差:39②根据给定的F(z),查表求zF(z)=95.45%查表z=2③求出抽样极限误差Δ和估计区间的上、下限

估计区间下限:估计区间上限:40

以95.45%概率保证程度估计,该校学生成绩在80分以上的学生所占的比重的范围在:38.01%-57.99%之间。41【例5.5】某工厂有工人1000名,若规定工人日产量在118件以上者为完成生产定额任务,下表是抽样数据。要求在95﹪的概率保证程度下,估计该厂全部工人中完成定额的工人比重及完成定额的工人总数。42按日产量分组(件)组中值(件)工人数(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合计—100100名工人的日产量分组资料完成定额的人数43解:44则该企业全部工人中完成定额的工人比重及完成定额的工人总数的置信区间为:即该企业工人中完成定额的工人比重在0.8432至0.9568之间,完成定额的工人总数在843.2至956.8人之间,估计的可靠程度为95﹪。45总结

在简单抽样条件下进行区间估计的例题。从上面的解法中,我们可以总结出这一类计算题的基本做法:先计算出样本指标,然后根据所给条件(重置抽样或不重置抽样)进行抽样平均误差的计算,抽样极限误差的计算,最后根据样本指标和极限误差进行区间估计。46例5.6

从某年级学生中按简单随机抽样方式抽取40名学生,对公共理论课的考试成绩进行检查,得知其平均分数为78.56分,总体标准差为12.13分,试以95.45%的概率保证程度推断全年级学生考试成绩的区间范围。47解:n=40,=78.56,σ=12.13,z=248第三节样本容量的确定在前面讨论中我们都是假定样本容量n是已知的,但是在实际问题中,需要自己动手设计调查方案,这是如何决定样本容量就是很大的学问。如果n选的过大,会增加费用;如果n选的过小,会使估计误差增大。这个问题的关键是:第一,要求什么样的精度?即我们想构造多宽的区间。第二,对于我们的置信区间来说,想要多大的置信度?即我们想要多大的可靠称度?49(1)估计总体均值时,样本容量的确定在总体均值的区间估计时,置信区间是由下式确定的:

极限误差(允许误差),该式反映了之间的相互制约关系,其中三个确定后,另一个也就随之确定了。重置抽样50它们之间的关系如下:①总体方差越大,必要的样本容量n越大。②必要样本容量反比例于允许误差。③必要样本容量n与概率度z成正比。51不重置抽样抽

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论