第6章参数估计ppt.ppt_第1页
第6章参数估计ppt.ppt_第2页
第6章参数估计ppt.ppt_第3页
第6章参数估计ppt.ppt_第4页
第6章参数估计ppt.ppt_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 参数估计,点估计 估计量的评选标准 区间估计,统计推断就是利用样本资料所提供的信息,对总体作出尽可能精确和可靠的结论.,由于样本带有随机性,这种推断一般总含有一定程度的不确定性,而所出现的不确定性可以用概率的大小来衡量.于是,统计推断总伴有一定的概率出现.,统计推断,参数估计,假设检验,点估计,区间估计,本章介绍,第七章介绍,1 点估计,一 参数估计的方式,参数估计就是根据样本所提供的信息,对总体分布中的未知参数进行估计,以及讨论如何建立一些准则对所做出的估计的好坏进行评价.,参数估计,点估计,区间估计,矩估计法,最大似然估计法,,最小二乘法,顺序统计量估计,判决函数法,单侧置信区间,

2、双侧置信区间,作为 的估计量.若当样本取得观察值 时,,称 为 的估计值.,点估计,设总体分布函数为 ,其中 为待估参数,由总体 的样本 构造一个适当的统计量,区间估计,称这样的估计方法为点估计.,由总体 的样本 构造两个统计量,使得 以较大概率被随机区间 所覆盖,称该区间为 的置信区间.,称这样的估计方法为区间估计.,二 矩估计,基本思想 就是把样本矩作为相应的总体矩的估计量,设 是来自总体 的一个样本,总体 的前k阶原点矩存 在,如果待估参数恰为k个,记为 ,用样本的 i 阶原点矩 去估计 ,即,由,解方程组,称 为 的矩估计量,称该方法为矩估计法.,由于总体k阶中心矩可化为总体原点矩的函

3、数,从而矩估计法也可以用样本的k阶中心矩作为总体k阶中心矩的矩估计量. 如例2(3),例1 某灯泡厂某天生产了一大批灯泡,从中抽取了10个进行寿命实验,得数据如下(单位:h),1050 1100 1080 1120 1200 1250 1040 1130 1300 1200,问该天生产的灯泡的平均寿命大约是多少?,解 计算出,以此作为总体期望值 的估计值,即,例2 设 为总体 的样本,分别求下列分布中参数的矩估计.,(1) 服从泊松分布 ;,(2) 服从指数分布 ;,(3) 服从正态分布 .,解 (1),故,(2),从而,(3) 服从正态分布 .,解 (3),二阶中心矩,其中,例3 设 服从

4、上的均匀分布, 是来自 的样本, 是未知参数,求的矩估计 .,解,从而,其中,解之得,若该例中, 为未知参数 ,则 的矩估计怎么求?,矩估计的优点是简便易于计算,但其应用前提为总体矩一定要存在.而有些分布,如柯西(Cauchy)分布,其各阶原点矩均不存在,从而不能用矩估计法.另外,矩估计量可能不唯一,如泊松(Poisson)分布中其期望和方差均为 ,因而 及 都可作为 的矩估计量,这在应用中是不利的.,三 最大似然估计,首先看如下的例子,一袋中有黑白两种形状相同的球,其球数之比为1:10,但不知哪种球数多,现从袋中随机摸出一球,发现是白球,显然认为白球比黑球多是合理的.,上述例子中有一个共同规

5、律,即从样本获得最大概率的参数值作为未知参数的估计值.这就是最大似然估计的基本思想.,一个老猎人带领一个新手进山打猎,遇见一只飞奔的野兔,他们各发一弹,野兔被打中了,但身上只有一个弹孔,谁打中的可能性大呢?恐怕绝大多数人认为是老猎人打中的.,为 的似然函数,记为,(1)设总体 为连续型随机变量,其密度函数,其中 为未知参数, 为 的样本, 为样本的观察值,称,若随机变量只有一个未知参数 ,则其似然函数为,形式已知,的联合概率密度,若 为离散型随机变量,其分布律,形式已知,则,的联合分布律称为,的似然函数,记为,以后似然函数简记为,(2)若存在一组 ,使得,则称 是 的最大似然估计值,因为 与

6、在同一 处取得极值,故,由似然方程组,求得,用最大似然估计方法得到的 的估计值 是,的函数,,故写成,当 作为 的最大似然估计量时,应写作,为总体的一组样本观测值,求 的最大似然估计量.,例4 设总体 服从泊松分布 ,其分布律,解,似然函数为,解似然方程,得,所以 的最大似然估计量为,例5 设是 来自参数为 的指数分布的总体 , 的概率密度函数为,其中 (未知),求 的最大似然估计量.,解,似然函数为,得 的最大似然估计量为,由,例6 设总体 是来自 的一个样本值,求 的最大似然估计量.,解,似然函数为,故 的最大似然估计量为,解似然方程为,例7 设总体 服从区间 上的均匀分布, 是来自总体

7、的样本值,求参数 的最大似然估计量.,解,似然函数为,其中 ,,显然,不能通过求偏导数获得最大似然估计量,但 为单调递减函数,可见其在 处取得极大值, 故 .其估计量为,最大似然估计法的优点是充分利用了总体分布所提供的信息,因此有许多优良性质.此外,最大似然估计还具有下述性质:,通过上述例题,我们看到:有时最大似然估计不能由解似然方程得到,有时似然方程的解也不一定使似然函数极大等等.但最大似然估计法仍不失为一种最重要和最好的方法之一,如果总体分布的具体形式给定,我们通常总是要先求其最大似然估计.,当 是参数 的最大似然估计,并且函数 有单值反函数 时, 是 的极大似然估计.,2 估计量的评选标

8、准,从上节介绍的内容可以看出,对于同一个未知参数使用不同的方法估计,可得出不同的估计量.,如:当 时,未知参数 的矩估计量是 ,而 的最大似然估计是,问题,(1)对于同一个参数究竟采用哪一个估计量好?,(2)评价估计量的标准是什么?,这是因为估计量是样本的函数, 是随机变量 . 因此,由不同的观测结果,就会求得不同的参数估计值. 因此一个好的估计,应在多次试验中体现出优良性 .,常用的几条标准是:,这里我们重点介绍前面两个标准 .,无偏性(无系统偏差 ) 有效性(最小方差性 ) 相合性(一致性),一 无偏性,估计量是随机变量,对于不同的样本值会得到不同的估计值 . 我们希望估计值在未知参数真值

9、附近摆动,而它的期望值等于未知参数的真值. 这就导致无偏性这个标准 .,设 为来自总体 的样本,,是未知参数 的估计量,若,则称 为 的无偏估计 .,例1 设 是来自数学期望为 的总体 ,,判断下列统计量是否为 的无偏估计.,解,故它是 的无偏估计;,故它是 的无偏估计.,故它不是 的无偏估计.,例2 设 是来自数学期望为 ,方差为,的总体 ,则样本均值 是 的无,偏估计,样本方差 是 的无偏估计.,解,由于,故 是 的无偏估计.,而,故 是 的无偏估计.,由此可见:样本的二阶中心矩不是总体二阶矩的无偏估计.,例3 设总体 的数学期望 存在,,证明: 不是 的无偏估计.,证明 因为,所以 不是

10、 的无偏估计.,从上例中,可以看出:如果 是 的无偏估计,除了 是 的线性函数外,一般 不是 的无偏估计,此外,由例1可以看出无偏估计可以有很多个,因此单从无偏性去评价估计量的好坏是不够的.衡量两个无偏估计更好的标准是看一看它们谁的波动性最小,即谁的方差最小,这就是下面介绍的有效性.,则称 较 有效,,二 有效性,设 为来自总体 的样本,,是参数 的两个无偏估计,若有关系式,和,若在 的一切无偏估计中 均有最小,,则称 为 的有效估计.,例4 设 是来自数学期望为 ,方差为,的总体 ,下列三个估计量哪个比较有效?,解 因为,所以, ,均为 的无偏估计.,又因为,其中 最小,所 以比 , 有效,

11、,是三个估计量中最有效的一个.,三 相合性,设 为未知参数 的一列估计量,,若对任意的 ,均有,称 是 的相合估计(或一致估计).,相合性是对一个估计量的基本要求,不具备相合性的估计量是不予以考虑的.,3 区间估计,前面我们讨论了参数的点估计,这一估计方法是用一个统计量 作为未知参数 的估计,一旦给定了样本观测值就能算出 的估计值.在使用中较为直观,也较为方便.,但是点估计也有明显的缺点,就是没有提供关于估计精度的任何信息.,为了解决上面的问题,我们常需要估计出未知参数的一个可能范围,这个范围在数轴上就是一个区间,我们希望给出两个区间端点(都是随机变量),用此两端点所构成的区间(是随机区间)来

12、估计参数 ,使这个随机区间以比较大的概率套住 的真值,这就是区间估计的问题.,设总体分布中含有一个未知参数 ,由样本,确定的两个统计量 及,,对于给定的 ,满足,称随机区间 为 的置信水平为 的置信区间.,分别称为置信下限和置信上限, 称为置信水平.,若 越小, 就越大, 覆盖住 的可能性就越大.同时,,区间 的长度就越大,区间过大,区间估计没意义了.,正确提法 :在给定的较大的置信水平 下,使 平均长度最小的区间估计为最好的区间估计.,一 单个正态总体的置信区间,1. 单个正态总体均值 的置信区间,设总体 , 为 的样本,给定,置信水平为 , 分别为样本均值和样本方差.,由 是 的一个无偏估

13、计,又由第二章知,1 已知,由正态分布表可知,对给定的 ,一定存在一个值 ,使,即 的分布不依赖于任何未知参数,有,这样,我们就得到了关于 的一个置信水平为 的置信区间,2 未知,方差未知时,考虑能否用 的无偏估计,来代替参数 ,由第五章定理四知,因而对给定的置信水平 ,可由 分布表查出,分位数 的数值,根据分位数的定义可知,于是关于 的一个置信水平为 的置信区间为,即,例1 某工厂生产滚珠,从某日生产的产品中随机抽取9个,测得直径(单位:mm)如下,14.6 14.7 15.1 14.9 14.8 15.0 15.1 15.2 14.8,设滚珠直径服从正态分布,若,(1) 已知滚珠直径的标准

14、差 ;,(2) 未知标准差,求直径均值的置信水平为0.95的置信区间.,解,由题可知,(1),计算得 ,,从而关于 的一个置信水平为0.95的置信区间为,(2),关于 的一个置信水平为0.95的置信区间为,2. 单个正态总体方差 的置信区间( 未知),设样本 来自正态总体,均未知,由于样本方差 是 的无偏估计,随机变量,,由,可得 的置信水平为 的,置信区间为,例2 设灯泡厂生产的一大批灯泡的寿命 服从正态分布,其中 未知,今随机的抽取16只灯泡进行,寿命试验,测得寿命数据如下(单位:h),1502 1480 1485 1511 1514 1527 1603 1480 1532 1508 14

15、90 1470 1520 1505 1485 1540,求灯泡寿命方差 的置信水平为0.95的置信区间.,解,的置信水平为0.95的置信区间为,分别为总体 和 的样本方差.,和 分别为总体 的样本.,二 两正态总体均值及方差的置信区间,1. 两个总体均值差 的置信区间,设正态总体 与 相互独立,,分别为总体 和 的样本均值,,构造总体均值差 的区间估计.,1 均为已知,因为,所以,统计量,得 关于的置信水平为 的置信区间为,*,2 ,但 未知,由 * 式得,用 的无偏估计,代替,得 关于的置信水平为 的置信区间为,未知,从而,例3 有二个建筑工程队,第一对有10人,平均每人每月完成50m2的住

16、房建筑任务,标准差S1=6.7m2;第二对有12人,平均每人每月完成43m2的住房建筑任务,标准差S2=5.9m2.试求 的置信水平为0.95的置信区间.,解,设两个总体相互独立且服从正态分布.因为 ,,查 分布表得,所以关于 的置信水平为0.95的置信区间为,相互独立, 均未知,2. 两个总体方差比 的置信区间,分别为总体 和 的样本方差.,和 分别为总体 的样本.,设正态总体 与,分别为总体 和 的样本均值,,构造总体方差比 的区间估计.,由第五章定理七知,的分布已知且其中不含任何未知参数,由,得 关于的置信水平为 的置信区间为,例4 某自动机床加工同类套筒,假设套筒的直径服从正态分布,现

17、从两个不同班次A班和B班的产品中各抽取5个套筒,测得它们的直径(单位:cm)分别为,A班:2.066,2.063,2.068,2.060,2.067 B班:2.058,2.057,2.063,2.059,2.060,试求两班所加工的套筒直径的方差比 的置信水平为0.90的置信区间.,解,查表得,于是,得 的置信水平为0.90的置信区间为,三 单侧置信区间,在上述讨论中,对于未知参数 ,我们给出两个统计量 , ,得到 的双侧置信区间 ,而在一些实际问题中,我们只关心置信上限或下限,例如,对于元件、设备的寿命问题,希望平均寿命越长越好,而不能过短,所以我们关注的是平均寿命的下限,此时置信区间可采用 的形式,与之相反,对产品的次品率等问题,我们关注的是它的上限,置信区间可设为 的形式,这就引出了单侧置信区间的概念.,设总体分布中含有一个未知参数 ,由样本,确定的两个统计量 及,,对于给定的 ,满足,称随机区间 为 的置信水平为 的置信区间.,分别称为置信下限和置信上限, 称为置信水平.,若 越小, 就越大, 覆盖住 的可能性就越大.同时,,区间 的长度就越大,区间过大,区间估计没意义了.,正确提法 :在给定的较大的置信水平 下,使 平均长度最小的区间估计为最好的区间估计.,设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论