![第8讲 第七章 参数估计_第1页](http://file4.renrendoc.com/view/fb93b6eedc2a8c38416c636a63760ab7/fb93b6eedc2a8c38416c636a63760ab71.gif)
![第8讲 第七章 参数估计_第2页](http://file4.renrendoc.com/view/fb93b6eedc2a8c38416c636a63760ab7/fb93b6eedc2a8c38416c636a63760ab72.gif)
![第8讲 第七章 参数估计_第3页](http://file4.renrendoc.com/view/fb93b6eedc2a8c38416c636a63760ab7/fb93b6eedc2a8c38416c636a63760ab73.gif)
![第8讲 第七章 参数估计_第4页](http://file4.renrendoc.com/view/fb93b6eedc2a8c38416c636a63760ab7/fb93b6eedc2a8c38416c636a63760ab74.gif)
![第8讲 第七章 参数估计_第5页](http://file4.renrendoc.com/view/fb93b6eedc2a8c38416c636a63760ab7/fb93b6eedc2a8c38416c636a63760ab75.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章参数估计第一节 参数的点估计第二节 估计量的评选标准第三节 区间估计第四节 正态总体均值与方差的区间估计第一节参数的点估计点估计概念求估计量的方法课堂练习小结
引言上一章,我们介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理.它们是进一步学习统计推断的基础.
总体样本统计量描述作出推断研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.随机抽样
现在我们来介绍一类重要的统计推断问题参数估计问题是利用从总体抽样得到的信息来估计总体的某些参数或者参数的某些函数.参数估计估计废品率估计新生儿的体重估计湖中鱼数……估计降雨量在参数估计问题中,假定总体分布形式已知,未知的仅仅是一个或几个参数.这类问题称为参数估计.参数估计问题的一般提法X1,X2,…,Xn要依据该样本对参数作出估计,或估计的某个已知函数.现从该总体抽样,得样本设有一个统计总体,总体的分布函数为F(x,),其中为未知参数(可以是向量).
参数估计点估计区间估计(假定身高服从正态分布)设这5个数是:1.651.671.681.781.69估计为1.68,这是点估计.这是区间估计.估计在区间[1.57,1.84]内,例如我们要估计某队男生的平均身高.现从该总体选取容量为5的样本,我们的任务是要根据选出的样本(5个数)求出总体均值的估计.而全部信息就由这5个数组成.一、点估计概念随机抽查100个婴儿,…得100个体重数据10,7,6,6.5,5,5.2,
…呢?据此,我们应如何估计和而全部信息就由这100个数组成.例1
已知某地区新生婴儿的体重,未知
为估计:我们需要构造出适当的样本的函数T(X1,X2,…Xn)
,每当有了样本,就代入该函数中算出一个值,用来作为的估计值.把样本值代入T(X1,X2,…Xn)
中,估计值
.T(X1,X2,…Xn)
称为参数的点估计量,得到
的一个点我们知道,若,由大数定律,自然想到把样本体重的平均值作为总体平均体重的一个估计.样本体重的平均值则.用样本体重的均值估计.类似地,用样本体重的方差估计.使用什么样的统计量去估计?可以用样本均值;也可以用样本中位数;还可以用别的统计量.问题是:二、寻求估计量的方法1.矩估计法2.极大似然法3.最小二乘法4.贝叶斯方法……这里我们主要介绍前面两种方法.1.矩估计法矩估计法是英国统计学家K.皮尔逊最早提出来的.由辛钦定理,若总体的数学期望有限,则有其中为连续函数.
这表明
,当样本容量很大时
,在统计上,可以用用样本矩去估计总体矩.这一事实导出矩估计法.定义用样本原点矩估计相应的总体原点矩,又用样本原点矩的连续函数估计相应的总体原点矩的连续函数,这种参数点估计法称为矩估计法
.理论依据:大数定律矩估计法的具体做法如下设总体的分布函数中含有k个未知参数,那么它的前k阶矩,一般都是这k个参数的函数,记为:i=1,2,…,k从这k个方程中解出j=1,2,…,kj=1,2,…,k那么用诸的估计量Ai分别代替上式中的诸,即可得诸的矩估计量:矩估计量的观察值称为矩估计值
.例2
设总体X在[a,b]上服从均匀分布,a,b未知.是来自X
的样本,试求a,b
的矩估计量.解
即
解得于是a,b的矩估计量为样本矩总体矩解
例3
设总体X的均值和方差都存在,未知.是来自X
的样本,试求的矩估计量.解得于是的矩估计量为样本矩总体矩
矩法的优点是简单易行,并不需要事先知道总体是什么分布.缺点是,当总体类型已知时,没有充分利用分布提供的信息.一般场合下,矩估计量不具有唯一性.其主要原因在于建立矩法方程时,选取那些总体矩用相应样本矩代替带有一定的随意性.
2.最大似然法它是在总体类型已知条件下使用的一种参数估计方法.它首先是由德国数学家高斯在1821年提出的.GaussFisher然而,这个方法通常归功于英国统计学家费歇尔.费歇尔在1922年重新发现了这一方法,并首先研究了这种方法的一些性质.最大似然法的基本思想先看一个简单例子:一只野兔从前方窜过.是谁打中的呢?某位同学与一位猎人一起外出打猎.如果要你推测,你会如何想呢?只听一声枪响,野兔应声倒下.你就会想,只发一枪便打中,猎人命中的概率一般大于这位同学命中的概率.看来这一枪是猎人射中的.这个例子所作的推断已经体现了极大似然法的基本思想.
最大似然估计原理:当给定样本X1,X2,…Xn时,定义似然函数为:设X1,X2,…Xn是取自总体X的一个样本,样本的联合密度(连续型)或联合分布律(离散型)为f(x1,x2,…,xn
;).f(x1,x2,…,xn;
)这里x1,x2,…,xn
是样本的观察值.似然函数:
最大似然估计法就是用使达到最大值的去估计.称为的最大似然估计值.看作参数的函数,它可作为将以多大可能产生样本值x1,x2,…,xn
的一种度量.
f(x1,x2,…,xn;)而相应的统计量称为的最大似然估计量.两点说明:
1、求似然函数L(
)
的最大值点,可以应用微积分中的技巧。由于ln(x)是
x的增函数,lnL()与L()在
的同一值处达到它的最大值,假定是一实数,且lnL()是的一个可微函数。通过求解方程:可以得到的MLE.若是向量,上述方程必须用方程组代替.
2、用上述求导方法求参数的MLE有时行不通,这时要用最大似然原则来求.L(p)=f(x1,x2,…,xn;p)下面举例说明如何求最大似然估计
例5
设X1,X2,…Xn是取自总体X~B(1,p)的一个样本,求参数p的最大似然估计量.解:似然函数为:对数似然函数为:即为p
的最大似然估计值
.对p求导并令其为0,=0得从而
p
的最大似然估计量为
(4)在最大值点的表达式中,用样本值代入就得参数的最大似然估计值
.求最大似然估计(MLE)的一般步骤是:
(1)由总体分布导出样本的联合分布率(或联合密度);
(3)求似然函数L()的最大值点(常常转化为求ln
L()的最大值点),即
的MLE;
(2)把样本联合分布率(或联合密度)中自变量看成已知常数,而把参数看作自变量,得到似然
函数L();
例6
设总体X~N(),未知.是来自X
的样本值,试求的最大似然估计量.似然函数为解X的概率密度为于是令解得的最大似然估计量为解:似然函数为例7
设X1,X2,…Xn是取自总体X的一个样本其中>0,求的最大似然估计.i=1,2,…,n对数似然函数为解:似然函数为i=1,2,…,n对分别求偏导并令其为0,=0(2)由(1)得=0
(1)对数似然函数为用求导方法无法最终确定用最大似然原则来求.对是故使达到最大的即的MLE于是
取其它值时,即为的MLE.且是的增函数第二次捕出的有记号的鱼数X是r.v,X具有超几何分布:为了估计湖中的鱼数N,第一次捕上r条鱼,做上记号后放回.隔一段时间后,再捕出S
条鱼
,结果发现这S条鱼中有k条标有记号.根据这个信息,如何估计湖中的鱼数呢?最后,我们用最大似然法估计湖中的鱼数应取使L(N;k)达到最大的N,作为N的极大似然估计.但用对N求导的方法相当困难,我们考虑比值:把上式右端看作N的函数,记作L(N;k).经过简单的计算知,这个比值大于或小于1,或而定.由经过简单的计算知,这个比值大于或小于1,或而定.由这就是说,当N增大时,序列P(X=k;N)先是上升而后下降;当N为小于的最大整数时,达到最大值.故N的极大似然估计为
例1
设总体X的概率密度为其中是未知参数,X1,X2,…,Xn
是取自X的样本,求参数
的矩估计.三、课堂练习
例1
设总体X的概率密度为其中是未知参数,X1,X2,…,Xn
是取自X的样本,求参数的矩估计.解
样本矩总体矩解得的矩估计量为故解由密度函数知例
2
设X1,X2,…Xn是取自总体X的一个样本其中>0,求的矩估计.具有均值为的指数分布即E(X-)=
D(X-)=
E(X)=
D(X)=故解得也就是
E(X)=
D(X)=的矩估计量为于是解似然函数为对数似然函数为例3设X1,X2,…Xn是取自总体X的一个样本求的最大似然估计值.其中
>0,求导并令其为0=0从中解得即为的最大似然估计值
.对数似然函数为这一节,我们介绍了参数点估计,给出了寻求估计量最常用的矩法和极大似然法.参数点估计是用一个确定的值去估计未知的参数.看来似乎精确,实际上把握不大.四、小结第二节估计量的评选标准无偏性有效性相合性小结样本均值是否是的一个好的估计量?(2)怎样决定一个估计量是否比另一个估计量“好”?样本方差是否是的一个好的估计量?这就需要讨论以下几个问题:(1)我们希望一个“好的”估计量具有什么特性?(3)如何求得合理的估计量?X~N()估计量的评选标准在介绍估计量的评选标准之前,我们必须强调指出:评价一个估计量的好坏,不能仅仅依据一次试验的结果,而必须由多次试验结果来衡量.这是因为估计量是样本的函数,是随机变量.因此,由不同的观测结果,就会求得不同的参数估计值.因此一个好的估计,应在多次试验中体现出优良性.
常用的几条标准是:1.无偏性2.有效性3.相合性这里我们重点介绍前面两个标准.估计量是随机变量,对于不同的样本值会得到不同的估计值.我们希望估计值在未知参数真值附近摆动,而它的期望值等于未知参数的真值.这就导致无偏性这个标准.一、无偏性则称为的无偏估计
.设是未知参数的估计量,若例如,用样本均值作为总体均值的估计时,虽无法说明一次估计所产生的偏差,但这种偏差随机地在0的周围波动,对同一统计问题大量重复使用不会产生系统偏差.无偏性是对估计量的一个常见而重要的要求.无偏性的实际意义是指没有系统性的偏差.例1
设总体X服从参数为的指数分布
,
其概率密度为为未知,X1,X2,…Xn是取自总体的一个样本,试证
和都是参数的无偏估计量
.证所以是参数的无偏估计量
.而具有概率密度故知即也是参数的无偏估计量
.所以无偏估计以方差小者为好,这就引进了有效性这一概念.的大小来决定二者谁更优.和一个参数往往有不止一个无偏估计,若和都是参数
的无偏估计量,我们可以比较由于二、有效性D()≤D()则称较有效.都是参数
的无偏估计量,若对任意,设和且至少对于某个上式中的不等号成立,故较有效.例2(续例1)
试证
当n>1时的无偏估计量较有效.证故有而故有当n>1时,三、相合性任意,当时依概率收敛于,则称为的相合估计量.设是参数
的估计量,若对于为的相合估计量对于任意,有由辛钦定理若总体的数学期望有限,则有其中为连续函数.故为的相合估计量.
若为连续函数,为的相合估计量.则有四、小结对于一个未知参数可以提出不同的估计量,因此自然提出比较估计量的好坏的问题,这就需要给出评定估计量好坏的标准.在本节中,介绍了评定估计量好坏的三个标准:无偏性、有效性、和相合性.第三节区间估计置信区间定义置信区间的求法单侧置信区间课堂练习小结
引言前面,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.区间估计正好弥补了点估计的这个缺陷.
譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的极大似然估计为1000条.若我们能给出一个区间,在此区间内我们合理地相信N的真值位于其中.这样对鱼数的估计就有把握多了.实际上,N的真值可能大于1000条,也可能小于1000条.也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.湖中鱼数的真值[]这里所说的“可靠程度”是用概率来度量的,称为置信度或置信水平.习惯上把置信水平记作,这里是一个很小的正数.例如,通常可取置信水平=0.95或0.9等.根据一个实际样本,由给定的置信水平,我小的区间,使们求出一个尽可能置信水平的大小是根据实际需要选定的.置信区间.称区间为
的置信水平为的一、置信区间定义满足设是一个待估参数,给定X1,X2,…Xn确定的两个统计量则称区间是的置信水平(置信度)为的置信区间.和分别称为置信下限和置信上限.若由样本这里有两个要求:可见,对参数作区间估计,就是要设法找出两个只依赖于样本的界限(构造统计量).一但有了样本,就把估计在区间内.可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.1.要求以很大的可能被包含在区间内,就是说,概率要尽可能大.即要求估计尽量可靠.
2.估计的精度要尽可能的高.如要求区间长度尽可能短,或能体现该要求的其它准则.在求置信区间时,要查表求分位点.二、置信区间的求法设,对随机变量X,称满足的点为X的概率分布的上分位点.定义若X为连续型随机变量,则有所求置信区间为所求置信区间为标准正态分布的上分位点分布的上分位数自由度为n的F分布的上分位数自由度为n1,n2的~N(0,1)选
的点估计为,求参数的置信度为的置信区间.
例1
设X1,…Xn是取自
的样本,明确问题,是求什么参数的置信区间?置信水平是多少?寻找未知参数的一个良好估计.解
寻找一个待估参数和统计量的函数,要求其分布为已知.有了分布,就可以求出U取值于任意区间的概率.对给定的置信水平查正态分布表得对于给定的置信水平,根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平.使为什么这样取?从中解得对给定的置信水平查正态分布表得使也可简记为于是所求的置信区间为从例1解题的过程,我们归纳出求置信区间的一般步骤如下:1.明确问题,是求什么参数的置信区间?置信水平
是多少?2.寻找参数的一个良好的点估计T(X1,X2,…Xn)
3.寻找一个待估参数和估计量T
的函数U(T,),且其分布为已知.
5.对“a<S(T,)<b”作等价变形,得到如下形式:即于是就是的100(
)%的置信区间.
4.对于给定的置信水平
,根据U(T,)的分布,确定常数a,b,使得P(a<U(T,)<b)=可见,确定区间估计很关键的是要寻找一个待估参数和估计量T的函数U(T,),且U(T,)的分布为已知,不依赖于任何未知参数.而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要.
需要指出的是,给定样本,给定置信水平,置信区间也不是唯一的.对同一个参数,我们可以构造许多置信区间.例如,设X1,…,Xn
是取自
的样本,求参数的置信水平为的置
~N(0,1)信区间.由标准正态分布表,对任意a、b,我们可以求得P(a<U<b).~N(0,1)例如,由P(-1.96≤U≤1.96)=0.95我们得到均值的置信水平为的置信区间为由P(-1.75≤U≤2.33)=0.95这个区间比前面一个要长一些.置信区间为我们得到均值的置信水平为的我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信区间.任意两个数a和b,只要它们的纵标包含f(u)下95%的面积,就确定一个95%的置信区间.在概率密度为单峰且对称的情形,当a=-b时求得的置信区间的长度为最短.a=-b即使在概率密度不对称的情形,如分布,F分布,习惯上仍取对称的分位点来计算未知参数的置信区间.我们可以得到未知参数的的任何置信水平小于1的置信区间,并且置信水平越高,相应的置信区间平均长度越长.也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差.这是一对矛盾.实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些.三、单侧置信区间上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向的界限.
例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了.这时,可将置信上限取为+∞,而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.于是引入单侧置信区间和置信限的定义:满足设是一个待估参数,给定若由样本X1,X2,…Xn确定的统计量则称区间是的置信水平为的单侧置信区间.定义称为的置信水平为的单侧置信下限.对于任意,满足若由样本X1,X2,…Xn确定的统计量则称区间是的置信水平为的单侧置信区间.称为的置信水平为的单侧置信上限.对于任意,设灯泡寿命服从正态分布.求灯泡寿命均值的置信水平为0.95的单侧置信下限.
例2
从一批灯泡中随机抽取5只作寿命试验,测得寿命X(单位:小时)如下:1050,1100,1120,1250,1280方差未知解的点估计取为样本均值,对给定的置信水平
,确定分位点使即于是得到的置信水平为的单侧置信区间为
将样本值代入得的置信水平为0.95的单侧置信下限是1065小时的置信水平为的单侧置信下限为即请自己画一张表,将各种情况下的区间估计加以总结.四、课堂练习随机地取炮弹10发做试验,得炮口速度的标准差,炮口速度服从正态分布.求这种炮弹的炮口速度的标准差的置信水平为0.95的置信区间.由解随机地取炮弹10发做试验,得炮口速度的标准差,炮口速度服从正态分布.求这种炮弹的炮口速度的标准差的置信水平为0.95的置信区间.于是得到的置信水平为的置信区间为这里可得到的置信水平为的置信区间为同学们可通过练习,掌握各种求未知参数的
置信区间的具体方法.这一节,我们介绍了区间估计.五、小结
第四节正态总体均值与方差的区间估计单个总体的情况两个总体的情况课堂练习小结一、单个总体的情况并设为来自总体的样本,分别为样本均值和样本方差.均值的置信区间为已知可得到的置信水平为的置信区间为或为未知可得到的置信水平为的置信区间为此分布不依赖于任何未知参数由或
例1
有一大批糖果.现从中随机地取16袋,称得重量(以克计)如下:506508499503504510497512514505493496506502509496设袋装糖果的重量近似地服从正态分布,试求总体均值的置信水平0.95为的置信区间.解这里于是得到的置信水平为的置信区间为即方差的置信区间由可得到的置信水平为的置信区间为由可得到标准差的置信水平为的置信区间为
例2
有一大批糖果.现从中随机地取16袋,称得重量(以克计)如下:506508499503504510497512514505493496506502509496设袋装糖果的重量近似地服从正态分布,试求总体标准差的置信水平0.95为的置信区间.解这里于是得到的置信水平为的置信区间为即二、两个总体的情况设已给定置信水平为,并设是来自第一个总体的样本,是来自第二个总体的样本,这两个样本相互独立.且设分别为第一、二个总体的样本均值,为第一、二个总体的样本方差
.两个总体均值差的置信区间为已知因为相互独立,所以相互独立.故或于是得到
的置信水平为的置信区间为为已知其中于是得到
的置信水平为的置信区间为其中例3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鲁教版地理七年级下册7.2《“鱼米之乡”-长江三角洲地区》听课评课记录1
- 华师大版数学九年级下册《圆的对称性》听评课记录
- 人教版数学七年级下册5.1《观察与思考 看图时的错觉》听评课记录
- 鲁人版道德与法治七年级下册第11课第2框《让友谊之树常青》听课评课记录1
- 【部编版】七年级历史上册 《动荡的春秋时期》公开课听课评课记录
- 冀教版数学八年级下册《函数的自变量取值范围》听评课记录3
- 一年级第一学期班级工作计划班级
- 小学生课外实践活动教学计划书
- 教科版道德与法治九年级上册第六课第一框《第一要义与核心》听课评课记录
- 形象代言人合同范本
- 建筑工地工人职业健康体检计划
- 河南省郑州市十校联考2024-2025学年高二上学期11月期中考试语文试题
- 音乐教学集训课程设计
- 妊娠期肝内胆汁淤积症临床诊治和管理指南(2024版)解读课件
- 肺切除手术的术前评估课件
- 招聘专职人员报名表
- 牛津上海版小学英语四年级下册(英语单词表)
- 《大学生创新与创业》课件
- 2024年体育赛事运动员赞助合同3篇
- 护士的护理职业生涯规划
- 2024年高考语文复习:古诗文阅读强化练习题汇编(含答案解析)
评论
0/150
提交评论