第7章 参数估计_第1页
第7章 参数估计_第2页
第7章 参数估计_第3页
第7章 参数估计_第4页
第7章 参数估计_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

若对参数一无所知用参数估计的方法处理若对参数有所了解但有怀疑猜测需要证实之时用假设检验的方法来处理机动目录上页下页返回结束1第一节点估计第二节估计量优劣的评价标准第三节区间估计第七章参数估计ParameterEstimation

机动目录上页下页返回结束2这类问题称为参数估计.参数估计问题的一般提法X1,X2,…,Xn要依据该样本对参数作出估计,或估计的某个已知函数

.现从该总体抽样,得样本设有一个统计总体,总体的分布函数为F(x,),其中

为未知参数

(可以是向量).

机动目录上页下页返回结束3参数的估计点估计:估计未知参数的值区间估计:估计未知参数的取值范围,使得这个范围包含未知参数真值的概率为给定的值.机动目录上页下页返回结束4(假定身高服从正态分布)设这5个数是:1.651.671.681.781.69估计为1.68,这是点估计.这是区间估计.估计在区间[1.57,1.84]内,例如我们要估计某队男生的平均身高.现从该总体选取容量为5的样本,我们的任务是要根据选出的样本(5个数)求出总体均值的估计.而全部信息就由这5个数组成.机动目录上页下页返回结束5一点估计的概念二矩估计法三最大似然估计法第一节点估计PointEstimation

机动目录上页下页返回结束6定义1

总体X的未知参数θ的点估计指的是一个数,此数可以作为θ的真值的近似.Pointestimate

通常的做法是构造适当的统计量用其测值作为θ的点估计.所选用的统计量称为θ的(点)估计量相应地,也称为θ的(点)估计值.有时,(点)估计量、(点)估计值统称为(点)估计,并简记为一点估计的概念estimator

常用的点估计法:矩估计法,(最)极大似然估计法机动目录上页下页返回结束7二矩估计法用样本矩代替相应总体矩得到估计的方法称为矩估计法,简称矩法Momentestimation

用矩法得到的估计称为矩估计Momentestimate用“总体矩等于样本矩”列出矩方程(组),做法:解之即得矩估计.机动目录上页下页返回结束8矩估计的步骤:

关键点:1、把待估参数与总体矩联系起来

2、用样本矩代替相应的总体矩即可机动目录上页下页返回结束设总体的分布函数中含有k个未知参数

它的前k阶矩,Step1

把待估参数和总体矩联系起来9机动目录上页下页返回结束这是包含k个未知参数的联立方程从而形式地解出所谓“形式地”解出是指:由于其中的具体值未知,仍未得到具体值点的估计。10机动目录上页下页返回结束Step2

将上式中的总体矩用样本矩代替其中可通过采样取得具体值,因而未知参数也可以有具体的估计结果。11例1

设总体X在区间(a,b)上服从均匀分布(a,b未知).X1,X2,

…,Xn是样本,试求a,

b的矩估计量.解

因为X~U(a,b),所以机动目录上页下页返回结束解出a,b12令机动目录上页下页返回结束以代替13例2

设总体求(未知).的矩估计量.解

因为解之得的矩估计量分别为

()存在,总有机动目录上页下页返回结束注无论总体分布如何,只要总体期望()、方差14机动目录上页下页返回结束

矩法的优点是简单易行,并不需要事先知道总体是什么分布.缺点是,当总体类型已知时,没有充分利用分布提供的信息.一般场合下,矩估计量不具有唯一性.其主要原因在于建立矩法方程时,选取那些总体矩用相应样本矩代替带有一定的随意性.如果是θ的矩估计,则是的矩估计15三最大似然估计法18211922FisherGauss引例袋中有10只黑白两色球,比例为9﹕1,希望知道是黑球多还是白球多(即黑球所占比例p是

90%还是10%).有放回地抽取两球,结果发现两次都是黑球,由此可推测黑球所占比例p为90%.思想方法:一次试验就出现的事件有较大的概率。机动目录上页下页返回结束16最大似然法的基本思想先看一个简单例子:一只野兔从前方窜过.是谁打中的呢?某位同学与一位猎人一起外出打猎.如果要你推测,只听一声枪响,野兔应声倒下.你会如何想呢?机动目录上页下页返回结束17你就会想,只发一枪便打中,猎人命中的概率一般大于这位同学命中的概率.看来这一枪是猎人射中的.这个例子所作的推断已经体现了最大似然法的基本思想.机动目录上页下页返回结束设总体中含有待估参数,它可以取得很多值,我们要在一切可能取值中,选出一个样本观察值出现的概率为最大的做为的估计并称为的最大似然估计。18利用“最大似然原理”获得的估计称为最大似然估计.MLE

最大似然法具体说来,设总体X的pdf

为——样本,——样本值Likelihoodfunction

——似然函数最大似然估计量最大似然估计值这种通过求似然函数的最大值点去求点估计的方法称为最大似然估计法Maximumlikelihoodestimation概率函数机动目录上页下页返回结束19求MLE的一般思路

设总体X的pdf

为概率函数写出似然函数(参数的函数)——对数似然函数Log-likelihoodfunction

取对数——似然方程令——最大似然估计量最大似然估计值相应地,解似然方程并将改记为得机动目录上页下页返回结束20解最大似然估计量.例3

设总体(未知).求的似然函数令解得故最大似然估计量分别为机动目录上页下页返回结束21L(p)解似然函数为

例4

设总体X~b(1,p),求p的最大似然估计量.令=0得

p的最大似然估计值故p的最大似然估计量为机动目录上页下页返回结束22解:机动目录上页下页返回结束例5

设某电子元件的寿命T服从参数为的指数分布今测得10个元件的失效时间为

求的最大似然估计量.23机动目录上页下页返回结束24分布形式已知这是因为,满足似然方程只是最大似然估计的一个必要条件.但这种验证在很多情况下是很难、甚至是不可能的.使用最大似然法的前提条件如果是θ的最大似然估计。则是的最大似然估计最大似然估计并不一定都通过求导数求得原则上还应验证似然方程的解确实使似然函数达到最大机动目录上页下页返回结束25例6:设X1,…,Xn为取自

U(0,)

总体的样本,>0未知,求参数

的矩估计量和极大似然估计量。解:矩估计法机动目录上页下页返回结束极大似然估计由似然估计可知,要使L最大,就要使尽可能地小,但又不能小于26一无偏性二有效性三相合性第二节估计量优劣的评价标准机动目录上页下页返回结束27定义1

设是的估计量.一无偏性若对任意的,有则称

是的无偏估计,否则称为有偏估计.Unbiased机动目录上页下页返回结束无偏性的直观意义:一个较好的估计量应在参数的真值周围摆动,所取的平均值要等于本身。28例1

样本均值是总体均值的无偏估计,样本方差是总体方差的无偏估计,有偏机动目录上页下页返回结束29例2

设总体X服从参数为θ的指数分布,θ>0未知,

证明nZ=

n[min(X1,X2,…,Xn)]是θ的无偏估计.

证明

X的pdf、cdf分别为=θFmin(z)=1[1

F(z)]n

机动目录上页下页返回结束30且至少有一个

使得上述不等号严格成立,则称若对任意的,二有效性是θ的两个无偏估计,定义2

设Effective

比有效.机动目录上页下页返回结束引例

都是总体均值的无偏估计.31三相合性

相合性是对估计量的一个最基本要求.

如果在样本量不断增大时,估计量都不能把被估参数估计到任意指定的精度,那么这个估计是不可取的.证明相合性除了利用依概率收敛的定义外,可利用大数定律.Consistent

对任意ε>0,有相合估计,若机动目录上页下页返回结束定义3

称为未知参数的32矩法得出的估计一般都具有相合性.样本均值是总体均值的相合估计.

样本方差和样本二阶中心矩是总体方差样本标准差是总体标准差的相合估计.

的相合估计.机动目录上页下页返回结束33一置信水平与置信区间二置信区间的构造三单个正态总体参数的区间估计四两个正态总体参数的区间估计五大样本区间估计六单侧置信区间第三节区间估计机动目录上页下页返回结束34

引言

前面,我们讨论了参数点估计.它是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用起来把握不大.区间估计正好弥补了点估计的这个缺陷.机动目录上页下页返回结束35

譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的极大似然估计为1000条.

实际上,N的真值可能大于1000条,也可能小于1000条.

若我们能给出一个区间,在此区间内我们合理地相信N的真值位于其中.这样对鱼数的估计就有把握多了.机动目录上页下页返回结束36也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.湖中鱼数的真值[]这里所说的“可靠程度”是用概率来度量的,称为置信度或置信水平.

习惯上把置信水平记作,这里是一个

很小的正数.机动目录上页下页返回结束37置信水平的大小是根据实际需要选定的.置信区间.置信水平为的称区间为的例如,通常可取置信水平=0.95或0.9等.根据一个实际样本,由给定的置信水平,我们求出一个尽可能小的区间,使机动目录上页下页返回结束38则称(随机)区间为θ的置信水平(或置信度)为1-

的置信区间.所谓区间估计就是找两个统计量T1

、T2,以它们为端点构造区间(T1,T2),一旦有了样本,就把θ的真值估计在此区间内.定义1

设是总体参数,对于给定的(0<<1),若有两个统计量使得对任意的,

IntervalestimationConfidencelevelConfidenceinterval,CI

分别称为(双侧)置信下限和置信上限一置信水平与置信区间机动目录上页下页返回结束39置信区间及置信水平的解释机动目录上页下页返回结束

95%置信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个置信区间,平均有95个置信区间包括总体参数(估计正确),只有5个置信区间不包括(估计错误)。或对于某一个区间而言,它包含总体的可能性为95%,而不包含的可能性仅为5%。因此在实际应用中,以这种方法估计总体参数犯错误的概率仅为5%。40置信区间具有两个要素

(1)准确度(accuracy)(置信度),反映区间估计的可靠程度,即置信区间包含待估参数的概率的大小,一般而言概率越大越好。

(2)精密度(precision),反映区间的长度,区间的长度越短,估计的精密度越好,反之越差。当n确定时,上述两者互相矛盾。当置信度增大时,区间长度也增大,精度减小;当置信度减小时,区间长度缩短,精度增高。原则:先保证置信度,在此前提下尽量提高精度。机动目录上页下页返回结束41

引例

设X~N(,

2)(

2

已知),求的1-CI.应该以很高的概率1-被区间盖住:分析二置信区间的构造——枢轴变量法—的好的点估计,真实参数离之不远.

而/2/21-故即这样,μ的1-αCI为

机动目录上页下页返回结束42/2/21-为什么这样取?置信区间不唯一,习惯上两边均分α(分布对称时,区间的长度达到最短,精度最高;分布不对称时,精度不算最高,但计算方便).机动目录上页下页返回结束43机动目录上页下页返回结束取=0.05~N(0,1)44在概率密度为单峰且对称的情形,当a=-b时求得的置信区间的长度为最短.a=-b机动目录上页下页返回结束45

即使在概率密度不对称的情形,如分布,F分布,习惯上仍取对称的分位点来计算未知参数的置信区间.机动目录上页下页返回结束46Step1

选θ的一个“好”的点估计T

;构造置信区间的方法——枢轴变量法Step2

找T

和θ

的函数W,其分布F已知且与θ无关;Step3

对于给定的置信水平1,取分布F的/2分位点wα/2和1-/2分位点w1-α/2,使得P{wα/2<W<w1-α/2}=1Step4

将不等式wα/2<W<w1-α/2改写成即为θ

的1CI——枢轴变量W机动目录上页下页返回结束47参数条件枢轴变量及其分布置信区间(CI)

2

已知

2

未知

2

未知三单个正态总体参数的区间估计总体X~N(,

2),样本,置信水平1机动目录上页下页返回结束48例1

用天平秤某物重量9次,得均值(克),解该物体平均重量的1-αCI为求该物体平均重量的0.95CI.已知天平秤量结果为正态分布,其标准差为0.1克.注意到1-α=0.95,查表知z0.975=1.96.从而该物体平均重量的0.95CI为(15.3347,15.4653)或机动目录上页下页返回结束49例2

假设轮胎的寿命服从正态分布.为估计某种轮胎的平均寿命,现随机地抽12只轮胎试用,测得它们的寿命(单位:万公里)如下:

4.684.854.324.854.615.025.204.604.584.724.384.70求平均寿命的0.95CI.

平均寿命的0.95CI为机动目录上页下页返回结束50现从该厂生产的零件中抽取9个,测得其重量为代入数值得的0.95CI为(0.1218,0.3454).

45.345.445.145.345.545.745.445.345.6试求总体标准差的0.95CI.2的1-αCI为例3

某厂生产的零件重量服从正态分布N(,2),

的1-αCI为机动目录上页下页返回结束51且两样本独立是来自X的样本是来自Y的样本四两个正态总体参数的区间估计置信水平1机动目录上页下页返回结束参数条件枢轴变量及其分布置信区间

已知

未知

2

2

未知52例4

甲、乙两台机床加工同种零件,从甲机床处随机取9个,从乙处随机取7个零件测得其样本均值分别为=19.8mm,=23.5mm.又知甲机床的零件长度X~N(1,0.34),乙机床的零件长度Y~N(2,0.36),求1-2的99%CI.(-4.47,-2.93)

机动目录上页下页返回结束53

例5

为提高某化学生产过程的得率,试图采用一种新的催化剂.为慎重起见,在实验工厂先进行试验.采用原来的催化剂进行了8次试验,得率均值为91.73,样本方差为3.89;采用新的催化剂进行了8次试验,得率均值为93.75,样本方差为4.02.假设两总体服从正态分布,且方差相等.求两总体均值差1-2的0.95CI.机动目录上页下页返回结束54(0.222,3.601)

例6A、B两位化验员独立地对某种聚合物的含氯量用相同的方法各做了10次测定,其测定值的方差分别为设分别是A、B两位化验员测量数据总体的的方差,且总体服从正态分布,求的0.95CI.机动目录上页下页返回结束55五大样本区间估计对于离散型随机变量来说,枢轴变量法不易使用,不仅由于枢轴变量大多不存在,即使存在,由于其分布为离散型,对于给定的置信水平,一般也不一定存在确切的分位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论