数理统计课件:区间估计的基本概念_第1页
数理统计课件:区间估计的基本概念_第2页
数理统计课件:区间估计的基本概念_第3页
数理统计课件:区间估计的基本概念_第4页
数理统计课件:区间估计的基本概念_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

区间估计的基本概念可靠度:越大越好

估计你的年龄八成在21—28岁之间区间:越小越好被估参数可靠度范围、区间4.1.1参数的区间估计问题引例:在估计湖中鱼数的问题中,若根据一个实际样本,得到鱼数n

的极大似然估计为1000条.实际上,n

的真实值可能大于1000条,也可能小于1000条.为此,希望确定一个区间来估计参数n.a

使我们能以比较高的可靠程度相信它包含参数真值.湖中鱼数的真值[]这里所说的“可靠程度”是用概率来度量的b

区间估计的精度要高.定义4.1.1:设是一个参数分布族,

其中Θ为参数空间,g(

)是定义在Θ上的一个已知函数,

X1,X2,…,Xn

是从分布族中的某总体f(x,

)中抽取的样本.

是定义在样本空间χ上的函数,且满足则称随机区间为g(

)的一个区间估计.令4.1.2区间估计的定义根据这个定义,从形式上看,任何一个满足条件既然一个未知参数的区间估计有很多种,如何从中挑选一个好的区间估计?的统计量和都可以构成g(

)的一个区间估计解决办法:就需要给出刻画区间估计优劣的准则和标准.评价标准:可靠度与精度(精确度).1可靠度要求g(

)以很大的可能被包含在区间内,就是说,概率要尽可能大.2精度估计的精度要尽可能的高.如:要求随机区间的平均长度越短越好.即要求估计尽量可靠.Neyman提出的妥协方案在保证可靠度的前提下,选择精度尽可能高的区间估计.如果在应用中要求可靠度和精度都很高,则必须加大样本容量,即多做一些实验,才可能实现.如何构造可靠度和精度尽可能高的区间估计?对于一个区间估计来说,当样本容量固定的时候,提高可靠度就要降低精度,提高精度就得降低可靠度.为该区间估计的置信水平或置信度.不失一般性,我们假设待估参数就是

本身,即g(

)

=

.定义4.1.2:设随机区间是参数

的一个区间估计,称包含

的概率(1)这个概率与

有关.(2)若对参数空间Θ中任一

,其置信水平都很大,

则这个区间估计就是一个好的区间估计.定义4.1.3:设随机区间是参数

的一个区间估计,置信水平在参数空间Θ上的下确界称为该区间估计的置信系数.一个区间估计的置信水平越大越好.为了计算置信水平和置信系数,需要利用统计量的精确分布或者渐近分布.精度的标准不止一个.只介绍最常见的,随机区间的平均长度越短越好这一标准,即下面的这个例子说明了精度,置信水平(置信度)及其它们的关系.越小越好用来构造参数μ的区间估计.试分析这个区间估计的置信水平和估计精度之间的关系.令=(μ,σ2),上述区间估计的置信水平为解:为什么用这个区间?例4.1.1设X1,X2,…,Xn是来自正态总体N(μ,σ2),其中-∞<μ<∞,σ2>0,

μ

和σ2的估计量分别是样本均值和样本方差.显然,k越大,置信水平越大,区间估计越可靠.下面考虑区间的平均长度其中其分布与参数

无关.因此,区间估计的置信水平为显然,k越大,区间平均长度越长,精度越低.k越大,区间的置信水平越大,区间越可靠.由于,因此区间估计的平均长度为由此例可以看出:在样本容量n给定后,为了提高置信水平,需要增加k值,从而增加了区间长度,降低了精度.置信水平与精度相互制约着.著名统计学家Neyman提出了妥协方案:保证置信水平达到指定要求的前提下,尽可能提高精度.由此引入置信区间的概念.通常置信区间也称为Neyman置信区间定义4.1.4:设随机区间是参数

的一个区间估计,对给定0<α<1,如果对任意

Θ,都有成立,则称是参数

的置信水平为1-α的置信区间.

称为相应的置信系数.1.对于样本(X1,X2

,…,Xn)

置信水平不小于1-α,但是在实际问题中我们常常要求取满足.随机区间的置信区间.说明:2.对于样本观察值(x1,x2

,…,xn)常数区间只有两个结果,包含θ

和不包含θ.此时,不能说:没有随机变量,自然不能谈概率说明:

和都是随机变量的函数,因而也是随机变量.但是给定样本观察值

就得到一个具体的闭区间,我们以1-α的概率保证未知参数在得到的100个区间中包含参数

真值的平均有95个左右,不包含参数

真值的平均有5个左右.如:取1−

=0.95.若重复抽样100次,样本观察值为对应的常数区间为3.区间估计有时用开区间或半开半闭区间,但从置信水平角度考虑,这几种区间估计没有本质的区别.说明:4.实际应用中,经常取α

为0.01,0.05,0.1等.在一些实际问题中,有时候感兴趣的仅仅是未知参数的置信上限或者置信下限.例如:一种新材料的强度,关心的是它最低不少于多少;一个工厂的废品率,关心它最高不超过多少.这些也是区间估计,称为置信上限或者置信下限.定义如下:定义4.1.5:设总体X的分布为f(x,θ),其中θ为未知参数,θ∈Θ,Θ为参数空间,X1,X2,…,Xn是来自总体X的一个样本,给定0<α<1,对于任意θ∈Θ,存在统计量

使得存在统计量

使得则称随机区间是θ的置信水平为1−α的单侧置信区间.称为置信水平为1−α的为单侧置信下限.则称随机区间是θ的置信水平为1−α的单侧置信区间.称为置信水平为1−α的为单侧置信上限.分别称为置信上限下限的置信系数越大,则置信下限的精度越高.

对置信上限而言,若越小,则置信上限的精度越高.单侧置信上、下限都是置信区间的特例.因此,寻求置信区间的方法可以用来求置信上、下限.单侧置信限与双侧置信区间之间存在一个简单的联系.对置信下限而言,若引理4.1.1设和分别是参数

的置信水平为1-α1和1-α2的单侧置信下限和单侧置信上限,且对任何样本X1,X2,…,Xn,都有则是参数

的置信水平为

1-(α1+α2)的置信区间.在引理的假定下,下列三个事件互不相容,“三个事件之并”为“必然事件”.证明:考虑因此引理4.1.1说明:在有了单侧置信上、下限后,不难求得置信区间.定义4.1.6:设有一个参数分布族,Θ是参数空间,其中.X1,X2,…,Xn是来自分布族中某总体f(x,

)的样本.若统计量S(X1,X2,…,Xn

)满足(1)对任一样本X1,X2,…,Xn

X,S(X1,X2,…,Xn

)是Θ的一个子集;(2)对给定的0<α<1,则称S(X1,X2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论