概率论与数理统计置信区间.ppt_第1页
概率论与数理统计置信区间.ppt_第2页
概率论与数理统计置信区间.ppt_第3页
概率论与数理统计置信区间.ppt_第4页
概率论与数理统计置信区间.ppt_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、解(1) 样本的似然函数为,当0 0,X1, X2, , Xn 是取自总体X的一组样本,求 的极大似然估计量与矩估计量.,其中 0为未知参数,例 设总体 X 的密度为,故有对数似然函数:,对 求导并令其为 0 可得似然方程:,= 0 ,解得极大似然估计量:,令,(2),解得矩估计量:,而区间估计正好弥补了点估计的这个缺陷.,无偏性 有效性 一致性, 估计量的期望值等于未知参数的真值.,为了使估计的结论更可信, 需要引入区间估计.,评选标准, 方差更小的无偏估计量., 样本 k 阶原点矩是总体 k 阶原点矩 的无偏估计量 ;, 样本方差 S 2 是总体方差 2 的无偏估计量 ;, 无偏估计量的函

2、数未必是无偏估计量, 在 的所有线性无偏估计量中, 样本均值 X 是最有效的.,参数的点估计是用样本算得的一个值去估计未知参数. 使用起来把握不大.,点估计值仅仅是未知参数的一个近似值, 它没有反映出这个近似值的误差范围.,若我们根据一个实际样本得到鱼数 N 的极大似然估计为 1000 条.,一个可以想到的估计办法是:若我们能给 出一个区间,并告诉人们该区间包含未知参数 N的可靠度 (也称置信系数).,但实际上, N 的真值可能大于 1000 条, 也可能小于1000条.,7.3 单个正态总体均值与方差的置信区间,也就是说,给出一个区间,使我们能以一定的可靠度相信区间包含参数 。,湖中鱼数的真

3、值, ,这里所说的“可靠程度”是用概率来度量的, 称为置信概率,置信度或置信水平.,习惯上把置信水平记作 1- ,这里 是一个很小的正数.,譬如,在估计湖中鱼数的问题中,根据置信水平1- , 可以找到一个正数 ,例如, 通常可取置信水平 = 0.95 或 0.9 等等.,根据一个实际样本, 由给定的置信水平1- , 我们求出一个的区间 , 使,置信水平的大小是根据实际需要选定的.,如何寻找这种区间?,使得, 我们选取未知参数的某个估计量 , 只要知道 的概率分布就可以确定 .,下面我们就来正式给出置信区间的定义, 并通过例子说明求置信区间的方法.,由不等式,可以解出 :,这个不等式就是我们所求

4、的置信区间,代入样本值所得的普通区间称为置信区间的实现.,1) 为两个统计量(由样本完全确定的已知函数);,X1, X2, , Xn 是取自总体 X 的样本,对给定值 0 1,满足,定义4 设 是总体 X 的待估参数,分别称为置信下限和置信上限.,一、 置信区间的概念,则称随机区间,为 的置信水平为 1- 的双侧置信区间 .,若统计量,和,置信度 置信概率,2) 是随机区间,并非一个实现以 1- 的概率覆盖了,要求置信区间的长度尽可能短.,估计的可靠度:, 即 P( )= 1- 要尽可能大. ,可靠度与精度是一对矛盾, 一般是在保证可靠度的条件下尽可能提高精度.,估计的精度:,即要求区间置信的

5、长度尽可能短, 或能体现该要求的其它准则.,要求 以很大的可能被包含在置信区间内 .,要求估计尽量可靠.,置信水平的概率意义: 置信水平为 0.95 是指 100 组样本值所得置信区间的实现中,约有95个能覆盖 ,而不是一个实现以 0.95 的概率覆盖了 .,估计要尽量可靠,估计的精度要尽可能的高:, 只要知道 的概率分布就可以确定 .,如何根据实际样本, 由给定的置信水平1- , 求出一个区间 , 使,根据置信水平1- , 可以找到一个正数 ,二、置信区间的求法,(一) 单个正态总体,1. 均值 ,(1) 已知方差 2,1. 均值 1- 2,(1) 已知方差12,22,(二) 两个正态总体,

6、2. 方差 2,(2) 未知方差 2,使得, 我们选取未知参数的某个估计量 ,由不等式,可以解出 :,这个不等式就是我们所求的置信区间,分布的分位数,(1) 已知均值 ,(2) 未知均值 ,(2) 未知方差12,22,2. 方差 12/22,(1) 已知均值 1, 2,(2) 未知均值 1, 2,但相等!,对于给定的置信水平, 根据估计量U 的分布, 确定 一个区间, 使得 U 取值于该区间的概率为置信水平., X , S 2 分别是其样本均值和样本方差, X N( , 2/n),求参数 、 2 的置信水平为1- 的置信区间.,设 X1, , Xn 是总体 X N( , 2)的样本, 确定未知

7、参数的 估计量及其函数的分布,是 的无偏估计量, 由分布求分位数 ,即得置信区间,(一) 单个正态总体置信区间的求法,(1)已知方差 2 时, 故可用 X 作为 EX 的一个估计量, N(0, 1),对给定的置信度 1- ,按标准正态分布的双侧 分位数的定义,查正态分布表可得 u / 2 , 由u / 2确 定置信区间,有了分布就可求出U 取值于任意区间的概率,简记为,由抽样分布定理知,1. 均值 的置信区间,是求什么参数的置信区间?,置信水平 1- 是多少?, 1. 寻找未知参数 的一个良好的点估计量 (X1, X2, , Xn );, 确定待估参数估计量函数 U( ) 的分布 ;,求置信区

8、间首先要明确问题:,2. 对于给定的置信水平 1- , 由概率, ( , ) 就是 的 100(1- ) 的置信区间. ,一般步骤如下:, 3. 由分位数|U| x 确定置信区间 ( , ). ,查表求出分布的分位数 x ,总体分布的形式是否已知,是怎样的类型,至关重要.,某乡农民在联产承包责任制前人均纯收入 X(单位:元),求 的置信水平为 0. 95 的置信区间.,推行联产承包责任制后, 在该乡抽得 n =16 的样本,且 X N ( , 252).,解 由于 =0.05 ,查正态分布表得,例1, 得 x =325元,假设 2 = 25 2 没有变化,即得置信区间 ( 312. 75 ,

9、337. 25 ).,同一置信水平下的置信区间不唯一,如在上例中取 = 0. 01 + 0. 04 ,由正态分布上侧分位数定义知,查表知,u0. 025 = 1. 96 ,当然区间长度越短的估计, 精度就越高.,其长度也不相等.,区间长度为 24. 25,长度为 25. 5,谁是精度最高的?,由于标准正态分布密度函数的图形是单峰且对称的,在保持面积不变的条件下, 以对称区间的长度为最短 ! !,但 的长度是最短的,l 与 n , 的关系:,可知,置信区间的长度 l 为:,由置信区间公式,l 随着 的减小而增大;,20 若给定 , l 随着 n 的增大而减小;,同一置信水平下的置信区间不唯一.,

10、其长度也不相等.,故我们总取它作为置信水平为 1- 的置信区间.,若给定 n ,且由于 l 与 成反比,减小的速度并不快,例如, n 由 100 增至 400 时,l 才能减小一半.,则 u / 2 越大, l 就越大,这时 就越小.,10,(u / 2)就越大,一般地, 在概率密度为单峰且对称的情形下, a =-b 对应的置信区间的长度为最短.,例2: 某厂生产的零件长度 X 服从 N( , 0.04),现从该厂生产的零件中随机抽取6个,长度测量值如下(单位:毫米): 14.6, 15.l, 14.9, 14.8, 15.2, 15.1. 求: 的置信系数为0.95的区间估计。,解:n =

11、6, = 0.05,z/2 = z0.025 = 1.96,2=0.22 .,所求置信区间为,故不能采用已知方差的均值估计方法,由于 与 有关,但其解决的思路一致.,由于 S 2是 2 的无偏估计量,查 t 分布表确定上侧 /2 分位数,令,T =,(2) 未知方差, 用 分布的分位数求 的置信区间.,故可用 S 替代 的估计量:,S, t(n-1),即为 的置信度为 1- 的区间估计., 2 时,由抽样分布定理知, 实用价值更大 !,t / 2(n -1),测定总体服从正态分布,求总体均值 的置信水平为 0. 95 的置信区间.,解 由于 /2 =0. 025 ,查 t 分布表得,例3 为确

12、定某种溶液中甲醛浓度, 且其 4 个独立测量值的平均值 x = 8. 34%,样本标准差 s= 0. 03%,即得置信区间,自由度 n-1= 3,t 0. 025 = 3. 182, 将 x = 8. 34 % 代入 得,(2) 未知时,所以 2的置信水平为1- 的区间估计为,因为 2 的无偏估计为 S 2 ,2. 方差 2 的,置信区间的求法,由抽样分布定理知, 2 =,由 确定 2 分布的上侧 /2 分位数,找一个含 与S, 但不含 , 且分布已知的统计量,为了计算简单,在概率密度不对称的情形下,如 2 分布,F 分布,习惯上仍取对称的分位点来计算未知参数的置信区间.,并不是最短的置信区间

13、, /2, /2,测定总体服从正态分布,求总体均值 的置信水平为 0. 95 的置信区间.,解 由于 /2 =0. 025 ,查 2 分布表得,例4 为确定某种溶液中甲醛浓度, 且其 4 个独立测量值的平均值 x = 8. 34%,样本标准差 s= 0. 03%,故 2 的置信区间为,自由度 n-1= 3,得,将 s 2 = 0. 0009代入,求总体方差 2和标准差 的置信水平为 0. 95 的置信区间.,故 的置信区间为,在实际应用中,经常会遇到两个正态总体的区间估计问题。,于是,评价新技术的效果问题,就归结为研究两个正态总体均值之差 1-2 的问题。,例如:考察一项新技术对提高产品的某项

14、质量指标的作用,将实施新技术前的产品质量指标看成正态总体 N(1, 12),实施新技术后产品质量指标看成正态总体 N(2, 22)。,设 X1, , Xm分别是总体 X N( 1 ,12)的样本, Y1, , Yn分别是总体 Y N( 2 ,22)的样本, X , Y 分别是总体 X 和 Y 的样本均值,求参数 1- 2 和 12/22 的置信水平为 1- 的置信区间., 由于X , Y 分别是1, 2 的无偏估计量,即得置信区间,(二) 两个正态总体,(1)已知方差12,22 时, 故可用 X -Y 作为 1- 2 的一个估计量, N(0, 1),对给定的置信度 1- ,查正态分布表可得 u

15、 / 2 ,由抽样分布定理知,1. 均值 1- 2 的置信区间,SX2 , SY2分别是总体 X 和 Y 的样本方差,置信区间的求法,设 X1, , Xm分别是总体 X N( 1 ,12)的样本, Y1, , Yn分别是总体 Y N( 2 ,22)的样本, X , Y 分别是总体 X 和 Y 的样本均值,求参数 1- 2 和 12/22 的置信水平为 1- 的置信区间.,即得置信区间,(二) 两个正态总体置信区间的求法,(2)未知方差12,22 , 但 12 = 22 = 2时, 仍用 X - Y 作为 1- 2 的一个估计量, t(n+m-2),对给定的置信度 1- ,查 t 分布表可得,由

16、抽样分布定理知,1. 均值差 1- 2 的置信区间,SX2 , SY2分别是总体 X 和 Y 的样本方差,t / 2(n+m-2),例5:某公司利用两条自动化流水线灌装矿泉水。设这两条流水线所装矿泉水的体积 (单位:毫升) XN(1, 2) 和 YN(2, 2)。现从生产线上分别抽取 X1, X2, X12 和 Y1, Y2, , Y17,样本均值与样本方差分别为:,求 1- 2 的置信系数为0.95的区间估计。,解:m=12, n=17, = 0.05,且,查 t 分布表,得 tm+n-2( /2) = t27(0.025)=2.05. 因此,置信度为 1- 的置信区间:,例6 (比较棉花品

17、种的优劣):假设用甲、乙两种棉花纺出的棉纱强度分别为 XN(1, 2.182)和Y N(2, 1.762)。试验者从这两种棉纱中分别抽取样本 X1, X2 , X200 和 Y1, Y2, , Y100,样本均值分别为:,求 1-2 的置信系数为 0.95 的区间估计。,解: 1=2.18, 2=1.76, m=200, n=100, =0.05, 1- 2 的置信系数为 1- 的置信区间为:,设同上,求参数 12/22 的置信水平为 1- 的置信区间.,即得12/22 的置信区间,(二) 两个正态总体置信区间的求法,(2)未知 1 , 2 时, F(m-1, n-1),对给定的置信度 1-

18、,查 F 分布表可得上侧分位数,由抽样分布定理知,2. 方差比 12/22 的置信区间,F / 2(m-1, n-1), F1- / 2(m-1, n-1),求两总体方差比12/22 的置信水平为 0. 90 的置信区间.,称重后所的样本方差分别为 sx2= 0.0125, sy2= 0. 01,假定所装番茄酱的重量 X 与 Y 分别服从正态分布N( 1 ,12)和 N( 2 ,22),解 由于 /2 =0. 05 ,查 F 分布表得,例7 某厂用两条流水线生产番茄酱小包装,现从两条流水线上各随机抽取样本容量分别为 m=6 , n=7 的样本,将条件代入得 12/22 的置信区间为 ( 0. 2847 , 6. 1875 ).,自由度 m-1=5, n-1= 6,主要根据 抽样分布Th,(二)两个总体, 由 的概率分布和置信水平 1- , 确定其相应的分位数 x /2 ;,小结正态总体置信区间的求法,(一)单个总体,均值 ,已知方差 2,均值差 1- 2,已知方差12,22,方差 2,未知方差 2,解得所求的置信区间, 根据未知参数的无偏估计量, 确定其某个估计量 ;, 由不等式,已知均值 ,未知均值 ,未知方差12,22,方差比12/22,已知均值 1,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论