概率论与数理统计浙大四版 第七章 第七章3讲2_第1页
概率论与数理统计浙大四版 第七章 第七章3讲2_第2页
概率论与数理统计浙大四版 第七章 第七章3讲2_第3页
概率论与数理统计浙大四版 第七章 第七章3讲2_第4页
概率论与数理统计浙大四版 第七章 第七章3讲2_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四节 区间估计区间估计 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计. 它它是用样本算得的一个值去估计未知参数是用样本算得的一个值去估计未知参数. 但是,点估计值仅仅是未知参数的一个但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误近似值,它没有反映出这个近似值的误差范围,使用起来把握不大差范围,使用起来把握不大. 区间估计区间估计正好弥补了点估计的这个缺陷正好弥补了点估计的这个缺陷 .求置信区间的一般步骤求置信区间的一般步骤:1. 明确问题明确问题, 是求什么参数的置信区间是求什么参数的置信区间? 置信水平置信水平 是多少是多少? 12. 寻找参数寻找参

2、数 的一个良好的点估计的一个良好的点估计t (x1,x2,xn) 称称s(t, )为为枢轴量枢轴量. 3. 寻找一个待估参数寻找一个待估参数 和估计量和估计量t的函数的函数 s(t, ),且其分布为已知且其分布为已知. 4. 对于给定的置信水平对于给定的置信水平 ,根据,根据s(t, )的分布,确定常数的分布,确定常数a, b,使得,使得 1 1 p(a s(t, )b)= 5. 对对“as(t, )b”作等价变形作等价变形,得到如下得到如下形式形式: 121p,21 1 则则 就是就是 的的100( )的置信区间的置信区间. 可见,确定区间估计很关键的是要寻找可见,确定区间估计很关键的是要寻

3、找一个待估参数一个待估参数 和估计量和估计量t 的函数的函数s(t, ), 且且s(t, )的分布为已知的分布为已知, 不依赖于任何未知不依赖于任何未知参数参数 (这样我们才能确定一个大概率区间这样我们才能确定一个大概率区间).而这与总体分布有关,所以,而这与总体分布有关,所以,总体分布的总体分布的形式是否已知,是怎样的类型,至关重要形式是否已知,是怎样的类型,至关重要. 这里,我们主要讨论总体分布为这里,我们主要讨论总体分布为正态正态的情形的情形. 若样本容量很大,即使总体分布若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近未知,应用中心极限定理,可得总体的近似分布,于是也可

4、以近似求得参数的区间似分布,于是也可以近似求得参数的区间估计估计.主要讨论以下几种情形:主要讨论以下几种情形:单个正态总体均值单个正态总体均值 和方差和方差 的区间估计的区间估计. 2 两个正态总体均值差两个正态总体均值差 和方差比和方差比 的区间估计的区间估计.21 2221 书末附有书末附有 分布、分布、t 分布、分布、f分布的上侧分布的上侧分位数表,供使用分位数表,供使用. 需要注意的事项在教需要注意的事项在教材上有说明材上有说明.2 至于如何由标准正态分布函数表查表至于如何由标准正态分布函数表查表求得分位数,若你对分布函数定义熟悉的求得分位数,若你对分布函数定义熟悉的话,这个问题不难解

5、决话,这个问题不难解决.在求置信区间时,要查表求分位数在求置信区间时,要查表求分位数.,),( , ,12221本方差本方差分别是样本均值和样分别是样本均值和样的样本的样本总体总体为为并设并设设给定置信水平为设给定置信水平为sxnxxxn 一、单个总体 的情况 ,)1(2为已知为已知 由例由例1可知可知: 1 的置信区间的置信区间的一个置信水平为的一个置信水平为 .2/ znx 的置信区间的置信区间均值均值 1. 包糖机某日开工包了包糖机某日开工包了1212包糖包糖, ,称得质量称得质量( (单单位位: :克克) )分别为分别为506,500,495,488,504,486,505,506,5

6、00,495,488,504,486,505,513,521,520,512,485. 513,521,520,512,485. 假设重量服从正态分布假设重量服从正态分布, ,解解,12,10 n ,92.502 x计算得计算得,10. 0)1(时时当当 05. 02/ zz 查表得查表得0.05). 0.10 ( 1 10, 和和分别取分别取置信区间置信区间的的试求糖包的平均质量试求糖包的平均质量且标准差为且标准差为.新建文件夹新建文件夹42-1.ppt42-1.ppt2-12-1,95. 021 ,645. 1例例2 2/ znx645. 1121092.502 ,67.507 2/ zn

7、x645. 1121092.502 ,17.498 90% 的置信区间为的置信区间为的置信度为的置信度为即即 ).67.507,17.498(,05. 0)2(时时当当 ,975. 021 025. 02/zz 95%的置信区间为的置信区间为的置信度为的置信度为同理可得同理可得 ).58.508,26.497(.,1 ;,1 ,置信区间也较小置信区间也较小较小时较小时当置信度当置信度置信区间也较大置信区间也较大较大时较大时当置信度当置信度从此例可以看出从此例可以看出 附表附表2-22-2,96. 1查表得查表得 ,)2(2为未知为未知 , , 2/直接使用此区间直接使用此区间不能不能中含有未知

8、参数中含有未知参数由于区间由于区间 znx , , 222 替换替换可用可用的无偏估计的无偏估计是是但因为但因为sss 1 的置信区间的置信区间的置信度为的置信度为 .)1(2/ ntnsx 推导过程如下推导过程如下:,1)1()1( 2/2/ ntnsxntnsxp即即 1 的置信区间的置信区间的置信度为的置信度为于是得于是得 .)1(2/ ntnsx ),1(/ ntnsx 又根据第六章定理三知又根据第六章定理三知 ,1)1(/)1( 2/2/ ntnsxntp则则解解 有一大批糖果有一大批糖果,现从中随机地取现从中随机地取16袋袋, 称得重称得重量量(克克)如下如下: 496509502

9、506496493505514512497510504503499508506设袋装糖果的重量服从正态分布设袋装糖果的重量服从正态分布, 试求总体均值试求总体均值,151 0.05, n : )1( 分布表可知分布表可知查查 nt )15(025. 0t,2022. 6,75.503 sx计算得计算得 . 0.95 的置信区间的置信区间的置信度为的置信度为 附表附表3-13-1,1315. 2例例3 5%9 的置信区间的置信区间的置信度为的置信度为得得 1315. 2162022. 675.503).1 .507, 4 .500(即即就是说估计袋装糖果重量的均值在就是说估计袋装糖果重量的均值在

10、500.4克与克与507.1克之间克之间, 这个估计的可信程度为这个估计的可信程度为95%. ).( 61. 621315. 2162022. 6 克克其误差不大于其误差不大于 , 的近似值的近似值为为若依此区间内任一值作若依此区间内任一值作 这个误差的可信度为这个误差的可信度为95%.推导过程如下推导过程如下: , 22的无偏估计的无偏估计是是因为因为 s),1()1(222 nsn 根据第六章第二节定理二知根据第六章第二节定理二知 1 2的置信区间的置信区间的置信度为的置信度为方差方差 .)1()1(,)1()1(22/1222/2 nsnnsn . ,未知的情况未知的情况只介绍只介绍根据

11、实际需要根据实际需要 . 22的置信区间方差 1 2的置信区间的置信区间的置信度为的置信度为于是得方差于是得方差 ,1)1()1()1( 22/2222/1 nsnnp则则 ,1)1()1()1()1( 22/12222/2 nsnnsnp即即 .)1()1(,)1()1(22/1222/2 nsnnsn 1 的置信区间的置信区间的一个置信度为的一个置信度为标准差标准差 .)1(1,)1(122/122/ nsnnsn 进一步可得进一步可得:注意注意: 在密度函数不对称时在密度函数不对称时, , 2分布分布分布和分布和如如f 习惯上仍取对称的分位点来习惯上仍取对称的分位点来确定置信区间确定置信

12、区间(如图如图). (续例续例2) 求例求例2 2中总体标准差中总体标准差 的置信度为的置信度为0.950.95的置信区间的置信区间. .解解,151 0.975,21 0.025,2 n : )1( 2分布表可知分布表可知查查 n )15(2025. 0 ,2022. 6 s计算得计算得 )15(2975. 0 代入公式得标准差的置信区间代入公式得标准差的置信区间).60. 9,58. 4(附表附表4-14-1 ,488.27,262. 6附表附表4-24-2例例4 需要指出的是,给定样本,给定置信水需要指出的是,给定样本,给定置信水平,平,置信区间也置信区间也不是唯一不是唯一的的. .对同

13、一个参数,我们可以构造许多置信区间对同一个参数,我们可以构造许多置信区间. .n(0, 1)nxu 取枢轴量取枢轴量由标准正态分布表,对任意由标准正态分布表,对任意a、b,我们可我们可以求得以求得p( aub) .,2已知 例如,设例如,设x1,xn是取自是取自 的样本,的样本, ),(2 n求参数求参数 的置信水平为的置信水平为 的的 1置信区间置信区间.n(0, 1)nxu 例如,由例如,由p(-1.96u1.96)=0.95)(ufu96. 196. 195. 0我们得到我们得到 均值均值 的置信水平为的置信水平为 1的的置信区间为置信区间为96. 1,96. 1nxnx 由由 p(-1

14、.75u2.33)=0.95这个区间比前面一个要长一些这个区间比前面一个要长一些. .置信区间为置信区间为33. 2,75. 1nxnx 我们得到我们得到 均值均值 的置信水平为的置信水平为 1的的)(ufu33. 275. 1我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短. .类似地,我们可得到若干个不同的置信类似地,我们可得到若干个不同的置信区间区间. . 任意两个数任意两个数a和和b,只要它们的纵标包含,只要它们的纵标包含f(u)下下95%的面积,就确定一个的面积,就确定一个95%的置信的置信区间区间. .0buuu)(ufaaabb950.950.950.在概率密度为单峰且对

15、称的情形,当在概率密度为单峰且对称的情形,当a =-b时时求得的置信区间的长度为最短求得的置信区间的长度为最短. .0buuu)(ufaaabb950.950.950.a =-b 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布分布,f分布分布,习惯上仍取对称的分位点来,习惯上仍取对称的分位点来计算未知参数的置信区间计算未知参数的置信区间. .2 我们可以得到未知参数的的任何我们可以得到未知参数的的任何置信水置信水平小于平小于1的的置信区间,并且置信区间,并且置信水平越高,置信水平越高,相应的相应的置信区间置信区间平均长度平均长度越长越长. .)(22n)(221n)(xfx

16、)(2nx 也就是说,要想得到的区间估计可靠也就是说,要想得到的区间估计可靠度高,区间长度就长,估计的精度就差度高,区间长度就长,估计的精度就差. .这是一对矛盾这是一对矛盾. . 实用中应在保证足够可靠的前提下,实用中应在保证足够可靠的前提下,尽量使得区间的长度短一些尽量使得区间的长度短一些 .休息片刻继续休息片刻继续二、两个总体 的情况., , ,),(,),( , ,122212222121121的样本方差的样本方差分别是第一、二个总体分别是第一、二个总体总体的样本均值总体的样本均值分别是第一、二个分别是第一、二个的样本的样本个总体个总体为第二为第二的样本的样本第一个总体第一个总体为为并

17、设并设设给定置信度为设给定置信度为ssyxnyyynxxxnn 讨论两个总体均值差和方差比的估计问题讨论两个总体均值差和方差比的估计问题.均为已知均为已知和和2221)1( 1 21的置信区间的置信区间的一个置信度为的一个置信度为 .2221212/ nnzyx , , , 21的无偏估计的无偏估计分别是分别是因为因为 yx推导过程如下推导过程如下: , 21的无偏估计的无偏估计是是所以所以 yx 21的置信区间的置信区间两个总体均值差两个总体均值差 1. , 的独立性及的独立性及由由yx,1211 nnx ,2222 nny , 22212121 nnnyx 可知可知 ,1, 0 22212

18、121nnnyx 或或 1 21的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 .2221212/ nnzyx ,)2(2221均为未知均为未知和和 ),50(21则有则有即可即可实用上实用上都很大都很大和和只要只要 nn 1 21的近似置信区间的近似置信区间的一个置信度为的一个置信度为 .2221212/ nsnszyx , ,)3(222221为未知为未知但但 1 21的置信区间的置信区间的一个置信度为的一个置信度为 .11)2(21212/ nnsnntyxw .,2)1()1( 2212222112wwwssnnsnsns 其中其中例例5为比较为比较, 两种型号步枪子弹的

19、枪口速度两种型号步枪子弹的枪口速度,随机地取随机地取型子弹型子弹10发发, 得到枪口速度的平均值为得到枪口速度的平均值为),s/m(5001 x),s/m(10. 1 1 s标准差标准差随机地取随机地取型子弹型子弹20发发, 得枪口速度平均值为得枪口速度平均值为),s/m(4962 x),s/m(20. 1 2 s标准差标准差假设两总体都可认为近似假设两总体都可认为近似地服从正态分布地服从正态分布,且由生产过程可认为它们的方差且由生产过程可认为它们的方差相等相等, 求两总体均值差求两总体均值差 .950 21的置的置的置信度为的置信度为 信区间信区间.解解 由题意由题意, 两总体样本独立且方差

20、相等两总体样本独立且方差相等(但未知但未知), 0.025,2 ,20,1021 nn,28221 nn : )1( 分布表可知分布表可知查查 nt,0484. 2)28(025. 0 t,2820. 11910. 19 222 ws,1688. 12 wwss .950 21的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 201101)28(025. 021tsxxw),93. 04( ).93. 4,07. 3( 即所求置信区间为即所求置信区间为 . , 21为未知的情况为未知的情况仅讨论总体均值仅讨论总体均值 1 2221的置信区间的置信区间的一个置信度为的一个置信度为 .

21、)1, 1(1,)1, 1(1212/12221212/2221 nnfssnnfss推导过程如下推导过程如下: ),1()1( 1221211 nsn 由于由于 ),1()1(2222222 nsn 2221的置信区间的置信区间两个总体方差比两个总体方差比 2. , )1( )1( 2222221211相互独立相互独立与与且由假设知且由假设知 snsn 根据根据f分布的定义分布的定义, 知知 ),1, 1(2122222121 nnfss 22222121 ss即即 )1()1()1()1(222222121211 nsnnsn ),1, 1(21 nnf,1 )1, 1()1, 1(212

22、/22222121212/1 nnfssnnfp ,1)1, 1(1)1, 1(1212/122212221212/2221 nnfssnnfssp 1 2221的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 .)1, 1(1,)1, 1(1212/12221212/2221 nnfssnnfss 解解,181 n,132 n例例6 研究由机器研究由机器 a 和机器和机器 b 生产的钢管内径生产的钢管内径, 随随机抽取机器机抽取机器 a 生产的管子生产的管子 18 只只, 测得样本方差为测得样本方差为均未知均未知, 求方差比求方差比 .900 的置的置的置信度为的置信度为区间区间

23、.设两样本相互独设两样本相互独);mm(34. 0 221 s).mm(29. 0 222 s抽取机器抽取机器b生产的管子生产的管子 13 只只, 测测得样本方差为得样本方差为立立,且设由机器且设由机器 a 和机器和机器 b 生产的钢管内径分别服生产的钢管内径分别服从正态分布从正态分布),(),(222211 nn)2 , 1(,2 iii 2221 信信,10. 0 ),mm(34. 0 221 s),mm(29. 0 222 s,59. 2)12,17()1, 1(05. 0212/ fnnf )12,17()12,17(95. 02/1ff ,38. 21)17,12(105. 0 f

24、.900 2221的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 38. 229. 034. 0,59. 2129. 034. 0 .79. 2,45. 0 解解, 91 n, 62 n,02. 0 例例7甲、乙两台机床加工同一种零件甲、乙两台机床加工同一种零件, 在机床甲在机床甲加工的零件中抽取加工的零件中抽取9个样品个样品, 在机床乙加工的零件在机床乙加工的零件信区间信区间. 假定测量值都服从正态分布假定测量值都服从正态分布, 方差分别为方差分别为的置的置在置信度在置信度,245. 0 21 s,357. 0 22 s由所给数据算得由所给数据算得0.98下下, 试求这两台机床

25、加工精度之比试求这两台机床加工精度之比.,2221 21 中抽取中抽取6个样品个样品,并分别测得它们的长度并分别测得它们的长度(单位单位:mm), 3 .10)5, 8()1, 1(99. 0212/1 fnnf )5, 8()5, 8(01. 02/ff ,63. 61)8, 5(199. 0 f .980 21的置信区间的置信区间的一个置信度为的一个置信度为于是得于是得 )1, 1(1,)1, 1(1212/12221212/2221 nnfssnnfss 357. 063. 6245. 0,3 .10357. 0245. 0 .133. 2,258. 0 一个正态总体未知参数的置信区间一

26、个正态总体未知参数的置信区间待估参数待估参数随机变量随机变量随机变量随机变量的分布的分布双侧置信区间的上、下限双侧置信区间的上、下限 2 已知已知2 未知未知2 已已知知 未知未知 nx/ nsx/ niix1221 niixx1221 10,n 1 nt n2 12 n nzx 2 nsntx 12 nxnxniinii211221222 11211221222 nxxnxxniinii 两个正态总体未知参数的置信区间(一)两个正态总体未知参数的置信区间(一)待估参数待估参数随机变量随机变量随机变量随机变量的分布的分布双侧置信区间的上、下限双侧置信区间的上、下限21 均已知均已知、222 但

27、未知但未知2221 nmyx222121 nmsyxw1121 10,n 2 nmt nmzyx22212 nmsnmtyxw1122 21122212 nmsnsmsw其中其中两个正态总体未知参数的置信区间(二)两个正态总体未知参数的置信区间(二)待估待估参数参数随机变量随机变量随机变量随机变量的分布的分布 双侧置信区间的上、下限双侧置信区间的上、下限2221 njjmiiymxn1222212121/ nmf, , njjmiiymxnnmf12212121 均已知均已知、21 均未知均未知、21 njjmiiymxnnmf122121121 ,22222121 ss),11( nmf ,

28、22211112ssnmf 222111112ssnmf , 三、单侧置信区间三、单侧置信区间 上述置信区间中置信限都是双侧的,但上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在对于有些实际问题,人们关心的只是参数在一个方向的界限一个方向的界限. 例如对于设备、元件的使用寿命来说,平均例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了寿命过长没什么问题,过短就有问题了. 这时,可将置信上限取这时,可将置信上限取为为+,而只着眼于置信下,而只着眼于置信下限,这样求得的置信区间限,这样求得的置信区间叫单侧置信区间叫单侧置信区间.于是引入单侧置信区间和置

29、信限的定义:于是引入单侧置信区间和置信限的定义: 11p),(2111nxxx 满足满足设设 是是 一个待估参数,给定一个待估参数,给定, 0 若由样本若由样本x1,x2,xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间. ),1 11 称为单侧置信下限称为单侧置信下限.),(2122nxxx 又若统计量又若统计量 满足满足 12p2 则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间. ,(2 1 称为单侧置信上限称为单侧置信上限.单个单个正态总体均值与方差的单侧置信区间正态总体均值与方差的单侧置信区间 ,

30、 )( , 2均为未知均为未知方差是方差是的均值是的均值是设正态总体设正态总体 x , , 21是一个样本是一个样本nxxx),1(/ ntnsx 由由,1)1(/ ntnsxp有有,1)1( ntnsxp即即,),1( ntnsx 1 的置信下限的置信下限的置信水平为的置信水平为 ).1( ntnsx ),1()1( 222 nsn 又根据又根据,1)1()1( 2122 nsnp有有 1的单侧置信区间的单侧置信区间的一个置信水平为的一个置信水平为于是得于是得 12的单侧置信区间的单侧置信区间的一个置信水平为的一个置信水平为于是得于是得 ,)1()1(, 0212 nsn 12的单侧置信上限

31、的单侧置信上限的置信水平为的置信水平为 .)1()1(2122 nsn ,1)1()1( 2122 nsnp即即设灯泡寿命服从正态分布设灯泡寿命服从正态分布. 求灯泡寿命均求灯泡寿命均值值 的置信水平为的置信水平为0.95的单侧置信下限的单侧置信下限. 例例8从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命x(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280 ) 1(ntnsx 由于方差由于方差 未知,取枢轴量未知,取枢轴量2 解:解: 的点估计取为样本均值的点估计取为样本均值 x 对给定的置信水平对给定的置信水平 ,确定分位数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论