版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 前面我们讨论了参数点估计前面我们讨论了参数点估计. . 它是用样本算得它是用样本算得的一个值去估计未知参数的一个值去估计未知参数. . 但是,点估计值仅仅是但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值未知参数的一个近似值,它没有反映出这个近似值的精确度以及误差范围,使用起来把握不大的精确度以及误差范围,使用起来把握不大. . 区间区间估计正好弥补了点估计的这个缺陷估计正好弥补了点估计的这个缺陷 . . 譬如,在估计湖中鱼数的问题中,若我们根譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数据一个实际样本,得到鱼数N的极大似然估计为的极大似然估计为1000条条.
2、 若我们能给出一个区间,在此区间内我们合理若我们能给出一个区间,在此区间内我们合理地相信地相信 N 的真值位于其中的真值位于其中. 这样对鱼数的估计就有这样对鱼数的估计就有把握多了把握多了. 实际上,实际上,N的真值可能大于的真值可能大于1000条,也可能小于条,也可能小于1000条条. 也就是说,我们希望确定一个区间,使我们也就是说,我们希望确定一个区间,使我们能以比较高的能以比较高的可靠程度可靠程度相信它包含真参数值相信它包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的,是用概率来度量的,称为称为置信概率置信概率、置信度置信度或或置信水平
3、置信水平. 习惯上把置信水平记作习惯上把置信水平记作 1 ,这里,这里 是一个是一个很小的正数很小的正数.( )1 1、置信区间定义、置信区间定义满足满足设设 是是 一个待估参数,给定一个待估参数,给定 , 0 X1,X2,Xn确定的两个统计量确定的两个统计量若由样本若由样本12(,)n XXX 12(,)n XXX () 和和 分别称为置信下限和置信上限分别称为置信下限和置信上限. 则称区间则称区间 是是 的置信水平(置信度的置信水平(置信度 )为为 的置信区间的置信区间. 1( , ) 1P 这里有两个要求这里有两个要求:基本思想基本思想寻找两个样本函数寻找两个样本函数(统计量统计量) (
4、 , ) 使区间使区间 以指定概率包含真值以指定概率包含真值指定的概率指定的概率 (1)置信度置信度 估计的可信度估计的可信度区间的长度区间的长度 估计的精度估计的精度可靠度与精度是一对矛盾,一般是可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高在保证可靠度的条件下尽可能提高精度精度.(1) 要求要求 以很大的可能被包含在区间以很大的可能被包含在区间 内,就是说,概率内,就是说,概率 要尽可能大要尽可能大 .即要求估计尽量可靠即要求估计尽量可靠. ( , ) P (2) 估计的精度要尽可能的高估计的精度要尽可能的高. 如要求区间长度如要求区间长度 尽可能短,或能体现该要求的其它准则
5、尽可能短,或能体现该要求的其它准则. 关于定义的说明关于定义的说明.) ,( , , , 是随机的是随机的而区间而区间没有随机性没有随机性但它是一个常数但它是一个常数虽然未知虽然未知被估计的参数被估计的参数 : 1),(),(2121的本质是的本质是因此定义中下表达式因此定义中下表达式 nnXXXXXXP). ,(1 ,1 ) ,( 的概率落入随机区间的概率落入随机区间以以而不能说参数而不能说参数的真值的真值的概率包含着参数的概率包含着参数以以随机区间随机区间 : 1),(),(2121还可以描述为还可以描述为另外定义中的表达式另外定义中的表达式 nnXXXXXXP若反复抽样多次若反复抽样多次
6、(各次得到的样本容量相等各次得到的样本容量相等,都是都是n) ), ,( 间间每个样本值确定一个区每个样本值确定一个区按按伯努利大数定理伯努利大数定理, , 在这样多的区间中在这样多的区间中, .%100 ,)%1(100 不不包包含含的的约约占占真真值值的的约约占占包包含含 , 的的真真值值的的真真值值或或不不包包含含每每个个这这样样的的区区间间或或包包含含 例如例如 , 1000 0.01, 次次反复抽样反复抽样若若 .10 1000 个个真值的约为真值的约为个区间中不包含个区间中不包含则得到的则得到的 在求置信区间时,要查表求分位点在求置信区间时,要查表求分位点.2、置信区间的求法、置信
7、区间的求法()1P aXb(),2P Xb()2P Xa若若 X 为连续型随机变量为连续型随机变量 , 则有则有12,ax 2.bx 所求置信区间为所求置信区间为122(,)xx ()1P aXb(),3P Xb2()3P Xa所求置信区间为所求置信区间为1 23,ax 3.bx 1 233(,)xx 由此可见,置由此可见,置信水平为信水平为 的置信区间是的置信区间是不唯一的不唯一的.1 同样对于同样对于 N(0, 1)求参数求参数 的置信度为的置信度为 的置信区间的置信区间. 例例 设设X1,Xn是取自是取自 的样本,的样本, 2, 已已知知),(2 N 1nXU 取明确问题明确问题,是求什
8、么是求什么参数的置信区间参数的置信区间?置信水平是多少?置信水平是多少?寻找未知参寻找未知参数的一个良数的一个良好估计好估计.选选 的点估计为的点估计为 , ,X解解 寻找一个待估参数和寻找一个待估参数和统计量的函数统计量的函数 ,要求,要求其分布为已知其分布为已知.,1 对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得2,z 对于给定的置信水平对于给定的置信水平, 根据根据U的分布,确定一的分布,确定一个区间个区间, 使得使得U取值于该区间的概率为置信水平取值于该区间的概率为置信水平.2|1XPzn 为什么为什么这样取?这样取? ,1/2/ znXP,1 2/2/ znXznXP
9、即即 分位点的定义知分位点的定义知由标准正态分布的上由标准正态分布的上 ., 1 2/2/ znXznX的置信区间的置信区间的一个置信水平为的一个置信水平为于是得于是得这样的置信区间常写成这样的置信区间常写成.2/ znX其置信区间的长度为其置信区间的长度为. 22/ zn 从例从例1解题的过程,我们归纳出求置信区间解题的过程,我们归纳出求置信区间的一般步骤如下的一般步骤如下:1. 明确问题明确问题, 是求什么参数的置信区间是求什么参数的置信区间? 置信水平置信水平 是多少是多少? 12. 寻找参数寻找参数 的一个良好的点估计的一个良好的点估计 3. 寻找一个待估参数寻找一个待估参数 和估计量
10、和估计量 T 的函数的函数 U(T, ),且其分布为已知且其分布为已知.T(X1,X2,Xn) 4. 对于给定的置信水平对于给定的置信水平 ,根据,根据U(T, )的分布,确定常数的分布,确定常数a, b,使得使得 1 1 P(a U(T, )b) = 5. 对对“aU(T, )b”作等价变形作等价变形,得到如下形式得到如下形式 1P 即即 1 于是于是 就是就是 的的100( )的置信区间的置信区间. ( , ) 可见,确定区间估计很关键的是要寻找一个可见,确定区间估计很关键的是要寻找一个待估参数待估参数 和估计量和估计量T 的函数的函数U(T, ), 且且U(T, )的分布为已知的分布为已
11、知, 不依赖于任何未知参数不依赖于任何未知参数 . 而这与总体分布有关,所以,总体分布的形而这与总体分布有关,所以,总体分布的形式是否已知,是怎样的类型,至关重要式是否已知,是怎样的类型,至关重要. 需要指出的是,给定样本,给定置信水平需要指出的是,给定样本,给定置信水平 ,置信区间也不是唯一的置信区间也不是唯一的. .对同一个参数,我们可以构造许多置信区间对同一个参数,我们可以构造许多置信区间. . 1.在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a =-b时时求得的置信区间的长度为最短求得的置信区间的长度为最短. 2.即使在概率密度不对称的情形,如即使在概率密度不对称的
12、情形,如 分布,分布,F分布,习惯上仍取对称的分位点来计算未知参数的分布,习惯上仍取对称的分位点来计算未知参数的置信区间置信区间.2 222111,( ,),()1nniiXXXNX SXXn 设设取取自自总总体体 1.总总体体均均值值 的的区区间间估估计计 2(1),总总体体方方差差已已知知的的置置信信区区间间寻找待估参数的较优的点估计量寻找待估参数的较优的点估计量11=niiXXn 构造不依赖待估参数、具有已知分布的统计量构造不依赖待估参数、具有已知分布的统计量(0,1)XNn ,且且不不依依赖赖于于未未知知参参数数 121()1XP KKn 对对于于已已知知的的置置信信度度,令令 12(
13、)()2XXPKPKnn21KKK 密密度度函函数数对对称称()1XPKn 可得到可得到 的的置信水平为置信水平为 的置信区间为的置信区间为 1 查找标准正态分布表确定分位点查找标准正态分布表确定分位点2=K z 22()1XPzzn 22Xzzn 反反解解不不等等式式: 22XzXznn得得到到参参数数置置信信区区间间: 222(,)()XzXzXznnn或或例例1 已知某商场每天的销售额服从正态分布,且已知某商场每天的销售额服从正态分布,且20.06. 为了解每天的平均销售情况,随机抽取为了解每天的平均销售情况,随机抽取14.6 15.1 14.9 14.8 15.2 15.16天的销售额
14、天的销售额(单位:万元单位:万元)试求平均每天销售额试求平均每天销售额 的置信区间的置信区间 (0.05). 解:解:1(14.615.114.914.815.215.1)14.956x 0.051=0.95当当时时,置置信信概概率率,2 1.96,Z 查查表表20.0614.951.966xZn (14.75, 15.15).所所求求置置信信区区间间为为练习练习2 设总体设总体1( , 4), ,nXNXX 为样本,为样本,(1) 当当n=16时时, 求求 为为0.9及及0.95的置信区间长度;的置信区间长度;(2) n为多大时为多大时, 可使可使 的的0.9的置信区间长度不超过的置信区间长
15、度不超过1; n为多大时为多大时, 可使可使 的的0.95的置信区间长度不超过的置信区间长度不超过1. 1 练习练习1 设总体设总体19( , 0.81), ,XNXX 为样本,为样本,样本均值为样本均值为5,求,求 的置信度为的置信度为95%的置信区间的置信区间. (2)10.9, 1.645 2. (1) 10.95, 1.96 说明在样本容量一定的条件下,置信度越高,置说明在样本容量一定的条件下,置信度越高,置信区间越长,精度越低信区间越长,精度越低.10.9, 44n时时1 10.95, 62n时时1 说明在置信区间长度(精度)不变的条件下,提说明在置信区间长度(精度)不变的条件下,提
16、高可信度就必须加大样本容量高可信度就必须加大样本容量.1. ( 4.412, 5.588 )2222 S由由于于未未知知,一一个个自自然然的的想想法法就就是是用用的的估估计计量量来来代代替替, 故故选选取取统统计计量量XTSn (1)t n 此分布不依赖于此分布不依赖于任何未知参数任何未知参数可得到可得到 的的置信水平为置信水平为 的置信区间为的置信区间为 1 2|(1)1XPtnSn 由由22(1), (1)SSXtnXtnnn2(2),总总体体方方差差未未知知的的置置信信区区间间 9() 510 485 505 505 490 495 520 515 490=02.01.某某种种袋袋装装商
17、商品品的的重重量量服服从从正正态态分分布布,某某日日随随机机抽抽取取 袋袋检检验验重重量量 单单位位:克克 为为试试在在下下,求求 的的置置信信区区间间例例解:因方差未知,解:因方差未知,501.6712.250.01xs,2 (1)=3.355ttn 查查表表 分分布布表表得得,212.25(1)501.673.3559sxtnn0.01(487.97, 515.37). 得得在在下下 的的置置信信区区间间为为 258012. ( =0.01).3xs某某旅旅行行社社随随机机访访问问了了名名旅旅客客,得得知知平平均均消消费费额额元元,样样本本标标准准差差元元 若若消消费费额额服服从从正正态态
18、分分布布,求求平平均均消消费费额额的的置置信信区区间间练练习习212(1)802.06425sxtnn(75.097, 84.95)22 ()().Xt上上述述求求 的的置置信信区区间间都都是是在在 服服从从正正态态分分布布条条件件下下当当 给给定定时时,查查正正态态分分布布表表已已知知 或或 分分布布表表未未知知 ,确确定定出出临临界界值值,从从而而确确定定置置信信区区间间 (50)Xnn 如如果果 的的分分布布是是未未知知的的,这这时时只只要要 充充分分大大,由由中中心心极极限限定定理理,得得(0,1)XNn 近近似似(0,1)XNn 近近似似2() 已已知知2() 未未知知(1)Xt n
19、Sn 近近似似而而当当n很大时,很大时,t分布渐近趋于正态分布,因此分布渐近趋于正态分布,因此(0,1)XNSn 近近似似例例3 有一批产品,其中含有一定数量的次品,为了有一批产品,其中含有一定数量的次品,为了估计这批产品的次品率,抽取估计这批产品的次品率,抽取70件产品进行检验,件产品进行检验,发现次品有发现次品有12件,求次品率件,求次品率p的置信区间的置信区间(0.05). (1, )XXBp解解:设设 表表示示抽抽到到产产品品的的结结果果,= , ppX 由由于于所所以以求求次次品品率率 置置信信区区间间的的问问题题转转化化为为求求随随机机变变量量 的的均均值值 置置信信区区间间的的问
20、问题题. .7011120.1717070iixx 7022221115812()12 ()58 () 0.1441697070iisxxn 70n 由由于于较较大大(0,1)XpNSn 近近似似所所以以()1XpPKSn 令令22SSXZpXZnn()()2XpXpPKPKSSnn 20.144=0.1711.960.1710.08940sxzn (0.082 0.26).p次次品品率率 的的置置信信区区间间为为,22. 总总体体方方差差的的区区间间估估计计22S 总总体体方方差差可可用用其其估估计计量量代代替替,引引入入统统计计量量222(1)nS 2(1)n 212 1nKK 对对给给定
21、定的的置置信信度度1-1- ,在在分分布布表表中中,查查自自由由度度对对应应的的两两个个临临界界值值,使使得得222122PKPK2222112 ( -1)(1)KnKn 得得,2221222(1)(1)( -1)1nSPnn 即即有有22222212(1)(1)1( -1)(1)nSnSPnn 22222122(1)(1) , ( -1)(1)1.nSnSnn 故故是是方方差差的的置置信信度度为为的的置置信信区区间间 25100= . 540 0s 某某批批产产品品的的强强力力服服从从正正态态分分布布,为为确确定定该该批批产产品品的的强强力力方方差差,随随机机抽抽取取见见进进行行强强力力测测
22、试试,测测的的强强力力标标准准差差为为(单单位位:公公斤斤)试试在在下下,对对强强力力方方差差进进例例行行区区间间估估计计. .解:解:2 25, 10000, =0.025, 1=0.97522ns由由题题22122 (24)12.401(24)39.364 查查表表得得,20.95 方方差差的的置置信信度度为为的的置置信信区区间间为为2222212(1)(1), ( -1)(1)nSnSnn (6096.94, 19353.28) 练习练习1 有一大批糖果,现从中随机地取有一大批糖果,现从中随机地取 16 袋袋 , 称得称得重量重量(以克计以克计)如下如下: 506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高端会议策划与销售服务合同模板
- 2025年度某局数字化转型劳务分包结算规范合同2篇
- 2025版办公楼小型装饰装修工程施工合同示范6篇
- 2025版建筑工地挖掘机驾驶员劳动合同标准范本3篇
- 《全球化与两岸关系》课件
- 可燃冰资源地质评价方法与实践考核试卷
- 2025版学校食堂蔬菜采购及食品安全追溯服务合同3篇
- 2025年度美术品艺术品投资顾问合同范本4篇
- 2025年学校节日庆祝协议
- 2025年合伙人员协议
- 2024-2025学年人教版数学六年级上册 期末综合试卷(含答案)
- 收养能力评分表
- 山东省桓台第一中学2024-2025学年高一上学期期中考试物理试卷(拓展部)(无答案)
- 中华人民共和国保守国家秘密法实施条例培训课件
- 管道坡口技术培训
- 2024年全国统一高考英语试卷(新课标Ⅰ卷)含答案
- 2024年认证行业法律法规及认证基础知识 CCAA年度确认 试题与答案
- 皮肤储存新技术及临床应用
- 外研版七年级英语上册《阅读理解》专项练习题(含答案)
- 2024年辽宁石化职业技术学院单招职业适应性测试题库必考题
- 上海市复旦大学附中2024届高考冲刺模拟数学试题含解析
评论
0/150
提交评论