




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四节 正态分布均值和方差的区间估计我们知道,正态随机变量是最为常见的,特别是很多产品的指标服从或近似服从正态分布。因此,我们主要研究正态总体参数的区间估计。先研究均值的区间估计,然后再研究方差的区间估计。这些在实际应用中是很重要的.一:均值的区间估计下面分两种情况进行讨论。1 方差已知,对进行区间估计设总体,其中已知。又为来自于总体的样本。由第七章第三节中的结论可知于是 由标准正态分布可知,对于给定的,可以找到一个数,使 , ,即 ,也就是说,落在区间内的概率为。区间 , (8.11)即为的置信区间。称为在置信度下的临界值,或称为标准正态分布的双侧分位点。当0.05时,查标准正态分布表得临界
2、值1.96,此时的置信区间是当0.01时,查标准正态分布表得临界值2.58,此时的置信区间是从上可知,越大,则越小,置信区间越小,(精度高,难于办到),落在区间内的把握也就越小。因此,在实际应用中,要适当选取。例1:已知某种滚珠的直径服从正态分布,且方差为0.06,现从某日生产的一批滚珠中随机地抽取6只,测得直径的数据(单位mm)为14.6 15.1 14.9 14.8 15.2 15.1试求该批滚珠平均直径的95置信区间。解 当0.05时,,查表得1.96 , , 于是14.951.9614.95+1.96故所求置信区间为。对于不是服从正态分布的总体,只要足够大,则由中心极限定理,随机变量近
3、似地服从标准正态分布,因此仍然可以用作为的置信区间,但此时仍然又多了一次误差。2 方差未知,对进行区间估计上面的讨论是在已知的情况下进行的,但实际应用中往往是未知的情况。设为正态总体的一个样本,由于未知,我们用样本方差来代替总体方差,,根据第七章定理四,统计量.于是,对给定的,查分布表可得临界值,使得,即,故得均值的置信区间为 ,(8.12)当时,查t分布表得临界值2.306。因此,在方差未知的情况下,的置信区间是 .例2 设有某种产品,其长度服从正态分布,现从该种产品中随机抽取9件,得样本均值9.28(cm),样本标准差0.36(cm),试求该产品平均长度的90置信区间.解:当时,查t分布表
4、得,于是9.281.86,故所求置信区间为9.06,9.50。例3 设灯泡的寿命服从正态分布,现从一批灯泡中随机地抽取6只,测得寿命的数据(单位:h)为1020 , 1010 , 1050 ,1040 ,1050 1030.求灯泡寿命平均值的置信度为0.95的单侧置信下限。解 由于总体方差未知,故统计量于是对给定的,查t分布表可得临界值,使得,即 ,由此得到的置信度为的单侧置信区间的置信度为的单侧置信下限为 .本例中,0.95,n=6,= 代入得单侧置信下限为.实际应用 例4:收获前如何预测水稻总产量问题问题:某县多年来一直种植某种水稻品种并沿用传统的耕作方法,平均亩产600千克,今年换了新的
5、稻种,耕作方法也作了一些改进,收获前,为了预测产量高低,先抽查了具有一定代表性的30亩水稻的产量,平均亩产642.5千克,标准差为160千克,如何估算总产量。解:由于总产量是随机变量,因此最有参考价值的是估算出总产量在某一个范围内,因而这是一个区间估计问题,设水稻亩产量X为一随机变量,由于它受众多随机因素的影响,我们可设它服从正态分布,即XN。只要算出水稻平均亩产量的置信区间,则下限与种植面积的乘积就是对总产量最保守的估计,而上限与种植面积的乘积则是对总产量最乐观的估计。根据正态分布关于均值的区间估计,在方差未知时,的置信度为95%的置信区间为(,其中为样本标准差。在例中,n=30,,将这些数
6、据代入,有=642.5因此得到的95%的置信区间为(582.25,699.75)。置信下限约为585.25千克/亩,小于以往的常数总体均值600千克/亩,置信上限约为700千克/亩,则大于以往总体均值600千克/亩,由此得出的结论是:今年的产量未必比往年高。最保守的估计为亩产585.25千克,比往年略低;最乐观的估计为亩产可达到700千克,比往年高出100千克。因上、下限差距太大,这将不能做出准确的预测,要解决这个问题,可在抽查70亩,前后共抽样100亩,设平均亩产量与标准差不变,即,n=100,则的置信度为95%的置信区间为31.4,即(611.1,673.9)。置信下限比往年亩产600千克
7、多11.1千克,这样就可以预测,在很大程度上,今年水稻平均亩产至少比往年要高出11千克。二.方差的区间估计设总体,是来自于总体的样本。现利用样本给出的置信区间。考虑统计量,由第七章定理三可知,统计量 。于是,对给定的,查分布表,可得临界值及,使得,因此,当总体中的参数为未知的情况下,方差的置信区间为 , (8.13)注意这里选取的临界值,不是唯一的。例如可以选取等等。顺便指出,的置信区间是 ,(8.14)例3:某自动车床生产的零件,其长度X服从正态分布,现抽取16个零件,测得长度(单位:mm)如下:12.15 ,12.12, 12.01 , 12.08, 12.0912.16 ,12.16,1
8、2.03,12.01,12.06 ,12.17 12.13 12.07 , 12.11,12.08 , 12.01 ,12.03 , 12.06试求的置信度为95%的置信区间。解:经计算可得查分布表得,,故的置信区间为 .第五节 二正态总体均值差和方差比的区间估计一:二正态总体均值差的区间估计设和分别来自于正态总体N和N的两独立样本,相应的样本均值和样本方差分别记为和。我们的任务是求的置信区间。下面按总体方差的不同情况分别进行讨论。1:方差和都已知由第七章第三节中的结论可知,于是如同上节一样讨论,可得的置信区间为 (8.15)2:方差和都为未知这时,只要m,n足够大,就以分别代替,并用 (8.
9、16)作为的近似置信区间。3:方差=且为未知由第七章定理五知,统计量服从于t(m+n-2)分布。由此可得的置信区间为 (8.17)这里假设未知方差=,实际问题是否这样,需要进行检验,这是关于参数假设检验的问题,下一章再进行讨论例1:有两台车床A和B同生产一种型号的零件,为了比较这两台车床所生产的零件的直径的均值,随机地抽取A车床生产的零件8个,测得平均直径,标准离差。随机地抽取B车床生产的零件9个,测得平均值,标准离差。根据以往经验可以认为,这两台车床所生产的零件的直径都服从正态分布,且它们的方差相等,求二总体均值差的95%置信区间。解:由抽样的随机性可推知两样本相互独立,又因它们的总体方差相
10、等,因此由(8.17)式可求得置信区间。在这里,查t分布表得临界值=2.1311.1380.125=0.303=15.2014.82=0.38故所求置信区间是,由此可认为。二:二正态总体方差比的区间估计设二正态总体和,其中参数均为未知。是分别来自于两总体且容量各为m和n的独立样本的方差。考虑统计量由于,所以=F(m-1,n-1)对于给定的,查F分布表得临界值和,使于是,的置信区间为 (8.18)当置信区间的下限大于1时,则;当区间的上限小于1时,则在这里,比较两个方差时,我们采用比的形式,但能否采用差的形式,请读者自己考虑例2 设有二正态总体和,其中参数均为未知,随机地从两总体中分别抽取容量为
11、10和15的独立样本,测得样本方差分别为,且二总体方差比的0.95置信区间。解 这里,m=10,n=15,查F分布表得=故所求置信区间为。第六节 一些易混的问题的讨论到此为止,我们已经学会了参数的两种最常见的估计,即点估计和区间估计。那么一定会有同学想到既然都是对未知参数进行近似估计,那么这两种方法到底哪个更好一些呢?他们的不同又在哪里呢。下面我们就来解决这个问题,也即是如何理解参数的点估计和区间估计所谓参数的点估计,就是利用样本X,X,X中的信息构造一个统计量(X,X,X)作为的估计量。简单的说,就是利用样本求未知参数的一个“近似值” ,而衡量其“近似”程度好坏的标准有无偏性,有效性,一致性
12、等。然而不管是怎么样一个优良的估计量,用去估计也只是一定程度的精确,至于如何反映准确度,参数的点估计就没有回答。也就是说任何一种“近似”若不附加“误差范围”,这种近似是没有价值的。因而用去估计必须按一定的置信度1(即概率)要求构造某个随机区间(I(),I(),使该随机区间包含的概率达到1。其中I(),I()是的函数。即P(I()<< I()=1随机区间(I(),I()称为的置信度为1的置信区间。由于考虑到随机性,一般一个有限的随机区间不可能以置信度1包含,通常我们取置信水平足够小(如5%,1%等),使随机区间(I(),I()包含的概率足够大。值得注意的是,从统计学中频率学派的观点看
13、,被估计的参数虽然未知,但它是一个常数,没有随机性,而区间(I(),I()则是随机的,因此关系式P(I()<< I()=1可解释为随机区间(I(),I()以概率1包含参数的真值,而不能说参数以1的概率落入随机区间(I(),I()。衡量一个置信区间优劣的标准则是在给定置信度1之下,置信区间的长度要尽可能的小。举一个简单的例子,已知样本均值是总体均值E(X)的一个无偏的,有效的,一致的点估计量,若进一步假定总体XN(,),其中已知,则由出发可构造的一个置信度为1的置信区间为(,),这里为标准正态分布的上侧分位数。在实际应用中,通常我们所具有的资料是样本X,X,X的一组观测值,由此代入I
14、()和I()可得到一个确定的区间,记为(,该区间已非随机区间,它要么包含,要么不包含,二者必居其一。因此我们此时也不能说区间(以概率1包含的真值,更不能说落在(的概率为1,那么此时应如何解释区间(呢?从频率的角度我们可给区间(以如下解释:从给定的总体X中重复抽样多次,且各次抽得的样本的容量均为n。对每次抽得的样本观测值,都对应于一个确定的区间(。由伯努里大数定律,当抽样次数充分大时,在这些区间中包含真值的频率接近于置信度1,即在这些区间中大约有100(1)的区间包含真值,100的区间不包含真值。例如,若给定0.05,重复抽样100次所得到的100个区间中,大约有95个包含真值。第七节 信任估计
15、前面我们说过从统计学中频率学派的观点看,被估计的参数虽然未知,但它是一个常数,没有随机性。也就是说无论是区间估计还是点估计,都是从统计学中的频率学派的观点出发的。而数理统计的奠基人之一费希尔却提出了一个出发点截然不同的估计方法,也就是这一节所提到的信任估计。信任估计法是费希尔在1930年提出的一种区间估计方法。在费希尔对数理统计学的众多贡献中,这一项是争议最大的。费希尔关于信任估计的思想可以通过一个简单的例子来说明。设为抽自正态总体的i.i.d样本,已知,未知。求的区间估计,对此,费希尔的推理如下:记则有分布,解上式得,其中为已知常数;由样本算出,也是已知的;的分布已知,故(在有了样本后)的分
16、布可以求出,在此例中为正态分布。费希尔把的分布叫做的信任分布。如以F记这个分布,找出,使则事件的“信任概率“为1。费希尔把作为的区间估计,并称之为的信任区间,其“信任系数”为1。本例可取只有这个取法使最小,得到与置信区间估计相同的结果若未知,则可以用S取代,并利用的事实,一样可以得出的信任区间,也得到与置信区间估计相同的结果费希尔这个做法的新奇之处,是把当做随机变量看,有其概率分布,而一般的看法是:是一个虽然未知,但是固定的常数,这是一个观念上的分歧,这一点倒不能看做是费希尔方法的致命弱点,因为一种方法或理论,只要没有内在的矛盾,就可当做一家之言提出来,而不必一定与现存理论合拍,但是,费希尔未
17、能对信任分布给出一个明确的定义和确定它的方法,而只能停留在对个别例子用特定的方法去处理,如何对信任分布运算也缺乏明确的规则。这些原因使他的方法未能得到广泛的接受,后来也有些学者继续在这个方向上作工作,以图解决这些问题,但未能取得实质性的进展。在简单的情况下,利用信任估计法求出的若干区间估计,都与用奈曼的置信区间方法求出的相同,但在较复杂的例子中这二者确有不同。最著名且有实用价值的例子,是所谓贝伦斯费希尔(Behrens-Fisher)问题。下面简单介绍一下这个问题。设和分别是抽自正态总体和的i.i.d.样本,和都未知,求的区间估计,这即是贝伦斯费希尔问题。当时,可用t分布求解,但在的情况下,此问题没有适当的小样本解,如果都很大,可考虑用大样本方法,用正态逼近去求解。此处,分别是X样本和Y样本的样本方差。费希尔用信任估计方法处理这个问题。其做法如下:记,则与独立,分别服从自由度为和的t分布。于是,有 (3-1)有了样本后,都已知,按费希尔的观点,上式给出了的信任分布,可找出d>0,使 (3-2)在计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度户外广告牌安装工程合同样本
- 二零二五年度☆高科技企业研发项目合同管理实务
- 二零二五年度绿色办公耗材采购与回收利用合同参考
- 2025版不锈钢栏杆新型材料研发与应用合同范本
- 2025版常年法律顾问合同(民商事争议解决专版)
- 二零二五年住宅租赁与租后增值服务合同
- 2025版建筑垃圾处理合同范本全新出炉
- 二零二五年度厂区物业能耗监测与合同
- 二零二五年度环保技术咨询服务合同
- 2025版豪华轿车抵押担保交易合同
- 中国心理学会临床与咨询心理学专业机构和专业人员注册标准(第二版)
- 老年骨质疏松症
- 电力建设工程施工安全管理导则
- 医院消防安全培训课件(完美版)
- 干部履历表(中组部1999年版)A4
- 雅马哈RX-V365使用说明书
- 照相馆管理制度
- IECQ QC 080000:2017 第四版标准(中文版)
- DZ∕T 0275.2-2015 岩矿鉴定技术规范 第2部分:岩石薄片制样(正式版)
- 国外激励研究现状分析报告
- GB/T 4074.4-2024绕组线试验方法第4部分:化学性能
评论
0/150
提交评论