版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、6.5 区间估计,2011-4-18,前面讨论了参数的点估计。点估计就是利用样本计算出的值 (即实轴上点) 来估计未知参数。,6.5 区间估计,其优点是:可直接地告诉人们 “未知参数大致是多少”;,缺点是:并未反映出估计的误差范围 (精度)。故,在使用上还有不尽如人意之处。,而区间估计正好弥补了点估计的这一不足之处 。,例如:在估计正态总体均值 的问题中,若根据一组实际样本,得到 的极大似然估计为 10.12。,一个可以想到的估计办法是:给出一个区间,并告诉人们该区间包含未知参数 的可靠度 (也称置信水平)。,实际上, 的真值可能大于10.12,也可能小于10.12。,也就是说,给出一个区间,
2、使我们能以一定的可靠度相信区间包含参数 。,这里的“可靠度”是用概率来度量的,称为置信水平,常用 表示,置信水平的大小常根据实际需要来确定,通常取0.95或0.99,即,根据实际样本,由给定的置信水平,可求出一个尽可能短的区间 ,使,单侧置信区间,定义 对于给定的 (0 1) , 是待估参数,是总体 X 的样本,若能确定一个统计量,使得,则称,为置信水平为1 - 的单侧置信区间.,(三),为确定置信区间,我们先回顾前面给出的随机变量的上 分位点的概念。,书末附有2分布、t 分布、F分布的上侧分位数表可供使用。,现在回到寻找置信区间问题上来。,6.5.1 区间估计的概念,定义1:,实际应用上,一
3、般取 = 0.05 或 0.01。,由图6.5.1可以看出,这100个区间中有91个包含参数真15,另外9个不包含参数真值。,图6.5.1 的置信水平为0.90的置信区间,取=0.50,我们也可以给出100个这样的区间,见图6.5.2。可以看出,这100个 区间中有50个包含参数真值15,另外50个不包含参数真值。,图6.5.2 的置信水平为0.50的置信区间,寻找一个样本的函数,它含有待估参数, 不含其它未知参数, 它的分布已知, 且分布不依赖于待估参数 (常由 的点估计出发考虑 ).,例如,求置信区间的步骤, 称为枢轴量,取枢轴量,给定置信水平 1 ,定出常数 a , b ,使得,如前例中
4、要找一个区间,使其包含 的真值的概率为0.95. ( 设 n = 5 ),取,查表得,( 例中,得置信区间,例中,满足置信水平的a,b是唯一的吗?,很多场合难以做到最短的估计区间, 一般都采用等尾置信区间的方法,,取 = 0.05, 反映了估计的可靠度, 越小, 越可靠.,置信区间的长度 反映了估计精度, 越小, 1- 越大, 估计的可靠度越高,但, 确定后, 置信区间 的选取方法不唯一, 常选最小的一个.,几点说明,这时, 往往增大, 因而估计精度降低.,越小, 估计精度越高.,处理“可靠性与精度关系”的原则,6.5.3 单个正态总体参数的置信区间,根据定理 ,知,也可简记为,于是, 的置信
5、区间为,例1: 某厂生产的零件长度 X 服从 N( , 0.04),现从该厂生产的零件中随机抽取6个,长度 测量值如下(单位:毫米): 14.6, 15.l, 14.9, 14.8, 15.2, 15.1. 求: 的置信水平为0.95的区间估计。,解:n = 6, = 0.05,z1-/2 = z0.975 = 1.96,2=0.22 .,所求置信区间为,当方差未知时,取, 的区间估计,于是, 的置信水平为1- 的区间估计为,也可简记为, 2 的区间估计, 2 的置信区间有下式得出,公式(4),例2:为估计一物体的重量,将其称量10次,得到重量的测量值 (单位: 千克) 如下: 10.l, 1
6、0.0, 9.8, 10.5, 9.7, l0.l, 9.9, 10.2, 10.3, 9.9. 设它们服从正态分布 N( , 2)。求 的置信水平为0.95的置信区间。,解: n=10, =0.05, t9 (0.975)=2.2622,例3(续例2) 求2的置信系数为0.95的置信区间。,解:n=10, = 0.05, S2=0.0583, 查附表得,,于是,,练习 某工厂生产一批滚珠, 其直径 X 服从,解 (1),即,正态分布 N( 2), 现从某天的产品中随机,(1) 若 2=0.06, 求 的置信区间 (2) 若 2未知,求 的置信区间 (3) 求方差 2的置信区间.,抽取 6 件
7、, 测得直径为,15.1 , 14.8 , 15.2 , 14.9 , 14.6 , 15.1,例1,由给定数据算得,由公式 得 的置信区间为,(2) 取,由给定数据算得,由公式 得 2 的置信区间为,(3) 选取枢轴量,查表得,由公式 得 的置信区间为,例 已知灯泡寿命X 服从正态分布, 从中 随机抽取 5 只作寿命试验, 测得寿命为 1050 , 1100 , 1120 , 1250 , 1280 (小时) 求灯泡寿命均值的单侧置信下限与寿命 方差的单侧置信上限.,解,未知,例3,(1) 选取枢轴量,(2) 选取枢轴量,在实际应用中,经常会遇到两个正态总体的区间估计问题。,于是,评价新技术
8、的效果问题,就归结为研究两个正态总体均值之差 1-2 的问题。,例如:考察一项新技术对提高产品的某项质量指标的作用,将实施新技术前的产品质量指标看成正态总体 N(1, 12),实施新技术后产品质量指标看成正态总体 N(2, 22)。,6.5.4 两个正态总体下的置信区间,定理:设 X1, X2, , Xm是抽自正态总体X 的简单样本,XN(1, 12),样本均值与样本方差为,Y1, Y2, , Yn 是抽自正态总体 Y 的简单样本,Y N(2, 22),样本均值与样本方差为,当两样本相互独立时,有,利用该定理,我们可以得到 1-2 的置信 水平为 1- 的置信区间。,例 (比较棉花品种的优劣)
9、 假设用甲、乙两种棉花纺出的棉纱强度分别为 XN(1, 2.182)和Y N(2, 1.762)。试验者从这两种棉纱中分别抽取样本 X1, X2 , X200 和 Y1, Y2, , Y100,样本均值分别为:,求 1-2 的置信水平为 0.95 的区间估计。,解: 1=2.18, 2=1.76, m=200, n=100, =0.05, 由上式,得 1- 2 的置信水平为 1- 的置信区间为,例 某公司利用两条自动化流水线灌装矿泉水。设这两条流水线所装矿泉水的体积 (单位:毫升) XN(1, 2) 和 YN(2, 2)。现从生产线上分别抽取 X1, X2, X12 和 Y1, Y2, , Y
10、17,样本均值与样本方差分别为:,求 1- 2 的置信水平为0.95的区间估计。,解:m=12, n=17, = 0.05,再由其他已知条件,可算出,查 t 分布表,得 tm+n-2(1- /2) = t27(0.975)=2.05.,再由公式,得 1- 2 的置信系数为 1- 的置信区间,在这两个例子中, 1- 2 的置信区间都包含了零,也就是说: 1可能大于 2,也可能小于 2。这时我们认为二者没有显著差异。,相互独立,(3) 未知, n, m 50, 的置信区间,公式(7),非正态总体的区间估计,前面讨论了正态总体分布参数的区间估计。但是在实际应用中,我们有时不能判断手中的数据是否服从正
11、态分布,或者有足够理由认为它们不服从正态分布。这时,只要样本大小 n 比较大,总体均值 的置信区间仍可用正态总体情形的公式,或,2已知时,2未知时,所不同的是:这时的置信区间是近似的。,这是求一般总体均值的一种简单有效的方法,其理论依据是中心极限定理,它要求样本大小 n 比较大。因此,这个方法称为大样本方法。,设总体均值为 , 方差为2 , X1, X2, , Xn 为来自总体的样本。因为这些样本独立同分布的,根据中心极限定理,对充分大的 n, 下式近似成立,因而,近似地有,于是, 的置信水平约为1- 的置信区间为,当2未知时,用2的某个估计,如 S2 来代替, 得到,只要 n 很大,(2)式
12、所提供的置信区间在应用上是令人满意的。,那么,n 究竟多大才算很大呢?,显然,对于相同的 n , (2)式所给出的置信区间的近似程度随总体分布与正态分布的接近程度而变化,因此,理论上很难给出 n 很大的一个界限。,但许多应用实践表明:当 n30时,近似程度是可以接受的;当 n50时,近似程度是很好的。,中心极限定理 (central limit theorem),的分布趋于正态分布的过程,例 某公司欲估计自己生产的电池寿命。现从其产品中随机抽取 50 只电池做寿命试验。这些电池寿命的平均值为 2.266 (单位:100小时),标准差 S=1.935。求该公司生产的电池平均寿命的置信系数为 95
13、% 的置信区间。,解:查正态分布表,得 z1- /2= z0.975=1.96,由公式 ,得电池平均寿命的置信系数为 95% 的置信区间为,设事件 A 在一次试验中发生的概率为 p, 现在做 n 次试验,以Yn记事件 A 发生的次数,则 Yn B(n, p)。依中心极限定理,对充分大的 n,近似地有,6.6.1 二项分布,例 设 X 服从参数为 p 的0-1分布, 样本为,求 p 的置信水平为 1 的置信区间,解,令,所以参数 p 的置信区间为( p1, p2 ),例如 自一大批产品中抽取100个样品,其中有60个一级品, 求这批产品的一级品率 p 的置信度为0.95的置信区间.,p 的置信区
14、间为,(4)式就是二项分布参数 p 的置信水平约为1- 的置信区间。,例 商品检验部门随机抽查了某公司生产的产品100件,发现其中合格产品为84件,试求该产品合格率的置信系数为0.95的置信区间。,解:n=100, Yn=84, =0.05, z1-/2=1.96, 将这些结果代入到(4)式,得 p 的置信水平为0.95的近似置信区间为 0.77, 0.91。,例 在环境保护问题中, 饮水质量研究占有重要地位, 其中一项工作是检查饮用水中是否存在某种类型的微生物。假设在随机抽取的100份一定容积的水样品中有20份含有这种类型的微生物。试求同样容积的这种水含有这种微生物的概率 p 的置信水平为0
15、.90的置信区间。,解:n=100, Yn=20, =0.10, z1-/2=1.645, 将这些结果代入到(4)式,得 p 的置信系数为0.90的近似置信区间为 0.134, 0.226。,例6.5.8 某传媒公司欲调查电视台某综艺节目收视率p,为使得 p 的1-置信区间长度不超过d0,问应调查多少用户?,解:这是关于二点分布比例p的置信区间问题,由(6.5.11)知,1-的置信区间长度为 这是一个随机变量,但由于 ,所以对任意的观测值有 。这也就是说p的1-的置信区间长度不会超过 。现要求p的的置信区间长度不超过d0,只需要 即可,从而 (6.5.12),这是一类常见的寻求样本量的问题。比
16、如,若取d0=0.04, =0.05,则 。 这表明,要使综艺节目收视率p的0.95置信区间的长度不超过0.04,则需要对2401个用户作调查。,相关理论,总体正态?,n30?,2已知?,否,是,是,否,否,是,实际中总体方差总是未知的,因而这是应用最多的公式。,根据中心极限定理得到的近似结果。 未知时用s来估计。,增大n?数学变换?,6.6.2 泊松分布,设 X1, X2 , Xn 为抽自具有泊松分布P()的总体的样本,因为 E(X)=Var(X) =,应用(2)式,并用,例 公共汽车站在一单位时间内 (如半小时,或1 小时, 或一天等) 到达的乘客数服从泊松分布 P(), 对不同的车站,
17、所不同的仅仅是参数 的取值不同。现对一城市某一公共汽车站进行了100个单位时间的调查。这里单位时间是20 分钟。计算得到每 20 分钟内来到该车站的乘客数平均值为 15.2 人。试求参数 的置信水平为 95%的置信区间。,解: n=100, =0.05, z1-/2=1.96, 将这些 结果代入到 (5) 式, 得 的置信水平为0.95的近似置信区间为 14.44, 15.96。,且,等价地有,对于给定的置信水平 ,可查表求得 使得,故 的单侧置信下限为,均未知.试求 的置信水平为 的单侧置信下限.,例,解,的无偏估计分别是,故 的单侧置信下限为,单侧置信区间,故 的置信度为 的单侧置信上限为
18、,且,设 为来自总体 的样本, 均未知. 试求 的置信水平为 的单侧置信上限.,(注意 较小),例,解,形式运算,的无偏估计分别为,小结,若总体 X 的分布未知, 但样本容量很大, 由中心极限定理, 可近似地视,若2已知, 则 的置信度为1 - 的置信区间 可取为,若2未知, 则 的置信度为1 - 的置信区间 可取为,非正态总体均值的区间估计,(四),区间估计的图示,关于置信水平含义的说明,样本均值的 抽样分布,在所有的置信区间中,有(1-) *100% 的区间包含 总体真实值。 对于计算得到的一个具体区间,“这个区间包含总体真实值”这一结论有(1-) *100%的可能是正确的。 说“总体均值有95%的概率落入某一区间”是不严格的,因为总体均值是非随机的。,取枢轴量,公式(10),取枢轴量,公式(9),练习 某厂利用两条自动化流水线罐装番 茄酱. 现分别 从两条流水线上抽取了容量 分别为13与17的两个相互独立的样本,与,已知,假设两条流水线上罐装的番茄酱的重量 都服从正态分布, 其均值分别为 1与 2,例2,解,查表得,由公式(6) 的置信区间为,(1) 取枢轴量,(2) 枢轴量为,查表得,由公式得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论