参数估计统计推断的目的是由样本推断出总体的具体分布_第1页
参数估计统计推断的目的是由样本推断出总体的具体分布_第2页
参数估计统计推断的目的是由样本推断出总体的具体分布_第3页
参数估计统计推断的目的是由样本推断出总体的具体分布_第4页
参数估计统计推断的目的是由样本推断出总体的具体分布_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章参数估计统计推断的目的,是由样本推断出总体的具体分布。一般来说,要想得到总 体的精确分布是十分困难的。由第六章知道:只有在样本容量n充分大时,经验 分布函数F(x) 一致 F(x)(以概率1),但在实际问题中,并不容许n很大。而由 n第五章的中心极限定理,可以断定在某些条件下的分布为正态分布,也就是说, 首先根据样本值,对总体分布的类型作出判断和假设,从而得到总体的分布类型, 其中含有一个或几个未知参数;其次,对另外一些并不关心其分布类型的统计推 断问题,只关心总体的某些数字特征,如期望、方差等,通常把这些数字特征也 称为参数。这时,抽样的目的就是为了解出这些未知的参数。1点估计一、由来

2、设总体X的分布函数形式已知,但它的一个或多个参数为未知,借助于总体X的一个样本来估计总体未知参数的值的问题称为点估计问题例1在某炸药制造厂,一天中发生着火现象的次数X是一个随机变量,假设 它服从参数为人0的泊松分布,参数人为未知,设有以下的样本值,试估计着火次数k0123 4 5 6发生k次着火的大数n k75 90 54 22 6 2 1S = 250参数人.解:因为XP (X),所以X= E (X)用样本均值来估计总体的均值E(X). kn_kx = k=0二 nk k=0二总(0 x 75 + 1x 90 + 2 x 54 + 3 x 22 + 4 x 6 + 5 x 2 + 6 x 1

3、) = 1.22故E(X) = X的估计为1.22 .二、一般提法设总体乂的分布函数F(x;。)的形式为已知,9是待估参数.X1,X2,,Xn 是X的一个样本,xi,x2,.,xn为相应的一个样本值.点估计问题就是要构造一个 适当的统计量9(X,X,,X ),用它的观察值9(x,x,,x )来估计 未知参数12n12 n0 。 6(X ,X,,X )称为。的估计量,0(% ,x,,x )称为。的估计值。 12n12 n三、点估计的方法(矩估计法和最大似然估计法)矩估计 用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续 函数,这种估计法称为矩估计法.设总体X的分布中含有未知参数,假定总

4、体X的1m阶原点矩都存在,则有u =u (0 ,0,,0 ) = E(Xk) (k = 1,2,.m)。取样本的k阶原点矩A作为总体的k k k 12 mk阶原点矩气的估计量,即uk =1 Xk (k = 1,2,m),得到方程组 n i=1解这个方程组得U (0 ,0 ,., 0 ) = Um12 m m旌=0 (X,X ,., X )U (0 ,0 ,., 0 ) = U u1(01,02,., 0m) = U 0)未知,(X1,X2,.,Xn)是来自总体X的样本,求0的估计量.解:因为只有一个未知参数0,所以只考虑总体X的1阶原点矩:因为r = E(X)=,根据矩估计法,令=A = X

5、= X , 1221 n ii=1 A一一.所以0 = 2X为所求0的估计量.例2、设总体乂服从几何分布,即有分布律PX = k = p(1-p)k-1 (k = 1,2,.),其中p (0p 0,但R和b2均为未知,又设X1, X2,.,X是一个样本,求R和Q 2的矩估计量.解:R1 = E (X ) =R , R2 = E ( X 2) = D ( X ) + E (X )2 =b2 + R 2,令A1解方程组得到矩估计量分别为b 2 + R 2 = A .K = A =又,b 2 = A - A 2 = 1 x 2 -又 2 = 1W (X - X )2.121 n 1 ini 7注:一

6、般地,用样本均值X =1 X作为总体X的均值的矩估计,i=1用样本二阶中心矩B2 = -(X. -X)2作为总体X的方差的矩估计.i=1最大似然估计法(1)设总体X属离散型似然函数的定义:设分布律PX = k = p(x;0), 0为待估参数,。6。,(其中&是0可能的取值范围),X 1,X2,.,Xn是来自总体X的样本,则X 1,X2,.,X. TOC o 1-5 h z 的联合分布律为Hp(x ;0 ).又设x , x,,x为相应于样本X , X,,X的 i12n12ni=1一个样本值.,则样本X , X,X取到观察值x ,x,,x的概率,即事件 12n12nX 1 = x1, X2 =

7、x2, .,X = x 发生的概率为L(0) = L(x ,x,,x ;0) = Hp(x ;0), 0 g0, L(0)称为样本似然函数.12 nii=1最大似然估计法:得到样本值x ,x,,x时,选取使似然函数L(0)取得最大值12n q ,- 4-的0作为未知参数0的估计值,即L(x ,x,,x ;0) = maxL(x ,x,,x ;0).1 2n0e1 2n(其中0是0可能的取值范围),这样得到的0与样本值x ,x,,x有关,12n、 A4一 A4一记为0(x ,x,,x ),参数0的最大似然估计值,0(X , X ,,X ),参数0的最大12 n12n似然估计量.(2)设总体X属连

8、续型设概率密度为f (x; 0), 0为待估参数,0e0 ,(其中0是0可能的取值范围),X 1,X2,.,Xn是来自总体X的样本,则X 1,X2,.,Xn的联合密度为 TOC o 1-5 h z H f 3 ;o),又设工,工,,工为相应于样本X ,X,,X的一个样 本值, i12n12ni=1则随机点(X ,X ,,X)落在点3,工,,工)的邻域(边长分别为&, & ,12n12 n12. .,危?5维立方体)内的概率近似地为 Hf(土;。)叫,i=1L(0) = L(x ,x,,x ;0) =Hf (x ;0), L(o )称为样本的似然函数. 12 nii=1若 L(x ,x ,x ;

9、) = maxL(x ,x ,x ;0).1 2n0e1 2n0( x , x,,x ),参数0的最大似然估计值,0“(X , X,,X ),参数0的最大似 12 n12n然估计量.求最大似然估计量的步骤:写出似然函数L(0) = L(x ,x,,x ;0) = Hp(x ;0)或 L(0) = L(x ,x,,x ;0)= Hf (x; 0); TOC o 1-5 h z 12 ni12 nii=1i=1取对数 lnL(0) = Inp(x;0)或 InL(0) = ZIn f (x.;0);i=1i=1对0求导 业黑,并令 业黑=0,解方程即得未知参数0的最大似d0d0然估计量01例4、设

10、总体X具有分布律X(123 、,0 220 (1-0) (1-0 )2 /,其中00 1是未知参数,样本值x1 = 2,%= 1,x3=1,试求未知参数0的矩估计值极大似然估计值.解:(1)EX = 3 - 20,x = 4,再令 x = EX 得0 =-(矩估计值)36(2)似然函数 L (0) = P (X1 = 2, X 2 = 1, X 3 = 1) = 20 (1-0 )0 20 2 = 20 5 20 6L(0) = 1004 -1205 =04(10-120)令 L(e) = 0,则 o = 0 或 o = 56由于已知0 0 0)的泊松分布,X1, X2,.,X.是来自X的一个

11、样本,求人的最大似然估计量.X x解:因为 X的分布律为PX = x = e-x, (x = 0, 1, 2,n) x!所以X的似然函数为L(X)=nri=1, u (x !)ii=1=e - nXT.C ( )de xIn L(X) = -nX + 筋 x 4n X - (x !),令 就姑 L(X) = -n + 于=0, 解得x的最大似然估计值;=艾,=x,x的最大似然估计量为八 1X= : X = X,这一估计量与矩估计量是相同的.例7、设总体XN(口,6),口,b为未知参数,x1,x2,.,x是来自X的一个样本值,求口和b2的最大似然估计量.(x p)2, 解:X的概率密度为f (x

12、; p, b2)= _ e 2b2 , x的似然函数为 如2 nbl( p, b2)= rTi=11 (x.-p )2-.e 2b2 2 nbnn1寸In L(p, b2) = _ ln(2 n) ln b2 (x p)2 ,222b 2、i i=1E 一、八布InL(p, b2)= 0,at lnL(p, b2) = 0,db 2x npii=1二 + X (X p)2 = 0 2b 22(b 2)2ii = 1 x np = 0 解得1- i=1人 1 np = x = xn . ii=1由一2- + b W (x. -p)2 = 0 解得 b2 =上(x, x)2, i=1i=1故p和b

13、 2的最大似然估计量分别为= X, b 2 = 1 ( X X )2. n i =1 i它们与相应的矩估计量相同.例8、设总体乂在。,b上服从均匀分布,其中, b未知,”x2,.,xn是来自总体X的一个样本值,求a, b的最大似然估计量.解:记 x = min( x ,x ,.,x ), x = max( x ,x ,.,x ), X 的概率密度为f (x; a, b)= 1;,a x b, b a因为0,其他.(l)1 2n(h)1 2na x ,x,,x b 等价于a x ,x b,12n(l) (h)作为a, b的函数的似然函数为L( a, b) = 土0,其他于是对于满足条件a 七,b

14、 x(h的任意a,b有L( a, b)=(b a) n(x(h)即似然函数L(a, b)在取到最大值(x( h)x(l)n, TOC o 1-5 h z 八一?a, b的最大似然估计值a = x = min x , b = x = max x ,(l)i(h)i 1in1in,,一,、一-一八a, b的最大似然估计量 a = min X , b = max X .1i n 11i n 14、.极大似然估计量有如下的性质:设0的函数u = u (0 ), 0 e0,具有单值反函数0=0 (u)。又设(是X的密度 函数f (x;0)或分布列p(x;0)(形式已知)中参数0的极大似然估计,则= u(

15、0 ) 是u(0 )的极大似然估计。2估计量的评选标准,区间估计一、估计量的评选标准(一)问题的提出从前一节可以看到,对于同一个参数,用不同的估计方法求出的估计量可能不 相同,原则上任何统计量都可以作为未知参数的估计量.问题(1)对于同一个参数究竟采用哪一个估计量好?(2)评价估计量的标准是什么?1、无偏性 -人-.若估计量0 =0(X 1,X2,.,X )的数学期望E(0)存在,且对于任意0 e0有E(0) =0,则称0是0的无偏估计量.2、有效性0 =0 (X,x,,x )与0 =0 (X,x,,x )都是0的无偏估计量, TOC o 1-5 h z 1112n2212n若D(0) D(0

16、 ),则称0较0有效12123、一致性一 q q. _ 一-若0 =0(X 1, X2,.,X )为0的估计量,若对于任意、0 G0,当n r 3时,0(X ,X,,X )依概率收敛于0,则称0为0的一致估计量.12n二、区间估计1、置信区间的定义设总体乂的分布函数尸(x;0)含有一个未知参数0,对于给定值a (0a 1),若由样本X1,X2,.,Xn确定的两个统计量0=0(X 1,X2,.,X/和0 =0(X ,X,,X )满足尸0(X ,X,,X ) 0 0(X ,X,,X ) = 1 -a12n12n12n则称随机区间(0, 0)是0的置信度为1-a的置信区间,0和0分别称为置信度为1-

17、a的双侧置信区间的置信下限和置信上限,1-a为置信度注:(1)被估计的参数0虽然未知,但它是一个常数,没有随机性,而区间(0, 0)是随机的.(2) P0 (X , X ,,X ) 00 (X , X ,,X ) = 1a 的本质是:一 12n12n随机区间(0, 0)以1 -a的概率包含着参数0的真值,而不能说参数0以1-a的概率落入随机区间(0, 0).三、正态总体均值与方差的区间估计(一)单个总体N(口,6)的情况设给定置信水平为1-a ,并设X1,X2,.,X为总体N(口,6)的样本,X, S2 分别是样本均值和样本方差.1、均值日的置信区间。2为已知,H的一个置信水平为1-a的置信区

18、间,一、. aT z而 a/2 7(2) a 2为未知,卜的置信度为1 -a的置信区间X 土、(n-1).7例1、包糖机某日开工包了 12包糖,称得质量(单位:克)分别为 506,500,495,488,504,486,505, 513,521,520,512,485.假设重量服从正态分布且标准差为a = 10,试求糖包的平均质量p的1-a置信区间,(分别取a = 0.10 和 a = 0.05).解:a = 10, n = 12,计算得 x = 502.92,(1)当 a= 0.10 时,1 - = 0.95,查表得 z = z = 1.645,2a/20.05x-兰 z =:n a/2:5

19、02.92 - JL x 1.645 = 498.17, 七12x + 乌 z = vn a/2二 502.92 + x 1.645 = 507.67, 12即P的置信度为90%的置信区间为(498.17, 507.67)(2)当 a = 0.05 时,1 气=0.975,查表得 z = z = 1.96,2a/20.025同理可得R的置信度为95%的置信区间为(497.26, 508.58)可以看出当置信度1 a较大时,置信区间也较大;当置信度1 a较小时,置信区间也较小.例2、有一大批糖果,现从中随机地取16袋,称得重量(克)如下:506 508 499 503514 505 493 49

20、6504 510 497 512506 502 509 496设袋装糖果的重量服从正态分布,试求总体均值r的置信度为0.95的置信区间 解:a = 0.05, n 1 = 15,查 t(n 1)分布表可知:0 025(15) = 2.1315,计算得无=503.75, s = 6.2022,得r的置信度为95%的置信区间,艮口 (500.4, 507.1)503.75土 6.2022 x 2.1315J就是说估计袋装糖果重量的均值在500.4克与507. 1克之间,这个估计的可信程 度为95%.2、方差。2的置信区间根据实际需要,只介绍R未知的情况.方差C2的置信度为1 -a的置信区间 (n

21、1)S2 ,(n 1)S2 .y2(n 1) y /2(n 1) J进一步可有标准差。的一个置信度为1a的置信区间7n 1Syjn 1S TOC o 1-5 h z ,.Ux2 (n 1) J/2 (n 1)a/21a/2/例3、求例2中总体标准差 的置信度为0.95的置信区间.,一 aa解:=0.025,1 - = 0.975, n 1 = 15,查 x 2(n 1)分布表可知:22X2 (15) = 27.488, X2 (15) = 6.262,计算得s = 6.2022,代入公式得标准差的置信0.0250.975区间(4.58, 9.60)(二)两个正态总体的情形在实际中常遇到下面的问

22、题:已知产品的某一质量指标服从正态分布,但由 于原料、设备条件、操作人员不同,或工艺过程的改变等因素,引起总体均值、 总体方差有所改变,我们需要知道这些变化有多大,这就需要考虑两个正态总体 均值差或方差比的估计问题。 TOC o 1-5 h z HYPERLINK l bookmark52 o Current Document 设总体X N(日,a2),Y N(日q2),且X与Y相互独立,(X ,X,X )来112212n自X的一个样本,(Y ,Y ,.,Y )为来自Y的一个样本,对给定置信水平为1-a, 12n且设X, Y, S:, S;分别为总体X与Y的样本均值与样本方差。1.求*-%的置信区间:1)当b2,b2已知时:由抽样分布可知:U =(X Y)(% 一四2) N(0,1):b 2。2 m n所以可以得到四-七的置信水平为1 -a的置信区间为:2)当*2,b;未知时,但m,n均较大(大于50),可用S;和S;分别代替式中b2,b2,则可得(* - %)的置信水平为1 -a的近似置信区间为:(X - Y) |1-1-a当b 2 = b 2 = b 2,且b 2未知时,由抽样分布可知:若令S *2 = _I* + (n_,12m + n 一 2贝行=(X 一 七一四之) t (m + n - 2)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论