数理统计课件:抽样分布_第1页
数理统计课件:抽样分布_第2页
数理统计课件:抽样分布_第3页
数理统计课件:抽样分布_第4页
数理统计课件:抽样分布_第5页
已阅读5页,还剩194页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

抽样分布及若干预备知识2.1抽样分布的概念2.2三大分布和分位数2.3抽样分布定理

抽样分布2.4指数族2.5充分统计量2.6完备统计量2.1抽样分布的概念统计量是样本X1,X2,…,Xn的函数,而样本X1,X2,…,Xn又是随机变量,故统计量也是随机变量,统计量的分布称为“抽样分布”.用样本对总体进行统计推断的做法如下首先,根据需要研究的总体特性,构造包含这个总体特性信息的统计量;然后,求出统计量的分布即抽样分布,并由此给出统计推断的结论或解释.研究统计量的性质和评价一个统计推断的优良性,取决于抽样分布的性质,确定统计量的抽样分布是数理统计的一个基本问题.近代统计学的创始人之一,英国统计学家费歇(R.A.Fisher)把抽样分布、参数估计和假设检验列为统计推断的三个中心内容.因此寻求抽样分布的理论和方法很重要.抽样分布精确分布极限分布(渐近分布)当总体分布类型已知,若对于任一自然数n,都能导出统计量T分布的表达式,这种分布称为T的精确抽样分布.说明1:能求出统计量精确分布的情形不多.已知的精确分布大多是在正态分布条件下得到.说明2:有些情形下虽然能求出统计量的精确分布,但是其表达式太复杂,使用不便;更多情形下,统计量的精确分布很难求出.精确抽样分布当样本容量n趋于无穷时,统计量T的分布称为极限分布.极限分布说明:只要样本容量足够大,且极限分布的形式比较简单,可以用统计量的极限分布作为其精确分布的近似.例2.1.1设X1,X2,…,Xn是来自两点分布总体B(1,p),0<p<1的样本,即P{X1=1}=p,P{X1=0}=1–p,求的分布.

解:由于因此例2.1.2设X1,X2,…,Xn是来自正态总体N(μ,σ2)的样本,求的抽样分布.

解:因为,其特征函数为而X1,X2,…,Xn相互独立,根据特征函数的性质得到的特征函数为因此例2.1.3设X1,X2,…,Xn是来自总体X的样本,且X的分布函数为F(x),(

X(1),X(2),…,X

(n))

是其顺序统计量,则对1≤r≤n,X

(r)的分布函数为若总体X为连续型且有密度函数f(x)

,则X

(r)也有密度函数为因为记则证明:这一事件的概率可用二项分布B(n,F(x))表示,因此于是有利用恒等式可知若总体X为连续型且有密度函数f(x)

,则X

(r)也有密度函数为特别当r=1时,得最小顺序统计量X(1)的分布函数和密度函数分别为特别当r=n时,得最大顺序统计量X(n)的分布函数和密度函数分别为例2.1.4设X1,X2,…,Xn是来自均匀分布总体U[0,

]的样本,求X

(1),X

(n)的密度函数解:X

1的分布函数为X

1的密度函数为因此,X(1)的密度函数为X(n)的密度函数为作业:习题2.1:2,4,6,72.2三大分布和分位数记做

ξ

所服从的分布称为自由度为

n

的χ2分布.其中

n为独立随机变量的个数.1定义2.2.1(χ

2分布):设X1,X2,…,Xn

独立同分布,

且都服从标准正态分布N(0,1),令则称随机变量ξ

是自由度为n的χ2变量.2.2.1

χ

2分布来定义.其中伽玛函数通过积分设随机变量,则ξ

的密度函数为2定理2.2.1(χ

2分布的密度函数)

的联合密度函数为的分布函数为当x>0时,证明:作球坐标变换

令令当x>0时,当x≤0时,因此,ξ

的密度函数为特别,当n=2时,其密度函数为是数学期望为2的指数分布.下图画出了n=1,4,10,20几种不同自由度的χ2分布的密度函数的图形.说明1.χ2(n)的密度函数的支撑集(使密度函数为正的自变量的集合)是(0,+∞);

2.当自由度n

越大,χ2(n)的密度函数的曲线越趋于对称,且

根据中心极限定理趋于正态分布;3.当自由度n

越小,χ2(n)的密度函数的曲线越不对称.性质1:

,则

3χ2分布的性质E(ξ)=n,D(ξ)=2n.(2)ξ

的数学期望和方差分别为(1)ξ

的特征函数为证明:(1)由特征函数定义,得其中

X1,X2,…,Xn独立同分布,且X1~N(0,1),则(2)法一:定义法法二:特征函数法由于因此χ2分布的可加性(再生性)证明:由χ2分布的定义知:其中,Ui~N(0,1),i=1,2,…,n1,且相互独立Vj~N(0,1)

,

j=1,2

,…,n2,且相互独立又由于X1,X2相互独立,得Ui

与Vj独立同分布,均服从N(0,1)因此性质2(可加性):设且X1与X2相互独立,则法一:定义法法二:特征函数法由性质1,得X1,X2的特征函数分别为因为,X1,X2相互独立,因此,X1+X2的特征函数是由特征函数和分布函数相互唯一确定,得X1+X2也服从卡方分布,自由度为n1+n2推广例2.2.1设总体X~N(0,1),X1,X2,…,X6为来自总体X的样本,记X1+X2

+X3~N(0,3),X4+X5

+X6~N(0,3)

由于X1,X2,…,X6独立同分布,且都服从N(0,1),因此因此c=1/3.解:试确定常数c,使cY

服从χ2分布.相互独立其中α>0为形状参数,λ>0为尺度参数,则称X服从参数为(α,λ)的伽玛(Gamma)分布,记作X~

Ga(α,λ).伽玛(Gamma)分布Ga(α

,λ)如果

X的密度函数是是数学期望为1/λ的指数分布.1.当α=1时,Ga(1,λ)

的密度函数为说明2.如果α=n/2,λ=1/2,其中n为自然数,则有是自由度n的χ2分布.记做T~t(n).其分布称为自由度为n的t分布.t分布又称学生氏(student)分布.为自由度为n的t变量.2.2.2

t分布1定义2.2.2(t分布)设随机变量X~N(0,1),Y~χ2(n),且X与Y相互独立,则称随机变量(X,Y)的联合密度函数为2定理2.2.2设随机变量T~t

(n),则T的密度函数为证明:则令该变换的雅可比行列式为因此,(T,U)的联合密度函数为T的密度函数为:下图画出了n=2,5两种不同自由度的t分布的密度函数的图形.3t分布的性质性质1:

t分布的密度函数关于y轴对称,且性质2:

t分布的密度函数曲线形状是中间高,两边低,左右对称,与标准正态分布的密度函数图像类似,且

t(2)与N(0,1)的密度函数曲线的对比对于较小的n,t分布与N(0,1)分布相差很大.

t

分布与标准正态分布的一个重要区别是:在尾部t分布比标准正态分布有更大的概率.

t(20)与N(0,1)的密度函数曲线的对比当n充分大时,t

分布近似N(0,1)分布.特别地设T~t(n)

数学期望为:当n>1时,

E(T)=0方差为:当n>2时

,D(T)=n/(n-2)性质3:证明:因此性质4:当n=1时,其密度函数为此时,t分布就是柯西分布,其数学期望不存在.例2.2.2设总体X与总体Y相互独立,且X~N(0,16),Y~N(0,9),X1,X2,…,X9

Y1,Y2,…,Y16

分别是来自总体X与总体

Y的样本,

求统计量所服从的分布.解:X1+X2

+…+X9~N(0,144)

且上述两个随机变量相互独立,因此且上述两个随机变量相互独立,因此根据t分布的定义得到其所服从的分布称为F分布,记做为自由度为m和n的F变量.2.2.3

F分布1定义2.2.3(F分布)设随机变量,且X与Y相互独立,则称随机变量其中m称为第一自由度,n称为第二自由度.2定理2.2.3设随机变量F~F(m,n)

,则F的密度函数为证明:(X,Y)的联合密度函数为令则该变换的雅可比行列式为于是(U,V)的联合密度函数为U的密度函数为因此F的密度函数为下图画出了几种不同自由度的F

分布的密度函数的图形.思考:峰值与多少接近,为什么?证明:根据F分布的定义设且X与Y相互独立,则随机变量性质1:因此3F分布的性质设随机变量F~F(m,n),则1/F~F(n,m).因为

T~t(n)

因此存在X~N(0,1),Y~χ2(n),且X与Y相互独立,使得

性质2:证明:由于X2~χ2(1),且X2与Y相互独立,使得

特别地性质3:设

X~F(m,n),则对r>0,有

练习:随机变量X和Y都服从标准正态分布,则(1)X+Y服从正态分布(2)X2+Y2服从

2分布(3)X2和Y2都服从

2分布(4)X2/Y2服从F分布

三大分布的定义(构造性)及其性质1

χ2分布,t分布,F分布奠定了后续正态分布统计推断的基础2三大分布小结2.2.4分位数定义2.2.4(分位数)设随机变量X的分布函数为F(x),对于实数

,0<

<1,若x

满足P{X>x

}=

,则称x

为X的概率分布的上

分位数(或分位点),简称

分位数.若X的密度函数为f(x),则xα满足

x

上分位数x

的单调递减函数.一标准正态分布

设随机变量X~N(0,1),给定实数

(0<

<1),若u

满足P{X>u

}=

,则称

u

为标准正态分布N(0,1)的上

分位数(分位点).Φ(u

)=P{X≤u

}=1−P{X>u

}=1−

u

1−

性质1:Φ(u

)=1−

证明:性质2:u1−

=

−u

得−X~N(0,1)

P{X>−u

}=P{−X<u

}=1−P{−X≥u

}

=1−

P{X>u1−

}=1−

因此

u1−

=

−u

u

u1−

常用数字u0.05=

1.645u0.025=1.96证明:由

X~N(0,1)

-u

例2.2.3设随机变量X~N(0,1),求常数c,使其满足P{|X|>c}=.解:由X~N(0,1)

c

=u

/2得

α=

P{|X|>c}=

P{X>c}+P{X<−c}=2P{X>c}因此P{X>c}=

/2即P{|X|>u

/2}=

P{|X|≤u

/2}=

1-

u

/2/2-u

/2/2区间估计假设检验二t分布设随机变量X~t(n),给定实数

(0<

<1)

,若t

(n)满足P{X>t

(n)}=

,则称t

(n)为自由度为n的t分布的上

分位数(分位点).性质2:当n较大(n>45)时,t

(n)≈u

性质1:t1−

(n)=−t

(n)t

(n)

t1−

(n)

例2.2.4求

t0.025(200).解:根据u0.025=1.96

t

(n)≈u

得到

t0.025(200)≈u0.025=1.96

.t

/2

(n)

/2

/2-t

/2

(n)f(x)例2.2.5设随机变量X~t(n),求常数c,使其满足P{|X|>c}=.解:由X~t(n)

α=

P{|X|>c}=

P{X>c}+P{X<−c}=2P{X>c}因此P{X>c}=

/2即P{|X|>t

/2(n)}=

P{|X|≤t

/2(n)}=

1-

区间估计假设检验三

2分布:设随机变量X~

χ2(n)

,给定实数

(0<

<1),若χ2α(n)满足P{X>χ2α(n)}=

,则称χ2α(n)为自由度为n的

2分布的上

分位数(分位点).f(x)αα例2.2.6设随机变量X~

χ2(n),则f(x)α/2α/2区间估计假设检验四F分布

设随机变量X~F(m,n),给定实数0<

<1,

若Fα(m,n)满足

则称

Fα(m,n)

为自由度为m,n的F分布的上

分位数(分位点).f(x)αα设随机变量X~

F

(m,n),则f(x)α/2α/2区间估计假设检验证明性质:因此设随机变量X~F(m,n),则解:例2.2.7查表得到查表计算根据公式得到N(0,1),t分布,χ2分布,F分布小结1分位数区间估计和假设检验2应用对于固定的α(0<α<1),书后附表分别给出了相应的分位数.作业:习题2.2:2,6,8,1,3,7,102.3抽样

分布定理定理2.3.1:设随机变量X1,X2,…,Xn

相互独立,且

令c1,c2,…,cn为常数且不全为0,记2.3.1精确抽样分布其中则证明:利用特征函数证明.一

相互独立正态随机变量线性函数的分布证明:因为其特征函数为因此T的特征函数为T的特征函数为其中由特征函数和分布函数相互唯一确定,得在定理2.3.1中,若在推论2.3.1中,若推论2.3.1:则推论2.3.2:则对于独立同分布的正态随机变量的线性变换,有如下结论为nxn的常数方阵,记Y=AX,即则有定理2.3.2:设随机变量X1,X2,…,Xn独立同分布,且1.Y1,Y2,···,Yn是正态随机变量,且2.

当为n阶正交阵时,Y1,···,Yn也相互独立,且其中3.

若μ=0,则Y1,Y2,···,Yn独立同分布,且证明:1.因为,根据推论2.3.1有因此2.当为n阶正交阵时,根据正交阵A的不同行和列的正交性得到当i≠j时因此于是Y1,···,Yn相互独立,且其中3.若μ=0,则因此,Y1,Y2,···,Yn独立同分布,且引理2.3.1:设X1,X2,…,Xn是来自总体X(不管是什么分布)的一个样本,且EX=μ,DX=σ2,则其中为样本均值为样本方差二几个重要定理证明:定理2.3.3:设X1,X2,…,Xn是来自正态总体N(μ,σ2)的样本,且分别表示样本均值和样本方差.则有即和相互独立.(1)由推论2.3.2得:为一正交阵作正交变换Y=AX,其中Y和X如定理2.3.2所示.(2)设证明:由正交变换保持向量长度不变可知因此所以由定理2.3.2知由A的行向量正交性得Y1,Y2,···,Yn相互独立,且于是因此,Y2,···,Yn独立同分布,且(3)由(2)的证明可知只和Y2,···,Yn有关只和Y1有关因此和相互独立.Y1,Y2,···,Yn相互独立则定理2.3.4:设X1,X2,…,Xn是来自正态总体N(μ,σ2)的样本,证明:则Y1,Y2···,Yn独立同分布,且Y1~N(0,1).因此由于

X1,X2,…,Xn独立同分布,且X1~N(μ,σ2),令定理2.3.5:设X1,X2,…,Xn是来自正态总体N(μ,σ2)的样本,分别为样本均值和样本方差.则有证明:根据定理2.3.3且和相互独立.由t

分布的定义,得到定理2.3.6(两正态总体样本均值差的分布)设Y1,Y2,…,Yn是来自总体Y的样本,设X1,X2,…,Xm是来自总体X的样本,设总体X~N(μ1,σ2),Y~N(μ2,σ2),且X与Y相互独立,分别为样本均值.分别为样本方差.则有其中证明:且可得由U,V独立,及t分布的定义,得独立独立独立定理2.3.7(两正态总体样本方差比的分布)设Y1,Y2,…,Yn是来自总体Y的样本,设X1,X2,…,Xm是来自总体X的样本,设总体X~N(μ1,σ12),Y~N(μ2,σ22),且X与Y相互独立,分别为样本均值.分别为样本方差.则有证明:由于由于与相互独立,根据F分布的定义,得证明由于2λX1的密度函数为恰好是自由度为2的χ2分布,即其中λ>0定理2.3.8(指数分布总体样本均值的分布)设X1,X2,…,Xn是来自指数分布总体X的样本,且X的密度函数为证明:由独立同分布,得到根据χ2分布的可加性,得到独立同分布,且都服从χ2(2)分布.例2.3.1设X1,X2

,…,Xn是来自正态总体N(μ,σ2)的样本,

又设Xn+1~N(μ,σ2),且Xn+1与X1,X2

,…,Xn相互独立,分别为样本均值和样本方差,

则有证明:由定理2.3.3(1)(2),得且它们相互独立.由于Xn+1与X1,X2

,…,Xn相互独立.所以与Xn+1相互独立,且因此由

t分布的定义,得从而又与相互独立根据相互独立正态随机变量的线性组合服从正态分布,得例2.3.2设总体X~N(1,σ2),总体Y~N(2,σ2),且X与Y相互独立,X1,X2,…,Xm

是来自总体X的样本,Y1,Y2,…,Yn是来自总体Y的样本,

是两个固定的实数,求T的分布.分别为样本均值.分别为样本方差.解:根据定理2.3.3(1),有根据相互独立正态随机变量线性组合仍服从正态分布,得又根据定理2.3.3(2),有根据两样本的独立性和定理2.3.3(3),得U与V相互独立.根据两样本的独立性和卡方分布的可加性得因此,根据

t分布的定义得到当样本容量n趋于无穷时,统计量的分布趋于一确定分布,则后者的分布称为统计量的极限分布,也称为大样本分布.当样本容量n充分大时,极限分布可作为统计量的近似分布.当样本容量n趋于无穷时,一个统计量或统计推断方法的性质称为大样本性质;定义2.3.1定义2.3.2当样本容量n固定时,统计量或者统计推断方法的性质称为小样本性质.2.3.2极限分布1.当统计量的精确分布很难求,建立统计量的极限分布提供了一种近似获得抽样分布的方法.2.有时统计量的精确分布虽然可求出,但是表达式过于复杂,使用不方便.若极限分布较简单,可使用极限分布.3.有些统计推断方法的优良性本身就是研究其极限性质,如相合性、渐近正态性.研究统计量的极限分布有如下意义:设为样本均值.解:(1)根据大数定律,得刻画了样本均值的相合性(大样本性质).例2.3.3设X1,X2

,…,Xn是来自总体X的样本,且X~F,其中总体均值µF和方差σF2都存在.讨论样本均值的大样本性质和小样本性质.(2)根据中心极限定理,得刻画了样本均值的渐近正态性(大样本性质).(3)由于刻画了样本均值的无偏性(小样本性质).大样本性质只有在n趋于无穷时才有意义.这条性质的意义是在样本容量n固定时去理解.例2.3.4若X~χ2(n),则证明:由χ2分布的定义,X可以写成如下形式其中,Ui~N(0,1),i=1,2,…,n1,且相互独立由EX=n,DX=2n,根据中心极限定理得到令{Xn,n≥1}

和{Yn,n≥1}是两个随机变量序列,满足当n→∞时为常数定理2.3.9(Slutsky引理)则有例2.3.5设X1,X2,…,Xn是来自两点分布总体B(1,p),0<p<1的样本,证明证明:令则由中心极限定理得到由大数定律得到且因此,根据Slutsky引理可知由于作业:习题2.3:2,4,6,8,1219,20,212.4指数族统计理论问题中,许多统计推断方法的优良性,对一类范围广泛的统计模型(也称为分布族)有比较满意的结果,这类分布族称为指数型分布族.常见的分布,如二项分布、Poisson分布、几何分布、指数分布、正态分布和伽玛(Gamma)分布都可以统一在指数型分布族中.2.4.1指数族的定义与例子定义2.4.1设是定义在样本空间χ

上的分布族,其中Θ为参数空间.若f(x,

θ)可以表示为如下形式则称此分布族为指数型分布族(简称指数族).其中f(x,

)在离散情形表示分布列,连续情形表示密度函数,k为自然数,C(

)>0和Qi(

)(i=1,2,…,k)都是定义在参数空间

Θ上的函数.

h(x)>0,

和Ti(x)(i=1,2,…,k)都是定义在样本空间χ上的函数.一指数族的定义的表示不唯一.1支撑集与

无关,即23或说明例2.4.1二项分布族{B(n,

):0<

<1}是指数族.样本空间为χ={0,1,2,…,n}.参数空间为Θ={

:0<

<1}.

设X~B(n,

),其分布列为证明:二指数族的例子其中满足指数族的定义,因此二项分布族是指数族.证明:例2.4.2泊松分布族{P(

):

>0}是指数族.设X~P(

),其分布列为样本空间为χ={0,1,2,…,}.参数空间为Θ={

:>0}.

其中满足指数族的定义,因此泊松分布族是指数族.样本X1,X2,…,Xn的联合密度函数为记=(μ,σ2),则参数空间为证明:例2.4.3设X1,X2,…,Xn是来自正态总体N(μ,σ2)的样本,则样本分布族是指数族.其中满足指数族的定义,因此上述样本分布族是指数族.特别地,取样本容量n=1,X1的密度函数为满足指数族的定义,因此正态分布族是指数族.其中X1的密度函数为证明:例2.4.4设X1,X2,…,Xn是从伽玛分布Ga(α,

),α>0,

>0中抽取的样本,则样本分布族是指数族.则样本X1,X2,…,Xn的联合密度函数为记

=(α,

),则参数空间为其中满足指数族的定义,因此上述样本分布族是指数族.与未知参数

有关,因此均匀分布族族{U(0,

):

>0}不是指数族.均匀分布族的支撑集为证明:例2.4.5均匀分布族{U(0,

):

>0}不是指数族.其中-∞<

<

∞和μ

>0是为未知参数,它的支撑集为证明:双参数指数分布的密度函数为与未知参数μ有关,若μ已知,如μ=0,因此双参数指数分布不是指数族.例2.4.6双参数分布族{Exp(

,µ):

>0,-∞<µ<∞}不是指数族.则单参数指数分布族{Exp(

):

>0}是指数族.2.6.2指数族的自然形式及自然参数空间则称它为指数族的自然形式(标准形式).此时集合称为自然参数空间.定义2.4.2:如果指数族有下列形式一指数族自然形式的定义例2.4.7把二项分布族表示成指数族的自然形式(标准形式),

并求出自然参数空间.解:二项分布的指数族形式为令参数空间为可知解出二指数族自然形式的例子其中因此二项分布族的自然形式(标准形式)为自然参数空间为解:例2.4.8把泊松布族表示成指数族的自然形式,并求出自然参数空间.泊松分布的指数族形式参数空间为Θ={

:>0}.

令可知解出其中因此泊松分布族的自然形式(标准形式)为自然参数空间为正态分布的指数族形式为记=(μ,σ2),则参数空间为解:例2.4.9设X1,X2,…,Xn是来自正态总体N(μ,σ2)的样本,将样本分布族表示为指数族的自然形式(标准形式),并求出自然参数空间.令解出其中因此样本分布族的自然形式(标准形式)为自然参数空间为在指数族的自然形式下,自然参数空间为凸集.证明:指数族的自然形式为自然参数空间为定理2.4.1:设任取则即此处用了Holder不等式.则因此,在指数族的自然形式下,自然参数空间为凸集.作业:习题2.4:3,4,5,6,72.5充分统计量统计量是对样本的简化,希望:简化程度高,同时信息损失少.一个统计量能集中样本中信息的多少,与统计量的具体形式有关,也依赖于问题的统计模型,我们希望所用的统计量能把样本中关于未知参数的信息全部“提炼”起来,即说不损失(重要)信息的统计量——充分统计量.问题:如何定义一个统计量是充分统计量?引例:设X=(X1,X2,…,Xn)是从0-1分布中抽取的简单随机样本,且P{Xi=1}=

,P{Xi=0}=1-

,记若只对

作推断,

T(X)与样本含的信息一样,即T(X)应该是充分统计量.则T(X)与样本(X1,X2,…,Xn)相差的仅仅是,

X1,X2,…,Xn中1的具体位置.样本(X1,X2,…,Xn)加工成统计量T(X1,X2,…,Xn)后,一般来说在信息上会有所损失,但是如果加工抓住了问题的实质,回到引例直观上:如果一个统计量满足这个要求,就称其为充分统计量.即:统计量T(X1,X2,…,Xn)保留了样本(X1,X2,…,Xn)中所含参数

的全部信息,丢掉的就是一些无关紧要的东西.样本X1,X2,…,Xn的分布,记

如何定义充分统计量?统计量T(X)的分布关于样本X=(X1,X2,…,Xn)的信息可以设想成如下公式{样本X中的信息}={T(X)中所含样本的信息}+{除了T(X)中的信息外,样本X含有的信息}因此T(X)为充分统计量的要求归结为要求后一项信息为0用统计语言描述为,即要求与

无关,其中A为任一事件.2.5.1充分统计量的定义和例子定义2.5.1设样本X1,X2,…,Xn的分布族为设T=T(X1,X2,…,Xn)为一统计量,若在给定T的条件下,样本X1,X2,…,Xn的条件分布与参数

无关,则称统计量T(X1,X2,…,Xn)为参数

的充分统计量.说明:1.充分统计量必存在.2.条件分布的作用是抽取信息.实际应用时,条件分布用条件概率(离散情形)和条件密度函数(连续情形)代替.样本本身是充分统计量,顺序统计量是充分统计量.3.充分统计量可以是向量,即不一定与参数的维数相同.(例2.5.9)为充分统计量.记T=T(X1,X2,…,Xn),按照定义只要证明下列条件概率与参数

无关.证明:例2.5.1

设X1,X2,…,Xn是来自两点分布总体B(1,

)的样本,证明两点分布的分布列为当T=t

时,有因此,有上述条件概率与参数

无关.因此是充分统计量.为充分统计量.记T=T(X1,X2,…,Xn),按照定义只要证明下列条件概率与参数

无关.证明:例2.5.2

设X1,X2,…,Xn是来自几何分布总体G(

)的样本,证明几何分布的分布列为由几何分布的性质知,T的分布列为当T=t

时,有因此,有上述条件概率与参数

无关.因此是充分统计量.因此,T(X1,X2,…,Xn)=X1不是充分统计量.证明:与µ有关.例2.5.3设X1,X2,…,Xn是来自正态总体N(µ,1)的样本,则不是充分统计量.记T=T(X1,X2,…,Xn),在T=x1条件下,X1,X2,…,Xn的条件密度函数为证明:例2.5.4设X1,X2,…,Xn是来自正态总体N(µ,1)的样本,证明为充分统计量.记T=T(X1,X2,…,Xn),由正态分布的性质知,在给定在T=t

条件下,X1,X2,…,Xn的条件密度函数为上述条件密度函数与参数与µ

有关,因此为充分统计量.例2.5.4中,仅有一个未知参数

µ

,如果其方差也是未知的,则利用定义来求充分统计量比较困难;从上面的例子也可以看出,求充分统计量,必须先猜测一个统计量,之后再用定义证明,这很不便于利用,于是有如下的因子分解定理.2.5.2因子分解定理因子分解定理是由R.A.Fisher在20世纪20年代提出,它的一般形式和严格数学证明是由Halmos和Savage在1949年给出.T=T(X1,X2,…,Xn)是充分统计量的充要条件是f(x1,x2,…,xn,

),可以分解为定理2.5.1(因子分解定理)设样本X1,X2,…,Xn的联合密度函数(或联合分布列)为f(x1,x2,…,xn,

),T=T(X1,X2,…,Xn)是一个统计量,则其中

h(x1,x2,…,xn)不依赖于参数

.充分统计量的一一变换不改变统计量的充分性.证明:存在逆函数T=k(S),因为

S

(T)是单值可逆函数,根据因子分解定理取则根据因子分解定理,S

(T)是

的充分统计量.推论2.5.1设T=T(X1,X2,…,Xn)为

的充分统计量,S(T)是单值可逆函数,则S(T)也是

的充分统计量.证明:例2.5.5设X1,X2,…,Xn是来自正态总体N(µ,1)的样本,证明为充分统计量.由例2.5.4是参数µ的充分统计量,因为

与一一对应.因此是µ的充分统计量.但是不是µ的充分统计量.样本X1,X2,…,Xn的联合分布列为根据因子分解定理,知为充分统计量.证明:其中h(x1,x2,…,xn)=1.为充分统计量.例2.5.6

设X1,X2,…,Xn是来自两点分布总体B(1,

)的样本,则样本X1,X2,…,Xn

的联合密度函数为为充分统计量.

证明:其中h(x1,x2,…,xn)=1.例2.5.7设X1,X2,…,Xn是来自正态总体N(µ,σ2)的样本,令

=(µ,σ2),则根据因子分解定理,知为充分统计量.由于与为一一对应的变换.根据推论2.5.1可知也为充分统计量.为充分统计量.根据因子分解定理,知为充分统计量.其中例2.5.8设X1,X2,…,Xn是来自均匀分布总体U[0,

]的样本,则样本X1,X2,…,Xn

的联合密度函数为证明:为充分统计量.例

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论