Poisson分布的参数估计_第1页
Poisson分布的参数估计_第2页
Poisson分布的参数估计_第3页
Poisson分布的参数估计_第4页
Poisson分布的参数估计_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Poisson分布的参数估计作者:高晨指导老师:戴林送摘要泊松分布是概率统计学科中一种重要的离散分布,在参数估计这块,对点估计,矩估计,最大似然估计以及近似的区间估计等,该文中对泊松分布的相关知识,包括其性质,参数的相关估计,研究了泊松分布的一些性质,参数的估计,以及一些在生活中的简单应用。关键词Poisson分布参数估计性质简单应用1引言Poisson分布是离散型随机变量X作为大量试验中稀有事件出现的频数的概率分布的数学模型,其中X可能取值为0,1,2,……而取各个值的概率为:P{x=k}= ,k=0,1,2其中入>0是常数,称X服从参数为入的泊松X~P(k;x).••1.1相关定义1-离散型随机变量X的函数分布律P{X=x}=p,k=O,1,2,若级数*xp绝kk kkk=1对收敛,称级数*乂此为随机变量X的数学期望E[x],k=1对收敛,E[x]=*xp.k=12.定理:Y是随机变量X的函数,Y=g(x),(g是连续函数),X是离散型随机变量,若*g(x)p绝对收敛,则kkk=1E[Y]=E[g(x)]=*gR)pk.k=13-随机变量X,若E{[X-E(X)]2}存在,则称E{[X-E(X)]2}为X的方差,记为D(x)或Var(x),即D(x)=Var(x)=E{[X-E(X)]2}.bG)=3(X)(与X有相同的量纲),称为标准差或均方差。注记:D(x)是刻画X取值分散程度的一个量,也可以看成是函数g(x)=[X-E(X)]2的数学期望。离散型随机变量X,TOC\o"1-5"\h\zz 2D(x)=井[xk-E(X)]pk.k=1其中P{X=x^}=pk,k=1,2,3是X的分布律。D(x)=E(x2)-[E(x)]2.2性质 ---2.1.Poisson分布中P{x=k}>0,k=0,1,2具有EP{x=k}=£g=e-EM=e*=1

k! k!k=0 k=0 k=0即P{x=k}满足P>0,k=0,1,2;若P=1. .k=1我们知道,无论是离散型或是非离散型的随机变量X都可以借助分布函数F(x)=P{X<x},—gjxV+3来描述,X落在任意区间[x「x2]的概率P{x<X<x}=F(x)-F(x).1 2 2 1f…人kP{X=k}=k!e-人,人〉0,k=0,1,2,X〜P(k;x).2.2数字特征 …2.21数学期望Poisson分布:人ke项P{x=k}=-kp,k=0,1,2g7冗ke项. y冗k-1E[x]= k =Ae-入乙 =Ke土e^=A.k=0 k, k=1(k1'2.22方差Poisson分布人ke-入P{x=k}=———,k=0,1,2,人〉0的方差D(x).k!

由上知,Poisson分布的数学期望为参数人,E[X2]=E[X(X-1)+X]=E[X(X-1)]+E[X]E[X(X-1)]+E(X)E*e-xk(k—1) +人k!k=0EXk-2 +Xk=2=X2e—XeX+X=X2+XD(X)=E(X2)—[E(x)]2=X.Poisson分布E[x]=D(x)=X,也就是说在Poisson分布中只含有一个参数X,只要知道一个Poisson分布的数学期望或者方差就能够完全确定它的分布。3相关定理定理【1】随机变量x〃(n=1,2,3 )服从二项分布,其分布律为TOC\o"1-5"\h\zP{x=k}=Ckpk(1—p)n—k,k=0,1,2 ,n.又设np^=X>0是常数,Xke—xlim尸{x=k}= \o"CurrentDocument"nsn k!证明由np=X>0得:P{'n=k}=H[n]n[1-nin--=k—1k—1Xn—k——]}X[1——]〃nnn—{1X[1—-]X[1—-]X・・・X[1—k! n显然当k=0时,故P{x〃=k}—e-X。1X[1—1]X[1—2]X X[1—^z1]t1,[1—X]nLTe-X\o"CurrentDocument"nn n nXeXe—Xk!P{xn

Xke-XlimP{x=k}= n—3n k!定理[2]设pX是服从参数为X的泊松分布的随即向量,则:limP{(p-X)/抓<x}=Jjxe-t22dtX—3 ' <2k-3的特征函数为:证明 已知M的特征函数为%(t)=ew-1)做气=(£X一的特征函数为:gX(t)=OX(乐)e-广折=e履注1对任意的t,有房=1+*-金+。|_!〔(X—3).于是人象—1—而=一人象—1—而=一v7,有;+X-°r1\X

kX7从而对任意的点列X—8_X2limg(t)=e-2.X—3n{f(x)}n但是e土是N(0,1)分布的特征函数,由于分布函数列{F(x)}弱收敛于分布函数F(x)的充要条件是相应的特征函数列{①(t)}收敛于F(x){f(x)}n所以limP人一3nXV1 . 2-^=j所以limP人一3nXV1 . 2-^=jxe-12dt⑵-3成立;又因为X是可以任意选取的,这就意味着'<xlimP1.一一^=je-2dt成立.v2kxeT2一34参数估计0=(0,0=(0,+3)=h:XeR+}为估计母体的参数。值的大小,具体抽取样本值(xi,x2,&〜P(x;X)上e-X。为估计母体的参数。值的大小,具体抽取样本值(xi,x2,x)。再把样本值(x,x,x)放

n 1 2n

入原来的样本(&,&,&)。构造统计量0(&,&,&)。把(x,X,x)代入得6的统计1 2n 1 2n 1 2n值0(x1x〃)用作6的近似值,用来计算参数0的估计值的统计量0(&「&2,&n)称为参数0的估计量。 … … …4.2参数的两个最大似然估计人ke-人P{x=k}= ,k=0,1,2人>0为未知参数k!设x,xx为子样&,&,&一组观测值TOC\o"1-5"\h\z1 2n 1 2n似然函数L(人)=L(X;X,x,x)=^X1e』立…Se-似12nx!x!x!x!1 n 1\o"CurrentDocument"lnL=nX+乙lnXJEln(x!) ...i=1 i=1. alnL1-八-d2lnL办2L是X的可导函数,用导数求极值~a^=-n+^^xd2lnL办2<0得人使L达到极大值,从而得X的极大似然估计量X(&,&)=&。\o"CurrentDocument"_ L1nX=x设0的函数侃=u(0),0e0具有单值反函数0=0(u),uG",又设0是・x的概率分布中参数0的最大似然估计,则u=u(0)为u(0)最大似然估计。易知,由e-X的单调性,得e-X的一个最大似然估计为u=e-x1在讨论估计量的性质之前,给出该参数的另一个最大似然估计量。对样本做如下变换:1,Xi=0,0,X。0.这样得到来自总体Y的样本,其中Y服从两点分布b(1,0),其中0=P{Y=1}=P{X=0}=e-X,这正是待估计的参数。容易知道0=e-X的最大似然估计为I%, ,Yn的样本均值u2=n边=n£1(xi=0)i=1 i=1其中1 —<八,(X斥0)为示性函数。1,X=0,i0,X丰0这样我们就得到同一个参数的两个最大似然估计量:- 1了1u=e-x,u— 1 .由于前者利用了泊松分布的信息,而后者没有利用分布信息,所以称前者为“参数的最大似然估计”,后者为“非参数的最大似然估计”。4.3参数的无偏估计当总体为泊松分布P(人)时,即r 、人X- 八一―P{X—x}———e-人,X=0,1,2

x!未知参数e=九〉0,可以证明样本均值X和样本方差s2.—二£(x-X)都是总体参n-1 'i—1数e-人的无偏估计。推广到一般情况,对任意的实数a,0<a<1,aX+(1-a)S2也都是人的无偏估计,即0—人—X或S2或aX+(1-a)S2。引理1设(X1Xn)是来自该总体泊松分布的一个样本,则nX—^^X^〜P(n人)。i—1证明因为X]〜p(X),x2〜p(人),且X1和X2相互独立,X=X1+X2的概率分布为P(X)—uP(X)P(X-X)—^2^2Xe-2X,

X1X2 X!X—0即X=X1+X2〜P(2X).由归纳法得到nX—^^X〜P(nX).i—1结论1设函数g](0)—g1(X)=e,可以证明g](x)的无偏估计为2Xi,而不是g(0)—ex.1

1E(g1(0))=E(g1(X))=E(ex)=E(e“(nX))=£e:P(nX=X)=£et也^e-n芳exx=0 x=0 •E(2x,)=£2xP(X=x)=£2x工e-xx!x=0 x=0£(2X)x=e-XA =e-Xe2x=exx!x=0结论2已知函数g(°)=g(X)=e-2人22可以证明/)的无偏估计为t(t(X.)=〈I-1(X,取偶数值时为1'X,取奇数值时为-1),而不是g2(°)=e-2X.证明E(g2(°))=E(g2(人))=E(e-2X)=E(e"X))=£e弋P(nX=X)x=0V=2X(nX)X=Jen e-nX丰e-2xX!X=0令估计量t(X,)=f(X,),而=e-x£(-1)xXix!x=0E(t=e-x£(-1)xXix!x=0=E(-1)x土-Xx!x=0=e-Xe-X=e-2X.结论3再考虑g3(e)=g‘(泠八2也是未知参数X的-个函数,但它的无偏估计不是 1EX2而是-云X,(X,-1).=1证明—— 工/二'VZ2 一E(X2)=E(e〃2("X)2)=乙enP(nX=X)EZEZen2X=0也Ze-n"人2Z!而TOC\o"1-5"\h\zE(18X(X-1))=E(1Ex.2-1£E(X))

n] , , n] ,n] ,=L£e(x.2)--£e(X.)ni=1 ni=1=1£"人2)—1&ni1 ni1=人2结论4已知函数g结论4已知函数g"。)=g^Xq,可以证明g4(冗)的无偏估计为1,X=00,X丰0而不是g(。)=e-X。4证明TOC\o"1-5"\h\zE(g(0))=E(g(人))=E(e-x)=E(e-n(n))4 4=£e:P(底=X)=£e:普e-n丰e-冗令估计量d(X.)=g(X.),而E(d(X.))=£g(x)P(X,=x)=£g(x)£e-

x=0 x=0•£Q「…入0=e-入A0—-+e-入1―-=e-入x=1 . •一般性结论 . .•命题1无偏估计不一定存在。比如,设样本X来自二项分布B(n,p)总体,样本量为1,n已知,而p未知,0<p<1,函数f(P)=sinp的无偏估计不存在。命题2设0[和02分别是未知参数0的可估函数人T+3,1-F(x;人)T1和g2(0)的无偏估计量,则C0+C0是eg(0)+cg(0)的无偏估计量。这里C,c为任意实数。TOC\o"1-5"\h\z11 22 11 22 1 2证明因为E(01)=g1(0),E(02)=g2(0),又因为E(c0+c0)=cE(0)+cE(0)=cg(0)+cg(0),11 22 1 1 2 2 11 22所以c0+c0是cg(0)+cg(0)的无偏估计量。11 22 11 22命题3无偏估计量不一定唯一。样本均值X和样本方差S2=F1不(X,-X)2都是总体参数0=人的无偏估计。i=1命题4能借助0的无偏估计来求g(0)的无偏估计。设总体X服从指数分布总体。(人),从总体中抽取一组样本(X1Xn),设0是0的无偏估计量。X的概率密度为f(X),记0=人>0,这里0=X为未知参数。0的无偏估计是•••0=人=X。今由0的无偏估计构造g(0)=02=X2的无偏估计,为此取。为修正系数,要使E(a(X)2)=02=X2成立,而— — — 1- - n+1-E((X)2)=D(X)+(E(X))2=—X2+X2=——X2nnn+1 ntt、故取系数a= 。此时E(a(X)2)=02+X2成立,故02+X2的无偏估计为一-(X)2。n n+14.4参数的区间估计泊松分布的X区间估计,一般是利用中心极限定理来实现。对于大容量样本,这种估计是可行的,然而,对于同样的置信水平,这种近似估计的误差会随着容量的减小而增大。可以通过建立Poisson分布和「分布的某种联系给出一种较为理想的区间估计,实际表明这种计较用中心极限定理效果好。设总体X服从参数为X(X>0)的Poisson分布,则X的分布函数为XtF(x;X)=Z_e-X(X>0)t!t<n对于固定的x,把F(x;X)视为X的函数,则易证F(x;X)具有下述性质当XT0+时;F(X;X)T1当XT+8时;F(X;X)T03F(x;X)是关于的连续可导函数。对于前两项性质,还可以描述为1'当人—0+,1-F(x;人)—02'当人—+8,1—F(x;人)—1性质1',2',3会使我们意识到对固定的,关于应具备分布函数的性质,为得到这一结论,先给出下面引理:引理设人为任意实数,为正整数,则下式成立(*)官e项=—卜tme项dt

t! r(m+1)o(*)t=m+1证明取 f(人)=£切e项--^卜tme项dtt! r证明取 f(人)=t=m+1只需证明f(人)=0,(*)式便成立。显然fn)是定义在(-8,+8)内的连续可导函数,且有f'(X)=尤t史e-x-尤父e-X-—-—人me-入t! t! r(m+1)TOC\o"1-5"\h\zt=m+1 t=m+1「Xm yXt-1 yXt , .=(m+1) e-X+^^ -X—— —e-X—— Xme-X(m+1)! (t-1)! t!r(m+1)t=m+2 t=m+1旦e-X+]E^-X-]E冬e-x-^Xme-x=0(m)! u! t!m!u=m+1 t=m+1所以f(X)在(-8,+8)内恒为常数,而f(0)=0,故f(X)三0即(*)式成立。特别地当X>0时,(*)式仍成立。定理设F(x;X)为泊松总体的分布函数,X>0为参数,若把X固定,视X为随机变量,则X的分布函数为1-F(x;X)>0,则X服从r(m+1,1),其中m=[x]。证明由于P{X=k}=^e-X

k!所以F(x;X)=P{X<x}=£左e-X(x>0)

t!t<x从而

由引理知1-F(x;人)=1-t<xThe-由引理知1-F(x;人)=1-t<xThe-4=Z£i=£t!41——e-4=t!t=[x]+1y人t=J——e-4

t!t=m+1另人tt!t=m+1r(m+1)01-F(x;4)=—1—j4tme-tdt〜r(m+1,1)r(m+1)o由此可知,当^(m=[x])固定时,1-F3;人)是变量人的分布函数,且为r(m+1,1)分布,利用泊松分布与r分布的这种内在联系,通过计算固定的观察值,注意到r分布与X2分布的关系,可以构造出参数人的置信区间。设(X1,X2, Xn)是取自泊松总体(参数为4)的简单子样,由泊松分布的可加性知T=£x仍为泊松分布,且参数为n,对于给定的一组观测值x,x,x,T=£x为TOC\o"1-5"\h\zi 1 2n ii=1 i=1定值,由上面结论可知,小服从r(m+1,1)分布。于是人的置信度为1-a的置信上下限••• jn4tme-tdt=1-—

r(m+1,1)0 2注意到等式——1——jxtme-tdt= 1 j2xtme二dt注意到等式r(m+1,1)o 2m+1r(m+1)o上式右边为X2(2m+2)分布的分布函数。从而4,4可以用X2分位数表示,即有2m+1r(m+1)J:n4tme膈=aTOC\o"1-5"\h\zI2n4 ■ a2m+1r(m+1)0m2-耳于是2n4=X 2(2m+2),2n4=X2(2m+2)n n12 2从而有X2(2mX2(2m+拦1-2X2(2m+

n2由此便得到人的置信度为1-a的置信区间为(X2(2m(X2(2m+2)1-n2X2(2m+2)n2n'22n5贝叶斯框架下的参数估计人们通常是在给定的损失函数下对其进行研究,设X1,X2X”是容量为n的一个泊松简单随机样本,其联合概率分布为-1 ...x5贝叶斯框架下的参数估计人们通常是在给定的损失函数下对其进行研究,设X1,X2X”是容量为n的一个泊松简单随机样本,其联合概率分布为-1 ...x|人)项x! XT(x)e-n人,"L"」其中x,x,x为样本X,X,X..的一组实现值,T(X)=wX,本文对给定的泊松样1 2n 1 2 n ii=1在p,q对称损失函数•••…X8L(X,8)=(如)p+("q-2(p,qeZ) (1)8X意义下考虑参数的估计问题,由分析问题知,损失函数(1)关于估计量8是凸的,且关于8在8=X处取得最小值。在贝叶斯框架下,利用损失函数(1)来研究参数X的贝叶斯估计的一般形式。下面给出参数X的一般形式。本X「X2,定理1令X=(X「X2,Xn),在损失函数(1)下,对于任何先验分布,参数X的贝叶斯估计为(PE(XP|X)丫3+q)*qE(X-q|X)/证明设8(X)为X的任意估计,对应的贝叶斯风险为E{嘉牛-2}=河嘉+岑2—2X}},这里等号左端E表示关于X和X的联合分布取数学期望。欲使贝叶斯风险达到最小,只需要极小化E{x失、+;")-2lX}即可。8p(X)Xq

记h(5)=等X)+EX(X—2'对h(5)关于5求导,易知h(5)是关于5的凸函数'并且在5(X并且在5(X)二PE(Xp|X))L+q)"qE(X-q|X)处取得唯一极小值,从而参数人的贝叶斯估计为(X)二(PE(Xp|(X)二^qE(X-q|X)/下面考虑在给定的先验分布后,参数X的贝叶斯估计的精确形式。定理2若参数人的先验分布为r(k,p)=。k(「(k))Msi"入。>0,k>0,则人的贝叶斯估计为/pr(T(X)+k-p;2)]tn+p[qr(T(X)+k+q『2)/并且是可容许的。证明由于X的先验分布为伽玛分布r(k,p),从而X的后验分布为h(X冬,X2,X)xXt(x)+k-ie-(n+p)x,ph(X冬,X2,E(XpX)=「Xph(XX)dX=—r(T(X)+k+p),

1 0 (n+p)p r(T(X)+k)E(X-qX)=j“X-qh(XX)dX=(n+p)qr(T(X)+k-q),0 r(T(x)+k)从而Vfpe(xpX)>t(p+q) 1(pr(T(x)+k-p⑵丫(p+q)5(X)=[-^-^J =n+4qr(T(X)+k+q「2)J由于参数X在损失函数(1)下关于先验密度兀(X)=pk(r(k))-1Xk-ie-PX的贝叶斯估计是唯一的,因此该估计也是可容许的。定理3在先验分布兀(X)=pk(r(k))-1Xie-px,X>0,P>0,k>0下,对给定置信概率1-a,参数X的最大后验区间估计D为&2(2T(X)+k)队2(2T(X)+k)]TOC\o"1-5"\h\z2 , 22(n+p) 2(n+p) ^k J证明由于参数的后验密度为h(XXt,X2,X〃)xXT(x)+k-ie-(n+p)X,p>0,k>0,,所以对于给定置信概率1-以,参数人的最大后验区间估计D满足:P(槌D|X)=』h(k|X)d人=1—a,D对于叫eD,气史D总有不等式h(k1\X)>h(气|X).下面求参数人的最大后验区间估计的精确形式。由于2(n+。)人X2(2T(X)+k),所以对给定的ae(0,1),有P(X2(2T(X)+k))<2(n+。)拦X2(2T(X)+k)=1—a.TOC\o"1-5"\h\za2 〜 a2,则对叫eD,气史D(X,,2(2T(X)+k)/ XZ2(2T,则对叫eD,气史D# / i-a /2 /2(n+" 2 /4(n+P)k 7,总有不等式h(%|X)>h(X2|X)。于是参数人的最大后验区间估计D为&(2T(X)+k)圣2(2T(x)+k)]2(n+P) , 2(n+p) -k6简单应用研究1)二项分布泊松近似常常被应用于研究稀有事件,即每次试验中的事件出现的概率p很小而贝努里试验的次数n很大时,事件才会发生。例1通过某路口的每辆汽车发生事故的概率为p=0.0001,假设在某段时间内有1000辆汽车通过此路口,试求在次时间内发生事故次数X的概率分布和发生2次以上事故的概率。分析首先在某段内发生事故属于稀有事件,观察通过路口的1000辆汽车发生事故与否,可视为是n=1000次伯努里试验,出现事故的概率为p=0.0001,因此X服从二项分布的,即X〜B(1000,0.0001).Q=p(工>2)=1—p{x=0}—p{x=1}=1—0.99991000—1000x0.0001x0.9999999由于n=1000很大,且p=0.0001很小,上面的式子计算工作量很大,则可以用:p{v=m}=Cmpm(1-p)n-m牝1^p-e-np(m=0,1,,n)来求近似。注意到np=1000x0.0001=0.1,••・有p{x>2}=1—°.10e—0.1—°」e—01=0.00450! 1!

p{x<n}=£p(1—p{x<n}=£p(1—p)k-1=1-£P(1-p)k-1=1-(1-p)n>0.9k=1k=n+1n>lg0.1

lg0.9975=919.88272)泊松分布可以计算大量试验中稀有事件出现频数的概率.这里的频数是指在相同条件下进行大量的试验,在这大量试验中,稀有事件发生的次数。例2一直患色盲者占0.25%,试求:为发现一例色盲者至少要检查25人的概率;为使发现色盲者的概率不小于0.9,至少要对多少人的辨色力进行检查?分析设X表示恰好发现一例色盲者所需要的检查人数,则X〜G(0.0025)。解p{x>25}=£p(1-p)k-25=(1-p)24=(0.9975)24牝0.94k=25设至少对n个人的辨色力进行检查,于是p{x<n}>0.9。从而:p{xp{x<n}=£p(1-p)k-1=1-£p(1-p)k-1=1-(1-p)nk=1k=nk=1由1-(1-p)n>0.9得n>I??广=919.8827。因此至少要检查920人。lg0.9975结束语目前关于Poisson分布的性质及其应用的研究已经取得丰富的成果,在参数估计这块,对点估计,矩估计,最大似然估计以及近似的区间估计等,文章中对泊松分布的相关知识,包括其性质,参数的相关估计,还有一些简单的应用一些整理和论述,希

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论