复合泊松分布_第1页
复合泊松分布_第2页
复合泊松分布_第3页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复合泊松分布及其性质称随机变量s=EN任Xi服从参数为舄的复合泊松分布,如果满足1.随机变量N,X1,X2|,Xn是相互独立2. 若Xi,X2,l1l,Xnlll具有相同的分布,且分布与X相同N服从泊松分布,参数为人0E(S)=E(X)E(N)='E(X)Var(S)=Var(X)E(N)E(X)2Var(N)=Var(X)E(X)22='E(X)二:,nn_enFS(x)='P(N=n)Fn(x)='Fn(x)n=6n=0n!:-'.nfs(x)=Sf*n(x)定理3.1设Si,&,|,Sn为相互独立的随机变量,且Si为参数为&,个体索

2、赔分布为fx«x)的复合泊松分布,i=1,21m,则mm,S=5+S2+lll+Sn服从参数为兀=Z约,且fX(xfXi(x)的复合i1i=1'分布。背景:m可看成m个保险保单组合,S则是这m个保单组合的总索赔额。S也可以看作同一个保单组合在m个不同年度内的总索赔额证明:设Si为参数为的复合泊松分布,S的矩母函数为Msi(texpph(MXi(t)-1)。由丁S&JHSn为相互独立的随机变量,因此S的矩母函数为:mts半Ms(t)=E(ets)=E(e±)mmts=HE(etSi)=nMs(t)ididmm=exp"MB-、')i注i4m,

3、=exp(i(M,i(t1)i彳m设MX(t)=£MXi(t),由矩母函数的定义知,MX(t)为im'xm"fx(t)='-i1'fXi(t)的矩母函数,因此Ms(t)=exp(Mx(t)1)所以S为参数为赤,个体索赔分布为fX(x)的复合泊松分布。例:设S服从复合泊松分布,*=10,fX1(1)=0.7,fX1(2)=0.3,&也服从复合泊松分布,=15,fX2(1)=0.5,fX2(2)=0.2,fX2(3)=0.2,若S,和S2相互独立,求S=S+S2的分布。解:S服从复合泊松分布,舄=10十15=25,X的分布为fx(x)=25fxi

4、(k)25fx2(k)1015fx(1)=一0.70.5=0.5825251015fx(2)=0.30.3=0.302525fx(3)=性.2坦0.2=0.122525定理:设总索赔额S是一个复合泊松分布,其中个体保单的索赔额X的分布fx(x)。假设X的取值可以分为m种类型:G,C2,IH,Cm,其中气=P(XG)。设N表示索赔发生总次数,N,lll,Nm分别表示G,C2,IH,Cm类型索赔发生的次数,N=N+N2+Il|+Nm。下面结论成(1) 随机变量Ni,N2,lll,Nm相互独立,Ni服从参数为*=阿的泊松分布。设X表示当第i类索赔事件发生时的索赔额,即X(D=X|XCi,令S=Xi+

5、|十乂""=1,|血,则S,lll,Sm都是相互独立且Si服从参数为&=赫i的复合泊松分布,个体索赔额为X(i)。例3.13:设S服从复合泊松分布,兀=10,fx(1)=0.5,fx(2)=0.3,fx(3)=0.2。令C1=(X|X壬2),C2=(X|X2),求X(1),X(2)的分布,5,&的分布。解:令p1=P(X壬2)=0.5+0.3=0.8,p2=P(X>2)=0.2则X,X(2)的分布为XfX(x)fX(x)fx(2)(x)X10.50.5/Z0.8020.30.3/0.8030.200.2/0.2设N表示第i类索赔事件发生的次数,则N是泊

6、松分布,我=7F(xG)=10p。于是计算得至U7*=10乂0.8=8,=100.2=2,因此,s是复合泊松分布,九=8,个体索赔分布为53fx(i)(1)=,fX(2)(2)=。&是复合泊松分布,丸=2,个体索赂分布为88fx(2)(3)=1例3.14设索赔次数N服从=2的泊松分布,个体索赔额的分布fx(x)=0.1x,x=1,2,3,4,计算总索赔额S等丁1,2,3,4时的概率。解:设Ni表示个体索赔额为i的索赔事件次数,则Ni服从参数为叫的泊松分布,总索赔额S=1N+2N+3N+4N其中,1=0.1兀,2=0%&,兀0干3利用独0K4L变量和的卷积公式得到卜表。x1Ni2

7、N23N34N4fs(x)00.81870.67030.5488'0.44930.135310.163750000.0270520.0163750.2681000.0568330.0010900.329300.092240.0000550.053600.35950.1364例3.15:设某保险公司承保医疗保险,X表示一次医疗费用,N表示看病的次数,N服从泊松分布,S=X+X2+IH+Xn表示该医疗保险的总费用,设X的分布密度为fX(x)=2250("京0<x<250试分析加入免赔额d=50后,保险公司的总索赔额的变化解:首先考虑无免赔额情形,此时d=0。总索赔额等

8、丁总医疗费用S。由X的分布密度计算得到250E(X)=x2(1-M)dx=2502503=83.32502var(xr总索赔额的期望和方差为E(S)=,E(X)=8333.32Var(S)=E(X2)=100(E(X)2Var(X)22 ,250、2250、=100(;)18=1041666.6下面考虑d=50的情形。这时将医疗费用分为两类:G=(X|X50)C2=(X|X50)。设M表示医疗费用小丁等丁免赔50c额的次数,服从参数为"=P(X50)=100(1-(1-)2)=36的泊松分250布。N2表示医疗费用大丁免赔额,服从参数2=7尸(X>50)=100(1-竺)2=6

9、4的泊松分布。设乂=X|x<50,250X2=X|x*0,则总损失额S=S+S2,其中§=X1川XnS2*川Xn2S1表示医疗费小丁等丁免赔额的总费用,这部分费用完全由投保人承担。S2表示医疗费大丁免赔额的总费用。由丁X2=X|x*o=50+(X-50)|x*o,因此S=Xi+|+Xn2=50N2十(丫十III+Yn2)其中Y=Xj-50|x.地表示第i次看病的索赔额。从上式可以看出,总费i用S2分为两部分,一部分由投保人承担,另一部分是总索赔额部分,由保险人来承担。我们记总索赔额为S3,则S3=丫+川十丫卬。Yi的分布密度为2(1一50")f(y)_fY(50y)_

10、250*250YP(X50)50)22502(20y)250*250(200)2250()200200因此,差为2002(200)2E(Y)=羹°,Var(Y)=2(200)。可以得到总理赔额的期望和万39.4-200E(S3)=E(N2)E(Y)=64()=4266.63八220022002-Var(S3)=E(N2)E(Y2)=64(;)2=)=426.6318加入免赔额后,总理赔额比没有免赔额时减少了8333.3-4266.6_rtn/=48.8%。8333.3事实上,总损失S可以分解为:S=&力卜乂卬lXi(2)T"Xn(2),Si=s+50N2+YHIJ+

11、YnS4S3其中S4为投保人承担的医疗费用,S3是由保险人来承担索赔额。S的近似分布1、正态近似定理设个别理赔额分布函数为f(x),u1=E(X),u2=E(X2)。如果S是复合泊松分布,参数为岛,则当%*时z=*i丛,U2的分布趋丁标准正态分布。如果S是复合负二项式分布,参数为r,P,k=0,1,2l|个别理赔额分布函数为f(x),则-S-ru1Z=七2r32(2)。对丁泊松分的分布在r*时趋丁标准正态分布。证明:我们将利用limMZ(t)=e2来证明(1)布情形,由z=SLes)=辎当得到.Var(S)u2S-,Uit.'Uit、Mz(t)=E(exp(t)=Ms()exp)一&#

12、39;u2'u2'u2由公式(5)知Ms(t)=expMMx(t)-1),因此由矩母函数的级数展开式nMx(t)=£甘)=1+E(X)t+12十川+1-+川,2n!我们可以得到,Mz(t)=exp(1t2+1二%t3+HI)26"(u2)2eT,即lim.MZ(t)当舄t",MZ(t)-*t2=e。从而,Z分布在rT"时趋丁标准正态分布。S-E(N)E(X)对丁负二项分布,令z=S二E(S)_,Var(S)E(N)Var(X)Var(N)E(X)2=Su,r-u2r-2u12再用类似的方法证明Z分布在rT*时趋丁标准正态分布。此处不再叙述

13、。例:(SOA2001-1130)TheclaimsdepartmentofaninsurancecompanyreceivesenvelopeswithclaimsforinsurancecoverageataPoissonrateofl=50envelopesperweek.Foranyperiodoftime,thenumberofenvelopesandthenumbersofclaimsintheenvelopesareindependent.Thenumbersofclaimsintheenvelopeshavethefollowingdistribution:NumberofCl

14、aimsPiotabiIity1 (1202 0.253 CUU4 (hi5Usingthenormalapproximation,calculatethe90thpercentileof24/39thenumberofclaimsreceivedin13weeks.解:设Y表示第I个信封中的索赔数。设X(13)表示13周内收到的总索赔数。E(Y)=1X0.2+2X0.25+3X0.4+4X0.15=2.52E(Y2)=10.240.2590.4160.15=7.2E(X(13)=50132.5=1625Var(X(13)=50137.2=4680由P(X(13)£Z)=0.9=:&

15、quot;1.282)>P(X(13U25”282)'、4680因此,X(13)”712.72、平移gamma近似-x设G(x*,E)=白-产七出为gamma分布,对任意一点X0,0一(:)定义一个新的分布函数H(x,。,&,Xo)=G(x-冷;口,)。若设h(x)和g(x)分布为H(x,%E,xo)和G(x,xo,口,臼)的分布函数密度,则从图形上H和G只差了一个平移变换0.7图5.1H和G的分布密度图下面我们用h(x)来描述总索赔S的分布密度。因为h(x)有三个参数,所以只需根据S的均值、方差和三阶中心矩定出h(x)的形状和位置。乂因.aaoa为H的均值,万差和三阶中

16、心矩分别为X。+§,p2,3,所以用h(x)来描述S的分布时,下面三个等式近似成立。otE(S)=x°+g(7)Var(S)=$2二E(S-E(S)3下J这是一方程组,解出x°,%E有X。=E(S)2Var(S)2E(S-E(S)3-4Var(S)3E(SE(S)3)2p_2Var(S)E(S-E(S)3这样就可以得到一个平移gamma分布。当S为复合泊松分布时,(7)可简化为2x。=U|2虫:其中=E(X3)。若Xo+东=u金=。2,当XT-oo,aT",0T"时,可以证明H(x,0t,E,x趋丁正态分布N(u,o2)。因此,正态分布可以看作

17、是这种三参数分布的一种极限情况。从这个意义上来说,平移gamma分布近似是正态近似的推广。例3.17:设S为复合泊松分布,舄=12,当个体索赔分布为【0,1】上的均匀分布时,试分别用(1)正态近似(2)平'移gamma近似计算P(S<10)。c1解:1由条件易知Ui=E(X)=,U2=E(X2)=,丁是得到3E(S)=赤鸟=6,var(S)=兀=4S-6所以,P(S<10)=P(<2)=中(2)=0.9772211(2)令U3=E(X3)=gx3dx=,则E(S-Eg)3=汐33,解方程04组6=况+/P=二/-23=2口/臼3得xo=Y.67,。=28.44,P=2

18、.67。因此S的分布函数为G(x4.67;28.44,2.67)P(S10)=G(14.67,28.44,2.67)=0.96833、对数正态近似此外,实际中还使用对数正态分布ln(u,。2)来近似S的分布,即考虑方程组(3.41)E(S)=exp(/2)E(S2)=exp(2u2。2)解出u*2,然后用ln(u,。2)来描述S的分布。当E(N)的值较大时,正态分布近似的效果不错,特别是当N为泊松分布,二项式分布和负二项式分布时,由中心极限定理知,当,m,r趋丁无穷时,S的分布将趋丁正态分布。而当E(N)的值较小时,S的分布是有偏斜的,这时使用平移gamma和对数正态近似可能更为恰当。例3.16:在过去的10个月里每月某险种的索赔次数和个体损失额的样本均值(和标准差)分别为6.7(2.3),179747(52,141)。计算每个月总损失额的样本均值和方差。(2)分别用正态近似和对数正态近似计算损失额超过期望的140%的概率P(S>140E(S)。解:(1)由公式(1)和(2)得到S的样本均值和样本方差为E(S)=E(X)E(N)=6.7179747=1200955Var(S)=E(Var(S|N)Var(E(S|N)=6.7(52,141了2.321797472=1881801011若使用正态

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论