精算模型第三版 第6章 经验模型_第1页
精算模型第三版 第6章 经验模型_第2页
精算模型第三版 第6章 经验模型_第3页
精算模型第三版 第6章 经验模型_第4页
精算模型第三版 第6章 经验模型_第5页
已阅读5页,还剩168页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章经验模型如何选取合适的理赔额分布或理赔次数的分布分布拟合检验的一般步骤:获得损失分布的经验分布信息,例如经验分布图、样本均值、样本方差、分位点等;选择一种概率分布作为损失的分布类型,估计所选择分布中所包含的参数;对分布进行拟合检验,以确信所选择的分布类型和参数估计是否恰当;考虑是否还有其它适合的分布,如果有,重复第(1)-(3)(6)模型的修正。选择模型后,要注意随时对模型修正,以反映未来发生的情况,如通货膨胀,免赔额变化等。Data

set

A下表是某保险公司在一年内小汽车发生事故次数的统计数据:6.1

数据类型此部分内容来loss

model2782

115126155161243294340

384457680

8558779741193134018842558

15743Data

set

B下表是某劳工补偿险的部分原始损失数据Data

set

C下表是某责任险的赔付数据:Data

setD1寿险保单终止有三种状态:死亡,期满和退保(surrender)下表是某寿险保单持有人在签订保单后5年内保单终止的时间记录。(接后)其中‘-’表示时间未知,最后12个保单持有人保单期满并退Data

set

D2下表表示寿险保单存活状态的两次观测值,其中First

observe表示第一次观测的时间,若为0则表示保单签订后马上进行记

录,Last

observed表示第二次观测的时间,Event表示最后一次观测时保单持有人的状态,S表示退保,D表示死亡,E表示保单期满。上面是一组责任险保单的赔付数据,这个数据中包含了不同的免赔额和限额。Data

set

E下面是一组责任险保单的赔付数据,包含了不同的免赔额和限额请同学们观察上述几个数据集的特征个体,完整数据分组数据Truncated和Censored数据我们将分三种情况讨论经验模型的构建个体,完整数据分组数据截断和删失数据删失(自上)

截断(自下)对于个体数据,它的经验分布信息除样本均值、样本方差、中位数、极大值和极小值,还包括经验分布函数、生存函数(survival),死亡力函数(cumulative

hazard

rate

function)等1、样本分布函数样本分布函数就是累积频率,其定义式为其中n是样本量。6.2完整个体数据的经验模型例:设某医疗保险,规定免赔额为50元,随机抽取了10个理赔事件,赔偿额分别为141

16

46

40

351

259

317

1511

107

567特殊地,则样本分布函数例假设某数据集包含下面的数据:1.0,1.3,1.5,1.5,2.1,2.12.8,计算其经验分布函数。解:k=5,例:设下表中的理赔记录用weibull分布来拟合,用25%和75%分位数来估计参数的值。解:weibull的分布函数为分别令解得请同学们画出均匀核密度分布图同法可得:我们可以绘制核密度估计的分布函数和密度函数图像,如下图所示。三角核函数(请同学们画出三角型图)Gamma核函数例:现要根据5个人来研究从患病到死亡时间的估计,这5个人的死亡时间如下:2

3

3

3

7使用带宽为2的三角核估计在2.5时的密度函数值。8/4012/4014/4016/4017/40解:三角核函数为三角核的底为4,中心的高为0.5(这样面积为1)。底的长度为宽的2倍。任意在2.5左右2的范围内都会对其估计值有影响。对于观察值2,三角的底的中点为2,在2.5的高为0.375(=0.5*0.7(底离2是三角形底2到4的1/4,因此高是从0.5到0的1/4)。与此类似,观察值为3的点同样是0.375。每个三角的高度根据其经验概率进行加权。因此在2.5的估计值为(1/5)(3/8)

+

(3/5)(3/8)

+

(1/5)(0)

=

12/40.6.3分组数据的经验模型例:某公司在1970年-1989年间发生的火灾损失记录如下:试画出损失的经验分布图解:先对损失记录按从小到大的递增顺序整理为:根据整理的数据记录可以确定以下标志值:把数据按不同规模分组,每组中的记录次数称为频数,以500,1000为组距分组得:注:同学们可以尝试把组分得更细些,这样得到的直方图就更加平滑2.经验分布函数光滑曲线下图为本例的经验分布光滑曲线例:下表给出了217份保单的理赔额数据。3.经验均值这部分内容参考loss

model第10章或manual(ME-50,51)。5.百分位数利用ogive曲线的特点,可得例:100个观察值被分为5组,请计算在40%的经验分位数。解:首先计算其经验分布函数因此,40%的分位数位于100和200之间。使用插值得到6.4非完整数据的经验模型删失和截断的含义

1.截断例如,免赔额自下截断,自左截断

2.删失例如,赔偿限额自上删失例:一组责任险保单数据注:在生命表(mortality

table)模型构建中也存在大量的删失和截断例子。例:为估计某年龄阶段的死亡率分布,随机抽取了40份保单,下面表中是两次观测的时间和保单持有人的状态。其中First

observed是指签订保单后第一次观测的时间,LastObserved是最后观测的时间,Event是最后观测时,保单持有人所处的状态,e表示保单期满,s表示退保,d表示死亡。例如:第4份保单,第一次观测的时间是签署保单后,第二次观测时间是签署保单后0.8年,状态死亡d。其存活时间为0.8。第31份保单,第一次观测的时间是签署保单后0.3年(truncated),第二次观测时间是签署保单后5年,状态是期满e。其存活时间大于等于5。第35份保单,第一次观测的时间是签署保单后2.1年,第二次观测时间是签署保单后3.9年,状态是退保s

(censored)。其存活时间未知但大于3.9。下面构造经验分布函数,首先定义几个记号:另外,注意到因此,(6-4-1)也可写作:即直观意义:由所有在给定年龄之前参与研究的个体减去已经离去的个体数。递推计算请同学们分析一下上面表达式的直观含义。下面给出经验生存函数估计,也称为Kaplan-Meier乘积极限估计在生命表中的直观解释:S(0)=1因此,可以证明Kaplan-Meier乘积极限估计与前面的估计是一致的,即例:计算data

setD2的Kaplan-Meier

product-limti答案:D数据可以整理如下:注意:上表中的T就是我们的y,Y就是我们的r,d就是我们的s例:在两个国家的保险产品的死亡率研究中,给定以下数据:例:假设某数据集包含下面的数据:1.0,1.3,1.5,1.5,2.1,2.1,2.8,计算其经验分布函数的Nelson-Aalen估计。解:例:一个赔款支付时间的研究,已知:数据不存在截断或者删失。1次最多支付1次赔款。在第二次支付赔款后的累积危险率函数H(t)的Nelson-Aalen估计为23/132.求第四次支付赔款后的累积危险率函数H(t)的Nelson-Aalen估计值。0.350.370.390.410.43例:计算data

setD2的Nelson-Aalen估计解:例:下列数据为关于从0时刻开始观察的20个人的死亡时间:例:对于数据集B表示原始损失额,假设免赔额我250,求理赔额至少为1000的概率及其方差估计。密度函数的估计例:已知损失额观测值可以分为以下几组解:(1)请问这样的答案是否有问题?置信区间的上界为1.0077大于1,这个值是没有意义的。在小样本情形,直接运用正态近似,极有可能得到这样的结果。解决这个问题的方法是使用对数转换的置信区间

(log-transformed

confidenceinterval)进行估计。在保险公司运营与制定养老计划中,通常使用大量的寿险保单数据来构造生命表,估计死亡概率和退保率。这些数据通常为非完整数据,即在某一确定观察期内,有的对象从观察期初期开始观察,有的从期中开始(中途加入);有的在期中活着退出观察,有的生存到观察期末,有的在观察期死亡。在这样的非完整样本数据集中,我们把观察期中活着离开的这种行为称为“退出”,把生存到观察期末的这种现象简称为“结束”。6.6基于大样本数据的死亡率近似估计(选讲)这种情况下的随机事件是“退出”与“死亡。”当样本量很大的时候,如果使用Kaplan-Meier估计方法,必须进行大量的数据排序和计算工作,但是从结果看,如此繁杂的工作是不必要的。比如在生命表的估计中,我们只需要计算整数年龄的函数值,而不需要知道每个观测值处的生存函数。因此,可以采用近

似的方法进行估计。式(1)被称为死亡率的确切法计算公式。但在早期的精算研究中,统计估计理论还不成熟,也没有出现任何机械或电子计算工具,人们只是简单保存记录,用精算暴露数来近似确切暴露数,采用式(2)来估计死亡率。这种方法称为精算暴露法。例6-30:一项养老研究计划,其参加者样本的观察期为2011年1月1日到

2013年12月31日。下面是5个被观察的样本的基本信息(1)1978年4月出生,在2010年8月签订保单,到观察期结束时仍然存活。(2)1978年6月出生,在2010年7月签订保单,于2012年9月死亡

(3)1978年8月出生,在2012年2月签订保单,于2013年2月退保

(4)1978年5月出生,在2011年6月签订保单,于2012年3月死亡

(5)1978年7月出生,在2011年3月签订保单,于2013年5月退保2、保险年龄上述例子描述大样本研究中的数据处理过程,需利用每位观

察对象的实际出生日期数据。但对于保险公司和养老基金,

这种数据却不需要。这是因为,大多数投保人并不是在生日

那天购买保单,因而在保单签订时他们有不同的非整数年龄。但保费的收取是按整数年龄收取。保险公司在签订保单时也

不依据被保险人的实际年龄(actual

age)来计算保险费,而是用一整数年龄代替投保人的实际年龄。这个整数年龄称为

保险年龄(insuring

ages)。例如,某个投保人的出生日期是1978年2月15日,他在2011年10月15日签订寿险保单时的实际年龄是33.67。有的保险公司按照最近年龄(33岁)收取保费,指定他的保险生日为1978年10月15日。有的保险公司按照距离签订保单日期最接近的生日年龄(34岁)来收取保费,指定他的保险生日为1977年10月15日。没有保险公司会按照他的实际年龄35.67的计算。2、周年日研究当选用保险年龄时,对于所研究的每一个观察对象,都很自然选择保险出生日期的某个周年日作为观察期限的开始。类似的,选取以后某年的同一天作为观察期限终止日。例如

某观察期限可定义为由1988年某个周年日到1992年的周年日。这样的方法称为周年日-周年日法(anniversary-to-anniversa注意,在这种方法下,每个观察对象都有其各自不同的观察

期限。与之对应,前面所述的方法称为日-日法(date-to-date例6-33:使用周年日-周年日法方法记录例6-30中观察对象的年龄一项养老研究计划,其参加者样本的观察期为2011年1月1日到

2013年12月31日。下面是5个被观察的样本的基本信息1、1978年4月出生,在2010年8月签订保单,到观察期结束时仍然存活。2、1978年6月出生,在2010年7月签订保单,于2012年9月死亡。3、1978年8月出生,在2012年2月签订保单,于2013年2月退保。4、1978年5月出生,在2011年6月签订保单,于2012年3月死亡5、1978年7月出生,在2011年3月签订保单,于2013年5月退保。解:在周年日法中,第1个观察对象在2011年8月进入观察,保险年龄为33-0,在2013年8月退出观察,保险年龄为35-0。第2个观察对象在2011年7月进入观察,保险年龄为33-0。第5个观察对象5在2013年周年日退保。因此在2013-3终止观察,保险年龄为34-0。其他成员的年龄向量保持不变。例6-34:XYZ公司展开一项死亡率研究,观察期限从2012年1月1日到2012年12月31日,保险年龄定义为距离签订保单日最近的年龄下表是观察对象的基本信息。使用实际年龄,按确切暴露和精算暴露数分别计算82岁的死亡率。使用保险年龄,按确切暴露和精算暴露数分别计算82岁的死亡率。假设观察期限从2012年周年日到2013年周年日,使用保险年龄,按确切暴露和精算暴露数分别计算82岁的死亡率。解:(1)如用实际年龄,观察对象1在2012年4月1日满82岁,在2012年10月1日死亡,在年龄区间(82,83]的确切暴露数是6个月,精算暴露数是12个月。对象2在2012年7月1日满82岁,在2013年5月1日退保,在年龄区间(82,83]的确切暴露数和精算暴露数均为6个月。对象3在2012年8月1日满82岁,到观察期结束时期满,在年龄区间(82,83]的确切暴露数和精算暴露数均为5个月。对象4在2012年9月1日满82岁,2012年11月1日退保,在年龄区间(82,83]的确切暴露数和精算暴露数均为2个月。(2)如用保险年龄,观察对象1在2012年3月1日满82岁,在2012年10月1日死亡,在年龄区间(82,83]的确切暴露

数是7个月,精算暴露数是12个月。对象2在2012年10月1日满82岁,2012年12月31日观察期

结束时的保险年龄为82-3,在年龄区间(82,83]的确切暴露数和精算暴露数均为3个月。对象3在2013年1月1日满82岁,对年龄区间(82,83]的暴露数没有贡献,确切暴露数和精算暴露数均为0。对象4在2012年8月1日满82岁,2012年11月1日退保,在

年龄区间(82,83]的确切暴露数和精算暴露数均为3个月。(3)用保险年龄和周年日-周年日法,观察对象1在2012年3月日满82岁,在2012年10月1日死亡,在年龄区间(82,83]的确切暴露数是7个月,精算暴露数是12个月。对象2在2012年10月1日满82岁,在2013年5月1日退出观察,在年龄区间(82,83]的确切暴露数和精算暴露数均为7个月。对象3在2013年1月1日满82岁,对年龄区间(82,83]的暴露数没有贡献,确切暴露数和精算暴露数均为0。对象4在2012年8月1日满82岁,2012年11月1日退出,在年龄区间(82,83]的确切暴露数和精算暴露数均为3个月。例6-35:将例6-30中观察对象的信息改成区间记录数据。请使用(1)实际年龄和日-日法;(2)保险年龄(最近生日日期)和周年日-周年日法解:(1)使用实际年龄和日-日法:5个样本成员的进入年龄退出年龄和退出状态等基本信息分别为(32–9,35–9,s),(3234–3,x),(33–6,34–6,s),(33–1,33–10,x)和(32–8,3整数年龄32,没有观察对象。在年龄区间(32,33),有3位样本成员进入,没有人离开。在年龄区间(33,34),有2位样本成员进入,1位死亡,在年龄区间端点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论