版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、孟生旺:广义线性模型-发展与应用 第第 十十 二二 届届 中中 国国 精精 算算 年年 会会 The 12th China Actuarial Annual Conference广义线性模型:发展与应用广义线性模型:发展与应用孟生旺中国人民大学统计学院Email:孟生旺:广义线性模型-发展与应用2主要内容主要内容 基本的广义线性模型:理论与应用基本的广义线性模型:理论与应用 模型评价 费率约束 广义线性模型的推广与应用广义线性模型的推广与应用 分布假设的推广 GAM与GAMLSS(GAM for Location, Scale and Shape) 神经网络与回归树 应用案例应用案例孟生旺:广
2、义线性模型-发展与应用3基本基本GLM:理论与应用:理论与应用 分布假设: 正态 泊松、负二项:索赔频率 伽马、逆高斯:索赔强度 Tweedie:纯保费 二项:续保率 连接函数: 恒等:加法模型 对数:乘法模型,预测值大于零 logit:预测值在(0,1)区间孟生旺:广义线性模型-发展与应用4 Tweedie、泊松和伽马的比较: Tweedie: 泊松:p=1 伽马:p=2( )12pV p Chi-SqOwnerAge 7 52.81 .0001Model 3 100.54 .0001CarAge 3 122.52 Chi-SqIntercept -1456.5376OwnerAge -14
3、38.7844 7 17.75 0.0131Model -1370.3694 3 68.41 .0001CarAge -1247.8460 3 122.52 ChisqInterceptIntercept1 15.13385.13380.06370.06375.00905.00905.25865.25866499.856499.85.0001.0001OwnerAgeOwnerAge17-2017-201 10.22630.22630.11070.11070.00940.00940.44330.44334.184.180.04090.0409OwnerAgeOwnerAge21-2421-24
4、1 10.22870.22870.05980.05980.11150.11150.34590.345914.6314.630.00010.0001OwnerAgeOwnerAge25-2925-291 10.16420.16420.04380.04380.07830.07830.25020.250214.0414.040.00020.0002OwnerAgeOwnerAge30-3430-341 10.11430.11430.04200.04200.03210.03210.19660.19667.437.430.00640.0064OwnerAgeOwnerAge35-3935-391 1-0
5、.0877-0.08770.04110.0411-0.1684-0.1684-0.0071-0.00714.544.540.03300.0330OwnerAgeOwnerAge40-4940-491 1-0.0129-0.01290.03580.0358-0.0831-0.08310.05740.05740.130.130.71970.7197OwnerAgeOwnerAge50-5950-591 10.00690.00690.03720.0372-0.0661-0.06610.07990.07990.030.030.85360.8536OwnerAgeOwnerAge60+60+0 00.0
6、0000.00000.00000.00000.00000.00000.00000.0000. . .CarAgeCarAge0-30-31 10.69900.69900.05160.05160.59780.59780.80020.8002183.32183.32.0001.0001CarAgeCarAge4-74-71 10.61300.61300.05160.05160.51190.51190.71410.7141141.33141.33.0001.0001CarAgeCarAge8-98-91 10.35580.35580.05980.05980.23860.23860.47300.473
7、035.4335.43.0001.0001CarAgeCarAgez10+z10+0 00.00000.00000.00000.00000.00000.00000.00000.0000. . .ScaleScale1 10.98520.98520.12340.12340.77070.77071.25941.2594孟生旺:广义线性模型-发展与应用10l模型评价模型评价5:把样本数据分为三组(数据充足)l训练样本(training data)l测试样本(test data)l评价样本(validation data)l模型评价模型评价6:Box-Cox检验11,恒等变换=0,对数变换,逆变换 孟
8、生旺:广义线性模型-发展与应用11来源:Anderson etc.(2007), Practitioners guide to GLM孟生旺:广义线性模型-发展与应用12 模型比较模型比较:信息准则 AIC或BIC的值越小越好。 误差平方和的比较? AIC22BIC2ln( )lplpn 孟生旺:广义线性模型-发展与应用13GLM的优缺点的优缺点 优点: 统计检验 处理相关性和交互作用(见下页) 现成软件 缺点: 无法处理加法和乘法的混合模型 参数模型,函数形式有限 寻找交互项:耗时 孟生旺:广义线性模型-发展与应用14 费率约束: A区域的费率系数不超过1.20 B区域的费率系数保持在当前水
9、平1.10不变 如何解决? 传统方法: 方法 2:抵消项 方法 3:一般约束条件下的广义线性模型费率约束的处理费率约束的处理孟生旺:广义线性模型-发展与应用15性别区域抵消项男Alog(1.2)Blog(1.1)Clog(1)Dlog(1)女Alog(1.2)Blog(1.1)Clog(1)Dlog(1)性别区域男A+B(基准水平,系数=1)CD女A+BCD 费率约束的处理:抵消项费率约束的处理:抵消项 例:区域A和B的费率系数分别限定为1.2和1.1,区域C和D不受约束, 另一个费率因子为性别。假设不存在其他费率因子。孟生旺:广义线性模型-发展与应用16 权重与抵消项的关系:泊松回归为例:
10、因变量:索赔次数(C) 权重:无 抵消项:log(风险单位数) 因变量:索赔频率(F) 权重:风险单位数(e) 抵消项:无log ( )log( )E CXelog ( ), /E FXFC e孟生旺:广义线性模型-发展与应用17 费率约束情况下,何时不宜使用抵消项? 例:公司希望开拓高端住宅保险市场,措施之一是适当降低其费率 问题:保额与区域高度相关 应用抵消项的结果:区域因子会调整,使得高端住宅的费率仍然较高 解决途径?方法3,一般约束条件下的广义线性模型孟生旺:广义线性模型-发展与应用18011 112211021 12222201 11200220ppphphhhpphaaaacaaa
11、acaaaacbbbbbbbbbbbb+ LLLL方法方法3:一般线性约束下的费率厘定一般线性约束下的费率厘定(1)( )*1*2(2) ()mmX W XA SAX W G yA S Ibblml+-=+-+约束条件:参数估计:孟生旺:广义线性模型-发展与应用19GLM的推广的推广与应用与应用 分布假设的推广分布假设的推广 过离散: 混合泊松分布:泊松-逆高斯,泊松-对数正态 零膨胀: 零膨胀模型 长尾: 对数正态,帕累托 0-1之间取值的变量: Beta分布孟生旺:广义线性模型-发展与应用20广义可加模型广义可加模型(Generalized Additive Models,GAM) GAM
12、LSS模型(GAM for Location, Scale and Shape)1( )()Jjjjgh x1()(,)()kJkkkkkkjkjkjghXhx孟生旺:广义线性模型-发展与应用21神经网络模型神经网络模型0011()mnjjij ijiyf wwg ww x=+邋孟生旺:广义线性模型-发展与应用22 神经网络模型的优点:广义线性模型的推广。非线性。无需事先指定解释变量与因变量之间的函数关系。可以以任意精度逼近任意的连续函数预测效果通常要优于常用的广义线性模型,但有例外孟生旺:广义线性模型-发展与应用23 神经网络的缺陷:缺乏进行统计推断和模型检验的统计理论模型参数不易解释预测过
13、程类似于一个黑箱有可能会引入不必要的交互项,导致过拟合。孟生旺:广义线性模型-发展与应用24回归树回归树 优点:无需对因变量和解释变量之间的函数关系作出假设可以方便地处理交互作用 缺点:拟合值是分段常数,不大可能产生很好的拟合效果。孟生旺:广义线性模型-发展与应用25最小偏差法及其推广最小偏差法及其推广(下页) 优点:建立加法和乘法的混合模型 缺点:没有严格的统计检验ijklijkl 孟生旺:广义线性模型-发展与应用26ijijijEY ijijjy ijijiy 1()jpqijjpqijjijijjffynn1()ipqijipqijijiijiffynn孟生旺:广义线性模型-发展与应用2
14、7应用案例应用案例来源: Ismail et al.(2007) 和Cheong et al.(2008)马来西亚车险汇总数据分类变量水平保障类型综合险非综合险汽车产地国内国外用途及性别男性个人女性个人商务车龄0至1年2至3年4至5年6年以上地区中部北部东部南部东马孟生旺:广义线性模型-发展与应用28系数(括号中表示基准水平)线性回归泊松回归负二项回归泊松-逆高斯回归截距00.0712-2.4921 -2.5781-2.5960非综合险(综合险)1-0.0110-0.5615 -0.6780-0.6809国外(国内)2-0.0036-0.0924 -0.0829-0.0821商务(男性个人)3
15、-0.0415-6.0618 -6.0551-6.0582女性个人(男性个人)4-0.0168-0.5149 -0.5483-0.5544车龄2至3年(0至1年)5-0.0187-0.3871 -0.3302-0.3057车龄4至5年(0至1年)6-0.0274-0.6390 -0.5657-0.5399车龄6年以上(0至1年)7-0.0315-0.7798 -0.6337-0.6140东部(中南部)8-0.0140-0.4428 -0.4367-0.4345东马(中南部)9-0.0137-0.5169 -0.5144-0.5144北部(中南部)10-0.0075-0.2155 -0.1498
16、-0.1422AIC1001.20901.73797.43796.53广义线性模型的参数估计值广义线性模型的参数估计值孟生旺:广义线性模型-发展与应用29广义线性模型的拟合结果比较广义线性模型的拟合结果比较孟生旺:广义线性模型-发展与应用30回归树的结果回归树的结果孟生旺:广义线性模型-发展与应用31模型参数个数误差平方和(SSE)类线性回归1119.080.7274回归树1116.760.7606泊松-逆高斯回归1215.080.7846负二项回归1214.730.7896泊松回归1113.040.8138神经网络(1个神经元)1312.300.8242神经网络(2个神经元)255.850.
17、9165神经网络(3个神经元)375.110.9270模型的误差平方和比较模型的误差平方和比较2R孟生旺:广义线性模型-发展与应用32费率约束费率约束约束:下述三个类别的预测值落在 0.01, 0.03。 风险类别保障类型汽车产地用途和性别车龄地区索赔频率观察值索赔频率拟合值1综合险国内男性个人23年东马0.02800.03352综合险国内商务23年东马0.00000.00013综合险国外女性个人6年以上东马0.01260.0123孟生旺:广义线性模型-发展与应用330.000.040.080.120.000.040.080.12索赔频率观测值无约束的索赔频率预测值0.000.040.080.120.000.040.080.12索赔频率观测值有约束的索赔频率预测值对选定的三个风险类别约束前后的索赔频率预测值对选定的三个风险类别约束前后的索赔频率预测值约束:索赔频率的拟合值要落在区间约束:索赔频率的拟合值要落在区间0.01, 0.03内内孟生旺:广义线性模型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 线上心理测评服务合同范本
- 房产维护2024协议样本
- 玻璃包装用品销售合同范本
- 小饭店合同范本
- 实施方法论- 信利半导体中高层培训
- 新建小区土地承包合同范本
- 2024装饰工程项目材料采购协议
- 玻璃幕墙系统综合施工与交付协议
- 外包安装合同范本
- 日语Ⅲ学习通超星期末考试答案章节答案2024年
- 第12课+明朝的兴亡-【中职专用】《中国历史》(高教版2023基础模块)
- 鲁滨逊漂流记读书分享课件
- 北京开放大学互联网营销方案策划写作在线测验5-1:本周测一测
- 高中生知识抢答竞赛题
- 幼儿园大班语言绘本《月亮的味道》课件
- 人教版《道德与法治》七年级上册 成长的节拍 复习教案
- 《中华商业文化》第六章
- 医院玻璃采光顶玻璃雨棚施工方案
- 运筹学-随机规划课件
- 《电阻》说课课件
- 同济外科学课件之颈腰椎退行性疾病
评论
0/150
提交评论