数学建模第八次作业-第十章人寿保险问题_第1页
数学建模第八次作业-第十章人寿保险问题_第2页
数学建模第八次作业-第十章人寿保险问题_第3页
数学建模第八次作业-第十章人寿保险问题_第4页
数学建模第八次作业-第十章人寿保险问题_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学建模作业论文(八) 题 目: (第十章)人寿保险问题 学 号: 20100633 20100598 20100549 姓 名: 张 林 任 凯 郭腾飞 年 级: 数学与应用数学10级三班 学 院: 信息与计算科学学院 指导教师: 沈菊红 完成日期: 2013年5月 信息与计算科学学院 人寿保险问题【摘要】:本文结合实际背景,经过对数据的观察并汇出其散点图推测经理的人寿保险额只与其年均收入和风险偏好度之间分别存在着二次效应和线性效应。在采用混合回归模型建立起了经理的人寿保险额与其年均收入和风险偏好度之间的函数关系式,采用最小二乘法利用 MATLAB软件的统计工具箱结合题中所给数据对各参数的值

2、与其置信区间进行了估计,并很好的通过了回归的检验。在通过对原模型进行改进的基础上,以一预测模型各参数的置信区间不应有零点作为该预测模型的可行的原则,验证了经理的年均收入和风险偏好度对其人寿保险额不存在交互效应。 人寿保险问题是一类统计回归模型问题,该模型是类随机模型,运用统计学的方法去解决现实中的类似问题。此论文通过对现有调查数据的分析,并用MATLAB等数学软件画出相应的图形,找出数据间的相关关系(一次关系,二次关系等),建立相应的数学模型。 本文的独特之处就是建立多个模型,对每个模型进行分析解出结果,并分析回归得一较优的模型。【关键词】:保险额 风险偏好度 回归系数 置信区间 统计回归方法

3、 目 录一、问题重述- 4 -二、基本假设- 4 -三、符号说明- 5 -四、问题分析:- 5 -五、模型建立与求解- 5 -六、结果分析- 14 -七、参考文献- 14 -八、附 录- 14 -一、问题重述 下表列出了某城市18位35岁44岁经理的年平均收入(千元),风险偏好度和人寿保险额(千元)的数据,其中风险偏好度是根据发给每个经理的问卷调查表综合评估得到的,它的数值越大,就越偏爱高风险。研究人员想研究此年龄段中的经理所投保的人寿保险额与年均收入及风险偏好度之间的关系。研究者预计,经理的年均收入和人寿保险额之间存在着二次关系,并有把握地认为风险偏好度对人寿保险额有线性效应,但对风险偏好度

4、对人寿保险额是否有二次效应以及两个自变量是否对人寿保险额有交互效应,心中没底。请你通过表中的数据来建立一个合适的回归模型,验证上面的看法,并给出进一步的分析。表一序号yx1x2119666.290726340.9645325272.9961048445.0106512657.204461426.852574938.122484935.8406926675.7969104937.40851110554.3762129846.1867137746.1304141430.3663155639.06051624579.38011713352.76681813355.9166二、基本假设 (1)风险偏好

5、度对人寿保险额有二次效应;(2)风险偏好度和经理年平均收入对人寿保险额有交互效应。三、符号说明人寿保险额经理的年平均收入风险偏好度回归系数(=0、1、2、3,4)随机误差回归方程的决定系数统计量值与统计量对应的概率值四、问题分析:在现实生活中,35岁44岁之间的经理很关心他们的人寿保险额跟风险偏好度和年平均收入有怎样的关系,本问题研究的是35岁44岁经理的年平均收入与风险偏好度和人寿保险额之间的关系,通过调查发现人寿保险额受经理的年平均收入与风险偏好度的影响,依次来研究它们之间的关系。五、模型建立与求解基于上面的分析,我们利用x1和x2来建立y的预测模型。基本模型 通过大概的分析并根据题意得y

6、与x1和x2的关系,利用表一的数据分别作出了y与x1和x2的散点图(如下图所示)。 图一(y对x1的散点图) 图二(y对x2的散点图) 通过图一我们发现,随着x1的增长,y有明显向上弯曲增加的趋势,图中的曲线可以用二次函数模型 y=0+1x1+2x12 + (1)拟合的 (其中是随机误差)。而在图二中,当x2的增大时,y有明显增长趋势,图中的直线用线性模型 y=0+1x2 + (2)拟合的(其中是随机误差)。 综合以上的分析,结合模型(1)和(2)建立如下模型 y=0+1x1+2x12+3x22+ (3)(3)式右端的x1和x2称为回归变量(自变量),0+1x1+2x12+3x22 是给定价格

7、差x1、广告费用x2时,牙膏销售量y的平均值,其中的参数0,1,2,3称为回归系数,由表1的数据估计,影响y的其他因素作用都包含在随机误差 中,如果模型选择得合适, 应大致服从均值为零的正态分布。模型求解:直接利用MATLAB统计工具箱中的命令regress求解,使用格式为:【b,bint,r,rint,stats】=regress(y,x,alpha) 其中输入y 为模型(3)中y的数据(n维向量,n=30),x为对应于回归系 =(0,1,2,3)的数据阵【1 x1 x2 x22】(n×4矩阵,其中第1列为全1向量),alpha为置信水平(缺省时=0.05);输出b为的估计值,常记

8、做,bint,为b的置信区间,r为残差向量y-x,rint为r的置信区间,stats为回归模型的检验统计量,有三个值第一个是回归方程的决定系数R2(R是相关系数),第二个是F统计量值,第三个是与F统计量对应的概率值p。 得到模型(3)的回归系数估计值及其置信区间(置信水平=0.05),的结果见表2.表二参数参数估计参数置信区间0-62.3486-73.5025 -51.194710.83960.3951 1.284025.68465.2604 6.108930.03710.0330 0.0412R2=1 F=8.2737 p<0.0033结果分析; 表2显示检查他们置信区间得到,0,1,

9、2,3都未包含零点,表明回归变量x1, x2 都是显著的。表2的回归系数给出了模型(3)中0,1,2,3 , 即0=-62.3486,1=0.8396,2= 5.6846,3= 0.0371。因此,该模型还是可用的,为了更好地理解风险偏好度和经理年平均入对人寿保险额的关系,对此进行改进。 模型改进II:模型(3)中回归变量x1和x2对因变量y的影响是相互独立的,即经理的年平均收入x1和人生保险额y之间存在二次关系,并风险偏好度与人寿保险额y有线性关系,根据经验可以猜想,风险偏好度对人寿保险有二次关系,于是将模型(3),增加一项即;y= 0+1x1+2x2+3 x22 +4 x12 + (5)对

10、y 和x12散点图和拟合图如下图所示:图三(y 和x12散点图) 下面让我们用表一的数据估计模型的系数,利用matlab的统计得到表三:表三参数参数估计参数置信区间0-60.9101-72.6072 -49.213010.9303 0.4389 1.421824.4529 1.6910 7.214930.0359 0.0310 0.040840.1159 -0.1409 0.3727R2=1 F=8.2737 p<0.0033 用模型(5)对人寿保险额做预测,经理的年平均收入x1和风险偏好度x2,表3的回归系数给出了模型(5)中的估计值0,1,2,3 , 即-60.9101,0.9303

11、,4.4529,0.0359,4=0.1159,则人寿保险额的估计值y =-60.9101+0.9303x1+4.4529x2+0.0359x22 +0.1159x12, 与模型(3)的结果相比,与表3检查它们的置信区间发现只有4的置信区间包含零点,表明回归变量x12不是太显著的,因此,4的估计值是不可靠的,要对模型(5)进行残差分析,首次回归所得图四图四图四个异常数据,剔除第3第5数据后再次回归,得到回归分析图五图五再次踢出第五个数据再次得到回归分析图六图六再次踢出第9,10数据后的回归分析图七图七结果其如表四:表四参数参数估计参数置信区间0-63.2111-69.8785 -56.5438

12、11.09980.8367 1.363023.45421.7941 5.114230.03400.0311 0.036840.24500.0759 0.4140R2= 1 F= 2.7735 p<0.0001在经过几组数据的踢出,使得模型的各估计值更为有了提升,无异常数据,该模基本可用。所以通过模型二的建立,其各计值-63.2111,1.0998,3.4542,0.0340,4=0.2450,则其预测方程为y =-63.2111+1.0998x1+3.4542x2+0.0340x22 +0.2450x12从中我们可知人寿保险额y与风险偏好度x1有二次关系该模似乎可以使用了,但是为了得到人

13、寿保险额y是否与风险偏好度x1和经理年收入x2有交互效应,我们将对模型(5)进行再次改进。模型为进一步的了解人寿保险额y与风险偏好度x1和经理的年平均收入x2是否有交互效应不妨简单的用x1, x2的乘积表示风险偏好度x1和经理的年平均收入x2交互效应,于是将模型(5) 进一步改进得到y= 0+1x1+2x2+3 x22 +4 x12 +5 x1x2 + (6)在这模型中,假设风险偏好度x1和经理的年平均收入有关,下面我们通过分析作出了y跟x1,x2乘积的散点图和拟合曲线,见如下图八所示:图八 利用matlab统计工具箱中的命令求解,得到表四的回归系数估计值及其置信区间(置信水平a=0.05)结

14、果见表五:表五参数参数估计参数置信区间0-65.3853-78.7266 -52.044011.01720.5202 1.514125.2172 2.2785 8.155930.03580.0310 0.040640.1661 -0.0956 0.42795-0.0196-0.0501 0.0109R2= 1 F= 7.1099 p<0.0030用模型(5)对人寿保险额做预测,经理的年平均收入x1和风险偏好度x2,与模型(3)的结果相比,表3的回归系数给出了模型(5)中的估计值0,1,2,3 ,4, 即0= -65.3853,1= 1.0172,2=5.2172,3= 0.0358,4=

15、0.1661, 5=-0.0196则人寿保险额的预测方程为 y=-65.3853+1.0172x1+5.2172x2+0.0358x22+0.1661x12-0.0196x1x2,根据表3检查它们的置信区间发现有4, 5的置信区间包含零点,表明回归变量x12,x1x2不是显著的,对此不能正确判断,需对模型(6)作残差分析,首次进行得到图九图九踢出第3,5个数据后的回归分析图十如下所示:图十再出第5个数据后的回归分析图十一下所示:图十一通过残差分析得到数据如表所示:表六参数参数估计参数置信区间0-64.7757-72.7253 -56.826111.10750.8381 1.376823.872

16、21.7990 5.945430.03470.0321 0.037440.29170.0962 0.48715-0.0160-0.0332 0.0011R2=0.0001 F= 2.0635 p<0.0001 通过这三次的残差回归分析,踢出几组数据后,各数据都能表示人寿保险额y与风险偏好度x1和经理年平均收入x2的关系,可通过残差回归分析检查得到,最后的数据发现5的置信区间包含零点,表明回归变量x1x2(对变量y的影响)不是太显著地,我们将变量x1x2从模型(6)中去掉。六、结果分析模型(5):表三显示,p远小于,发现存在问题,通过残差回归分析,几次数据的踢出,得到的使数据更有说服力,模

17、型从整体看上去还是可用的。表明人寿保险额y与风险偏好度x1有二次关系;所以,型(5)的预测方程为 y =-63.2111+1.0998x1+3.4542x2+0.0340x22 +0.2450x12模型(6):表七显示,发现5的置信区间包含零点,并通过残差回归分析,得到最后的数据,还是包含零点,得到最后的结论是去除模型(6)的变量x1x2 ,可知经理当中经理年平均收入x2和风险偏好度x两个自变量的交互效应与人寿保险额y没有关系。七、参考文献【1】数学模型(第三版).姜启源,谢金星,叶俊.北京,高等教育出版社,2012【2】MATLAB7.X程序设计.王建卫,曲中水,凌滨.北京,中国水利水电出版

18、社,2007八、附 录模型I第一次分析: %未踢出前的 一 y=196 63 252 84 126 14 49 49 266 49 105 98 77 14 56 245 133 133' ; x0=1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 'x1=66.290 40.964 72.996 45.010 57.204 26.852 38.122 35.840 75.796 37.408 54.376 46.186 46.130 30.366 39.060 79.380 52.766 55.916'x2=7 5 10 6 4 5 4 6 9

19、5 2 7 4 3 5 1 8 6'x3=4394.36 1678.05 5328.42 2025.90 3272.30 721.03 1453.29 1284.51 5745.03 1399.36 2956.75 2133.15 2127.98 922.09 1525.68 6301.18 2784.25 3126.60'x4=49 25 100 36 16 25 16 36 81 25 4 49 16 9 25 1 64 36'x=x0,x1,x2,x3,x4;alpha=0.05;b,bint,r,rint,stats=regress(y,x,alpha);rco

20、plot(r,rint)(图略) b = -60.9101 0.9303 4.4529 0.0359 0.1159bint = -72.6072 -49.2130 0.4389 1.4218 1.6910 7.2149 0.0310 0.0408 -0.1409 0.3727r = 0.7270 0.4326 -2.2943 -0.5397 -3.3788 -1.1024 2.6367 -0.4088 0.8087 -0.2602 -0.1297 2.5586 -1.0201 -0.8249 0.6707 1.4165 1.8852 -1.1770rint = -2.5610 4.0149 -

21、3.4379 4.3031 -4.1867 -0.4018 -4.3744 3.2951 -6.2877 -0.4699 -3.9695 1.7647 -0.8425 6.1158 -4.1858 3.3682 -2.2604 3.8777 -4.1121 3.5916 -2.9567 2.6972 -0.8788 5.9961 -4.7723 2.7321 -4.1082 2.4584 -3.1819 4.5233 -0.3912 3.2242 -1.4489 5.2193 -4.7434 2.3893stats = 1.0e+003 * 0.0010 8.2737 0 0.0033%踢出5

22、数据后 一x4=49 25 36 25 16 36 81 25 4 49 16 9 25 1 64 36' y=196 63 84 14 49 49 266 49 105 98 77 14 56 245 133 133' ;x3=4394.36 1678.05 2025.90 721.03 1453.29 1284.51 5745.03 1399.36 2956.75 2133.15 2127.98 922.09 1525.68 6301.18 2784.25 3126.60'x1=66.290 40.964 45.010 26.852 38.122 35.840 75

23、.796 37.408 54.376 46.186 46.130 30.366 39.060 79.380 52.766 55.916'x2=7 5 6 5 4 6 9 5 2 7 4 3 5 1 8 6'x0=1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 'x=x0,x1,x2,x3,x4;alpha=0.05;b,bint,r,rint,stats=regress(y,x,alpha)rcoplot(r,rint);%踢出3,5数据后 一x4=49 25 36 25 36 81 25 4 16 9 25 64 36' y=196 63 84

24、 14 49 266 49 105 77 14 56 133 133' ;x3=4394.36 1678.05 2025.90 721.03 1284.51 5745.03 1399.36 2956.75 2127.98 922.09 1525.68 2784.25 3126.60'x1=66.290 40.964 45.010 26.852 35.840 75.796 37.408 54.376 46.130 30.366 39.060 52.766 55.916'x2=7 5 6 5 6 9 5 2 4 3 5 8 6'x0=1 1 1 1 1 1 1 1

25、1 1 1 1 1 'x=x0,x1,x2,x3,x4;alpha=0.05;b,bint,r,rint,stats=regress(y,x,alpha)rcoplot(r,rint)模型II第一次回归分析:%踢出3,5,后的 二x4=49 25 36 25 16 36 81 25 4 49 16 9 25 1 64 36' y=196 63 84 14 49 49 266 49 105 98 77 14 56 245 133 133' ;x3=4394.36 1678.05 2025.90 721.03 1453.29 1284.51 5745.03 1399.36 2956.75 2133.15 2127.98 922.09 1525.68 6301.18 2784.25 3126.60'x1=66.290 40.964 45.010 26.852 38.122 35.840 75.796 37.408 54.376 46.186 46.130 30.366 39.060 79.380 52.766 55.916'x2=7 5 6 5 4 6 9 5 2 7 4 3 5 1 8 6'x0=1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 'x5= 464.0300 204.8200 270.0600

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论