




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人寿保险问题【摘要】本文结合实际背景,经过对数据的观察并汇出其散点图推测经理的人寿保险额只与其年均收入和风险偏好度之间分别存在着二次效应和线性效应。在采用混合回归模型建立起了经理的人寿保险额与其年均收入和风险偏好度之间的函数关系式,采用最小二乘法利用MATLAB软件的统计工具箱结合题中所给数据对各参数的值与其置信区间进行了估计,并很好的通过了回归的检验。在通过对原模型进行改进的基础上,以一预测模型各参数的置信区间不应有零点作为该预测模型的可行的原则,验证了经理的年均收入和风险偏好度对其人寿保险额不存在交互效应。人寿保险问题是一类统计回归模型问题,该模型是类随机模型,运用统计学的方法去解决现实中的类似问题。此论文通过对现有调查数据的分析,并用MATLAB等数学软件画出相应的图形,找出数据间的相关关系(一次关系,二次关系等),建立相应的数学模型。本文的独特之处就是建立多个模型,对每个模型进行分析解出结果,并分析回归得一较优的模型。【关键词】:保险额风险偏好度回归系数置信区间统计回归方法目录一、问题重述-4-二、基本假设-4-三、符号说明-5-四、问题分析:-5-五、模型建立与求解-5-六、结果分析-14-七、参考文献-14-八、附录-14-一、问题重述下表列出了某城市18位35岁~44岁经理的年平均收入(千元),风险偏好度和人寿保险额(千元)的数据,其中风险偏好度是根据发给每个经理的问卷调查表综合评估得到的,它的数值越大,就越偏爱高风险。研究人员想研究此年龄段中的经理所投保的人寿保险额与年均收入及风险偏好度之间的关系。研究者预计,经理的年均收入和人寿保险额之间存在着二次关系,并有把握地认为风险偏好度对人寿保险额有线性效应,但对风险偏好度对人寿保险额是否有二次效应以及两个自变量是否对人寿保险额有交互效应,心中没底。请你通过表中的数据来建立一个合适的回归模型,验证上面的看法,并给出进一步的分析。表一序号yx1x2119666.290726340.9645325272.9961048445.0106512657.204461426.852574938.122484935.8406926675.7969104937.40851110554.3762129846.1867137746.1304141430.3663155639.06051624579.38011713352.76681813355.9166二、基本假设(1)风险偏好度对人寿保险额有二次效应;(2)风险偏好度和经理年平均收入对人寿保险额有交互效应。三、符号说明——人寿保险额——经理的年平均收入——风险偏好度——回归系数(=0、1、2、3,4)——随机误差——回归方程的决定系数——统计量值——与统计量对应的概率值四、问题分析:在现实生活中,35岁~44岁之间的经理很关心他们的人寿保险额跟风险偏好度和年平均收入有怎样的关系,本问题研究的是35岁~44岁经理的年平均收入与风险偏好度和人寿保险额之间的关系,通过调查发现人寿保险额受经理的年平均收入与风险偏好度的影响,依次来研究它们之间的关系。五、模型建立与求解基于上面的分析,我们利用x1和x2来建立y的预测模型。基本模型І通过大概的分析并根据题意得y与x1和x2的关系,利用表一的数据分别作出了y与x1和x2的散点图(如下图所示)。图一(y对x1的散点图)图二(y对x2的散点图)又由基本假设可知y与x2的关系,利用表一的数据分别作出了y与x2的散点图(如下图所示)。图三(y对x2的散点图)通过图一我们发现,随着x1的增长,y有明显向上弯曲增加的趋势,图中的曲线可以用二次函数模型y=β0+β1x1+β2x12+ε(1)拟合的(其中ε是随机误差)。而在图二中,当x2的增大时,y有明显增长趋势,图中的直线用线性模型y=β0+β1x2+β2x22+ε(2)拟合的(其中ε是随机误差)。综合以上的分析,结合模型(1)和(2)建立如下模型y=β0+β1x1+β2x2+β3x12+β4x22+ε(3)(3)式右端的x1和x2称为回归变量(自变量),β0+β1x1+β2x2+β3x12+β4x22是给定经理的年平均收入x1、风险偏好度x2时,人寿保险额y的平均值,其中的参数β0,β1,β2,β3,β4称为回归系数,由表1的数据估计,影响y的其他因素作用都包含在随机误差ε中,如果模型选择得合适,ε应大致服从均值为零的正态分布。模型求解:直接利用MATLAB统计工具箱中的命令regress求解,使用格式为:【b,bint,r,rint,stats】=regress(y,x,alpha)其中输入y为模型(3)中y的数据(n维向量,n=30),x为对应于回归系β=(β0,β1,β2,β3,β4)的数据阵【1x1x2x12x22】(n×5矩阵,其中第1列为全1向量),alpha为置信水平α(缺省时α=0.05);输出b为β的估计值,常记做٨β,bint,为b的置信区间,r为残差向量y-x٨β,rint为r的置信区间,stats为回归模型的检验统计量,有三个值第一个是回归方程的决定系数R2(R是相关系数),第二个是F统计量值,第三个是与F统计量对应的概率值p。得到模型(3)的回归系数估计值及其置信区间(置信水平α=0.05),的结果见表2.表二参数参数估计参数置信区间β0-60.9101[-72.6072-49.2130]β10.9303[0.43891.4218]β24.4529[1.69107.2149]β30.0359[0.03100.0408]β40.1159[-0.14090.3727]R2=0.999607357642094F=8274.0026564139p<<0.05S2=3.26322882309438用模型(3)对人寿保险额做预测,经理的年平均收入x1和风险偏好度x2,表2的回归系数给出了模型(3)中的估计值β0,β1,β2,β3,β4,即β0=-60.9101,β1=0.9303,β2=4.4529,β3=0.0359,β4=0.1159,则人寿保险额的估计值y=-60.9101+0.9303x1+4.4529x2+0.0359x12+0.1159x22,与模型(3)的结果相比,与表3检查它们的置信区间发现只有β4的置信区间包含零点,表明回归变量x12不是太显著的,因此,β4的估计值是不可靠的,要对模型(3)进行残差分析,首次回归所得图四图四(模型(3)进行残差分析)图四存在异常数据,剔除第5数据后再次回归,得到回归分析图五图五(剔除第5个数据后进行残差分析)图六(继续剔除第3个数据后进行残差分析)图七(继续剔除第5个数据后进行残差分析)图七(继续剔除第9个和第13个数据后进行残差分析)结果其如表四:表四参数参数估计参数置信区间β0-63.2115[-69.8783-56.5447]β11.0999[0.83671.3630]β23.4542[1.79435.1141]β30.0340[0.03110.0368]β40.2450[0.07600.4139]R2=0.9999F=27739.0097899986p<<0.05S2=0.565703715419549在经过几组数据的踢出,使得模型的各估计值更为有了提升,无异常数据,该模基本可用。所以通过模型二的建立,其各计值β0=-63.2115,β1=1.0999,β2=3.4542,β3=0.0340,β4=0.2450,则其预测方程为y=-63.2115+1.0999x1+3.4542x2+0.0340x12+0.2450x22从中我们可知人寿保险额y与风险偏好度x1有二次关系该模似乎可以使用了,但是为了得到人寿保险额y是否与风险偏好度x1和经理年收入x2有交互效应,我们将对模型(3)进行再次改进。改进模型II为进一步的了解人寿保险额y与经理的年平均收入x1和风险偏好度x2是否有交互效应。不妨简单的用x1,x2的乘积表示经理的年平均收入x1和风险偏好度x2交互效应,于是将模型(3)进一步改进得到y=β0+β1x1+β2x2+β3x12+β4x22+β5x1x2+ε(4)在这模型中,假设经理的年平均收入x1和风险偏好度x2有关,下面我们通过分析作出了y跟x1,x2乘积的散点图,见如下图八所示:图八利用matlab统计工具箱中的命令求解,得到表四的回归系数估计值及其置信区间(置信水平a=0.05)结果见表五:表五参数参数估计参数置信区间β0-65.3856[-78.7266-52.0447]β11.0172[0.52021.5141]β25.2171[2.27858.1558]β30.0358[0.03100.0406]β40.1662[-0.09560.4279]β5-0.0196[-0.05010.0109]R2=0.9997F=p<<0.05S2=3.0381用模型(3)对人寿保险额做预测,经理的年平均收入x1和风险偏好度x2,与模型(3)的结果相比,表3的回归系数给出了模型(3)中的估计值β0,β1,β2,β3,β4,β5即β0=-65.3856,β1=1.0172,β2=5.2171,β3=0.0358,β4=0.1662,β5=-0.0196则人寿保险额的预测方程为y=-65.3856+1.0172x1+5.2171x2+0.0358x22+0.1662x12-0.0196x1x2,根据表3检查它们的置信区间发现有β4,β5的置信区间包含零点,表明回归变量x22,x1x2不是显著的,对此不能正确判断,需对模型(4)作残差分析,首次进行得到图九图九踢出第3,5个数据后的回归分析图十如下所示:图十再出第5个数据后的回归分析图十一下所示:图十一通过残差分析得到数据如表所示:表六参数参数估计参数置信区间β0-64.7763[-72.7255-56.8270]β11.1075[0.83821.3768]β23.8722[1.79915.9454]β30.0347[0.03210.0374]β40.2917[0.09620.4871]β5-0.0160[-0.03320.0011]R2=0.9999F=20637.1319676015p<<0.05S2=0.8105通过这三次的残差回归分析,踢出几组数据后,各数据都能表示人寿保险额y与经理的年平均收入x1和风险偏好度x2的关系,可通过残差回归分析检查得到,最后的数据发现β5的置信区间包含零点,表明回归变量x1x2(对变量y的影响)不是太显著地,我们将变量x1x2从模型(4)中去掉。六、结果分析模型(3):表四显示,p远小于α,通过残差回归分析,几次数据的踢出,得到的使数据更有说服力,模型从整体看上去还是可用的。表明人寿保险额y与风险偏好度x2有二次关系;所以,模型(3)的预测方程为y=-63.2115+1.0999x1+3.4542x2+0.0340x12+0.2450x22模型(4):表六显示,发现β5的置信区间包含零点,并通过残差回归分析,得到最后的数据,还是包含零点,得到最后的结论是去除模型(6)的变量x1x2,可知经理的年平均收入x1和风险偏好度x2两个自变量的交互效应与人寿保险额y没有关系。七、参考文献【1】数学模型(第三版).姜启源,谢金星,叶俊.北京,高等教育出版社,2023【2】MATLAB7.X程序设计.王建卫,曲中水,凌滨.北京,中国水利水电出版社,2007八、附录模型I第一次分析:①%未踢出前的一clearclcfigure(1)x1=[66.29040.96472.99645.01057.20426.85238.12235.84075.79637.40854.37646.18646.13030.36639.06079.38052.76655.916]'x2=[7510645469527435186]'y=[19663252841261449492664910598771456245133133]'plot(x1,y,'or')xlabel('x1(元)')ylabel('y(百万支)')figure(2)plot(x2,y,'or')xlabel('x2(元)')ylabel('y(百万支)')one1=ones(18,1);x=[one1,x1,x2,x1.^2,x2.^2];alpha=0.05;[b,bint,r,rint,stats]=regress(y,x,alpha)②%踢出3数据后clearclcx1=[66.29040.96445.01026.85238.12235.84075.79637.40854.37646.18646.13030.36639.06079.38052.76655.916]'x2=[7565469527435186]'x3=[4394.361678.052025.90721.031453.291284.515745.031399.362956.752133.152127.98922.091525.686301.182784.253126.60]';x4=[49253625163681254491692516436]';y=[19663841449492664910598771456245133133]'figure(1)plot(x1,y,'or')xlabel('x1(‘™)')ylabel('y(∞ŸÕÚ÷ß)')figure(2)plot(x2,y,'or')xlabel('x2(‘™)')ylabel('y(∞ŸÕÚ÷ß)')one1=ones(16,1);x=[one1,x1,x2,x1.^2,x2.^2];alpha=0.05;[b,bint,r,rint,stats]=regress(y,x,alpha)rcoplot(r,rint)③%踢出5数据后clearclcx1=[66.29040.96445.01026.85235.84075.79637.40854.37646.18646.13030.36639.06079.38052.76655.916]'x2=[756569527435186]'x3=[4394.361678.052025.90721.031284.515745.031399.362956.752133.152127.98922.091525.686301.182784.253126.60]';x4=[492536253681254491692516436]';y=[196638414492664910598771456245133133]'figure(1)plot(x1,y,'or')xlabel('x1(‘™)')ylabel('y(∞ŸÕÚ÷ß)')figure(2)plot(x2,y,'or')xlabel('x2(‘™)')ylabel('y(∞ŸÕÚ÷ß)')one1=ones(15,1);x=[one1,x1,x2,x1.^2,x2.^2];alpha=0.05;[b,bint,r,rint,stats]=regress(y,x,alpha)rcoplot(r,rint)eq\o\ac(○,4)%踢出9,13后的clearclcx1=[66.29040.96445.01026.85235.84075.79637.40854.37646.13030.36639.06052.76655.916]'x2=[7565695243586]'x3=[4394.361678.052025.90721.031284.515745.031399.362956.752127.98922.091525.682784.253126.60]';x4=[492536253681254169256436]';y=[1966384144926649105771456133133]'figure(1)plot(x1,y,'or')xlabel('x1(‘™)')ylabel('y(∞ŸÕÚ÷ß)')figure(2)plot(x2,y,'or')xlabel('x2(‘™)')ylabel('y(∞ŸÕÚ÷ß)')one1=ones(13,1);x=[one1,x1,x2,x1.^2,x2.^2];alpha=0.05;[b,bint,r,rint,stats]=regress(y,x,alpha)rcoplot(r,rint)模型第一次回归分析:①%踢出3,5,后的二clearclcx1=[66.29040.96445.01026.85238.1223
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年贵州水投水库运营管理西秀有限公司招聘笔试参考题库附带答案详解
- 2025年重庆璧山区龙湖两山物业服务有限公司招聘笔试参考题库含答案解析
- 2025年河南西峡县宜居城镇环保科技有限公司招聘笔试参考题库含答案解析
- 高校财务规划解读
- 2025五指山市仁兴镇社区工作者考试真题
- 2025唐山市迁安市上射雁庄镇社区工作者考试真题
- 2025台州市仙居县步路乡社区工作者考试真题
- 2024哈佛大学人工智能政务服务
- 智能食品自助售卖机创新设计方案
- 胃肠外科护理读书报告
- 有色金属冶金概论总论
- 砂石料单价编制
- 海藻学知到章节答案智慧树2023年烟台大学
- 六年级下册道德与法治期中测试卷含答案【考试直接用】
- EIM Book 1 Unit 11 Promise,promise单元知识要点
- 全陕西师范大学《716文学综合》考研真题详解下载全
- 引航梯的位置和标识及保养记录
- 外科学急性化脓性腹膜炎
- 苯酚的分子组成和结构课件
- 《罗织经》全文及翻译
- GB∕T 26077-2021 金属材料 疲劳试验 轴向应变控制方法
评论
0/150
提交评论