




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
拟合在实际问题中的应用摘要本文考虑的是18位35岁—44岁经理的年平均收入与风险偏好度和人寿保险金额之间关系的问题。首先用散点图和题目条件预测出收入与人寿保险金额成二次关系,风险偏好度与人寿保险金额成线性关系。利用matlab统计工具箱中的命令regress,在置信水平为的条件下,对数据进行拟合观察回归变量对因变量的影响是否显著,然后分别对风险偏好度和人寿保险额就是否存二次效应以及两个自变量是否对人寿保险额有交互效应进行拟合,最终得到与和之间的关系为:关键字:散点图曲线拟合一、问题重述下表列出了某城市18位35岁—44岁经理的年平均收入千元,风险偏好度和人寿保险金额千元的数据,其中风险偏好度是根据发给每个经理的问卷调查表综合评估得到的,它的数值越大,就越偏爱高风险。研究人员想研究此年龄段中的经理所投保的人寿保险额与年均收入及风险偏好度之间的关系。研究者预计,经理的年均收入和人寿保险额之间存在着二次关系,并有把握地认为风险偏好度对人寿保险额有线性效应。但对风险偏好度对人寿保险额是否有二次效应以及两个自变量是否对人寿保险额有交互效应,心中没底。请你通过表中的数据来建立一个适宜的回归模型,验证上面的看法,并给出进一步的分析。序号序号119666.2907104937.408526340.96451110554.3762325272.99610129846.186748445.0106137746.1304512657.2044141430.366361426.8525155639.060574938.12241624579.380184935.84061713352.7668926675.79691813355.9166二、问题分析本文是一个求数据间相互关系的问题。首先我们利用最常用的观测数据之间关系的散点图出发,画出收入—人寿保险额和风险偏好度——人寿保险额的散点图如下〔程序见附录〕:〔图1〕〔图2〕其次我们利用matlab工具箱中的程序对数据进行拟合,观察回归变量对因变量的影响是否显著。三、模型假设与约定假设该问卷调查表的数据全部真是可靠,且这18位经理具有随机性。四、符号说明:经理的年均收入:风险偏好度:人寿保险额五、模型建立与求解利用题目中给出的条件和散点图可以发现,随着的增加,有向上弯曲增长的趋势,图中的曲线可用二次函数模型〔1〕拟合〔其中是随机误差〕。而对于风险偏好度和人寿保险额的图像可以看出,随着的增加,的值有比拟明显的线性增长趋势。图中的‘*’可用线性模型〔2〕拟合。综合上面的分析,结合模型〔1〕和〔2〕建立如下的回归模型〔3〕在matlab中输入如下程序:>>x1=[66.2940.96472.99645.0157.20426.85238.12235.8475.79637.40854.37646.18646.1330.36639.0679.3852.76655.916];>>y=[19663252841261449492664910598771456245133133];>>x2=[7510645469527435186];>>x=[ones(18,1)x1'(x1.^2)'x2'];>>[b,bint,r,rint,stats]=regress(y',x)得到模型〔3〕的回归系数估计值及置信区间〔置信水平〕、检验统计量,,的结果如下表。参数参数估计值参数置信区间-62.3489[-73.5027-51.1952]0.8396[0.39511.2840]0.0371[0.03300.0412]5.6846[5.26046.1089]=1.0e+004*0.0001=1.0e+004*1.1070=1.0e+004*0表中显示,=1.0e+004*0.00011指应变量的大约100%可由模型确定,值远远超过检验的临界值,远小于,因而模型〔3〕从整体来看是可用的。回归系数的参数置信区间均不包含零点,说明回归变量对的影响均是显著的。将回归系数的估计值代入模型〔3〕,可得到模型〔3〕的预测方程〔4〕六、进一步讨论〔一〕、假设风险偏好度对人寿保险额具有二次效应对模型〔3〕增加人寿保险额的二次效应,可得模型为:〔5〕在matlab中输入如下程序:>>x=[ones(18,1)x1'(x1.^2)'x2'(x2.^2)']>>[b,bint,r,rint,stats]=regress(y',x)参数参数估计值参数置信区间-60.9104[-72.6072-49.2135]0.9303[0.43891.4218]0.0359[0.03100.0408]4.4529[1.69107.2147]0.1159[-0.14080.3727]=1.0e+003*0.0010=1.0e+003*8.2740=1.0e+003*0利用模型〔3〕的判别方法,模型〔5〕从整体来看是可用的。在检验回归系数的参数置信区间发现,的置信区间包含零点,说明回归变量对应变量的影响不是太显著。所以模型〔5〕没有模型〔3〕更符合实际。〔二〕、假设年均收入和风险偏好度对人寿保险额据有交互效应对模型〔3〕增加年均收入和风险偏好度对人寿保险额据有交互效应,可得模型为:〔6〕在matlab中输入如下程序:>>x=[ones(18,1)x1'(x1.^2)'x2'(x1.*x2)']>>[b,bint,r,rint,stats]=regress(y',x)参数参数估计值参数置信区间-65.9461[-79.6004-52.2917]0.8731[0.41971.3265]0.0374[0.03320.0415]6.6005[4.57868.6223]-0.0138[-0.04360.0160]=1.0e+003*0.0010=1.0e+003*8.3044=1.0e+003*0与模型〔5〕相同,的置信区间包含零点,所以模型〔6〕没有模型〔3〕更符合实际。七、模型优缺点该模型首先利用散点图描绘数据之间的关系,然后大胆的对数据进行了假设,后利用了matlab的拟合函数进行拟合,整体来说该模型的处理过程是科学的,可是由于题目中给出的数据较少,在拟合的过程中难免会有较大的误差,并且,假设数据之间的关系时只是假设为简单的初等函数,虽然拟合程度较好,可是还是缺乏科学依据。八、参考文献及参考书籍和网站[1]姜启源谢金星叶俊.数学模型〔第三版〕.高等教育出版社[2]孙祥徐流美吴清.MATLAB7.0根底教程。清华大学出版社[3]中国知识资料总库.九、附录画图〔1〕>>x1=[66.2940.96472.99645.0157.20426.85238.12235.8475.79637.40854.37646.18646.1330.36639.0679.3852.76655.916];>>y=[19663252841261449492664910598771456245133133];>>a=polyfit(x1,y,2);>>z=polyval(a,x1);>>plot(x1,y,'k+',x1,z,'r*')其中拟合的曲线为:y=0.0302+1.7886x1-60.5239x1.^2画图〔2〕>>x2=[7510645469527435
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 橡胶制品质量控制与检测考核试卷
- 皮鞋生产工艺流程再造考核试卷
- 留在心底的声音初三语文作文
- 上海高三语文一模满分作文
- 摩托车展示区环境卫生考核试卷
- 再生物资回收与工业绿色转型考核试卷
- 静脉血液标本采集指南(WST661-2020)解读
- 河南省洛阳市2023~2024学年高一数学下学期5月月考试题含答案
- 二年级加减混合运算练习题
- 山东省牡丹区胡集中学2024-2025学年初三下期期中考试英语试题含答案
- 工作交接表excel模板
- 滚筒式柑橘分选机的设计
- 孟母三迁成语故事
- 瓦斯发电方案
- Q-CR 807-2020 隧道喷射混凝土用液体无碱速凝剂
- 民间非营利组织会计制度分解
- GB/T 20564.2-2017汽车用高强度冷连轧钢板及钢带第2部分:双相钢
- GB/T 13914-2013冲压件尺寸公差
- GB/T 11349.3-1992机械导纳的试验确定冲击激励法
- 《政治学原理》课件
- 【高效管理】团队建设-如何迈向高绩效团队课件
评论
0/150
提交评论