数学实验第10次作业-回归分析(共13页)_第1页
数学实验第10次作业-回归分析(共13页)_第2页
数学实验第10次作业-回归分析(共13页)_第3页
数学实验第10次作业-回归分析(共13页)_第4页
数学实验第10次作业-回归分析(共13页)_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上回归分析一 实验目的1 了解回归分析的基本原理,掌握MATLAB实现的方法;2 练习用回归分析解决实际问题。二 实验内容1 电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表),建立回归模型并进行检验,诊断异常点的存在并进行处理。每周收入9690959295959494电视广告费用1.52.01.52.53.32.34.22.5报纸广告费用5.02.04.02.53.03.52.53.0初步解决:首先对于题目作初步分析,题目中电视广告费用和报纸广告费用都会对与每周收入产生影响,但是两者对于每周收入的影响都是独立的。首先画出散点图如下:观察散点

2、图之后,假设自变量与因变量满足多元线性关系。设电视广告费用为x1,报纸广告费用为x2,每周收入为y,那么每周收入与电视广告费用以及报纸广告费用的关系模型表示如下:y=0+1x1+2x2;下面在MATLAB中输入以下命令:输出结果如下所示:结果列表如下:回归系数回归系数估计值回归系数置信区间083.211678.8058,87.617411.29850.4007,2.196222.33721.4860,3.1883R2=0.9089,F=24.9408,p=0.0025<0.05,s2=0.4897于是由它得到的预测模型为y=83.2116+1.2985x1+2.3372x2。做出残差和置

3、信区间的图像如下:由图像可以看出,只有第一组数据的置信区间不包括零,改组数据可能有误,去掉之后再进行计算。在命令栏中输入以下命令:输出结果如下所示:将结果列表如下:回归系数回归系数估计值回归系数置信区间081.488178.7878,84.188311.28770.7964,1.779022.97662.3281,3.6250R2=0.9768,F=84.3842,p=0.0005<0.05,s2=0.1257由它得到的回归模型为y=81.4881+1.2877x1+2.9766x2。对于实验结果的分析:回归模型:y=81.4881+1.2877x1+2.9766x2。对比剔除异常点后的

4、分析结果可知,第一次分析的过程中,第一组数据的置信区间不包括零点,所以该点为异常点,需要剔除再进行一次计算。剔除之后,发现所有点的置信区间都包括了零点。剔除数据之后计算结果与剔除之前的比较00int11int22int原始数据83.211678.8058,87.61741.29850.4007,2.19622.33721.4860,3.1883剔除后81.488178.7878,84.18831.28770.7964,1.77902.97662.3281,3.6250纵向比较可以看出,剔除了异常数据之后,置信区间明显的有了缩小,所以说,剔除异常数据可以有利于更加精确地建立模型。2 汽车销售商认

5、为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)18个月的调查资料见下表,其中y1是普通型汽车售量(千辆),y2是豪华型汽车售辆(千辆),x1是汽油价格(元/gal),x2是贷款利率(%)。序号y1y2x1x2122.17.21.896.1215.45.41.946.2311.77.61.956.3410.32.51.828.2511.42.41.859.867.51.71.7810.3713.04.31.7610.5812.83.71.768.7914.63.91.757.41018.97.01.746.91119.36.81.705.21230.110.11.704.9

6、1328.29.41.684.31425.67.91.603.71537.514.11.613.61636.114.51.643.11739.814.91.671.81844.315.61.682.3(1) 对普通型和豪华型汽车分别建立如下模型:y1=0(1)+1(1)x1+2(1)x2;y2=0(2)+1(2)x1+2(2)x2.给出的估计值和置信区间,决定系数R2,F值及剩余方差等;(2) 用x3=0,1表示汽车类型,建立统一模型:y=0+1x1+2x2+3x3,给出估计值和置信区间,决定系数R2,F值及剩余方差等。以x3=0,1代入统一模型,将结果与(1)的两个模型比较,解释二者的区别;

7、(3) 对统一模型就每种类型汽车分别作x1和x2与残差的散点图,有什么现象,说明模型有何缺陷?(4) 对统一模型增加二次项和交互项,考察结果有什么改进。初步解决:(1) 首先研究y1,在命令栏中输入以下命令:输出结果如下:结果列表如下:回归系数回归系数估计值回归系数置信区间090.181446.1971,134.16561-27.6588-54.5542,-0.76342-3.2283-4.2747,-2.1819R2=0.8593,F=45.7992,p<0.05,s2=20.7910由它得到的回归模型为:y=90.1814-27.6588x1-3.2283x2。1、2的置信区间不包含

8、零点,且p<,且计算可得,F1,n-2,1-=4.4940<F,所以该模型有效。下面研究y2,在命令栏中输入以下内容:输出结果如下:结果列表如下:回归系数回归系数估计值回归系数置信区间024.54715.9201,43.17401-4.6285-16.0184,6.76152-1.4360-1.8792,-0.9929R2=0.8402,F=39.4474,p<0.05,s2=3.7288由它得到的回归模型为:y=24.5471-4.6285x1-1.4360x2。1的置信区间包含了零点,所以该模型无效。(2) 对于统一模型,用x3来表示车的类型,x3=0表示普通型,x3=1

9、表示豪华型。在命令栏中输入以下内容:输出结果如下所示:结果列表如下:回归系数回归系数估计值回归系数置信区间064.575333.5007,95.64991-16.1436-35.1193,2.83202-2.3322-3.0705,-1.59393-14.4222-17.6546,-11.1898R2=0.8366,F=54.6111,p<0.05,s2=22.6642由它得到的统一回归模型为:y=64.5753-16.1436x1-2.3322x2-14.4222x3。1的置信区间包含了零点,所以该模型无效。下面对这个统一模型进行研究:首先将x3=0代入统一模型,得到回归模型为y1=64.5753-16.1436x1-2.3322x2,然后将x3=1代入统一模型,得到回归模型为y2=50.1531-16.1436x1-2.3322x2。与第一问的结果相比相差较大,说明该模型并不合适。(3) 对于第二问中求出的的统一模型,分别画出x1、x2与残差的散点图。首先是x1与残差的散点图:然后是x2与残差的散点图:对于两幅图,纵轴均为残差,横轴分别为x1和x2。两种类型的汽车残差分布不同,这说明x3(即汽车类型)与x1、x2有交互作用,模型中应添加交互项。(4) 在MATLAB中尝试使用逐步回归来建立包括二次项和交互项的模型。在命令栏中输入以下命令:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论