




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验13 回归分析【实验目的】1. 了解回归分析的基本原理,掌握MATLAB实现的方法; 2. 练习用回归分析解决实际问题。【实验内容】【题目2】 电影院调查电视广告费用和报纸广告费用对每周收入的影响,得到下面的数据(见下表), 建立回归模型并进行检验,诊断异常点的存在并进行处理。每周收入9690959295959494电视广告费用1.52.01.52.53.32.34.22.5报纸广告费用5.02.04.02.53.03.52.53.02.1 模型分析本题研究电视广告费用与报纸广告费用对电影收入的影响。我们首先尝试线性回归,由R2 值判断回归模型是否合理。如果不合理, 再采取其他方法进行回归
2、分析。设电视广告费用为,报纸广告费用为,每周电影院收入为y。建立如下模型: 2.2 matlab求解y=96 90 95 92 95 95 94 94;x1=1.5 2.0 1.5 2.5 3.3 2.3 4.2 2.5;x2=5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0;n=8;m=2;X=ones(8,1),x1',x2'b,bint,r,rint,s=regress(y',X);b,bint,srcoplot(r,rint)得到如下结果:b = 83.2116 1.2985 2.3372bint = 78.8058 87.61741 / 14 0
3、.4007 2.1962 1.4860 3.1883s = 0.9089 24.9408 0.0025 0.4897 整理成表格如下:回归系数回归系数估计值回归系数置信区间083.211678.8058 87.617411.29850.4007 2.196222.33721.4860 3.1883R2=0.9089 , F=24.9408 , p=0.0025 , s2=0.4897 在残差及置信区间的图中,第一个点的残差的置信区间不包含零点,以红色标出。残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。2.3 剔
4、除点后重新计算删除第一个点后重新计算,将输出结果同样以表格表示。回归系数回归系数估计值回归系数置信区间081.488178.7878 84.188311.28770.7964 1.779022.97662.3281 3.6250R2=0.9768 , F=84.3842 , 0.0005 , s2=0.1257剔除第一个异常点后,R2=0.97685,相比之前有了增加,拟合的线性性有了提高;相比之前的模型,p值也有了明显的减少,远小于显著性水平,这表示置信概率大大提高了;s2 也有了减小,说明了偏差减小。综合以上几点,说明这个二元线性的模型比较合理,回归效果很好。 拟合公式为y=81.4881
5、+1.2877x1+2.9766x2+=2.4 小结本题是个较为直观的线性回归题,在它的计算中出现了异常点。剔除后计算可以得到一个回归效果相当好的模型。【题目8】汽车销售商认为汽车销售量与汽油价格、贷款利率有关,两种类型汽车(普通型和豪华型)18个月的调查资料如表,其中y1是普通型汽车售量(千辆),y2是豪华型汽车售量(千辆),x1是汽油价格(元/gal),x2是贷款利率(%)(1)对普通型和豪华型汽车分别建立如下模型:y1=0(1)+1(1)x1+2(1)x2,y2=0(2)+1(2)x1+2(2)x2给出的估计值和置信区间,决定系数R2,F值及剩余方差等。(2)用x3=0,1表示汽车类型,
6、建立统一模型y=0+1x1+2x2 +3x3 ,给出给出的估计值和置信区间,决定系数R2,F值及剩余方差等。以x3=0,1带入统一模型,将结果与(1)的两个模型的结果比较,解释二者的区别。(3)对统一模型就每种类型汽车分别作x1和x2与残差的散点图,有什么现象,说明模型有何缺陷?(4)对统一模型增加二次项和交互相,考察结果有什么改进。8.1 根据模型分别求解 由题意,对普通型和豪华型汽车分别建立如下模型:y1=0(1)+1(1)x1+2(1)x2,y2=0(2)+1(2)x1+2(2)x2此为二元线性回归,可用matlab编写程序如下:y1=22.1,15.4,11.7,10.3,11.4,7
7、.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3;y2=7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6
8、,3.1,1.8,2.3;n=18;m=2;X=ones(n,1),x1',x2'b1,bint1,r1,rint1,s1=regress(y1',X);b2,bint2,r2,rint2,s2=regress(y2',X);subplot(2,1,1)rcoplot(r1,rint1)subplot(2,1,2)rcoplot(r2,rint2)得到如下图:在残差及置信区间的图中,有三个点的残差的置信区间不包含零点,以红色标出。残差应该服从均值为0的正态分布,可以认为这个数据是异常的,偏离了数据整体的变化趋势,给模型的有效性的精度带来不利影响,应予以剔除。8.
9、2 剔除点后的模型求解(1)对于y1=0(1)+1(1)x1+2(1)x2剔除第14、18个点后继续自此基础上剔除第11个点(2)对于y2=0(2)+1(2)x1+2(2)x2剔除第14个点后继续剔除第七个点,得到残差及置信区间图如下:将输出结果汇总成下表:普通型回归系数回归系数估值回归系数置信区间0(1)107.560175.3160 139.80421(1)-37.9283-57.2842 -18.57232(1)-3.0314-3.7862 -2.2767R2=0.9334 F=84.0758 p<0.0001 s2=9.2746豪华型回归系数回归系数估值回归系数置信区间0(2)2
10、9.758316.2864 43.23031(2)-6.7738-14.9774 1.42992(2)-1.6367-1.9680 -1.3054R2=0.9450 F=103.1152 p<0.0001 s2=1.5413可得模型如下:普通型:y=107.5601-37.9283x1-3.0314x2豪华型:y=29.7583-6.7738x1-1.6367x28.3 建立统一模型 建立统一模型y=0+1x1+2x2 +3x3 ,用x3=0表示普通型,x3=1表示豪华型,此时为三元线性回归,可用matlab编写程序如下:y=22.1,15.4,11.7,10.3,11.4,7.5,13
11、.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.
12、61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;x3=zeros(1,18),ones(1,18);n=36;m=3;X=ones(n,1),x1',x2',x3'b,bint,r,rint,s=regress(y',X);b,bint,srcoplot(r,rint)输出如下
13、结果:b = 64.5753 -16.1436 -2.3322 -14.4222bint = 33.5007 95.6499 -35.1193 2.8320 -3.0705 -1.5939 -17.6546 -11.1898s = 0.8366 54.6111 0.0000 22.6642回归系数回归系数估值回归系数置信区间064.575333.5007 95.64991-16.1436-35.1193 2.83202-2.3322-3.0705 -1.59393-14.4222-17.6546 -11.1898R2=0.8366 F=54.6111 p<0.0001 s2= 22.66
14、42可得模型为:y=64.5753-16.1436-2.3322x2 -14.4222x3,x3=0表示普通型,x3=1表示豪华型。即:普通型:y=64.5753-16.1436-2.3322x2 豪华型:y=50.1531-16.1436-2.3322x2 可以看出:统一模型相当于将分立模型进行了统一:(1)统一模型的值趋近于给分立模型的“平均”;(2)统一模型的残差较大;(3)统一模型的决定系数较小;(4)统一模型的拒绝概率较小,到达了10的-12次方量级,说明模型更加有效;总体上讲,将两者统一后进行回归分析的结果有其优点,但是仍有许多不理想的成分。8.4 就每种类型汽车分别作x1和x2与
15、残差的散点图y=22.1,15.4,11.7,10.3,11.4,7.5,13.0,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3,7.2,5.4,7.6,2.5,2.4,1.7,4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68,1.89,1.94,1.95,1.82,1.85,1.78,1.7
16、6,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3,6.1,6.2,6.3,8.2,9.8,10.3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;x3=zeros(1,18),ones(1,18);n=36;m=3;X=ones(n,1),x1',x2',x3'b,bint,r,rint,s=regres
17、s(y',X);x11=x1(:,1:18);x22=x2(:,1:18);r1=r(1:18,:);r2=r(19:36,:);subplot(2,2,1)plot(x11,r1,'r+')title('ÆÕͨÐÍÆû³µ£º²Ð²îÓëx1µÄÉ¢µãͼ')subplot(2,2,2)plo
18、t(x22,r1,'r+')title('ÆÕͨÐÍÆû³µ£º²Ð²îÓëx2µÄÉ¢µãͼ')subplot(2,2,3)plot(x11,r2,'r+')title('ºÀ»ªÐÍÆû³
19、;µ£º²Ð²îÓëx1µÄÉ¢µãͼ')subplot(2,2,4)plot(x22,r2,'r+')title('ºÀ»ªÐÍÆû³µ£º²Ð²îÓëx2µÄÉ¢µ
20、;ãͼ')得到如下图形对比以上各图,发现针对同一变量(x1或x2),两种类型汽车所得的残差变化趋势不一致,说明x1、x2与x3有交互作用,即模型的缺陷是缺少二次项和交互项。8.5 对统一模型增加二次项和交互相进行回归(1)增加交互项,改用模型:y=0+1x1+2x2+3x3+4x1x2+5x2x3+6x3x1进行回归分析x1=1.89,1.94,1.95,1.82,1.85,1.78,1.76,1.76,1.75,1.74,1.70,1.70,1.68,1.60,1.61,1.64,1.67,1.68;x2=6.1,6.2,6.3,8.2,9.8,10.
21、3,10.5,8.7,7.4,6.9,5.2,4.9,4.3,3.7,3.6,3.1,1.8,2.3;x3 = zeros(1,length(x1),ones(1,length(x2);x1 = x1,x1;x2 = x2,x2;x1x2 = x1.*x2;x1x3 = x1.*x3;x2x3 = x2.*x3;x12 = x1.*x1;x22 = x2.*x2;y1=22.1,15.4,11.7,10.3,11.4,7.5,13,12.8,14.6,18.9,19.3,30.1,28.2,25.6,37.5,36.1,39.8,44.3;y2=7.2,5.4,7.6,2.5,2.4,1.7,
22、4.3,3.7,3.9,7.0,6.8,10.1,9.4,7.9,14.1,14.5,14.9,15.6;X=ones(length(x1),1),x1',x2',x3',x1x2',x2x3',x1x3'Y = y1,y2;b,bint,r,rint,s=regress(Y',X);b,bint,s得到如下结果:b = 141.1004 -57.4368 -12.5875 -65.6343 5.3855 1.7923 23.0304bint = 39.5625 242.6383 -117.0970 2.2235 -30.2968 5.1
23、218 -111.3383 -19.9303 -4.7953 15.5663 0.7050 2.8796 -4.9166 50.9774s = 0.9203 55.8474 0.0000 12.1906发现R2、F和s2都有所改善,模型有效的概率也有所提高,但是x1,x2的置信区间都包含0,这应当是由于引入交互项x1x3和x2x3导致的。(2)增加二次项改用模型:y=0+1x1+2x2+3x3+4x12+5x22这里不增加x32是因为它和x3一样。将程序改为X=ones(length(x1),1),x1',x2',x3',x12',x22'得到如下结果:b = -140.9671 217.3994 -6.0022 -14.4222 -62.6018 0.2625bint = -741.4504 459.5163 -456.1560 890.9548 -9
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 冷冻食品采购合同
- 建设工程施工合同空
- 拆迁工程承包合同
- 无底薪房产销售合同年
- 度电线电缆购销合同汇编
- 城市公园环境监测与维护合同
- 《分布式能源》 教学大纲
- 《动物行为的研究》
- 宽带网络电话客户签约合同 (2025年版)
- 委托装潢服务合同范本
- 内设部室及人员调整工作方案
- 反违章安全培训课件
- 社会主义发展史智慧树知到期末考试答案2024年
- Q-GDW 644-2011 配网设备状态检修导则
- 《公路桥梁抗震性能评价细则》(JTG-T2231-02-2021)
- 代持股协议书范文集合
- 装饰装修工程监理细则详解样本
- 中国急性胰腺炎诊治指南
- 学生食堂满意度测评表
- 新生儿颅内感染课件
- 急诊科护士的急救护理的评估和监督机制
评论
0/150
提交评论