第11章_多元回归及复相关分析.ppt_第1页
第11章_多元回归及复相关分析.ppt_第2页
第11章_多元回归及复相关分析.ppt_第3页
第11章_多元回归及复相关分析.ppt_第4页
第11章_多元回归及复相关分析.ppt_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2020/7/24,1,第11章多元回归和多重相关分析,2020/7/24,2,单变量线性回归,多元线性回归,回归分析,数学模型和定义,*模型参数估计,*测试,预测和控制,可线性化单变量非线性*测试和预测,多元线性回归,逐步回归分析,2020/7/24,3,11.1,多元线性回归方程,2020/7/24,4,1,多元线性回归模型(残差平方和),2020/7/24,8,3。多元线性回归中的检验和预测,(R)检验,2020/7/24,9,2,预测,(1)点预测,(2)区间预测,2020/7/24,10,2020 (1)从所有可能的因素(变量)组合的回归方程中选择最好的;(2)从包含所有变量的回归方

2、程中剔除无关紧要的因素;(3)从一个变量开始,将变量逐一引入方程;选择“最佳”回归方程有几种方法:“最佳”回归方程包括对Y有影响的所有变量,但不包括对Y无显著影响的变量。第四种方法,逐步回归分析,是筛选变量的理想方法。2020/7/24/11。重复该过程,直到没有显著变量从回归方程中消除,并且没有显著变量被引入回归方程。逐步回归分析的思想:从一个自变量开始,根据因变量Y的显著性,由大到小逐一引入回归方程。当引入的自变量由于引入后一个变量而变得不重要时,应将其消除。引入自变量或从回归方程中去除自变量是逐步回归的一个步骤。每一步都要进行Y值检验,以确保回归方程在每次引入新的显著变量之前只包含对Y有

3、显著影响的变量。,2020/7/24,12,统计工具箱中的回归分析命令,1,多元线性回归,2,多项式回归,3,非线性回归,4,逐步回归,2020/7/24,13,多元线性回归,b=回归(y,x),1,确定回归3。得出残差及其置信区间:rcoplot(r,rint)。2.找出回归系数的点估计和区间估计,并检验回归模型:b,bint,r,rint),2 stats=回归(y,x,),2020/7/24,15,例1,x=1(16,1)x;y=88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102;2。回归分析和测试:b,bint,r,rint,stats=

4、回归(y,x) b,bint,stats,转到MATLAB (liti 11),主题,2020/7/24,16,3。残差分析,制作残差图:rcoplot(r,rint)其它数据的残差均接近于零,残差的置信区间均为零,说明回归模型y=-16.0730.7194 x能更好地符合原始数据,而第二个数据可视为异常点。4。预测和绘图:z=b (1) b (2) * x图(x,y,k,x,z,k) 2020/7/24,17,多项式回归,(1)单变量多项式回归,y=a1xma2xm-1amxam 1,2020/7/24,18,方法1,直接二次多项式回归:t=1/30:1/30336014s=11.86 15

5、.67 20.60p,s=polyfit (t,s,2),至MATLAB (liti21),回归模型为:2020/7/24,19,方法2,转化为多元线性回归:t=1/30:1/30336014/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;t=1(14,1)t(t . 2);b,bint,r,rint,stats=回归(s,T);b,stats,To MATLAB(liti22),得到的回归模型是:y=polyconf (p,t,s)图(t,s,k,t,y,

6、r),预测与映射,To MATLAB(liti23),2020/7/24,20,(.2020/7/24/21,例3,假设商品需求、消费者平均收入和商品价格的统计如下,建立回归模型,预测平均收入为1000、价格为6时的商品需求。方法1,直接使用多元二项回归:x1=1000 600 1200 500 300 400 1300 1100 1300 x2=5 7 6 8 7 5 4 3 9;y=100 75 80 70 50 65 90 100 110 60x=x1 x2r tool(x,y,纯二次型),2020/7/24,22,从屏幕左下角的下拉菜单中选择“全部”,然后beta、rmse和残差将全部

7、传输到Matlab工作空间。在左图下方的框中输入1000,在右图下方的框中输入6。屏幕左侧“预测Y”下的数据变为88.47981,即预测平均收入为1000、价格为6的商品需求为88.4791。2020/7/24/23,并在Matlab工作区中输入命令:beta,RMSE,到MATLAB (liti31),2020/7。结果是: b=110.5313 0.1464-26.5709-0.0001 1.8475 stats=0.9702 40.6656 0.0005,方法2,至MATLAB(liti32),返回,2020/7/24,25,非线性返回。J=线性回归(x,y,model,beta0),(

8、2)非线性回归命令:n线性回归(x,y,model,beta0,alpha),1。回归:2020/7/24,26,示例4第一节中示例2的解决方案如下:2。输入数据y=6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.59 10.60 10.80 10.60 10.90 10.76;0=8 2;3。求回归系数:,r,j=指数(x,y,volum,0);的结果:=11.6036-1.0641,回归模型为:至MATLAB(liti41),题目,2020年7月24日,27,4,预测与绘图:YY,=nlpredici(volum,x,r,j)图(x,y,k,x,Y

9、Y,r),TOMATLAB (liti42),2020/7/24,28,例5:财政收入与国民收入、工业总产值相关下表列出了从1952年到1981年的原始数据,并试图构建一个预测模型。国民收入、工业总产值、农业总产值、总人口、就业人口和固定资产投资分别为x1、x2、x3、x4、x5和x6,财政收入为y,变量之间的关系为y=ax1 bx2 cx3 dx4 ex5 fx6。2020/7/24/29/1,建立了m文件模型. m如下:函数YY=模型(beta 0,x)a=beta 0(1);b=0(2);c=0(3);d=0(4);e=0(5);f=0(6);x1=X(:1);x2=X(:2);x3=X

10、(:3);x4=X(:4);x5=X(:5);x6=X(:6);yy=a * x1 b * x2 c * x3 d * x4 e * x5 f * x62020年7月24日、30日、2日。主程序liti6.m如下:x=598.00 349.00 461.00 57482.00 20729.00 44.00.20729.00430000005y=184.00 216.00 248.00 254.00 268.00 286.00 357.00 444.00 506.00.271.00 230.00 266.00 323.00 393.00 466.00 352.00 303.00 447.00.5

11、64.00 638.00 658.00 691.00 655.00 692.00 657.00 723.00 922.00.890.00 826.00 810.0;0=0.50-0.03-0.60 0.01-0.02 0.35;Beta fit=检验(X,y,模型,beta0),至MATLAB(liti6),2020/7/24,31,Beta fit=0.5243-0.0294-0.6304 0.0112-0.0230 0 0.3658,即y=0.5243 x1-0.0294 x2-0.6304 x3 0.0112 x4-0.0230 X5 0.366逐步回归命令为:逐步(x,y,inmode

12、l,alpha)。运行逐步命令时,会生成三个图形窗口:逐步图、逐步表、逐步历史。在逐步绘图窗口中,显示回归系数及其置信区间。逐步表窗口中列出了一个统计表,包括回归系数及其置信区间,以及对应于F,p,2020/7/24,33的统计残差标准差(RMSE)、相关系数(平方)、F值和概率。在实施例6中,水泥固化过程中释放的热量Y与水泥中的四种化学成分x1、x2、x3和x4有关。如下测量一组数据,并通过逐步回归方法确定线性模型。1.数据输入:x1=7 1 11 11 7 11 3 1 2 21 1 11 10x2=26 29 56 31 52 55 71 31 54 47 40 66 68x3=6 15

13、 8 8 6 9 17 22 18 4 23 9 8x4=60 52 20 47 33 22 6 44 22 26 34 12y=78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4;x=x1 x2 x3 x4,2020/7/24,34,2,逐步回归:(1)首先,取初始模型中的所有自变量:逐步图和逐步表(x,y),逐步图中的四条直线均为虚线,说明模型不显著。从逐步表可以看出,变量x3和x4是最不重要的。2020/7/24,35。(2)单击逐步图中的第3行和第4行,并删除变量x3和x4。除去变量x3和x4后,模型是有意义的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论