回归建模及Matlab实现_第1页
回归建模及Matlab实现_第2页
回归建模及Matlab实现_第3页
回归建模及Matlab实现_第4页
回归建模及Matlab实现_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、01002003004005000123456x 101019971998199920000100200300400 为了研究钢材消费量与国民收入之间的关为了研究钢材消费量与国民收入之间的关系,在统计年鉴上查得一组历史数据。系,在统计年鉴上查得一组历史数据。 年 份196419651966197819791980消费(吨)698872988144627362825收入(亿)109712841502294831553372 试分析预测若试分析预测若19811981年到年到19851985年我国国民收年我国国民收入以入以4.5%4.5%的速度递增,钢材消费量将达到什么的速度递增,钢材消费量将达到什

2、么样的水平?样的水平? 引例1:钢材消费量与国民收入的关系 钢材消费量-试验指标(因变量)Y;国民收入-自变量 X;作拟合曲线图形分析; 建立数据拟合函数 y = E(Y | X=x)= f(x)。引例1:钢材消费量与国民收入的关系 10001500200025003000350050010001500200025003000 钢材消费量钢材消费量y y与国民收入与国民收入x x的散点图的散点图y=a+bx引例1:钢材消费量与国民收入的关系 假设:假设:1. 线性函数线性函数 ax+b 2. 正态性正态性xx0E(Y|x0)y0 x1E(Y|x1), 0(;2NbxaY一元线性回归模型:一元线

3、性回归模型:引例1:钢材消费量与国民收入的关系 ( |)EY Xxa bx 某建材公司对某年20个地区的建材销售量Y(千方)、推销开支、实际帐目数、同类商品竞争数和地区销售潜力分别进行了统计。试分析推销开支、实际帐目数、同类商品竞争数和地区销售潜力对建材销售量的影响作用。试建立回归模型,且分析哪些是主要的影响因素。引例:某建筑材料公司的销售量因素分析 x1x2x3x4 12345678910111213141516171819205.52.58.03.03.02.98.09.04.06.55.55.06.05.03.58.06.04.07.57.031556750387130564273604

4、450395570405062591081278121258511126101061111998691615178104167126441468131179.3200.1163.2200.1146.0177.730.9291.9160.0339.4159.686.3237.5107.2155.0201.4100.2135.8223.3195.0 x1 x2 x3 x4 y1111.11111X=统计数据引例:某建筑材料公司的销售量因素分析 数据能否可视化?即通过散点图去发现y与x1,x2x4的函数关系? 由一元回归模型得到启示,我们是否欲寻找关系: y = E(Y|x1,x2,x3,x4) 即

5、 y = f(x1,x2,x3,x4) ?), 0(;)(2NxfY), 0(;),(221NxxxfYm一元与多元任务: 估计回归模型中的未知参数; 检验模型假设的正确性; 分析影响试验指标y的因素,挑选重要因素; 应用预测与控制;线性与非线性一般的回归模型与任务一般的回归模型与任务返 回多元线性回归模型), 0(Y2mm110Nxx任务: 在回归模型中如何估计参数i (i=0,1,m)和2? 模型的假设(线性)是否正确? 判断每个自变量xi (i=1,m)对Y的影响是否显著? 利用回归方程对试验指标 Y进行预测或控制?知识简介多元线性回归模型与任务mnnmnmyyxxxx,1Y,11XYX

6、)XX(01111T1T矩阵表达形式拟合误差e = y y 称为残差向量y的估计值:mmxxy110残差平方和niiiniiyyeQ1212)(多元线性回归分析12mnQ0:H100m2201/( ,1)/(1)( ,1)ReSmFF m nmSnmFFm nm1)F-统计检验法22012,|()RTSRRrnkS任务二:模型检验多元线性回归分析提出问题2)相关系数 R检验法222TeRSSS0:H, 0:H10ii2012 (1),1|()iiiieicTt nmSnmTtnk任务三:因素分析多元线性回归分析提出问题检验方法任务四:应用返 回预测、控制MATLAB软件实现使用命令使用命令re

7、gress实现一实现一(多多)元线性回归模型的计算元线性回归模型的计算 b = regress (Y, X) 或 b, bint, r, rint, stats = regress(Y, X, alpha)nnyyxx11Y,11X回归系数回归系数a,b以及它们的置信区间以及它们的置信区间残差向量e=Y-Y及它们的置信区间相关系数相关系数R2,F-统计量和与统计量和与0对应的概率对应的概率p。残差及其置信区间可以用残差及其置信区间可以用rcoplot(r,rint)画图。画图。默认值是默认值是0.05输入:(jzhui.m)x1=5.5 2.5 8 3 8 6 4 7.5 7;(20维)维)x

8、2=31 55 67 55 70 40 50 62 59;x3=10 8 12 11 11 9 9;x4=8 6 9 16 8 13 11;y=79.3 200.1 135.8 223.3 195;X=ones(size(x1),x1,x2,x3,x4;b,bint,r,rint,stats=regress(y,X)引例2求解输出结果:输出结果:b = 191.9158 -0.7719 3.1725 -19.6811 -0.4501 0 1 2 3 4bint = 103.1071 280.7245(系数的置信区间)(系数的置信区间)r = -6.3045 -4.2215 8.4422 23.

9、4625 3.3938rint=(略)(略)stats = 0.9034(R2) 35.0509(F) 0.0000(p)Q = r*r2= Q/(n-2) = 537.2092 (近似)(近似) 引例2求解残差向量分析图 任务三(因素分析)如何实现?stepwise(X, y, inmodel,alfha)如上例,输入:如上例,输入: X=x1,x2,x3,x4; stepwise(X,y,1,2,3)逐步回归引例2求解b = 191.9158 -0.7719 3.1725 -19.6811 -0.4501 0 1 2 3 4模型中均方差历模型中均方差历史数据记载表史数据记载表参变量数参变量

10、数据分析表据分析表Stepwise 语句功能介绍Stepwise 语句功能介绍经过观察,得到各种情况下的均方差对比:变量组合x1,x2x1,x3x1,x4x2,x3x2,x4x3,x4RMSE5351.96 61.77 23.96 52.96 44.75变量组合x1,x2x3x1, x2x4x1, x3 x4x2,x3x4x1,x2x3, x4RMSE24.6554.4345.8624.6425.39引例2求解最佳回归方程061.499029. 0:34173. 0605.19149. 3882.18705443.499028. 0:2584.191066. 37048. 072.189063

11、81.789025. 0:15176.1909. 311tatsxxxystatsxxxystatsxxy思考:如何进行预测? restool(X,y,model)引例2求解 MATLAB 软件能否实现非线性回归分析? 如果从数据的散点图上发现y与x没有直线关系,又如何计算?例1: 试分析年龄与旋转定向(运动)能力之 间的关系年龄年龄 17 19 21 23 25 27 29第第1人人第第2人人20.48 25.13 26.15 30.0 26.1 20.3 19.3524.35 28.11 26.3 31.4 26.92 25.7 21.3一元非线性回归分析一元非线

12、性回归分析152025301820222426283032一元非线性回归分析一元非线性回归分析假设模型), 0(;23221NaxaxaY 一元多项式回归在matlab 软件中用命令polyfit实现。如前面的例子,具体计算如下:输入: (phg1.m)x1=17:2:29;x=x1,x1;y=20.48 25.13 26.15 30.0 26.1 20.3 19.35 24.35 28.11 26.3 31.4 26.92 25.7 21.3;p,S=polyfit(x,y,2);p 注意: x,y向量的维数要一致。S是一个数据结构,用于其它函数的计算。一元非线性回归分析一元非线性回归分析计

13、算计算y的拟合值:的拟合值:输入:输入:Y,delta=polyconf(p,x,S);Y结果:结果: Y= 22.5243 26.0582 27.9896 28.3186 27.0450 24.1689 19.6904 22.5243 26.0582 27.9896 28.3186 27.0450 24.1689 19.6904拟合效果图:152025301520253035一元非线性回归分析一元非线性回归分析用用polytool(x,y,2)polytool(x,y,2)还可以得到一个交互式画面。还可以得到一个交互式画面。ExportParametersParameters CIPredi

14、ctionPrediction CIResidualsAll), 0(;23221NaxaxaY一元非线性回归分析一元非线性回归分析在工作空间中,输入yhat,回车,得到预测值。一元非线性回归分析一元非线性回归分析返 回 为了研究三种化学元素:氢、n戊烷和异构戊烷与生成物的反应速度Y(%)之间的关系,经试验测定得到某些数据。试建立非线性回归模型,并进行统计分析。例2:某物质的化学反应问题多元非线性回归分析多元非线性回归分析y = b 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 + (linear terms) b 12 x 1 x 2 + b 13 x 1 x 3 + b

15、23 x 2 x 3 + (interaction terms) b 11 x 1 2 + b 22 x 2 2 + b 33 x 3 2 + (quadratic terms) N(0, 2)例2:某物质的化学反应问题假设与建模一 在各因素与指标(因变量)之间的信息“一无所知”的情况下,假设模型Y = f (x1,x2,x3)+中的函数f 是多项式形式,即linear:(缺省)y = 0+1x1+mxm purequadratic: y = 0+1x1+mxm +j=1 to mj*xj2 interaction: y = 0+1x1+mxm +1jk mjkxjxk quadratic(完

16、全二次,以上模型之和)其中model有以下四种选择:例2:某物质的化学反应问题rstool(X, y, model, alpha) (二次多项式回归分析的语句)MATLAB软件实现 load reaction(调出数据) Whos (查看数据名称及大小) Name Size Bytes Class beta 5x1 40 double array model 1x6 12 char array rate 13x1 104 double array reactants 13x3 312 double array xn 3x10 60 char array yn 1x13 26 char array三个自变量三个自变量因变量因变量Y Y例2:某物质的化学反应问题X=reactants;y=rate;rstool(X,y,quadratic)ExportParametersRMSEResidualsAllLinearPure QuadraticInteractionsFull QuadraticUser Specified例2:某物质的化学反应问题在工作空间可以分别给出在工作空间可以分别给出参数估计值、残差平方和、残差向量参数估计值、残差平方和、残差向量。例2:某物质的化学反应问题 假定由实际问题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论