数学建模-回归分析_第1页
数学建模-回归分析_第2页
数学建模-回归分析_第3页
数学建模-回归分析_第4页
数学建模-回归分析_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析

数理部一、变量间的关系第一节回归分析预测法概述各经济变量之间的关系一般分为两类:1.确定性关系2.相关关系变量与变量之间的函数关系反映客观事物之间存在着严格的依存关系。在这种关系中,当一个或几个变量取值一定时,另一个变量有确定的值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。在三个变量中,任意两个都可以确定第三个。 一般把作为影响因素的变量称为自变量,把发生对应变化的变量称为因变量。1.确定性关系2.相关关系

相关关系反映的是客观事物之间的非严格、不确定的线性依存关系。这种线性依存关系有两个显著的特点:①客观事物之间在数量上确实存在一定的内在联系。表现在一个变量发生数量上的变化,要影响另一个变量也相应地发生数量上的变化。②客观事物之间的数量依存关系不是确定的,具有一定的随机性。表现在当一个或几个相互联系的变量取一定数值时,与之对应的另一个变量可以取若干个不同的数值。这种关系虽然不确定,但因变量总是遵循一定规律围绕这些数值的平均数上下波动(一)回归分析的提出

回归分析起源于生物学研究,是由英国生物学家兼统计学家高尔登(FrancisGalton1822-1911)在19世纪末叶研究遗传学特性时首先提出来的。高尔登在1889年发表的著作《自然的遗传》中,提出了回归分析方法以后,很快就应用到经济领域中来,而且这一名词也一直为生物学和统计学所沿用。回归的现代涵义与过去大不相同。一般说来,回归是研究因变量随自变量变化的关系形式的分析方法。其目的在于根据已知自变量来估计和预测因变量的总平均值。

1、定义理解:

相关分析是以相关关系为对象,研究两个或两个以上随机变量之间线性依存关系的紧密程度。通常用相关系数表示,多元相关时用复相关系数表示。

回归分析是对具有相关关系的变量之间的数量变化规律进行测定,研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间的数量变动关系,并据此对因变量进行估计和预测的分析方法。(三)回归分析与相关分析它们是研究客观事物之间相互依存关系的两个不可分割的方面。在实际工作中,一般先进行相关分析,由相关系数的大小决定是否需要进行回归分析。在相关分析的基础上建立回归模型,以便进行推算、预测,同时相关系数还是检验回归分析效果的标准。相关分析需要回归分析来表明客观事物数量关系的具体形式,而回归分析则应建立在相关分析的基础上。2、回归分析与相关分析的关系(四)在回归分析中应当注意的问题1.重视数据的收集和甄别在收集数据的过程中可能会遇到以下困难:(1)一些变量无法直接观测。(2)数据缺失或出现异常数据。(3)数据量不够。(4)数据不准确、不一致、有矛盾。2.合理确定数据的单位在建立回归方程时,如果不同变量的单位选取不适当,导致模型中各变量的数量级差异悬殊,往往会给建模和模型解释带来诸多不便。比如模型中有的变量用小数位表示,有的变量用百位或千位数表示,可能会因舍入误差使模型计算的准确性受到影响。因此,适当选取变量的单位,使模型中各变量的数量级大体一致是一种明智的做法。从各种经济现象之间的相关关系出发,通过对与预测对象有联系的现象变动趋势的分析,推算预测对象未来状态数量表现的一种预测法。回归分析预测法(一)根据预测的目的,选择确定自变量和因变量(二)收集历史统计资料,分析.计算并建立回归预测模型(三)进行相关分析(四)检验回归预测模型,计算预测误差(五)计算并确定预测值回归分析预测法的基本步骤回归模型定义:回归分析是对具有相关关系的变量之间的数量变化规律进行测定,研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间的数量变动关系,并据此对因变量进行估计和预测的分析方法。由回归分析求出的关系式,称为回归模型

一元线性回归回归函数若Y的数学期望E(Y)存在,则其取值随x的取值而定,它是x的函数,记为u(x),称其为Y关于x的回归函数。利用样本来估计u(x)的问题称为求Y关于x的回归问题,若u(x)为线性函数,此时称为一元线性回归问题(Ⅰ)一元线性回归(Ⅱ)多元线性回归回归分析数学模型及定义模型参数估计检验、预测与控制可线性化的一元非线性回归(曲线回归)数学模型及定义模型参数估计多元线性回归中的检验与预测逐步回归分析(i)建立因变量y与自变量x1,x2,…,xm

之间的回归模型(经验公式);(ii)对回归模型的可信度进行检验;(iii)判断每个自变量xi(i=1,2,…,m)对y的影响是否显著;(iv)利用回归模型对y进行预报或控制。线性回归分析的主要任务是:(Ⅰ)一、数学模型例1

测16名成年女子的身高与腿长所得数据如下:以身高x为横坐标,以腿长y为纵坐标将这些数据点(xI,yi)在平面直角坐标系上标出.散点图解答返回二、模型参数估计1、回归系数的最小二乘估计

其中åå====niiniiynyxnx111,1,åå====niiiniiyxnxyxnx11221,1.

返回对一元线性回归模型的检验拟合优度检验显著性检验回归方程线性关系的显著性检验(F检验)

回归系数的显著性检验(t检验)三、检验、预测与控制1、拟合优度检验拟合优度也叫判定系数。用R2表示。(1)0≤R2≤1;(2)当R2=1时,此时原数据的总变异完全可以由拟合值的变异来解释,并且残差为零,即拟合点与原数据完全吻合;(3)当R2=0时,回归方程完全不能解释原数据的总变异,y的变异完全由与x无关的因素引起。2、回归方程的显著性检验(Ⅰ)F检验法—回归模型的线性关系检验

(Ⅱ)t检验法—回归系数的显著性检验2、回归系数的置信区间3、预测与控制(1)预测(2)控制返回四、可线性化的一元非线性回归(曲线回归)例2出钢时所用的盛钢水的钢包,由于钢水对耐火材料的侵蚀,容积不断增大.我们希望知道使用次数与增大的容积之间的关系.对一钢包作试验,测得的数据列于下表:解答散点图此即非线性回归或曲线回归

问题(需要配曲线)配曲线的一般方法是:通常选择的六类曲线如下:返回(Ⅱ)一、多元回归分析模型及定义返回二、模型参数估计返回

1.与一元线性回归模型的检验一样,多元线性回归模型的检验也主要分为:对多元线性回归模型的检验拟合优度检验显著性检验回归方程线性关系的显著性检验(F检验)

回归系数的显著性检验(t检验)三、多元线性回归中的检验与预测2、预测(1)点预测(2)区间预测返回四、逐步回归分析(4)“有进有出”的逐步回归分析。(1)从所有可能的因子(变量)组合的回归方程中选择最优者;(2)从包含全部变量的回归方程中逐次剔除不显著因子;(3)从一个变量开始,把变量逐个引入方程;选择“最优”的回归方程有以下几种方法:

“最优”的回归方程就是包含所有对Y有影响的变量,而不包含对Y影响不显著的变量回归方程。

以第四种方法,即逐步回归分析法在筛选变量方面较为理想.

这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。逐步回归分析法的思想:

从一个自变量开始,视自变量Y作用的显著程度,从大到地依次逐个引入回归方程。

当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。

引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。

对于每一步都要进行Y值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。返回统计工具箱中的回归分析命令1、多元线性回归2、多项式回归3、非线性回归4、逐步回归返回多元线性回归

b=regress(Y,X)1、确定回归系数的点估计值:3、画出残差及其置信区间:

rcoplot(r,rint)2、求回归系数的点估计和区间估计、并检验回归模型:

[b,bint,r,rint,stats]=regress(Y,X,alpha)回归系数的区间估计残差用于检验回归模型的统计量,有三个数值:相关系数r2、F值、与F对应的概率p置信区间

显著性水平(缺省时为0.05)例1解:1、输入数据:

x=[143145146147149150153154155156157158159160162164]';X=[ones(16,1)x];Y=[8885889192939395969897969899100102]';2、回归分析及检验:

[b,bint,r,rint,stats]=regress(Y,X)b,bint,stats题目3、残差分析,作残差图:

rcoplot(r,rint)

从残差图可以看出,除第二个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型y=-16.073+0.7194x能较好的符合原始数据,而第二个数据可视为异常点.4、预测及作图:z=b(1)+b(2)*xplot(x,Y,'k+',x,z,'r')返回多项式回归(一)一元多项式回归

(1)确定多项式系数的命令:[p,S]=polyfit(x,y,m)(2)一元多项式回归命令:polytool(x,y,m)1、回归:y=a1xm+a2xm-1+…+amx+am+12、预测和预测误差估计:(1)Y=polyval(p,x)求polyfit所得的回归多项式在x处的预测值Y;(2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得的回归多项式在x处的预测值Y及预测值的显著性为1-alpha的置信区间YDELTA;alpha缺省时为0.5.法一

直接作二次多项式回归:

t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];

[p,S]=polyfit(t,s,2)得回归模型为:法二化为多元线性回归:t=1/30:1/30:14/30;s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48];T=[ones(14,1)t'(t.^2)'];[b,bint,r,rint,stats]=regress(s',T);b,stats得回归模型为:Y=polyconf(p,t,S)plot(t,s,'k+',t,Y,'r')预测及作图(二)多元二项式回归命令:rstool(x,y,’model’,alpha)nm矩阵显著性水平(缺省时为0.05)n维列向量

例3

设某商品的需求量与消费者的平均收入、商品价格的统计数据如下,建立回归模型,预测平均收入为1000、价格为6时的商品需求量.法一

直接用多元二项式回归:x1=[10006001200500300400130011001300300];x2=[5766875439];y=[10075807050659010011060]';x=[x1'x2'];rstool(x,y,'purequadratic')

在画面左下方的下拉式菜单中选”all”,则beta、rmse和residuals都传送到Matlab工作区中.在左边图形下方的方框中输入1000,右边图形下方的方框中输入6。

则画面左边的“PredictedY”下方的数据变为88.47981,即预测出平均收入为1000、价格为6时的商品需求量为88.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论