回归分析完整_第1页
回归分析完整_第2页
回归分析完整_第3页
回归分析完整_第4页
回归分析完整_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

科海拾贝—回归分析在客观世界中普遍存在着变量之间的关系。变量之间的关系一般来说可分为确定性的与非确定性的两种。确定性关系是指变量之间的关系可以用函数关系来表达的。另一种非确定性的关系即所谓相关关系。例如,人的身高与体重之间存在着关系,一般来说,人高一些,体重要重一些,但同样高度的人的体重往往不相同。人的血压与年龄之间也存在着关系,但同年龄的人的血压往往不相同。气象中温度与湿度之间的关系也是这样。这是因为涉及的变量(如体重、血压、湿度)是随机变量。上面说的变量关系是非确定性的。回归分析是研究相关关系的一种数学方法。使用这种方法可以用一个变量取得的值去估计另一个变量所取的值,或者使用一个变量去解释另外一个变量变化的原因。这两个量,我们分别称为自变量和因变量。回归分析是数学建模的有力工具,那么我们要建立回归分析的数学模型,需要以下几个步骤:收集一组包含因变量和自变量的数据;选定因变量与自变量之间的模型,利用数据,按照最小二乘准则计算模型中的系数;利用统计分析方法对不同的模型进行比较,找出与数据拟合地最好的模型;判断得到的模型是否适合于这组数据,诊断有无不适合回归模型的异常数据;利用模型对因变量做出预测或解释。注:在第二步中,选定因变量与自变量的模型时,一般是凭经验选取模型,所以此模型又称为经验公式。回归分析主要包括一元线性回归,多元线性回归以及非线性回归,这里主要是介绍一元线性回归的MATLAB实现。实验目的:了解回归分析的基本原理,掌握MATLAB的实现方法;联系实际用回归分析方法解决实际问题。一元线性回归模型例:用切削机床加工时,为实时地调整机床需测定刀具的磨损程度,先每隔一小时测量刀具的厚度得到以下的数据:时间(h)012345678910刀具厚度(cm)30.629.128.428.128.027.727.527.227.026.826.5试建立刀具厚度关于切削时间的回归模型,对模型和回归系数进行检验,预测15小时后刀具的厚度。分析:首先对原始数据进行观察,确定回归模型,然后通过计算最终确定模型和模型参数,并对模型和回归系数进行检验。在进行回归分析之前,现将刀具厚度和时间的关系绘图,程序如下:>>x1=0:1:10;%定义横坐标>>y=[30.629.128.428.128.027.727.527.227.026.826.5]';%定义纵坐标>>plot(x1,y,'+')%绘图命令,在坐标面上用“+”描出上述坐标点运行结果:从原始数据上看,可以建立一元线性回归模型:其中,然后,计算回归系数,可以用MATLAB实现。二、一元线性回归MATLAB实现1、确定回归系数的点估计值:b=regress(y,x)其中,,2、求回归系数的点估计和区间估计、并检验回归模型:[b,bint,r,rint,stats]=regress(y,x,alpha)其中,bint为回归系数的区间估计;r是残差;rint是置信区间;stats是用于检验回归模型的统计量,有四个数值:相关系数、F值、与F对应的概率P、以及方差估计误差;alpha表示显著性水平,缺省时为0.05相关系数越接近1,说明回归方程越显著;与F对应的概率P<alpha时拒绝,回归模型成立。画出残差及其置信区间:rcoplot(r,rint)那么对于我们上面的例子有如下程序,计算回归系数:>>alpha=0.05;>>x=[ones(11,1),x1'];%>>[b,bint,r,rint,stats]=regress(y,x,alpha);>>b,bint,stats,rcoplot(r,rint)运行结果:b=29.5455-0.3291Pbint=P28.976930.1140-0.4252-0.2330stats=0.869660.00180.00000.1985同时MATLAB绘出残差图,如下因为P<alpha,拒绝,回归模型成立。观察残差分布,发现第一个数据(0,30.6)残差的置信区间不包括零点,应视为异常点,将其剔除后,用剩余的数据点重新进行计算:>>alpha=0.05;>>x1=1:1:10;>>y=[29.128.428.128.027.727.527.227.026.826.5]';>>x=[ones(10,1),x1'];>>[b,bint,r,rint,stats]=regress(y,x,alpha);>>b,bint,stats,rcoplot(r,rint)运行结果:b=29.0533-0.2588bint=28.833429.2732-0.2942-0.2233stats=0.9726283.55990.00000.0195再次计算,发现原始数据中的第二个数据(1,29.1)残差的置信区间也不包括零点,人将该点视为异常点,将其剔除,重新计算:>>alpha=0.05;>>x1=2:1:10;>>y=[28.428.128.027.727.527.227.026.826.5]';>>x=[ones(9,1),x1'];>>[b,bint,r,rint,stats]=regress(y,x,alpha);>>b,bint,stats,rcoplot(r,rint)运行结果:b=28.8667-0.2333bint=28.779628.9537-0.2467-0.2200stats=1.0e+003*0.00101.71500.00000.0000这次的数据残差的置信区间全部包括零点,无异常点。对比分析:对比剔除前后的变化,发现置信区间明显缩小,相关系数和F都明显变大,表明异常点的剔除有利于更好的建立模型。于是,就可以输出最终计算结果和图形(上述程序的最后运行结果中的b即为最后输出的b,即一元线性回归模型中的未知参数),程序如下:>>x1=0:1:10;>>y=[30.629.128.428.128.027.727.527.227.026.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论