线性回归分析使用说明_第1页
线性回归分析使用说明_第2页
线性回归分析使用说明_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

线性回归分析使用说明一、工具产生背景变量之间的关系,一般可以分为两类,一类是函数关系,例如圆的面积S与半径r之间的关系S=πr2。矩形的周长L和两条边a和b的关系L=2(a+b)。另一类关系是相关关系,这一类关系的特征是很难用一种精确的方法表示出来。例如,人的身高和体重之间的关系,农业上的施肥量与单位产量的关系,等等。需要指出的是,函数关系与相关关系之间没有一道明确的分界线,一方面由于测量存在误差,在实际中,函数关系往往通过相关关系表现出来;另一方面,当对事物内部规律了解更深刻时,相关关系可能会转化成确定的函数关系。回归分析,就是定量地研究因变量受自变量影响地大小,并通过建立回归方程对因变量地取值进行预测或控制的统计方法。回归分析一般分为线性回归分析和非线性回归分析,从统计工程的角度出发,一般首先认为变量之间呈线性关系。本文讲解线性回归分析。二、功能按钮说明软件打开后界面如下:接下来具体介绍功能的使用:选择因变量数据集选择回归分析的因变量,数据格式需满足以下要求:首行为字段,且只能有一个字段字段为数值型选择自变量数据集选择回归分析的自变量,数据格式需满足以下要求:首行为字段字段为数值型模型预测运用回归方程对因变量进行预测。点击“模型预测”复选框将弹出以下对话框:训练数据集使用计算好的回归方程预测训练数据集的因变量。所谓训练数据集即自变量数据集。新数据集使用计算好的回归方程预测一个新选择的数据集的因变量。新选择的数据集需和训练用的自变量数据集具有相同的字段数,即变量的个数相同。三、生成图表解释相关系数矩阵,如下:在做回归分析前,第一个非常重要的步骤就是观察和描述两个连续变量之间的关系。皮尔逊相关系数是最常用的描述变量线性相关性的统计量。共线性诊断(VIF),如下:在进行多元线性回归的时候,自变量间的共线性问题容易导致模型不稳定,因此需要做共线性诊断,我们通过VIF(VarianceInflationFactor,方差膨胀因子)判断自变量之间的共线性问题。如果VIF>10,表示对应变量与其它变量存在高度共线性,可能造成模型不稳定。截距,如下:截距是线性回归方程的常数项。回归系数,如下:通过截距和回归系数可将线性回归函数表示如下:medv=4.9285*rm–0.6564*lstat+0.1039模型评估,如下:通过观察以下两个指标来评价模型的拟合优度。RMSE(均方根误差)越小说明模型拟合得越充分;准确率:基于训练数据集计算出的准确率。模型预测运用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论