第11讲 回归概念、回归系数_第1页
第11讲 回归概念、回归系数_第2页
第11讲 回归概念、回归系数_第3页
第11讲 回归概念、回归系数_第4页
第11讲 回归概念、回归系数_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1相关概念

相关分析就是描述两个或两个以上变量间关系密切程度的统计方法,有效地揭示事物之间相关关系的强弱程度。二元变量相关分析(散点图——直观;相关系数——精准)偏相关分析(固定某些变量,研究其它变量之间的关系)距离相关分析相关上节回顾散点图、相关系数

散点图绘制Graphs→LegacyDialogs→Scatter/Dot二元变量分析Analyze→Correlate→Bivariate偏相关分析

Analyz→Correlate→Partial上节回顾零假设H0:两总体线性不相关(或相关系数与0无显著性差异)3解释:1.Sig.=0.041<0.05,拒绝H0假设,表明两变量之间是相关的。2.由于r=0.229<0.3,为微弱正相关。相关系数取值范围r=0|r|<0.3|r|=0.3~0.5|r|=0.5~0.8|r|>0.8|r|=1相关程度无相关微弱相关低度相关显著相关高度相关完全相关4散点图5第11讲

回归分析6基本概念7一、“回归”起源

“回归”一词是英国生物学家、统计学家高尔顿(F.Galton)在研究父亲身高和其成年儿子身高关系时提出的。

从大量父亲身高和其成年儿子身高数据的散点图中,Galton发现了条贯穿其中的直线,它能描述父亲身高和其成年儿子身高的关系,并可用于根据父亲身高预测其成年儿子身高。

8一、“回归”起源

Galton通过上述研究发现儿子的平均身高一般总是介于其父亲与其种族的平均高度之间,即儿子的身高在总体上有一种“回归”到其所属种族高度的趋势,这种现象称为回归现象,贯穿数据的直线称为回归线。回归概念产生以后,被广泛应用于各个领域之中,并成为研究随机变量与一个或多个自变量之间变动关系的一种统计分析技术。9二、回归的基本概念回归分析的概念

回归分析就是研究一个或多个变量的变动对另一个变量的变动的影响程度的方法。相关分析与回归分析的关系相关分析是根据统计数据,通过计算分析变量之间关系的方向和紧密程度,而不能说明变量之间相互关系的具体形式,无法从一个变量的变化来推测另一个变量的变化情况。回归分析能够确切说明变量之间相互关系的具体形式,可以通过一个相关的数学表达式,从一个变量的变化来推测另一个变量的变化情况,使估计和预测成为可能。

相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。相关与回归10二、回归的基本概念回归分析的目的

根据已知的资料或数据,找出变量之间的关系表达式(找到回归线或回归方程),用自变量的已知值去推测因变量的值或范围(进行预测),实际上是研究因果关系。(例如:)回归分析的基本过程确定自变量、因变量确定回归模型估计模型中的参数(建立回归方程)对回归模型进行各种检验模型应用(利用回归方程预测)11二、回归的基本概念回归分析可以解决的问题确定因变量与若干个自变量之间联系的定量表达式,即回归方程或数学模型通过控制可控变量的数值,借助数学模型来预测或控制因变量的取值和精度进行因素分析,从影响因变量变化的自变量中区分出重要因素和次要因素分类根据变量之间相关关系的表现形式分为

线性回归分析:变量之间的相关关系是线性关系非线性回归分析:变量之间的相关关系是非线性关系

根据影响因变量的自变量的多少分为一元回归分析多元回归分析12二、回归的基本概念回归分析的功能

实现回归分析的功能主要在“Analyze→Regression”命令菜单中,主要分为:线性回归分析(Linear)曲线估计分析(CurveEstimation)二维逻辑分析多维逻辑分析顺序分析概率分析非线性回归分析加权估计分析两阶最小二乘分析

13线性回归14三、线性回归线性回归的概念

线性函数是变量之间存在的各种关系中最简单的形式,具有这种关系的回归叫做线性回归。线性回归根据自变量多少分为一元线性回归和多元线性回归15三、线性回归线性回归的模型

下面以一元线性回归为例,解析线性回归模型。一元线性回归的数学模型为:

多元线性回归的数学模型为:在数学模型中

----------回归常数

----------(偏)回归系数----------随机误差16三、线性回归线性回归的模型

从数学模型可以看出因变量y的变化由两部分组成自变量x的变化所引起的y的线性变化,即其他随机因素引起的y的变化,即如果随机误差的期望为0,那么数学模型可以转化为:称为一元线性回归方程

从几何意义上讲,一元线性回归方程是一条直线,即回归线。

从一元线性回归方程可以看出,一元线性回归分析是在不考虑随机因素条件下进行分析的,所以是在比较理想状态下的分析17三、线性回归线性回归方程的统计检验

通过样本数据建立的回归方程,不能立即用于对实际问题的分析和预测,还需要进行各项统计检验。回归方程的拟合优度检验检验样本数据点聚集在回归线周围的密集程度,从而评价回归方程对样本数据的代表程度。拟合优度检验采用判定(决定)系数(一元)和调整判定(决定)系数(多元),来检验。其中R是自变量x和因变量y之间的相关系数。和取值范围是0~1,越接近1表示拟合优度越高,反之就越低。

判定(决定)系数:反映了因变量y的全部变异中能够通过回归关系被自变量解释的比例。

18三、线性回归线性回归方程的统计检验

回归方程的显著性检验

检验因变量与所有的自变量之间的线性关系是否显著

1.显著性检验H0假设是:回归系数与0无显著性差异。

2.检验采用F统计量,SPSS自动计算统计量的观测值和对应的伴随概率。3.如果伴随概率大于显著性水平ɑ=0.05,接受H0假设,回归系数与0无显著性差异。表明自变量x和因变量y之间线性关系不显著,回归方程无实际意义。如果伴随概率小于等于显著性水平ɑ=0.05,拒绝H0假设,回归系数与0有显著性差异。表明自变量x和因变量y之间有线性关系,回归方程有实际意义。19三、线性回归线性回归方程的统计检验

回归系数的显著性检验检验每个自变量与因变量之间的线性关系是否显著,能否保留在方程中

1.显著性检验H0假设是:回归系数与0无显著性差异。

2.检验t统计量,SPSS自动计算统计量的观测值和对应的伴随概率。3.如果伴随概率大于显著性水平ɑ=0.05,接受H0假设,回归系数与0无显著性差异。表明自变量x和因变量y之间线性关系不显著,回归方程无实际意义。如果伴随概率小于显著性水平ɑ=0.05,拒绝H0假设,回归系数与0有显著性差异。表明自变量x和因变量y之间有线性关系,回归方程有实际意义。20三、线性回归SPSS操作及案例分析例一:一元线性回归分析9-linear_one.sav一家地产公司调查了某城市的房地产销售价格与房产的评估价值的数据,请用一元线性回归分析,能否用房产的评估价值来预测房地产销售的价格。分析:1.自变量:房产的评估价值;因变量:房地产销售价格2.散点图分析3.一元线性回归结果分析21三、线性回归SPSS操作及案例分析

结果分析:从建立的散点图来看,自变量x和因变量y之间存在一定的线性关系,而且相关程度较高。

22三、线性回归SPSS操作及案例分析结果分析:(1)变量进入/移出表(表1)

Enter表示选定变量全部进入模型(2)模型综述表(表2)相关系数R=0.916、判定系数R2=0.839、调整判定系数R2=0.830,说明变量之间相关程度高,回归方程的拟合优度高。表123三、线性回归SPSS操作及案例分析

结果分析:(3)方差分析表(表3)

F检验统计量的观测值=93.567,伴随概率=0.000<0.05,拒绝零假设,说明自变量x和因变量y之间线性关系显著,可以建立线性模型。(4)模型系数表(表4)常数项Constant=895.020,回归系数=1.351

;回归系数的伴随概率=0.000,拒绝零假设,说明自变量x和因变量y之间线性关系显著,可以建立线性模型。表3表424三、线性回归SPSS操作及案例分析

结果分析:结论:根据上述分析结果,可以得到回归方程,用该方程来进行分析和预测实际问题,结果较为准确。

举例:25三、线性回归SPSS操作及案例分析

操作步骤:

(1)根据数据建立散点图,进行初步分析

Graphs→LegacyDialogs

→Scatter/dot...数据文件:9-linear_one.sav保存文件:9-linear_one1.spv26三、线性回归SPSS操作及案例分析

操作步骤:

(2)一元线性回归

Analyze→Regression→Linear…数据文件:9-linear_one.sav保存文件:9-linear_one2.spv12自变量因变量27三、线性回归SPSS操作及案例分析

例二:一元线性回归分析9-polishing.savNambeMills公司生产5种金属餐具产品,分别是Bowl(碗)、Casserole(焙盘)、Dish(碟)、Tray(托盘)、Plate(盘子)。在生产过程中都有一个抛光的过程。为了有助于安排生产,记录了59个产品的抛光时间(time)、产品类型(type)和产品直径(diam)。用一元线性回归分析能否用产品的直径来预测产品的抛光时间。28三、线性回归SPSS操作及案例分析

结果分析(1)散点图从建立的散点图来看,自变量x和因变量y之间存在一定的线性关系,但数据分布较为分散,所以相关程度不是很高。29三、线性回归SPSS操作及案例分析

结果分析(2)一元线性回归变量进入/移出方式表表示选定变量全部进入模型模型综述表反映了因变量和自变量之间的线性相关系数R=0.700,判定系数R2=0.490,说明自变量diam可以解释因变量time49%的变异性。说明自变量与因变量之间的相关程度一般,回归方程的拟合优度不高。30三、线性回归SPSS操作及案例分析结果分析方差分析表F检验统计量的观测值为54.865,F分布的伴随概率为0.000,从而拒绝零假设,即因变量和自变量的线性关系是显著的,可以建立线性模型。模型系数表回归模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论