第八章 相关分析与回归分析_第1页
第八章 相关分析与回归分析_第2页
第八章 相关分析与回归分析_第3页
第八章 相关分析与回归分析_第4页
第八章 相关分析与回归分析_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章相关分析与回归分析第一节相关分析第二节一元线性回归分析第三节多元线性回归分析第一节相关分析一、变量之间的两类关系

(一)函数关系

函数关系亦称确定性关系,是指变量(现象)之间存在的严格确定的依存关系。

(二)相关关系

相关关系,是指变量(现象)之间存在着非严格、不确定的依存关系。第八章相关分析和回归分析二、相关关系的种类

(一)按相关的密切程度可分为:完全相关、不完全相关、不相关

(二)按表现形态可分为:线性相关、非线性相关

(三)按相关的方向可分为:正相关、负相关

(四)按研究变量的多少可分为:单相关、复相关、偏向关。

第八章相关分析和回归分析三、相关分析与回归分析

(一)相关分析

相关分析主要研究两个或者两个以上随机变量之间相互依存关系的方向和密切程度的方法。

(二)回归分析

回归分析是研究某一随机变量关于另一个(或多个)非随机变量之间数量关系变动趋势的方法。其目的在于根据已知非随机变量来估计和预测随机变量的总体均值。第八章相关分析和回归分析四、相关关系的测度

(一)相关图相关图又称散点图。它是将具有相关关系的两个变量间相对应的变量值,在直角坐标系上用坐标点的形式描绘出来,根据坐标点的分布状况来大致判别相关形式、相关方向和相关的密切程度。

第八章相关分析和回归分析(a)正相关(b)负相关(二)相关系数

相关系数是衡量变量之间线性相关密切程度及相关方向的统计分析指标。1.相关系数的计算公式

总体相关系

第八章相关分析和回归分析样本相关系数

第八章相关分析和回归分析样本相关系数分子分母的简化计算形式:2.相关系数的性质(1);(2)当时,变量间不存在线性相关关系;(3)当时,变量间具有完全线性相关关系,当时,称完全正相关,当时,称完全负相关。(4)当时,变量间存在负相关关系;当时,变量之间存在正相关关系(5)的取值越接近0,变量间线性相关关系越弱,越接近1,变量间线性相关关系越强。第八章相关分析和回归分析3.相关系数的检验

第八章相关分析和回归分析对的统计量检验法第一步:提出假设;第二步:计算检验统计量第三步:根据给定的显著性水平,进行决策。若,拒绝,表明变量间线性相关关系显,不能拒绝,表明变量间的线性著;若相关关系不显著;

例8-1根据1996-2012年国内生产总值和固定资产投资额资料,见书本表8-1,计算国内生产总值和固定资产投资额之间的相关系数,并对相关系数进行显著性检验。

解:1)计算相关系数

第八章相关分析和回归分析2)对样本相关系数进行t检验计算t统计量

对给定显著性水平,查表得,这里,故在0.05的显著性水平下,检验通过,说明国内生产总值和固定资产投资额之间的相关关系显著。第八章相关分析和回归分析第二节一元线性回归分析一、一元线性回归模型

(一)回归模型的基本形式

一元线性总体回归模型:

与是参数和的最小二乘估计。实际观测值与之间差值称为残差,即:

第八章相关分析和回归分析一元线性回归方程:(二)一元线性回归模型的基本假设

假设1:随机误差项具有零均值,同方差性,即

假设2:随机误差项之间不存在序列相关关系,即假设3:解释变量是确定性变量,且与随机误差项之间线性无关。假设4:随机误差项服从零均值、同方差的正态分布,即:第八章相关分析和回归分析二、一元线性回归模型的估计

(一)参数和的最小二乘估计

最小二乘法:就是使残差平方和达到最小时求得参数和的估计值与的方法。第八章相关分析和回归分析残差平方和公式为:对分别求一阶偏导,并令其为0,得方程组:第八章相关分析和回归分析求解方程组得的最小二乘估计量例8-2根据表8-1中给出的我国国内生产总值和固定资产投资额数据,建立回归方程。解:根据例8-1的计算结果可知,国内生产总值和固定资产投资额之间具有显著的线性相关关系,由此可建立简单直线回归方程:

将表8-1中的有关数据代入上式,可得

所求回归方程为:

表明固定资产投资额每增加一亿元,国内生产总值平均增加1.305亿元第八章相关分析和回归分析

(二)最小二乘估计量的性质

最小二乘估计量与分别是其真值与的无偏估计,且都服从正态分布。

第八章相关分析和回归分析

(三)总体方差的估计第八章相关分析和回归分析回归标准差:其简捷公式:越小表明实际观测点与所拟合的样本回归线的离差程度越小,回归线能较好的代表总回归模型。反之,越大表明实际观测点与所拟合的样本回归线的离差程度越大,回归线的代表性越差。(四)回归系数的区间估计

其中:

第八章相关分析和回归分析三、一元线性回归模型的检验

(一)拟合优度检验

所谓拟合优度,是指模型对样本观测值的拟合程度,即样本回归直线与观测点之间的紧密程度。衡量拟合优度的指标通常用样本可决系数(又称决定系数)记:总偏差平方和:

回归平方和:

残差平方和:

总偏差平方和分解式:第八章相关分析和回归分析样本可决系数可定义为回归平方和与总偏差平方和之比,用来反映回归方程的拟合程度,记为。用公式表示:的取值在0到1之间,其值越接近1,说明回归方程的拟合程度越高;反之,其值越小,说明回归方程的拟合效果差。第八章相关分析和回归分析(二)回归方程的显著性检验(检验)

检验的步骤:1.提出假设原假设;备择假设2.构造统计量

在原价设成立的条件下,上述统计量

3.给定显著性水平,确定拒绝域:,在附表中可直接查找的值。第八章相关分析和回归分析4.作出判断根据样本计算出统计量的数值,然后与的值进行比较,若,则拒绝原假设,认为回归方程是显著的,即与之间有显著的线性关系。若,则接受原假设,认为回归方程不显著。第八章相关分析和回归分析(三)回归系数的显著性检验(检验)

检验的步骤:1.提出假设原假设;备择假设2.构造统计量

在原价设成立时,统计量3.给定显著性水平,确定拒绝域:,在附表中可直接查找的值。第八章相关分析和回归分析4.作出判断根据样本计算出统计量的数值,然后与的值进行比较,若,则拒绝原假设,认为显著不为0,变量x与y之间一元线性关系显著成立;若,则接受原假设,认为回归方程不显著。认为显著为0,变量x与y之间一元线性关系不成立;第八章相关分析和回归分析

第八章相关分析和回归分析例8-3对例8-2建立的国内生产总值和固定资产投资额的回归方程进行显著性检验。解:1)先进行检验,计算统计量对于给定的显著性水平,查表得,由于,拒绝原假设,认为回归方程是显著的。2)还可以进行检验,计算统计量当时,查表得,由于,拒绝原假设,说明显著不为0,即国内生产总值和固定资产投资额之间具有显著的线性相关关系。四、一元线性回归模型的应用:估计与预测(一)的均值的估计

点估计:区间估计:第八章相关分析和回归分析(二)的预测区间第八章相关分析和回归分析第三节多元线性回归分析一、多元线性回归模型

(一)多元线性回归模型的一般形式

分别是参数的最小二乘估计。实际观测值与之间差值称为残差,即:

第八章相关分析和回归分析多元线性回归方程:n个多元线性回归模型的矩阵形式为:其中,第八章相关分析和回归分析多元线性回归方程的矩阵形式:其中,(二)多元线性回归模型的基本假设

假设1:随机误差项具有零均值,同方差性,即

假设2:随机误差项之间不存在序列相关关系,即假设3:解释变量是确定性变量,相互之间互不相关,且与随机误差项之间线性无关,

第八章相关分析和回归分析假设4:随机误差项服从零均值、同方差的正态分布,即二、多元线性回归模型的参数估计

(一)回归系数的最小二乘估计

第八章相关分析和回归分析残差平方和公式为:分别对求一阶偏导,并令其为0,得方程组:第八章相关分析和回归分析解矩阵方程得:以上个方程组成的方程组称为正规方程组,经过整理得用矩阵形式表示如下:这就是参数的最小二乘估计量。

(二)最小二乘估计量的性质

第八章相关分析和回归分析参数估计量的期望为因而,参数估计量是的无偏估计参数估计量的方差-协方差阵为

(三)总体方差的估计

第八章相关分析和回归分析三、拟合优度检验

多元回归分析中的可决系数用表示。

第八章相关分析和回归分析多元回归分析中用作为拟合优度的评价不可靠,必须进行修正。在样本容量一定的情况下,将残差平方和与总偏差平方和分别除以各自的自由度,以消除变量个数对拟合优度的影响。修正以后的决定系数用表示。计算公式为:修正后的可绝系数与未经修正的可绝系数之间有如下关系:第八章相关分析和回归分析一般来说,越接近1,表明拟合程度越高;越接近0或者小于0,表明拟合程度越差。四、显著性检验

(一)回归方程的显著性检验具体的方法步骤如下:1.提出假设原假设备择假设不全为0第八章相关分析和回归分析2.构造统计量在原假设成立的条件下,上述统计量3.列出回归模型的方差分析表第八章相关分析和回归分析方差来源平方和自由度均方F检验值回归

残差

总和

4.给定显著性水平在附表中查找的值,并与方差分析表中统计量的数值进行比较,若,拒绝原假设,认为总体回归方程中各解释变量与被解释变量的线性关系是显著的。若,拒绝原假设,则认为总回归方程不显著,所建立的回归模型没有意义。(三)回归系数的显著性检验(检验)

检验的步骤:1.提出假设原假设;备择假设2.构造统计量

第八章相关分析和回归分析其中,为回归标准差3.给定显著性水平,查出临界值,当时,拒绝原假设,可以认为在显著性水平下,对的影响显著。当时,接受原假设,认为在显著性水平下,对的影响不显著。第八章相关分析和回归分析五、多元线性回归模型的应用:估计与预测点估计:区间估计:区间估计:第八章相关分析和回归分析六、偏相关系数与复相关系数(一)偏相关系数

考虑在对其他变量的影响进行控制的情况下,来考察相关的多个变量中某两个变量的相关程度,偏相关系数就是衡量这种相关程度的指标。为简明起见,先计算三个变量间的相关系数。三个变量拟合三个回归方程第八章相关分析和回归分析当的值一定时,与的偏相关系数为:第八章相关分析和回归分析当的值一定时,与的偏相关系数为:当的值一定时,与的偏相关系数为:偏相关系数的符号与相应的偏回归系数相同,其取值范围在-1到1之间。在实际运用中,可以将以上偏相关系数的定义推广到多个变量的场合。(二)复相关系数

复相关系数,是在多元线性回归分析中衡量因变量与多个自变量之间相关程度的指标其计算公式如下:第八章相关分析和回归分析本章小结本章介绍了研究现象之间相关关系的两种基本方法:一是相关分析,二是回归分析。实际应用中,一般先进行定性的相关分析;然后计算相关系数,拟合适当的回归方程,进行显著性检验;最后用回归方程进行推算和预测。在学习本章内容的过程中,需要着重把握以下知识点:第八章相关分析和回归分析本章小结一、相关分析

客观现象间的依存关系大致可归纳为两种不同类型:一类是函数关系,指变量(现象)之间存在的严格确定的依存关系;另一类是相关关系,是指变量(现象)之间存在着非严格、不确定的依存关系。相关关系可以从不同的角度进行分类。按相关的密切程度可分为完全相关、不完全相关和不相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论