第八章 相关与回归分析_第1页
第八章 相关与回归分析_第2页
第八章 相关与回归分析_第3页
第八章 相关与回归分析_第4页
第八章 相关与回归分析_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学STATISTICS高等学校应用型特色规划教材清华大学出版社第八章相关与回归分析第一节相关的基本概念

第三节

一元线性回归分析

第四节

多元线性回归分析

【学习目标】通过对本章的学习,掌握相关分析的种类及简单相关系数的计算方法;重点掌握回归分析的估计和检验方法;在此基础上能够运用相关分析和回归分析的基本方法解释实际社会经济问题。重点与难点:相关系数的计算;一元线性回归分析。第五节

非线性回归分析

第二节

相关关系的确定

第一节相关的基本概念(一)函数关系一、相关关系与函数关系

第八章相关与回归分析函数关系是指现象之间存在着严格的依存关系,亦即当其它条件不变时,对于某一自变量或几个自变量的每一数值,都有因变量的一个的确定值与之相对应,并且这种关系可以用一个确定的数学表达式反映出来。第一节相关的基本概念(二)统计关系一、相关关系与函数关系

第八章相关与回归分析统计关系不同于函数关系,当重复观测时,观测点不是完全落在统计关系曲线上,而是围绕统计关系曲线散布。统计关系可以表示为确定部分和随机性部分二者之和,这是回归分析的基础。相关关系因果关系案例分析相关关系与因果关系一家研究机构有一项惊人的发现:统计数据显示,脚长的儿童拼写能力比脚短的儿童强。原来他们调查的是一群年龄不同的儿童,脚长的儿童比脚短的儿童年龄大!赶快回去量一下儿子的脚长我要把脚拉长一点!相关关系与函数关系的联系相关关系和函数关系既有区别,又有联系。区别表现在:(1)函数关系指变量之间关系是确定的,而相关关系指变量之间关系是不确定的,可以在一定范围内变动;(2)函数关系中变量之间依存关系是可以用一定的的方程y=f(x)表现出来,可以给定自变量来推算应变量,而相关关系不能用一定的方程准确地表示 相关关系与函数关系的联系联系表现在:(1)有些函数关系往往因为有观察或测量误差以及各种随机因素的干扰等原因,在实际中常常通过相关关系表现出来;(2)而在研究相关关系时,其数量间的规律性了解得越深刻的时候,则相关关系越有可能转化为函数关系或借助函数关系来表现。⒈按涉及变量的多少分为相关关系的种类⒉按照表现形式不同分为⒊按照变化方向不同分为直线相关曲线相关负相关正相关二、相关分析的种类复相关单相关偏相关第八章相关与回归分析4.按相关的程度分为相关关系的种类5.按变量之间因果关系的方向分为完全相关不完全相关不相关双向因果相关单向因果相关虚假相关第八章相关与回归分析第二节相关关系的确定定性分析:是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析:在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。第二节相关关系的确定第八章相关与回归分析一、相关表与相关图(一)简单相关表将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便得到简单的相关表。适用于所观察的样本单位数较少,不需要分组的情况

第二节相关关系的确定第八章相关与回归分析

企业编号月产量(千吨)X生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用第二节相关关系的确定第八章相关与回归分析一、相关表与相关图

(二)分组相关表:适用于所观察的样本单位数较多,需要分组的情况

单变量分组表双变量分组表第二节相关关系的确定第八章相关与回归分析

1.单变量分组表

表某纺织厂工人看管织机台数和时劳动生产率相关表正相关负相关曲线相关不相关xyxyxyxy又称散点图,用直角坐标系的x轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。相关图(万元)(万元)相关图某软件公司的年广告投入费和月平均销售额相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。著名统计学家卡尔·皮尔逊设计了统计指标–––相关系数

在直线相关的条件下,用以反映两变量间线性相关方向和程度的统计指标,用r表示相关系数r的取值范围:-1≤r≤1r>0表示两变量正相关;r<0表示两变量负相关;|r|=0表示两变量间不存在线性关系;|r|=1表示完全线性相关,即函数关系;0<|r|<1表示存在不同程度的线性相关:|r|<0.4为低度线性相关;0.4≤|r|<0.7为显著性相关;0.7≤|r|<1.0为高度线性相关。相关系数的取值及其意义图示-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加相关系数序号广告投入费x(万元)月均销售额y(万元)x2y2xy1234567891012.515.323.226.433.534.439.445.255.460.921.223.932.934.142.543.249.052.859.463.5156.25234.09538.24696.961122.251183.361552.362043.043069.163708.81449.44571.211082.411162.811806.251866.242401.002787.843528.364032.25265.00365.67763.28900.241423.751486.081930.602386.563290.763867.15合计346.2422.514304.5219687.8116679.09相关系数为0.9942,说明广告投入费与月平均销售额之间有高度的线性正相关关系相关分析不能解释两变量间的因果关系

相关系数只是表明两个变量间互相影响的程度和方向,它并不能说明两变量间是否有因果关系,以及何为因,何为果,即使是在相关系数非常大时,也并不意味着两变量间具有显著的因果关系。

相关分析应注意的问题相关分析应注意的问题警惕虚假相关导致的错误结论有时两变量之间并不存在相关关系,但却可能出现较高的相关系数。例如:对教师薪金的提高和酒价的上涨作相关分析,计算得到一个较大的相关系数,这不能表明是教师薪金提高导致酒的消费量增加,从而导致酒价上涨.。

事实是由于经济繁荣导致教师薪金和酒价的上涨,而教师薪金增长和酒价之间并没有什么直接关系。相关分析应注意的问题不要在相关关系据以成立的数据范围以外,推论这种相关关系仍然保持

例如:雨下的多,农作物长的好,在缺水地区,干旱季节雨是一种福音,但雨量太大,却可能损坏庄稼。

广告投入多,销售额上涨,利润增加,但盲目加大广告投入,却未必使销售额再增长,利润还可能减少。

正相关达到某个极限,就可能变成负相关一、回归分析的含义回归分析是指对具有相关关系的现象,根据其相关关系的形态,选择一个合适的数学模型,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。实际上是相关现象之间不确定的不规则的数量关系的一般化、规则化的过程。第三节一元线性回归分析第一节相关与回归分析的基本概念

第八章相关与回归分析二、相关分析与回归分析的关系

回归分析是关于研究一个叫做因变量的变量对另一个或多个叫做解释变量的依赖关系。

相关分析是测度两个变量之间的线性关联度的,并用一些指数(相关系数)表示相关程度。

第一节相关与回归分析的基本概念

第八章相关与回归分析二、相关分析与回归分析

相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。区别:第一节相关与回归分析的基本概念

第八章相关与回归分析二、相关分析与回归分析的关系联系:相关分析是回归分析的基础和前提。回归分析是相关分析的深入和继续。三、回归分析的种类(1)按自变量的个数分一元回归多元回归按回归线的形态分普通回归模型曲线回归(2)(3)按回归模型是否带有虚拟变量带虚拟变量的回归模型线性回归第三节一元线性回归分析第八章相关与回归分析四、一元线性回归分析的模型

在回归分析中,最简单最基本的单方程模型为一元线性回归模型。一元线性回归分析的总体回归模型为:

为常数项或截距项,表示自变量为零时y的取值为斜率系数,表示当x增加一个单位时y的平均增加数量是随机误差项,又称随机干扰项。第三节一元线性回归分析第八章相关与回归分析(一)一元线性回归分析随机误差项的基本假定

第二,模型的设定误差。在线性回归模型中加入随机误差项是基于以下原因:

第一,模型不可能包含所有的解释变量。第三,测量误差的影响。第四,其他随机因素的影响。第三节一元线性回归分析第八章相关与回归分析(二)、一元线性回归分析随机误差项的基本假定

满足以下假定的线性回归模型称为古典(或经典)线性回归模型

假定1:回归模型是正确设定的假定2:解释变量是非随机的假定3:随机误差项的均值为零假定4:随机误差项的方差为一个不变的常数(等方差假定)假定5:随机误差项的观测值互不相关(非序列相关假定)假定6:解释变量与随机误差项不相关假定7:随机误差项服从正态分布假定8:没有一个解释变量是其他任何解释变量的完全线性组合(无多重共线性假定,只适用于多元线性回归模型)第三节一元线性回归分析第八章相关与回归分析

线性回归模型由两部分构成,确定性部分和随机性部分,为确定性部分,称为对于给定值的期望值,可以写为:

上式被称为总体线性回归方程。第三节一元线性回归分析第八章相关与回归分析五、一元线性回归模型的估计

为了得到这些估计值而最为广泛使用的方法就是普通最小二乘法

为样本回归方程。

一般用、分别表示参数的估计值第三节一元线性回归分析第八章相关与回归分析

普通最小二乘法(OrdinaryLeastSquare)是通过最小化残差平方和而计算估计值得一种回归技术。其基本思想是:由于描述n组数据的直线有多条,需要按照一定的原则确定一条最优直线来代表两个变量间的关系。所谓最优直线是指该直线距离各散点最近,即对y的拟合值与y的观察值之间总的误差为最小。达到最小来确定、称为回归残差最小二乘法的意义在于使:第二节一元线性回归分析第八章相关与回归分析五一元线性回归模型的估计

根据微积分的极值定理,对求相应于、的偏导数,并令其等于0,即可求得:

第二节一元线性回归分析第八章相关与回归分析三、一元线性回归模型的拟合程度分析

(一)一元线性回归模型的判定系数第八章相关与回归分析剩余离差平方和回归离差平方和总离差平方和第二节一元线性回归分析第八章相关与回归分析三、一元线性回归模型的拟合程度分析

可以证明,对上式两边分别平方加总后等式仍然成立,即:(一)一元线性回归模型的判定系数

可简写为:TSS=ESS+RSS第二节一元线

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论