项目八 相关分析与回归分析法_第1页
项目八 相关分析与回归分析法_第2页
项目八 相关分析与回归分析法_第3页
项目八 相关分析与回归分析法_第4页
项目八 相关分析与回归分析法_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计基础

相关分析与回归分析法8.1.1相关关系的含义

(1)函数关系函数关系是指变量之间存在的一种完全确定性的一一对应关系,在这种关系中,对于某一变量的一个数值,都有另一变量的唯一确定的值与之对立。客观世界的各种现象之间,特别是在自然界,广泛存在着函数关系。(2)相关关系相关关系是指变量之间的一种不完全确定的关系,即对于某一变量的每一个数值,另一变量有若干个数值与之相适应在相关关系中,相互联系的现象之间通常存在着一定的、因果关系,这时就把其中起着影响作用的变量叫作自变量(用x来表示),由于受到自变量响而发生变动的变量叫作因变量(用y来表示)。8.1.2相关关系的类型(1)按变量之间相关因素的多少分按变量之间的相关因素的多少分,有单相关和复相关。(2)按变量之间相关关系的方向分按变量之间相关关系的方向分,有正相关和负相关。(3)按变量之间相关关系的表现形式分按变量之间相关关系的表现形式分,有直线相关和曲线相关。(4)按变量之间相关的程度分

按变量之间相关的程度分,有完全相关、不相关和不完全相关。相关分析与回归分析法8.1.3相关关系分析的内容

(1)相关分析通过相关分析,确定现象之间有无关系及相关关系的表现形式。①确定现象之间相关关系的类型由于相关分析的研究对象是现象之间的相关关系,然而现象之间有无关系是个定性认识的问题。所以进行相关分析之前,首先要根据经济理论、专业知识和实践经验对被研究对象进行定性判断。当确认现象之间具有相关关系时,才能运用相关分析方法进行定量分析。为了验证定性判断是否正确,还要运用大量的实际资料,通过编制相关表、绘制相关图及计算相关系数对被研究现象是否真正存在相关关系,以及相关关系的形式做出进一步的判断。②测定现象之间相关关系的密切程度由于相关关系是一种不严格的数量关系,它们的关系有的不大密切,有的比较密切。所以相关分析的一个重要内容,就是要从现象之间不严格的数量关系中想办法来判断它们之间相关关系的密切程度,只有相关关系的密切程度达到一定的标准,对其进行研究才具有实际意义。判断相关关系密切程度的主要方法是计算相关系数或相关指数。相关图表能帮助我们做出一般性的判断,相关系数能从数量上明确说明直线相关关系的密切程度与方向,要确定曲线相关关系的密切程度则需要计算相关指数。相关分析与回归分析法(2)回归分析

通过回归分析,说明现象变量之间的数量影响关系。

①建立相关变量之间的一般关系的数学表达式(即回归方程)

如果相关的程度高,就需要进行回归分析,即建立相关变量之间的一般关系的数学表达式。如果现象之间表现为直线相关,采用配合直线方程的方法;如果表现为曲线相关,就采用配合曲线方程的方法。所配合的方程称为回归方程式,它是进行判断、推算和预测的依据。②对因变量估计值的可靠程度进行检验

根据回归方程,可以给出自变量的若干数值,求得因变量的相应的估计值。估计值与实际值之间存在误差的,确定因变量估计值误差大小的指标叫作回归误差。回归误差越小,则因变量估计值的可靠程度越高;反之,因变量估计值的可靠程度越低。相关分析与回归分析法8.2.1相关表和相关图对两个现象变量作相关分析时,首先必须取得一系列的成对的统计资料。这是相关分析的原始数据。根据资料是否经过分组,相关表可以分为简单相关表与分组相关表。简单相关表是指根据总体单位的原始资料,将其中一个变量的数值按一定的顺序排列,同时列出与之对应的另一个变量的变量值而形成的表格。例如,研究棉纱产量与单位成本之间的关系,搜集数据排列形成表8—1就是简单相关表。相关分析与回归分析法月份产量(吨)单位成本(千元/吨)1977.22100731036.941096.751106.561156.571087.281067.291146.8101186.8表8—1某种棉纱产量与单位成本之间的关系相关分析与回归分析法相关图也称散点图,是根据原始数据,在直角坐标中绘制出两个变量相对应的观察值的所有点,从这些点的分布情况观察分析两个变量间的关系,这个图称为相关图。该图表明相关点分布状况,如将上表的资料画在一坐标系中,以x轴代表产量,y轴代表单位成本,各点的分布状况如图,即散点图(相关图)。相关分析与回归分析法分组相关表和相关图当相关资料包括的对应数值很多时,直接根据两变量各原始值编制相关表、绘制相关图进而计算各相关指标,工作量很大,且相关表会很长,也不方便,相关图也不好绘制,在这种情况下,可编制分组相关表或绘制分组相关图。分组相关表是指将原始资料按某一变量的变量值进行统计分组,并计算相对应的变量值的平均数以后整理形成的表格。例如,为研究耕作深度与亩产量的关系,分别搜集了30块地的耕作深度与亩产量的数据,共60个数据值。由于数据多,所以把30块地按耕作深度分组,形成成分组相关表如表8一2。

耕作深度(厘米)

田块数(块)平均亩产量(公斤/亩)81012141618459741427498568631683734

合计30——表8—2某乡某农作物耕作深度与平均亩产量分组资料相关分析与回归分析法8.2.2相关系数相关关图表可以帮助我们直观地看出所观察的两个现象的数量变动之间是否存在直线相关关系和相关方向。相关系数是研究和判断两个现象之间线性相关密切程度大小的一个统计分析指标。通常用r来表示。

相关系数的最简单的一种计算方法是积差法,它是用两个变量的协方差与其标准差的乘积之比来计算的。其计算公式如下:

从上式可以看到,相关系数的性质表现为:(1)取值范围是在一1和+1之间,即一l≤r≤+1;(2)r>0为正相关,r<0则为负相关;(3)r的绝对值越接近于1,表示相关关系越强,越接近于0,表示相关关系越弱;(4)|γ|=1,则表明两个变量完全相关,r=0,则表明两个变量不存在直线相关关系。

相关分析与回归分析法分组相关表更能清晰地反映两变量之间相关关系的存在。从分组相关表中可以看出,耕作深度每增加2厘米,平均亩产量增加大致均等的量(即60公斤左右),由此可以初步判断耕作深度与亩产量之间存在直线正相关关系。相关分析与回归分析法8.3.1回归分析的意义

(1)回归分析的含义和种类(2)回归分析的特点

一元线性回归分析具有以下特点:

①区分自变量和因变量。两含变量不是对等的,必须区分出自变量和因变量。如果是互为因果关系则根据研究的目的来确定因变量(y)与自变量(x)。②求回归方程。在没有明显的因果关系的两个变量x与y之间可以求得两个回归方程——y依x的回归方程及x依y的回归方程。两个方程是互相独立的,不能互相替换。

③回归方程的作用。回归方程的主要作用在于给出自变量的数值来估计因变量的数值。一个回归方程只能做一种推算。相关分析与回归分析法8.3.2直线回归方程的建立与应用

直线的一般方程为:y=a+bx,这个方程中的y值是x值的函数,是确定性关系,也就是说只要给定一个x值,y值也就随之确定,但是前面已经讲过,具有相关关系的两个变量之间的数量关系是不严格的、非确定性的。方程式应改写为:

式中,

表示因变量的估计值,

为自变量的实际值;a、b为待定参数。其几何意义是:a是直线方程的截距,b是斜率。其经济意义是:a是当x为零时y的估计值,b是当x每变动一个单位时,y平均变动的数量,b也叫回归系数。回归系数b的符号与相关系数r的符号一致并且意义相同。当b的符号为正时,自变量和因变量同方向变动;当b的符号为负时,自变量和因变量反方向变动。回归系数b与相关系数r的区别是:相关系数r的取范围是确定的,即一1至+1之间,而回归系数b的取值并没有一个确定的范围,其大小是依据y的计量单位而确定。相关分析与回归分析法最小平方法配合直线,就是要求实际值与回归值的离差平方和最小。其求a、b参数的方法同任务五中介绍的。相关分析与回归分析法8.3.3回归标准误差

估计标准误差是用来说明回归方程代表性大小的统计指标。它是以回归直线为中心反映各观察值与估计值平均数之间离差程度的大小,从另一方面看,也就是反映着估计值平均数yc的代表性的可靠程度,其计算原理与标准差基本相同,计算公式如下:估计标准误差的计算有两种方法:公式中Syx代表估计标准误差,即x为自变量,y为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论