第六章相关与回归()_第1页
第六章相关与回归()_第2页
第六章相关与回归()_第3页
第六章相关与回归()_第4页
第六章相关与回归()_第5页
已阅读5页,还剩154页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 相互联系与相互影响是普遍的现象受教育的水平工作后的收入预防疾病支出疾病的发病率 客观现象总是普遍联系和相互依存的,当我们用变量来反映这些现象的特征时,便表现为变量之间的依存关系。 如商品价格的变化会刺激或抑制商品销售量的变化;劳动力素质的高低会影响企业的效益;原材料、直接人工的价格变化对产品销售成本有直接的影响,粮食亩产量与施肥量、降雨量、温度之间的关系等。 在经济管理和其他领域中,人们经常需要研究两个或多个变量(现象)之间的相互(因果)关系,并使用数学模型来加以描述和解释。相关与回归分析是定量分析现象之间相互依存关系的统计方法之一,是现代统计学中非常重要的内容,它在自然科学、管理科学和社会

2、经济领域有着十分广泛的应用。 第第6 6章章 相关与回归分析相关与回归分析学习目的和要求: 本章介绍相关分析与回归分析的基本概念与分类,计算简单相关系数,对一元线性回归模型进行参数估计、模型检验、估计与预测等内容。返回6.1 6.1 相 关 关 系 概 述6.26.2线性相关关系测定6.36.3一元线性回归分析 互有联系的客观现象(变量)间关系的紧密程度各不一样。归纳起来,现象间的依存关系大致可以分成两种类型:函数关系和相关关系。函数关系完全确定性的关系相关关系不完全确定的关系6.1 相关关系概述6.1.1 变量间的相互关系例:价格不变时商品销售收入与销售量的关系。Y = cX销售收入销售量Y

3、 与 X 间的确定性关系 (一)函数关系定义:现象之间存在着完全确定的依存关系,即当一个或一组变量每取一个值时,相应的另一个变量必然有一个确定值与之对应 。 函数关系可以用一个确定的公式,即函数式来表示。 ),(21nxxxfy 或:Y=F(X) 然而,现实世界中还有不少情况是现象之间有着密切的联系,但密切的程度并没有达到由一个(几个)变量可以完全确定另一个变量的程度,它们之间是一种非确定性的关系。 变量之间的不确定的依存关系称为相关关系(统计关系)。这种统计关系规律性的研究是相关分析和回归分析研究的主要对象。家庭收入家庭消费支出(二)相关关系 定义:现象之间存在有依存关系,但这种关系是不完全

4、确定的随机关系,即当一个或一组变量每取一个值时,相应的另一个变量可能有多个不同 值与之对应 。相关关系可用统计模型),(21nxxxfy或:Y=F(X)+式中, 为影响Y的除X外的其他随机因素。 非确定性关系 (1)单一因果关系(如货物运输量与货车保有辆数之间 ); (2)互为因果关系(如铁路运输业的发展水平与经济发展水平之间) ; (3)伴随关系(共变关系,如工资与物价的变动) 。现象间数量依存关系的形式: 变量间的依存关系在许多情况下表现为因果关系,其中一个或若干个起着影响作用的变量称为自变量,通常用 X 表示,它是引起另一现象变化的原因,通常是可以控制、给定的值;而受自变量影响的变量称为

5、因变量,通常用 Y 表示,它是自变量变化的结果,是不确定的值。(三) 相关关系与函数关系的联系与区别 (2)函数关系可以用数学表达式精确表示出来,而相关关系只能通过研究变量间的统计规律才能得到。 (1)函数关系中的变量之间的关系是完全确定的,而相关关系中的变量之间的关系是不完全确定的。 由于有观察或测量误差等原因,函数关系在实际中往往通过相关关系表现出来。在研究相关关系时,又常常要使用函数关系的形式来表现,以便找到相关关系的一般数量表现形式。 为此,在研究相关关系时,又常常使用函数关系作为工具,用一定的函数关系表现相关关系的数量联系。(一)按相关的程度分6.1 相关关系概述6.1.2 相关关系

6、的种类 当一种现象的数量变化完全由其它现象的数量变化所确定时,此时现象的关系为完全相关。 如:在价格不变的条件下,某商品的销售额与其销售量总是成正比例关系; 在相关图上表现为所有的观察点都落在同一条线上,在这种场合,相关关系便成为函数关系函数关系是相关关系的一个特例。 当现象间彼此的数量变化互相独立时,称为不相关现象。 例如,通常认为股票价格的高低与气温的高低是不相关的; 如果现象之间的关系介于完全相关和不相关之间,称为不完全相关。 如妇女的结婚年龄与受教育程度之间的关系。 不完全相关关系是现实当中相关关系的主要表现形式,也是相关分析的主要研究对象。 正相关:变量的变动方向一致(同增同减);

7、例如:工人的工资随劳动生产率的提高而增加; 负相关:变量的变动方向相反(一增一减) ; 例如:商品流转的规模愈大,流通费用水平愈低。(二)按相关的方向分(三)按相关的形式分 相关程度密切相关程度不密切 线性相关:当相关现象之间的关系大致呈现为线性关系,即当一个变量变动一个单位时,另一个变量也按一个大致固定的增(减)量变动,就称为线性相关。 如:人均消费水平与人均收入水平通常成线性关系; 非线性相关:当相关现象之间不按固定比例变化时,近似于某种曲线方程的关系。 如:产品的平均成本与产品总产量之间的相关关系就是一种非线性相关。图6.1 相关关系分类示意图(四)按影响因素的多少分 1、 (简)单相关

8、:两个现象的相关,即一个变量对另一个变量的相关关系。 例学习成绩与学习时间;血压与年龄;亩产量与施肥量。 2、复(多元)相关:三个或三个以上现象的相关,即一个变量对两个或两个以上其它变量的相关关系。 例经济增长与人口增长、科技水平、自然资源、管理水平等之间的关系; 体重与身高、食欲、睡眠时间之间的关系。 3、偏相关:就多个变量测定其中两个变量的相关程度而假定其他变量不变。 例在假定人们的收入水平不变时,某种商品的需求与其价格水平的关系。 就 y=ax1+bx2+ ,研究y与x1之间的关系,假定x2不变。 值得注意的是,并非所有的变量之间都存在相关关系,因此需要用相关分析方法来识别和判断。 研究

9、和测度现象间相互依存关系的一种统计分析方法。相关分析,是以现象之间不完全的相关关系为研究对象,6.1 相关关系概述6.1.3 相关分析的主要内容 1.确定现象间是否存在依存关系,其依存关系属于何种类型主要是定性分析和判断; 2.确定相关关系的密切程度定量分析相关图、表、相关系数; 3.确定相关关系的数学表达式回归分析; 4.确定因变量估计值误差的程度; 5.对回归方程进行显著性检验。相关分析的主要内容:6.1 6.1 相 关 关 系 概 述6.2 6.2 线性相关关系测定6.3 6.3 一元线性回归分析 定性分析是依据研究者的理论知识、专业知识和实践经验,对客观现象之间是否存在相关关系,以及有

10、何种相关关系做出判断。6.2 线性相关关系的测定6.2.1 定性分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形式及密切程度。6.2 线性相关关系的测定6.2.2 定量分析相关表与相关图 相关表和相关图是研究相关关系的直观工具。 在进行精确的定量分析之前,可以先利用它们对现象之间存在的相关关系的方向、形式、和密切程度作大致的判断。 (一)相关表:相关表是一种统计表。由相关变量相对应的关系数值所编制成的反映现象之间的相关关系的数列表。 简单相关表-根据总体单位的原始资料编制的相关表(适用 于所观察的样本单位数较少,不需要分组的情况)分

11、组相关表-将原始资料进行分组而编制的相关表(适用于所 观察样本单位数较多,标志变异又较复杂,需要分组的情况) 单变量分组表-按自变量分组 双变量分组表-自变量和因变量均分组 (二)相关图: 又称散点图,它是将两个变量相对应的变量值用坐标点的形式,在直角坐标上描绘出来,以反映二者之间相关关系的图形。 为研究商店人均月销售额和利润率的关系,调查10家商店取得10对数据,说明简单相关表和相关图的编制方法。 从表可看出,随着人均月销售额的增加,利润率有明显的增长趋势。所以,资料表明(如图)有明显的直线相关趋势。例 1人均销售额与和利润率相关表编号人均月销售额(千元)利润率()1234567891013

12、345667783.06.26.68.110.412.612.316.316.818.5利润率(%)人均销售额(千元)120人均销售额与利润率相关图510152384567 在某个地区抽取了9家生产同类产品的企业,其月产量和单位产品成本的资料如表,现在来分析月产量和单位成本的关系。表6-2 9家企业的月产量和单位产品成本资料企业编号123456789月产量(千件)(x)4.16.35.47.63.28.59.76.82.1单位产本(元)(y)807271588650426391例 2序 号月产量(千件)(x)单位产本(元)(y)92.19153.28614.18035.47126.37286.

13、86347.65868.55079.742合计53.7613 9家企业的月产量和单位产品成本相关表 根据规模经济理论,可以判断产品的产量和单位成本之间存在着相关关系,再绘制散点图,我们可以比较直观地看出这两个变量间的关系。 9家企业的月产量和单位产品成本散点图企业按销售额分组(万元)流通费用率(%)4以下9.65 4 87.68 8 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.5866.577.588.599.51004812162024283236销售额(万元)流通费用率(%)例 3 单变量分组表可以使原始资料大大简化,

14、在原始数据较多的情况下,使用单变量分组表能更清晰地反映现象间的相互依存关系,找出变量间数据变动的规律性。例 4 双变量分组表又称为棋盘式相关表。首先,分别确定自变量和因变量的分组数;其次,按两个变量的组数设计棋盘型表格;最后,计算各组次数置于相对应的方格中。适用于对大量复杂数据的处理和分析。 编制双变量分组相关表,要把自变量置于横行,其变量值从小到大自左至右排列;因变量置于纵栏,其变量值从大到小自上而下排列。这样排列,可使相关表与相关图取得一致形式,能直观地看出变量之间相关的方向。 相关图、表虽然有助于识别变量间的相关关系,但它无法对这种关系进行精确的计量(判定其相关关系的密切程度)。 在初步

15、判定变量间存在相关关系的基础上,通常还要计算相应的分析指标相关系数。 相关系数是测定变量之间相关密切程度和相关方向的代表性指标。相关系数用符号“r”表示。 在各种相关中,单相关是基本的相关关系,它是复相关和偏相关的基础。单相关有线性和非线性两和表现形式。测定线性相关系数的方法是最基本的相关分析,是测定其他相关系数方法的基础。我们着重研究线性的单相关系数线性的单相关系数。6.2 线性相关关系的测定6.2.3 定量分析相关系数 1、积差法计算公式:由英国统计学家皮尔逊(Pearson)设计的,故又称为Pearson相关系数。则的一组样本观察值是设,),(),(YXyxii2222)()()()()

16、()(yyxxyyxxnyynxxnyyxxr的标准差的协方差的相关系数与为yxyxyxryxxyyxxy,)(yyxx2)(xx2)(yyyyxxxyLLLr 22)()()(yyxxyyxxr 由于COV(X,Y)的主导地位,又因为其形式是两个差值的乘积之和,故把这个公式又称为“积差公式”。 简记为:Lxy简记为:Lxx简记为:Lyy 2 2、下面我们介绍直线相关系数的设计思路,从中我们会接触到一些新的统计指标,同时也能充分享受到皮尔逊给我们展现的“对称”美感。XYyy xx )(一)(二)(三)(四),(11yx),(nnyx00)()()()()(ryyxxyyxxxy正相关三一yxx

17、yrnyyxxxy)()(1yyxxnii显示x与y之间的相关方向(1)即x和y基本上同时大或同时小,即两个变量之间为正相关负相关XYyy xx )(一)(二)(三)(四),(11yx),(nnyx00)()()()()(ryyxxyyxxxy负相关四二nyyxxxy)(yxxyr 显示x与y之间的相关程度)()()()()(yyxxAyyxx图三一密集分布图A散乱分布图BXYPQ偏小偏大)()(qqppyyxx)(1yyxxnii(2)负相关)()()()()(yyxxAyyxx图四二密集分布图A散乱分布图BXYPQ偏小偏大)()(qqppyyxx不相关00)(0:xyyyxxxxA图 图A

18、图BXYXYxx yy 00)(0:xyyyxxyyB图之间无直线相关与yx第一、显示x与y之间的相关方向负相关正相关无直线相关00)(00)(00)()(ryyxxryyxxryyxxnyyxxryx之间的相关程度越低与越小之间的相关程度越高与越大yxyyxxyxyyxx)()(第二、显示x与y之间的相关密切程度)(1yyxxnii的作用:归 纳 为大的正值时,表示强的正线性相关关系。 接近于零时,表示很小或没有线性相关关系。 为大的负值时,表示强的负线性相关关系。nyyxxiixy)(nyyxxiixy)( cm kg mm kg大于基本结论:协方差与样本的项数n、X与Y的计量单位有关 ,

19、从而不能真实反映相关的程度。)(1yyxxnii)(1yyxxnii)(1yyxxnii 似乎是 这样(3)x、y的作用 消除变量协方差计量单位的影响直接对比:yxyxxynyyxxr)(yxnyyxx)( 相关程度的大小与计量单位无关。为了消除积差中两个变量原有计量单位的影响,将各变量的离差除以该变量数列的标准差,使之成为相对积差,即 ,所以相关系数是无量纲的数量。yxyyxx和 使使111rrnyyxxryx22nyyxxryx2221yxyxyyxxyyxxn1112yxyyxxn22222)()(1yxyxnyynxxyyxxn1:1022rrr同理可证2122yxyyxxnr221)(ynyy3、积差法相关系数的简捷计算公式2222)()()()()()(yyxxyyxxnyynxxnyyxxryxxynyxxy)()(yxyxyxxyyyxxyxyxxyxynyn

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论