项目10相关和回归_第1页
项目10相关和回归_第2页
项目10相关和回归_第3页
项目10相关和回归_第4页
项目10相关和回归_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、项项目目十十 相相关关和和回回归归分分析析项目十项目十 相关和回归分析相关和回归分析能力目标能力目标(1) 具有运用正确理论和方法判定现象之间的相关关系的能力;具有运用正确理论和方法判定现象之间的相关关系的能力;(2) 能够编制相关表和绘制相关图;能够编制相关表和绘制相关图;(3) 具有在实际工作中根据有关直线回归资料配合回归直线方程的能力;具有在实际工作中根据有关直线回归资料配合回归直线方程的能力;(4) 具有应用具有应用Excel工具进行回归分析的能力,并能够用文字描述回归系数工具进行回归分析的能力,并能够用文字描述回归系数的含义。的含义。知识目标知识目标(1) 相关关系的含义;相关关系的

2、含义;(2) 相关关系的类别划分标志;相关关系的类别划分标志;(3) 相关系数的计算;相关系数的计算;(4) 回归方程参数的计算;回归方程参数的计算;(5) 一元线性回归方程的建立。一元线性回归方程的建立。项目十项目十 相关和回归分析相关和回归分析表表10-1 全家福朝阳路店的历年销售利润和员工工资支出资料全家福朝阳路店的历年销售利润和员工工资支出资料万元万元年度年度销售利润销售利润工资支出工资支出200020012002200320042700278028602920305090100118132145200531451562006323017220073308188200835022012

3、0094005230项目分析项目分析由表由表10-1的资料可知,超市的销售利润与员工工的资料可知,超市的销售利润与员工工资支出之间呈现逐渐上升的趋势,但是用数字来资支出之间呈现逐渐上升的趋势,但是用数字来描述这两者之间的关系,需要测度销售利润和员描述这两者之间的关系,需要测度销售利润和员工工资支出的相关程度。对于具有高度相关关系工工资支出的相关程度。对于具有高度相关关系的变量,可以进一步了解变量之间的影响关系,的变量,可以进一步了解变量之间的影响关系,这需要对数据进行回归分析。本项目可以通过以这需要对数据进行回归分析。本项目可以通过以下任务来完成。下任务来完成。工作任务一工作任务一 相关关系分

4、析的意义相关关系分析的意义工作任务二工作任务二 相关分析相关分析工作任务三工作任务三 一元线性回归分析一元线性回归分析工作任务一工作任务一 相关分析的意义相关分析的意义一、相关关系的概念及特点一、相关关系的概念及特点(一一)相关关系的概念相关关系的概念1函数关系函数关系函数关系是指现象之间存在的完全确定的、严格的依存关系。即对于某一变函数关系是指现象之间存在的完全确定的、严格的依存关系。即对于某一变量的每一个数值,都有另一个变量唯一确定的数值与之相对应,且这种关系量的每一个数值,都有另一个变量唯一确定的数值与之相对应,且这种关系可以用一个数学函数式反映出来。可以用一个数学函数式反映出来。2相关

5、关系相关关系相关关系是指现象之间客观存在的、关系数值不确定的相互依存关系。即在相关关系是指现象之间客观存在的、关系数值不确定的相互依存关系。即在两个变量两个变量(或两个以上变量或两个以上变量)之间,虽不存在严格的数量关系,但彼此存在着之间,虽不存在严格的数量关系,但彼此存在着相互伴随的变动状态,并且在数量上表现为非确定性的对应关系。即当一个相互伴随的变动状态,并且在数量上表现为非确定性的对应关系。即当一个或几个变量发生数量上的变化时,另一个变量也会发生相应的变化,但没有或几个变量发生数量上的变化时,另一个变量也会发生相应的变化,但没有一个唯一的数值与之相对应。一个唯一的数值与之相对应。工作任务

6、一工作任务一 相关分析的意义相关分析的意义一、相关关系的概念及特点一、相关关系的概念及特点(一一)相关关系的概念相关关系的概念3相关关系与函数关系的区别与联系相关关系与函数关系的区别与联系一方面,对于具有函数关系的某些现象也会因一方面,对于具有函数关系的某些现象也会因观察测量的误差,而使得到的数据表现为非确观察测量的误差,而使得到的数据表现为非确定性的定性的工作任务一工作任务一 相关分析的意义相关分析的意义一、相关关系的概念及特点一、相关关系的概念及特点(一一)相关关系的概念相关关系的概念3相关关系与函数关系的区别与联系相关关系与函数关系的区别与联系另一方面,如果对相关关系作进一步的观察,不难

7、发另一方面,如果对相关关系作进一步的观察,不难发现它们也是有规律可循的,这种规律是,影响因素给现它们也是有规律可循的,这种规律是,影响因素给出一个确定的数值,被影响因素虽没有一个唯一确定出一个确定的数值,被影响因素虽没有一个唯一确定的数值与之相对应,有一定的波动性,但却总是分布的数值与之相对应,有一定的波动性,但却总是分布在它们的平均数周围,并围绕它们的平均数依照一定在它们的平均数周围,并围绕它们的平均数依照一定的规律变动,对这种变动规律,可以借助函数关系的的规律变动,对这种变动规律,可以借助函数关系的数学表达式来近似地描述具有相关关系现象间的相关数学表达式来近似地描述具有相关关系现象间的相关

8、表现形式、相关方向等,作为分析和预测的依据。表现形式、相关方向等,作为分析和预测的依据。工作任务一工作任务一 相关分析的意义相关分析的意义一、相关关系的概念及特点一、相关关系的概念及特点(二二)相关关系的特点相关关系的特点(2) 现象之间数量上的关系不是现象之间数量上的关系不是完全确定的。完全确定的。(1) 现象之间确实存在着数量现象之间确实存在着数量上的依存关系。上的依存关系。工作任务一工作任务一 相关分析的意义相关分析的意义二、相关关系的种类二、相关关系的种类(一一)单相关和复相关单相关和复相关(二二)直线相关和曲线相关直线相关和曲线相关(三三)正相关和负相关正相关和负相关(四四)完全相关

9、、不完全相关和不相关完全相关、不完全相关和不相关工作任务一工作任务一 相关分析的意义相关分析的意义二、相关关系的种类二、相关关系的种类图图10-1 直线正相关直线正相关 图图10-2 直线负相关直线负相关工作任务一工作任务一 相关分析的意义相关分析的意义二、相关关系的种类二、相关关系的种类图图10-3 曲线相关曲线相关 图图10-4 不相关不相关工作任务一工作任务一 相关分析的意义相关分析的意义三、相关分析的内容三、相关分析的内容相关关系分析是对客观现象之间存在的相关关系进行分析研相关关系分析是对客观现象之间存在的相关关系进行分析研究的一种统计方法。究的一种统计方法。其主要目的就是对现象间的相

10、互关系的密切程度和变化其主要目的就是对现象间的相互关系的密切程度和变化规律,有一个具体量的观念,进一步找出相互关系的模规律,有一个具体量的观念,进一步找出相互关系的模式,以便进行统计预测和推算,为管理决策提供资料。式,以便进行统计预测和推算,为管理决策提供资料。具体内容包括两个部分:一是相关分析;二是回归分析。具体内容包括两个部分:一是相关分析;二是回归分析。相关图又称散相关图又称散点图,它是将点图,它是将相关表中的观相关表中的观测值在平面直测值在平面直角坐标系中用角坐标系中用坐标点描绘出坐标点描绘出来,以表明相来,以表明相关点的分布状关点的分布状况的图形。况的图形。通常坐标上的横通常坐标上的

11、横轴轴( )代表自变量代表自变量(起影响作用的现起影响作用的现象象);纵轴;纵轴( )代表代表因变量因变量(受自变量受自变量影响而变动的现影响而变动的现象象)。通过相关图,可以通过相关图,可以大致看出两个变量大致看出两个变量之间有无相关关系,之间有无相关关系,相关的形态、方向相关的形态、方向和密切程度。一般和密切程度。一般说来,相关图上所说来,相关图上所有相关点愈聚集在有相关点愈聚集在某一条直线某一条直线(或曲或曲线线)附近,则表明附近,则表明现象间的相关关系现象间的相关关系愈密切。愈密切。工作任务二工作任务二 相关分析的方法相关分析的方法一、相关表和相关图一、相关表和相关图(一一)相关表相关

12、表工作任务二工作任务二 相关分析的方法相关分析的方法【例例10-1】对全国对全国19912003年城镇居民家庭全年人均可年城镇居民家庭全年人均可支配收入与恩格尔系数调查得到的资料见表支配收入与恩格尔系数调查得到的资料见表10-2。表表10-2 全国城镇居民家庭人均可支配全国城镇居民家庭人均可支配收入与恩格尔系数相关表收入与恩格尔系数相关表年份年份人均可支配收入人均可支配收入/元元 恩格尔系数恩格尔系数/% 19911992199319941995199619971998199920002001200220031700.602026.602577.403496.204283.004838.905

13、160.305425.105854.026280.006859.607702.808472.2053.8053.0450.3250.0450.0948.7646.5944.6642.0739.4438.2037.6837.10工作任务二工作任务二 相关分析的方法相关分析的方法一、相关表和相关图一、相关表和相关图(二二)相关图相关图【例例10-2】以表以表10-2数据绘制的相关图如图数据绘制的相关图如图10-5所示。所示。图图10-5 全国城镇居民家庭人均可支配全国城镇居民家庭人均可支配收入与恩格尔系数相关图收入与恩格尔系数相关图工作任务二工作任务二 相关分析的方法相关分析的方法二、相关系数二、

14、相关系数(一一)相关系数的概念相关系数的概念相关系数是用以反映变量之间在直线相关条件下相关关系密切相关系数是用以反映变量之间在直线相关条件下相关关系密切程度的统计指标。程度的统计指标。(1) 表明现象之间是否存在直线相关关系。表明现象之间是否存在直线相关关系。(2) 表明现象之间直线相关关系的密切程度。表明现象之间直线相关关系的密切程度。(3) 表明现象之间直线相关关系的方向。表明现象之间直线相关关系的方向。工作任务二工作任务二 相关分析的方法相关分析的方法二、相关系数二、相关系数(二二)相关系数的计算相关系数的计算(1) 自变量自变量 的标准差:的标准差:x2xxxn(2) 因变量因变量 的

15、标准差:的标准差:y2yyyn工作任务二工作任务二 相关分析的方法相关分析的方法二、相关系数二、相关系数(二二)相关系数的计算相关系数的计算(3) 与与 的协方差:的协方差:x用积差法测定相关系数的公式如下:用积差法测定相关系数的公式如下:y2xyxxyyn2221()()11()()xyxyxxyynrxxyynn 工作任务二工作任务二 相关分析的方法相关分析的方法二、相关系数二、相关系数(二二)相关系数的计算相关系数的计算为了计算上的方便,上面相关系数的公式还可以简化成下式:为了计算上的方便,上面相关系数的公式还可以简化成下式:2222nxyxyrnxxnyy 工作任务二工作任务二 相关分

16、析的方法相关分析的方法【例例10-3】某地区某地区20052011年生产总值与社会商品零售额年生产总值与社会商品零售额的资料见表的资料见表10-3。表表10-3 某地区生产总值与社会商品零售额的相关系数某地区生产总值与社会商品零售额的相关系数年份年份生产总值生产总值x/亿元亿元商品零售总额商品零售总额y/亿元亿元200520062007200820092010201139455263708085202226343639401521202527043969490064007225400484676115612961521160078099013522142252031203400合计合计4342

17、17287447133143042x2yxy工作任务二工作任务二 相关分析的方法相关分析的方法【例例10-3】某地区某地区20052011年生产总值与社会商品零售额年生产总值与社会商品零售额的资料见表的资料见表10-3。2222()()n xyx yrn xxn yy 227 14304434217728744(434)77133(217)0.984工作任务二工作任务二 相关分析的方法相关分析的方法二、相关系数二、相关系数(三三)相关系数的分析相关系数的分析相关系数由两部分组成,即正负号和绝对值的大小。相关系数由两部分组成,即正负号和绝对值的大小。相关系数的正负说明现象之间的相关方向,当相关系

18、数的正负说明现象之间的相关方向,当 0时,表时,表示两变量为正相关,示两变量为正相关, 0时,表示两变量为负相关。时,表示两变量为负相关。相关系数的值介于相关系数的值介于-1到到+1之间,即之间,即-1 +1。其绝对值的。其绝对值的大小说明两现象之间线性相关的密切程度。大小说明两现象之间线性相关的密切程度。工作任务二工作任务二 相关分析的方法相关分析的方法二、相关系数二、相关系数(三三)相关系数的分析相关系数的分析(1) 当当|r |=1时,表示时,表示两变量为完全线性相两变量为完全线性相关,即为直线函数关关,即为直线函数关系。系。(2) 当当r =0时,表示两时,表示两变量间无线性相关关变量

19、间无线性相关关系。无线性相关关系,系。无线性相关关系,不等于说现象间没有不等于说现象间没有相关关系。现象间不相关关系。现象间不具有线性相关关系,具有线性相关关系,可能具有曲线相关关可能具有曲线相关关系。系。工作任务二工作任务二 相关分析的方法相关分析的方法二、相关系数二、相关系数(三三)相关系数的分析相关系数的分析(3) 当当0| r |1时,表时,表示两变量存在一定程示两变量存在一定程度的线性相关。且度的线性相关。且| r |越接近越接近1,两变量间线,两变量间线性相关越强;性相关越强;| r |越接越接近于近于0,表示两变量的,表示两变量的线性相关越弱。线性相关越弱。(4) 一般可按四级划

20、一般可按四级划分:分:| r |0.3为微弱线为微弱线性相关;性相关;0.3| r |0.5为低度线性相关;为低度线性相关;0.5| r |0.8为显著线为显著线性相关;性相关;0.8| r |1为为高度线性相关。高度线性相关。工作任务三工作任务三 回回 归归 分分 析析一、回归分析的含义一、回归分析的含义回归分析就是对具有相关关系的诸变量之间数量变回归分析就是对具有相关关系的诸变量之间数量变化的一般关系进行测定,确立一个数学表达式,用化的一般关系进行测定,确立一个数学表达式,用于估计或预测的统计分析方法。于估计或预测的统计分析方法。根据回归分析方法得出的数学表达式称为回归方程,根据回归分析方

21、法得出的数学表达式称为回归方程,它可能是直线回归方程或曲线回归方程,也可能是它可能是直线回归方程或曲线回归方程,也可能是一元回归方程或多元回归方程,视具体资料的性质一元回归方程或多元回归方程,视具体资料的性质而定。两个变量之间的线性回归方程称为一元线性而定。两个变量之间的线性回归方程称为一元线性回归方程或简单直线回归方程。回归方程或简单直线回归方程。工作任务三工作任务三 回回 归归 分分 析析二、一元线性回归方程的建立二、一元线性回归方程的建立进行回归分析通常要设定一定的数学模型。在回归分析进行回归分析通常要设定一定的数学模型。在回归分析中,最简单的模型是只有一个因变量和一个自变量的线中,最简

22、单的模型是只有一个因变量和一个自变量的线性回归模型。这一类模型就是一元线性回归方程。该类性回归模型。这一类模型就是一元线性回归方程。该类模型假定因变量模型假定因变量y 主要受自变量主要受自变量x 的影响,它们之间存的影响,它们之间存在着近似的线性函数关系,即:在着近似的线性函数关系,即:cyabx工作任务三工作任务三 回回 归归 分分 析析二、一元线性回归方程的建立二、一元线性回归方程的建立一元线性回归方程中的待定参数也是根据最小平方法的一元线性回归方程中的待定参数也是根据最小平方法的原理,在自变量和因变量的原始数据资料的基础上求出原理,在自变量和因变量的原始数据资料的基础上求出的。其计算公式

23、为:的。其计算公式为:22()nxyxybnxx xbya当当 、 求出后,一元线性回归方程求出后,一元线性回归方程 便可便可确定了。确定了。a bcyabx工作任务三工作任务三 回回 归归 分分 析析 【例例10-4】以表以表10-3的资料,建立生产总值与社会商品零的资料,建立生产总值与社会商品零售额的一元线性回归方程,将表售额的一元线性回归方程,将表10-3的计算数据代入公式的计算数据代入公式求解未知参数求解未知参数、得:得:、ab22()nxyxybnxx 27 14304434217728744(434)0.3159()亿元aybx2174340.31597711.414 211.41

24、4 20.3159cyx所以,回归方程为所以,回归方程为工作任务三工作任务三 回回 归归 分分 析析三、回归分析与相关分析的区别三、回归分析与相关分析的区别 二者的区别主要体现在以下三个方面:二者的区别主要体现在以下三个方面:(1) 在相关分析中涉及的变量不存在自变量和因变量的在相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是对等的;而在回归分析中,划分问题,变量之间的关系是对等的;而在回归分析中,则必须根据研究对象的性质和分析研究的目的,对变量则必须根据研究对象的性质和分析研究的目的,对变量进行自变量和因变量的划分。因此,在回归分析中,变进行自变量和因变量的划分。因此,在

25、回归分析中,变量之间的关系是不对等的。量之间的关系是不对等的。(2) 在相关分析中所有的变量都是随机变量;而在回归在相关分析中所有的变量都是随机变量;而在回归分析中,自变量是给定的,因变量才是随机的,即将自分析中,自变量是给定的,因变量才是随机的,即将自变量的给定值代入回归方程后,所得到的因变量的估计变量的给定值代入回归方程后,所得到的因变量的估计值不是唯一确定的,而会表现出一定的随机波动性。值不是唯一确定的,而会表现出一定的随机波动性。工作任务三工作任务三 回回 归归 分分 析析三、回归分析与相关分析的区别三、回归分析与相关分析的区别 二者的区别主要体现在以下三个方面:二者的区别主要体现在以

26、下三个方面:(3) 相关分析主要是通过一个指标即相关系数来反映变相关分析主要是通过一个指标即相关系数来反映变量之间相关程度的大小,由于变量之间是对等的,因此量之间相关程度的大小,由于变量之间是对等的,因此相关系数只有一个数值。而在回归分析中,对于互为因相关系数只有一个数值。而在回归分析中,对于互为因果的两个变量果的两个变量(如人的身高与体重,商品的价格与需求如人的身高与体重,商品的价格与需求量量),则可存在两个回归方程。,则可存在两个回归方程。工作任务三工作任务三 回回 归归 分分 析析四、回归估计标准误差四、回归估计标准误差 (一一)回归估计标准误差的计算回归估计标准误差的计算通常用通常用 代表回归估计标准误差,其计算公式为:代表回归估计标准误差,其计算公式为:yS2()cyyySn上面的计算公式为回归估计标准误差的概念性计算公式,利用这个公式计算上面的计算公式为回归估计标准误差的概念性计算公式,利用这个公式计算回归估计标准误差需计算所有实际值回归估计标准误差需计算所有实际值 的理论值的理论值(估计值估计值) ,这样的计算工作,这样的计算工作量非常大,因此,统计实践中,在已知直线回归方程的情况下,通常采用下量非常大,因此,统计实践中,在已知直线回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论