统计学相关与回归分析法-文档资料_第1页
统计学相关与回归分析法-文档资料_第2页
统计学相关与回归分析法-文档资料_第3页
统计学相关与回归分析法-文档资料_第4页
统计学相关与回归分析法-文档资料_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第九章第九章 相关与回归分析法相关与回归分析法2第九章第九章 相关与回归分析相关与回归分析法法3第一节第一节 相关与回归分析概述相关与回归分析概述相关和回归分析是研究事物的相互关系、相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是构造各具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、种经济模型、进行结构分析、政策评价、预测和控制的重要工具。预测和控制的重要工具。4 一种商品的销售收入与其销售量:一种商品的销售收入与其销售量: 销售收入销售收入=销售量销售量 商品价格商品价格PQG

2、 家庭收入与恩格尔系数:家庭收入与恩格尔系数: 家庭收入高,则恩格尔系数低。家庭收入高,则恩格尔系数低。相关关系相关关系一、相关关系与相关分析5678现象之间的相互联系,在许多情况下表现现象之间的相互联系,在许多情况下表现为一定的因果关系,将这些现象数量化则为一定的因果关系,将这些现象数量化则成为变量:成为变量:自变量自变量X因因变量变量Y94.按涉及变量的多少分为按涉及变量的多少分为按相关的形式不同分为按相关的形式不同分为按相关的方向不同分为按相关的方向不同分为直线相关直线相关曲线相关曲线相关负相关负相关正相关正相关按相关的程度不同分为按相关的程度不同分为完全相关完全相关不完全相关不完全相关

3、不相关不相关复相关复相关单相关单相关10相关分析相关分析11回归分析回归分析二、回归与回归分析12按回归方程的形式分为按回归方程的形式分为直线回归直线回归曲线回归曲线回归按自变量的个数分为按自变量的个数分为复回归复回归简单回归简单回归13q有共同的研究对象:现象之间的相关关系;有共同的研究对象:现象之间的相关关系;q互相补充:互相补充:相关分析要依靠回归分析表明现相关分析要依靠回归分析表明现象数量相关的具体形式;而回归分析要依靠相象数量相关的具体形式;而回归分析要依靠相关分析来表明现象数量的相关程度。只有变量关分析来表明现象数量的相关程度。只有变量之间存在着高度相关时,进行回归分析寻求其之间存

4、在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。相关的具体形式才有意义。三、相关分析与回归分析的关系14q相关分析不必确定自变量和因变量,所涉相关分析不必确定自变量和因变量,所涉及的都是随机变量;回归分析事先要确定自及的都是随机变量;回归分析事先要确定自变量和因变量,只有因变量为随机变量。变量和因变量,只有因变量为随机变量。q内容上:相关分析研究相关的方向和程度,内容上:相关分析研究相关的方向和程度,不能指出相关的具体形式,无法从一个变量不能指出相关的具体形式,无法从一个变量的变化推测另一个变量的变化;而回归分析的变化推测另一个变量的变化;而回归分析研究变量之间相互关系的具体形式,可

5、根据研究变量之间相互关系的具体形式,可根据回归模型从已知量估计和预测未知量。回归模型从已知量估计和预测未知量。q方法上:相关分析通过编制相关表、绘制方法上:相关分析通过编制相关表、绘制相关图、计算相关系数;回归分析通过建立相关图、计算相关系数;回归分析通过建立回归模型。回归模型。1516定性分析定性分析定量分析定量分析第二节第二节 简单线性相关分析简单线性相关分析1718企业编号企业编号月产量(千吨)月产量(千吨)X生产费用(万元)生产费用(万元)Y123456781.22.03.13.85.06.17.28.0628680110115132135160八个同类工业企业的月产量与生产费用八个同

6、类工业企业的月产量与生产费用19平均每昼平均每昼夜产量夜产量 固定资产原值固定资产原值35404045455050555560606565706006501 15506001235005502134505001517400450224350400030035022223543120(百万元)(百万元)(吨)(吨)YfXf20个同类工业企业固定资产原值与平均每昼夜产量个同类工业企业固定资产原值与平均每昼夜产量20正正 相相 关关负负 相相 关关曲线相关曲线相关不不 相相 关关xyxyxyxy又称又称,用直角坐标系的,用直角坐标系的x轴代表自变量,轴代表自变量,y轴代表因变量,将两个变量间相对应的

7、变量轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。点分布状况的图形。21在在的条件下,用以反映的条件下,用以反映两变量两变量间间密切程度的统计指标,用密切程度的统计指标,用r表示表示)(22222积差法yyxxyyxxnyynxxnyyxxryxxy22 xyLyxnxyyyxx1)(令xxLxnxxx222)(1)(yyLynyyy222)(1)(yyxxxyLLLr:则 2222)()(yynxxnyxxynryxnynxnxyyxyxxy23相关系数相关系数r r的取值范围:的取值范围:r0 为正相关,

8、为正相关,r 0 为负相关;为负相关;|r|=0 表示不存在表示不存在关系;关系;|r|1 表示完全表示完全相关;相关; |r| 0.3 为微弱相关为微弱相关(基本无关基本无关); 0.3 |r| 0.5为低度相关;为低度相关; 0.5 |r| 0.8为显著相关为显著相关(中度相关中度相关) ; 0.8 |r| 1.0为高度相关为高度相关(强相关强相关) 。24相关系数的取值及其意义图示25序号序号能源消耗量能源消耗量(十万吨)(十万吨)x工业总产值工业总产值(亿元)(亿元)yx2y2xy12345678910111213141516353840424952545962646568697172

9、76242524283231374041404750495148581225144416001764240127042916348138444096422546244761504151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计合计91662555086261753788726能 源 消 耗 量807060504030工业总产值605040302027()9757. 0=625-261

10、7516916-5508616625916-3788716=)(-=26175=,55086=,37887=,625=,916=,16=22222222yynxxnyxxynryxxyyxn解:已知结论:结论:工业总产值与能源消耗量之间存工业总产值与能源消耗量之间存在高度的正相关关系。在高度的正相关关系。28回归分析回归分析指根据变量之间相关关系的指根据变量之间相关关系的具体形态,建立一个数学方具体形态,建立一个数学方程(回归方程)来描述变量程(回归方程)来描述变量之间关系;对给定的之间关系;对给定的自变量自变量x x,揭示,揭示因变量因变量y y在数量上的在数量上的平均变化并求得因变量的预平

11、均变化并求得因变量的预测值的统计分析方法。测值的统计分析方法。第三节第三节 简单线性回归分析简单线性回归分析29XY为随机误差项为模型参数,与式中:XYEY30)(YEXXY截距截距斜率斜率一元线性回归方程的可能形态一元线性回归方程的可能形态 为正为正 为负为负 为为031XYEYbxay以样本统计量估计总体参数以样本统计量估计总体参数斜率(回归系数)斜率(回归系数)截距截距截距截距a 表示在自变量表示在自变量x为为0时,其它各种因素时,其它各种因素对因变量对因变量y的平均影响;的平均影响;回归系数回归系数b 表明自变表明自变量量x每变动一个单位,因变量每变动一个单位,因变量y平均变动平均变动

12、b个个单位。单位。32iiiiiybxayyyxbxay)(值应为的实际而变量之间的平均变动关系,变量与是理论模型,表明3310名学生的身高与体重散点图10名学生的身高与体重散点图40404545505055556060656570707575158158163163168168173173178178身高(X )身高(X )体重(Y )体重(Y )bxayxbay残差:残差:e34bxay最小平方法最小平方法基本数学要求:基本数学要求:min)(02yyyy02012min,min) (22xbxaybxaybabxayyy,有求偏导数,并令其为零、分别对函数中,有由352xbxaxyxbn

13、ayxbynxbnyayxxyLLxxnyxxynbxxxxy222)(369757. 0=r,55086,37887,625,916,162xxyyxn由计算表知bxay375142. 6169167961. 0166257961. 091655086166259163788716222 xbyaxxnyxxynbxy7961.05142.6380 xbxayyxxy7961.05142.6对于若若 x = 80(十万吨),则:(十万吨),则:亿元1738.57807961. 05142. 6y39 r0 r0 r=0b0 b0 b=0 xyyxrbbr;4010名学生的身高与体重散点图10

14、名学生的身高与体重散点图40404545505055556060656570707575158158 160160 162162 164164 166166 168168 170170 172172 174174 176176 178178身高(X )身高(X )体重(Y )体重(Y )yy yyyyyy2)(yySST2) (yySSE2) (yySSR误差平方和误差平方和回归回归平方和平方和总离差平方和总离差平方和41) ()(yyyyyy22) ()()(yyyyyy) )(2) ()(22yyyyyyyy0)() )(exbxebexbabxayyyy222) ()()(yyyyyyQ

15、yyUyyLyyyy222) (,)(,)(令QULyy:则总离差平方和的分解:总离差平方和的分解:42222)/()(nynyyyLSSTyy xyyyyybLLULbxayQSSE2)()()()()() ()(2222222xxnnyxxynbLLLLbxxbxbabxayyUSSRxyxxxxxy43102 r判定系数取值范围:判定系数取值范围:222)()(yyyyLUryy判定系数是评价回归方程拟合优度的指判定系数是评价回归方程拟合优度的指标,可以说明回归方程的代表性大小。标,可以说明回归方程的代表性大小。44判定系数与相关系数的关系判定系数与相关系数的关系2)(rbr的符号22)

16、(yyxxxyyyxyxxxyyyxyyyLLLLLLLLbLLUr45无方向性,无方向性,则有方向,则有方向,其方向与样本回归系数其方向与样本回归系数 b 相同;相同;说明变量值的总离差平方和中说明变量值的总离差平方和中可以用回归线来解释的比例,主要用于评可以用回归线来解释的比例,主要用于评价回归方程的拟合优度;价回归方程的拟合优度;只说明只说明两变量间关联程度及方向,主要用于评价两变量间关联程度及方向,主要用于评价两变量间线性关系的密切程度。两变量间线性关系的密切程度。46是因变量各实际值与其估计值之间的是因变量各实际值与其估计值之间的平均差异程度,表明其估计值对各实平均差异程度,表明其估

17、计值对各实际值代表性的强弱;其值越小,回归际值代表性的强弱;其值越小,回归方程的代表性越强,用回归方程估计方程的代表性越强,用回归方程估计或预测的结果越准确。或预测的结果越准确。22) (22nxybyaynyySe47亿元,且知解:已知457.227961.0,5142.626175,37887,625,1622nxybyaySbayxyynenxybyaynyySe22) (48222)() (11yyyyLQLUryyyy2221yeSSr2) (2nyy1)(2nyy491、在因变量的总离差平方和中,如果回归、在因变量的总离差平方和中,如果回归平方和所占比重大,剩余平方和所占比平方和所占比重大,剩余平方和所占比重小,则两变量之间(重小,则两变量之间( )A. 相关程度高相关程度高B. 相关程度低相关程度低C. 完全相关完全相关D. 完全不相关完全不相关课堂练习题:501、某商业企业、某商业企业20002004年五年内商品销售额的年

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论