单元八数据分析之现象间关系分析_第1页
单元八数据分析之现象间关系分析_第2页
单元八数据分析之现象间关系分析_第3页
单元八数据分析之现象间关系分析_第4页
单元八数据分析之现象间关系分析_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1单元八、数据分析之现象间关系分析单元八、数据分析之现象间关系分析2例子:我们身边有趣的经济现象例子:我们身边有趣的经济现象nSkirt-length Theoryn裙长理论裙长理论n裙子长度与股票走势裙子长度与股票走势n牛市还是熊市得看看女士裙子是长还是牛市还是熊市得看看女士裙子是长还是短短3以美国股市为例以美国股市为例n19201920年,裙子变短,股市上扬年,裙子变短,股市上扬n19291929年,裙子变长,股市崩盘年,裙子变长,股市崩盘n1960-19701960-1970,迷你裙当道,股市强劲,迷你裙当道,股市强劲n19701970年以后,当裙长至脚踝时,股市哀年以后,当裙长至脚踝时

2、,股市哀鸿一片鸿一片4为什么?为什么?n有理论蕴意抑或胡说八道?有理论蕴意抑或胡说八道?n解释解释1 1:与情绪有关:与情绪有关n女性流行穿短裙,意味着她们充满信心,女性流行穿短裙,意味着她们充满信心,情绪高涨,预示着事物发展的牛市心态;情绪高涨,预示着事物发展的牛市心态;n女性流行穿长裙,意味着她们内心恐惧、女性流行穿长裙,意味着她们内心恐惧、情绪低落,隐藏着事物发展的熊态特征。情绪低落,隐藏着事物发展的熊态特征。 5n解释解释2 2:与商品有关:与商品有关n经济景气时,裙子越穿越短,以展示穿经济景气时,裙子越穿越短,以展示穿在美腿上的昂贵丝袜在美腿上的昂贵丝袜n经济萧条时,裙子越穿越长,好

3、遮掩腿经济萧条时,裙子越穿越长,好遮掩腿上既破旧又廉价的丝袜上既破旧又廉价的丝袜n是裙子长度引领股市走势,还是股市引是裙子长度引领股市走势,还是股市引导时尚潮流?导时尚潮流?6n在这一章,我们将学习:在这一章,我们将学习:n什么是相关分析?什么是相关分析?n什么是回归分析?什么是回归分析?7(一(一 )相关分析概述)相关分析概述n一、函数关系与相关关系一、函数关系与相关关系n(一)函数关系(一)函数关系n严格的依存关系,即具有确定性的对应严格的依存关系,即具有确定性的对应关系,可用一个数学表达式反映出来。关系,可用一个数学表达式反映出来。n如:如:s与与rn销售额与销售量的关系销售额与销售量的

4、关系8函数关系函数关系作为影响因素的变量称自变量,用作为影响因素的变量称自变量,用x x表示;表示;发生对应变化的变量称因变量,用发生对应变化的变量称因变量,用y y表示。表示。9(二二) 相关关系相关关系n不严格的依存关系不严格的依存关系n不具有确定性的对应关系不具有确定性的对应关系n不能用函数关系精确的表达不能用函数关系精确的表达10相关关系相关关系11判断函数关系判断函数关系or相关关系相关关系n商品销售额商品销售额(y)(y)与广告费支出与广告费支出(x)(x)之间的关系之间的关系n收入水平收入水平(y)(y)与受教育程度与受教育程度(x)(x)之间的关系之间的关系n商品销售额商品销售

5、额(y)(y)与产量与产量(x)(x)的关系的关系n身高身高(y)(y)与体重与体重(x)(x)12二、相关关系的种类二、相关关系的种类n(一)按相关程度分:(一)按相关程度分:n1 1、完全相关、完全相关n2 2、不相关、不相关n3 3、不完全相关、不完全相关不相关不相关不完全相关不完全相关完全相关完全相关13(二)按相关的方向分:n1、正相关:、正相关:x增加,增加,y增加增加n x减少,减少,y减少减少n2、负相关:、负相关:x增加,增加,y减少减少n x减少,减少,y增加增加负相关负相关正相关正相关14(三)按相关的形式分n1、线性相关:、线性相关:x,y大致呈直线关系大致呈直线关系n

6、2、非线性相关:、非线性相关:x,y大致呈曲线关系大致呈曲线关系线性相关线性相关非线性相关非线性相关15(四)按所研究的变量多少分:n1、单相关:、单相关:x与与y的相关关系的相关关系n2、复相关:、复相关:x,y与与z的相关关系的相关关系n3、偏相关:、偏相关:x不变时,不变时,y与与z的相关关系的相关关系16三、相关分析与回归分析三、相关分析与回归分析n相关分析:相关分析:x与与y之间依存关系的密之间依存关系的密切程度切程度n回归分析:根据相关关系的具体形回归分析:根据相关关系的具体形态,选择一个合适的数学模型(简态,选择一个合适的数学模型(简称回归模型),来近似地表达变量称回归模型),来

7、近似地表达变量间的平均变化关系。间的平均变化关系。17(一一)两者的区别两者的区别n1、相关分析中,、相关分析中,x与与y对等,回归分析中,对等,回归分析中, y因变量,处于被解释的地位。因变量,处于被解释的地位。n2、相关分析中、相关分析中x,y均为随机变量,回归分均为随机变量,回归分析中,析中,x为确定性变量,为确定性变量,y为随机变量;为随机变量;n3、相关分析研究两个变量之间的密切程度,、相关分析研究两个变量之间的密切程度,回归分析不仅可以解释回归分析不仅可以解释x对对y的影响大小,还的影响大小,还可以用回归模型进行预测和控制。可以用回归模型进行预测和控制。 18两者的联系两者的联系n

8、1 1、相关分析是回归分析的基础和前提、相关分析是回归分析的基础和前提n2 2、回归分析是相关分析的深入和继续、回归分析是相关分析的深入和继续19(二)(二) 相关关系的判断和测度相关关系的判断和测度n一、定性分析一、定性分析n根据经济理论、专业知识和实践经验,根据经济理论、专业知识和实践经验,通过绘制相关表或相关图,判断通过绘制相关表或相关图,判断x与与y是是否存在相关关系,及相关的方向、形态否存在相关关系,及相关的方向、形态和密切程度。和密切程度。201、相关表、相关表判断广告费与年销售收入是否具有相判断广告费与年销售收入是否具有相关关系?关关系?随着广告费的增加,年销售收入基本上也随着广

9、告费的增加,年销售收入基本上也是增加的,所以两者之间存在一的正相关是增加的,所以两者之间存在一的正相关关系。关系。212、相关图(散点图)、相关图(散点图)22n简单相关系数:在直线相关条件下,表简单相关系数:在直线相关条件下,表明两个现象之间相关关系的方向和密切明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号程度的综合性指标。一般用符号r表示。表示。23yxxyr21、相关系数计算:积差法、相关系数计算:积差法的的协方差方差与与是变量是变量式中:式中:yxnyiyxixxy,)(2的标准差的标准差是是(xnxixx,)2的标准差的标准差是是ynyiyy,)(222)()(yiy

10、xixyiyxix(24化简得:化简得: 2222() )() )i iiiiiiinxyxyrnxxnyy 5165696045625980184647744384420253600324625y2合计合计10987654321序号序号265076084280949004225360017649001600225400 x266298759992886245601825可支配收入可支配收入y764478528060598065693070397553369334732604421350302400402701550020 xy消费支出消费支出x计算消费支出与可支配收入的相关系数计算消费支出与

11、可支配收入的相关系数26解:计算相关系数需算解:计算相关系数需算5个数个数7 .4310473x2 .6610662y516562iy36933iiyx265072ix99. 0)2 .661051656)(7 .431026507(2 .667 .43103693322)(2222ynyxnxyxnyxriiii说明说明x x与与y y高度线性相关高度线性相关272 2、相关系数的取值及意义、相关系数的取值及意义正相关正相关yxr,0) 3(完全相关完全相关yxr,1)2(负相关负相关yxr,0 不相关不相关yxr,0 相关程度越高相关程度越高,说明,说明越越接近于近于yxr,1)4(相关程

12、度越低相关程度越低,说明,说明越越接近于近于yxr,0 1 , 1) 1 (的取值的取值范围r282 2、相关系数的取值及意义、相关系数的取值及意义(5) |0.3称为微弱相关称为微弱相关0.3 |0.5称为低度相关称为低度相关0. |0.8称为显著相关称为显著相关0.8 |1称为高度相关或强相关称为高度相关或强相关29判断:判断:n若若r=1,说明什么?,说明什么?n若若r=0.3,说明什么?说明什么?n若若r=-0.9,说明什么?说明什么?nR=0.6与与r=-0.8哪个相关程度更大?哪个相关程度更大?30课堂练习课堂练习n计算公司每年的投资和利润的简单相关系数。计算公司每年的投资和利润的

13、简单相关系数。年度年度投资(万元)投资(万元)利润(万元)利润(万元)1382453674720合计合计204031(三)(三) 回归分析回归分析一、回归分析的定义一、回归分析的定义(X变大一倍时,变大一倍时,Y大概会变化多少呢?)大概会变化多少呢?)回归分析中,用来表达变量之间的关系的回归分析中,用来表达变量之间的关系的数学形式就叫数学形式就叫“模型模型”,也叫,也叫“回归方回归方程式程式”。如:。如:Y=3+2X“回归回归”是一种根据自变量(解释变量)是一种根据自变量(解释变量)来解释来解释/预测因变量(被解释变量)的方预测因变量(被解释变量)的方法。法。32n为什么这种方法叫为什么这种方

14、法叫“回归回归”呢?呢?33Regress“往回走往回走”n高尔顿爵士(高尔顿爵士(1822-1911)被誉为现代回)被誉为现代回归和相关技术的创始人。归和相关技术的创始人。n他在研究父母的身高对儿女身高的影响时发他在研究父母的身高对儿女身高的影响时发现,如果父母的身高超出人群身高的平均值,现,如果父母的身高超出人群身高的平均值,儿女的身高通常也会超出人群平均身高,但儿女的身高通常也会超出人群平均身高,但不像父母超出的那么多。高尔顿把这种现象不像父母超出的那么多。高尔顿把这种现象称为称为“向人群平均身高的回归向人群平均身高的回归”。n于是这种说法就被用在这种统计方法上了。于是这种说法就被用在这

15、种统计方法上了。34二、回归模型的类型二、回归模型的类型回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性回线性回归归非线性非线性回归回归35 因变量的估计值;因变量的估计值; x x 自变量;自变量; a a 回归直线在回归直线在y y轴上的截距;轴上的截距; b b 回归直线的斜率,称回归系数回归直线的斜率,称回归系数, , 表明表明x x每增加一个单位,因变量每增加一个单位,因变量y y的的 平均变化值平均变化值 b0 b0,x x与与y y为正相关为正相关 b0 b0,x x与与y y为负相关为负相关三、一元线性回归模型三、一元线性回归模型1、模型

16、的建立、模型的建立bxayy 36例如例如:n研究收入(研究收入(x x)对消费()对消费(y y)的)的影响,获得如下的回归模型:影响,获得如下的回归模型:xy75. 045037n(1)截矩项,表示当)截矩项,表示当x=0时,时,y的期望值。在的期望值。在这里,它表示平均每人固定的最低消费水平。这里,它表示平均每人固定的最低消费水平。n(2)斜率为)斜率为0.75,表示收入每增加一元,人们,表示收入每增加一元,人们会将其中的会将其中的75%花在消费上。花在消费上。n(3)当月收入为)当月收入为5000元时,消费水平的期望元时,消费水平的期望值为值为4200。但是,实际观察时,对于月收入为。

17、但是,实际观察时,对于月收入为5000元的人群而言,其消费,有的可能为元的人群而言,其消费,有的可能为3200元,有的可能为元,有的可能为4200元,有的可能为元,有的可能为4600,它,它是一个随机变量。是一个随机变量。382、模型中参数的确定、模型中参数的确定最小二乘法(最小二乘法(ordinary least squareordinary least square)OLSOLS估计误差估计误差残差差)(回归值回归值估计值估计值预测值预测值实际值实际值/y -y/y ymin)y -(y2bxayxymin2yy40求偏导数方法,得到以下联立方程组:求偏导数方法,得到以下联立方程组:iix

18、bnay2iiiixbxayxxbyaxnxyxnyxbiii22解得解得41建立一元线性回归模型的步骤:建立一元线性回归模型的步骤: 确定自变量确定自变量x x和因变量和因变量y y; 计算计算 代入公式,先求代入公式,先求b b,再求,再求a a。iiiyxxyx,25165696045625980184647744384420253600324625x2合计合计10987654321序号序号66298759992886245601825可支配收入可支配收入764478528060598065693070397553369334732604421350302400402701550020

19、xy消费支出消费支出消费支出与可支配收入的回归模型消费支出与可支配收入的回归模型yx43xbay ,建立回归模型建立回归模型消费支出为消费支出为解:设可支配收入为解:设可支配收入为yx36933iiyx516562ix3 .47y2 .66x364. 02 .6672. 03 .47xbya72. 02 .6610516563 .472 .661036933222xnxyxnyxbiiixy72. 0364. 0回归模型为:回归模型为:44分析:分析:(25,20)xy72. 0364. 0453、回归参数、回归参数b与相关系数与相关系数r的关系的关系2222()()iiiix ynxyrxn

20、xyny22xnxyxnyxbiii22iiix ynxybxnx()222222()()()iiibxnxxnxyny2222iibxnxyny2222()/iibxnxynyn()/nxybxybr rb 与 的符号相同464、估计标准误差、估计标准误差y实际值实际值y 估计值估计值yy估计误差估计误差2) (2nyys估计标准误差估计标准误差010:srsrrs时,时,最大;最大;时,时,的呈反向关系的呈反向关系与与47补充:估计标准误差的计算补充:估计标准误差的计算2) (2nyys估计标准误差估计标准误差计算计算,再带入,再带入方法一:可以先求出方法一:可以先求出2) (2nyysy

21、计算计算,利用公式,利用公式方法二:不需方法二:不需要求出求出22) (222nxbyanynyysyii48课堂练习:某公司每年的投资和利课堂练习:某公司每年的投资和利润如下润如下计算:建立投资与利润的回归模型计算:建立投资与利润的回归模型 预测当投资为预测当投资为10万元时,利润是多少?万元时,利润是多少? 估计标准误差估计标准误差年度年度投资(万元)投资(万元)利润(万元)利润(万元)1382453674720合计合计2040建立消费支出与可支配收入的回归模型建立消费支出与可支配收入的回归模型序号序号消费支出消费支出可支配收入可支配收入12025215183406043045542626

22、6088765928709995375107898合合计计789850bxayxymin2yy51四、四、 多元线性回归模型多元线性回归模型( (了解了解) ) 以二元线性回归模型为例以二元线性回归模型为例52 估计值;估计值; a 截距;截距; b 偏回归系数;偏回归系数; b1:假定:假定x2不变时,不变时,x1每变动每变动1个单位个单位 引起的引起的y的增量;的增量; b2 :假定:假定x1不变时,不变时,x2每变动每变动1个单位个单位 引起的引起的y的增量。的增量。1、模型的建立、模型的建立y 2211xbxbay53例如例如: 一家百货公司商品销售额一家百货公司商品销售额y y(万元)受哪些因素影响呢?(万元)受哪些因素影响呢?该地区的人口数该地区的人口数x1x1(万人)(万人)人均收入人均收入x2(x2(元元) )2102. 034. 182.38xxy542、模型中参数的确定、模型中参数的确定最小二乘法(最小二乘法(ordinary least squareordinary least square)OLSO

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论