




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章第七章 相关分析相关分析 第1页/共53页第一节第一节 相关分析的意义和任务相关分析的意义和任务 一、相关关系的概念一、相关关系的概念( (注意相关关系与函数关系的区别注意相关关系与函数关系的区别) ) ( (一一) ) 函数关系函数关系 它它反映着现象之间存在着严格的依存关系,也反映着现象之间存在着严格的依存关系,也就是具有就是具有确定性的对应关系确定性的对应关系,这种关系可用一个,这种关系可用一个数学表达式反映出来。数学表达式反映出来。 例例如某种商品的销售额和销售量之间,如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的由于价格因素,所以两者可表现为严格的依存关系
2、。依存关系。第2页/共53页( (二二) ) 相关关系相关关系 它它反映着现象之间的数量上不严格的依存关系,反映着现象之间的数量上不严格的依存关系,也就是说两者之间也就是说两者之间不具有确定性的对应关系不具有确定性的对应关系,这种关,这种关系有二个明显特点:系有二个明显特点:1.1.相关关系是相关关系是现现象之间确实存在数量上的依存关系,象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的即某一社会经济现象变化要引起另一社会经济现象的变化;变化;2.2.现现象之间的这种依存关系是不严格的,即无法用象之间的这种依存关系是不严格的,即无法用数学公式表示。数学公式表示。第3
3、页/共53页商品价格和商品销售量之间,存在着一商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品定的依存关系,即商品价格发生变动,商品的销售量也会随之发生变动。的销售量也会随之发生变动。 在在具有相互依存关系的两个变量中,作为具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用根据的变量称自变量,一般用X X表示;发生对表示;发生对应变化的变量称因变量,一般用应变化的变量称因变量,一般用y y表示。表示。例例第4页/共53页二、相关关系的种类二、相关关系的种类 第5页/共53页(一)(一)按按相关关系涉及的因素多少来分,可相关关系涉及的因素多少来分,可分为:单相关
4、和复相关分为:单相关和复相关。 在实际工作中,如存在多个自变量,可抓住其在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另一些中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为因素不变,这时复相关可转化为偏相关偏相关。(了解)。(了解)二因素之间的相关关系称二因素之间的相关关系称单相关单相关,即只涉及,即只涉及一个自变量和一个因变量一个自变量和一个因变量。三个或三个以上因素的相关关系称三个或三个以上因素的相关关系称复相关复相关,或,或多元相关,即涉及二个或二个以上的自变量和因变多元相关,即涉及二个或二个以上的自变量和因变量量。第6页/共53页
5、(二)(二) 按按相关关系的形式来分,可分为:相关关系的形式来分,可分为: 直线相关和曲线相关直线相关和曲线相关 直线相关直线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数的数值发生变动时,因变量值发生变动时,因变量y y随之发生近似于固定比例的变随之发生近似于固定比例的变动,在相关图上的散点近似地表现为直线形式,因此称动,在相关图上的散点近似地表现为直线形式,因此称其为直线相关关系。其为直线相关关系。 曲线相关曲线相关是指两个相关现象之间,当自变是指两个相关现象之间,当自变量量X X的数值发生变动时,因变量的数值发生变动时,因变量y y也随之发生变也随之发生变动,
6、但这种变动在数值上不成固定比例,在相动,但这种变动在数值上不成固定比例,在相关图上的散点可表现为抛物线、指数曲线、双关图上的散点可表现为抛物线、指数曲线、双曲线等形式,因此称其为曲线相关关系。曲线等形式,因此称其为曲线相关关系。第7页/共53页(三)(三)按按相关关系的性质来分,可分为相关关系的性质来分,可分为: : 正相关和负相关正相关和负相关正相关正相关是指两相关现象变化的方向是一致的。是指两相关现象变化的方向是一致的。负相关负相关是指两相关现象变化的方向是相反的。是指两相关现象变化的方向是相反的。第8页/共53页(四)(四) 按按相关程度分,可分为:相关程度分,可分为: 完全相关、不完全
7、相关和不相关完全相关、不完全相关和不相关 完全相关完全相关就是相关现象之间的关系是完全确定的就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。关系,因而完全相关关系就是函数关系。 不相关不相关是指两现象之间在数量上的变化上各自独是指两现象之间在数量上的变化上各自独立,互不影响。立,互不影响。 不完全相关不完全相关就是介于完全相关和不相关之间的一就是介于完全相关和不相关之间的一种相关关系。相关分析的对象主要是不完全相关关种相关关系。相关分析的对象主要是不完全相关关系。系。第9页/共53页三、相关分析三、相关分析的主要内容的主要内容 相关分析的主要内容,概括起来是五个方面:相关
8、分析的主要内容,概括起来是五个方面:(一)(一)确定现象之间有无关系,以及相关确定现象之间有无关系,以及相关关系的表现形式关系的表现形式;(二)(二) 确确定相关关系的密切程度;定相关关系的密切程度;(三)选择合适的数学模型(三)选择合适的数学模型;(四)测定变量估计值的可靠程度;(四)测定变量估计值的可靠程度;(五)对计算出的相关系数,进行显著检验。(五)对计算出的相关系数,进行显著检验。第10页/共53页第二节第二节 简单线性相关分析简单线性相关分析 一、相关表和相关图一、相关表和相关图相关图,也称散布图相关图,也称散布图( (或散点图或散点图) )。 简简单单相相关关表表 根根据据总总体
9、体单单位位的的原原始始资资料料汇汇编编的的相相关关表表分分组组相相关关表表 将将原原始始资资料料进进行行分分组组而而编编制制的的相相关关表表单单变变量量分分组组表表 按按自自变变量量分分组组 双双变变量量分分组组表表 按按自自变变量量和和因因变变量量均均分分组组第11页/共53页某市某市19981998年年 2005 2005年的工资性现金支出与城镇储蓄存年的工资性现金支出与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。款余额的资料,说明简单相关表和相关图的编制方法。(简单相关表)(简单相关表) 序号序号年份年份工资性工资性现金支出现金支出(万元万元)x城镇储蓄存城镇储蓄存款余额款
10、余额(万万元元)y11998 50012021999 54014032000 62015042001 73020052002 90028062003 97035072004 105045082005 1170510例例1 1第12页/共53页50100150200250300350400450500550400500600700800900100011001200工资性现金支出( 万元)城镇储蓄存款余额(万元)第13页/共53页企业按销售额分组企业按销售额分组(万元万元)流通费用率流通费用率(%)4以下以下9.65 4 87.68 8 127.2512 167.0016 206.8620 24
11、6.7324 286.6428 326.6032 366.5866.577.588.599.51004812162024283236销售额(万元)流通费用率(%)例例2 2(分组相关表)(单变量分组相关表)(分组相关表)(单变量分组相关表)(双变量分组相关表(双变量分组相关表:表表7-4p351)第14页/共53页二、二、相关系数的测定与应用相关系数的测定与应用 相关系数相关系数是在直线相关条件下,表明两是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综个现象之间相关关系的方向和密切程度的综合性指标。一般用符号合性指标。一般用符号r r表示。表示。第15页/共53页r r的测定方
12、法:的测定方法:2222221 ()()11 () ()()() ()()()xyxyxyxyrxxyynxxyynnxxyyrxxyy 一一 积积差差法法:第16页/共53页仍以上例1 1资料计算:序序号号年年份份x(万元万元)y(万元万元)11998 500120-310-155 96100 240254805021999 540140-270-135 72900 182253645032000 620150-190-125 36100 156252375042001 730200 -80 -75 6400 5625 600052002 900280 90 5 8100 25 450620
13、03 970350 160 75 25600 562512000720041050450 240175 57600 3062542000820051170510 360235129600 5522584600合计合计6480 2200-432400155000 253300yyxx2yy 2xxyy xx第17页/共53页经过计算,表明该市工资性现金支出与城镇储经过计算,表明该市工资性现金支出与城镇储蓄存款余额之间存在着高度正相关。蓄存款余额之间存在着高度正相关。98. 0155000432400253300)()()()(27582200 ),(8108648022yyxxyyxxrnyyn
14、xx万元万元第18页/共53页(二)相关系数简捷计算方(二)相关系数简捷计算方法法 2222)()()( yynxxnyxxynr第19页/共53页资料计算如下: 序号序号年份年份x(万元万元)y(万元万元)x2y2xy11998 500120 250000 14400 6000021999 540140 291600 19600 7500032000 620150 384400 22500 9300042001 730200 532900 4000014600052002 900280 810000 7840025200062003 970350 9409001225003395007200
15、410504501102500202500472500820051170510 1368900260100596700合计合计6480 2200 5681200760000 2035300第20页/共53页 980111418592026400220076000086480568120082200648020353008 222222. yynxxnyxxynr第21页/共53页r rr rr rr r0.30.3时时,没没有有关关系系;0.30.3 0.50.5时时,称称低低度度相相关关;0.50.5 0.80b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负相关
16、第28页/共53页 a a、b b的确定:的确定:在在简单直线回归方程中,简单直线回归方程中,a a、b b为待定系数,常用最为待定系数,常用最小平方法来确定,即小平方法来确定,即(y-y(y-yc c) )2= =最小值。最小值。2ynabxxyaxbx 即即22()nxyxybnxxyxabnn 第29页/共53页简单直线回归方程建立的步骤为:简单直线回归方程建立的步骤为: 确确定自变量定自变量x x和因变量和因变量y y; 计计算算x x2、xyxy、xx、yy、xx2、xyxy; 代代入公式,先求入公式,先求b b,再求,再求a a。2.2.简单直线回归方程的计算简单直线回归方程的计算
17、第30页/共53页仍用上例仍用上例1 1资料得到:资料得到: y yc c = -199.5 + 0.5858x= -199.5 + 0.5858x表明该市工资性现金支出每增加表明该市工资性现金支出每增加1 1万元,储万元,储蓄存款余额就增加蓄存款余额就增加0.58580.5858万元。万元。第31页/共53页举例说明b(b(回归系数) )在经济管理中的作用: 某企业的某种产品月产量与单位成本的关系呈某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是:直线关系,用直线回归方程表示是: y yc c=77.36-1.818x=77.36-1.818x,其中,其中, x x表示
18、月产量表示月产量( (千件千件) ) y y表示单位成本表示单位成本( (元元);); a=77.36( a=77.36(元元) ),表示生产这种产品在单位,表示生产这种产品在单位成本方面的条件;成本方面的条件; b=-1.818b=-1.818,表示月产品每增加,表示月产品每增加10001000件,件,单位成本平均降低单位成本平均降低1.8181.818元。元。 第32页/共53页( (三)判定系数(三)判定系数(p361-364p361-364)判定系数是测定回归方程拟合优度的一个重要指标。判定系数是测定回归方程拟合优度的一个重要指标。222cir (y -y)回归偏差(回归解释的变异)总
19、偏差(总变异)(y -y)222222nxyxyrnxxnyy 简捷公式:第33页/共53页(四)估计标准误差(四)估计标准误差 估计标准误差的概念和作用估计标准误差的概念和作用估计标准误差估计标准误差就是用来说明回归方程就是用来说明回归方程推算结果的准确程度的统计分析指标。以绝推算结果的准确程度的统计分析指标。以绝对值表示,其数值越小,说明推算结果的准对值表示,其数值越小,说明推算结果的准确程度越高,回归直线的代表性也越大。确程度越高,回归直线的代表性也越大。用用S Syxyx表示,也可用表示,也可用S Sy y表示。表示。第34页/共53页估计标准误差的两种计算方法估计标准误差的两种计算方
20、法 2yS 2. 2yaybxyn 根根据据a,ba,b两两个个参参数数值值计计算算估估计计标标准准误误差差:1. 根据因变量实际值和估计值的离差计算根据因变量实际值和估计值的离差计算:22 nyyScy)(第35页/共53页仍用前例资料计算S Sy y:)(22.33 2820353005858. 02200) 5 .199(760000万元yS%08.1227522.33误差率第36页/共53页(五)线性回归方程的显著性检验(了解,(五)线性回归方程的显著性检验(了解,p365-367)第37页/共53页二、多元线性回归分析二、多元线性回归分析 多多元线性回归分析可以看作是一元线元线性回归
21、分析可以看作是一元线性回归分析的扩展。现以二元线性回归模性回归分析的扩展。现以二元线性回归模型进行回归分析,其方程式为:型进行回归分析,其方程式为:(一)多元线性回归方程(一)多元线性回归方程第38页/共53页2211xbxbayc 12bbcya为因变量估计值, 、 、为参数,三个规范方程如下: 2211xbxbnay 21221111xxbxbxayx 22221122xbxxbxayx第39页/共53页 以我国以我国1973197319831983年年1111年手表价格和手表销售量年手表价格和手表销售量的实际资料为例,拟合一元线性回归方程为:的实际资料为例,拟合一元线性回归方程为: y
22、yc c= 9643 - 65x= 9643 - 65x此时,回归系数此时,回归系数b b表明,手表平均价格每降低表明,手表平均价格每降低1 1元元/ /只,只,销售量约平均增长销售量约平均增长6565万只。一元线性回归模型只列入万只。一元线性回归模型只列入了手表平均价格对销售量的影响,而忽略了居民收入了手表平均价格对销售量的影响,而忽略了居民收入这一很重要的因素,因此,现对此资料补入同期居民这一很重要的因素,因此,现对此资料补入同期居民人均货币收入资料,将原来的一元线性回归模型扩展人均货币收入资料,将原来的一元线性回归模型扩展为二元线性回归模型进行回归分析。为二元线性回归模型进行回归分析。例
23、例第40页/共53页列成计算表如下:年份年份(n=11)手表销售量手表销售量y(万只万只)人均货人均货币收入币收入x1(元元)手表平手表平均价格均价格x2(元元/只只)x1yx2yx1x21973 650.4102.113466405.8487153.613681.41974 758.4105.313479859.52101625.614110.21975 819.9110.112990270.99105767.114202.91976 1051.7113.9131119788.63137772.714920.91977 1149.7120.4127148423.88146011.915290
24、.81978 1388.1131.0125181841.10173512.516375.01979 1944.4157.0123305270.80239161.219311.01980 2534.0193.5123490329.00311682.023800.51981 2890.0210.2114607478.00329460.023962.81982 3576.0228.7 89817831.20318264.020354.31983 3898.0258.7 861008412.60335228.022248.2合计合计20660.61730.9562285638
25、.6198258.0第41页/共53页年份年份(n=11)197310 424.4117 956197411 088.0917 956197512 122.0116 641197612 973.2117 161197714 496.1616 129197817 161.0015 625197924 649.0015 129198037 442.2515 129198144 184.0412 996198252 303.697 921198366 925.697 396合计合计303 769.55160 03921x22x续表续表第42页/共53页21212121210328. 86368.18
26、0641.940328. 86368.180641.9416003919825813156 .228563819825855.3037699 .173056.390591113159 .1730116 .20660 xxybbabbabbabbac第43页/共53页b b1 1表明在手表平均价格固定时,人均货币收入每增表明在手表平均价格固定时,人均货币收入每增加元,手表销售量平均增长加元,手表销售量平均增长18.636818.6368万只;万只;b b2 2表明在人均货币收入固定时,手表平均价格每上表明在人均货币收入固定时,手表平均价格每上升元升元/ /只,手表销售量平均减少只,手表销售量平均
27、减少8.03288.0328万只。万只。这里的这里的b b2 2比原一元线性回归模型中的同一回归系数比原一元线性回归模型中的同一回归系数b=-65b=-65要大得多,是因为一元线性回归模型只列入了手表要大得多,是因为一元线性回归模型只列入了手表平均价格对销售量的影响而忽略了居民收入这一很重要平均价格对销售量的影响而忽略了居民收入这一很重要的因素,在手表平均价格的影响中渗入了居民收入的影的因素,在手表平均价格的影响中渗入了居民收入的影响。响。210328. 86368.180641.94xxyc第44页/共53页上面的方法推广到多个自变量,其回归方程为:上面的方法推广到多个自变量,其回归方程为:
28、21122331122211112121222112222112211 cnnnnnnnnnnnnnnyab xb xb xb xnnynabxbxbxx yaxbxbx xbx xx yaxbx xbxbx xx yaxbx xbx xbx L LL LL LL LM ML L因因有有个个参参数数,应应确确定定个个方方程程式式:第45页/共53页( (二)多元线性回归模型的判定系数和估计标准误差二)多元线性回归模型的判定系数和估计标准误差(了解,(了解,p370-371p370-371)第46页/共53页 拟合方法拟合方法:统计上通常采用变量代换法把:统计上通常采用变量代换法把非线性形式转换为线性形式处理,使线性非线性形式转换为线性形式处理,使线性回归分析的方法也能适用于非线性回归问回归分析的方法也能适用于非线性回归问题的研究。题的研究。第四节第四节 曲线回归分析曲线回归分析 第47页/共53页一、指数曲线回归模型(一、指数曲线回归模型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 车辆保险代理与理赔服务合作协议
- 教育论文和教学论文的区别是什么
- 限制性股票的定义
- 2025-2030中国浮鱼饲料行业销售态势与竞争策略分析报告
- 电影产业的全球化与本地化融合研究-洞察阐释
- 跨境食品物流挑战-洞察阐释
- 货运代理行业国际合作与竞争策略-洞察阐释
- 2025-2030中国旅游综合体行业运营态势及经营效益预测报告
- 2025-2030中国建筑涂料添加剂行业应用状况与供需趋势预测报告
- 2025-2030中国工业气体行业发展态势及经营效益预测报告
- 变电工程施工合同协议书
- 电工技术-北京科技大学中国大学mooc课后章节答案期末考试题库2023年
- 星海音乐学院乐理试题A卷
- 2019年4月27日山东省纪委监委遴选公务员考试真题及答案
- ktv包房服务员岗位职责8篇
- 西安某大跨度钢桁架人行天桥结构设计分析
- 新疆全部及全国部分加气站分布情况6
- 初中学段劳动任务清单(七到九年级)
- 2023年中国各地磁偏角
- 六维领导力专题知识
- 【护士资格考试】云南省精神病医院模拟检测练习题
评论
0/150
提交评论