第十章回归分析_第1页
第十章回归分析_第2页
第十章回归分析_第3页
第十章回归分析_第4页
第十章回归分析_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

··············xy第十章相关分析与一元线性回归分析第一节相关分析和回归分析概述第二节相关分析第三节一元线性回归分析本章内容第一节相关分析和回归分析概述一、相关关系的概念及特点相关关系:客观现象之间存在的互相依存的不确定性关系。2.特点:(1)现象之间确实存在着数量上的依存关系;(2)现象之间数量上的关系是不确定、不严格的依存关系。图10.1相关关系分类示意图二、相关关系的分类相关分析就是对变量之间相关关系的描述与度量。其基本内容包括:1、直观地判断变量之间是否存在相关关系及其相关关系的具体形式。一般是通过绘制统计图表来实现,这也是相关分析的出发点。2、定量地刻画变量之间相关关系的程度或强度。线性相关关系一般是通过相关系数来说明,非线性相关关系可以通过相关指数来说明,这是相关分析的中心内容。3、相关系数的显著性检验。在实际进行相关分析时,相关系数都是利用样本数据计算的,因而带有一定的随机性。因此,也需要进行显著性检验。三、相关关系的内容

相关表一相关图二相关系数三第二节相关关系的测定

一、相关分析与回归分析相关分析:是用相关系数去表现现象间相关关系的方向和密切程度。回归分析:根据相关关系的形态,选择一个合适的数学模型(称为回归方程式),来近似地表示变量间的平均变化关系的一种统计分析方法。二、相关表与相关图相关表:相关表是一种反映变量之间相关关系的统计表。相关表的编制,一般以x为自变量,y为因变量,把每个自变量与其相应的因变量在表格中一一对应地排列。通过相关表可以初步看出相关关系的形式、密切程度和相关方向。相关图:又称散点图、散布图(Scatterdiagram),它是将相关表中的观测值在平面直角坐标系中用坐标点描绘出来,以表明相关点的分布状况。通过相关图,可以大致看出两个变量之间有无相关关系以及相关的形态、方向和密切程度。单变量分组相关表按耕作深度分组(厘米)亩数(亩)平均亩产量(公斤)12432014634316153531810378204400221420合计40361表是将40亩地的耕作深度与亩产量数据按耕作深度进行分组后所形成的单变量分组相关表,分组后各耕作深度对应着一定的次数(即亩数),而产量为相应亩数上的平均产量。从表中可以看出,平均亩产量随着耕作深度的增加有增加的趋势,是一种正相关。表双变量分组表营业额y(万元)营业员x合计1—33—55—77—99—116—7---1675—6--244104—5-245-113—4214--72—312---31—22----2合计5510101040表则是将40家便民店按营业人员数(自变量)和营业额(因变量)同时进行分组而形成的双变量分组相关表。从表中数据可以看出,营业额随着营业员的增加有增加的趋势,也是一种正相关。图10.2强正相关

图10.3弱正相关图10.4强负相关图10.5弱负相关图10.6非线性相关图10.7不相关利用Excel绘制散点图的具体方法

①进入Excel表格界面,然后直接点击“图表”命令。出现如图10.8所示的对话框。我们选择“XY散点图”。图10.8表10-1

②单击“自定义类型”,出现图10.9所示的对话框,选择“两轴折线图”③单击下一步,出现图10.10的对话框,在数据区域里选择数据区域“$B2:$C9”。

图10.9图10.10

单击下一步,出现图10.11的对话框,在系列里选择“产品产量”和“生产费用”,在分类X轴标志里选择“$A2:$A9”。⑤单击下一步,出现图10.12的对话框,在图表标题框里输入“产品产量与生产费用相关图”,X轴输入“时间”,Y轴分别输入“产品产量”和“生产费用”,单击“完成”出现图10.13的输出结果:图10.11图10.12

输出结果图10.13三、单相关关系的测定——相关系数相关系数:在线性相关条件下,说明两个现象之间相关关系的方向和密切程度的统计分析指标。通常用r来表示。

总体相关系数的计算:(10.1)式中:Var(X)是变量X的方差;Var(Y)是变量Y的方差;Cov(X,Y)是变量X和Y的协方差。

相关系数的定义公式为:(10.2)式中,n表示资料项数;表示x变量数列的算术平均数;表示y变量数列的算术平均数;σx表示x变量数列的标准差;σy表示y变量数列的标准差;表示x,y两个变量数列的协方差。上述定义公式,整理可写成:在实际应用中,可运用相关系数简捷法。即:

(10.3)(10.4)例3.设某市十家主要商场的人均销售额和利润率资料如表10-2所示,试计算其相关系数。表10-2解:根据表中所列示的资料,代入下式

=0.987(1)利用Excel公式计算相关系数r

例.针对表10-2,借助于Excel表格计算相关系数。①进入Excel表格界面,选中C15单元格,输入“=”,单击插入“fx”函数命令,出现图10.14对话框,单击“选择类别”,在下拉菜单中选中“统计”,在选择函数中选择“CORREL”函数图10.14

②在图10.15对话框里,在Arrey1一栏输入B3:B12,在Arrey2里输入C3:C12。③单击“确定”,计算出r=0.9874,和例3计算的结果是一致的。但用Excel计算要比公式计算快捷的多。图10.15图10.16(2)利用Excel“数据分析”计算相关系数r用工具“加载宏”选项选中“分析工具库”选项

,见图10.17这时,在“工具”菜单中选中“数据分析”命令。从“数据分析”选项中选中“相关系数”选项,见图10.18。

图10.17图10.18在输入的区域里输入“$B$3:$C$12”,在输出的区域里输入“$B$15:$D$17”,见图10.19。相关系数分析的结果间图10.20。图10.19图10.20

按例2的方法绘制散点图,见图10.21,可以看出:由于r=0.987,人均销售额和利润率高度正相关。图10.21第三节回归分析一、回归分析的一般问题回归分析所研究的两个变量不是对等关系,必须根据研究目的,先确定其中一个是自变量,另一个是因变量;回归分析可以根据研究目的不同分别建立两个不同的回归方程;回归分析对资料的要求是,自变量是可以控制的变量(给定的变量),因变量是随机变量。二、一元线性回归分析

式中,a表示回归直线在y轴上的截距,代表经济现象经过修匀的基础水平;b表示直线的斜率,称为y倚x的回归系数,表明x每变动一个单位时,影响y平均变动的数量;a和b表示确定回归直线模型的两个待定参数。(10.9)例5.根据表10-2人均销售额与利润率资料,求其一元线性回归方程。表10-3

解:首先,根据表中合计栏的资料求出标准方程组中所需数据其次,将求出的数据代入公式(10.9),求出a、b的值:再次,将a、b的值代入回归方程得:最后,由回归方程可得相应的回归估计值,如表10-3所示。利用Excel求一元线性回归方程在“工具”菜单中选中“数据分析”命令。从“数据分析”选项中选中“回归”选项,见图10.22。单击“确定”按钮出现图10.23的对话框。在Y值输入区域$C$3:$C$12,在X值输入区域$B$3:$B$12,输出区域选中新工作表组.图10.22图10.23

表10-4计算结果如表10-4,计算出的interpret(截矩)即a=-0.38591,XVarable即b=2.293182,和例5用公式计算的结果是一致的,只是这要方便快捷的多。三、估计标准误差的计算方法

(10.7)公式10.7中,Sy表示估计标准误差;我们称之为均方残差(SS),n-2表示数据的项数的自由度。估计标准误差是残差平方和(SS)除以它的自由度n-2后的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论