自考 统计学原理 第5章 相关分析_第1页
自考 统计学原理 第5章 相关分析_第2页
自考 统计学原理 第5章 相关分析_第3页
自考 统计学原理 第5章 相关分析_第4页
自考 统计学原理 第5章 相关分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 相关分析相关分析 第一节 相关分析概述 2021-8-53 一、相关关系的概念 o 社会经济现象之间的关系有两大类,一类是函数关社会经济现象之间的关系有两大类,一类是函数关 系,一类是相关关系。系,一类是相关关系。 o 函数关系函数关系 o 相关关系:现象之间确实存在的、保龄球关系数值相关关系:现象之间确实存在的、保龄球关系数值 不固定的相互依存关系。不固定的相互依存关系。 o 相关分析:对于若干变量之间相互关系密切程度的相关分析:对于若干变量之间相互关系密切程度的 研究,称为相关分析。研究,称为相关分析。 o 回归分析:研究若干变量之间的方程式,给出自变回归分析:研究若干变量之

2、间的方程式,给出自变 量一个数值以推断因变量的可能值,则称回归分析量一个数值以推断因变量的可能值,则称回归分析。 2021-8-58 相关关系产生的原因相关关系产生的原因 o 第一,受干扰的因果关系,第一,受干扰的因果关系, o 第二,同一原因的诸多结果之间的关系第二,同一原因的诸多结果之间的关系 o 第三,因果关系不同而局部出现相同走势第三,因果关系不同而局部出现相同走势 2021-8-59 o 相关关系的特点:相关关系的特点: o 1、相关关系是指现象之间确实存在的相互、相关关系是指现象之间确实存在的相互 依存关系。依存关系。 o 相关关系不是虚构的。相关关系不是虚构的。 o 2、现象之间

3、的数量依存关系的具体关系值、现象之间的数量依存关系的具体关系值 是不固定的。是不固定的。 o 不如函数关系那么精确。不如函数关系那么精确。 2021-8-510 二、相关关系的种类二、相关关系的种类 o 1、按影响因素的数量不同,可分为单相关、复、按影响因素的数量不同,可分为单相关、复 相关和偏相关。相关和偏相关。 o 单相关单相关:两个变量之间的相关关系。:两个变量之间的相关关系。 o 复相关复相关:3个或个或3个以上变量之间的相关关系(见个以上变量之间的相关关系(见 P126)。)。 o 偏相关偏相关:在三个及三个以上的复相关变量中,若只反:在三个及三个以上的复相关变量中,若只反 映其中两

4、个变量的相关关系,而假定其他变量不变。映其中两个变量的相关关系,而假定其他变量不变。 o 2、按相关关系表现形态分这线性相关和非线性相关。、按相关关系表现形态分这线性相关和非线性相关。 o 线性相关线性相关:诸变量之间的联系可以近似地表现为一条:诸变量之间的联系可以近似地表现为一条 直线。直线。 2021-8-511 o 非线性相关非线性相关:诸变量之间的联系可近似地表现为某:诸变量之间的联系可近似地表现为某 种曲线方程的关系。种曲线方程的关系。 o 3、按现象变化的方向可分为正相关和负相关、按现象变化的方向可分为正相关和负相关 o 正相关正相关:两个变量按相同的方向变化,一个变量增:两个变量

5、按相同的方向变化,一个变量增 加(或减少),另一个变量也随着增加(或减少),加(或减少),另一个变量也随着增加(或减少), 这种相关关系称为正相关。这种相关关系称为正相关。 o 负相关负相关:两个变量按不同的方向变化,一个变量增:两个变量按不同的方向变化,一个变量增 加(或减少),另一个变量却减少(或增加),这加(或减少),另一个变量却减少(或增加),这 种相关关系称为负相关。种相关关系称为负相关。 2021-8-512 o 4、按变量之间的相关程度可分为完全相关、按变量之间的相关程度可分为完全相关、 不完全相关和零相关。不完全相关和零相关。 o 完全相关:就是函数关系。完全相关:就是函数关系

6、。 o 零相关:两个变量之间,各自的变化是独立零相关:两个变量之间,各自的变化是独立 的,互不影响,互不相干。的,互不影响,互不相干。 o 不完全相关:介于上述两种情况之间的相关不完全相关:介于上述两种情况之间的相关 关系称为不完全相关。关系称为不完全相关。 2021-8-513 三、相关分析的主要内容三、相关分析的主要内容 o 1、分析现象之间是否存在相关关系,以及、分析现象之间是否存在相关关系,以及 相关关系的表现形式。相关关系的表现形式。 o 有无相关关系?是什么类型的相关关系?有无相关关系?是什么类型的相关关系? o 2、确定相关关系的密切程度、确定相关关系的密切程度 o 可以通过图表

7、和计算可以通过图表和计算相关系数相关系数判断判断 o 3、确定相关关系的数学表达式,以测定变、确定相关关系的数学表达式,以测定变 量之间的一般关系值。量之间的一般关系值。 2021-8-514 o 4、测定因变量估计值的误差程度。、测定因变量估计值的误差程度。 o 计算计算估计标准误差估计标准误差,可测定因变量估计值与,可测定因变量估计值与 实际值之间的差异程度,从而可以衡量一般实际值之间的差异程度,从而可以衡量一般 关系值对实际问题代表性在大小。关系值对实际问题代表性在大小。 第二节第二节 简单线性相关分析简单线性相关分析 2021-8-516 一、相关图表的编制一、相关图表的编制 o (一

8、)相关表(一)相关表 o 相关表是根据相关资料编制出反映变量之间相关表是根据相关资料编制出反映变量之间 相关关系的统计表。相关关系的统计表。 o 1、简单相关表、简单相关表 o 简单相关表是资料未曾分组,只将自变量的简单相关表是资料未曾分组,只将自变量的 变量值按照从小到大的顺序并配合因变量的变量值按照从小到大的顺序并配合因变量的 变量值一一对应而平行排列在一张表格上,变量值一一对应而平行排列在一张表格上, 以观察相关关系。以观察相关关系。 o 例如:例如:P127表格表格。 2021-8-517 o 2、分组相关表、分组相关表 o 在简单相关表的基础上,将相关资料加以分组,排在简单相关表的基

9、础上,将相关资料加以分组,排 列在一张表格上,以观察相关关系。列在一张表格上,以观察相关关系。 o (1)单变量分组相关表)单变量分组相关表 o 它是将自变量分为若干组并计算各组次数,而因变它是将自变量分为若干组并计算各组次数,而因变 量不分组,只计算相应平均值的一种相关表。量不分组,只计算相应平均值的一种相关表。 o 这种分组表与简单相关表相比,能清楚地表明变量这种分组表与简单相关表相比,能清楚地表明变量 之间的相关关系。之间的相关关系。 o 例如:例如:P127表格表格。 2021-8-518 o (2)双变量分组相关表。它是对自变量和)双变量分组相关表。它是对自变量和 因变量都进行分组而

10、制成的相关表因变量都进行分组而制成的相关表。 o P128。 o (二)相关图(二)相关图 o 相关图又称散点图或散布图,它是利用直角相关图又称散点图或散布图,它是利用直角 坐标第一象限,把反映现象之间相互关系的坐标第一象限,把反映现象之间相互关系的 有关资料用相应的坐标点描绘出来,以表明有关资料用相应的坐标点描绘出来,以表明 相关点分布状况的图形。相关点分布状况的图形。 2021-8-519 o 相关图与相关表的作用相同,都是判断两个相关图与相关表的作用相同,都是判断两个 变量之间是否存在相关关系以及相关关系的变量之间是否存在相关关系以及相关关系的 类型。但相关关系的程度必须计算相关系数类型

11、。但相关关系的程度必须计算相关系数 才能判断。才能判断。 2021-8-520 散点图 (scatter diagram) 2021-8-521 散点图 (例题分析) o【例【例】一家大型商业银行在多个地区设有分行, 其业务主要是进行基础设施建设、国家重点项 目建设、固定资产投资等项目的贷款。近年来, 该银行的贷款额平稳增长,但不良贷款额也有 较大比例的提高,这给银行业务的发展带来较 大压力。为弄清楚不良贷款形成的原因,希望 利用银行业务的有关数据做些定量分析,以便 找出控制不良贷款的办法。下面是该银行所属 的25家分行2002年的有关业务数据 2021-8-522 散点图 (例题分析) 20

12、21-8-523 散点图 (例题分析) 不良贷款与贷款余额的散点图 0 2 4 6 8 10 12 14 0100200300400 贷款余额 不良贷款 不良贷款与贷款项目个数的散点图 0 2 4 6 8 10 12 14 010203040 贷款项目个数 不良贷款 不良贷款与固定资产投资额的散点图 0 2 4 6 8 10 12 14 050100150200 固定资产投资额 不良贷款 不 良 贷 款 与 累 计 应 收 贷 款 的 散 点 图 0 2 4 6 8 1 0 1 2 1 4 01 02 03 0 累 计 应 收 贷 款 不良贷款 2021-8-524 二、相关系数的计算二、相关

13、系数的计算 o 相关系数:它表明现相关系数:它表明现 象之间相关关系的相象之间相关关系的相 对密切程度。对密切程度。 o (一)相关系数的一(一)相关系数的一 般公式般公式 的协方差与变量也称为变量的平均数代表两个变量离差乘积yx, yy n xx n yyxx n r xy yx xy 2 2 22 )( 1 )( 1 )( 1 2021-8-525 因此,相关关系可表述为: 的标准差之乘积标准差与变量变量 的协方差与变量变量 相关系数 yx yx 2021-8-526 相关系数 (计算公式) o 样本相关系数的计算公式 2021-8-527 o 上述公式表明,在直线相关的情况下,协方上述公

14、式表明,在直线相关的情况下,协方 差为正值时,相关系数也为正值,表示正相差为正值时,相关系数也为正值,表示正相 关;协方差负值时,相关系数也为负值,表关;协方差负值时,相关系数也为负值,表 示负相关;协方差为示负相关;协方差为O时,表示两个变量不时,表示两个变量不 相关。相关。 2021-8-528 相关系数大小的含义相关系数大小的含义 o 0.30以下关系微弱;以下关系微弱; o 3-0.5低度相关低度相关 o 0.5-0.8显著相关显著相关 o 0.8以上高度相关以上高度相关 第三节 一元线性回归分析 2021-8-530 一、回归分析的概念和种类 o 相关分析解决了变量之间有无关系和关系

15、密 切程度的问题,但变量之间具体的数值关系 没有解决。这一问题留给了回归分析。 o 回归分析:把具有相关关系的两个或两个以 上变量之间的变动加以模型化,求出回归方 程,以便进行估计或预测的统计方法。 o 从变量的数量分:一元和多元回归。 o 从回归的形式分:线性和非线性回归。 o 重点关注线性回归。 2021-8-531 一、一元线性回归 o (一)一元线性回归分析的特点 o 这些特点是在与相关分析的比较中得出的: o 1、两个变量之间不是对等关系。必须确定自变量 和因变量。 o 2、在没有明显的因果关系的两个变量x和y之间可 以求得两个回归方程,而相关系数只有一个。 o 3、回归方程可以用于

16、推算或估计具体的数值,而 象相关系数那么抽象。 o 4、回归系数与相关系数有内在联系。 o 5、资料要求不一样。 2021-8-532 o (二)一元线性回归方程(二)一元线性回归方程 o 方程基本形式:方程基本形式: o a,c为直线的起点值,数学上为截距;为直线的起点值,数学上为截距; o b,d为回归系数。数学上为斜率。为回归系数。数学上为斜率。 o a,c, b,d都叫待定参数。根据实际资料求出参数值后,都叫待定参数。根据实际资料求出参数值后, 变量之间的一般关系的回归直线就确定下来了。变量之间的一般关系的回归直线就确定下来了。 : : yxyabx xyxcdy 倚 回归方程 倚 回

17、归方程 2021-8-533 o 求解参数的最常用的方法是最小平方法求解参数的最常用的方法是最小平方法 o 解释为什么用这种方法求参数。解释为什么用这种方法求参数。 参数的最小二乘估计 0 1 b 2021-8-539 估计方程的求法 (例题分析) o 不良贷款对贷款余额回归方程的图示 不良贷款对贷款余额的回归直线不良贷款对贷款余额的回归直线 -2 0 2 4 6 8 10 12 14 0100200300400 贷款余额 不良贷款 2021-8-540 三、估计标准误差 v利用回归方程可以推断因变量的值。这个值是利用回归方程可以推断因变量的值。这个值是 许多可能数值中的平均值。回归线就是一条

18、平许多可能数值中的平均值。回归线就是一条平 均线,要说明它的代表性需要计算估计值的标均线,要说明它的代表性需要计算估计值的标 准误差。准误差。 v估计标准误差:又称回归标准差,是指实际值估计标准误差:又称回归标准差,是指实际值 与估计值与估计值 的平均离差。的平均离差。 v估计标准误差的大小的含义(解释)。估计标准误差的大小的含义(解释)。 y y 2021-8-541 估计标准误差的计算公式 2 () 1. 2 yx y y S n n 为 因 变 量 的 项 数 ,n-2为 自 由 度 在 简 单 线 性 回 归 中 ,参 数 是 a,b两 个 ,所 以 由 n-2表 示 表 示 估 计

19、回 归 线 时 已 经 推 动 了 两 个 自 由 度 在 参 数 不 只 两 个 时 ,自 由 度 为 n-m-1(m为 自 变 量 的 数 目 ) 2021-8-542 举例 序号xy 1 2 3 4 5 6 7 8 9 10 96.8 109.06 116.85 125.59 136.34 153.84 175.42 187.81 206.12 233.64 40.49 47.73 52.13 54.75 58.99 69.62 79.44 81.06 89.90 101.36 42.51 47.87 51.28 55.10 59.81 67.46 76.90 82.31 90.32 1

20、02.36 -1.57 -1014 0.85 -0.35 -0.82 2.16 2.54 -1.25 -0.42 -1 2.4649 0.0196 0.7225 0.1225 0.6724 4.6656 6.4516 1.5625 0.1764 1 合计 1514.47675.92-17.858 0.18021 0.43731yx yy 2 ()yy 2021-8-543 5 . 1 2 5 . 1 2 ) ( 2 n xybyay s n yy s y y 2021-8-544 估计标准误差的作用 o 第一,用来衡量回归模型的拟合优度(有效第一,用来衡量回归模型的拟合优度(有效 程度)程度)

21、 o 第二,用来对实际的值第二,用来对实际的值Y落到估计值周围的落到估计值周围的 区间做出一个大概的说明。区间做出一个大概的说明。 o 实际上,实际值落在估计值加减一个标准误实际上,实际值落在估计值加减一个标准误 差范围内的概率有差范围内的概率有68.27%;落在估计值加落在估计值加 减减2个标准误差范围内的概率有个标准误差范围内的概率有95.45%; 落在估计值加减落在估计值加减3个标准误差范围内的概率个标准误差范围内的概率 有有99.73%. 2021-8-545 四,可化为线性回归的非线性回归 o 1、指数函数 o 2、幂函数 o 3、双曲函数 o 4、对数函数 o 5、S型曲线 o P139-141 2021-8-546 五,相关分析与回归分析的特点 o 1、注意现象质的界限及相关关系作用的范、注意现象质的界限及相关关系作用的范 围围 o 2、计算相关系数时,两个变量不必区分自、计算相关系数时,两个变量不必区分自 变量与因变量,但在回归分析时,必须区分变量与因变量,但在回归分析时,必须区分 自变量与因变量自变量与因变量 o 3、相关系数表示的是变量之间关系的紧密、相关系数表示的是变量之间关系的紧密 程度,回归分析能反映变量之间的相互影响程度,回归分析能反映变量之间的相互影响 关系和数量规律性关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论