统计学原理(第五版)第09章相关与回归分析_第1页
统计学原理(第五版)第09章相关与回归分析_第2页
统计学原理(第五版)第09章相关与回归分析_第3页
统计学原理(第五版)第09章相关与回归分析_第4页
统计学原理(第五版)第09章相关与回归分析_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九章 相关与回归分析统计学原理(第五版)第九章 相关与回归分析内容提要第一节 相关分析的一般问题第二节 相关关系的判断第三节 回归分析的一般问题第四节 回归模型的建立与检测本章习题下一章内容提要 相关分析与回归分析是两种既有区别又有联系的统计分析方法。本章阐述了相关关系的概念与特点;相关关系与函数关系的区别与联系;相关关系的种类;相关关系的测定方法(直线相关系数的含义、计算方法与运用);回归分析的概念与特点;直线回归方程的求解及其精确度的评价;估计标准误差的计算。 返回相关分析的一般问题第一节一、相关关系的概念与特点 (一)相关关系的概念 相关关系是指现象之间客观存在的,在数量变化上受随机因

2、素的影响,非确定性的相互依存关系。(二)相关关系的主要特点 1.相关关系表现为数量相互依存关系。 2.相关关系在数量上表现为非确定性的相互依存关系。二、相关关系的种类 (一)相关关系按变量的多少,可分为单相关和复相关 单相关是指两个变量间的相关关系,如自变量x和因变量y的关系。 复相关是指多个自变量与因变量间的相关关系。 (二)相关关系从表现形态上划分,可分为直线相关和曲线相关 直线相关是指两个变量的对应取值在坐标图中大致呈一条直线。 曲线相关是指两个变量的对应取值在坐标图中大致呈一条曲线,如抛物线、指数曲线、双曲线等。 (三)相关关系从变动方向上划分,可分为正相关和负相关 正相关是指直线相关

3、中,两个变量的变动方向相同,即变量x增加,变量y也相应增加;变量x减少,变量y也相应减少。 负相关是指直线相关中,两个变量的变动方向相反,即变量x增加,变量y反而减少;变量x减少,变量y反而增多。 (四)按相关的密切程度分,有完全相关、不完全相关和不相关 完全相关是两个变量之间有确定的函数关系。 若两个变量之间有一定联系,当一个变量变化时,另一个变量也会因此发生变化,但不存在严格的函数关系,称为不完全相关。 若两个变量之间各自独立,当一个变量变化,另一个变量不变化,或呈不规则变化,两者没有依存关系,称为不相关。三、相关分析的内容 (一)判别现象间有无相关关系 (二)判定相关关系的表现形态和密切

4、程度返回到内容提要相关关系的判断第二节一、相关关系的一般判断 (一)定性分析 对现象进行定性分析,就是根据现象质的规定性,运用理论知识、专业知识、实际经验来进行判断和分析。(二)相关表 相关表就是把被研究现象的观察值对应排列所形成的统计表格。表91 某地区工业劳动者数与工业增加值相关表工业劳动者数(万人)工业增加值(亿元) 2 相关表中的两列数据叫相关数列,它有别于变量数列。相关表中的数值是变量的观测值,是实际资料,是样本数据,它是判别相关关系的基础。在相关表中,如果观测值的分布呈现一定的规律性,则表明现象间存在相关关系。 相关表可分为简单相关表和分组相关表。(三)相关图 相关图也叫相关散点图

5、,它是根据相关表中的观测数据在坐标图中所绘制的点状图形。用x和y分别代表两个变量,把相关表中的对应观测值一一描绘在坐标图中,则形成了反映相关点分布状况的图形,据此就可以观测现象间相关关系的情况。图91 工业劳动者数与工业增加值相关图图92 商品销售额与流通费用率相关图二、相关系数 (一)相关系数的含义 相关系数是指直线相关条件下,说明两现象之间相关关系密切程度的统计分析指标,用r表示。其定义公式为:公式91式中 依相关系数的定义公式可知相关系数的含义如下: (1)r的取值范围为r1。因为协方差的绝对值最小为0,最大为x和y的乘积。 (2)r的绝对值越接近于1,表明相关关系越密切;越接近于0,表

6、明相关关系越不密切。 (3)r=+1或r=-1,表明两现象完全相关。 (4)r=0,表明两变量无直线相关关系。 (5)r0,表明现象呈正直线相关;r0,表明现象呈负直线相关。实际中r0.3,视为无相关;.r.,为低度相关;.r.,为显著相关;r.,一般称为高度相关。 (二)相关系数的计算 1.根据相关系数的定义公式可直接计算相关系数。【例9-1】已知某地生产总值和社会零售总额的历史资料见表9-4表9-4某地生产总值和社会零售后总额资料年份(序号)生产总值社会商品零售总额13920245223522646334570366803978540现根据9-4的资料,用定义公式计算相关系数,其计算结果列

7、于表9-5中表9-5相关系数计算表根据表9-5的数据得2.相关系数的简捷计算法 按照定义公式计算相关系数r运算量较大,过程繁琐,实践中多采用由定义公式推导出的简捷公式计算相关系数。简捷计算公式为:公式92用简捷公式计算相关系数为 3.相关系数的其他公式公式93公式94公式95返回到内容提要回归分析的一般问题第三节 一、回归分析的概念与特点 (一)回归分析的概念 现象之间的相关关系,虽然不是严格的函数关系,但现象之间的一般关系值,可以通过函数关系的近似表达式来反映,这种表达式根据相关现象的实际对应资料,运用数学的方法来建立,这类数学方法称回归分析。(二)回归分析的特点 与相关分析相比,回归分析的

8、特点有: 1.回归分析的两个变量是非对等关系。 2.回归分析中,因变量是随机变量,自变量是可控制变量。 二、回归分析的内容 (一)确定现象之间相关关系的数学模型 (二)测定数学模型的拟合精度 三、相关分析和回归分析的区别与联系 相关分析与回归分析既相互区别又密切联系,是相辅相成的。相关分析是研究两个或两个以上变量之间相关关系及其密切程度的分析。判断相关关系及其密切程度,一般可通过进行定性与定量分析、编制相关图表、计算相关系数等,来反映相关方向和密切程度。回归分析是指将相关现象的关系转变为函数关系,并建立变量关系的数学表达式,来研究变量之间数量变动关系的统计分析方法。 相关分析和回归分析是研究现

9、象之间互相依存关系的不可分割的两个方面。一般先进行相关分析,测定相关现象之间相关程度大小,进而决定是否需要进行回归分析,并拟合相应的回归方程,以便进行推算和预测等,因而可以说相关分析是进行回归分析的基础,回归分析是把变量的相关关系转变为函数关系的手段。但须指出,相关分析可以不分自变量和因变量,而进行回归分析时,则必须明确自变量和因变量,当自变量与因变量位置互换时所得到的回归方程则不同。 返回到内容提要第四节回归模型的建立与检测一、一元线性回归模型 一元线性回归模型是用来进行两个变量间回归分析的。回归分析的重要内容之一,就是根据变量观测值构建回归直线方程,对现象间存在的一般数量关系进行描述。(一

10、)构建回归模型应具备的条件 1.现象间确实存在数量上的相互依存关系。 2.现象间存在直线相关关系。 3.具备一定数量的变量观测值。 (二)直线回归方程的求法 直线回归方程又称一元一次线性回归方程,若以x表示自变量,y表示因变量,则其基本形式为: 模型中的参数a,b与直线趋势方程相同,通常用最小平方法来求。最小平方法的数学出发点是:根据高等数学中求极值的原理:公式96 这就是求解参数a,b的二元一次方程组。解之即得求a,b的公式如下:公式97例根据相关系数的简捷公式计算有: 再求回归直线方程: 二、估计标准误差 (一)估计标准误差的概念与计算 估计标准误差是用来说明回归直线方程代表性大小的统计分

11、析指标。其计算公式为:公式98 实践中,在已知直线回归方程的情况下,通常用下面的简便公式计算估计标准误差:公式99 (二)估计标准误差与相关系数的关系 估计标准误差与相关系数存在着密切的关系,二者的关系可由如下表达式描述:公式910 根号前面的正负号表明正相关或负相关,具体取舍由回归系数的符号来确定:回归系数为正,则取正;回归系数为负,则取负。 在给定相关系数的情况下,估计标准误差的计算公式又为:公式911 (三)相关系数与回归系数的关系 公式912公式913 (四)回归方程的变形形式公式914 例 (1)先求直线回归方程 由公式913: 由公式97: 故所求直线回归方程为: (2)求估计标准误差 由公式911有:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论