第9章 相关与回归分析_第1页
第9章 相关与回归分析_第2页
第9章 相关与回归分析_第3页
第9章 相关与回归分析_第4页
第9章 相关与回归分析_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第9章相关与回归分析教学目的:通过本章的学习掌握相关分析和回归分析的基本原理和方法,并理解相关分析和回归分析的区别和联系。教学重点:简单相关系数的计算;简单直线回归方程的拟合及拟合好坏的判断。9-2第一节相关关系的一般问题一、相关关系的概念1、相关关系的概念和特点现象之间确实存在着数量关系,但关系值并不固定的相互依存关系。相关关系有两个特点:现象之间确实存在着的数量上的相互依存关系;现象之间数量关系是不确定的、不严格的。2、现象之间数量关系的类型:函数关系:指变量之间存在的相互依存的关系,它们之间的关系值是确定的。相关关系:是两个现象数值变化不完全确定的随机关系,是一种不完全确定的依存关系。9-33、相关关系与函数关系的区别函数关系指变量之间的关系是确定的,而相关关系的两变量的关系则是不确定的。可以在一定范围内变动;函数关系变量之间的依存可以用一定的方程表现出来,可以给定自变量来推算因变量,而相关关系则不能用一定的方程表示。函数关系是相关关系的特例,即函数关系是完全的相关关系,相关关系是不完全的相关关系。9-4二、相关关系的种类按相关关系所涉及变量的多少,可分为单相关和复相关;按相关关系表现的形式不同,可分为直线相关和曲线相关;从变量之间相互关系的性质看,可分为正相关和负相关;按变量之间相关程度的不同,可分为完全相关、不完全相关和不相关。9-5三、相关分析的内容确定现象之间有无关系;确定相关关系的表现形式;确定相关关系的密切程度和方向。统计上,一般通过编制相关表、绘制相关图和计算相关系数来作出判断;根据相关图可对相关关系的表现形态和密切程度作出一般性的判断,依据相关系数则能作出数量上的具体分析。9-6第二节相关关系的判断定性分析定性分析即根据现象质的规定性,运用理论知识、专业知识、实际经验来进行判断和分析。定性分析是进行相关分析的基础。9-7相关表:是一种反映变量之间相关关系的统计表。将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。相关图:又称散点图。它是以直角坐标系的横轴代表变量X,纵轴代表变量Y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形。9-8相关表简单相关表例:居民消费支出和收入的相关表(单位:百元)

根据以上资料绘制坐标图便得到相关图家庭编号12345678910消费支出y可支配收入x15203040425360657078182545606275889299989-9单变量分组表产量(千件)x企业数平均单位成本(元/件)y20304050809556516.815.615.014.814.2合计30例:30家企业按产品产量分组的平均单位产品成本9-10双变量分组表

例:30家企业按产品产量和单位产品成本分组

单位成本(元/件)y产量(千件)

x合计203040508018161514441--32--131-132--1449107合计95565309-11相关关系的图示(散点图scatterdiagram)

不相关

负线性相关

正线性相关

非线性相关

完全负线性相关完全正线性相关

9-12相关系数相关系数是对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数(简称相关系数)若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

若相关系数是根据样本数据计算的,则称为样本相关系数,记为r在此仅讨论两变量间相关关系问题。对于随机变量x和y,总体相关系数

一般是未知的,只能根据样本观测值给出一个估计量即样本相关系数r。

9-13样本相关系数r的计算公式或化简为协方差x,y的标准差9-14相关系数取值及其意义

r

的取值范围是[-1,1]|r|=1,表明x与y完全线性相关r=1,为完全正线性相关r=-1,为完全负线性相关

r=0,表明x与y不存在线性相关关系-1

r<0,为负线性相关0<r

1,为正线性相关|r|越趋于1表示x与y线性关系越密切;|r|越趋于0表示x与y线性关系越不密切9-15相关系数(取值及其意义)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加9-16样本容量适中时相关关系程度一般判断标准无相关或微弱相关低度相关中度相关(显著相关)高度相关注:这种判断必须建立在对相关系数进行显著性检验的基础上。9-17

我国人均国民收入与人均消费金额数据单位:元年份人均国民收入人均消费金额年份人均国民收入人均消费金额1981198219831984198519861987393.8419.14460.86544.11668.29737.73859.972492672893294064515131988198919901991199219931068.81169.21250.71429.51725.92099.56436907138039471148相关系数计算例【例1】在我国居民消费水平研究中,将人均消费额记为y,人均国民收入记为x。收集到1981~1993年的样本数据(xi,yi,i=1,2,…,13)见下表,计算相关系数。9-18相关系数计算例表年份序号人均国民收入x人均消费金额yx2y2xy123∶∶∶∶13393.8419.14460.86∶∶∶∶2099.5249267289∶∶∶∶1148155078.44175678.34212391.94∶∶∶∶4407900.25620017128983521∶∶∶∶131790498056.20111910.38133188.54∶∶∶∶2410226合计12827.5745716073323.7752263399156173.999-19计算结果相关系数相关系数为0.9987,显示人均国民收入与人均消费金额之间高度正相关。9-20第三节回归分析的一般问题什么是回归?回归是由英国著名统计学家FrancisGalton在19世纪末期研究孩子及其父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们父母那样高。比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们父母的平均身高高。Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他给出的研究两个数值变量之间数量关系的方法称为回归分析。什么是回归分析?回归分析是对具有相关关系的变量拟合数学方程,通过一个或一些变量的变化解释另一变量变化的方法。9-21回归分析的内容和步骤根据理论和对问题的分析判断,区分自变量(即解释变量)和因变量(即被解释变量);从一组样本数据出发,设法确定合适的数学方程式(即回归模型regressionmodel)描述变量间的关系;对数学方程式(回归模型)的可信程度进行统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著;利用数学方程式(回归模型),根据一个或几个自变量的取值来估计或预测因变量的取值,并确定这种估计或预测的精确程度。9-22回归模型的类型1.按涉及变量多少分为:一元回归和多元回归2.按变量相关的形式分:线性回归和非线性回归(注:本章仅讨论一元线性回归分析问题)一个自变量两个及以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归9-23回归分析与相关分析的区别相关分析中,变量

x

与y处于平等地位;回归分析中具有相关关系的变量之间地位是非对等的,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x

可以是随机变量,也可以是非随机的确定变量相关分析主要描述变量之间相关关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行估计和预测

9-24回归分析与相关分析的联系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论