第八章 回归与相关分析 2_第1页
第八章 回归与相关分析 2_第2页
第八章 回归与相关分析 2_第3页
第八章 回归与相关分析 2_第4页
第八章 回归与相关分析 2_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第八章相关与回归分析相关和回归分析是研究事物的相互关系、测定它们联系的紧密程度、揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。第一节相关分析概述第二节相关关系的测定第三节回归分析第四节线性回归模型第八章相关与回归分析★⒈出租汽车费用与行驶里程:总费用=行驶里程每公里单价⒉家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。函数关系(确定性关系)相关关系(非确定性关系)比较下面两种现象间的依存关系联系与相互影响是普遍的现象受教育的水平工作后的收入预防疾病支出疾病的发病率变量间的关系

(函数关系)是一一对应的确定关系设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x

,当变量x取某个数值时,

y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量各观测点落在一条线上

xy变量间的关系

(函数关系)

函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为y=p

x(p为单价)圆的面积(S)与半径之间的关系可表示为S=

R2

企业的原材料消耗额(y)与产量(x1)

、单位产量消耗(x2)

、原材料价格(x3)之间的关系可表示为y=x1x2x3

变量间的关系

(相关关系)变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时,变量y的取值可能有几个各观测点分布在直线周围

xy现象间的依存关系大致可以分成两种类型:函数关系指现象间所具有的严格的确定性的依存关系相关关系指客观现象间确实存在,但数量上不是严格对应的依存关系函数关系与相关关系之间并无严格的界限:有函数关系的变量间,由于有测量误差及各种随机因素的干扰,可表现为相关关系;对具有相关关系的变量有深刻了解之后,相关关系有可能转化为或借助函数关系来描述。⒈按涉及变量的多少分为相关关系的种类⒉按照表现形式不同分为⒊按照变化方向不同分为一元相关多元相关直线相关曲线相关负相关正相关相关分析的种类定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来判断现象之间相关的方向、形态及密切程度第二节相关关系的测定简单相关表适用于所观察的样本单位数较少,不需要分组的情况分组相关表适用于所观察的样本单位数较多标志变异又较复杂,需要分组的情况将现象之间的相互关系,用表格的形式来反映。相关表正相

关负相关曲线相关不相

关xyxyxyxy又称散点图,用直角坐标系的x轴代表自变量,y轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用以表明相关点分布状况的图形。相关图在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r表示相关系数相关系数r的取值范围:-1≤r≤1r>0为正相关,r<0为负相关;|r|=0表示不存在线性关系;|r|=1表示完全线性相关;0<|r|<1表示存在不同程度线性相关:|r|

<

0.4为低度线性相关;0.4≤|r|<0.7为显著性线性相关;0.7≤|r|<1.0为高度显著性线性相关。是相关系数的平方,用表示;用来衡量回归方程对y的解释程度。判定系数取值范围:越接近于1,表明x与y之间的相关性越强;越接近于0,表明两个变量之间几乎没有直线相关关系.判定系数相关关系的测度

(相关系数计算例)【例8.1】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们收集到1981~1993年的样本数据(xi,yi),i=1,2,…,13,数据见表,计算相关系数。相关关系的测度

(计算结果)解:根据样本相关系数的计算公式有人均国民收入与人均消费金额之间的相关系数为0.9987回归分析指根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法回归:退回regression第三节回归分析概述回归分析与相关分析理论和方法具有一致性;无相关就无回归,相关程度越高,回归越好;

相关系数和回归系数方向一致,可以互相推算。联系:相关分析中x与y对等,回归分析中x与y要确定自变量和因变量;相关分析中x、y均为随机变量,回归分析中只有y为随机变量;相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。回归分析与相关分析区别:注意

我们不能把回归分析看作是在变量间建立一个因果关系的过程。回归分析只能表明,变量是如何或者是以怎样的程度彼此联系在一起的。有关因果关系的任何结论,必须建立在理论分析的基础之上。回归分析的种类一元回归(简单回归)多元回归(复回归)线性回归非线性回归一元线性回归SimpleLinearregression按自变量的个数分⒈按回归曲线的形态分⒉第四节一元线性回归模型对于经判断具有线性关系的两个变量y与x,构造一元线性回归模型为:一元线性回归模型

(概念要点)对于只涉及一个自变量的简单线性回归模型可表示为y=b0+b1x+e模型中,y是x的线性函数(部分)加上误差项线性部分反映了由于x的变化而引起的y的变化误差项

是随机变量反映了除x和y之间的线性关系之外的随机因素对y的影响是不能由x和y之间的线性关系所解释的变异性

0和

1称为模型的参数一元线性回归模型

(基本假定)误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的x值,y的期望值为E

(y)=

0+

1x对于所有的x值,ε的方差σ2都相同误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N(0,σ2)独立性意味着对于一个特定的x值,它所对应的ε与其他x值所对应的ε不相关对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关一元线性回归方程的几何意义截距斜率一元线性回归方程的可能形态

为正

为负

为0总体一元线性回归方程:样本一元线性回归方程:以样本统计量估计总体参数斜率(回归系数)截距截距a表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b表明自变量x每变动一个单位,因变量y平均变动b个单位。(估计的回归方程)(一元线性回归方程)随机干扰:各种偶然因素、观察误差和其他被忽视因素的影响X对y的线性影响而形成的系统部分,反映两变量的平均变动关系,即本质特征。残差(Residual):一元线性回归方程中参数a、b的确定:最小平方法基本数学要求:整理得到由两个关于a、b的二元一次方程组成的方程组:进一步整理,有:离差平方和的分解因变量y的取值是不同的,y取值的这种波动称为变差。变差来源于两个方面由于自变量x的取值不同造成的除x以外的其他因素(如x对y的非线性影响、测量误差等)的影响对一个具体的观

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论