第4章 相关与回归分析_第1页
第4章 相关与回归分析_第2页
第4章 相关与回归分析_第3页
第4章 相关与回归分析_第4页
第4章 相关与回归分析_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章

相关与回归分析第一节

相关分析变量间的关系

(函数关系)是一一对应的确定关系设有两个变量x和y,变量y随变量x一起变化,并完全依赖于x,当变量x取某个数值时,

y依确定的关系取相应的值,则称y是x的函数,记为y=f(x),其中x称为自变量,y称为因变量各观测点落在一条线上

xy变量间的关系

(函数关系)

函数关系的例子某种商品的销售额(y)与销售量(x)之间的关系可表示为y=px(p为单价)圆的面积(S)与半径之间的关系可表示为S=R2

企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1x2x3

变量间的关系

(相关关系)变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量x取某个值时,变量y的取值可能有几个各观测点分布在直线周围

xy变量间的关系

(相关关系)

相关关系的例子商品的需求量(y)与价格(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系子女身高(y)与父亲身高(x)之间的关系一、相关的概念相关关系是指自然界和社会中许多现象之间存在的数量上的相互联系、相互依存、相互制约的关系。二、相关关系的类型按涉及的变量分为:简单相关和复相关。按表现形态分为:直线相关和曲线相关。直线相关按变化方向分为:正相关和负相关。按相关程度分为:完全相关、不完全相关、不相关。相关关系的图示

不相关

负线性相关

正线性相关

非线性相关

完全负线性相关完全正线性相关

三、相关系数的测定相关系数计算公式简单计算公式相关系数取值及其意义

r

的取值范围是[-1,1]|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关

r=0,不存在线性相关关系-1

r<0,为负相关0<r

1,为正相关|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加四、相关的密切程度R=0.3---0.5低度相关R=0.5---0.8显著相关R=0.8以上高度相关五、相关系数的计算1.手算实例。X:-2,-1,0,1,2;Y:2,3,3,5,72.Excel计算实例。3.相关系数大小与样本数据多少的关系:数据越多相关系数越准确。第二节

一元线性回归模型一、什么是回归分析

回归分析是从一组变量(X,Y)的样本数据出发,根据变量的相关类型,确定变量之间相关关系的数学表达式的统计分析方法。回归一词的来历回归这个术语是由英国著名统计学家FrancisGalton在19世纪末期研究孩子及他们的父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量之间关系的方法称为回归分析。

在同族中抽取n对父-子的身高,即有n对数据:(X1,Y1),(X2,Y2),…,(Xn,Yn).Yk

a+bXk,1

k

n.Yk=a+bXk+ek,1

k

n

--男人平均身高.由上式得Yk-

=a+bXk+ek-

=a+(b-1)

+b(Xk-

)+ek

=c+b(Xk-

)+ek

(注意

=(1-b)

+b

,c=a+(b-1)

,0<b<1)平均说来,当父亲身高超过平均身高时,其子身高也会超过平均身高,但是比父亲身高更靠近平均身高.有回归平均身高的趋向!

家庭对某种商品的需求量与该商品价格之间的调查数据:变量Y与X之间的关系可表示成其中,ε是一个误差项,它包含1.模型中省略的变量2.一些随机因素3.测量(观测)误差4.数学模型设定形式的误差

二、一元线性回归模型的建立

一元线性回归模型其中,称为回归常数;称为回归系数;是随机误差项。

将n组样本(X1,Y1),…,(Xn,Yn)代入(1)得:(1)称为总体回归模型,(2)称为样本回归模型。(1)式两边求数学期望:记:则(3)称为Y对X的回归函数或回归方程(回归直线)。第三节

回归方程系数的最小二乘估计

用样本数据估计系数、,原则是使回归直线很好的拟合样本数据,即使误差平方和达最小。

最小二乘法

(图示)xy(xn,yn)(x1,y1)

(x2,y2)(xi,yi)}ei=yi-yi^

由二元函数极值理论,、应满足:

经整理后的正规方程:

求解正规方程得:记:或者公式:

为了表明、是用样本求得的最小二乘估计,我们用、来表示,即由估计可得样本回归方程:

特别当X等于时间t时,线性方程

可作为Y随时间变化的趋势模型。当时间是奇数个时变换成…-2,-1,0,1,2…,当时间是偶数个时变换成…-3,-1,1,3…,第四节

线性关系的显著性检验

一、样本决定系数总离差平方和分解总离差平方和=残差平方和+回归平方和

回归平方和表示回归关系引起的Yi的波动

残差平方和表示由随机变量影响引起的Yi的波动。

样本决定系数表示回归平方和占总离差平方和的比重,即表示在Yi的总波动中,由回归关系解释的波动的比重。,越大,表明Y与X的线性回归关系越明显。所以是检验线性关系显著性的一个标准。

称为Y与X的样本相关系数,也可用检验Y与X的线性关系的显著性。

对于,计算,并根据样本n,查。若,则认为线性关系显著;否则,不显著。

二、F-检验

对于显著性水平,查若则拒绝H0,认为线性关系显著;否则,不显著(若F值的概率P小于,拒绝H0,认为Y与X线性关系显著)。

三、t-检验由于

于是当H0成立时

对于显著性水平,查若

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论