应用回归分析liu改_第1页
应用回归分析liu改_第2页
应用回归分析liu改_第3页
应用回归分析liu改_第4页
应用回归分析liu改_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章应用回归分析1回归分析的研究对象家庭收入与家庭支出的关系父母身高与子/女身高的关系平时作业成绩与最后的考试成绩的关系银行利率与股票指数的关系现实世界中变量之间的关系并不总是可以用函数关系(自变量确定,因变量唯一)来表示的比如:2经验和统计数据表明某些变量的取值相互之间是有关系的,不是完全无关的,这种关系称为统计相关关系 统计相关关系: 回归分析及回归方程: 回归分析就是研究变量间的统计相关关系一种统计方法. 根据变元的统计数据,用一个函数来近似变元间的统计相关关系,这个函数叫回归方程或回归函数3本例中, 父亲身高与儿子身高的关系就是统计相关关系上述高尔顿得到的近似直线方程就是回归方程45

2、8.1 一元线性回归一元线性回归的模型:其中,X为确定性变量,它是可以测量和控制的,也称解释变量或自变量; Y为被解释变量或响应变量 6根据变元(X,Y)的一组观测值代入上述一元线性回归模型,得:78我们导出了参数的极大似然估计,但是,历史上高尔顿是用我们高等数学中所学过的最小二乘法导出的,因此,一般称之为最小二乘估计9重要公式1011关于上述例1,请大家思考如下问题: 我们得到的回归方程有什么用? 根据哪些指标可以判断回归的效果?上述回归的效果如何? 上例中:年龄为自变量(控制变量),体重为因变量(响应变量),回 归方程为: y = 7.83+2.01x , 那么据此方程得: x = (y

3、-7.83)/2.01 ,它 可否视为把体重作为自变量,年龄作为因变量的回归方程? 对于任意给定的一组数值(xi, yi) i=1,2,n,比如 xi 表示第i天的最高 气温, yi表示第i天股市的收盘指数,是否都可以像例1一样代入参数的公 式并求出回归方程? 如果观测值较多,直接手算比较复杂,如何借助计算机求解回归方程?12关于问题1:回归方程有什么用途?回归方程的主要用途是预测和控制,比如根据上例的回归方程 y = 7.83+2.01x ,我们可以预测 x=2.2(岁)时儿童的体重为:y = 7.83+2.01*2.2=12.252(kg)-这是y的点估计,我们还可以得到y的区间估计。对于

4、一元线性回归模型 ,其中误差项满足正态性,独立性,及方差齐性的条件 , 给定 ,则对应 的点估计为 ;当 n 充分大时, 置信水平为此外,我们还可以求出参数13关于问题2:哪些指标可以判断回归的效果?如下指标都可以直接或间接用来表示回归的效果: 残差平方和 SSE 估计标准差 相关系数 R 判定系数 修正判定系数 其中p为自变元个数 从例1第二问的结果看,该例回归的效果还是很好的 14关于问题3: 能否由体重关于年龄的回归方程: y = 7.83+2.01x , 得出年龄关于体重的回归方程: x = (y -7.83)/2.01=0.4975y 3.8955 ?不可以。事实上,如果把体重作为自

5、变量年龄作为因变量,代入一元回归的公式,得:x = 0.4939y 3.853; 二者为何不同呢?因为我们这里介绍的一元回归模型中,自变量与响应变量的地位是不等同的 还有一种回归,叫距离回归,即通过各散点到回归函数的距离平方和最小来求出回归参数,此时自变量与响应变量的地位是等同的,这种情况下是可以直接从 y关于 x 的回归方程解出 x 关于 y 的回归方程的 15关于问题4: 对于任意给定的一组数值(xi, yi) i=1,2,n,是否都可以求变量的回归方程?可以代入参数最小二乘估计的公式求出变元的回归方程,但是,如果变元 X 和 Y 没有统计相关关系,这样求出的回归方程是没有意义的(如气温与

6、股票点数);而如果回归模型的三个条件,即正态性,独立性,方差齐性 不满足,我们就无法对参数的概率特性(分布,区间估计 等)作出判断。直观地说,如果根据变元 X 和 Y 的观测值算出的相关系数的绝对值越大(越接近1),即表示变元 X 和 Y 线性关系越强,这时拟合观测值(xi, yi)的回归方程越有意义那么,相关系数的绝对值要达到多大才可以求回归方程呢?在统计上,我们是用假设检验的方法来判定变元的线性关系是否显著,因为检验的统计量服从F分布(证明略),因此这个检验叫F检验16关于问题4: 如何借助计算机算法进行回归分析?各种统计软件都有回归分析的功能,比如SAS,SPSS,R,包括MATLAB的

7、统计包 等,这里我们介绍EXCEL的回归分析功能操作步骤(多元回归同样操作,但利用EXCEL多元回归分析时自变元个数不能超过16个):1)把数据输入EXCEL表2)点工具菜单 加载宏 数据分析 回归17对例1中数据的EXCEL回归分析结果:相关系数判定系数修正判定系数估计标准差F统计量观测值F检验的P值,当P值小于给定显著性水平时,说明变元线性关系显著P值小于显著性水平时说明常数项显著性非零P值小于显著性水平时说明x系数显著性非零回归参数置信区间的上下限SSRSSESSTF=(SSR/1)/(SSE/n-2)F(1,n-2)18例2:恩格尔系数(食品支出与收入之比)的估算已知人均月收入X与人均食品月支出Y的15组抽样数据如下,求恩格尔系数:X1020960970102091015805408301230106012901380810920640Y270260250280270360190260310310340380270280200分析:根据给定数据,先找出X,Y的回归函数,再根据回归函数来估计恩 格尔系数19解:利用EXCEL进行回归分析,得:208.2 多元线性回归2122令:23解方程组得参数的此外:24例3:试根据表中居民月收入X1(单位百元)及 某商品的单价X2(单位十元)来拟合该商 品的需求量Y(单位百件)的函数需求 Y月收入 X1商品单价 X21

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论