一元线性回归模型及其假设条件_第1页
一元线性回归模型及其假设条件_第2页
一元线性回归模型及其假设条件_第3页
一元线性回归模型及其假设条件_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、§4.2 一元线性回归模型及其假设条件1理论模型y=a+bx+ eX 是解释变量,又称为自变量,它是确定性变量,是可以控制的。是已知的。Y 是被解释变量,又称因变量,它是一个随机性变量。是已知的。A,b 是待定的参数。是未知的。2实际中应用的模型y? a? b?xa, b, x是已知的,y是未知的。回归预测方程:y a bx a,b称为回归系数。若已知自变量x的值,则通过预测方程可以预测出因变量y的值,并给出预测值的置信区间。3假设条件满足条件:(1 )E()=0;( 2)D() = ';( 3)Cov ( i , j)=O,i 丰 j ; Cov ( i , j )=0 o

2、条件( 1)表示平均干扰为 0;条件( 2)表示随机干扰项等方差;条件( 3)表示随机干扰 项不存在序列相关;条件(4)表示干扰项与解释变量无关。 在假定条件(4)成立的情况下, 随机变量yN (a+bx, /)。一般情况下,e N ( 0, /)。4需要得到的结果§4.3 模型参数的估计1估计原理回归系数的精确求估方法有最小二乘法、最大似然法等多种,我们这里介绍最小二乘法。估计误差或残差:ei yi yi,yi a bx,yiyi eia bx ei(5.31)误差e的大小,是衡量a、b好坏的重要标志,换句话讲,模型拟合是否成功,就看残差是否达到要求。可以看出,同一组数据,对于不同

3、的a、b有不同的 点,所以,我们的问题是如何选取a、b使所有的e都尽可能地小,通常用总误差来衡量。衡量总误差的准则有:最大绝对误差最小、绝对误差的总和最小、误差的平方和最小等。我们的准则取:误差的平方和最小。最小二乘法:令 Qn n n 2 22eyj yjy: a bxi (532)使 Q 达到1i1i 1 i最小以估计出 a、 b 的方法称为最小二乘法。 理论推导:微积分极值理论的拉格朗日极值法。2.估计结果nnnn x yi xyii 1i 1 in2Xina?ni1 yin2 QXi一 ybxXi i 1"2i1 yiyii1 yi a bxi2,y是y的算术平均数,x是x的

4、算术平均数。§ 4.5回归方程的检验一、离差平方和的分解与可决系数当根据历史数据估计出回归预测方程后,我们要思考这样的一些问题:回归直线是否有意 义?可否用于预测和控制?参与计算的两个变量x和y是否有线性关系?若有线性关系,其关系的密切程度如何度量。1. 离差平方和的分解n _ 2第一、yi y 表示观祭值yi与其平均值的总离差平方和,用S总表示。(总变差或离i 1 i差平方和)。n _ 2第二、 ?. y 是总离差平方和中由回归直线方程中x的变化所引起,它的大小反映i 1 i了自变量x的重要程度,称为回归平方和。用U表示。(回归变差)。n 2第三、yi ?i反映了不能由回归直线解释

5、的部分,是由其他未能控制的随机干扰因i 1素引起的。称为残差平方和。用Q表示。(剩余变差)22可决系数RS总=U+Q , 1= ( U/S总)+ (Q/S总);R2= U/S总=1 Q/S总表示由解释变量 x的变化而引起因 变量y的变差占总离差的百分比。称为可决系数。3相关系数在一元线性回归中,相关系数是可决系数的平方根。相关系数:是描述变量 x与y之间的线性关系密切程度的一个数量指标。计算公式为:1 xi x yi y结论:第一、当?=0时,变量x与y无任何线性关系,表现为(Xi, yi )的散布是完全没 有规则的。第二、当?2=1时,所有的样本点都落在回归直线上,称变量x与y完全相关。?=

6、1是完全正相关,?=-1是完全负相关。第三、一般情况是,0<丨? I <1。?>0称为正相关,r?<0称为负相关。r <0.3,视为无相关;0.3w r < 0.5为低度相关;0.5< r < 0.8为显著相关;r > 0.8为高度相关。二、回归方程的检验1. 相关系数检验法建立回归方程前要考察 ?的大小,以确定回归方程有无使用价值。相关系数?计算后,要进行统计检验,判别是否具有统计意义。检验方法是:根据置信度、 自由度(样本数据个数一1)和自变量与因变量的总个数查相关系数表,确定临界值,若计 算所得到的相关系数 ?小于临界值,则无统计意义

7、。反之,则有统计意义,是有效的。2. F检验法解释F检验法的含义。回归方程显著性检验的含义:即检验:y a bx对实际的y和x的拟合是否有统计意义。所用统计量为F=U/Q/ (n-2)。检验步骤是第一步计算统计量F的值;第二步根据给出的置信度a得到临界值Fa ( 1, n-2);第三步将统计量值 F与临界值F a进行比较,若统 计量值F大于Fa则认为回归方程显著,线性假设成立,有统计意义,否则回归方程没有 统计意义。实际应用中,统计软件给出了F值。3. T检验解释T检验法的含义。P129 T检验法关于b?=0的假设检验,有专门的 t检验。在一元线性回归模型中,F检验与t检验等同。§ 4.6预测区间1点预测设预测点为 x0,y°,则预测值为: ?0 旨?x。2预测置信区间S 1 丄 XO XS h n- 2Xi X3.控制区间y。t 2n 2 s。已知y。,求Xo的变动范围,称为对Xo的控制,我们在这里不在讲述

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论