一元线性回归_第1页
一元线性回归_第2页
一元线性回归_第3页
一元线性回归_第4页
一元线性回归_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

函数关系:确定性关系,如圆的面积与半径变量之间的关系相关关系:非确定性关系,如商品的销售量与价格(不能由一个变量的数值准确的求出另一个变量的数值)§8一元线性回归分析回归分析的相关概念(1)回归分析:由一个(或一组)普通变量来估计、预测某一个随机变量的观测值所进行的统计分析叫做回归分析.所求得的公式称为回归方程.

(2)线性回归分析:回归分析的模型是线性的,则称为线性回归分析.即用一组非随机变量的线性关系式(一次式)来估计、预测某一个随机变量的观测值.

(3)一元回归分析:研究一个随机变量与一个普通变量的相关关系的回归分析叫一元回归分析.

(4)一元线性回归分析:用一个普通变量的线性关系式(一次式)来估计、预测一个随机变量的观测值的回归分析叫一元线性回归分析.

我们以后只讨论一元线性回归分析.设随机变量y与普通变量x之间存在着某种相关关系.通过试验,可得到x,y的若干对实测数据,将这些数据在坐标系中描绘出来,所得到的图称为散点图.一、散点图与回归直线例1随机抽取某地区10个家庭的年收入与年储蓄(千元)资料如下表所示:

试建立x与y之间的关系式.年收入x1218211491125281716年储蓄y3.26.1103.61.11.3141555.9108l散点图

1405101520253035x1264216y从图中看出,这些点虽然都不在一条直线上,但都分布在一条直线附近,因此可以用这条直线来近似表示y与x之间的关系,这条直线的方程称为y对x的一元线性回归方程(也称为经验公式).这条直线的方程其中a,b称为回归系数,表示直线上y的值与实际值是有差别的.二、最小二乘法与回归方程下面利用n对观测值确定回归方程中的回归系数.

采用最小二乘法.记我们寻找使达到最小值的a,b.

是a,b的二元函数,根据二元函数取极值的必要条件,对求偏导,得方程组整理后,得二元函数取极值的必要条件:设函数在点具有偏导数且在点有极值,则它在该点的偏导数必为零.解方程组得a,b的值为其中,

为了方便计算,记:则因上式所求得的回归系数a,b是仅依据n组样本值对a,b的一种估计值,一般用表示,即由所确定的回归直线方程也相应地记作

下面计算例1中y对x的一元线性回归方程.首先将计算列成如下表

序号xi

yixi2yi2

xiyi1123.214410.2438.4

218

6.132437.21109.8

321

10441

100210

414

3.619612.9650.4

59

1.1

811.219.9

611

1.3121

1.6914.3

725

14625

196350

828

15784

225420

917

5289

2585

1016

5.925634.8194.4合计17165.23261664.121382.2计算,得:故所求线性回归方程为三、一元线性回归的相关性检验用最小二乘法求回归方程,并没有要求y与x存在线性相关关系,当y与x不存在线性相关关系时,求出的线性回归方程就没有意义了,因此我们还必须检验y与x之间是否存在线性相关关系,即进行相关关系的检验.

考虑偏差平方和可证明令则由于且所以即

从看出,|r|引起Q的变化,当|r|接近1时,Q的值就接近0,说明y与x之间的线性关系就好;当|r|接近0,Q的值就较大,用回归直线来表达y与x之间的线性关系就不准确.由于r的大小可以表示y与x之间具有线性关系的相对程度,因此将称为y对x的相关系数.

特别地,当时,则散点图上的点完全落在回归直线上,称y对x完全相关;当时Q的值最大说明y与x无线性关系.相关性检验的步骤如下:(1)提出原假设y与x存在显著的线性相关关系(2)选用统计量根据样本值计算r的值;(3)给定显著性水平,按自由度.查相关系数表,求出临界值;(4)做判断.若,则接受,即认为在给定显著性水平下y与x的线性相关关系较显著;若,则拒绝,认为y与x的线性相关关系不显著.

例2例1中y与x的线性相关关系是否显著?(取显著性水平)解假设y与x的线性相关关系显著从而相关系数为由,,查相关系数表,得所以接受假设,即在下,认为y与x的线性相关关系显著.

四、回归预测当回归方程检验显著有效时,回归方程就大致反映了y与x之间的变化规律.对于x取任意值x0,虽然不能精确地知道相应的y的真值,当用回归方程可以估计出y的真值的取值范围,就是回归预测问题.要用去预测y的真值取值范围,只要估计出偏差的大小即可.因为偏差通常服从正态分布,即

由正态分布的法则知可以证明是的无偏估计量,其中于是用代替,得

y的置信水平为0.99的置信区间为

y的置信水平为0.95的置信区间为

y的置信水平为0.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论