应用回归分析(第5版)第2章 一元线性回归_第1页
应用回归分析(第5版)第2章 一元线性回归_第2页
应用回归分析(第5版)第2章 一元线性回归_第3页
应用回归分析(第5版)第2章 一元线性回归_第4页
应用回归分析(第5版)第2章 一元线性回归_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024/12/281第2章一元线性回归2.1一元线性回归模型2.2参数β0、β1的估计2.3最小二乘估计的性质2.4回归方程的显著性检验2.5残差分析2.6回归系数的区间估计2.7预测和控制2.8本章小结与评注2024/12/2822.1一元线性回归模型例2.1

表2.1列出了15起火灾事故的损失及火灾发生地与最近的消防站的距离。表2.1 火灾损失表2024/12/2832.1一元线性回归模型例2.2

全国人均消费金额记作y(元);

人均国民收入记为x(元)表2.2 人均国民收入表2024/12/2842.1一元线性回归模型一元线性回归模型

y=β0+β1x+ε回归方程E(y|x)=β0+β1x2024/12/2852.1一元线性回归模型样本模型

yi=β0+β1xi+εi, i=1,2,…,n回归方程E(yi)=β0+β1xi,var(yi)=σ2,样本观测值(x1,y1),(x2,y2),…,(xn,yn)经验回归方程

回归方程平均意义的解释2024/12/2862.2参数β0、β1的估计一、普通最小二乘估计

(OrdinaryLeastSquareEstimation,简记为OLSE)最小二乘法就是寻找参数β0、β1的估计值使离差平方和达极小称为yi的回归拟合值,简称回归值或拟合值

称为yi的残差有人用绝对值2024/12/2872.2参数β0、β1的估计2024/12/2882.2参数β0、β1的估计经整理后,得正规方程组2024/12/2892.2参数β0、β1的估计得OLSE为记2024/12/28102.2参数β0、β1的估计续例2.1回归方程2024/12/28112.2参数β0、β1的估计二、最大似然估计

连续型:是样本的联合密度函数:离散型:是样本的联合概率函数。似然函数并不局限于独立同分布的样本。似然函数在假设εi~N(0,σ2)时,由(2.10)式知yi服从如下正态分布:2024/12/28122.2参数β0、β1的估计二、最大似然估计

y1,y2,…,yn

的似然函数为:对数似然函数为:与最小二乘原理完全相同

2024/12/28132.3最小二乘估计的性质一、线性

是y1,y2,…,yn的线性函数

:2024/12/2814其中用到

2.3最小二乘估计的性质二、无偏性

无偏性的意义2024/12/28152.3最小二乘估计的性质三、的方差

回归系数的相关情况2024/12/28162.3最小二乘估计的性质三、的方差

在正态假设下Gauss

Markov条件

2024/12/28172.4回归方程的显著性检验

一、t

检验

原假设:H0:β1=0 对立假设:H1

:β1≠0

由当原假设H0:β1=0成立时有:

2024/12/28182.4回归方程的显著性检验

一、t

检验

构造t统计量

其中2024/12/28192.4回归方程的显著性检验

二、用统计软件计算

1.例2.1用Excel软件计算2024/12/2820什么是P值?

(P-value)P值即显著性概率值

SignificenceProbabilityValue是当原假设为真时得到比目前的样本更极端的样本的概率,所谓极端就是与原假设相背离它是用此样本拒绝原假设所犯弃真错误的真实概率,被称为观察到的(或实测的)显著性水平2024/12/2821双侧检验的P值

/

2

/

2

t拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值2024/12/2822左侧检验的P值H0值临界值a样本统计量拒绝域抽样分布1-

置信水平计算出的样本统计量P值2024/12/2823右侧检验的P值H0值临界值a拒绝域抽样分布1-

置信水平计算出的样本统计量P值2024/12/2824利用P值进行检验的决策准则若p-值≥

,不能拒绝H0若p-值<

,拒绝H0双侧检验p-值=2×单侧检验p-值2024/12/28252.4回归方程的显著性检验

二、用统计软件计算2.例2.1用SPSS软件计算2024/12/28262.4回归方程的显著性检验

二、用统计软件计算2.用SPSS软件计算2024/12/28272.4回归方程的显著性检验

三、F检验平方和分解式

SST=SSR+SSE构造F检验统计量

可以证明SSR和SSE均服从卡方分布2024/12/28282.4回归方程的显著性检验

三、F检验一元线性回归方差分析表方差来源自由度平方和均方F值P值回归残差总和1n-2n-1SSRSSESSTSSR/1SSE/(n-2)P(F>F值)=P值2024/12/28292.4回归方程的显著性检验

四、相关系数的显著性检验

2024/12/28302.4回归方程的显著性检验

四、相关系数的显著性检验

2024/12/28312.4回归方程的显著性检验

四、相关系数的显著性检验

附表1相关系数ρ=0的临界值表n-25%1%n-25%1%n-25%1%10.9971.000160.4680.590350.3250.41820.9500.990170.4560.575400.3040.39330.8780.959180.4440.561450.2880.37240.8110.947190.4330.549500.2730.35450.7540.874200.4230.537600.2500.32560.7070.834210.4130.526700.2320.30270.6660.798220.4040.515800.2170.28380.6320.765230.3960.505900.2050.26790.6020.735240.3880.4961000.1950.254100.5760.708250.3810.4871250.1740.228110.5530.684260.3740.4781500.1590.208120.5320.661270.3670.4702000.1380.181130.5140.641280.3610.4633000.1130.148140.4970.623290.3550.4564000.0980.128150.4820.606300.3490.44910000.0620.0812024/12/28322.4回归方程的显著性检验

四、相关系数的显著性检验

用SPSS软件做相关系数的显著性检验

2024/12/28332.4回归方程的显著性检验

四、相关系数的显著性检验

两变量间相关程度的强弱分为以下几个等级:当|r|≥0.8时,视为高度相关;当0.5≤|r|<0.8时,视为中度相关;当0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,表明两个变量之间的相关程度极弱,在实际应用中可视为不相关。2024/12/28342.4回归方程的显著性检验

五、三种检验的关系H0:b=0H0:r=0H0:回归无效2024/12/28352.4回归方程的显著性检验

六、样本决定系数

可以证明2024/12/28362.5残差分析

一、残差概念与残差图

残差

误差项

残差ei是误差项ei的估计值。

2024/12/28372.5残差分析

一、残差概念与残差图

2024/12/28382.5残差分析

一、残差概念与残差图

图2.6火灾损失数据残差图2024/12/28392.5残差分析

二、残差的性质

性质1E(ei)=0

证明:2024/12/28402.5残差分析

二、残差的性质

性质2其中称为杠杆值

2024/12/28412.5残差分析

二、残差的性质

2024/12/28422.5残差分析

二、残差的性质

性质3.

残差满足约束条件:

这表明残差是相关的,不是独立的.2024/12/28432.5残差分析

三、改进的残差

标准化残差学生化残差2024/12/28442.6回归系数的区间估计

等价于β1的1-α置信区间2024/12/28452.7预测和控制

一、单值预测

2024/12/28462.7预测和控制

二、区间预测找一个区间(T1,T2),使得

需要首先求出其估计值的分布

1.因变量新值的区间预测2024/12/2847二、区间预测1因变量新值的区间预测以下计算的方差从而得2024/12/2848二、区间预测1因变量新值的区间预测记于是有

则2024/12/2849二、区间预测1因变量新值的区间预测y0的置信概率为1-α的置信区间为

y0的置信度为95%的置信区间近似为

能不能两全其美2024/12/2850二、区间预测2因变量平均值的区间估计得E(y0)的1-α的置信区间为

E(y0)=β0+β1x0是常数2024/12/2851二、区间预测计算

对例2.1的火灾损失数据,假设保险公司希望预测一个距最近的消防队x0=3.5公里的居民住宅失火的损失

点估计值95%区间估计单个新值:(22.32,32.67)平均值E(y0):(26.19,28.80)

的95%的近似置信区间为

=(27.50-2×2.316,27.50+2×2.316)=(22.87,32.13)2024/12/2852三、控制问题

给定y的预期范围(T1,T2),如何控制自变量x的值才能以1-α的概率保证

用近似的预测区间来确定x。如果α=0.05,则要求

把带入2024/12/28532.8本章小结与评注

一、一元线性回归模型从建模到应用的全过程例2.2

全国人均消费金额记作y(元);人均国民收入记为x(元)表2.2 人均国民收入表2024/12/2854回归模型的一个真实应用2024/12/28552024/12/28562024/12/2857

黄石公园(Yellowstone)的间歇喷泉预测(回归分析)

凡是到过美国黄石国家公园的人,都会被那里神奇而美丽的间歇喷泉深深迷住(OldFaithful)。这一喷泉每次喷发大约持续1分半钟至5分钟,两次喷发间的间隔时间不等,短则40分钟,长则126分钟。就是说,喷发时间和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论