




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、5.2 一元线性回归中的假设检验和预测一元线性回归中的假设检验(1)假设检验的必要性上一节推导出的回归系数的最小二乘估计(5.1-8)式,对的任何一组数据均适用,即使之间毫无关系。如果这样,求得的回归直线方程就没有任何意义。因此,求得回归直线后还需要检验之间是否真的有统计线性相关关系一元线性回归的模型检验。回归系数的最小二乘估计只是由的对观测值求得的,此估计值到底在什么程度上适于之间的真正关系?因此,需对参数是否取为其估计值作假设检验一元线性回归的参数检验。(2)一元线性回归的模型检验为对之间满足一元正态线性回归模型: 这一假设的合理性进行严格的检验,需要检验三点: 在的各取值点处,都服从正态
2、分布,期望值依赖于,且方差都相同;在的各取值点处,的期望是的线性函数;在的各取值点处,相应的是相互独立的。可见,进行完全的严格检验并不容易。而引起线性回归不显著的原因主要有以下三点:除变量外,还有其它重要变量影响的取值,故当取定时,不能服从正态分布;之间不是线性相关关系,而是某种非线性相关关系;的取值根本与的取值无关。在上述情况之一出现时,若对配以线性回归模型,均会有,即. 因此,对线性回归模型显著性的检验可以简化处理为对是否成立的检验。方法如下:作假设检验统计量及其分布由定理5.1.3知: ,故当成立时有以此为检验统计量,且由的一组观测值可以求得的观测值。注: ,在matlab软件中采用的是
3、检验。拒绝域给定显著水平,该双边检验的拒绝域应取为.做出判断当抽样结果使的观测值落入拒绝域时,拒绝,认为,因而线性回归显著;否则认为线性回归不显著。(3)一元线性回归的参数检验作假设(为已知数)检验统计量及其分布由定理5.1.3知: ,故当成立时有以此为检验统计量,且由的一组观测值可以求得的观测值。拒绝域给定显著水平,取该双边检验的拒绝域为.做出判断当抽样结果使的观测值落入拒绝域时,拒绝,认为;否则接受,认为.注:由定理5.1.1中的分布及由定理5.1.2中的分布可以构造服从的另一统计量,对进行类似的假设检验。一元线性回归中的预测回归分析的最终目的,是当取定时利用回归方程对进行预测。所谓对的预
4、测,即当时,求的点估计(预测值)和区间估计(预测区间)。问题:在模型中令,则,且. 求的取值估计值和置信概率为的置信区间。(1)预测值的求法求出经验回归直线后,将代入,取 实质上是取.(2)预测区间的求法的点估计.寻找枢轴量() 的分布其中均服从正态分布,故它们的线性函数也服从正态分布。再求的两个参数和.又时, , , 且与相互独立。而 (5.1-8)其中,故与的线性函数相互独立。于是 () 构造枢轴量由上式知由定理5.1.2知又:与相互独立(由定理5.1.2知分别与相互独立,故与独立;是的函数,故与独立, 从而与相互独立),于是即:以此为区间估计的枢轴量。求置信区间给定置信概率为,有使由导出
5、的置信区间为(3)对预测区间的分析考虑任一点处的取值的预测区间:由(5.2-3)式知,若记而,于是的置信下限,置信上限,预测区间为. 其中预测区间长当时最小;离越远,越大。这说明回归分析比较适于在原有观测数据附近作内插预测;而不适于在离原有观测数据较远处作外推预测。预测区间的中心为,即经验回归直线上处的纵坐标。 当很大且较小时,则预测区间可简化为:,此时的置信上、下限在的临近,近似于直线。例5.2.1(续例5.1.1) (3)检验线性回归的显著性();(4)求(2岁3个月)时,平均体重的预测值和预测区间()。解:(3)作假设,当成立时检验统计量临界值为可见,拒绝,认为,因而与之间线性回归显著。
6、(4)时,的置信下限,置信上限,预测区间为. 例5.2.2 下表给出了过去年间某城市新建住宅面积(单位:万平米)和某家具公司的销售额(单位:万元)的统计数据:年12345678910新建住宅面积121118271190175263334368305210销售额的观测值360260440400360500580560505480年11121314151617181920新建住宅面积380270218342173370215205339283销售额的观测值602540414590492660463410680594若今年,试预测()。 X=121 118 271 190 175 263 334 3
7、68 305 210 380 270 218 342 173 370 215 205 339 283; Y=360 260 440 400 360 500 580 560 505 480 602 540 414 590 492 660 463 410 680 594; plot(X,Y,ro) y=192.0574+1.1745.*X; hold on plot(X,y,b-)解: = 1 * GB3 ,于是回归系数经验回归直线为. 且 = 2 * GB3 线性回归的显著性检验作假设,当成立时检验统计量临界值为可见,拒绝,认为,因而与之间线性回归显著,利用线性回归模型进行预测是合理的。 = 3 * GB3 预测:,. 的置信下限,置信上限,预测区间为. 一元线性回归分析的一般步骤:针对实际问题中存在相关关系的自变量和因变量,做次独立试验,得到子样值 ;画出散点图,直观判断这个点(很大时)是否分布在一条直线附近;如是利用子样值求得、,从而可得未知参数的最小二乘
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年车辆抵押贷款信保业务借款协议
- 三年级下册数学教案-第五单元长方形的面积∣北师大版
- 2025年工作室网站合同
- 行业培训外包合同(2篇)
- (高清版)DB45∕T 227-2022 地理标志产品 广西肉桂
- 2011年全国各地高考生物试题分章汇编
- 任务二 高效地下载信息 教学设计 -2023-2024学年桂科版初中信息技术七年级上册
- 第十一课 智能家居教学设计 -2023-2024学年青岛版(2019)初中信息技术第四册
- 第八单元(A卷基础篇)三年级语文下册单元分层训练AB卷(部编版)
- 第六单元-平移、旋转和轴对称(单元测试)-苏教版数学三年级上册(含解析)
- 2024义务教育道德与法治课程标准(2022版)
- 2024年新人教版化学九年级上册全册课件(新版教材)
- 智能体脂秤市场洞察报告
- 教科版 二年级科学上册第一单元第6课《不同的季节》同步练习(附答案解析)
- 山东省东营市2024年中考英语真题【附真题答案】
- 2024义务教育英语新课标课程标准2022年版考试真题附答案
- 粤港澳宜居城市建设协同发展策略
- 动物防疫服务投标方案(技术方案)
- 2024年新课标全国Ⅰ卷语文高考真题试卷(含答案)
- 2022-2023学年广州市六年级下学期数学期末考试试卷及答案解析
- 设备维护服务方案(2篇)
评论
0/150
提交评论