版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.2一元线性回归模型及其应用
第2课一元线性回归模型参数的最小二乘估计(1)新知探究探究1.
如何利用散点图找出一条直线,使各散点在整体上与此直线尽可能接近。追问:这条直线的函数关系式是什么?这条直线的关系是怎么求?阅读教材P107提供的三种方法这些方法虽然有一定的道理,但比较难操作,我们需要另辟蹊径.
理由:模型准确,便于计算,结构简单.问题1:如何利用成对样本数据,用数学方法刻画“从整体上看,各散点与直线最接近”?注:样本数据得点到回归直线竖直距离的平方和最小的方法叫做最小二乘法.因此,可以用
来刻画各样本观测数据与直线y=bx+a的整体接近程度。探究2.推导方程探究2.推导回归方程探究2.推导回归方程称为样本点的中心.探究2.推导回归方程探究5:深度学习:两个公式的转化
我们将
称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫最小二乘法.注意:1、经验回归必过.2、
都是估计值.3、
与r符号相同.
理解
经验回归方程注意:两个公式间的转化推导探究3:模型深化理解——身高案例的经验回归方程
含义2:父亲身高为176cm的所有儿子身高的均值的估计值为177cm.含义1:由方程作出推测,当父亲身高为176cm时,儿子身高一般在177cm左右
斜率可以解释为父亲身高每增加1cm,其儿子身高平均增加0.839cm.思考3:根据方程,父亲身高为多少时,长大成人的儿子身高和父亲身高一样?模型深化理解——经验回归方程D练习:模型深化理解——经验回归方程2、工人工资y(元)依劳动生产率x(千元)变化的回归方程^,下列判断正确的是()A、劳动生产率为1000元时,工资为130元B、劳动生产率提高1000元时,工资约提高80元C、劳动生产率提高1000元时,工资约提高130元D、当月工资250时,劳动生产率为2000元B练习:模型深化理解——经验回归方程模型深化理解——经验回归方程(2)利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.注意:语言表达准确模型深化理解——经验回归方程例3.在全国脱贫攻坚总结表彰大会上,习近平总书记庄严宣告:我国脱贫攻坚战取得全面胜利.目前,河南省53个贫困县已经全部脱贫摘帽,退出贫困县序列.2016年起,我省某贫困地区创新开展产业扶贫,响应第三产业的扶贫攻坚政策,经济收入逐年增加.该地的经济收入变化如图所示:求经验回归方程及应用经验回归方程进行预测年份2016年2017年2018年2019年2020年年份代号x12345经济收入y(单位:百万元)59141720(1)求经济收入y关于x的经验回归方程,并预测2025年该地区的经济收入.探究4:由表格中的数据可知,年份2016年2017年2018年2019年2020年年份代号x12345经济收入y(单位:百万元)59141720①经验回归方程只适用于我们研究的样本和总体。②经验回归方程一般都有时间性。③解释变量的取值不能离可望而不可及本数据的范围太远。样本取值的范围会影响回归方程的适用范围。④不能期望回归方程得到的预报值是预报变量的精确值。事实上,它是响应变量的可能取值的平均值注意问题:在使用经验回归方程进行预测时,需要注意下列问题解题技巧总结2.注意分步计算3:灵活选择与转化两个公式把身高和体重的关系用下面的线性回归模型表示:
其中a和b为模型的未知参数,e是一个随机变量,称为随机误差
线性回归模型y=bx+a+e增加了随机误差项e,这样y的值就由x和e共同确定,即自变量x只能解析部分y的变化。一般,我们把x称为解释变量,y称为预报变量。探究5:残差线性回归模型的完整表达式:预报值真实值探究5:残差(1)根据散点图来粗略判断它们是否线性相关。(2)是否可以用线性回归模型来拟合数据(3)通过残差来判断模型拟合的效果
这种分析工作称为残差分析一般地,在研究两个变量的关系时:我们可以通过残差发现原始数据中的可疑数据,判断所建立的模型的拟合效果
探究6:残差分析利用残差图进行残差分析的具体步骤如下:(1)计算每组观测数据的残差,即残差等于真实值减预测值.当残差比较小时,说明回归模型拟合数据较好,如:编号12345678身高/㎝165165157170175165155170体重/㎏4857505464614359残差-6.3752.6272.419-4.6181.1376.627-2.8830.382残差分析的一般方法:作残差图探究6:残差分析以残差为纵坐标,以样本编号(或x)为横坐标.(2)画残差图.
残差图的纵坐标为残差,横坐标通常可以是观测样本的编号、自变量x或因变量的预测值等,残差图是一种散点图,如:(4)找异常值.
根据计算的残差值和残差图,观察是否存在残差特别大的点,即远离横坐标的点.如果存在远离坐标轴的点,即为异常点,就要研究它出现的原因.(3)分析残差图:残差有正有负,比较均匀地分布在横轴的两边,说明残差比较符合一元线性回归模型中对于随机误差的假定若残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.判断回归模型刻画数据的效果;发现原始数据中是否存在可疑数据,对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.残差的作用:
思考:观察以下四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?(1)(2)(3)(4)
图(1)显示残差与观测时间有线性关系,应将时间变量纳入模型;图(2)显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;图(3)说明残差的方差不是一个常数,随观测时间变大而变大;图(4)的残差比较均匀地集中在以横轴为对称轴的水平带状区域内.所以,只有图(4)满足一元线性回归模型对随机误差的假设。方法总结:回归分析的流程
经验回归方程的理解①只有在散点图大致呈线性相关关系时,求出的经验回归方程才有实际意义,否则求出的经验回归方程毫无意义.②经验回归方程一般都有时效性.③解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好④不能期望经验回归方程得到的预报值就是响应变量的精确值.它是响应变量的可能取值的平均值.课堂小结
素养升华1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 重庆三峡学院《绿色工程》2022-2023学年第一学期期末试卷
- 重庆人文科技学院《思想政治教育学原理》2022-2023学年第一学期期末试卷
- 重庆三峡学院《机械制图》2021-2022学年第一学期期末试卷
- 2024北京怀柔一中高二(上)期中英语(教师版)
- 重庆三峡学院《景观设计基础》2022-2023学年第一学期期末试卷
- 重庆人文科技学院《内科护理学》2021-2022学年第一学期期末试卷
- JAVA服务端程序员岗位职责
- 重庆财经学院《数据库原理与应用》2022-2023学年期末试卷
- 重庆财经学院《软件测试实践》2022-2023学年期末试卷
- 肠道动力机制研究报告
- 起重机日常维护保养方案
- 民法典讲座-继承篇
- 超级优等生:优等生最高效的学习方法
- 糖尿病健康知识宣教课件
- 教科版六年级英语上册(广州版)课件【全册】
- 大学生健康教育大学生性教育教学课件
- 医学-心脏骤停急救培训-心脏骤停急救教学课件
- 企业员工预防职务犯罪讲座课件
- 初中数学北师大版七年级上册课件5-4 应用一元一次方程-打折销售
- 圆柱的截交线公开课一等奖市优质课赛课获奖课件
- X-R控制图模板完整版
评论
0/150
提交评论