版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、8.2一元线性回归模型及其应用一、教学目标知识与技能从相关指数和残差分析角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤.过程与方法在发现直接求回归直线方程存在缺陷的基础上,引导学生去发现解决问题的新思£一进行回归分析,进而介绍残差分析的方法和利用疋来表示解释变量对于预报变量变化的贡献率.情感、态度与价值观通过本节课的学习,加强数学与现实生活的联系,以科学的态度评价两个变量的相关性,掌握处理问题的方法,形成严谨的治学态度和锲而不舍的求学精神.培养学生运用所学知识解决实际问题的能力.教学中适当地利用学生的合作与交流,使学生在学习的同时,体会与他人合作的重要性.二、教学重难点教学重
2、点:从残差分析、相关指数角度探讨回归模型的拟合效果,以及建立回归模型的基本步骤:教学难点:了解评价回归效果的两个统计疑:相关指数、残差和残差平方和.三、教学过程(一)新课导入(幻灯片)编号12345678身髙/cm165165157170175165155170体重,kg4857505464614359上表是上一节课我们从某大学选取8名女大学生英身高和体重数据组成的数据表,在上一节课中我们通过数据建立了回归直线方程,并根据方程预测了身髙为172cm的女大学生的体重.当时,我们提到根据回归直线方程求得的体重数据,仅是一个估计值,英与真实值之间存在着误差,为了综合分析身高和体重的关系,我们引入了线
3、性回归模型y=bx+a+e来表示两变量之间的关系,其中e为随机变量,又称随机误差.线性回归模型y=bx+a+e增加了随机误差项0因变呈的值由自变量x和随机误差。共同确左.假设随机误差对体重没有影响,也就是说,体重仅受身髙的彫响,那么散点图中所有的点将完全落在回归直线上.但是,在图中,数据点并没有完全落在回归直线上这些点散布在回归直线附近,所以一泄是随机误差把这些点从回归直线上“推”开了,即自变疑X只能解释部分y的变化.同学们考虑一下,随机变呈的均值是多少?方差又是多少?活动设计:学生思考回答问题.设计意图:说明研究随机误差0的必要性,通过研究随机误差g可以分析预报值的可信度.提出问题:既然可以
4、用随机变量0的方差来衡呈随机误差的大小,即通过方差*来刻画预报变量(体重)的变化在多大程度上与随机误差有关,那么如何获得方差*呢?活动结果:可以采用抽样统计的思想,通过随机变量0的样本来估计,的大小.设讣目的:复习抽样统计思想,以便通过随机变量0的样本来估计总体.探究新知提岀问题:既然e表示了除解释变量以外其他各种影响预报值的因素带来的误差,那么如何获得&的样本来计算*呢?学生活动:分组合作讨论交流.学情预测:由函数模型y=bx+a和回归模型y=bx+a-ie可知e=y-y,这样根据图表中女大学生的身高求出预报值,再与真实值作差,即可求得e的一个估计值.教师:由于在讣算回归直线方程时,
5、利用公式求得的b和a为斜率和截距的估计值,它们与真实值a和b之间存在误差,因此y是估讣值,所以e=y-y也是一个估计值.由上可知,对于样本点(XI,yi),(X2,2),,(X”,片)而言,它们的随机误差为AAei二yibxta,r=l»2,.m,称其估计值ei=yty为相应于点(x,必)的残差.将所有残差的平方加起来,这个和称作残差平方和.类比样本方差估计总体方差的思想,可以用作为於的估计量,通常,;2越小,预报精度越高.这样,当我们求得回归直线方程后,可以通过残差来判断模型拟合程度的效果,判断原始数据中是否存在可疑数据,这方而的分析工作称为残差分析.设计目的:通过问题诱思,引入残
6、差概念.(二)探索新知提出问题:对照女大学生的身髙和体重的原始数据,结合求出的回归直线方程,求出相应的残差数据.活动结果:编号12345678身髙(cm)165165157170175165155170体重(kg)4857505464614359残差;-6.3732.6272.419-4.6181.1376.627一2.8830.382提出问题:根拯表格中的数拯,以样本编号为横坐标,残差值为纵坐标,做岀散点图(这样的散点图称作残差图).学生活动:分组合作,共同完成.活动结果:残差图残差提出问题:观察上而的残差图,你认为哪几个样本点在采集时可能存在人为的错误?为什么?学生活动:分组讨论.活动结果
7、:第一个和第六个样本点在采集过程中可能存在错误,因为其他的样本点基本都集中在一个区域内,只有这两个样本点的残差比较大,相对其他样本点来说,分布得较为分散.提出问题:如何从残差图来判断模型的拟合程度?学生活动:独立思考也可相互讨论.活动结果:因为V72越小,预报精度越髙,即模型的拟合程度越髙,而;2越小,。的取值越集中,故若残差点比较均匀地落在水平的带状区域内.说明选用的模型比较合适,且带状区域的宽度越窄,说明拟介精度越高,回归直线的预报精度越高.教师:在统汁学上,人们经常用相关指数疋来刻画回归的效果,其讣算公式是:ny(v-v)2相关指数二1-:_EU-y)2提出问题:分析上而讣算相关指数疋的
8、公式,如何根据疋来判断模型的拟合效果?学生活动:独立思考也可相互讨论,教师加以适当的引导提示.活动结果:疋取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.提出问题:在线性回归模型中,疋表示解释变量对于预报变量变化的贡献率,疋越接近1,表示回归的效果越好,即解释变量和预报变量的线性相关性越强,试讣算关于女大学生身高与体重问题中的相关指数疋一提出问题:结合我们刚学习的概念,现在能否将建立回归模型的步骤补充完整?学生活动:讨论交流,合作完成.活动结果:一般地,建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变疑是解释变量,哪个变量是预报变量.(2)画出确定好的解释变量和预报变疑的敬
9、点图,观察它们之间的关系(如是否存在线性关系等).由经验确左回归方程的类型(如我们观察到数拯呈线性关系,则选用线性回归方程).(4) 按一立规则(如最小二乘法)估计回归方程中的参数.(5) 得岀结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性,等等).若存在异常,则检查数据是否有误,或模型是否合适等.设il億图:设汁问题,让学生讨论分析,得出使用回归方程进行预报需注意的问题,并让学生完善建立回归模型的步骤.在这个过程中,教师不宜做太多引导,要放手给学生,让学生讨论,充分参与进来.运用新知例1一个车间为了规泄工时定额,需确左加工零件所花费的时间,为此进行了10次试验,
10、测得的数据如下:编件数刃个102030405060708090100加工时间y/分626875818995102108115122(1) 建立零件数为解释变量,加工时间为预报变量的回归模型,并计算残差:(2) 你认为这个模型能较好地刻画零件数和加工时间的关系吗?解:(1)根据表中数据作岀散点图如下:散点图4(200(8(604020时间由散点图可知变量之间具有线性相关关系,可以通过求线性回归方程来拟合数据.A残差图根据公式可求得加工时间对零件数的线性回归方程为y=A0.668x+54.96.残差数据如下表:编号12345678910残差;0.39-0.290.03-0
11、.650.67-0.010.31-037-0.050.27可以看岀,第4个样本点和第5个样本点残差较大,需要确认在采集这两个样本点的过程中是否有人为的错误.点评:由散点图判断两个变量的线性相关关系,误差较大,利用残差图可以较好地评价模型的拟合程度,并能发现样本点中的可疑数据.变练演编例2在一段时间内,某种商品的价格x(元)和需求咼y(件)之间的一组数拯为:价格X/元1416182022需求疑W件5650434137求出y对x的回归方程,并说明拟合效果的好坏.解:作出散点图:=18,y=454由计算公式得b=2.35,a=vbx=87.7.故y对x的回归方程为y=-2.35x+87.7,列表:A
12、yi-yi1.2-0.1-2.4031yi-y10.64.6-2.4-4.4一8.4相关指数R40.946.因为0.964很接近1,所以该模型的拟合效果很好.变式1:若要分析是否在上述样本的采集过程中存在可疑数据,应如何分析?活动设计:学生分组讨论,回顾课本解答问题.活动成果:可以画出残差图来进行分析.变式2:既然利用残差图和相关指数都能够评价回归模型的拟合效果,能否总结一下两种方法各自的特点?活动成果:利用残差图可以直观展示拟合的效果,而且还可以发现样本数据中的可疑数据;而相关指数是把对拟合效果的评价转换为数值大小的判断,易于量化处理,并能在数量上表现解释变量对于预报变量变化的贡献率.设讣意
13、图:进一步熟悉判断拟合效果的方法以及各自的特点.非线性回归分析2. 现收集了一只红铃虫的产卵数y和温度xoC之间的7组观测数据列于下表:温度*°C21232527293235产卵数刖个7112124661153251)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。2)你所建立的模型中温度在多大程度上解释了产卵数的变化?(三)课堂练习1. 分析下列残差图,所选用的回归模型效果最好的是()-34(1002(X)3004(X)5006(X)7008(X)90010002. 一为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下时间x/天123456繁殖个数3,612254995190(1)用时间作解释变量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 诉讼案件处理经验总结
- 房地产开发业会计工作总结
- 网上购物系统课程设计jsp
- 茶叶店销售员工作总结
- 工业行业保安工作总结
- 电子商务行业行政后勤工作总结
- 电影影视销售心得体会
- 玻璃制品生产招标合同三篇
- 劝退员工合同(2篇)
- 创新项目保密协议书(2篇)
- 系统集成实施方案
- 2024年大学试题(管理类)-行政管理学笔试历年真题荟萃含答案
- 高尿酸血症的预防与控制策略研究
- 2023-2024学年湖南省常德市武陵区湘少版(三起)六年级上册期末质量检测英语试卷(无答案)
- 医疗机构规章制度目录
- 中国史硕士研究生培养方案
- 成人自考市场营销策划
- 肠梗阻小讲课
- 1-先心病房间隔缺损封堵术护理教学查房
- 电子表格表格会计记账凭证模板
- 2021年深圳亚迪学校小升初面试数学模拟题及答案
评论
0/150
提交评论