版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人教A版(新教材)高中数学选择性必修第三册PAGEPAGE1第2课时一元线性回归模型的综合问题学习目标1.了解随机误差、残差、残差图的概念,会通过残差分析判断经验回归方程的拟合效果.2.了解回归分析的基本思想方法和初步应用.一、残差及残差分析问题1上节课中我们知道儿子身高Y关于父亲身高x的经验回归方程为eq\o(y,\s\up6(^))=0.839x+28.957,那么当x=172时,eq\o(y,\s\up6(^))=0.839×172+28.957=173.265(cm),如果一位父亲的身高为172cm,他儿子长大成人后的身高一定是173cm吗?为什么?〖提示〗不一定,因为还有其他影响他儿子身高的因素,父亲的身高不能完全决定儿子身高.问题2观察课本105页表8.2-1,我们发现当父亲身高为172cm时,儿子的身高实际为176cm,实际身高与预测的身高相差了多少?我们把这个差值叫什么?〖提示〗176-173.265=2.735(cm),残差.知识梳理1.残差:对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的eq\o(y,\s\up6(^))称为预测值,观测值减去预测值称为残差.2.残差分析:残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.例1(1)对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是()〖答案〗A〖解析〗用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.(2)已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为eq\o(y,\s\up6(^))=2x+a,若样本点(r,1)与(1,s)的残差相同,则有()A.r=s B.s=2rC.s=-2r+3 D.s=2r+1〖答案〗C〖解析〗样本点(r,1)的残差为1-2r-a,样本点(1,s)的残差为s-a-2,依题意得1-2r-a=s-a-2,故s=-2r+3.反思感悟残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.跟踪训练1(1)已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第________个.〖答案〗6〖解析〗原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大.(2)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为eq\o(y,\s\up6(^))=0.85x-85.71,那么针对某个体(170,58)的残差是________.〖答案〗-0.79〖解析〗由题意可得eq\o(y,\s\up6(^))i=0.85×170-85.71=58.79,残差eq\o(e,\s\up6(^))=yi-eq\o(y,\s\up6(^))i=58-58.79=-0.79.二、对数函数模型y=c1+c2lnx例2近年来,随着互联网技术的快速发展,共享经济覆盖的范围迅速扩张,继共享单车、共享汽车之后,共享房屋以“民宿”“农家乐”等形式开始在很多平台上线.某创业者计划在某景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近六家“农家乐”跟踪调查了100天.得到的统计数据如表,x为收费标准(单位:元/日),t为入住天数(单位:天),以频率作为各自的“入住率”,收费标准x与“入住率”y的散点图如图.x50100150200300400t906545302020(1)若从以上六家“农家乐”中随机抽取两家深入调查,记ξ为“入住率”超过0.6的农家乐的个数,求ξ的分布列;(2)令z=lnx,由散点图判断eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))与eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))z+eq\o(a,\s\up6(^))哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求经验回归方程.(eq\o(b,\s\up6(^))结果保留一位小数)参考数据:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x),eq\x\to(x)=200,eq\x\to(y)=0.45,eq\i\su(i=1,6,x)eq\o\al(2,i)=325000,eq\x\to(z)≈5.1,eq\i\su(i=1,6,y)izi≈12.7,eq\i\su(i=1,6,z)eq\o\al(2,i)≈158.1.解(1)ξ的所有可能取值为0,1,2.则P(ξ=0)=eq\f(C\o\al(2,4),C\o\al(2,6))=eq\f(6,15)=eq\f(2,5),P(ξ=1)=eq\f(C\o\al(1,2)×C\o\al(1,4),C\o\al(2,6))=eq\f(8,15),P(ξ=2)=eq\f(C\o\al(2,2),C\o\al(2,6))=eq\f(1,15),∴ξ的分布列为ξ012Peq\f(2,5)eq\f(8,15)eq\f(1,15)(2)由散点图可知eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))z+eq\o(a,\s\up6(^))更适合于此模型.其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,6,z)iyi-6\x\to(z)\x\to(y),\i\su(i=1,6,z)\o\al(2,i)-6\x\to(z)2)=eq\f(-1.07,2.04)≈-0.5,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(z)=3,∴所求的经验回归方程为eq\o(y,\s\up6(^))=-0.5lnx+3.反思感悟对数函数模型y=c1+c2lnx的求法(1)确定变量,作出散点图.(2)根据散点图,做出y=c1+c2lnx的函数选择.(3)变量置换,令z=lnx,通过变量置换把问题转化为eq\o(y,\s\up6(^))=eq\o(c,\s\up6(^))1+eq\o(c,\s\up6(^))2z的经验回归问题,并求出经验回归方程eq\o(y,\s\up6(^))=eq\o(c,\s\up6(^))1+eq\o(c,\s\up6(^))2z.(4)根据相应的变换,写出eq\o(y,\s\up6(^))=eq\o(c,\s\up6(^))1+eq\o(c,\s\up6(^))2lnx的经验回归方程.跟踪训练2噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D(单位:分贝)与声音能量(单位:W/cm2)之间的关系,将测量得到的声音强度Di和声音能量Ii(i=1,2…,10)数据作了初步处理,得到如下散点图及一些统计量的值.eq\x\to(I)eq\x\to(D)eq\x\to(W)eq\i\su(i=1,10,)(Ii-eq\x\to(I))2eq\i\su(I=1,10,)(Wi-eq\x\to(W))21.04×10-1145.7-11.51.56×10-210.51eq\i\su(i=1,10,)(Ii-eq\x\to(I))(Di-eq\x\to(D))eq\i\su(i=1,10,)(Wi-eq\x\to(W))(Di-eq\x\to(D))6.88×10-115.1表中Wi=lgIi,eq\x\to(W)=eq\f(1,10)eq\i\su(i=1,10,)Wi.(1)根据散点图判断,eq\o(D,\s\up6(^))=eq\o(a,\s\up6(^))1+eq\o(b,\s\up6(^))1I与eq\o(D,\s\up6(^))=eq\o(a,\s\up6(^))2+eq\o(b,\s\up6(^))2lgI哪一个适宜作为声音强度D关于声音能量的经验回归方程类型?(给出判断即可,不必说明理由)(2)根据表中数据,求声音强度D关于声音能量的经验回归方程.附:对于一组数据(u1,v1),(u2,v2),…,(un,vn).其经验回归直线eq\o(v,\s\up6(^))=eq\o(α,\s\up6(^))+eq\o(β,\s\up6(^))u的斜率和截距的最小二乘估计分别为eq\o(β,\s\up6(^))=eq\f(\i\su(i=1,n,)ui-\x\to(u)vi-\x\to(v),\i\su(i=1,n,)ui-\x\to(u)2),eq\o(α,\s\up6(^))=eq\x\to(v)-eq\o(β,\s\up6(^))eq\x\to(u).解(1)eq\o(D,\s\up6(^))=eq\o(a,\s\up6(^))2+eq\o(b,\s\up6(^))2lgI更适合.(2)令Wi=lgIi,先建立D关于W的经验回归方程.由于eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,10,)Wi-\x\to(W)Di-\x\to(D),\i\su(i=1,10,)Wi-\x\to(W)2)=eq\f(5.1,0.51)=10,∴eq\o(a,\s\up6(^))=eq\x\to(D)-eq\o(b,\s\up6(^))eq\x\to(W)=160.7.∴D关于W的经验回归方程是eq\o(D,\s\up6(^))=10W+160.7,即D关于声音能量的非线性经验回归方程是eq\o(D,\s\up6(^))=10lgI+160.7.三、残差平方和与决定系数R2问题3例2中给出了两个模型,那么如何比较这两个模型的拟合效果?〖提示〗残差平方和、决定系数知识梳理1.残差平方和法残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2越小,模型的拟合效果越好.2.决定系数R2可以用R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2)来比较两个模型的拟合效果,R2越大,模型拟合效果越好,R2越小,模型拟合效果越差.例3假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下表:x15.025.830.036.644.4y39.442.942.943.149.2并由最小二乘法计算得经验回归方程为eq\o(y,\s\up6(^))=0.29x+34.7.(1)计算各组残差,并计算残差平方和;(2)求R2.eq\b\lc\(\rc\)(\a\vs4\al\co1(参考数据:\i\su(i=1,5,)yi-\x\to(y)2=50.18))解(1)由eq\o(y,\s\up6(^))i=eq\o(b,\s\up6(^))xi+eq\o(a,\s\up6(^)),可以算得eq\o(e,\s\up6(^))i=yi-eq\o(y,\s\up6(^))i分别为eq\o(e,\s\up6(^))1=0.35,eq\o(e,\s\up6(^))2=0.718,eq\o(e,\s\up6(^))3=-0.5,eq\o(e,\s\up6(^))4=-2.214,eq\o(e,\s\up6(^))5=1.624,残差平方和为eq\i\su(i=1,5,)(eq\o(e,\s\up6(^))i)2≈8.43.(2)eq\i\su(i=1,5,)(yi-eq\x\to(y))2=50.18,故R2≈1-eq\f(8.43,50.18)≈0.832.反思感悟刻画回归效果的三种方法(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.(2)残差平方和法:残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2越小,模型的拟合效果越好.(3)R2法:R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2)越接近1,表明模型的拟合效果越好.跟踪训练3已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753求y关于x的经验回归方程,并借助残差平方和和R2说明回归模型拟合效果的好坏.eq\b\lc\(\rc\(\a\vs4\al\co1(参考公式及数据:\o(b,\s\up6(^))=\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x),))eq\b\lc\\rc\)(\a\vs4\al\co1(\i\su(i=1,5,x)\o\al(2,i)=1660,\i\su(i=1,5,x)iyi=620))解eq\x\to(x)=eq\f(1,5)×(14+16+18+20+22)=18,eq\x\to(y)=eq\f(1,5)×(12+10+7+5+3)=7.4,所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(620-5×18×7.4,1660-5×182)=-1.15,eq\o(a,\s\up6(^))=7.4+1.15×18=28.1,所以所求经验回归方程是eq\o(y,\s\up6(^))=-1.15x+28.1.列出残差表为yi-eq\o(y,\s\up6(^))i00.3-0.4-0.10.2yi-eq\x\to(y)4.62.6-0.4-2.4-4.4所以eq\i\su(i=1,5,)(yi-eq\o(y,\s\up6(^))i)2=0.3,eq\i\su(i=1,5,)(yi-eq\x\to(y))2=53.2,R2=1-eq\f(\i\su(i=1,5,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,5,)yi-\x\to(y)2)≈0.994,所以回归模型的拟合效果很好.1.知识清单:(1)一元线性回归模型.(2)最小二乘法、经验回归方程的求法.(3)对模型刻画数据效果的分析:残差图法、残差平方和法和R2法.2.方法归纳:数形结合、转化化归.3.常见误区:不判断变量间是否具有线性相关关系,盲目求解经验回归方程致误.1.(多选)关于残差图的描述正确的是()A.残差图的横坐标可以是样本编号B.残差图的横坐标也可以是解释变量或响应变量C.残差点分布的带状区域的宽度越窄R2越小D.残差点分布的带状区域的宽度越窄残差平方和越小〖答案〗ABD〖解析〗残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时,R2的值越大,故描述错误的是C.2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年防雾涂料项目投资申请报告代可行性研究报告
- 山东省临沂一中2024-2025学年高三11月测试语文试题含答案
- 第六章 社区营养管理和营养干预课件
- 五年级数学(小数除法)计算题专项练习及答案
- 2024年期房屋建筑施工协议范例大全
- 2024电力供应与消费合规协议样式
- 2024育儿嫂职责与服务协议书
- 2024无息借款协议格式
- 2024公司绩效奖金分配协议样本
- 单休就业协议范本2024年适用
- 2023-2024学年江苏省南京玄武区中考语文最后一模试卷含解析
- 糖皮质激素的合理应用课件
- 五年级四则混合运算
- 苏教版五年级上册第七单元解决问题的策略作业设计
- 《变压器有载分接开关振动声学现场测试方法》
- 管桁架施工方案
- 全国高考物理高考题说题比赛一等奖课件物理说题李焕景
- 华为MA5800配置及调试手册
- 二轮复习微专题湖泊专题
- 2024年德阳发展控股集团有限公司招聘笔试参考题库附带答案详解
- 餐前检查表(标准模版)
评论
0/150
提交评论