新教材适用2023-2024学年高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用学案新人教A版选择性必修第三册_第1页
新教材适用2023-2024学年高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用学案新人教A版选择性必修第三册_第2页
新教材适用2023-2024学年高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用学案新人教A版选择性必修第三册_第3页
新教材适用2023-2024学年高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用学案新人教A版选择性必修第三册_第4页
新教材适用2023-2024学年高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用学案新人教A版选择性必修第三册_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2一元线性回归模型及其应用学习目标1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义.了解最小二乘法原理.掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.2.针对实际问题,会用一元线性回归模型进行预测.3.了解随机误差、残差、残差图的概念.核心素养1.通过对散点图、线性回归的分析,培养数据分析素养.2.借助回归模型的建立,培养数学建模、数据分析及数学运算素养.知识点1一元线性回归模型一元线性回归模型的完整表达式为eq\b\lc\{\rc\(\a\vs4\al\co1(Y=bx+a+e,,E(e)=0,D(e)=σ2.))其中Y称为_因变量__或_响应变量__,x称为自变量或_解释__变量;a,b为模型的未知参数,e是Y与bx+a之间的_随机误差__.想一想:具有相关关系的两个变量,其样本点散布在某一条直线y=bx+a的附近,可以用一次函数y=bx+a来描述两个变量之间的关系吗?提示:不能.练一练:下列说法不正确的是(C)A.在回归模型中,变量间的关系是非确定性关系,因变量不能由自变量唯一确定B.在函数模型中,变量间的关系是确定性关系,因变量由自变量唯一确定C.在回归模型中,变量x和y都是普通变量D.在回归模型中,回归系数可能是正的也可能是负的[解析]在回归模型中,x是解释变量,y是响应变量,当解释变量取值一定时,响应变量的取值带有一定的随机性.知识点2最小二乘法与经验回归方程(1)最小二乘法=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为_经验回归直线__.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计.(2)经验回归方程的系数计算公式经验回归方程的计算公式的计算公式=x+=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2)=eq\x\to(y)-eq\x\to(x)(3)经验回归方程的性质①经验回归方程一定过点(eq\x\to(x),eq\x\to(y));②一次函数=x+的单调性由的符号决定,函数递增的充要条件是>0;③的实际意义:当x增大一个单位时,增大个单位.练一练:如果记录了x,y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于x的经验回归方程必过点(D)A.(2,2) B.(1.5,2)C.(1,2) D.(1.5,4)[解析]因为eq\x\to(x)=eq\f(0+1+2+3,4)=1.5,eq\x\to(y)=eq\f(1+3+5+7,4)=4,所以经验回归方程必过点(1.5,4).知识点3残差与残差分析(1)残差对于响应变量Y,通过观测得到的数据称为_观测值__,通过经验回归方程得到的称为_预测值__,_观测值__减去_预测值__称为残差.(2)残差分析_残差__是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为_残差分析__.(3)对模型刻画数据效果的分析①残差图法:在残差图中,如果残差比较均匀地集中在以_横轴为对称轴的水平带状区域内__,则说明经验回归方程较好地刻画了两个变量的关系;②残差平方和法:残差平方和eq\o(∑,\s\up6(n),\s\do4(i=1))(yi-i)2越小,模型的拟合效果越好;③R2法:可以用R2=1-来比较两个模型的拟合效果,R2越_大__,模型拟合效果越好,R2越_小__,模型拟合效果越差.练一练:甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2分别如表:甲乙丙丁R20.980.780.500.85哪位同学建立的回归模型拟合效果最好(A)A.甲 B.乙C.丙 D.丁[解析]决定系数R2越大,表示回归模型的拟合效果越好.题|型|探|究题型一求经验回归方程典例1随着网络的普及,网上购物的方式已经受到越来越多年轻人的青睐,某家网络店铺商品的成交量x(单位:件)与店铺的浏览量y(单位;次)之间的对应数据如下表所示:x/件24568y/次3040506070(1)根据表中数据画出散点图;(2)根据表中的数据,求出y关于x的经验回归方程;(3)当这种商品的成交量突破100件(含100件)时,预测这家店铺的浏览量至少为多少?[分析]以横轴表示成交量,纵轴表示浏览量,画出散点图,若散点图显示两变量线性相关,则依据公式求解经验回归方程,再利用经验回归方程进行估计.[解析](1)散点图如图所示.(2)根据散点图可得,变量x与y之间具有线性相关关系.根据数据可知,eq\x\to(x)=5,eq\x\to(y)=50,eq\o(∑,\s\up6(5),\s\do4(i=1))xiyi=1390,eq\o(∑,\s\up6(5),\s\do4(i=1))xeq\o\al(2,i)=145,代入公式得==eq\f(1390-5×5×50,145-5×52)=7,=eq\x\to(y)-eq\x\to(x)=50-7×5=15.故所求的经验回归方程是=7x+15.(3)根据上面求出的经验回归方程,当成交量突破100件(含100件),即x=≥100时,≥715,所以预测这家店铺的浏览量至少为715次.[规律方法]经验回归分析的步骤(1)收集样本数据,设为(xi,yi)(i=1,2,…,n)(数据一般由题目给出).(2)作出散点图,确定x,y具有线性相关关系.(3)计算eq\x\to(x),eq\x\to(y),eq\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i),eq\o(∑,\s\up6(n),\s\do4(i=1))xiyi.(4)代入公式计算相关系数,确定相关性的强弱.(5)代入公式计算,,写出经验回归方程=x+.(6)利用经验回归方程进行预测.对点训练❶佩戴头盔是一项对家庭与社会负责的表现,某市对此不断进行安全教育.下表是该市某主干路口连续4年监控设备抓拍到的驾驶员不戴头盔的统计数据:年度2020202120222023年度序号x1234不戴头盔人数y125010501000900(1)请利用所给数据求不戴头盔人数y与年度序号x之间的经验回归方程=x+;(2)估算该路口2024年不戴头盔的人数.[解析](1)由表中数据知,eq\x\to(x)=eq\f(1+2+3+4,4)=eq\f(5,2),eq\x\to(y)=eq\f(1250+1050+1000+900,4)=1050,所以=eq\f(\i\su(i=1,4,x)iyi-4\x\to(x)\x\to(y),\i\su(i=1,4,x)\o\al(2,i)-4\x\to(x)2)=eq\f(9950-10500,30-25)=-110,所以=eq\x\to(y)-eq\x\to(x)=1050-(-110)×eq\f(5,2)=1325,故所求回归直线方程为=-110x+1325.(2)令x=5,则=-110×5+1325=775,则估算该路口2024年不戴头盔的人数为775人.题型二R2的求解与回归模型的拟合典例2我国在第七十五届联合国大会上提出:“中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.”减少碳排放,实现碳中和,人人都可出一份力.某中学数学教师组织开展了题为“家庭燃气灶旋钮的最佳角度”的数学建模活动.实验假设:①烧开一壶水有诸多因素,本建模的变量设定为燃气用量与旋钮的旋转角度,其他因素假设一样;②由生活常识知,旋转角度很小或很大,一壶水甚至不能烧开或造成燃气浪费,因此旋转角度设定在10°到90°之间,建模实验中选取5个代表性数据:18°,36°,54°,72°,90°.某数学建模小组收集了“烧开一壶水”的实验数据,如表:项目旋转角度开始烧水时燃气表度数/dm3水烧开时燃气表度数/dm318°9080921036°8958908054°8819895872°8670881990°84988670以x表示旋转角度,y表示燃气用量.(1)用列表法整理数据(x,y);x(旋转角度:度)1836547290y(燃气用量:dm3)(2)假定x,y线性相关,试求经验回归方程=x+;(注:计算结果精确到小数点后三位)(3)计算(2)中所求模型的决定系数,评价此模型的拟合效果.(注:计算结果精确到小数点后两位)参考数据:eq\i\su(i=1,5,y)i=712,eq\i\su(i=1,5,)(xi-eq\x\to(x))(yi-eq\x\to(y))=1998,eq\i\su(i=1,5,)(xi-eq\x\to(x))2=3240,eq\i\su(i=1,5,)(yi-eq\x\to(y))2=1501.2,eq\i\su(i=1,5,)(yi-i)2≈269.1.[解析](1)整理数据如表:x(旋转角度:度)1836547290y(燃气用量:dm3)130122139149172(2)eq\x\to(x)=54,eq\x\to(y)=142.4,=eq\f(\i\su(i=1,5,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,5,)(xi-\x\to(x))2)=eq\f(1998,3240)≈0.617,≈142.4-0.617×54=109.082,故回归直线方程为=0.617x+109.082.(3)计算(2)中所求模型的决定系数R2=1-=1-eq\f(269.1,1501.2)≈0.82.此模型的拟合效果较好.[规律方法]决定系数R2、残差图在回归分析中的作用(1)决定系数R2是用来刻画回归效果的,由R2=可知,R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好;(2)残差图也是用来刻画回归效果的,判断依据是残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预测的精度也越高.对点训练❷某运动员训练次数与训练成绩之间的数据关系如表:次数(x)3033353739444650成绩(y)3034373942464851(1)作出散点图;(2)求出经验回归方程;(3)作出残差图;(4)计算R2,并说明运动员的训练次数对成绩的影响占百分之几.[解析](1)作出该运动员训练次数x与成绩y的散点图,如图所示.由散点图可知,它们之间具有相关关系.(2)eq\x\to(x)=39.25,eq\x\to(y)=40.875,eq\i\su(i=1,8,x)eq\o\al(2,i)=12656,eq\i\su(i=1,8,x)iyi=13180,所以=eq\f(\i\su(i=1,8,x)iyi-8\x\to(x)\x\to(y),\i\su(i=1,8,x)\o\al(2,i)-8\x\to(x)2)≈1.0415,=eq\x\to(y)-eq\x\to(x)=-0.003875,所以经验回归方程为=1.0415x-0.003875.(3)残差分析:下面的表格列出了运动员训练次数和成绩的原始数据以及相应的残差数据.xy=y-3030-1.24113334-0.365635370.551437390.468439421.385444460.177946480.09495051-1.0711作残差图如图所示.由图可知,残差点比较均匀地分布在水平带状区域内,说明选择的模型比较合适.(4)计算R2≈0.9855,说明了该运动的训练次数对成绩的影响占98.55%.题型三非线性经验回归问题典例3某公交公司推出扫码支付优惠乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示推出的天数,y表示每天使用扫码支付的人次(一人次等于十人),统计数据如下表:x1234567y611213466101196根据以上数据,绘制了如图所示的散点图.(1)根据散点图判断,在推广期内,=x+与=c·dx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中的数据,求y关于x的经验回归方程,并预测活动推出后第8天使用扫码支付的人数.参考数据:eq\x\to(y)eq\x\to(v)eq\i\su(i=1,7,x)iyieq\i\su(i=1,7,x)ivi100.5462.141.54253550.123.47其中vi=lgyi,eq\x\to(v)=eq\f(1,7)eq\i\su(i=1,7,v)i.[分析]由散点图可判断x,y之间的关系符合指数型函数模型,选择=c·dx进行拟合,然后取对数,进而求出经验回归方程.[解析](1)根据散点图判断=c·dx适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程类型.(2)=c·dx,两边同时取常用对数得lg=lg(c·dx)=lgc+lgd·x.设lg=v.∴v=lgc+lgd·x.∴eq\x\to(x)=4,eq\x\to(v)=1.54,eq\i\su(i=1,7,x)eq\o\al(2,i)=140,eq\i\su(i=1,7,x)ivi=50.12.∴lgd=eq\f(\i\su(i=1,7,x)ivi-7\x\to(x)\x\to(v),\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2)=eq\f(50.12-7×4×1.54,140-7×42)=eq\f(7,28)=0.25.把点(4,1.54)代入v=lgc+lgd·x,得lgc=0.54,∴v=0.54+0.25x,∴lg=0.54+0.25x,∴y关于x的经验回归方程为=100.54+0.25x=100.54×100.25x=3.47×100.25x.把x=8代入,得=3.47×102=347(人次).故预测活动推出后第8天使用扫码支付的人数为3470.[规律方法]求非线性经验回归方程的方法(1)非线性经验回归方程的求解,一般可以根据散点图选取合适的非线性回归模型,或根据已知条件选取拟合程度较好的非线性回归模型,再通过变换,转化为求线性经验回归方程,最后还原即可.(2)非线性经验回归方程常见形式有以下几种:=a+b(x-c)2,=a+bln(x-c),=a+beq\r(x-c),=a+eq\f(b,x)和=abcx.其中=a+b(x-c)2,=a+bln(x-c),=a+beq\r(x-c),=a+eq\f(b,x)可通过变量替换(换元)求解;=abcx可通过先两边取对数,再变量替换(换元)求解.对点训练❸某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)的数据作了初步处理,得到下面的散点图及一些统计量的值.eq\x\to(x)eq\x\to(y)eq\x\to(w)eq\i\su(i=1,8,)(xi-eq\x\to(x))2eq\i\su(i=1,8,)(wi-eq\x\to(w))2eq\i\su(i=1,8,)(xi-eq\x\to(x))(yi-eq\x\to(y))eq\i\su(i=1,8,)(wi-eq\x\to(w))(yi-eq\x\to(y))46.65636.8289.81.61469108.8表中wi=eq\r(xi),eq\x\to(w)=eq\f(1,8)eq\i\su(i=1,8,w)i.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计分别为=eq\f(\i\su(i=1,n,)(ui-\x\to(u))(vi-\x\to(v)),\i\su(i=1,n,)(ui-\x\to(u))2),=eq\x\to(v)-eq\x\to(u).[解析](1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的经验回归方程.由于=eq\f(\i\su(i=1,8,)(wi-\x\to(w))(yi-\x\to(y)),\i\su(i=1,8,)(wi-\x\to(w))2)=eq\f(108.8,1.6)=68,=eq\x\to(y)-eq\x\to(w)=563-68×6.8=100.6,所以y关于w的经验回归方程为=100.6+68w,因此y关于x的经验回归方

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论