人教A版(新教材)高中数学选择性必修第三册学案2:§8 2 一元线性回归模型及其应用_第1页
人教A版(新教材)高中数学选择性必修第三册学案2:§8 2 一元线性回归模型及其应用_第2页
人教A版(新教材)高中数学选择性必修第三册学案2:§8 2 一元线性回归模型及其应用_第3页
人教A版(新教材)高中数学选择性必修第三册学案2:§8 2 一元线性回归模型及其应用_第4页
人教A版(新教材)高中数学选择性必修第三册学案2:§8 2 一元线性回归模型及其应用_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人教A版(新教材)高中数学选择性必修第三册PAGEPAGE1§8.2一元线性回归模型及其应用学习目标1.结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义.2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.知识梳理知识点一一元线性回归模型称eq\b\lc\{\rc\(\a\vs4\al\co1(Y=bx+a+e,,E(e)=0,D(e)=σ2))为Y关于x的一元线性回归模型.其中Y称为或,x称为或,称为截距参数,称为斜率参数;e是与之间的随机误差,如果e=,那么Y与x之间的关系就可以用一元线性函数模型来描述.知识点二最小二乘法将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,n,)(xi-\x\to(x))2),eq\o(a,\s\up6(^))=.思考1经验回归方程一定过成对样本数据(x1,y1),(x2,y2),…,(xn,yn)中的某一点吗?思考2点(eq\x\to(x),eq\x\to(y))在经验回归直线上吗?知识点三残差与残差分析1.残差对于响应变量Y,通过观测得到的数据称为,通过经验回归方程得到的称为,减去称为残差.2.残差分析是随机误差的估计结果,通过对的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.知识点四对模型刻画数据效果的分析1.残差图法在残差图中,如果残差比较均匀地集中在以,则说明经验回归方程较好地刻画了两个变量的关系.2.残差平方和法残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2越小,模型的拟合效果越好.3.R2法可以用R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2)来比较两个模型的拟合效果,R2越,模型拟合效果越好,R2越,模型拟合效果越差.思考利用经验回归方程求得的函数值一定是真实值吗?题型探究探究一求经验回归方程例1.某种产品的广告费支出x与销售额Y(单位:百万元)之间有如下对应数据:x24568Y3040605070(1)画出散点图;(2)求经验回归直线方程.反思感悟求经验回归方程可分如下四步来完成(1)列:列表表示xi,yi,xeq\o\al(2,i),xiyi.(2)算:计算eq\x\to(x),eq\x\to(y),eq\i\su(i=1,n,x)eq\o\al(2,i),eq\i\su(i=1,n,x)iyi.(3)代:代入公式计算,的值.(4)写:写出经验回归方程.跟踪训练1.假设关于某设备的使用年限x和所支出的维修费用Y(万元),有如下资料:使用年限x23456维修费用Y2.23.85.56.57.0由散点图(图略)知Y与x是线性相关的,试求(1)经验回归直线方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的eq\o(a,\s\up6(^));(2)估计使用年限为10年时,维修费用为多少?探究二线性回归分析例2.一台机器按不同的转速生产出来的某种机械零件有一些会有缺陷,据统计显示,每小时生产的有缺陷的零件数随机器的运转速度而变化.下表为抽样试验的结果:转速x(转/秒)1614128生产的有缺陷的零件数y(件/小时)11985(1)判断y与x是否具有线性相关关系;(2)如果有,求出y对x的经验回归直线方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x;(3)若实际生产中,允许每小时生产的产品中有缺陷的零件最多为10个,则机器的运转速度应控制在什么范围内?反思感悟刻画回归效果的三种方法(1)残差图法,残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.(2)残差平方和法:残差平方和eq\i\su(i=1,n,)(yi-i)2越小,模型的拟合效果越好.(3)R2法:R2=1-越接近1,表明模型的拟合效果越好.跟踪训练2.寒假中,某同学为组织一次爱心捐款,于2020年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计天数x1234567人数y711212466115325(1)作出散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型;(3)如果此人打算在2020年2月12日(即帖子传播时间共10天)进行募捐活动,根据上述回归模型,估计可去多少人.探究三非线性回归例3.某地区不同身高的未成年男性的体重平均值如下表:身高x(cm)60708090100110体重Y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170体重Y(kg)20.9226.8631.1138.8547.2555.05(1)试建立Y对x的经验回归方程;(2)如果体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高为175cm,体重为82kg的在校男生的体重是否正常?反思感悟非线性回归问题的处理方法(1)指数函数型y=ebx+a①函数y=ebx+a的图象,如图所示;②处理方法:两边取对数得lny=lnebx+a,即lny=bx+a.令z=lny,把原始数据(x,y)转化为(x,z),再根据线性回归模型的方法求出a,b.(2)对数函数型y=blnx+a①函数y=blnx+a的图象,如图所示;②处理方法:设x′=lnx,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.(3)y=bx2+a型处理方法:设x′=x2,原方程可化为y=bx′+a,再根据线性回归模型的方法求出a,b.跟踪训练3.在一次抽样调查中测得样本的5个样本点,数值如下表:x0.250.5124Y1612521试建立Y与x之间的经验回归方程.课堂小结1.知识清单:(1)一元线性回归模型.(2)最小二乘法、经验回归方程的求法.(3)对模型刻画数据效果的分析:残差图法、残差平方和法和R2法.2.方法归纳:数形结合、转化化归.3.常见误区:不判断变量间是否具有线性相关关系,盲目求解经验回归方程致误.当堂检测1.对于指数曲线y=aebx方程,令u=lny,c=lna经过非线性化回归分析之后,可以转化成的形式为()A.u=c+bx B.u=b+cxC.y=b+cx D.y=c+bx2.指数曲线y=aebx的图像可以是()3.x,y的取值如下表:x0.20.61.01.21.41.61.82.02.2y0.040.3611.41.92.53.23.984.82则x、y之间的关系可以选用函数________进行拟合.4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5试预测加工10个零件需要多少时间?5.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:日期3月1日3月2日3月3日3月4日3月5日温差x(℃)101113128发芽数y(颗)2325302616(1)若选取的是3月1日与3月5日的两组数据,请根据3月2日至3月4日的数据,求出y关于x的线性经验回归方程;(2)若由线性经验回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性经验回归方程是可靠的,试问(1)中所得的线性经验回归方程是否可靠?▁▃▅▇█参*考*答*案█▇▅▃▁知识梳理知识点一一元线性回归模型因变量响应变量自变量解释变量abYbx+a0知识点二最小二乘法eq\x\to(y)-eq\x\to(x)思考1〖答案〗不一定.思考2〖答案〗在.知识点三残差与残差分析1.残差观测值预测值观测值预测值2.残差分析残差残差知识点四对模型刻画数据效果的分析1.残差图法横轴为对称轴的水平带状区域内3.R2法大小思考〖答案〗不一定,他只是真实值的一个预测估计值.题型探究探究一求经验回归方程例1.解:(1)散点图如图.(2)列出下表,并用科学计算器进行有关计算.序号xyx2xy1230460244016160356025300465036300587064560合计252501451380于是可得:x=5,y=50.=-=50-6.5×5=17.5.于是所求的经验回归直线方程是=6.5x+17.5.跟踪训练1.解:(1)=eq\f(2+3+4+5+6,5)=4,=eq\f(2.2+3.8+5.5+6.5+7.0,5)=5,探究二线性回归分析例2.解:(1)由表中数据代入相关系数公式得:r=eq\f(\i\su(i=1,4,x)iyi-4\x\to(x)\x\to(y),\r((\i\su(i=1,4,x)\o\al(2,i)-4\x\to(x)2)(\i\su(i=1,4,y)\o\al(2,i)-4\x\to(y)2)))≈0.995,因为r>0.95,接近于1,所以y与x之间具有线性相关关系.(2)设y与x之间的线性回归模型为:y=bx+a+ε,由表中数据利用科学计算器得a,b的估计值分别为:eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,4,x)iyi-4\x\to(x)\x\to(y),\i\su(i=1,4,x)\o\al(2,i)-4\x\to(x)2)≈0.7286,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=8.25-0.7286×12.5=-0.8575,所以y对x的经验回归直线方程是:eq\o(y,\s\up6(^))=0.7286x-0.8575.(3)由题意知y≤10,即0.7286x-0.8575≤10,解得x≤14.9019≈15.即要使有缺陷的零件最多有10个,转速应不超过15转/秒.跟踪训练2.解:(1)散点图略.从散点图可以看出x与y不具有线性相关关系,同时可发现样本点分布在某一个指数函数曲线y=kemx的周围,其中k、m是参数.(2)对y=kemx两边取对数,把指数关系变成线性关系.令z=lny,则变换后的样本点分布在直线z=bx+a(a=lnk,b=m)的周围,这样就可以利用线性回归模型来建立x与y之间的非线性经验回归方程了,数据可以转化为天数x1234567人数y1.9462.3983.0453.1784.1904.7455.784求得经验回归直线方程为z=0.620x+1.133,∴y=e0.620x+1.133.(3)截止到2013年2月12日,x=10,此时y=e0.620×10+∴估计可去1530人.探究三非线性回归例3.解:(1)根据表中的数据作散点图,如图所示.由图可以看出,样本点分布在某条指数函数曲线y=c1ec2x的附近,其中c1,c2为待定参数.于是令z=lny,得到x与z的数据如下表:x60708090100110120130140150160170z1.812.072.302.502.712.863.043.293.443.663.864.01作出散点图如图所示.由表中数据可得z对x的经验回归直线方程=0.693+0.020x,则=e0.693+0.020x.故Y对x的经验回归方程为=e0.693+0.020x.(2)当x=175时,预测平均体重为=e0.693+0.020×175≈66.22.因为66.22×1.2≈79.46<82,所以这个男生偏胖.跟踪训练3.解:由数值表可作散点图如下:根据散点图可知y与x近似地呈反比例函数关系,设y=eq\f(k,x),令t=eq\f(1,x),则y=kt,原数据变为:t4210.50.25y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系,列表如下:itiyitiyiteq\o\al(2,i)yeq\o\al(2,i)141664162562212244144315512540.5210.25450.2510

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论