新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型学生用书新人教A版选择性必修第三册_第1页
新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型学生用书新人教A版选择性必修第三册_第2页
新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型学生用书新人教A版选择性必修第三册_第3页
新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型学生用书新人教A版选择性必修第三册_第4页
新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型学生用书新人教A版选择性必修第三册_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2课时回归分析及非线性回归模型学习任务1.了解残差、残差图的概念.(数学抽象)2.会通过分析残差和利用R2判断回归模型的拟合效果.(数学运算、数据分析)3.了解非线性回归模型,掌握对数函数模型、指数函数模型和幂函数模型的求解过程.(数学运算、数学建模)设某幼苗从观察之日起,第x天的高度为ycm,测得的一些数据如表所示:第x度y/cm0479111213作出这组数的散点图近似描述y与x的关系,很显然,这些散点不在一条直线附近.你能求出这个函数模型吗?知识点1残差及残差图(1)对于响应变量Y,通过观测得到的数据称为________.通过经验回归方程得到的y称为________,观测值减去预测值称为________.残差是随机误差的估计结果.通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等.(2)作图时纵坐标为残差,横坐标可以选为样本编号,或解释变量的观测值等,这样作出的图形称为________.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度________,说明模型拟合精度越高.(3)残差分析:________是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为________.知识点2对模型刻画数据效果的分析(1)残差图法:在残差图中,如果残差比较均匀地集中在以________,则说明经验回归方程较好地刻画了两个变量的关系.(2)(3)决定系数R2法:可以用R2=来比较两个模型的拟合效果,R2越________,模型拟合效果越差,R2越________,模型拟合效果越好.决定系数R2的取值范围是什么?知识点3非线性回归方程(1)非线性回归分析的思想研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用经验回归方程来建立两个变量之间的关系.(2)非线性经验回归方程当回归方程不是形如y=bx+a(a,b∈R)时,称之为非线性经验回归方程.当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性经验回归方程.1.思考辨析(正确的画“√”,错误的画“×”)(1)残差平方和越接近0,线性回归模型的拟合效果越好. ()(2)在画两个变量的散点图时,响应变量在x轴上,解释变量在y轴上. ()(3)R2越小,线性回归模型的拟合效果越好. ()(4)在残差图中,纵坐标为残差,横坐标可以选为样本编号. ()2.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的决定系数R2如下,其中拟合效果最好的模型是()A.模型1的决定系数R2为0.98B.模型2的决定系数R2为0.80C.模型3的决定系数R2为0.50D.模型4的决定系数R2为0.253.从某省“双一流”大学中随机选出8名女大学生,得到其身高x(单位:cm)与体重y(单位:kg)的数据如下表:x165165157170175165155170y4857505464614359若已知y与x的经验回归方程为y=0.85x-85.71,则选取的女大学生身高为175cm时,相应的残差为________kg.类型1残差与残差分析【例1】(1)对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是()ABCD(2)已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为y=2x+a,若样本点(r,1)与(1,s)的残差相同,则有()A.r=s B.s=2rC.s=-2r+3 D.s=2r+1[尝试解答](1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.(2)残差是随机误差的估计值,ei=yi-yi.[跟进训练]1.两个线性相关变量x与y的统计数据如表所示:x99.51010.511y1110865其经验回归方程是y=bx+40,则相对应于点(11,5)的残差为()A.0.1B.0.2C.0.3D.0.42.已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第________个.类型2残差平方和与决定系数R2【例2】已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x1416182022y1210753(1)求y关于x的经验回归方程;(2)借助残差平方和与R2说明回归模型拟合效果的好坏.[尝试解答]刻画回归效果的三种方法(1)残差图法:残差点比较均匀地落在水平带状区域内说明选用的模型比较合适.(2)(3)决定系数R2法:R2=1-越接近1,表明模型的拟合效果越好.[跟进训练]3.为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求经验回归方程;(2)求出R2并说明回归模型拟合的程度;(3)进行残差分析.类型3非线性回归分析【例3】为了研究某种细菌随时间x变化,繁殖的个数y的变化,收集数据如表所示:天数x/天123456繁殖个数y/个612254995190(1)用天数作解释变量,繁殖个数作响应变量,作出这些数据的散点图,根据散点图判断:y=a+bx与y=c1ec2x哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?xyzi=1i=1i=13.562.833.5317.5596.50512.04其中(2)根据(1)的判断最佳结果及表中的数据,建立y关于x的回归方程.[尝试解答][母题探究](变设问)在本例条件不变的情况下,试估计第7天细菌繁殖个数.解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,响应变量为y.(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型.(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题.(4)分析拟合效果:通过计算决定系数等来判断拟合效果.(5)写出非线性回归方程.提醒:当数据量较大时,可采用计算器或者数学软件来求回归方程.[跟进训练]4.(源自湘教版教材)实验中获得了某化学品的化学反应时间和转化率的数据如表,试建立转化率y关于反应时间x的回归方程(结果保留三位小数).时间x/min6080100120140150160170转化率y/%6.139.9915.0220.9231.1138.8547.2555.051.下面四个残差图中,可以满足一元线性回归模型中对随机误差的假定的是()ABCD2.下列说法错误的是()A.残差点分布的带状区域越窄,回归方程的拟合效果越好B.残差平方和越小,决定系数R2越大C.决定系数R2可以大于1D.通过经验回归方程得到的预报值是响应变量的可能取值的平均值,不一定是响应变量的精确值3.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性作试验,并用回归分析的方法分别求得相关系数r与残差平方和m如表:甲乙丙丁r0.820.780.690.85m106115124103则________同学的试验结果体现了A,B两变量更强的线性相关性.4.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条曲线y=ebx+a的周围,令z=lny,求得经验回归方程为z=0.25x-2.58,则该模型的经验回归方程为________.回顾本节知识,自主完成以下问题:1.对模型刻画数据效果的分析有哪些常见方法?2.决定系数R2与相关系数r一样吗?第2课时回归分析及非线性回归模型[必备知识·情境导学探新知]知识点1(1)观测值预测值残差(2)残差图越窄(3)残差残差分析知识点2(1)横轴为对称轴的水平带状区域内(3)小大思考提示:0≤R2≤1.课前自主体验1.(1)√(2)×(3)×(4)√2.A[R2越大拟合效果越好.]3.0.96[当x=175cm时,y=0.85×175-85.71=63.04(kg),∴相应的残差e=64-63.04=0.96(kg).][关键能力·合作探究释疑难]例1(1)A(2)C[(1)用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.(2)样本点(r,1)的残差为1-2r-a,样本点(1,s)的残差为s-a-2.依题意得1-2r-a=s-a-2,故s=-2r+3.]跟进训练1.B[由于y=bx+40过样本中心点(10,8所以8=10b+40,则b=-3.2,因此y=-3.2x+40.当x=11时,y=-3.2×11+40=4.8,所以残差e=5-y=5-4.8=0.2.]2.6[原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大.]例2解:(1)x=15×(14+16+18+20+22)=18,y=15×(12+10+7+5所以b==620-5×18a=7.4+1.15×18=28.1,所以所求经验回归方程是y=-1.15x+28.1.(2)列出残差表为yi-y00.3-0.4-0.10.2yi-y4.62.6-0.4-2.4-4.4所以所以回归模型的拟合效果很好.跟进训练3.解:(1)散点图如图所示.样本点分布在一条直线附近,y与x具有线性相关关系.由表中数据,得x=16×(5+10+15+20+25+30)y=16×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487i=1计算得b≈0.183,a≈6.285.故所求经验回归方程为y=6.285+0.183x.(2)列表如下:yi-y0.050.005-0.08-0.0450.040.025yi-y-2.237-1.367-0.5370.4131.4132.313可得所以R2=1-0.0131814.6783≈0.9991回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在宽度不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与所挂物体的质量成线性关系.例3解:(1)作出散点图,如图1所示.由散点图看出样本点分布在一条指数函数y=c1ec2x的周围,于是选择y=c(2)令z=lny,则z=bx+x123456z1.792.483.223.894.555.25相应的散点图如图2.从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用经验回归方程来拟合.a=z-bx=1.115,得z=则有y=e0.69x+1.115.母题探究解:∵y=e0.69x+1.115,∴当x=7时,y≈382(个),即第7天细菌繁殖个数约为382个.跟进训练4.解:根据收集的数据作散点图(图1).观察散点图可知,样本点并没有分布在某条直线附近,因而变量y与x之间没有明显的线性相关关系,所以不能直接利用线性回归模型来刻画这两个变量之间的关系.根据已有的数学知识,可以认为样本点分布在指数曲线y=c1ec2x的附近,其中c1和c为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论