人教A版(新教材)高中数学选择性必修第三册学案:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断_第1页
人教A版(新教材)高中数学选择性必修第三册学案:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断_第2页
人教A版(新教材)高中数学选择性必修第三册学案:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断_第3页
人教A版(新教材)高中数学选择性必修第三册学案:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断_第4页
人教A版(新教材)高中数学选择性必修第三册学案:8 2 2 第二课时 非线性回归模型及回归模型的拟合效果的判断_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人教A版(新教材)高中数学选择性必修第三册PAGEPAGE1第二课时非线性回归模型及回归模型的拟合效果的判断课标要求素养要求1.进一步掌握一元线性回归模型参数的统计意义,会用相关统计软件.2.了解非线性回归模型.3.会通过分析残差和利用R2判断回归模型的拟合效果.通过学习回归模型的应用及对回归模型的拟合效果的判断,提升数学运算及数据分析素养.自主梳理1.残差的概念对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的eq\o(y,\s\up6(^))称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.2.刻画回归效果的方式(1)残差图法作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.(2)残差平方和法残差平方和eq\o(∑,\s\up16(n),\s\do14(i=1))(yi-eq\o(y,\s\up6(^))i)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.(3)利用决定系数R2刻画回归效果R2=1-eq\f(\o(∑,\s\up16(n),\s\do14(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up16(n),\s\do14(i=1))(yi-\o(y,\s\up6(-)))2),R2越大,即拟合效果越好,R2越小,模型拟合效果越差.3.非线性回归模型对于非线性回归分析问题,应先进行变量代换,求出代换后的经验回归方程,再求非线性经验回归方程.在使用经验回归方程进行预测时,需要注意的问题:(1)经验回归方程只适用于所研究的样本的总体;(2)所建立的经验回归方程一般都有时效性;(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果好,超出这个范围越远,预报的效果越差;(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.自主检验1.思考辨析,判断正误(1)残差平方和越接近0,线性回归模型的拟合效果越好.(√)(2)在画两个变量的散点图时,响应变量在x轴上,解释变量在y轴上.(×)〖提示〗在画两个变量的散点图时,响应变量在y轴上,解释变量在x轴上.(3)R2越小,线性回归模型的拟合效果越好.(×)〖提示〗R2越大,线性回归模型的拟合效果越好.(4)回归分析前,要先进行相关性的分析.(√)2.在一次试验中,当变量x的取值分别为1,eq\f(1,2),eq\f(1,3),eq\f(1,4)时,变量y的值分别为2,3,4,5,则y关于eq\f(1,x)的回归曲线方程为()A.eq\o(y,\s\up6(^))=eq\f(1,x)+1 B.eq\o(y,\s\up6(^))=eq\f(2,x)+3C.eq\o(y,\s\up6(^))=2x+1 D.eq\o(y,\s\up6(^))=x-1〖答案〗A〖解析〗由数据可得,四个点都在曲线eq\o(y,\s\up6(^))=eq\f(1,x)+1上.3.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其经验回归方程为eq\o(y,\s\up6(^))=eq\f(1,3)x+eq\o(a,\s\up6(^)),且x1+x2+…+x8=2(y1+y2+…+y8)=6,则实数eq\o(a,\s\up6(^))等于()A.eq\f(1,16) B.eq\f(1,8)C.eq\f(1,4) D.eq\f(1,2)〖答案〗B〖解析〗由x1+x2+…+x8=2(y1+y2+…+y8)=6,得eq\o(x,\s\up6(-))=eq\f(3,4),eq\o(y,\s\up6(-))=eq\f(3,8).由于经验回归方程eq\o(y,\s\up6(^))=eq\f(1,3)x+eq\o(a,\s\up6(^))过样本点的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))),则eq\o(y,\s\up6(-))=eq\f(1,3)eq\o(x,\s\up6(-))+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=eq\f(1,8).4.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性作试验,并用回归分析的方法分别求得相关系数r与残差平方和m如表:甲乙丙丁r0.820.780.690.85m106115124103则________同学的试验结果体现了A,B两变量更强的线性相关性.〖答案〗丁〖解析〗由题表可知,丁同学的相关系数r最大且残差平方和m最小,故丁同学的试验结果体现了A,B两变量更强的线性相关性.题型一残差分析与决定系数R2的应用〖例1〗假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图;(2)求y关于x的经验回归方程,对于基本苗数56.7预报成熟期有效穗;(3)计算各组残差,并计算残差平方和;(4)求R2,并说明(2)中求出的回归模型的拟合程度.解(1)散点图如下.(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用经验回归方程刻画它们之间的关系.设回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),又eq\o(x,\s\up6(-))=30.36,eq\o(y,\s\up6(-))=43.5,eq\o(∑,\s\up16(5),\s\do14(i=1))xeq\o\al(2,i)=5101.56,eq\a\vs4\al(\o(x,\s\up6(-)))eq\a\vs4\al(\o(y,\s\up6(-)))=1320.66,eq\o(x,\s\up6(-))2=921.7296,eq\o(∑,\s\up16(5),\s\do14(i=1))xiyi=6746.76.则eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up16(5),\s\do14(i=1))xiyi-5\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\o(∑,\s\up16(5),\s\do14(i=1))xeq\o\al(2,i)-5\o(x,\s\up6(-))2)≈0.29,eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))≈34.70.故所求的经验回归方程为eq\o(y,\s\up6(^))=0.29x+34.70.当x=56.7时,eq\o(y,\s\up6(^))=0.29×56.7+34.70=51.143.故估计成熟期有效穗为51.143.(3)由eq\o(y,\s\up6(^))i=eq\o(b,\s\up6(^))xi+eq\o(a,\s\up6(^)),可以算得eq\o(e,\s\up6(^))i=yi-eq\o(y,\s\up6(^))i分别为eq\o(e,\s\up6(^))1=0.35,eq\o(e,\s\up6(^))2=0.718,eq\o(e,\s\up6(^))3=-0.5,eq\o(e,\s\up6(^))4=-2.214,eq\o(e,\s\up6(^))5=1.624,残差平方和:eq\o(∑,\s\up16(5),\s\do14(i=1))eq\o(e,\s\up6(^))eq\o\al(2,i)≈8.43.(4)eq\o(∑,\s\up16(5),\s\do14(i=1))(yi-eq\o(y,\s\up6(-)))2=50.18,故R2≈1-eq\f(8.43,50.18)≈0.832.所以(2)中求出的回归模型的拟合效果较好.思维升华刻画回归效果的三种方法①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.②残差平方和法:残差平方和eq\o(∑,\s\up16(n),\s\do14(i=1))(yi-eq\o(y,\s\up6(^))i)2越小,模型的拟合效果越好.③决定系数法:R2=1-eq\f(\o(∑,\s\up16(n),\s\do14(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up16(n),\s\do14(i=1))(yi-\o(y,\s\up6(-)))2)越接近1,表明回归的效果越好.〖训练1〗为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如下表:x51015202530y7.258.128.959.9010.911.8(1)作出散点图并求经验回归方程;(2)求出R2并说明回归模型拟合的程度;(3)进行残差分析.解(1)散点图如图所示.样本点分布在一条直线附近,y与x具有线性相关关系.由表中数据,得eq\o(x,\s\up6(-))=eq\f(1,6)×(5+10+15+20+25+30)=17.5,eq\o(y,\s\up6(-))=eq\f(1,6)×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,eq\o(∑,\s\up16(6),\s\do14(i=1))xeq\o\al(2,i)=2275,eq\o(∑,\s\up16(6),\s\do14(i=1))xiyi=1076.2.计算得eq\o(b,\s\up6(^))≈0.183,eq\o(a,\s\up6(^))≈6.285.故所求经验回归方程为eq\o(y,\s\up6(^))=6.285+0.183x.(2)列表如下:yi-eq\o(y,\s\up6(^))i0.050.005-0.08-0.0450.040.025yi-eq\o(y,\s\up6(-))-2.237-1.367-0.5370.4131.4132.313可得eq\o(∑,\s\up16(6),\s\do14(i=1))(yi-eq\o(y,\s\up6(^))i)2≈0.01318,eq\o(∑,\s\up16(6),\s\do14(i=1))(yi-eq\o(y,\s\up6(-)))2≈14.6783.所以R2=1-eq\f(0.01318,14.6783)≈0.9991,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正错误,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在宽度不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与所挂物体的质量成线性关系.题型二非线性回归分析〖例2〗某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.eq\o(x,\s\up6(-))eq\o(y,\s\up6(-))eq\o(w,\s\up6(-))eq\o(∑,\s\up16(8),\s\do14(i=1))(xi-eq\o(x,\s\up6(-)))2eq\o(∑,\s\up16(8),\s\do14(i=1))(wi-eq\o(w,\s\up6(-)))2eq\o(∑,\s\up16(8),\s\do14(i=1))(xi-eq\o(x,\s\up6(-)))·(yi-eq\o(y,\s\up6(-)))eq\o(∑,\s\up16(8),\s\do14(i=1))(wi-eq\o(w,\s\up6(-)))·(yi-eq\o(y,\s\up6(-)))46.65636.8289.81.61469108.8表中wi=eq\r(xi),eq\o(w,\s\up6(-))=eq\f(1,8)eq\o(∑,\s\up16(8),\s\do14(i=1))wi.(1)根据散点图判断,y=a+bx与y=c+deq\r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线eq\o(v,\s\up6(^))=eq\o(α,\s\up6(^))+eq\o(β,\s\up6(^))u的斜率和截距的最小二乘估计分别为eq\o(β,\s\up6(^))=eq\f(\o(∑,\s\up16(n),\s\do14(i=1))(ui-\o(u,\s\up6(-)))(vi-\o(v,\s\up6(-))),\o(∑,\s\up16(n),\s\do14(i=1))(ui-\o(u,\s\up6(-)))2),eq\o(a,\s\up6(^))=eq\o(v,\s\up6(-))-eq\o(β,\s\up6(^))eq\o(u,\s\up6(-)).解(1)由散点图可以判断,y=c+deq\r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.(2)令w=eq\r(x),先建立y关于w的经验回归方程.由于eq\o(d,\s\up6(^))=eq\f(\o(∑,\s\up16(8),\s\do14(i=1))(wi-\o(w,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up16(8),\s\do14(i=1))(wi-\o(w,\s\up6(-)))2)=eq\f(108.8,1.6)=68,eq\o(c,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(d,\s\up6(^))eq\o(w,\s\up6(-))=563-68×6.8=100.6,所以y关于w的经验回归方程为eq\o(y,\s\up6(^))=100.6+68w,因此y关于x的经验回归方程为eq\o(y,\s\up6(^))=100.6+68eq\r(x).(3)①由(2)知,当x=49时,年销售量y的预报值eq\o(y,\s\up6(^))=100.6+68eq\r(49)=576.6(t),年利润z的预报值eq\o(z,\s\up6(^))=576.6×0.2-49=66.32(千元).②根据(2)的结果知,年利润z的预报值eq\o(z,\s\up6(^))=0.2(100.6+68eq\r(x))-x=-x+13.6eq\r(x)+20.12.所以当eq\r(x)=eq\f(13.6,2)=6.8,即x=46.24时,eq\o(z,\s\up6(^))取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.思维升华求非线性经验回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性经验回归问题转化为线性回归问题,并求出经验回归方程.(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性经验回归方程.〖训练2〗下表为收集到的一组数据:x21232527293235y711212466115325(1)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论