数学人教A版选修2-3学案第三章3.1回归分析的基本思想及其初步应用_第1页
数学人教A版选修2-3学案第三章3.1回归分析的基本思想及其初步应用_第2页
数学人教A版选修2-3学案第三章3.1回归分析的基本思想及其初步应用_第3页
数学人教A版选修2-3学案第三章3.1回归分析的基本思想及其初步应用_第4页
数学人教A版选修2-3学案第三章3.1回归分析的基本思想及其初步应用_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.1回归分析的基本思想及其初步应用学习目标重点、难点.2.会利用散点图分析两个变量是否存在相关关系.会用残差及R2来刻画线性回归模型的拟合效果.3.能记住建立回归模型的方法和步骤;能知道如何利用线性回归模型求非线性回归模型.重点:建立变量之间的线性回归方程,能根据散点图初步判断两个变量之间是否具有线性关系..2.掌握建立回归模型的步骤,会选择回归模型,特别是非线性回归模型.1.线性回归模型(1)函数关系是一种______关系,而相关关系是一种________关系.(2)回归分析是对具有____关系的两个变量进行统计分析的一种常用方法.(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),回归直线的斜率和截距的最小二乘估计公式分别为__________________.其中(eq\x\to(x),eq\x\to(y))称为________.(4)线性回归模型y=bx+a+e,其中e称为________,a和b是模型的未知参数,自变量x称为________,因变量y称为________.预习交流1如果记录了x,y的几组数据分别为(0,1),(1,4),(2,7),(3,10),则y关于x的线性回归直线必过点().A.(2,2)B.(,2) C.(1,2) D.(,)2.残差的概念对于样本点(x1,y1),(x2,y2),…,(xn,yn)而言,它们的随机误差为ei=____,i=1,2,…,n,其估计值为eq\o(e,\s\up6(^))i=__________=__________,i=1,2,…,n,eq\o(e,\s\up6(^))i称为相应于点(xi,yi)的残差.3.回归模型拟合效果的刻画类别残差图法残差平方和法R2法特点残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高残差平方和eq\i\su(i=1,n,)(yi-eq\o(y,\s\up6(^))i)2越小,模型的拟合效果越好R2=__________表示________对于________变化的贡献率,R2越接近于__,表示回归的效果越好预习交流2怎么理解散点图和相关指数的关系?4.建立回归模型的基本步骤为:(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量.(2)画出解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等).若存在异常,则检查数据是否有误,或模型是否合适等.预习交流3用回归方程求预报值应注意哪些问题?答案:1.(1)确定性非确定性(2)相关(3)eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,n,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,n,)xi-\x\to(x)2)=eq\f(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)样本点的中心(4)随机误差解释变量预报变量预习交流1:提示:D2.yi-bxi-ayi-eq\o(y,\s\up6(^))iyi-eq\o(b,\s\up6(^))xi-eq\o(a,\s\up6(^))3.1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2)解释变量预报变量1预习交流2:提示:散点图可以说明变量间有无线性相关关系,只能粗略地说明两个变量之间关系的密切程度,而相关指数R2能精确地描述两个变量之间的密切程度.预习交流3:提示:(1)回归方程只适用于所研究的样本的总体.(2)所建立的回归方程一般都有时间性.(3)样本的取值范围会影响回归方程的适用范围.(4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.在预习中,还有哪些问题需要你在听课时加以关注?请在下列表格中做个备忘吧!我的学困点我的学疑点一、求线性回归方程某工厂1~8月份某种产品的产量与成本的统计数据见下表:月份12345678产量(吨)成本(万元)130136143149157172183188以产量为x,成本为y.(1)画出散点图;(2)y与x是否具有线性相关关系?若有,求出其回归方程.思路分析:画出散点图,观察图形的形状得x与y是否具有线性相关关系.把数值代入回归系数公式求回归方程.某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:x35404550y56412811(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程.(方程的斜率保留一个有效数字)(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求回归直线方程,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.二、线性回归分析某运动员训练次数与运动成绩之间的数据关系如下:次数(x)3033353739444650成绩(y)3034373942464851(1)作出散点图;(2)求出线性回归方程;(3)作出残差图,并说明模型的拟合效果;(4)计算R2,并说明其含义.思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合的效果和R2的含义.1.(2011山东高考,文8)某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))中的eq\o(b,\s\up6(^)),据此模型预报广告费用为6万元时销售额为().A.B. C. D.2.在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:x(元)1416182022y(件)1210753且知x与y具有线性相关关系,求出y对x的回归直线方程,并说明拟合效果的好坏.“相关指数R2、残差图”在回归分析中的作用:(1)相关指数R2是用来刻画回归效果的,由R2=1-eq\f(\i\su(i=1,n,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,n,)yi-\x\to(y)2)可知R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报精度越高.三、非线性回归分析下表为收集到的一组数据:x21232527293235y711212466115325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系,预报回归模型并计算残差;(3)利用所得模型,预报x=40时y的值.思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数.在一次抽样调查中测得样本的5个样本点,数值如下表:x124y1612521试建立y与x之间的回归方程.非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.答案:活动与探究1:解:(1)由表画出散点图,如图所示.(2)从图上可看出,这些点基本上散布在一条直线附近,可以认为x和y线性相关关系显著,下面求其回归方程,首先列出下表.序号xiyixeq\o\al(2,i)yeq\o\al(2,i)xiyi1130169002136184963143204494149222015157246491617229584171833348918188353441∑12582011128eq\x\to(x)=6.85,eq\x\to(y)=157.25.∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,8,x)iyi-8\x\to(x)\x\to(y),\i\su(i=1,8,x)\o\al(2,i)-8\x\to(x)2)=eq\f(8-8××,-8×2)≈,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=-×≈,故线性回归方程为eq\o(y,\s\up6(^))=x+5.39.迁移与应用:解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.设回归直线为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),由题知eq\x\to(x)=,eq\x\to(y)=34,则求得eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,4,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,4,)xi-\x\to(x)2)=eq\f(-370,125)≈-3.eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=34-(-3)×=161.5.∴eq\o(y,\s\up6(^))=-3x+161.5.(2)依题意有P=(-3x+)(x-30)=-3x2+x-4845=-3eq\b\lc\(\rc\)(\a\vs4\al\co1(x-\f(,6)))2+eq\f(2,12)-4845.∴当x=eq\f(,6)≈42时,P有最大值,约为426.即预测销售单价为42元时,能获得最大日销售利润.活动与探究2:解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)eq\x\to(x)=39.25,eq\x\to(y)=40.875,eq\i\su(i=1,8,x)eq\o\al(2,i)=12656,eq\i\su(i=1,8,y)eq\o\al(2,i)=13731,eq\i\su(i=1,8,x)iyi=13180,∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,8,)xi-\x\to(x)yi-\x\to(y),\i\su(i=1,8,)xi-\x\to(x)2)=eq\f(\i\su(i=1,8,x)iyi-8\x\to(x)\x\to(y),\i\su(i=1,8,x)\o\al(2,i)-8\o\al(2,x))≈5,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=-875,∴线性回归方程为eq\o(y,\s\up6(^))=5x-875.(3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.(4)计算得相关指数R2=5,说明了该运动员的成绩的差异有98.55%是由训练次数引起的.迁移与应用:解析:∵eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=eq\f(49+26+39+54,4)-×eq\f(4+2+3+5,4)=,∴回归方程为eq\o(y,\s\up6(^))=x+9.1.令x=6,得eq\o(y,\s\up6(^))=×6+=(万元).2.解:eq\x\to(x)=eq\f(1,5)×(14+16+18+20+22)=18,eq\x\to(y)=eq\f(1,5)×(12+10+7+5+3)=7.4,eq\i\su(i=1,5,x)eq\o\al(2,i)=142+162+182+202+222=1660,eq\i\su(i=1,5,y)eq\o\al(2,i)=122+102+72+52+32=327,eq\i\su(i=1,5,x)iyi=14×12+16×10+18×7+20×5+22×3=620,∴eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,x)iyi-5\x\to(x)\x\to(y),\i\su(i=1,5,x)\o\al(2,i)-5\x\to(x)2)=eq\f(620-5×18×,1660-5×182)=eq\f(-46,40)=-1.15.∴eq\o(a,\s\up6(^))=+×18=,∴回归直线方程为eq\o(y,\s\up6(^))=-x+28.1.列出残差表为:yi-eq\o(y,\s\up6(^))i0yi-eq\x\to(y)∴eq\i\su(i=1,5,)(yi-eq\o(y,\s\up6(^))i)2=,eq\i\su(i=1,5,)(yi-eq\x\to(y))2=,R2=1-eq\f(\i\su(i=1,5,)yi-\o(y,\s\up6(^))i2,\i\su(i=1,5,)yi-\x\to(y)2)≈0.994.故R2≈.活动与探究3:解:(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.(2)对两边取对数把指数关系变为线性关系,令z=lny,则有变换后的样本点应分布在直线z=bx+a,a=lnc1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:x21232527293235z求得回归直线方程为eq\o(z,\s\up6(^))=x-,∴eq\o(y,\s\up6(^))=ex.残差yi711212466115325eq\o(y,\s\up6(^))ieq\o(e,\s\up6(^))i(3)当x=40时,y=ex≈1131.迁移与应用:解:画出散点图如图所示.根据散点图可知y与x近似地呈反比例函数关系,设y=eq\f(k,x),令t=eq\f(1,x),则y=kt,原数据变为:t421y1612521由置换后的数值表作散点图如下:由散点图可以看出y与t呈近似的线性相关关系.列表如下:序号tiyitiyiteq\o\al(2,i)yeq\o\al(2,i)14166416256221224414431551254214511∑365430所以eq\x\to(t)=,eq\x\to(y)=7.2.所以eq\o(b,\s\up6(^))=eq\f(\i\su(i=1,5,t)iyi-5\x\to(t)\x\to(y),\i\su(i=1,5,t)\o\al(2,i)-5\x\to(t2))≈4,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(t)≈0.8.所以eq\o(y,\s\up6(^))=4t+0.8.所以y与x的回归方程是eq\o(y,\s\up6(^))=eq\f(4,x)+0.8.1.(2011江西高考,文8)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x(cm)174176176176178儿子身高y(cm)175175176177177则y对x的线性回归方程为().A.y=x-1B.y=x+1 C.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论