一元线性回归模型参数的最小二乘估计(2)课件【知识精讲精研+能力培优提升】高二下学期数学人教A版(2019)选择性必修第三册_第1页
一元线性回归模型参数的最小二乘估计(2)课件【知识精讲精研+能力培优提升】高二下学期数学人教A版(2019)选择性必修第三册_第2页
一元线性回归模型参数的最小二乘估计(2)课件【知识精讲精研+能力培优提升】高二下学期数学人教A版(2019)选择性必修第三册_第3页
一元线性回归模型参数的最小二乘估计(2)课件【知识精讲精研+能力培优提升】高二下学期数学人教A版(2019)选择性必修第三册_第4页
一元线性回归模型参数的最小二乘估计(2)课件【知识精讲精研+能力培优提升】高二下学期数学人教A版(2019)选择性必修第三册_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2.2一元线性回归模型参数的最小二乘估计(2)8.2一元线性回归模型及其应用1.经验回归方程:

2.最小二乘估计:

复习回顾3.分析模型的回归效果方法:

利用残差图直观判断模型是否满足一元线性回归模型的假设。残差散点图应均匀地分布在横轴两侧,呈带状,宽度越窄,说明模型拟合精度越高。也可以利用决定系数R2判断回归模型的拟合效果。编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.95问题情境

人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程

解:以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图,得到散点图.图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.相关系数r=-0.86

编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.95问题情境

人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程

解:用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份根据最小二乘法,由表中的数据得到经验回归方程为:将经验回归直线叠加到散点图上。观察:从图中可以看到,经验回归方程较好地刻画了散点的变化趋,请再仔细观察图形,你能看出其中存在的问题吗?例如,第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.答案:散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.修正模型,以使其更好地反映散点的分布特征:仔细观察右图,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近.函数y=-lnx的图象具有类似的形状特征.由于到100m短跑的第一个世界纪录产生于1896年,因此可设非线性回归方程为:

y=f(t)=c1+c2ln(t-1895)

(其中c1、c2为未知参数,且c2<0).如何利用成对数据估计参数c1和c2?引进一个中间变量x,令x=ln(t-1895),,则Y=c2x+c1.编号12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29记录/s11.8010.6010.4010.3010.2010.1010.009.95借助一元线性回归模型和新的成对数据,对参数c1和c2作出估计画出上表中成对数据的散点图,散点分布呈现出很强的线性相关特征.通过x=ln(t-1895)

,将年份变量数据进行变换,得到新的成对数据,如下表.引进一个中间变量x,令x=ln(t-1895),,则Y=c2x+c1.编号12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29记录/s11.8010.6010.4010.3010.2010.1010.009.95画出上表中成对数据的散点图,通过x=ln(t-1895)

,将年份变量数据进行变换,得到新的成对数据,如下表.根据最小二乘法,由表中的数据得到经验回归方程为:在上图中画出经验回归直线,如图所示.将x=ln(t-1895)代入

得到由创纪录年份预报世界纪录的经验非线性回归方程:②①我们发现,散点图中各散点都非常靠近②的图像,表明非线性经验回归方程②对于原始数据的拟合效果远远好于经验回归方程①.

将两个回归直线进行对比,可以发现修正模型后x和Y之间的线性相关程度比原始样本数据的线性相关程度强得多.(1)用残差来比较这两个经验回归方程对数据刻画的好坏观察各项残差的绝对值,发现经验回归方程②远远小于①,即经验回归方程②的拟合效果要远远好于①.编号12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022两个经验回归方程的残差(精确到0.001)如下表所示.用ti表示编号为i的年份数据,用yi表示编号为i的记录数据,则经验回归方程①和②的残差计算公式分别为

(2)用残差平方和来比较这两个经验回归方程对数据刻画的好坏编号12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022两个经验回归方程的残差(精确到0.001)如下表所示.它们的残差平方和分别是:

可知Q2小于Q1,因此在残差平方和最小的标准下,非线性回归模型的拟合效果要优于一元线性回归模型的拟合效果.(3)用决定系数R2来比较这两个经验回归方程对数据刻画的好坏编号12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022两个经验回归方程的残差(精确到0.001)如下表所示.由上述残差表可算出经验回归方程①和②的决定系数R2分别为

由于R22>R12

,因此经验回归方程②的刻画效果比经验回归方程①的好很多.分析模型的回归效果方法:(2)残差平方和(1)残差分析好的回归方程对应的残差散点图应是均匀地分布在横轴两侧的带状区域内.且带状区域越窄,说明模型拟合效果越好.列残差表画残差图(3)决定系数R2法残差平方和越小,说明模型拟合效果越好.R2越大,说明模型拟合效果越好.线性相关非线性相关

对于非线性经验回归问题,可以画出已知数据的散点图,把它与学过的各种函数(幂函数、对数函数、指数函数等)的图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题转化为经验回归方程问题来解决.解决非线性回归问题的步骤画散点图根据散点图,选择恰当的拟合函数进行恰当的变换,转化成线性函数,用最小二乘法求经验回归方程通过相应的变换,即可得非线性经验回归方程选拟合函数根据原始数据(x,y)画散点图变换求解变换还原得出结果后需进行线性回归分析.——决定系数R2取值越大,说明模型的拟合效果越好.知识海洋非线性经验回归方程当经验回归方程并非形如y=bx+a(a,b∈R)时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:曲线方程变换公式变换后的线性关系式y=axbc=lna,v=lnx,u=lnyu=c+bvc=lna,u=lnyu=c+bxc=ln

a,,u=lnyu=c+bvy=a+blnxv=lnxy=a+bvy=a+bv=,u=yu=a+bv拓展练习1

某企业为确定下一年投入某种产品的研发费用,需了解年研发费用x(单位:千万元)对年销售量y(单位:千万件)的影响,统计了近10年投入的年研发费用xi与年销售量yi(i=1,2,‧‧‧,10)的数据,得到散点图如图所示.(1)利用散点图判断y=a+bx和y=c‧xd(其中c,d均为大于0的常数)哪一个更适合作为年销售量y和年研发费用x的回归方程类型(只要给出判断即可,不必说明理由);(2)对数据作出如下处理,令ui=lnxi,vi=lnyi,得到相关统计量的值如下.根据第(1)问的判断结果及表中数据,求y关于x的回归方程.附:对于一组数据(u1,v1),(u2,v2),‧‧‧,(un,vn),其回归直线的斜率和截距的最小二乘估计分别为解:(1)由散点图可知,选择回归类型y=c‧xd更合适.(2)对y=c‧xd两边取对数,的lny=lnc+dlnx,拓展练习2

某地今年上半年患某种传染病的人数y(人)与月份x(月)之间满足函数关系,模型为y=aebx,确定这个函数解析式.月份x/月123456人数y/人526168747883解:x123456u=lny3.95124.11094.21954.30414.35674.4188(1)作GDP和年份的散点图,根据该图猜想它们之间的关系可以用什么模型描述;(2)建立年份为解释变量,GDP为响应变量的一元线性回归模型,并计算残差;(3)根据你得到的一元线性回归模型,预测2017年的GDP,看看你的预测值与实际的GDP的误差是多少;(4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由.课本120页2.1997-2006年我国的国内生产总值(GDP)的数据如下:年份GDP/亿元年份GDP/亿元199779715.02002121727.4199885195.52003137422.0199990564.42004161840.22000100280.12005187318.92001110863.12006219438.5(5)随着时间的发展,又收集到2007-2016年的GDP数据如下:建立年份(1997-2016)为解释变量,GDP为响应变量的经验回归方程,并预测2017年的GDP,与实际的GDP误差是多少?你能发现什么?年份GDP/亿元年份GDP/亿元2007270232.32012540367.42008319515.52013595244.42009349081.42014643974.02010413030.32015689052.12011489300.62016744127.2(1)作GDP和年份的散点图,根据该图猜想它们之间的关系可以用什么模型描述;课本120页2.1997-2006年我国的国内生产总值(GDP)的数据如下:年份GDP/亿元年份GDP/亿元199779715.02002121727.4199885195.52003137422.0199990564.42004161840.22000100280.12005187318.92001110863.12006219438.5解:(1)画GDP与年份的散点图,如图所示,可以观察到随着年份的增加GDP也随之增加,GDP值与年份呈现近似线性关系,可以用一元线性回归模型刻画.(2)建立年份为解释变量,GDP为响应变量的一元线性回归模型,并计算残差;(3)根据你得到的一元线性回归模型,预测2017年的GDP,看看你的预测值与实际的GDP的误差是多少;课本120页2.1997-2006年我国的国内生产总值(GDP)的数据如下:解:(2)用y表示GDP的值,t表示年份,用一元线性回归模型拟合数据,用统计软件计算,得到经验回归方程为残差的计算结果见下表.年份1997199819992000200120022003200420052006残差171267752-1734-6873-11145-15145-14296-4732589223157

(3)2017年的GDP预报值为359684亿元,2017年的实际的GDP为820754亿元,预测值比实际值少461070亿元.(4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由.课本120页2.1997-2006年我国的国内生产总值(GDP)的数据如下:解:(4)上面建立的回归方程的R2=0.9213,说明在1997-2006年内,该模型年份能够解释92.13%的GDP值变化,因此所建立的模型较好地刻画了GDP和年份的关系.但因为残差呈现一定的规律性,中间是负数,两边是正数,所以可以考虑用非线性回归模型拟合数据.(5)随着时间的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论