




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8.2一元线性回归模型及其应用8.2.2一元线性回归模型参数的最小二乘估计复习回顾1、经验回归方程:
我们将称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.
这种求经验回归方程的方法叫做最小二乘法.2、最小二乘估计:经验回归方程中的参数
计算公式为:例题解析1、经验表明,对于同一树种,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经验回归方程.编号123456789101112胸径/cm18.120.122.224.426.028.329.632.433.735.738.340.2树高/m18.819.221.021.022.122.122.422.623.024.323.924.7解:以胸径为横坐标,树高为纵坐标作散点图
在右图中,散点大致分布在一条从左下角到右上角的直线附近,表明两个变量线性相关,并且是正相关,因此可以用一元线性回归模型刻画树高与胸径之间的关系.一元线性回归模型的应用例题解析1、经验表明,对于同一树种,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经验回归方程.编号123456789101112胸径/cm18.120.122.224.426.028.329.632.433.735.738.340.2树高/m18.819.221.021.022.122.122.422.623.024.323.924.7解:用d表示胸径,h表示树高,根据据最小二乘法,计算可得经验回归方程为:相应的经验回归直线如图所示.一元线性回归模型的应用例题解析残差分析:根据经验回归方程,由胸径的数据可以计算出树高的预测值(精确到0.1)以及相应的残差,如下表所示.一元线性回归模型的应用编号胸径/cm树高观测值/m树高预测值/m残差/m118.118.819.4-0.6220.119.219.9-0.7322.221.020.40.6424.421.020.90.1526.022.121.30.8628.322.121.90.2729.622.422.20.2832.422.622.9-0.3933.723.023.2-0.21035.724.323.70.61138.323.924.4-0.51240.224.724.9-0.2例题解析以胸径为横坐标,残差为纵坐标,作残差图,得到下图.一元线性回归模型的应用30252015-1.0-0.50.00.51.0·······残差/m·····354045胸径/cm观察残差表和残差图,可以看到残差的绝对值最大是0.8,所有残差分布在以横轴为对称轴、宽度小于2的带状区域内.可见经验回归方程较好地刻画了树高与胸径的关系,我们可以根据经验回归方程由胸径预测树高.例题解析2、人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程一元线性回归模型的应用编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.95解:以成对数据中的世界纪录产生年份为横坐标,世界纪录为纵坐标作散点图,得到下图
在左图中,散点看上去大致分布在一条直线附近,似乎可用一元线性回归模型建立经验回归方程.例题解析2、人们常将男子短跑100m的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑100m世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑100m世界纪录关于纪录产生年份的经验回归方程一元线性回归模型的应用编号12345678年份18961912192119301936195619601968记录/s11.8010.6010.4010.3010.2010.1010.009.95解:用Y表示男子短跑100m的世界纪录,t表示纪录产生的年份,利用一元线性回归模型来刻画世界纪录和世界纪录产生年份之间的关系.根据最小二乘法,由表中的数据得到经验回归方程为:
将经验回归直线叠加到散点图,得到下图:从图中可以看到,经验回归方程较好地刻画了散点的变化趋势,请再仔细观察图形,你能看出其中存在的问题吗自主探究思考1:从图中可以看到,经验回归方程较好地刻画了散点的变化趋势,请再仔细观察图形,你能看出其中存在的问题吗
第一个世界纪录所对应的散点远离经验回归直线,并且前后两时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.
这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的非线性相关的特征.自主探究思考2:你能对模型进行修改,以使其更好地反映散点的分布特征吗?仔细观察右图,可以发现散点更趋向于落在中间下凸且递减的某条曲线附近.回顾已有的函数知识,可以发现函数y=-lnx的图象具有类似的形状特征
注意到100m短跑的第一个世界纪录产生于1896年,因此可以认为散点是集中在曲线y=f(t)=c1+c2ln(t-1895)的周围,其中c1、c2为未知参数,且c2<0.自主探究思考3:这是一个非线性经验回归函数,如何利用成对数据估计参数c1、c2y=f(t)=c1+c2ln(t-1895)为了利用一元线性回归模型估计参数参数c1、c2,引进一个中间变量x,令x=ln(t-1895),则Y=c2x+c1.编号12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29记录/s11.8010.6010.4010.3010.2010.1010.009.95通过x=ln(t-1895),将年份变量数据进行变换,得到新的成对数据,如下表.自主探究得到散点图如下:编号12345678x0.002.833.263.563.714.114.174.29记录/s11.8010.6010.4010.3010.2010.1010.009.95由表中的数据得到经验回归方程为:在上图中画出经验回归直线,如图所示.上图表明,经验回归方程对于成对数据具有非常好的拟合精度.将x=ln(t-1895)代入:自主探究思考4:对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?(1)直接观察法:在同一坐标系中画出成对数据散点图、非线性经验回归方程②的图象(蓝色)以及经验回归方程①的图象(红色).我们发现,散点图中各散点都非常靠近②的图象,表明非线性经验回归方程②对于原始数据的拟合效果远远好于经验回归方程①.自主探究思考4:对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?(2)残差分析:残差平方和越小,模型拟合效果越好.残差平方和:Q2明显小于Q1,说明非线性回归方程的拟合效果要优于线性回归方程.自主探究思考4:对于通过创纪录时间预报世界纪录的问题,我们建立了两个回归模型,得到了两个回归方程,你能判断哪个回归方程拟合的精度更好吗?(3)利用决定系数R2刻画回归效果..R2越大,表示残差平方和越小,即模型的拟合效果越好R2越小,表示残差平方和越大,即模型的拟合效果越差.①和②的R2分别为0.7325和0.9983显然0≤R2≤1,R2越接近1,则线性回归刻画的效果越好.在一元线性回归模型中R2=r2,即决定系数R2等于响应变量与解释变量的样本相关系数r的平方.概念讲解分析模型的回归效果方法:(2)残差平方和(1)残差分析好的回归方程对应的残差散点图应是均匀地分布在横轴两侧的带状区域内.且带状区域越窄,说明模型拟合效果越好.列残差表画残差图(3)决定系数R2法残差平方和越小,说明模型拟合效果越好.R2越大,说明模型拟合效果越好.概念讲解建立线性回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量.(2)画出解释变量与响应变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型.(4)按一定规则(如最小二乘法)估计经验回归方程中的参数.(5)得出结果后需进行线性回归分析.①残差平方和越小,模型的拟合效果越好.②决定系数R2取值越大,说明模型的拟合效果越好.注意:若题中给出了检验回归方程是否理想的条件,则根据题意进行分析检验即可.概念讲解解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,响应变量为y;(2)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数、反比例函数等)作比较,选取拟合效果好的函数模型;(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;(4)分析拟合效果:通过计算决定系数来判断拟合效果;(5)写出非线性经验回归方程.随堂练习1、一只药用昆虫的产卵数y与一定范围内的温度x有关,现收集了6组观测数据列于表中:温度x/℃212324272932产卵数y/个61120275777经计算得:线性回归残差的平方和:其中xi、yi分别为观测数据中的温度和产卵数,i=1,2,3,4,5,6.e8.0605≈3167(1)若用线性回归模型拟合,求y关于x的回归方程
(精确到0.1);(2)若用非线性回归模型拟合,求得y关于x回归方程为
,且决定系数R2=0.9522.②用拟合效果好的模型预测温度为35℃时该种药用昆虫的产卵数.(结果取整数).①试与(1)中的线性回归模型相比较,用R2说明哪种模型的拟合效果更好随堂练习解:(1)由题意得,n=6,所以y关于x的经验回归方程为(2)①对于线性回归模型,相关系数∵0.9398<0.9522∴非线性回归模型的回归方程比线性回归方程为
拟合的拟合效果更好
随堂练习(2)②由①知拟合效果好的模型为所以当x=35时,所以预测温度为35℃时该种药用昆虫的产卵数为190个.概念讲解在使用经验回归方程进行预测时,需注意以下问题1、回归方程只适用于我们所研究的样本的总体;2、我们所建立的回归方程一般都有时效性;3、解释变量的取值范围不能离开样本数据的范围太远.样本采集的范围会影响回归方程的适用范围;4、不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可取值的平均值.课堂小结1、残差平方和:2、最小二乘法将称为Y关于x的经验回归方程.3、判断模型拟合的效果:①残差分析②决定系数R2法R2越大,表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年悬浮床加氢裂化催化剂项目建议书
- 幼儿行为观察记录培训
- 护理反思日记实践体系
- 社区护理评估方法
- 经济适用房满年限上市买卖及共有权证明注销合同
- 影视行业服装道具损坏赔偿补充合同
- 医疗机构护理劳务外包保密协议书
- 能源行业市场调研与分析补充协议
- 直播带货平台与商家佣金分成协议
- 豪华私人飞机氧气舱设施租赁服务协议
- 2024年工艺美术研究报告
- 南京师范大学泰州学院《宏观经济学》2022-2023学年第一学期期末试卷
- 《民航服务与沟通学》课件-第18讲 儿童旅客
- 儿科发热护理常规
- 房地产金融不良资产处置
- 《临床药学》课件
- 检验科个人防护培训材料
- 工业自动化生产线操作手册
- 经济与社会如何用决策思维洞察生活尔雅答案
- 四川省成都市2021年中考英语真题(含答案)
- GB/T 18238.1-2024网络安全技术杂凑函数第1部分:总则
评论
0/150
提交评论