一元线性回归模型参数的最小二乘估计(2)课件高二下学期数学人教A版选择性_第1页
一元线性回归模型参数的最小二乘估计(2)课件高二下学期数学人教A版选择性_第2页
一元线性回归模型参数的最小二乘估计(2)课件高二下学期数学人教A版选择性_第3页
一元线性回归模型参数的最小二乘估计(2)课件高二下学期数学人教A版选择性_第4页
一元线性回归模型参数的最小二乘估计(2)课件高二下学期数学人教A版选择性_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8.2.2一元线性回归模型参数的最小二乘估计(2)最小二乘法:我们将

称为Y关于x的

,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做

,求得的

,叫做

b,a

,经验回归方程最小二乘法最小二乘估计复习引入其中思考1:已知儿子身高关于父亲身高x的经验回归方程为

如果一位父亲的身高为176cm,他儿子长大成人后的身高一定是177cm吗?为什么?显然不一定,因为还有其他影响儿子身高的因素,父亲身高不能完全决定儿子身高.

不过,我们可以作出推测,当父亲身高为176cm时,儿子身高一般在177cm左右.实际上,如果把这所学校父亲身高为176cm的所有儿子身高作为一个子总体,那么177cm是这个子总体的均值的估计值.追问:根据经验回归方程

中斜率的具体含义,高个子的父亲一定生高个子的儿子吗?同样,矮个子的父亲一定生矮个子的儿子吗?这里的经验回归方程

,其斜率0.839可以解释为父亲身高每增加1cm,其儿子的身高平均增加0.839cm.分析模型可以发现,高个子父亲有生高个子儿子的趋势,但一群高个子父亲的儿子们的平均身高要低于父亲们的平均身高,例如x=185(cm),则矮个子父亲有生矮个子儿子的趋势,但一群矮个子父亲的儿子们的平均身高要高于父亲们的平均身高,例如x=170(cm),则英国著名统计学家高尔顿把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.x(s)5101520304050607090120y(μm)610101316171923252946在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y(μm)与腐蚀时间x(s)之间的一组观察值如表.(1)画出散点图;(2)求y关于x的经验回归方程;(3)利用经验回归方程预测时间为100s时腐蚀深度为多少.解:(1)散点图如图所示,例题x(s)5101520304050607090120y(μm)610101316171923252946∴y关于x的经验回归方程为解:(3)根据(2)求得的经验回归方程,当腐蚀时间为100s时,即腐蚀时间为100s时腐蚀深度为约35.76μm.课本113页∴估计女儿的身高为168cm左右.1.假如女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为

已知父亲身高为175cm,请估计女儿的身高.解:练习2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得如表数据:(1)请画出上表数据的散点图;解:散点图如图所示.x681012y2356x681012y2356x681012y2356故经验回归方程为

=0.7x-2.3.(3)试根据求出的经验回归方程,预测记忆力为9的同学的判断力.即预测记忆力为9的同学的判断力为4.对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的

称为预测值,观测值减去预测值称为残差,即

例如,对于下表中的第6个观测,父亲身高为172cm,其儿子身高的观测值为y6=176(cm),预测值为残差为176-173.265=2.735(cm).编号1234567891011121314父亲身高/cm174170173169182172180172168166182173164180儿子身高/cm176176170170185176178174170168178172165182探究:残差分析残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.编号父亲身高/cm儿子身高观测值/cm儿子身高预测值/cm残差/cm1174176174.9431.0572170176171.5874.4133173170174.104-4.1044169170170.748-0.7485182185181.6553.3456172176173.2652.7357180178179.977-1.9778172174173.2650.7359168170169.9090.09110166168168.231-0.23111182178181.655-3.65512173172174.104-2.1041316416566.553-1.55314180182179.9772.023残差表:类似地,我们还可以得到其他的残差,如下表所示.为了使数据更加直观,用父亲身高作为横坐标,残差作为纵坐标,可以画出残差图,如图下所示.残差图:012345-1-2-3-4-5160165170175180185残差/cm父亲身高/cm••••••••••••••观察残差图可以直观判断模型是否满足一元线性回归模型的假设.观察残差的散点图可以发现,残差比较均匀地分布在横轴的两边.说明残差比较符合一元线性回归模型的假定,是均值为0、方差为σ2的随机变量的观测值.可见,通过一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.思考2:

观察下列四幅残差图,你认为哪一个残差满足一元线性回归模型中对随机误差的假定?图(1)显示残差与观测时间有线性关系,应将时间变量纳入模型;图(2)显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;图(3)说明残差的方差不是一个常数,随观测时间变大而变大图(4)的残差比较均匀地集中在以取值为0的横轴为对称轴的水平带状区域内.所以在四幅残差图中,只有图(4)满足一元线性回归模型对随机误差的假设.一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.2.原始数据中的可疑数据往往是残差绝对值过大的数据;3.对数据刻画效果比较好的残差图特征:残差点比较均匀的集中在水平带状区域内.1.残差等于观测值减预测值残差的性质:归纳总结课本113页

计算表8.2-2中的所有残差之和,你能发现什么规律?解:经计算可知残差的总和为0.027.但是即理论上残差的总和应等于0,这个误差是由于计算过程中四舍五入的原因导致.1.工人工资y(元)与劳动生产率x(千元)的相关关系的经验回归方程为

=50+80x,下列判断正确的是(

)A.劳动生产率为1000元时,工人工资为130元B.劳动生产率提高1000元时,工人工资平均提高80元C.劳动生产率提高1000元时,工人工资平均提高130元D.当月工资为250元时,劳动生产率为2000元解析:因为经验回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1000元时,工人工资平均提高80元.随堂检测2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是(

)解析:用残差A图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.3.某种产品的广告支出费用x(单位:万元)与销售额y(单位:万元)的数据如下表:x24568y3040605070104.某工厂对某产品的产量与成本的资料分析后有如下数据:产量x(千件)2356成本y(万元)7891214.5年份x20162017201820192020储蓄存款额y/千亿元5678105.某地随着经济的发展,居民收入逐年增长,该地一银行连续五年年底的储蓄存款情况如下表所示.为了计算方便,工作人员将上表的数据进行了处理,令t=x-2015,z=y-5,得到下表.t12345z01235(1)求z关于t的经验回归方程;(2)通过(1)中的方程,求出y关于x的经验回归方程;(3)用所求经验回归方程预测到2022年年底,该地此银行储蓄存款额可达到多少?t12345z01235解:∴z关于t的经验回归方程为∴y关于x的经验回归方程为∴预测到2022年年底,该地此银行储蓄存款额可达到12千亿元.课堂小结1.残差:对于响应变量Y,通过观测得到的数据称为

值,通过经验回归方程得到的

称为

减去

称为残差.2.残差分析:

是随机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论