人教版2017高中数学选修1-2《回归分析》_第1页
人教版2017高中数学选修1-2《回归分析》_第2页
人教版2017高中数学选修1-2《回归分析》_第3页
人教版2017高中数学选修1-2《回归分析》_第4页
人教版2017高中数学选修1-2《回归分析》_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.3.13.1回归分析的基本回归分析的基本思想思想及其初步应用及其初步应用(第一课时)(第一课时). 1 1通过典型案例的探究,进一步了解回归分析的基本思想、通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用方法及其初步应用 2 2让学生经历数据处理的过程,培养他们对数据的直观感让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用,通过使用转化觉,体会统计方法的特点,认识统计方法的应用,通过使用转化后的数据,求相关指数,运用相关指数进行数据分析、处理的方后的数据,求相关指数,运用相关指数进行数据分析、处理的方法法 3 3从实际问题中发现已有

2、知识的不足,激发好奇心,求知从实际问题中发现已有知识的不足,激发好奇心,求知欲,通过寻求有效的数据处理方法,开拓学生的思路,培养学生欲,通过寻求有效的数据处理方法,开拓学生的思路,培养学生的探索精神和转化能力,通过案例的分析使学生了解回归分析在的探索精神和转化能力,通过案例的分析使学生了解回归分析在实际生活中的应用,增强数学取之生活,用于生活的意识,提高实际生活中的应用,增强数学取之生活,用于生活的意识,提高学习兴趣学习兴趣. 本节课通过必修本节课通过必修3 3熟悉有例题回顾线性相关关系知熟悉有例题回顾线性相关关系知识,通过实际问题中发现已有知识的不足,引出随机识,通过实际问题中发现已有知识的

3、不足,引出随机误差、残差、残差分析的概念,进而运用残差来进行误差、残差、残差分析的概念,进而运用残差来进行数据分析,通过例题讲解掌握用残差分析判断线性回数据分析,通过例题讲解掌握用残差分析判断线性回归模型的拟合效果。掌握建立回归模型的步骤。归模型的拟合效果。掌握建立回归模型的步骤。 本节内容学生内容不易掌握,通过知识整理与比本节内容学生内容不易掌握,通过知识整理与比较引导学生进行区分、理解。通过对典型案例的探究,较引导学生进行区分、理解。通过对典型案例的探究,练习进行巩固了解回归分析的基本思想方法和初步应练习进行巩固了解回归分析的基本思想方法和初步应用用.从某大学中随机选取从某大学中随机选取8

4、 8名女大学生,其身高和体重数名女大学生,其身高和体重数据如下表所示:据如下表所示: 怎样根据一名女大学生的身高预报她的体重,并预怎样根据一名女大学生的身高预报她的体重,并预报一名身高为报一名身高为172 cm172 cm的女大学生的体重?的女大学生的体重? 编号12345678身高/cm165165157170175165155170体重/kg4857505464614359.niii 1n2ii 1baybx.xxyyxx$根据必修根据必修3 2.33 2.3变量相关关系解决这个问题的方法:变量相关关系解决这个问题的方法:1.1.先判断是两个变量是否具有线性相关关系先判断是两个变量是否具有

5、线性相关关系(1)(1)作散点图,如图所示作散点图,如图所示( (见课本见课本P82P82:图:图3.1-1)3.1-1)2.2.根据线性回归的系数公式,根据线性回归的系数公式,求回归直线方程求回归直线方程 0.849x-85.7120.849x-85.712y$3.3.由线性回归方程可以估计其位由线性回归方程可以估计其位置值为置值为 60.316(60.316(千克千克) )左右。左右。 y$具有较好的线性相关关系具有较好的线性相关关系性质:回归直线一定过样本中心点性质:回归直线一定过样本中心点(2)(2)计算计算相关系数相关系数.这些点并不都在同一条直线上,上述直线并不能精确这些点并不都在

6、同一条直线上,上述直线并不能精确地反映地反映x与与y之间的关系,之间的关系,y 的值不能完全由的值不能完全由x 确定,确定,它们之间是统计相关关系,它们之间是统计相关关系,y 的实际值与估计值之间的实际值与估计值之间存在着误差存在着误差因此因此, ,在统计学中设它们的线性回归模型为在统计学中设它们的线性回归模型为: :ybxae其中其中a,ba,b为模型的未知参数为模型的未知参数,e,e为为y y与与bx+abx+a之间的误差,之间的误差,称它为随机误差,它是随机变量。且称它为随机误差,它是随机变量。且 2E e0,D e 线性回归模型完整表达式为线性回归模型完整表达式为 2y bx a eE

7、 e0,D e, ,x x称为称为_变量变量,y,y称为称为_变量变量. .解释解释预报预报.线性回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源线性回归模型中的预报值线性回归模型中的预报值 与真实情况与真实情况y y引引起的误差;起的误差;观测与计算观测与计算( (用用 代替代替b a)b a)产生的误差;产生的误差;省略了一些因素的影响省略了一些因素的影响( (如生活习惯等)产如生活习惯等)产生的误差生的误差. .y$ba$.在线性回归模型中,在线性回归模型中,e e为用为用bx+abx+a的预报真实值的预报真实值y y的随机误的随机误差,它是一个不可观测的量,那么应该怎样研究

8、随机误差,它是一个不可观测的量,那么应该怎样研究随机误差?差?在实际应用中,我们用在实际应用中,我们用 估计估计 bx+a y bx a$ $ey- bxa所以所以 的估计量为的估计量为ey y $iix,yi 1,2,3,nL对于样本点对于样本点iiieybxai1,2,3,nLiiiiieyyybxan1,2,3,n$L它们的随机误差为它们的随机误差为估计值为估计值为称相应于点称相应于点 的残差的残差iiiex ,y.坐标纵轴为残差变量,横轴可以有不同的选择;坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴若模型选择的正确,残差图中的点应该分布在以横

9、轴为中心的带形区域;为中心的带形区域;对于远离横轴的点,要特别注意。对于远离横轴的点,要特别注意。错误数据模型问题身高与体重残差图异常点残差的作用残差的作用1.1.通过残差表或残差图发现原始数据中的可疑数据通过残差表或残差图发现原始数据中的可疑数据.通过残差通过残差 来判断模型拟合的效果这种分来判断模型拟合的效果这种分析工作称为析工作称为残差分析残差分析1, 2, 3, .ne e ee.通过残差表或残差图判断模型拟合的效果是直观判断,通过残差表或残差图判断模型拟合的效果是直观判断,如何精确判断模型拟合的效果?如何精确判断模型拟合的效果?引入参数引入参数R R2 2n2ii2i 1n2ii 1

10、yyR1yy $n2ii 1yy来精确该画模型拟合效果来精确该画模型拟合效果n2iii 1yy$对于己获取的样本数据,在上式子中对于己获取的样本数据,在上式子中 是定是定值,值, 越小,即残差平方和越小,越小,即残差平方和越小,R R2 2越大,说越大,说明模型拟合效果越好。明模型拟合效果越好。引入例中参数引入例中参数R R2 2计算得约为计算得约为0.640.64说明女大学生体重差说明女大学生体重差异有百分之六十四是由身高引起的异有百分之六十四是由身高引起的. .知识点知识点 线性回归分析线性回归分析1.1.对线性回归模型的三点说明对线性回归模型的三点说明(1)(1)非确定性关系:线性回归模

11、型非确定性关系:线性回归模型y=bx+a+ey=bx+a+e与确与确定性函数定性函数y=bx+ay=bx+a相比,它表示相比,它表示y y与与x x之间是统计相之间是统计相关关系关关系( (非确定性关系非确定性关系),),其中的随机误差其中的随机误差e e提供了提供了选择模型的准则以及在模型合理的情况下探求最选择模型的准则以及在模型合理的情况下探求最佳估计值佳估计值a a,b b的工具的工具. .(2)(2)线性回归方程线性回归方程 中中 , 的意义是:以的意义是:以 为基为基数,数,x x每增加每增加1 1个单位,个单位,y y相应地平均增加相应地平均增加 个单位个单位. .(3)(3)线性

12、回归模型中随机误差的主要来源线性回归模型中随机误差的主要来源线性回归模型与真实情况引起的误差;线性回归模型与真实情况引起的误差;观测与计算产生的误差;观测与计算产生的误差;省略了一些因素的影响产生的误差省略了一些因素的影响产生的误差. .y bx a$ $b$a$a$b$.2.2.线性回归模型的模拟效果线性回归模型的模拟效果(1)(1)残差图法残差图法: :观察残差图观察残差图, ,如果残差点比较均匀如果残差点比较均匀地落在水平的带状区域中地落在水平的带状区域中, ,说明选用的模型比较说明选用的模型比较合适合适, ,这样的带状区域的宽度越窄这样的带状区域的宽度越窄, ,说明模型拟合说明模型拟合

13、精度越高精度越高, ,回归方程的预报精度越高回归方程的预报精度越高. .(2)(2)残差的平方和法残差的平方和法: :一般情况下一般情况下, ,比较两个模型的残比较两个模型的残差比较困难差比较困难( (某些样本点上一个模型的残差的绝对值某些样本点上一个模型的残差的绝对值比另一个模型的小比另一个模型的小, ,而另一些样本点的情况则相反而另一些样本点的情况则相反),),故通过比较两个模型的残差的平方和的大小来判断模故通过比较两个模型的残差的平方和的大小来判断模型的拟合效果型的拟合效果. .残差平方和越小的模型残差平方和越小的模型, ,拟合的效果越拟合的效果越好好. .(3)R(3)R2 2法法:R

14、:R2 2的值越大的值越大, ,说明残差平方和越小说明残差平方和越小, ,也就是说也就是说模型拟合的效果越好模型拟合的效果越好. .3.3.相关系数与相关系数与R R2 2(1)R(1)R2 2是相关系数的平方是相关系数的平方, ,其变化范围为其变化范围为0,1,0,1,而相而相关系数的变化范围为关系数的变化范围为-1,1.-1,1.(2)(2)相关系数可较好地反映变量的相关性及正相关或相关系数可较好地反映变量的相关性及正相关或负相关负相关, ,而而R R2 2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果. .(3)(3)当当|r|r|接近于接近于1 1时说明两变量的相关性较强时说

15、明两变量的相关性较强, ,当当|r|r|接近于接近于0 0时说明两变量的相关性较弱时说明两变量的相关性较弱, ,而当而当R R2 2接近于接近于1 1时时, ,说明线性回归方程的拟合效果较好说明线性回归方程的拟合效果较好. .【微思考微思考】(1)(1)残差与我们平时说的误差是一回事儿吗残差与我们平时说的误差是一回事儿吗? ?提示提示: :这两个概念在某程度上具有很大的相似性这两个概念在某程度上具有很大的相似性, ,都都是衡量不确定性的指标是衡量不确定性的指标, ,二者的区别是二者的区别是: :误差与测量误差与测量有关有关, ,误差可以衡量测量的准确性误差可以衡量测量的准确性, ,误差越大表示

16、测误差越大表示测量越不准确量越不准确; ;残差与预测有关残差与预测有关, ,残差大小可以衡量预残差大小可以衡量预测的准确性测的准确性, ,残差越大表示预测越不准确残差越大表示预测越不准确. .(2)R(2)R2 2与原来学过的相关系数与原来学过的相关系数r r有区别吗有区别吗? ?提示提示: :它们都是刻画两个变量之间的的相关关系的它们都是刻画两个变量之间的的相关关系的, ,区区别是别是R R2 2表示解释变量对预报变量变化的贡献率表示解释变量对预报变量变化的贡献率, ,其表其表达式为达式为R R2 2=1- ;=1- ;相关系数相关系数r r是检验两个变量相关性的强弱程度是检验两个变量相关性

17、的强弱程度, ,其表达式为其表达式为 n2iii 1n2ii 1yyyy$nniii ii 1i 1nnnn222222iiiii 1i 1i 1i 1x x y yxy nx yr.x xy y( xnx)( yny).建立回归模型的基本步骤建立回归模型的基本步骤(1)(1)确定研究对象,明确哪个变量是解释变量,哪个变量确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量是预报变量(2)(2)画出确定好的解释变量和预报变量的散点图,观察它画出确定好的解释变量和预报变量的散点图,观察它们之间的关系们之间的关系( (如是否存在线性关系等如是否存在线性关系等) )(3)(3)由经验确定回归方程

18、的类型由经验确定回归方程的类型( (如我们观察到数据呈线如我们观察到数据呈线性关系,则选用线性回归方程性关系,则选用线性回归方程) )(4)(4)按一定规则按一定规则( (如最小二乘法如最小二乘法) )估计回归方程中的参数估计回归方程中的参数(5)(5)得出结果后分析残差图是否有异常得出结果后分析残差图是否有异常( (如个别数据对应如个别数据对应残差过大,或残差呈现不随机的规律性等残差过大,或残差呈现不随机的规律性等) )若存在异若存在异常,则检查数据是否有误,或模型是否合适等常,则检查数据是否有误,或模型是否合适等. 为研究重量为研究重量x x( (单位:克单位:克) )对弹簧长度对弹簧长度

19、y y( (单位:单位:厘米厘米) )的影响,对不同重量的的影响,对不同重量的6 6个物体进行测量,数个物体进行测量,数据如下表所示:据如下表所示:x51015202530y7.258.128.959.9010.911.8(1)(1)作出散点图并求线性回归方程;作出散点图并求线性回归方程;(2)(2)求出求出R R2 2;(3)(3)进行残差分析进行残差分析作残差分析时,一般从以下几个方面予以说明:作残差分析时,一般从以下几个方面予以说明:(1)(1)散点图;散点图;(2)(2)相关指数;相关指数;(3)(3)残差图中的异常点残差图中的异常点和样本点的带状分布区域的宽窄和样本点的带状分布区域的

20、宽窄.解答解答 (1) (1)散点图如图散点图如图 .0.050.0050.080.0450.040.0252.241.370.540.411.412.31.(3)(3)由残差表中的数值可以看出第由残差表中的数值可以看出第3 3个样本点的残差比较个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过由表中数据可以看出残差点比较均匀地落在不超过0.150.15的狭窄的水平带状区域中,说明选用的线性回归模

21、型的的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关精度较高,由以上分析可知,弹簧长度与拉力成线性关系系规律方法规律方法当资料点较少时,也可以利用残差表进行残当资料点较少时,也可以利用残差表进行残差分析,注意计算数据要认真细心,残差分析要全面差分析,注意计算数据要认真细心,残差分析要全面.1.1.判一判判一判( (正确的打正确的打“”, ,错误的打错误的打“”)”)(1)(1)残差平方和越小残差平方和越小, ,线性回归方程拟合效果越好线性回归方程拟合效果越好.(.() )(2)(2)在画两个变量的散点图时在画两个变量的散点图时, ,预报变量在预报

22、变量在x x轴上轴上, ,解释变解释变量在量在y y轴上轴上. .( () )(3)R(3)R2 2越接近于越接近于1,1,线性回归方程的拟合效果越好线性回归方程的拟合效果越好.(.() ).2.2.做一做做一做( (请把正确的答案写在横线上请把正确的答案写在横线上) )(1)(1)从散点图上看从散点图上看, ,点散布在从左下角到右上角的点散布在从左下角到右上角的区域内区域内, ,两个变量的这种相关关系为两个变量的这种相关关系为. .(2)(2)在残差分析中在残差分析中, ,残差图的纵坐标为残差图的纵坐标为. .(3)(3)如果发现散点图中所有的样本点都在一条直如果发现散点图中所有的样本点都在

23、一条直线上线上, ,则残差平方和等于则残差平方和等于, ,解释变量和预报解释变量和预报变量之间的相关系数变量之间的相关系数R R等于等于. .正相关正相关残差残差0 01 1或或-1-1.3.已知某种商品的价格已知某种商品的价格x(元元)与需求量与需求量y(件件)之间的之间的关系有如下一组数据:关系有如下一组数据:x1416182022y1210753求求y对对x的回归直线方程,并说明回归模型拟合效果的回归直线方程,并说明回归模型拟合效果的好坏的好坏.00.30.40.10.24.62.60.42.44.4.3.13.1回归分析的基回归分析的基本思想及其初步应用本思想及其初步应用(第二课时)(

24、第二课时). 1 1通过典型案例的探究,进一步了解回归分析的基本思想、通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用方法及其初步应用 2 2让学生经历数据处理的过程,培养他们对数据的直观感让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用,通过使用转化觉,体会统计方法的特点,认识统计方法的应用,通过使用转化后的数据,求相关指数,运用相关指数进行数据分析、处理的方后的数据,求相关指数,运用相关指数进行数据分析、处理的方法法 3 3从实际问题中发现已有知识的不足,激发好奇心,求知从实际问题中发现已有知识的不足,激发好奇心,求知欲,通过寻求

25、有效的数据处理方法,开拓学生的思路,培养学生欲,通过寻求有效的数据处理方法,开拓学生的思路,培养学生的探索精神和转化能力,通过案例的分析使学生了解回归分析在的探索精神和转化能力,通过案例的分析使学生了解回归分析在实际生活中的应用,增强数学取之生活,用于生活的意识,提高实际生活中的应用,增强数学取之生活,用于生活的意识,提高学习兴趣学习兴趣. 本节课通过例题线性相关关系知识,通过实际问本节课通过例题线性相关关系知识,通过实际问题中发现已有知识的不足,引导学生寻找解决非线性题中发现已有知识的不足,引导学生寻找解决非线性回归问题思想与方法,培养学生化归数学思想。通过回归问题思想与方法,培养学生化归数

26、学思想。通过知识的整理,通过例题讲解掌握解决非线性回归问题。知识的整理,通过例题讲解掌握解决非线性回归问题。 本节内容学生内容不易掌握,通过知识整理与比本节内容学生内容不易掌握,通过知识整理与比较引导学生进行区分、理解。通过对典型案例的探究,较引导学生进行区分、理解。通过对典型案例的探究,练习进行巩固解决非线性回归基本思想方法及初步应练习进行巩固解决非线性回归基本思想方法及初步应用用.建立回归模型的基本步骤建立回归模型的基本步骤(1)(1)确定研究对象,明确哪个变量是解释变量,哪个变量确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量是预报变量(2)(2)画出确定好的解释变量和预报变量的

27、散点图,观察它画出确定好的解释变量和预报变量的散点图,观察它们之间的关系们之间的关系( (如是否存在线性关系等如是否存在线性关系等) )(3)(3)由经验确定回归方程的类型由经验确定回归方程的类型( (如我们观察到数据呈线如我们观察到数据呈线性关系,则选用线性回归方程性关系,则选用线性回归方程) )(4)(4)按一定规则按一定规则( (如最小二乘法如最小二乘法) )估计回归方程中的参数估计回归方程中的参数(5)(5)得出结果后分析残差图是否有异常得出结果后分析残差图是否有异常( (如个别数据对应如个别数据对应残差过大,或残差呈现不随机的规律性等残差过大,或残差呈现不随机的规律性等) )若存在异

28、若存在异常,则检查数据是否有误,或模型是否合适等常,则检查数据是否有误,或模型是否合适等.(6)(6)参数参数R R2 2与相关系数与相关系数r r提示提示: :它们都是刻画两个变量之间的的相关关系的它们都是刻画两个变量之间的的相关关系的, ,区区别是别是R R2 2表示解释变量对预报变量变化的贡献率表示解释变量对预报变量变化的贡献率, ,其表其表达式为达式为R R2 2=1- ;=1- ;相关系数相关系数r r是检验两个变量相关性的强弱程度是检验两个变量相关性的强弱程度, ,其表达式为其表达式为 n2iii 1n2ii 1yyyy$nniii ii 1i 1nnnn222222iiiii 1

29、i 1i 1i 1x x y yxy nx yr.x xy y( xnx)( yny).(7 7)相关系数)相关系数r r与与R R2 2(1)R(1)R2 2是相关系数的平方是相关系数的平方, ,其变化范围为其变化范围为0,1,0,1,而相关系而相关系数的变化范围为数的变化范围为-1,1.-1,1.(2)(2)相关系数可较好地反映变量的相关性及正相关或负相关系数可较好地反映变量的相关性及正相关或负相关相关, ,而而R R2 2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果. .(3)(3)当当|r|r|接近于接近于1 1时说明两变量的相关性较强时说明两变量的相关性较强, ,当当|r

30、|r|接接近于近于0 0时说明两变量的相关性较弱时说明两变量的相关性较弱, ,而当而当R R2 2接近于接近于1 1时时, ,说说明线性回归方程的拟合效果较好明线性回归方程的拟合效果较好. .31表 325115662421117/y35322927252321C/0个个产卵数产卵数温度温度例:一只红铃虫产卵数例:一只红铃虫产卵数y和温度和温度x有关,现收集到的一有关,现收集到的一组数据如下表组数据如下表1-3表,试建立表,试建立y与与x之间的回归方程。之间的回归方程。.画出确定好的解释变量画出确定好的解释变量和预报变量的散点图,和预报变量的散点图,观察它们之间的关系观察它们之间的关系(1)是

31、否存在线性关系?(2)散点图具有哪种函数特征?(3)以指数函数模型为例,如何设模型函数?非线性关系非线性关系指数函数、二次函数、三次函数指数函数、二次函数、三次函数41 . 1图温度温度产卵数产卵数. .,abxy线性回归方程线性回归方程我们称之为非我们称之为非时时当回归方程不是形如当回归方程不是形如cc21设指数函数曲线 其中 和 是待定参数。ecyxc12我们可以通过对数变换把指数关系变为线性关系 这样就可以利用线性回归模型来建立z 与x回归模型,进而找到y与x的非线性回归方程 。则变换后样本点分布在直线的周围。令)cb,clna(abxz21ylnz 现在问题变为如何估计待定参数 和 ?

32、cc21非线性回归模型非线性回归模型.,51 . 1.4151 . 1用线性回归方程来拟合因此可以一条直线的附近变换后的样本点分布在看出中可以从图中数据的散点图给出了表784.5745.4190.4178.3045.3398.2946.1z35322927252321x41表产卵数的对数温度51 . 1图.843. 3272. 041xz到线性回归方程中的数据得由表图的样本数据表的数据可以得到变换后由表, 4131(6)ey0.272x-3.843(1).325115662421117y12251024841729625529441t51表另一方面另一方面, ,可以认为图可以认为图11-411

33、-4中样本点集中在某二次曲线中样本点集中在某二次曲线因此可以对温度变量做变换因此可以对温度变量做变换, ,即令即令 然后建立然后建立y y与与t t之间的线性回归方程,从而得到之间的线性回归方程,从而得到y y与与x x之间的排线性回之间的排线性回归方程。归方程。,2xt 的附近的附近, ,其中其中 和和 为待定参数为待定参数. .43cc423cxcy 表表1-51-5是红铃虫的产卵数和对应的温度的平方,图是红铃虫的产卵数和对应的温度的平方,图1.1-61.1-6是相应的散点图是相应的散点图. .,61 . 1423下面介绍具体方法到还可以通过残差分析得这个结论之间的关系与来拟合二次曲线即不

34、宜用合它回归方程来拟此不宜用线性因直线的周围不分布在一条的散点图并与可以看出中从图xycxcyty温度的平方数卵产61 . 1图中用线性回归模型拟合表的二次回归方程关于下面建立的指数回归方程关于前面已经建立了方程归需要建立两个相应的回残差为比较两个不同模型的51.,.,xyxy. 7.54.202x367.0y xy,54.202t367.0y ty,222的二次回归方程为关于即的线性回归方程关于得到的数据 的残差计算公式分别为和则回归方程列的数据行第第表示表用的拟合效果和个回归方程可以通过残差来比较两76,1151.76ixi ; 7 , 2 , 1i ,eyy ye 843.3x272.0

35、i1ii1i .7 , 2 , 1i ,54.202x367.0yy ye 2ii2ii2i .的拟合效果好7型的拟合效果比模6因此模型,的残差的绝对值小7模型的残差的绝对值显然比6模型从表中的数据可以看出.残差的两个回归方程的给出了原始数据及相应61表 . 965.77268.58107.4041003835.5397.19693.47e 928.32153.14889.8149.9760.1617.0518.0e 325115662421117y35322927252321x2161表 .7型的拟合效果远远优于模6因此模型.432.15448,673.1450的残差平方和分别为7和6算出模

36、型容易61由表.拟合的效果越好,残差平方和越小的模型.合效果的大小来判断模型的拟两个模型的残差平方和这时可以通过比较.则相反而另一些样本点的情况,的小型差的绝对值比另一个模的残某些样本点上一个模型原因是在.较困难比较两个模型的残差比,在一般情况下21QQ. ,b, xgya, xfy21和和对于给定的样本点 ,两个含有未知数的模型 1122,nnxyxyxy其中a和b都是未知参数,可以按如下的步骤来比较它们的拟合效果. .ba 其中 和 分别是参数a、b的估计值(1)分别建立对应于两个模型的回归方程 ,b, xgy 2 a , xfy 1 ;y yQn1i22ii2 Q1 y yn1i21ii

37、与(2)分别计算两个回归方程的残差平方和 .b, xgy a , xfy ,;b, xgy a , xfy ,QQ212121的好的效果不如反之的好的效果比则(3)若.非线性回归问题的处理方法(1)两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y= ,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.2c x1ce.(2)非线性回归方程的求法根据原始数据(x,y)作出散点图;根据散点图,选择恰当的拟合函数;作恰当的变换,将其转化成线性函数,求线性回归方程;在的基础上通过相应的变换,即可得非线性回归方程.(3)非线性相关问题中常见的几种线性变换在实际问题中,常常要根据一批实验数据绘出曲线,当曲线类型不具备线性相关关系时,可以根据散点分布的形状与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论