




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、3.13.1回归分析的基回归分析的基本思想及其初步应用本思想及其初步应用(第二课时)(第二课时) 1 1通过典型案例的探究,进一步了解回归分析的基本思想、通过典型案例的探究,进一步了解回归分析的基本思想、方法及其初步应用方法及其初步应用 2 2让学生经历数据处理的过程,培养他们对数据的直观感让学生经历数据处理的过程,培养他们对数据的直观感觉,体会统计方法的特点,认识统计方法的应用,通过使用转化觉,体会统计方法的特点,认识统计方法的应用,通过使用转化后的数据,求相关指数,运用相关指数进行数据分析、处理的方后的数据,求相关指数,运用相关指数进行数据分析、处理的方法法 3 3从实际问题中发现已有知识
2、的不足,激发好奇心,求知从实际问题中发现已有知识的不足,激发好奇心,求知欲,通过寻求有效的数据处理方法,开拓学生的思路,培养学生欲,通过寻求有效的数据处理方法,开拓学生的思路,培养学生的探索精神和转化能力,通过案例的分析使学生了解回归分析在的探索精神和转化能力,通过案例的分析使学生了解回归分析在实际生活中的应用,增强数学取之生活,用于生活的意识,提高实际生活中的应用,增强数学取之生活,用于生活的意识,提高学习兴趣学习兴趣 本节课通过例题线性相关关系知识,通过实际问本节课通过例题线性相关关系知识,通过实际问题中发现已有知识的不足,引导学生寻找解决非线性题中发现已有知识的不足,引导学生寻找解决非线
3、性回归问题思想与方法,培养学生化归数学思想。通过回归问题思想与方法,培养学生化归数学思想。通过知识的整理,通过例题讲解掌握解决非线性回归问题。知识的整理,通过例题讲解掌握解决非线性回归问题。 本节内容学生内容不易掌握,通过知识整理与比本节内容学生内容不易掌握,通过知识整理与比较引导学生进行区分、了解。通过对典型案例的探究,较引导学生进行区分、了解。通过对典型案例的探究,练习进行巩固解决非线性回归基本思想方法及初步应练习进行巩固解决非线性回归基本思想方法及初步应用用建立回归模型的基本步骤建立回归模型的基本步骤(1)(1)确定研究对象,明确哪个变量是解释变量,哪个变量确定研究对象,明确哪个变量是解
4、释变量,哪个变量是预报变量是预报变量(2)(2)画出确定好的解释变量和预报变量的散点图,观察它画出确定好的解释变量和预报变量的散点图,观察它们之间的关系们之间的关系( (如是否存在线性关系等如是否存在线性关系等) )(3)(3)由经验确定回归方程的类型由经验确定回归方程的类型( (如我们观察到数据呈线如我们观察到数据呈线性关系,则选用线性回归方程性关系,则选用线性回归方程) )(4)(4)按一定规则按一定规则( (如最小二乘法如最小二乘法) )估计回归方程中的参数估计回归方程中的参数(5)(5)得出结果后分析残差图是否有异常得出结果后分析残差图是否有异常( (如个别数据对应如个别数据对应残差过
5、大,或残差呈现不随机的规律性等残差过大,或残差呈现不随机的规律性等) )若存在异常若存在异常,则检查数据是否有误,或模型是否合适等,则检查数据是否有误,或模型是否合适等(6)(6)参数参数R2R2与相关系数与相关系数r r提示提示: :它们都是刻画两个变量之间的的相关关系的它们都是刻画两个变量之间的的相关关系的, ,区别是区别是R2R2表示解释变量对预报变量变化的贡献率表示解释变量对预报变量变化的贡献率, ,其其表达式为表达式为R2=1- ;R2=1- ;相关系数相关系数r r是检验两个变量相关性的强弱程度是检验两个变量相关性的强弱程度, ,其表达式为其表达式为 n2iii 1n2ii 1yy
6、yy$nniii ii 1i 1nnnn222222iiiii 1i 1i 1i 1x x y yxy nx yr.x xy y( xnx)( yny)(7 7相关系数相关系数r r与与R2R2(1)R2(1)R2是相关系数的平方是相关系数的平方, ,其变化范围为其变化范围为0,1,0,1,而相关系而相关系数的变化范围为数的变化范围为-1,1.-1,1.(2)(2)相关系数可较好地反映变量的相关性及正相关或负相关系数可较好地反映变量的相关性及正相关或负相关相关, ,而而R2R2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果. .(3)(3)当当|r|r|接近于接近于1 1时说明两变量
7、的相关性较强时说明两变量的相关性较强, ,当当|r|r|接接近于近于0 0时说明两变量的相关性较弱时说明两变量的相关性较弱, ,而当而当R2R2接近于接近于1 1时时, ,说说明线性回归方程的拟合效果较好明线性回归方程的拟合效果较好. .31表 325115662421117/y35322927252321C/0个个产卵数产卵数温度温度例:一只红铃虫产卵数例:一只红铃虫产卵数y和温度和温度x有关,现收集到的一有关,现收集到的一组数据如下表组数据如下表1-3表,试建立表,试建立y与与x之间的回归方程。之间的回归方程。画出确定好的解释变量画出确定好的解释变量和预报变量的散点图,和预报变量的散点图,
8、观察它们之间的关系观察它们之间的关系(1是否存在线性关系?(2散点图具有哪种函数特征?(3以指数函数模型为例,如何设模型函数?非线性关系非线性关系指数函数、二次函数、三次函数指数函数、二次函数、三次函数41 . 1图温度温度产卵数产卵数 .,abxy线性回归方程线性回归方程我们称之为非我们称之为非时时当回归方程不是形如当回归方程不是形如cc21设指数函数曲线 其中 和 是待定参数。ecyxc12我们可以通过对数变换把指数关系变为线性关系 这样就可以利用线性回归模型来建立z 与x回归模型,进而找到y与x的非线性回归方程 。则变换后样本点分布在直线的周围。令)cb,clna(abxz21ylnz
9、现在问题变为如何估计待定参数 和 ?cc21非线性回归模型非线性回归模型.,51 . 1.4151 . 1用线性回归方程来拟合因此可以一条直线的附近变换后的样本点分布在看出中可以从图中数据的散点图给出了表784.5745.4190.4178.3045.3398.2946.1z35322927252321x41表产卵数的对数温度51 . 1图.843. 3272. 041xz到线性回归方程中的数据得由表图的样本数据表的数据可以得到变换后由表, 4131(6)ey0.272x-3.843(1)325115662421117y12251024841729625529441t51表另一方面另一方面,
10、,可以认为图可以认为图11-411-4中样本点集中在某二次曲线中样本点集中在某二次曲线因此可以对温度变量做变换因此可以对温度变量做变换, ,即令即令 然后建立然后建立y y与与t t之间的线性回归方程,从而得到之间的线性回归方程,从而得到y y与与x x之间的排线性回之间的排线性回归方程。归方程。,2xt 的附近的附近, ,其中其中 和和 为待定参数为待定参数. .43cc423cxcy 表表1-51-5是红铃虫的产卵数和对应的温度的平方,图是红铃虫的产卵数和对应的温度的平方,图1.1-61.1-6是相应的散点图是相应的散点图. .,61 . 1423下面介绍具体方法到还可以通过残差分析得这个
11、结论之间的关系与来拟合二次曲线即不宜用合它回归方程来拟此不宜用线性因直线的周围不分布在一条的散点图并与可以看出中从图xycxcyty温度的平方数卵产61 . 1图中用线性回归模型拟合表的二次回归方程关于下面建立的指数回归方程关于前面已经建立了方程归需要建立两个相应的回残差为比较两个不同模型的51.,.,xyxy 7.54.202x367.0y xy,54.202t367.0y ty,222的二次回归方程为关于即的线性回归方程关于得到的数据 的残差计算公式分别为和则回归方程列的数据行第第表示表用的拟合效果和个回归方程可以通过残差来比较两76,1151.76ixi ; 7 , 2 , 1i ,ey
12、y ye 843.3x272.0i1ii1i .7 , 2 , 1i ,54.202x367.0yy ye 2ii2ii2i .的拟合效果好7型的拟合效果比模6因此模型,的残差的绝对值小7模型的残差的绝对值显然比6模型从表中的数据可以看出.残差的两个回归方程的给出了原始数据及相应61表 965.77268.58107.4041003835.5397.19693.47e 928.32153.14889.8149.9760.1617.0518.0e 325115662421117y35322927252321x2161表 .7型的拟合效果远远优于模6因此模型.432.15448,673.1450的
13、残差平方和分别为7和6算出模型容易61由表.拟合的效果越好,残差平方和越小的模型.合效果的大小来判断模型的拟两个模型的残差平方和这时可以通过比较.则相反而另一些样本点的情况,的小型差的绝对值比另一个模的残某些样本点上一个模型原因是在.较困难比较两个模型的残差比,在一般情况下21QQ ,b, xgya, xfy21和和对于给定的样本点 ,两个含有未知数的模型 1122,nnxyxyxy其中a和b都是未知参数,可以按如下的步骤来比较它们的拟合效果.ba 其中 和 分别是参数a、b的估计值(1分别建立对应于两个模型的回归方程 ,b, xgy 2 a , xfy 1 ;y yQn1i22ii2 Q1
14、y yn1i21ii与(2分别计算两个回归方程的残差平方和 .b, xgy a , xfy ,;b, xgy a , xfy ,QQ212121的好的效果不如反之的好的效果比那么(3假设非线性回归问题的处理方法(1)两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y= ,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.2c x1ce(2)非线性回归方程的求法根据原始数据(x,y)作出散点图;根据散点图,选择恰当的拟合函数;作恰当的变换,将其转化成线性函数
15、,求线性回归方程;在的基础上通过相应的变换,即可得非线性回归方程.(3)非线性相关问题中常见的几种线性变换在实际问题中,常常要根据一批实验数据绘出曲线,当曲线类型不具备线性相关关系时,可以根据散点分布的形状与已知函数的图象进行比较,确定曲线的类型,再作变量替换,将曲线改为直线.下面是几种容易通过变量替换转化为直线的函数模型:y=a+ ,y=a+ ,令令t= t= ,则有,则有y=a+bty=a+bt;y=axby=axb,令,令z=ln yz=ln y,t=ln xt=ln x,m=ln am=ln a,则有,则有z=m+btz=m+bt;y=aebxy=aebx,令,令z=ln yz=ln
16、y,m=ln a,m=ln a,则有则有z=m+btz=m+bt;y= ,y= ,令令z=ln y,t= z=ln y,t= ,m=ln am=ln a,则有,则有z=m+btz=m+bt;y=a+bln xy=a+bln x,令,令t=ln xt=ln x,则有,则有z=a+btz=a+bt;y=bx2+a,y=bx2+a,令令t=x2t=x2,则有,则有y=bt+a.y=bt+a.bx1xbxae1x例例 某种食品每公斤的生产成本某种食品每公斤的生产成本y(y(元元) )与该食品生产与该食品生产的重量的重量x(x(公斤公斤) )有关,经生产统计得到以下数据:有关,经生产统计得到以下数据:x
17、123510203050100 200y10.155.524.082.852.111.621.411.301.211.15通过以上数据判断该食品的成本y(元)与生产的重量x(公斤)的倒数1/x之间是否具有线性相关关系?若有,求出y关于1/x的回归直线方程,并借此估计一下生产该食品500公斤时每公斤的生产成本是多少?(精确到0.01) 于是 y 与1x的回归方程为y8.973x1.125. 当 x500(公斤)时,y8.9735001.1251.14.即估计生产该食品 500 公斤时每公斤的生产成本是1.14 元 X x2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y关于x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176父亲身高父亲身高x(cm)174176176176178儿子身高儿子身高y(cm)175175176177177答案:C解析:方法一:由线性回归直线方程过样本中心(176,176),排除A,B答案,结合选项可得C为正确答案.方法二:将表中的五组数值分别代入选
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论