第5章回归分析ppt课件_第1页
第5章回归分析ppt课件_第2页
第5章回归分析ppt课件_第3页
第5章回归分析ppt课件_第4页
第5章回归分析ppt课件_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第5章章 回归分析回归分析5.1 概述概述 回归分析回归分析研讨变量与变量之间关系的数学研讨变量与变量之间关系的数学方法。方法。 变量之间的关系:变量之间的关系:5.1.1 确定性关系确定性关系 函数关系,经反复的精确实验或严厉的数学推函数关系,经反复的精确实验或严厉的数学推导得到。如导得到。如 S= vt 。数学分析和物理学中的大多。数学分析和物理学中的大多数公式属于这种类型。数公式属于这种类型。到方差分析到方差分析 实践问题中,绝大多数情况下,变量之间的关系实践问题中,绝大多数情况下,变量之间的关系不那么简单。如资料的抗拉强度与其硬度之间的关系;不那么简单。如资料的抗拉强度与其硬度之间的

2、关系;资料的性能与其化学成份之间等等。资料的性能与其化学成份之间等等。 这些变量之间既存在着亲密的关系,又不能由一这些变量之间既存在着亲密的关系,又不能由一个或几个变量自变量的数值准确地求出另一个或几个变量自变量的数值准确地求出另一个变量因变量的数值,而是要经过实验和调查研个变量因变量的数值,而是要经过实验和调查研讨,才干确定它们之间的关系,如图讨,才干确定它们之间的关系,如图5.1所示,虽然各所示,虽然各组数据不是准确地服从组数据不是准确地服从f(x)关系,但关系,但y值总还是随值总还是随x的添的添加而添加。我们称这类变量之间的关系为相关关系。加而添加。我们称这类变量之间的关系为相关关系。

3、5.1.2 相关关系相关关系 图5.1 相关关系024681012141605101520 xy 虽然各组数据不是准确地服从虽然各组数据不是准确地服从f(x)关系,但关系,但y值总值总还是随还是随x的添加而变化。的添加而变化。5.1 概述概述回归分析的主要内容:回归分析的主要内容: 运用数学的方法,对大量的丈量数据进展处置,从运用数学的方法,对大量的丈量数据进展处置,从而得出比较符合事物内部规律的数学表达式数学模而得出比较符合事物内部规律的数学表达式数学模型。型。),(21Ncccxfy5-1待定常数待定常数5 .2 最小二乘法原理最小二乘法原理 假设假设 x 和和 y 是具有某种相关关系的物

4、理量,它们是具有某种相关关系的物理量,它们之间的关系可用下式给出:之间的关系可用下式给出:5 .2 最小二乘法原理最小二乘法原理 同时丈量同时丈量 x ,y 的数值,设有的数值,设有 m 对观测结果:对观测结果:),( ,),(),(2211mmyxyxyx 利用观测值,确定利用观测值,确定 。设。设 x,y 关系的最关系的最正确方式为:正确方式为:Nccc,21),(21Ncccxfy5-25-3最正确估计值最正确估计值如不存在丈量误差,那么:如不存在丈量误差,那么:micccxfyNii, 2 , 1),(215-4由于存在丈量误差,因此式由于存在丈量误差,因此式5-3与与5-4不相重合,

5、即有:不相重合,即有:miyyeiii, 2 , 15-5残差残差误差的实测值误差的实测值5 .2 最小二乘法原理最小二乘法原理 式式53中的中的 x 变化时,变化时,y 也随之变化。假设也随之变化。假设 m 对观测值对观测值中有比较多的中有比较多的 y 值落到曲线值落到曲线51上,那么所得曲线就能较为上,那么所得曲线就能较为称心地反映被测物理量之间的关系,称心地反映被测物理量之间的关系,y 值同时出现的概率最大,值同时出现的概率最大,那么曲线那么曲线53就是曲线就是曲线51的最正确方式。如图的最正确方式。如图5.1a所所示。假设误差服从正态分布,那么概率示。假设误差服从正态分布,那么概率 P

6、(e1, e2, , em)为:为: miimiiieyyS1212)(57当当P最大时,求得的曲线就该当是最正确方式。从图最大时,求得的曲线就该当是最正确方式。从图5-1a中可以中可以看出,显然,此时下式应最小:看出,显然,此时下式应最小:miiimyyeeeP122212)(exp21),( 56即残差平方和最小,这就是最小二乘法原理的由来。即残差平方和最小,这就是最小二乘法原理的由来。图图5.1aiy 38141514108y = 0.0108x3 - 0.4408x2 + 4.8901x - 1.976402468101214161805101520 xyx1 13 36 68 810

7、10131316163 38 814141515141410108 8yi2.482.489.029.0213.8313.8314.4614.4613.6413.6410.8310.837.667.66ei0.520.52-1.02-1.020.170.170.540.540.360.36-0.83-0.830.340.34iy 5 .2 最小二乘法原理最小二乘法原理 这里假定这里假定 xi 无误差。式无误差。式57可以写成:可以写成:miNiicccxfyS1221),(58S最小,就应有:最小,就应有:0, 0, 021NcScScS59即要求求解如即要求求解如下联立方程组:下联立方程组:

8、0),(0),(0),(12121211121NmiNiimiNiimiNiicfcccxfycfcccxfycfcccxfy5105.3 直线的回归直线的回归5.3.1 一元直线回归分析一元直线回归分析 对一元线性回归而言,就是配直线的问题,下面对一元线性回归而言,就是配直线的问题,下面经过例题加以分析阐明。经过例题加以分析阐明。 例例5.1 研讨腐蚀时间与腐蚀深度两个变量之间的研讨腐蚀时间与腐蚀深度两个变量之间的关系,可把腐蚀时间作为自变量关系,可把腐蚀时间作为自变量 x ,把腐蚀深度作为,把腐蚀深度作为因变量因变量 y ,将实验数据记录在表,将实验数据记录在表5-1中。求出中。求出x,y

9、之之间的线性关系。间的线性关系。 解:将表解:将表5-1中的中的(x, y) 数据,在直角坐标系中对应数据,在直角坐标系中对应地做出一系列的点,可得图地做出一系列的点,可得图5.2,这种图称之为散,这种图称之为散点图。点图。 与与 x 的关系大致呈直线关系,但并不是确定性的的关系大致呈直线关系,但并不是确定性的关系,而是一种相关关系:关系,而是一种相关关系:y bxay 回归系数回归系数511 最正确估计值应使其残差平方和最小,残差为:最正确估计值应使其残差平方和最小,残差为:)(iiibxaye 512图图52、表、表51时时间间 x,min351020304050606590120腐腐蚀蚀

10、深深度度 y, u40 60 80 130 160 170 190 250 250 290 460表表5-1 实验数据实验数据图52 散点图图52 散点图y = 3.2149x + 45.007R2 = 0.97110100200300400500020406080100120140时间 x时间 x腐蚀深度 y腐蚀深度 ybxay.5.3.1一元直线回归分析一元直线回归分析其平方和为:其平方和为: 2112)( miiimiibxayeS513平方和最小,即:平方和最小,即: 0)(20)(211miiiimiiibxayxbSbxayaS514得正规方程组:得正规方程组: imiimiimi

11、imiimiiyxxbxayxbam1121115155.3.1一元直线回归分析一元直线回归分析令平均值为:令平均值为: miimiimyymxx11516由由511得:得: xbyayxba517518由式由式515得:得: mimiiimimiimiiiixmxyxmyxb1212111115.3.1一元直线回归分析一元直线回归分析 miimiiixxyyxxb121)()(519式中式中520 由式由式(5-18)和式和式(5-19)可以求得回归直线方程式中的常可以求得回归直线方程式中的常数数a及回归系数及回归系数b。令令5-21便可得到回归系数的另一种表达式:便可得到回归系数的另一种表

12、达式: 5-52并且,习惯上称miix12为 x 的平方和; mxmii12)(为平方和的修正项; miiiyx1为 x 与 y 的乘积和;的乘积和;myxmiimii11)( )(为乘积和的修正项。 上述回归直线的详细计算,通常都是列表进展的,上述回归直线的详细计算,通常都是列表进展的,本节的例如,详细计算见表本节的例如,详细计算见表5-2。完成表完成表5-2的计算,就可得到回归直线方程:的计算,就可得到回归直线方程: 5-23编号 x yx2 y2xy1340916001202560253600300310801006400800420130400169002600530160900256

13、004800640170160028900680075019025003610095008602503600625001500096525042256250016250109029081008410026100111204601440021160055200参数值493208035859539800137470参数值44.81818182189.0922095.3636439330993221.818181376414649144248.181823.2145.01表5-2 回归直线方程的计算(I)xy2x2yxyxymx2)(my2)(myx)(yylxylxxxyllbxbyaxxl1先把

14、数据在先把数据在Excel中成列输入到电子表格中;中成列输入到电子表格中;2全部选择一切数据;全部选择一切数据;3点击图表导游快捷按钮,按提示一步一步建立点击图表导游快捷按钮,按提示一步一步建立散点图;散点图;5.3.2 利用微软公司的电子表格利用微软公司的电子表格Microsoft Excel在在计算机中进展线性回归的方法计算机中进展线性回归的方法14建立好散点图后,用鼠标点到图上散点的位置,建立好散点图后,用鼠标点到图上散点的位置,单击鼠标左键选中一切的散点,然后单击鼠标右键,单击鼠标左键选中一切的散点,然后单击鼠标右键,出现一个对话框,点击左键选择添加趋势线,出现出现一个对话框,点击左键

15、选择添加趋势线,出现另一个对话框,在对话框中选择某些功能,回归直另一个对话框,在对话框中选择某些功能,回归直线方程就会出如今图上的某一位置。线方程就会出如今图上的某一位置。2.3.2 方差分析方差分析 由由 x 预告预告 ,准确度如何?用方差分析,准确度如何?用方差分析 处理这一问题。处理这一问题。 残差可表示如下:残差可表示如下:y iiiyye 实验得到的数据实验得到的数据回归直线对应的数据回归直线对应的数据上式可改写成:上式可改写成:)()(yyyyyyeiiiii 524移项得:移项得:)()(yyyyyyiiii miimiiiimiiimiiiimiiyyyyyyyyyyyyyy1

16、21122112)()(2)()()()(两端平方求和得:两端平方求和得:525可以证明此项可以证明此项为零,故得:为零,故得: miimiiimiiyyyyyy121212)()()( miiiyy12)( miiyy12)( 上式中三项平方和的意义如下:上式中三项平方和的意义如下:代表在实验范围内,观测值代表在实验范围内,观测值 yi 总总的动摇情况,称此为总平方和。的动摇情况,称此为总平方和。 miiyy12)(代表代表 x 变化所引起的变化所引起的 y 值变化大小的量,值变化大小的量,即即yi 动摇中,可以经过回归方程计算出动摇中,可以经过回归方程计算出来的那一部分,称之为回归平方和。

17、来的那一部分,称之为回归平方和。 上述三个平方和之间的关系,可以用图上述三个平方和之间的关系,可以用图5.14表示出来。总平表示出来。总平方和可以分解成两部分,回归平方和与残差平方和。方和可以分解成两部分,回归平方和与残差平方和。是残差平方和,表示了回归方程的拟合是残差平方和,表示了回归方程的拟合误差,即观测值误差,即观测值yi 偏离回归值偏离回归值 的大小。的大小。这一部分不能经过回归方程计算出来,这一部分不能经过回归方程计算出来,它是它是yi 动摇中与动摇中与 x 无关的部分。无关的部分。iy 的的分分解解图图yyi 35 x x y y回 归残 差的分解图yyi14. 5yy yyi b

18、xay iiyy yyi 由图中可以看出,假设残差平方和很小,那么回归平方和总平方和将接近于由图中可以看出,假设残差平方和很小,那么回归平方和总平方和将接近于1。这时,一切的观测点都接近或落在回归线上,这就阐明回归直线的精度较高。这时,一切的观测点都接近或落在回归线上,这就阐明回归直线的精度较高。 残差平方和是排除了残差平方和是排除了 x 对对 y 的线性影响后的剩余部分,的线性影响后的剩余部分,y 值值随机动摇程度的大小,用它来估计误差。随机动摇程度的大小,用它来估计误差。 产生缘由:包括随机误差、那些影响很小但尚未思索的要素。产生缘由:包括随机误差、那些影响很小但尚未思索的要素。自在度:自

19、在度: f总总= f回回 + f残残 f总总= m - 1 f回回 =1f残残= f总总 f回回 = m - 2 方差:残差平方和除以它的自在度:方差:残差平方和除以它的自在度:残残残差平方和残差平方和fS 2规范偏向估算值:规范偏向估算值:残残残残差差平平方方和和fS 529用用S衡量随机要素对衡量随机要素对 y 的影响。的影响。回归方程可作如下预告:回归方程可作如下预告:)( 置信水平置信水平Sbxay 波动原因自由度方差142252471.04239.121.70146491总计表5-3 一元直线回归方程方差分析示例平方和1回归残差4395023.3)(2xyiblyy6 .142029

20、146491)(2xyyyiibllyy2myyilyy2)(1m22mbllSxyyyS将例将例5.1一元直线回归的方差分析可归纳在表一元直线回归的方差分析可归纳在表5-3中。中。 回归方程可改写为:回归方程可改写为:)05. 0(70.21668.432316. 3置信水平xy5.3.4 相关性检验相关性检验 用一个数量性的目的,来衡量两个变量之间线性相关关用一个数量性的目的,来衡量两个变量之间线性相关关系的亲密程度系的亲密程度相关系数相关系数 r 。2121)()( miimiiyyyyr回归平方和回归平方和总平方和总平方和5-32 r 1 时,阐明规范误差很小实验点与回归点几乎吻时,阐

21、明规范误差很小实验点与回归点几乎吻合,回归方程才有意义。通常合,回归方程才有意义。通常 0r1。r 取值不同时的散点分布情况示于图取值不同时的散点分布情况示于图5.15中,详细分析如下:中,详细分析如下:1 r = 0 时。此时时。此时 b = 0 ,即按最小二乘法确定的回归直线平,即按最小二乘法确定的回归直线平行于行于 x 轴,这阐明轴,这阐明 y 的变化与的变化与 x 无关。故无关。故 x 与与 y 之间没有线性关之间没有线性关系。通常,散点的分布是完全不规那么的,如图系。通常,散点的分布是完全不规那么的,如图5.15a所示。所示。2 0r1。这时,。这时, x 与与 y 之间存在着一定的

22、线性关系。之间存在着一定的线性关系。当当 r 0 时时 b0 ,散点分布有随,散点分布有随 x 添加添加 y 添加的趋势,此时称添加的趋势,此时称 x 与与 y 是正相关,如图是正相关,如图5.15b所示。当所示。当 r 0 时时 b0 ,散点图,散点图呈呈 y 随随 x 添加而减小的趋势,此时称添加而减小的趋势,此时称 x 与与 y 为负相关,如图为负相关,如图5.15c所示。当所示。当 r 的绝对值比较大时,散点远离回归直线较为分的绝对值比较大时,散点远离回归直线较为分散;当散;当 r 的绝对值较大时,散点分布就接近直线。的绝对值较大时,散点分布就接近直线。3 r= 1。一切的点都在一条直

23、线上,即散点都落在回归。一切的点都在一条直线上,即散点都落在回归直线上。此时,称直线上。此时,称 x 与与 y 完全性相关。实践上,此时完全性相关。实践上,此时 x 与与 y 之间之间有确定性的线性关系。如图有确定性的线性关系。如图5.15d所示。所示。图图(a)R2 = 0 xy 图图5.15(a) x图5 4 ( b)R2 = 0.6215xy 图图5.15(b) x图5 4 ( c)R = - 0.79xy 图图5.15(c) x图5 4 ( d)R2 = 1xy 图图5.15(d) x图5 4 ( e)R2 = 0 xy 图图5.15(e) x 从上述讨论可以看出,相关系数从上述讨论可

24、以看出,相关系数 r 表示两个随机变量表示两个随机变量 x 与与 y 之间线性相关的亲密程度。之间线性相关的亲密程度。 r越大,愈接近于越大,愈接近于1,x 与与 y 之间之间的线性相关也就愈亲密。但必需指出,相关系数的线性相关也就愈亲密。但必需指出,相关系数 r 只表示线性相只表示线性相关的亲密程度,当关的亲密程度,当 r 很小,甚至等于零时,并不一定阐明很小,甚至等于零时,并不一定阐明 x 与与 y 之间就不存在其它关系。如图之间就不存在其它关系。如图515(e)所示,虽然所示,虽然 r = 0,但从散点,但从散点分布看,分布看,x 与与 y 之间存在着明显的曲线关系,只不过这种关系不之间

25、存在着明显的曲线关系,只不过这种关系不是线性关系罢了。是线性关系罢了。 相关系数的绝对值终究多大才干以为两个变量是相关的呢?相关系数的绝对值终究多大才干以为两个变量是相关的呢?或回归方程才有意义呢?或回归方程才有意义呢?F检验:检验:假设:假设:H0:b = 0,F为:为:残残回回残残差差平平方方和和回回归归平平方方和和ffF/534 可见可见 r 检验与检验与 F 检验的作检验的作用是一致的,只用一种即可。用是一致的,只用一种即可。 可查表得出可查表得出 Fa=1,m2,当:,当: F F0.01 特别显著;特别显著; F0.01 F F0.05 时,显著;时,显著; F0.05 F F0.

26、10 时,较显著;时,较显著; F F0.10 时,不显著。时,不显著。1先把数据在先把数据在Excel中成列输入到电子表格中;中成列输入到电子表格中;2点击下拉菜单的点击下拉菜单的“工具按钮,鼠标箭头挪动到工具按钮,鼠标箭头挪动到“数据分析项下,点击左键,出现数据分析对话框,数据分析项下,点击左键,出现数据分析对话框,在对话框中选择在对话框中选择“回归,点击回归,点击“确定按钮,出现回确定按钮,出现回归对话框,按对话框中的提示,选择对话框中的某些功归对话框,按对话框中的提示,选择对话框中的某些功能,即可得出与直线回归有关的很多参数。能,即可得出与直线回归有关的很多参数。3利用计算出的参数,即

27、可写出回归方程。利用计算出的参数,即可写出回归方程。5.3.5 利用利用Excel在计算机中进展线性回归的方法在计算机中进展线性回归的方法25.4 曲线回归曲线回归 在实践问题中,变量之间经常不是直线关系。这时,通常在实践问题中,变量之间经常不是直线关系。这时,通常是选配一条比较接近的曲线,经过变量变换把非线性方程加以是选配一条比较接近的曲线,经过变量变换把非线性方程加以线性化,然后对线性化的方程运用最小乘法求解回归方程。线性化,然后对线性化的方程运用最小乘法求解回归方程。 最小二乘法的一个前提条件是函数最小二乘法的一个前提条件是函数 y = fx的详细方式为的详细方式为知,即要求首先确定知,

28、即要求首先确定 x 与与 y 之间内在关系的函数类型。函数的之间内在关系的函数类型。函数的方式能够是各种各样的,详细方式确实定或假设,普通有下述方式能够是各种各样的,详细方式确实定或假设,普通有下述两个途径:一是根据有关的物理知识,确定两个变量之间的函两个途径:一是根据有关的物理知识,确定两个变量之间的函数类型;二是把观测数据划在坐标纸上,将散点图与知函数曲数类型;二是把观测数据划在坐标纸上,将散点图与知函数曲线对比,选取最接近散点分布的曲线公式进展试算。线对比,选取最接近散点分布的曲线公式进展试算。 常见的一些非线性函数及其线性化方法如下。常见的一些非线性函数及其线性化方法如下。5.4.1

29、曲线回归曲线回归xbay 11双曲线,双曲线, 型,见图型,见图5.23。bvauxvyu 则则令令,1,12指数曲线,指数曲线, ,见图,见图5.24。型型bxaey bvcuacxvyu 则则令令,ln,ln 3指数曲线,指数曲线, ,见图,见图5.25。型型xbaey/bvcuacxvyu则则令令,ln,/1,ln 4幂函数曲线,幂函数曲线, ,见图,见图5.26。型型baxy bvcuacxvyu则则令令,lg,lg,lg图图5.23 (a) 双曲线双曲线(a ) a 0, b 0-0.10-0.050.000.050.100.15-4-202468101214xy图图5.23(b)

30、双曲线双曲线(b) a0, b00510152025-1-0.500.511.52xy图图5.24(b) 指数曲线指数曲线(b) b00102030405060708000.511.522.533.54xy图图5.25(b) 指数曲线指数曲线(b) b0 xyb10 b 1b = 1图图5.26(b) 幂函数曲线幂函数曲线(b) b0 xyb 1b=11 b 0-10 xy图图5.27(b) 对数曲线对数曲线(a) b 0, c b 0, c 0050 xy图图5.29 (b) 对数抛物线对数抛物线b 0, c b 0, c 0 0 如上所述,许多曲线都可以经过变换化为直线,可以按直线如上所述

31、,许多曲线都可以经过变换化为直线,可以按直线拟合的方法来处置。拟合的方法来处置。 必需留意!所配曲线的回归中,必需留意!所配曲线的回归中,r r、S S、F F 等的计算稍有不同。等的计算稍有不同。u u、v v 等仅仅是为了变量变换,使曲线方程变为直线方程,然而要等仅仅是为了变量变换,使曲线方程变为直线方程,然而要求的是所配曲线与观测数据拟合较好,所以计算求的是所配曲线与观测数据拟合较好,所以计算r r、S S、F F 等时,等时,应首先根据已建立的回归方程,用应首先根据已建立的回归方程,用 xi xi 依次代入,得到依次代入,得到 yi yi 后再后再计算计算残 差 平 方 和残 差 平

32、方 和 及 总 平 方及 总 平 方和和 ,于是:,于是: miiiyy12)( miiyy12)(21212)() (1miimiiyyyyR5362)(12 myySmiii537残残回回残残差差平平方方和和回回归归平平方方和和ffF/538 下面举例阐明曲线回归的普通计算方法。下面举例阐明曲线回归的普通计算方法。 例例5.2 炼钢厂出钢用钢包在运用过程中,由于钢液炼钢厂出钢用钢包在运用过程中,由于钢液及炉渣对耐火资料的浸蚀,其容积不断增大。钢包的及炉渣对耐火资料的浸蚀,其容积不断增大。钢包的容积用盛满钢水的分量容积用盛满钢水的分量 kg 表示与相应的运用次数表示与相应的运用次数列于表列于

33、表5-4中。求:中。求:x、y之间的关系式:之间的关系式: 表表5-4 实验数据实验数据使用次数 x23457810容积 y106.42108.20109.58109.50110.00109.93110.49使用次数 x111415161819容积 y110.59110.60110.90110.76111.00111.20 解:解: 首先按实测数据做散点图,如图首先按实测数据做散点图,如图5.30所示。所示。 由图可见,最初容积添加很快,以后减慢并趋于由图可见,最初容积添加很快,以后减慢并趋于稳定。根据这个特点,选用双曲线:稳定。根据这个特点,选用双曲线:xbay 1(539表示容积表示容积

34、y 与运用次数与运用次数 x 的关系。的关系。图5.30 钢包容积与使用次数之间的关系散点图10610710810911011111205101520使用次数 x钢包容积 y:,1,1则则上上式式可可改改写写成成若若令令xvyubvau5-40 对新变量对新变量 u、 v 而言,式而言,式5-40是一个直线方程,是一个直线方程,因此可用最小二乘法进展拟合计算,求出回归系数因此可用最小二乘法进展拟合计算,求出回归系数 b 和常数项和常数项 a 。计算步骤如下:。计算步骤如下:1根据表根据表5-4中的数据,计算出中的数据,计算出 v 、v2、 u、 u2 、uv和回归系数和回归系数b及常数项及常数

35、项a列于表列于表5-5中。中。 编号 x yv2u2uv12106.420.5000000.0093970.25000008.829853E-054.698365E-0323108.200.3333330.0092420.11111118.541723E-053.080715E-0334109.580.2500000.0091260.06250008.327937E-052.281438E-0345109.500.2000000.0091320.04000008.340110E-051.826484E-0357110.000.1428570.0090910.02040828.264463E-0

36、51.298701E-0368109.930.1250000.0090970.01562508.274991E-051.137087E-03710110.490.1000000.0090510.01000008.191323E-059.050593E-04811110.590.0909090.0090420.00826458.176516E-058.220372E-04914110.600.0714290.0090420.00510208.175037E-056.458280E-041015110.900.0666670.0090170.00444448.130868E-056.011422E

37、-041116110.760.0625000.0090290.00390638.151436E-055.642831E-041218111.000.0555560.0090090.00308648.116224E-055.005005E-041319111.200.0526320.0089930.00277018.087056E-054.733056E-042.0508820.1182670.5372181.076075E-031.883495E-02xv1yu1_表5-5 回归计算13vumv2)(mu2muv)(m编号 x yv2u2uv12106.420.5000000.0093970.

38、25000008.829853E-054.698365E-0323108.200.3333330.0092420.11111118.541723E-053.080715E-0334109.580.2500000.0091260.06250008.327937E-052.281438E-0345109.500.2000000.0091320.04000008.340110E-051.826484E-0357110.000.1428570.0090910.02040828.264463E-051.298701E-0368109.930.1250000.0090970.01562508.274991

39、E-051.137087E-03710110.490.1000000.0090510.01000008.191323E-059.050593E-04811110.590.0909090.0090420.00826458.176516E-058.220372E-04914110.600.0714290.0090420.00510208.175037E-056.458280E-041015110.900.0666670.0090170.00444448.130868E-056.011422E-041116110.760.0625000.0090290.00390638.151436E-055.64

40、2831E-041218111.000.0555560.0090090.00308648.116224E-055.005005E-041319111.200.0526320.0089930.00277018.087056E-054.733056E-042.0508820.1182670.5372181.076075E-031.883495E-02xv1yu1_表5-5 回归计算130.15776010.01865777610.00909740.32354740.0010759245vumv2)(mu2 muv)(m由式(5-21)计算下面的参数为:8.291744E-040.008966630

41、.21367051.508906E-071.771701E-04vvluuluvl muv)(vvuvllbvbua(2) 得出变换后的回归直线方程式为:得出变换后的回归直线方程式为:vu4310291744. 81096663. 8变换回原始曲线方程为:变换回原始曲线方程为: 将原始数据带入回归方程式将原始数据带入回归方程式(5-42)中,计算规范偏中,计算规范偏向向S和相关系数和相关系数R,计算结果见表,计算结果见表5-6所示。所示。 由表由表5-6得出的参数可写出最后的回归曲线方程式为:得出的参数可写出最后的回归曲线方程式为:xy110291744. 81096663. 8143 0.2

42、284933 109.94f回 = 10.22849330.9864f残 = m 2 = 11f总 = m 1 = 12式 (5-29)y残残 差 平 方 和fS总 平 方 和残 差 平 方 和1R编 号 x y残 差 平 方 和总 平 方 和12106.42106.60-0.180.0310-3.5212.363323108.20108.190.010.0001-1.743.014234109.58109.000.580.3311-0.360.126845109.50109.500.000.0000-0.440.190257110.00110.07-0.070.00500.060.00416

43、8109.93110.25-0.320.1025-0.010.0000710110.49110.50-0.010.00020.550.3067811110.59110.590.000.00000.650.4275914110.60110.79-0.190.03720.660.44071015110.90110.840.060.00340.960.92901116110.76110.88-0.120.01530.820.67871218111.00110.950.050.00211.06120110.980.220.04651.261.59731429.171429.1

44、70.00490.57430.000021.211表 5-6 回 归 后 的 方 差 分 析y yy2)(yy yy 2)(yy _ 本例运用最小二乘法,虽然运用双曲线拟合,在本例运用最小二乘法,虽然运用双曲线拟合,在计算过程中使残差平方和到达了最小,但这并缺乏以计算过程中使残差平方和到达了最小,但这并缺乏以阐明,所配双曲线是对表阐明,所配双曲线是对表5-4中数据的最正确拟合曲线。中数据的最正确拟合曲线。因此在配曲线时,最好用不同的函数类型计算后再进因此在配曲线时,最好用不同的函数类型计算后再进展比较,选取其中最优者,即选取相关系数展比较,选取其中最优者,即选取相关系数R为最大的为最大的曲线。

45、此外,在曲线拟合时也可采用分段拟合的方法,曲线。此外,在曲线拟合时也可采用分段拟合的方法,即在不同的自变量区间内配以不同的曲线来进展拟合。即在不同的自变量区间内配以不同的曲线来进展拟合。下面我们采用计算机处置方法,用其它类型的函数进下面我们采用计算机处置方法,用其它类型的函数进展回归拟合试一试,看会得出什么样的结果?展回归拟合试一试,看会得出什么样的结果? 利用利用 Excel 对对 x 、y 的数据作散点图,直接作出回归曲的数据作散点图,直接作出回归曲线。线。 第一步第一步: 在在Excel电子表格中,按列行输入电子表格中,按列行输入 x 与与 y 的的实验数据。实验数据。 第二步:对第二步

46、:对 x 与与 y 的实验数据作出散点图。的实验数据作出散点图。 第三步:在图中选定散点的数据,做多项式的趋势线,第三步:在图中选定散点的数据,做多项式的趋势线,即得到相应的回归曲线。即得到相应的回归曲线。5.4.2 用用Excel电子表格软件进展曲线回归的方法电子表格软件进展曲线回归的方法5.4.2.1 方法方法15.4.2.2 方法方法2 利用利用 Excel 对对 x 、y 的数据求出一切的回归系数及方差的数据求出一切的回归系数及方差分析数据。分析数据。 第一步第一步: 在在Excel电子表格中,按列行输入电子表格中,按列行输入 x 与与 y 的的实验数据。实验数据。 第二步:对第二步:

47、对 x 数据进展格式化复制数据进展格式化复制x2x8。 第三步:在表中选定一切第三步:在表中选定一切xx8数据,选择数据,选择“工具下拉工具下拉菜单菜单“数据分析,按提示进展操作,即可得出全部数据分析,按提示进展操作,即可得出全部计算分析数据。计算分析数据。5.5 多元回归多元回归5.5.1根本概念根本概念 上面讨论的是只需两个变量的回归问题,其中一个是自变量,上面讨论的是只需两个变量的回归问题,其中一个是自变量,另一个是因变量。但在大多数情况下,自变量不是一个而是多个,另一个是因变量。但在大多数情况下,自变量不是一个而是多个,称这类问题为多元回归问题。称这类问题为多元回归问题。 多元回归中最简单且最根本的是多元线性回归。如自变量多元回归中最简单且最根本的是多元线性回归。如自变量 xi ( i= 1,2, ,G ),进展,进展m次实验,所得的数据可以写成两个数组,次实验,所得的数据可以写成两个数组,即两个矩阵:即两个矩阵:121212221212

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论