《试验设计与数据处理》讲稿试验数据的回归分析课件_第1页
《试验设计与数据处理》讲稿试验数据的回归分析课件_第2页
《试验设计与数据处理》讲稿试验数据的回归分析课件_第3页
《试验设计与数据处理》讲稿试验数据的回归分析课件_第4页
《试验设计与数据处理》讲稿试验数据的回归分析课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章试验数据的回归分析

4.1基本概念方差分析研究两个变量间的显著性问题回归分析处理变量之间相关关系的问题——由试验结果建立数学模型(1)确定性关系—对应关系、函数关系。其变量称确定性变量。(2)相关关系—对应的变量称随机变量。没有一一对应的函数关系,但有统计规律—散点图、回归方程

一元回归分析——研究单因素与试验指标间相关关系多元回归分析——研究多因素与试验指标间相关关系线性回归、非线性回归——相关关系为线性或非线性1第4章试验数据的回归分析4.1基本概念(1)确定性4.2一元线性回归分析—最简单的线性回归分析4.2.1一元线性回归方程的建立设有一组试验数据xi,yi(i=1,2,…,n),其中x是自变量,y是因变量。若x,y符合线性关系,或已知经验公式为直线形式,即:称为变量x,y的一元线性回归方程。

a,b称为回归系数;是由xi代入回归方程的计算值,称为回归值。24.2一元线性回归分析—最简单的线性回归分析4.2.1一元线性回归方程的建立(续)与yi之间的偏差称为残差,用ei表示,则有:残差平方值(考虑到残差有正有负)之和为:显然,只有残差平方和最小时,回归方程与试验值的拟合程度最好。

残差平方和SSe为a,b的函数,即:SSe=f(a,b)为使SSe值到达极小,根据极值原理,只要对上式分别对a,b求偏导数,并令其等于零,求解方程组即可求得a,b之值————最小二乘法原理。3一元线性回归方程的建立(续)与yi之间的偏差称为残一元线性回归方程的建立(续)根据最小二乘法,可以得到:对方程组求解,即可得到回归系数a,b的计算式:正规方程组4一元线性回归方程的建立(续)根据最小二乘法,可以得到:对方程一元线性回归方程的建立(续)为了方便计算,令:于是:5一元线性回归方程的建立(续)为了方便计算,令:于是:56677884.2.2一元线性回归效果的检验——检验回归方程的可靠性或可信性相关系数检验法、F检验即方差分析法、残差分析法94.2.2一元线性回归效果的检验相关系数检验法、F检验即4.2.2.1相关系数检验法

相关系数用于描述变量x与y的线性相关程度的系数:回归系数b与相关系数r的关系为:b与r有相同的符号决定系数——相关系数的平方r2

104.2.2.1相关系数检验法相关系数用于描述变量x与y相关系数的特点:

0≤|r|≤1完全线性相关完全线性相关有一定的线性关系

有一定的线性关系

无线性关系

无线性关系

11相关系数的特点:0≤|r|≤1完全线性相关完全线性相关相关系数检验:相关系数r越接近1,x与y的线性相关程度越高,然而r的大小未能回答其值达到多大时,x与y之间才存在线性相关,所以须对相关系数r进行显著性检验:(1)根据给定的显著性水平a和试验数据组数n(n>2),从附录5(P.208)查取相关系数临界值rmin。表中,m为自变量的个数:一元回归m=1;二元回归m=2(2)显著性检验:如果|r|≥rmin线性相关显著;如果|r|<rmin线性相关不显著。更确切地检验:如果|r|≥rmin(0.01)线性相关非常显著;如果rmin(0.05)≤|r|<rmin(0.01)线性相关显著;如果|r|<rmin(0.05)线性相关不显著。12相关系数检验:相关系数r越接近1,x与y的线性相关程度越13134.2.2.2F检验—方差分析法(1)计算离差平方和回归平方和—回归值与算术平均值的偏差总离差平方和—试验值yi与其算术平均值的偏差残差平方和—试验值yi与回归值的偏差三种平方和之间有下述关系:

SST=SSR+SSe

SSR还可以用更简单的公式计算:

144.2.2.2F检验—方差分析法(1)计算离(2)计算自由度

总离差平方和SST的自由度为:dfT=n-1回归平方和SSR的自由度为:dfR

=1残差平方和SSe的自由度为:dfe=n-2显然,三种自由度之间的关系为:dfT

=dfR+dfe

(3)计算均方——离差平方和/自由度回归平方和的均方残差平方和的均方(4)F检验服从自由度为(dfR,dfe)的F分布15(2)计算自由度总离差平方和SST的自由度为:dfT表4-3一元线性回归方差分析表1.若F>F0.01(dfR,dfe),称x与y有非常显著的线性关系,用两个“**”号表示2.若F0.05(dfR,dfe)<F<F0.01(dfR,dfe),称x与y有显著的线性关系,用一个“*”号表示;3.若F<F0.05(dfR,dfe),则称x与y没有明显著的线性关系,回归方程不可信。差异源SSdfMSF显著性

回归SSR1MSR=SSRMSR

/MSe误差SSen-2MSe=SSe/(n-2)总和SSTn-116表4-3一元线性回归方差分析表1.若F>F0.017174.2.2.3残差分析试验值yi与回归值的偏差称为残差:——用残差来估算试验值的范围残差的标准误差可按下式计算:

如果试验的随机误差服从正态分布,则:试验值yi落在之内的概率为95%;试验值yi落在之内的概率为99%。

可见,残差标准差越小,说明曲线拟合得越好。184.2.2.3残差分析试验值yi与回归值的偏差4.3多元线性回归分析—多个变量的线性回归分析设试验指标(因变量)y与多个试验因素(自变量)xj,(j=1,2,…,m)之间的近似函数关系式为:则上式称为因变量y关于自变量x1,x2,…,xm的多元线性回归方程,其中b1,b2,…,bm称为偏回归系数设y有n组试验数据x1i,x2i,…,xmi,yi(i=1,2,…,n),如果将自变量x1i,x2i,…,xmi

,代入上述回归方程,就可以得到对应的函数计算值,即回归值。残差平方和为:

4.3.1多元线性回归方程194.3多元线性回归分析—多个变量的线性回归分析设偏回归系数的确定:根据最小二乘法原理,要使Q达到最小,应满足以下条件:由此可以得到如下的正规方程组:20偏回归系数的确定:根据最小二乘法原理,要使Q达到最小,应方程组的解就是偏回归系数注意:为了使正规方程组有解,要求n≥m,即试验次数应大于自变量的个数。4.3.2多元线性回归方程的显著性检验4.3.2.1F检验法

总平方和:回归平方和:残差平方和:

21方程组的解就是偏回归系数注意:为了使正规方程组有解,要求n表4-8多元线性回归方差分析表差异源SSdfMSF显著性

回归SSRmMSR=SSR/mMSR

/MSe误差SSen-m-1MSe=SSe/(n-m-1)总和SSTn-11.若F>F0.01(dfR,dfe),称y与x1,x2,…,xm有非常显著的线性关系,用两个“**”号表示2.若F0.05(dfR,dfe)<F<F0.01(dfR,dfe),称y与x1,x2,…,xm有显著的线性关系,用一个“*”号表示;3.若F<F0.05(dfR,dfe),则称y与x1,x2,…,xm没有明显著的线性关系,回归方程不可信。22表4-8多元线性回归方差分析表差异源SSdfMSF显著4.3.2.2相关系数检验法一元线性回归:相关系数r—反映变量y与x的线性相关程度多元线性回归:复相关系数R—反映变量y与多个变量xj之间的线性相关程度复相关系数R的定义式:多元线性回归方程的决定系数:复相关系数的平方R2。—反映了回归平方和SSR在总离差平方和SST中所占的比重。234.3.2.2相关系数检验法一元线性回归:相复相关系数R的特点:

0≤R≤1(与一元线性回归类似)当R=1时,y与x1,x2,…,xm存在严格的线性关系;当R=0时,y与x1,x2,…,xm不存在任何线性相关关系,但可能存在其他非线性关系;当0<R<1时,变量间存在一定程度的线性相关关系。当m=1,复相关系数R与一元线性相关系数r相等。

修正自由度的决定系数显著性检验:如果|r|≥rmin(0.01)y与x1,x2,…,xm有非常显著的线性关系;如果rmin(0.05)≤|r|<rmin(0.01)有显著的线性关系;如果|r|<rmin(0.05)线性相关不显著。24复相关系数R的特点:0≤R≤1(与一元线性回归类4.3.3偏回归系数的显著性检验——因素主次的判断方法“最优”回归方程的条件:(1)回归方程的残差平方和最小;(2)对y有显著影响的变量不能遗漏;(3)回归方程中含有变量应尽可能少。用偏回归平方和SSj

来判断:计算偏回归平方和SSj

:SSj愈大,表示xj对y影响程度就愈大。服从自由度为(1,dfe)的F分布式中:(2)F检验:254.3.3偏回归系数的显著性检验——因素主次的判断方

4.4非线性回归分析

已经学过“线性回归分析”方法:一元、多元线性回归“非线性回归分析”“线性回归分析”转化要解决两个问题:一、如何确定非线性函数的具体形式?不同的非线性函数有不同的线性化形式二、如何估计函数中的参数?“线性回归分析”已经解决——仍然是最小二乘法关键:将非线性问题线性化处理264.4非线性回归分析已经学过“线性回归分析”方法:

4.4.1一元非线性回归分析转化为一元线性回归问题的具体做法:①根据试验数据,在直角坐标中画出散点图;②根据散点图,推测y与x之间的函数关系;③选择适当的变换,使之变成线性关系;④用线性回归方法求出线性回归方程;⑤返回到原来的函数关系,得到要求的回归方程。

——转化为一元线性回归274.4.1一元非线性回归分析转化为一元线性回归问题的具常用非线性函数的线性化变换28常用非线性函数的线性化变换284.4.2一元多项式回归常用非线性函数线性化容易复杂非线性函数线性化难任何复杂的一元连续函数都可用高阶多项式近似表达,因此,对于较难直线化的一元函数,可用多项式来拟合:如果令Xl=x,X2=x2,…,Xm=xm,则上式可以转化为多元线性方程:——转化为多元线性回归294.4.2一元多项式回归常用非线性函数线性化容易复杂非4.4.3多元非线性回归——转化为多元线性回归本章要求:掌握回归分析的基本概念和方法熟练Excel中“工具分析库”304.4.3多元非线性回归——转化为多元线性回归本第4章试验数据的回归分析

4.1基本概念方差分析研究两个变量间的显著性问题回归分析处理变量之间相关关系的问题——由试验结果建立数学模型(1)确定性关系—对应关系、函数关系。其变量称确定性变量。(2)相关关系—对应的变量称随机变量。没有一一对应的函数关系,但有统计规律—散点图、回归方程

一元回归分析——研究单因素与试验指标间相关关系多元回归分析——研究多因素与试验指标间相关关系线性回归、非线性回归——相关关系为线性或非线性31第4章试验数据的回归分析4.1基本概念(1)确定性4.2一元线性回归分析—最简单的线性回归分析4.2.1一元线性回归方程的建立设有一组试验数据xi,yi(i=1,2,…,n),其中x是自变量,y是因变量。若x,y符合线性关系,或已知经验公式为直线形式,即:称为变量x,y的一元线性回归方程。

a,b称为回归系数;是由xi代入回归方程的计算值,称为回归值。324.2一元线性回归分析—最简单的线性回归分析4.2.1一元线性回归方程的建立(续)与yi之间的偏差称为残差,用ei表示,则有:残差平方值(考虑到残差有正有负)之和为:显然,只有残差平方和最小时,回归方程与试验值的拟合程度最好。

残差平方和SSe为a,b的函数,即:SSe=f(a,b)为使SSe值到达极小,根据极值原理,只要对上式分别对a,b求偏导数,并令其等于零,求解方程组即可求得a,b之值————最小二乘法原理。33一元线性回归方程的建立(续)与yi之间的偏差称为残一元线性回归方程的建立(续)根据最小二乘法,可以得到:对方程组求解,即可得到回归系数a,b的计算式:正规方程组34一元线性回归方程的建立(续)根据最小二乘法,可以得到:对方程一元线性回归方程的建立(续)为了方便计算,令:于是:35一元线性回归方程的建立(续)为了方便计算,令:于是:53663773884.2.2一元线性回归效果的检验——检验回归方程的可靠性或可信性相关系数检验法、F检验即方差分析法、残差分析法394.2.2一元线性回归效果的检验相关系数检验法、F检验即4.2.2.1相关系数检验法

相关系数用于描述变量x与y的线性相关程度的系数:回归系数b与相关系数r的关系为:b与r有相同的符号决定系数——相关系数的平方r2

404.2.2.1相关系数检验法相关系数用于描述变量x与y相关系数的特点:

0≤|r|≤1完全线性相关完全线性相关有一定的线性关系

有一定的线性关系

无线性关系

无线性关系

41相关系数的特点:0≤|r|≤1完全线性相关完全线性相关相关系数检验:相关系数r越接近1,x与y的线性相关程度越高,然而r的大小未能回答其值达到多大时,x与y之间才存在线性相关,所以须对相关系数r进行显著性检验:(1)根据给定的显著性水平a和试验数据组数n(n>2),从附录5(P.208)查取相关系数临界值rmin。表中,m为自变量的个数:一元回归m=1;二元回归m=2(2)显著性检验:如果|r|≥rmin线性相关显著;如果|r|<rmin线性相关不显著。更确切地检验:如果|r|≥rmin(0.01)线性相关非常显著;如果rmin(0.05)≤|r|<rmin(0.01)线性相关显著;如果|r|<rmin(0.05)线性相关不显著。42相关系数检验:相关系数r越接近1,x与y的线性相关程度越43134.2.2.2F检验—方差分析法(1)计算离差平方和回归平方和—回归值与算术平均值的偏差总离差平方和—试验值yi与其算术平均值的偏差残差平方和—试验值yi与回归值的偏差三种平方和之间有下述关系:

SST=SSR+SSe

SSR还可以用更简单的公式计算:

444.2.2.2F检验—方差分析法(1)计算离(2)计算自由度

总离差平方和SST的自由度为:dfT=n-1回归平方和SSR的自由度为:dfR

=1残差平方和SSe的自由度为:dfe=n-2显然,三种自由度之间的关系为:dfT

=dfR+dfe

(3)计算均方——离差平方和/自由度回归平方和的均方残差平方和的均方(4)F检验服从自由度为(dfR,dfe)的F分布45(2)计算自由度总离差平方和SST的自由度为:dfT表4-3一元线性回归方差分析表1.若F>F0.01(dfR,dfe),称x与y有非常显著的线性关系,用两个“**”号表示2.若F0.05(dfR,dfe)<F<F0.01(dfR,dfe),称x与y有显著的线性关系,用一个“*”号表示;3.若F<F0.05(dfR,dfe),则称x与y没有明显著的线性关系,回归方程不可信。差异源SSdfMSF显著性

回归SSR1MSR=SSRMSR

/MSe误差SSen-2MSe=SSe/(n-2)总和SSTn-146表4-3一元线性回归方差分析表1.若F>F0.047174.2.2.3残差分析试验值yi与回归值的偏差称为残差:——用残差来估算试验值的范围残差的标准误差可按下式计算:

如果试验的随机误差服从正态分布,则:试验值yi落在之内的概率为95%;试验值yi落在之内的概率为99%。

可见,残差标准差越小,说明曲线拟合得越好。484.2.2.3残差分析试验值yi与回归值的偏差4.3多元线性回归分析—多个变量的线性回归分析设试验指标(因变量)y与多个试验因素(自变量)xj,(j=1,2,…,m)之间的近似函数关系式为:则上式称为因变量y关于自变量x1,x2,…,xm的多元线性回归方程,其中b1,b2,…,bm称为偏回归系数设y有n组试验数据x1i,x2i,…,xmi,yi(i=1,2,…,n),如果将自变量x1i,x2i,…,xmi

,代入上述回归方程,就可以得到对应的函数计算值,即回归值。残差平方和为:

4.3.1多元线性回归方程494.3多元线性回归分析—多个变量的线性回归分析设偏回归系数的确定:根据最小二乘法原理,要使Q达到最小,应满足以下条件:由此可以得到如下的正规方程组:50偏回归系数的确定:根据最小二乘法原理,要使Q达到最小,应方程组的解就是偏回归系数注意:为了使正规方程组有解,要求n≥m,即试验次数应大于自变量的个数。4.3.2多元线性回归方程的显著性检验4.3.2.1F检验法

总平方和:回归平方和:残差平方和:

51方程组的解就是偏回归系数注意:为了使正规方程组有解,要求n表4-8多元线性回归方差分析表差异源SSdfMSF显著性

回归SSRmMSR=SSR/mMSR

/MSe误差SSen-m-1MSe=SSe/(n-m-1)总和SSTn-11.若F>F0.01(dfR,dfe),称y与x1,x2,…,xm有非常显著的线性关系,用两个“**”号表示2.若F0.05(dfR,dfe)<F<F0.01(dfR,dfe),称y与x1,x2,…,xm有显著的线性关系,用一个“*”号表示;3.若F<F0.05(dfR,dfe),则称y与x1,x2,…,xm没有明显著的线性关系,回归方程不可信。52表4-8多元线性回归方差分析表差异源SSdfMSF显著4.3.2.2相关系数检验法一元线性回归:相关系数r—反映变量y与x的线性相关程度多元线性回归:复相关系数R—反映变量y与多个变量xj之间的线性相关程度复相关系数R的定义式:多元线性回归方程的决定系数:复相关系数的平方R2。—反映了回归平方和SSR在总离差平方和SST中所占的比重。534.3.2.2相关系数检验法一元线性回归:相复相关系数R的特点:

0≤R≤1(与一元线性回归类似)当R=1时,y与x1,x2,…,xm存在严格的线性关系;当R=0时,y与x1,x2,…,xm不存在任何线性相关关系,但可能存在其他非线性关系;当0<R<1时,变量间存在一定程度的线性相关关系。当m=1,复相关系数R与一元线性相关系数r相等。

修正自由度的决定系数显著性检验:如果|r|≥rmin(0.01)y与x1,x2,…,xm有非常显著的线性关系;如果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论