回归分析方法课件_第1页
回归分析方法课件_第2页
回归分析方法课件_第3页
回归分析方法课件_第4页
回归分析方法课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8回归分析方法当人们对研究对象的内在特性和各因素间的关系有比较充分的认识时,一般用机理分析方法建立数学模型。如果由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型,那么通常的办法是收集大量数据,基于对数据的统计分析去建立模型。本章讨论其中用途最广泛的一类模型——统计回归模型。8回归分析方法当人们对研究对象的内在特性和各因素间的关系有变量之间的关系可以分为两类:一类叫确定性关系,也叫函数关系,其特征是一个变量随着其他变量的确定而确定;另一类关系叫相关关系,变量之间的关系很难用一种精确的方法表示出来。例如,通常人的年龄越大血压越高,但人的年龄和血压之间没有确定的数量关系,人的年龄和血压之间的关系就是相关关系。回归分析就是处理变量之间的相关关系的一种数学方法。变量之间的关系可以分为两类:一类叫确定性关父亲们的身高与儿子们的身高之间关系的研究1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录,企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式父亲们的身高与儿子们的身高之间关系的研究1889年F.Gal160165170175180185140150160170180190200YX儿子们身高向着平均身高“回归”,以保持种族的稳定160165170175180185140150160170“回归”一词的由来从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下:如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”

。后人将此种方法普遍用于寻找变量之间的规律“回归”一词的由来从图上虽可看出,个子高的父亲确有生出个子高用回归分析方法解决问题的大致步骤如下:收集一组包含因变量和自变量的数据;选定因变量和自变量之间的模型,即一个数学式子,利用数据按照最小二乘准则计算模型中的系数;利用统计分析方法对不同的模型进行比较,找出与数据拟合得最好的模型;判断得到的模型是否适合于这组数据;利用模型对因变量做出预测或解释。用回归分析方法解决问题的大致步骤如下:回归分析方法有:一元线性回归多元线性回归非线性回归逐步回归回归分析方法有:8.1一元线性回归分析回归模型可分为线性回归模型和非线性回归模型。非线性回归模型是回归函数关于未知参数具有非线性结构的回归模型。某些非线性回归模型可以化为线性回归模型处理。8.1一元线性回归分析回归模型可分为线性回归模型和非线性回设x,y是随机变量,我们称为一元线性回归模型,其中β0,β1为待定系数。

假设有一组关系x和y的数据(xi,yi),i=1,2,…,n,确定β0,β1的方法是根据最小二乘准则,即求β0,β1使取得最小值。令求β0,β1的估计值

,从而得到直线。设x,y是随机变量,我们称参数的区间估计由于所计算出的仍然是随机变量,因此要对的取值的区间进行估计,如果区间估计值是一个较短的区间表示模型精度较高。误差方差估计设为回归函数的值,yi为测量值,剩余方差为线性相关性检验

如果y与x具有较好的线性关系,则说明模型可用。反映模型是否具有良好线性关系可通过相关系数R的值和F值观察。参数的区间估计一元线性回归的Matlab实现利用Matlab统计工具箱(StatisticsToolbox)中的regress函数可实现一元线性回归分析。其用法是:[b,bint,r,rint,stats]=regress(y,x,alpha)y为因变量数据,以列向量表示,x为1与自变量数据组成的矩阵,alpha为显著性水平(默认值为0.05).输出b=[β0,β1],bint为β0,β1的置信区间,r是残差(列向量),r是残差的置信区间,stats包含4个统计量:决定系数R2,F值,F(1,n-2)分布大于F值的概率p;剩余方差s2.R2越接近1,变量的线性相关性越强.如果满足F1-α(1,n-2)<F,则认为变量y与x显著地有线性关系.如果p<alpha,则模型可用.这三个值互相印证.s2的值越小说明模型的精度越高.一元线性回归的Matlab实现利用Matlab统计工具箱(S例1身高与腿长在某地区测得成年女子身高与腿长的数据如下:试利用此数据分析成年女子身高与腿长的关系.腿长8885889192939395969897969899100102身高143145146147148150153154155156157158159160162164例1身高与腿长在某地区测得成年女子身高与腿8.2多元线性回归分析如果根据经验和有关知识认为与因变量有关联的自变量不止一个,那么就应该考虑建立多元线性回归模型.

设影响因变量y的主要因素有m个,记为x=(x1,x2,…,xm),我们称

为多元线性回归模型.

若已知一组因变量y与自变量x的数据,采用最小二乘法确定系数可得到回归方程8.2多元线性回归分析如果根据经验和有关知建立多元线性回归模型是一个相当复杂的过程,概括起来主要有以下几个方面:根据研究目的收集数据和预分析,确定因变量与自变量;根据散点图是否具有线性关系建立基本回归模型;参数估计模型的精细分析模型应用建立多元线性回归模型是一个相当复杂的过程,例2某类研究学者的年薪

某科学基金会希望估计从事某研究的学者的年薪y与他们的研究成果的质量x1、工作时间x2、获得资助的能力x3等指标之间的关系,为此按一定的实验设计方法调查了24位学者,得到如下数据:学者123456789101112x13.55.35.15.84.26.06.85.53.17.24.54.9x29201833311325305472511x36.16.47.46.77.55.96.04.05.88.35.06.4y33.240.338.746.841.437.539.040.730.152.938.231.8学者131415161718192021222324x18.06.56.63.76.27.04.04.55.95.64.83.9x223353921740352333273415x37.67.05.04.45.57.06.03.54.94.38.05.8y43.344.142.533.634.248.038.035.940.436.845.235.1试建立y与x1,x2,x3之间关系数学模型。例2某类研究学者的年薪某科学基金会希望估计从事某研8.2.3逐步回归方法

逐步回归就是一种从众多变量中有效地选择重要变量的方法。基本思路是,先确定一个包含若干自变量的初始集合,然后每次从集合外的变量中引入一个对因变量影响最大的,再对集合中的变量进行检验,从变量不显著的变量中移出一个影响最小的,依此进行,直到不能引入和移出为止。引入和移出都以给定的显著性水平为标准。8.2.3逐步回归方法逐步回归就是一种从众

在Matlab中使用stepwise实现逐步回归,它提供了一个人机交互式画面,通过此工具可以自由地选择变量进行统计分析。该命令的用法是:stepwise(x,y,inmodel,penter,premove)参数说明:x—自变量数据,为n×m矩阵(m为自变量个数,n为每个自变量的数据量)y—因变量数据,为n×1矩阵inmodel

—自变量初始集合的指标penter—显著水平上限值,缺省时为0.05.premove—显著水平下限值,缺省时为0.1在Matlab中使用stepwise实现逐步交互式图形界面说明交互式图形界面说明多元线性回归示例序号瘦肉量y(kg)眼肌面积x1(cm2)腿肉量x2(kg)腰肉量x3(kg)序号瘦肉量y(kg)眼肌面积x1(cm2)腿肉量x2(kg)腰肉量x3(kg)115.0223.735.491.211415.9423.525.181.98212.6222.344.321.351514.3321.864.861.59314.8628.845.041.921615.1128.955.181.37413.9827.674.721.491713.8124.534.881.39515.9120.835.351.561815.5827.655.021.66612.4722.274.271.501915.8527.295.551.70715.8027.575.251.852015.2829.075.261.82814.3228.014.621.512116.4032.475.181.75913.7624.794.421.462215.0229.655.081.701015.1828.965.301.662315.7322.114.901.811114.2025.774.871.642414.7522.434.651.821217.0723.175.801.902514.3720.445.101.551315.4028.575.221.66例根据下述某猪场25头育肥猪4个胴体性状的数据资料,试进行瘦肉量y对眼肌面积(x1)、腿肉量(x2)、腰肉量(x3)的多元线性回归分析。多元线性回归示例序瘦肉量眼肌面积腿肉量腰肉量序瘦肉量y(kg8.2.4多项式回归多项式回归仍然属于多元线性回归,包括一元多项式回归和多元一元多项式回归。一元多项式回归模型为可以使用Matlab的polytool命令进行求解。该命令的用法是:polytool(x,y,n,alpha)参数说明:x—自变量数据,列向量y—因变量数据,列向量n—多项式次数alpha—显著性水平输出为交互式图形界面,画面显示回归曲线及其置信区间8.2.4多项式回归多项式回归仍然属于多元多项式回归示例产犊月份x123456平均产奶量y(kg)3833.433811.583769.473565.743481.993372.82产犊月份x789101112平均产奶量y(kg)3476.763466.223395.423807.083817.033884.52例根据重庆市种畜场奶牛群各月份产犊母牛平均305天产奶量的数据资料,试进行一元二次多项式回归分析。多项式回归示例产犊月份x123456平均产奶量y(kg)388.3非线性回归分析非线性回归模型一般形式为其中x为自变量,β为参数,y为因变量。求解β的方法仍然是使用最小二乘法。8.3非线性回归分析非线性回归模型一般形式为[b,R,J]=nlinfit(x,y,’model’,b0)[b,R,J]=nlinfit(x,y,’model’,b08回归分析方法当人们对研究对象的内在特性和各因素间的关系有比较充分的认识时,一般用机理分析方法建立数学模型。如果由于客观事物内部规律的复杂性及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型,那么通常的办法是收集大量数据,基于对数据的统计分析去建立模型。本章讨论其中用途最广泛的一类模型——统计回归模型。8回归分析方法当人们对研究对象的内在特性和各因素间的关系有变量之间的关系可以分为两类:一类叫确定性关系,也叫函数关系,其特征是一个变量随着其他变量的确定而确定;另一类关系叫相关关系,变量之间的关系很难用一种精确的方法表示出来。例如,通常人的年龄越大血压越高,但人的年龄和血压之间没有确定的数量关系,人的年龄和血压之间的关系就是相关关系。回归分析就是处理变量之间的相关关系的一种数学方法。变量之间的关系可以分为两类:一类叫确定性关父亲们的身高与儿子们的身高之间关系的研究1889年F.Gallton和他的朋友K.Pearson收集了上千个家庭的身高、臂长和腿长的记录,企图寻找出儿子们身高与父亲们身高之间关系的具体表现形式父亲们的身高与儿子们的身高之间关系的研究1889年F.Gal160165170175180185140150160170180190200YX儿子们身高向着平均身高“回归”,以保持种族的稳定160165170175180185140150160170“回归”一词的由来从图上虽可看出,个子高的父亲确有生出个子高的儿子的倾向,同样地,个子低的父亲确有生出个子低的儿子的倾向。得到的具体规律如下:如此以来,高的伸进了天,低的缩入了地。他百思不得其解,同时又发现某人种的平均身高是相当稳定的。最后得到结论:儿子们的身高回复于全体男子的平均身高,即“回归”

。后人将此种方法普遍用于寻找变量之间的规律“回归”一词的由来从图上虽可看出,个子高的父亲确有生出个子高用回归分析方法解决问题的大致步骤如下:收集一组包含因变量和自变量的数据;选定因变量和自变量之间的模型,即一个数学式子,利用数据按照最小二乘准则计算模型中的系数;利用统计分析方法对不同的模型进行比较,找出与数据拟合得最好的模型;判断得到的模型是否适合于这组数据;利用模型对因变量做出预测或解释。用回归分析方法解决问题的大致步骤如下:回归分析方法有:一元线性回归多元线性回归非线性回归逐步回归回归分析方法有:8.1一元线性回归分析回归模型可分为线性回归模型和非线性回归模型。非线性回归模型是回归函数关于未知参数具有非线性结构的回归模型。某些非线性回归模型可以化为线性回归模型处理。8.1一元线性回归分析回归模型可分为线性回归模型和非线性回设x,y是随机变量,我们称为一元线性回归模型,其中β0,β1为待定系数。

假设有一组关系x和y的数据(xi,yi),i=1,2,…,n,确定β0,β1的方法是根据最小二乘准则,即求β0,β1使取得最小值。令求β0,β1的估计值

,从而得到直线。设x,y是随机变量,我们称参数的区间估计由于所计算出的仍然是随机变量,因此要对的取值的区间进行估计,如果区间估计值是一个较短的区间表示模型精度较高。误差方差估计设为回归函数的值,yi为测量值,剩余方差为线性相关性检验

如果y与x具有较好的线性关系,则说明模型可用。反映模型是否具有良好线性关系可通过相关系数R的值和F值观察。参数的区间估计一元线性回归的Matlab实现利用Matlab统计工具箱(StatisticsToolbox)中的regress函数可实现一元线性回归分析。其用法是:[b,bint,r,rint,stats]=regress(y,x,alpha)y为因变量数据,以列向量表示,x为1与自变量数据组成的矩阵,alpha为显著性水平(默认值为0.05).输出b=[β0,β1],bint为β0,β1的置信区间,r是残差(列向量),r是残差的置信区间,stats包含4个统计量:决定系数R2,F值,F(1,n-2)分布大于F值的概率p;剩余方差s2.R2越接近1,变量的线性相关性越强.如果满足F1-α(1,n-2)<F,则认为变量y与x显著地有线性关系.如果p<alpha,则模型可用.这三个值互相印证.s2的值越小说明模型的精度越高.一元线性回归的Matlab实现利用Matlab统计工具箱(S例1身高与腿长在某地区测得成年女子身高与腿长的数据如下:试利用此数据分析成年女子身高与腿长的关系.腿长8885889192939395969897969899100102身高143145146147148150153154155156157158159160162164例1身高与腿长在某地区测得成年女子身高与腿8.2多元线性回归分析如果根据经验和有关知识认为与因变量有关联的自变量不止一个,那么就应该考虑建立多元线性回归模型.

设影响因变量y的主要因素有m个,记为x=(x1,x2,…,xm),我们称

为多元线性回归模型.

若已知一组因变量y与自变量x的数据,采用最小二乘法确定系数可得到回归方程8.2多元线性回归分析如果根据经验和有关知建立多元线性回归模型是一个相当复杂的过程,概括起来主要有以下几个方面:根据研究目的收集数据和预分析,确定因变量与自变量;根据散点图是否具有线性关系建立基本回归模型;参数估计模型的精细分析模型应用建立多元线性回归模型是一个相当复杂的过程,例2某类研究学者的年薪

某科学基金会希望估计从事某研究的学者的年薪y与他们的研究成果的质量x1、工作时间x2、获得资助的能力x3等指标之间的关系,为此按一定的实验设计方法调查了24位学者,得到如下数据:学者123456789101112x13.55.35.15.84.26.06.85.53.17.24.54.9x29201833311325305472511x36.16.47.46.77.55.96.04.05.88.35.06.4y33.240.338.746.841.437.539.040.730.152.938.231.8学者131415161718192021222324x18.06.56.63.76.27.04.04.55.95.64.83.9x223353921740352333273415x37.67.05.04.45.57.06.03.54.94.38.05.8y43.344.142.533.634.248.038.035.940.436.845.235.1试建立y与x1,x2,x3之间关系数学模型。例2某类研究学者的年薪某科学基金会希望估计从事某研8.2.3逐步回归方法

逐步回归就是一种从众多变量中有效地选择重要变量的方法。基本思路是,先确定一个包含若干自变量的初始集合,然后每次从集合外的变量中引入一个对因变量影响最大的,再对集合中的变量进行检验,从变量不显著的变量中移出一个影响最小的,依此进行,直到不能引入和移出为止。引入和移出都以给定的显著性水平为标准。8.2.3逐步回归方法逐步回归就是一种从众

在Matlab中使用stepwise实现逐步回归,它提供了一个人机交互式画面,通过此工具可以自由地选择变量进行统计分析。该命令的用法是:stepwise(x,y,inmodel,penter,premove)参数说明:x—自变量数据,为n×m矩阵(m为自变量个数,n为每个自变量的数据量)y—因变量数据,为n×1矩阵inmodel

—自变量初始集合的指标penter—显著水平上限值,缺省时为0.05.premove—显著水平下限值,缺省时为0.1在Matlab中使用stepwise实现逐步交互式图形界面说明交互式图形界面说明多元线性回归示例序号瘦肉量y(kg)眼肌面积x1(cm2)腿肉量x2(kg)腰肉量x3(kg)序号瘦肉量y(kg)眼肌面积x1(cm2)腿肉量x2(kg)腰肉量x3(kg)115.0223.735.491.211415.9423.525.181.98212.6222.344.321.351514.3321.864.861.59314.8628.845.041.921615.1128.955.181.37413.9827.674.721.491713.8124.534.881.39515.9120.835.351.561815.5827.655.021.66612.4722.274.271.501915.8527.295.551.707

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论