《回归分析法建模》课件_第1页
《回归分析法建模》课件_第2页
《回归分析法建模》课件_第3页
《回归分析法建模》课件_第4页
《回归分析法建模》课件_第5页
已阅读5页,还剩109页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

回归分析建模

Lum21thJuly20051精选PPT回归分析建模Lum1精选POutline一、基本概念二、多元线性回归模型三、非线性回归2精选PPTOutline一、基本概念2精选PPT一、基本概念1.两类关系确定性关系e.g.圆的面积非确定性关系e.g.人的年龄x与血压Y的关系细纱强度Y与原棉的纤维长度x1,纤维细度x2,纤维强度x33精选PPT一、基本概念1.两类关系3精选PPT2.回归分析自变量X:可控变量(可精确测量)因变量Y:随机变量回归分析:研究两者之间的相关关系

4精选PPT2.回归分析自变量X:可控变量(可精确测量)4精选PPT3.基本问题参数估计parameterestimate假设检验hypothesistesting预测预报prediction5精选PPT3.基本问题参数估计parameterestimat二、多元线性回归模型实际问题中,一个变量往往受到多个因变量的影响,在线性回归模型中则表现为有多个解释变量。所谓多元线性回归是指描述一个因变量与二个以上的自变量之间线性关系的一种方法,这样的模型被称为多元线性回归模型。6精选PPT二、多元线性回归模型6精选PPT主要内容1.多元线性回归模型及假设2.参数估计3.假设检验4.预测预报5.多元线性回归存在的问题6.实例分析7精选PPT主要内容1.多元线性回归模型及假设7精选PPT

1.多元线性回归模型及假设8精选PPT1.多元线性回归模型及假设8精选PPT9精选PPT9精选PPT10精选PPT10精选PPT2.参数估计(最小二乘估计)11精选PPT2.参数估计(最小二乘估计)11精选PPT12精选PPT12精选PPT估计量的特征13精选PPT估计量的特征13精选PPT一般来说,由于多元的缘故,多元回归估计值的显著性检验的内容显然要复杂得多,具体说是检验的对象多、不同性质的问题多、难度大等。3.假设检验

14精选PPT一般来说,由于多元的缘故,多元回归估计值的显著性检验的3.1回归参数的显著性检验15精选PPT3.1回归参数的显著性检验15精选PPT回归参数的t-检验16精选PPT回归参数的t-检验16精选PPT3.2回归方程的显著性检验回归系数的t-检验,检验了各个解释变量Xj单独对应变量Y是否显著;我们还需要检验:所有解释变量联合在一起,是否对应变量Y也显著?这即是下面所要进行的F-检验。17精选PPT3.2回归方程的显著性检验回归系数的t-检验,检验了各个方差分析表以下用表格的形式列出变差、自由度、方差变差来源平方和自由度方差源于回归K-1源于残差n-k总变差n-118精选PPT方差分析表以下用表格的形式列出变差、自由度、方差变差来源平方F-检验(单侧检验)19精选PPTF-检验(单侧检验)19精选PPT4.预测预报4.1因变量平均值的点预测、区间预测4.2因变量个别值的点预测、区间预测20精选PPT4.预测预报4.1因变量平均值的点预测、20精选PPT4.1应变量平均值的点预测、区间预测4.1.1Y平均值的点预测将解释变量预测值代入估计的方程便可:21精选PPT4.1应变量平均值的点预测、区间预测4.1.1Y平4.1.2Y平均值的区间预测基本思想22精选PPT4.1.2Y平均值的区间预测基本思想22精选PPTY平均值的区间预测

——具体作法23精选PPTY平均值的区间预测

——具体作法23精选P4.2因变量个别值的点预测、区间预测4.2.1点预测:与因变量平均值点预测相等,为:

24精选PPT4.2因变量个别值的点预测、区间预测4.2.1点预测4.2.2因变量个别值的区间预测25精选PPT4.2.2因变量个别值的区间预测25精选PPT5.多元线性回归存在的问题5.1样本容量问题5.2相对重要性5.3多重共线性问题5.4虚变量

26精选PPT5.多元线性回归存在的问题5.1样本容量问题26精选PPT5.1样本容量问题最小样本容量:所谓“最小样本容量”,即从最小二乘原理和最大似然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。样本最小容量必须不少于模型中解释变量的数目(包括常数项),即27精选PPT5.1样本容量问题27精选PPT满足基本要求的样本容量28精选PPT满足基本要求的样本容量28精选PPT5.2相对重要性在多元线性回归模型中,有时需要考察对于被解释变量来讲,哪个解释变量更重要,即需要比较各个解释变量的相对重要性,这可以通过简单相关系数、偏相关系数和复相关系数来考察。如果各解释变量的计量单位不同,就不能直接应用偏回归系数进行比较,因为偏回归系数的取值受解释变量计量单位的影响。我们需要对偏回归系数加以调整,以便进行多元回归模型中各解释变量对被解释变量相对重要性的比较,如以下介绍的Beta系数、弹性系数。29精选PPT5.2相对重要性在多元线性回归模型中,有时需要考察对于被解Beta系数30精选PPTBeta系数30精选PPT弹性系数31精选PPT弹性系数31精选PPT所谓“多重共线性”是指解释变量之间存在某种线性关系。显然,如果多元回归模型中的解释变量存在“多重共线性”,其最小二乘估计的结果是无效的。亦即是不存在的。(岭回归、主成分回归)5.3多重共线性问题32精选PPT5.3多重共线性问题32精选PPT

在回归分析中,还有一类用来表示某种属性的变量,例如,有关性别、种类、地区、战争、地震、罢工、政变和政府经济政策的变化等。这种通常表示有或没有某种性质的变量称之为“虚变量”。一般用-1,0,1等来表示有或没有这种属性。一个例子:战争时期和和平时期的消费函数。5.4虚变量(DummyVariables)33精选PPT5.4虚变量(DummyVariables)33精选PP34精选PPT34精选PPT35精选PPT35精选PPT36精选PPT36精选PPT

利用“虚变量”的一般原则是,如果一个质的变量需要表示m种可能性,那么最多就只能引入m-1个虚变量。根据这个原则,在上面的例子中,就只能引入一个虚变量。如果不遵守这个原则,我们就可能掉入所谓“虚变量陷阱”,即完全多重共线性的情形。关于如何应用“虚变量”方法,需要讨论更多的问题,必须另外进行讨论。37精选PPT利用“虚变量”的一般原则是,如果一个质的变量6.实例分析(e.g.1)38精选PPT6.实例分析(e.g.1)38精选PPT39精选PPT39精选PPT结果表明,当前一期人均居民消费额(X2)保持不变时,人均国内生产总值(X1)每增加1千元,人均居民消费额(Y)平均增加0.339千元;当人均国内生产总值(X1)保持不变时,前一期人均居民消费额(X2)每增加1千元,人均居民消费额(Y)平均增加0.302千元。注:对回归模型和回归参数一定要分别通过t检验和F检验,才能说明模型的合理性。在此留作作业。40精选PPT结果表明,当前一期人均居民消费额(X2)40精选PPTe.g.2某电网有8台发电机组,6条主要线路,表A和表B中的方案0给出了各机组的当前出力和各线路上对应的有功潮流值,方案1~32给出了围绕方案0的一些实验数据,试用这些数据确定各线路上有功潮流关于各发电机组出力的近似表达式。41精选PPTe.g.2某电网有8台发电机组,6条主要线路,表A和表B中表A:各机组出力方案(MW)42精选PPT表A:各机组出力方案(MW)42精选PPT表B各线路的潮流值(MW)43精选PPT表B各线路的潮流值(MW)43精选PPT44精选PPT44精选PPT

45精选PPT

45精选PPT所求回归参数46精选PPT所求回归参数46精选PPTSPSS提供的模型显著性检验水平

47精选PPTSPSS提供的模型显著性检验水平47精选PPT多元线性回归法建模小结Step1.分析实验数据建立回归模型Step2.估计模型的未知参数Step3.对回归方程和回归参数作显著性检验,如果通过检验则执行下一步,否则转Step1Step4.结合实验数据作预测48精选PPT多元线性回归法建模小结Step1.分析实验数据建立回归模型4三、非线性回归1.引言在许多实际问题中,变量之间更加一般的关系形式是非线性关系的。我们注意到在非线性关系中,有许多情况是可以通过简单的变量变换,就可以转变为线性回归关系,从而这类非线性关系的问题也可应用前面所讲的方法来解决。因此,解决非线性回归模型的基本思路,就是通过一定的转换,将非线性形式转换成线性的形式,然后加以解决。49精选PPT三、非线性回归1.引言49精选PPT2.变量之间的非线性关系50精选PPT2.变量之间的非线性关系50精选PPT51精选PPT51精选PPT一些常用非线性函数

(主要是单个自变量的情况)52精选PPT一些常用非线性函数

(主要是单个自变量的情况)52精选PPT3.实例分析e.g.1多项式函数53精选PPT3.实例分析e.g.1多项式函数53精选PPTe.g.2参数为非线性的情况54精选PPTe.g.2参数为非线性的情况54精选PPT55精选PPT55精选PPT总之,对于非线性回归模型问题,实际上最重要、最困难的,并不是非线性形式的线性转换方式,而是原有的非线性回归模型如何建立,这才是最困难的,也是建模关键和困难之处。非线性回归小结56精选PPT总之,对于非线性回归模型问题,实际上最重要、最困难的,并不

Thankyou!57精选PPTThankyou!57精回归分析建模

Lum21thJuly200558精选PPT回归分析建模Lum1精选POutline一、基本概念二、多元线性回归模型三、非线性回归59精选PPTOutline一、基本概念2精选PPT一、基本概念1.两类关系确定性关系e.g.圆的面积非确定性关系e.g.人的年龄x与血压Y的关系细纱强度Y与原棉的纤维长度x1,纤维细度x2,纤维强度x360精选PPT一、基本概念1.两类关系3精选PPT2.回归分析自变量X:可控变量(可精确测量)因变量Y:随机变量回归分析:研究两者之间的相关关系

61精选PPT2.回归分析自变量X:可控变量(可精确测量)4精选PPT3.基本问题参数估计parameterestimate假设检验hypothesistesting预测预报prediction62精选PPT3.基本问题参数估计parameterestimat二、多元线性回归模型实际问题中,一个变量往往受到多个因变量的影响,在线性回归模型中则表现为有多个解释变量。所谓多元线性回归是指描述一个因变量与二个以上的自变量之间线性关系的一种方法,这样的模型被称为多元线性回归模型。63精选PPT二、多元线性回归模型6精选PPT主要内容1.多元线性回归模型及假设2.参数估计3.假设检验4.预测预报5.多元线性回归存在的问题6.实例分析64精选PPT主要内容1.多元线性回归模型及假设7精选PPT

1.多元线性回归模型及假设65精选PPT1.多元线性回归模型及假设8精选PPT66精选PPT9精选PPT67精选PPT10精选PPT2.参数估计(最小二乘估计)68精选PPT2.参数估计(最小二乘估计)11精选PPT69精选PPT12精选PPT估计量的特征70精选PPT估计量的特征13精选PPT一般来说,由于多元的缘故,多元回归估计值的显著性检验的内容显然要复杂得多,具体说是检验的对象多、不同性质的问题多、难度大等。3.假设检验

71精选PPT一般来说,由于多元的缘故,多元回归估计值的显著性检验的3.1回归参数的显著性检验72精选PPT3.1回归参数的显著性检验15精选PPT回归参数的t-检验73精选PPT回归参数的t-检验16精选PPT3.2回归方程的显著性检验回归系数的t-检验,检验了各个解释变量Xj单独对应变量Y是否显著;我们还需要检验:所有解释变量联合在一起,是否对应变量Y也显著?这即是下面所要进行的F-检验。74精选PPT3.2回归方程的显著性检验回归系数的t-检验,检验了各个方差分析表以下用表格的形式列出变差、自由度、方差变差来源平方和自由度方差源于回归K-1源于残差n-k总变差n-175精选PPT方差分析表以下用表格的形式列出变差、自由度、方差变差来源平方F-检验(单侧检验)76精选PPTF-检验(单侧检验)19精选PPT4.预测预报4.1因变量平均值的点预测、区间预测4.2因变量个别值的点预测、区间预测77精选PPT4.预测预报4.1因变量平均值的点预测、20精选PPT4.1应变量平均值的点预测、区间预测4.1.1Y平均值的点预测将解释变量预测值代入估计的方程便可:78精选PPT4.1应变量平均值的点预测、区间预测4.1.1Y平4.1.2Y平均值的区间预测基本思想79精选PPT4.1.2Y平均值的区间预测基本思想22精选PPTY平均值的区间预测

——具体作法80精选PPTY平均值的区间预测

——具体作法23精选P4.2因变量个别值的点预测、区间预测4.2.1点预测:与因变量平均值点预测相等,为:

81精选PPT4.2因变量个别值的点预测、区间预测4.2.1点预测4.2.2因变量个别值的区间预测82精选PPT4.2.2因变量个别值的区间预测25精选PPT5.多元线性回归存在的问题5.1样本容量问题5.2相对重要性5.3多重共线性问题5.4虚变量

83精选PPT5.多元线性回归存在的问题5.1样本容量问题26精选PPT5.1样本容量问题最小样本容量:所谓“最小样本容量”,即从最小二乘原理和最大似然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。样本最小容量必须不少于模型中解释变量的数目(包括常数项),即84精选PPT5.1样本容量问题27精选PPT满足基本要求的样本容量85精选PPT满足基本要求的样本容量28精选PPT5.2相对重要性在多元线性回归模型中,有时需要考察对于被解释变量来讲,哪个解释变量更重要,即需要比较各个解释变量的相对重要性,这可以通过简单相关系数、偏相关系数和复相关系数来考察。如果各解释变量的计量单位不同,就不能直接应用偏回归系数进行比较,因为偏回归系数的取值受解释变量计量单位的影响。我们需要对偏回归系数加以调整,以便进行多元回归模型中各解释变量对被解释变量相对重要性的比较,如以下介绍的Beta系数、弹性系数。86精选PPT5.2相对重要性在多元线性回归模型中,有时需要考察对于被解Beta系数87精选PPTBeta系数30精选PPT弹性系数88精选PPT弹性系数31精选PPT所谓“多重共线性”是指解释变量之间存在某种线性关系。显然,如果多元回归模型中的解释变量存在“多重共线性”,其最小二乘估计的结果是无效的。亦即是不存在的。(岭回归、主成分回归)5.3多重共线性问题89精选PPT5.3多重共线性问题32精选PPT

在回归分析中,还有一类用来表示某种属性的变量,例如,有关性别、种类、地区、战争、地震、罢工、政变和政府经济政策的变化等。这种通常表示有或没有某种性质的变量称之为“虚变量”。一般用-1,0,1等来表示有或没有这种属性。一个例子:战争时期和和平时期的消费函数。5.4虚变量(DummyVariables)90精选PPT5.4虚变量(DummyVariables)33精选PP91精选PPT34精选PPT92精选PPT35精选PPT93精选PPT36精选PPT

利用“虚变量”的一般原则是,如果一个质的变量需要表示m种可能性,那么最多就只能引入m-1个虚变量。根据这个原则,在上面的例子中,就只能引入一个虚变量。如果不遵守这个原则,我们就可能掉入所谓“虚变量陷阱”,即完全多重共线性的情形。关于如何应用“虚变量”方法,需要讨论更多的问题,必须另外进行讨论。94精选PPT利用“虚变量”的一般原则是,如果一个质的变量6.实例分析(e.g.1)95精选PPT6.实例分析(e.g.1)38精选PPT96精选PPT39精选PPT结果表明,当前一期人均居民消费额(X2)保持不变时,人均国内生产总值(X1)每增加1千元,人均居民消费额(Y)平均增加0.339千元;当人均国内生产总值(X1)保持不变时,前一期人均居民消费额(X2)每增加1千元,人均居民消费额(Y)平均增加0.302千元。注:对回归模型和回归参数一定要分别通过t检验和F检验,才能说明模型的合理性。在此留作作业。97精选PPT结果表明,当前一期人均居民消费额(X2)40精选PPTe.g.2某电网有8台发电机组,6条主要线路,表A和表B中的方案0给出了各机组的当前出力和各线路上对应的有功潮流值,方案1~32给出了围绕方案0的一些实验数据,试用这些数据确定各线路上有功潮流关于各发电机组出力的近似表达式。98精选PPTe.g.2某电网有8台发电机组,6条主要线路,表A和表B中表A:各机组出力方案(MW)99精选PPT表A:各机组出力方案(MW)42精选PPT表B各线路的潮流值(MW)100精选PPT表B各线路的潮流值(MW)43精选PPT101精选PPT44精

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论