一元线性回归分析预测法与多元回归分析_第1页
一元线性回归分析预测法与多元回归分析_第2页
一元线性回归分析预测法与多元回归分析_第3页
一元线性回归分析预测法与多元回归分析_第4页
一元线性回归分析预测法与多元回归分析_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一元线性回归分析预测法概念(思路)根据预测变量(因变量)Y和影响因素(自变量)X的历史统计数据,建立一元线性回归方程,然后代入X的预测值,求出Y的预测值的方法。基本公式:y=aa+bxx其中:a、bb为回归归系数,是是未知参参数。基本思路:利用X,YY的历史史统计数数据,求求出合理理的回归归系数:a、bb,确定定出回归归方程根据预计的的自变量量x的取取值,求求出因变变量y的的预测值值。一元线性回回归方程程的建立立使用散点图图定性判判断变量量间是否否存在线线性关系系例:某地区区民航运运输总周周转量和和该地区区社会总总产值由由密切相相关关系系。年份总周转量(亿亿吨公里里)Y社会总产值值(百亿元元)

2、X112.530214.536314.738415.141515.548616.852717.553818.253.5918.855使用最小二二乘法确确定回归归系数使实际值与与理论值值误差平平方和最最小的参参数取值值。对应于自变变量xii,预测测值(理理论值)为为b+m*xi,实际际值yii,min(yi-b-mxi)2,求aa、b的的值。使用微积分分中求极极值的方方法,得得:由下列方程程代表的的直线的的最小二二乘拟合合直线的的参数公公式:其中 m 代表斜斜率 ,bb 代表表截距。一元线性回回归.xlss回归方程的的显著性性检验判断X、YY之间是是否确有有线性关关系,判判定回归归方程是是否有意

3、意义。有两类检验验方法:相关系系数检验验法和方方差分析析法相关系数检检验法构造统计量量r相关系数的的取值范范围为:-11,1,|rr|的大大小反映映了两个个变量间间线性关关系的密密切程度度,利用用它可以以判断两两个变量量间的关关系是否否可以用用直线方方程表示示。r值两变量之间间的关系系r=1完全正相关关1r00正相关,越越接近11,相关关性越强强。越接接近0,相相关性越越弱r=0不线性相关关0r-1负相关,越越接近-1,相相关性越越强;越越接近00,相关关性越弱弱r=-1完全负相关关两个变量是是否存在在线性相相关关系系的定量量判断规规则: 对于给定的的置信水水平,从相相关系数数临界值值表中查查

4、出r临临(n-2),把把其与用用样本计计算出来来的统计计量r00比较:若|r0|r临临(n-2)成成立,则则认为XX、Y之之间存在在线性关关系,回回归方程程在水平上上显著。差差异越大大,线性性关系越越好。反反之则认认为不显显著,回回归方程程无意义义,变量量间不存存在线性性关系。其中:n为为样本数数。方差分析法法:方差分析的的基本特特点是把把因变量量的总变变动平方方和分为为两部分分,一部部分反映映因变量量的实际际值与用用回归方方程计算算出的理理论值之之差,一一部分反反映理论论值与实实际值的的平均值值之差。Y的总变差差=Y的的残余变变差+YY的说明明变差,SSST=SSEE+SSSR或:总离差差平

5、方和和=剩余余平方和和+回归归平方和和回归平方和和U与剩剩余平方方和Q相相比越大大,说明明回归效效果越好好。注:在方差差分析中中,已被被解释的的和未被被解释的的变差除除以相应应的自由由度的个个数即变变为方差差。Y的的方差是是Y的总总偏差平平方和除除以n-1,被被解释的的方差等等于被解解释的变变差(因因为回归归只比估估计Y的的均值多多用一个个约束条条件),残残余方差差等于残残差偏差差平方和和除以nn-2,残残差的方方差S22是误差差方差的的无偏且且一致的的估计(SS叫做回回归标准准差)SS2=Q/(n-m)定量判断回回归有效效性有两两种方法法:可决系数检检验法拟合优度统统计量;判定系系数 :r2

6、=SSSR/SSST=U/SSyy 调整的r22 =11-QQ/(nn-m)/Syyy/(nn-1)复相关系数数检验法法:构造造统计量量R=SSQRTT1-Q/SSyy=SQRRT(UU/Syyy)判断规则:对于给定的的置信度度,从相相关系数数r分布布表中查查出r临临(n-m),把把其与用用样本计计算出来来的统计计量R00比较:若R0rr临(n-m)成成立,则则认为回回归方程程在水平上上显著。反反之则认认为不显显著,回回归方程程无意义义,变量量间不存存在线性性关系。F检验法:构造统统计量FF=(UU/m-1)/Q/(n-m)其中:m为为变量个个数(总总数);n为样样本数。统计量F服服从第一一自

7、由度度为m-1、第第二自由由度为nn-m的的F(m-11,n-m)分分布。F=r2/(1-r2)*(n-mm)/(m-11)判断规则:对于给定的的置信度度,从FF分布表表中查出出F(m-1,nn-m),把把其与用用样本计计算出来来的统计计量F00比较:若F0FF(m-1,nn-m)成成立,则则认为回回归方程程在水平上上显著。反反之则认认为不显显著,回回归方程程无意义义,变量量间不存存在线性性关系。回归方程没没有通过过检验的的原因定性分析选选择的各各变量间间,本来来不存在在因果关关系。定定性分析析设想不不准确。选择的变量量间存在在因果关关系,但但还存在在其它起起着更重重要作用用的变量量尚未列列入

8、模型型之中。选择变量之之间的关关系是非非线性关关系。利用检验通通过的回回归方程程进行预预测y=6.334+00.2113x点估计值:若给定定x值,则则y的预预测值为为6.334+00.2113*558=118.669区间估计:标准误差:S=ssqrtt(e22)/(n-mm)一元非线性性回归分分析预测测法思路:与一一元线性性回归分分析基本本相同。即即通过变变量替换换将非线线性方程程转化为为线性方方程;使使用最小小二乘法法建立线线性回归归方程;在通过过逆变换换将线性性方程转转化为非非线性方方程。函数的线性性变换及及逆变换换是个数数学问题题,不讲讲了。例题,参见见1600页:航航空货物物周转量量=

9、a*(社会会总产值值)196页页,SBB机场空空运需求求预测202页页,利雅雅得国际际机场业业务量预预测多元回归分分析思路多元非线性性回归分分析转换为为多元线线性回归归分析,多多元线性性回归分分析,与与一元线线性回归归分析基基本相同同,只是是在自变变量的选选定上、求求解回归归方程及及统计检检验等方方面比一一元回归归要复杂杂一些。设多元线性性回归模模型为:y=bb0+b1*x1+b2*x2+bbm*xm参数求法为为最小二二乘法:min(yyi-(bb0+b1*x1ii+b2*x2ii+bbm*xmii)2分别对bjj求偏导导数,偏偏导数等等于0时时,上式式取得最最小值。可以得到mm+1个个关于b

10、bj的标标准方程程,使用用线性代代数中的的行列式式解法,可可以求出出回归系系数bjj。以二元回归归分析为为例,说说明多元元回归方方程的建建立定性判断得得知,因因变量YY与自变变量X11, XX2存在在线性相相关关系系。模型型形式为为:y=b0+b1*x1+b2*x2确定回归系系数b00、b1、b2,最小小二乘法法。分别别对b00、b1、b2求偏导导,令偏偏导数=0,构构成如下下方程组组:手工列表计计算:回归方程的的统计检检验回归方程的的显著性性检验,检检验回归归方程的的有效性性检验方法有有:F检检验法、复复相关系系数检验验法回归系数的的显著性性检验,检检验回归归系数的的有效性性,检验方法有有:

11、t检检验法构造统计量量t其中:m为为变量个个数;nn为样本本数。统计量t服服从自由由度为nn-m的的t(nn-m)分分布。判断规则:对于给定的的置信度度,从tt分布表表中查出出t/2(nn-m),把把其与用用样本计计算出来来的统计计量t00比较:若t0tt(n-m)成成立,则则认为回回归方程程在水平上上显著。反反之则认认为不显显著,回回归系数数无意义义,变量量间不存存在线性性相关关关系。统计假设检检验总结结:对于于一元回回归,四四种检验验方法选选一即可可;对于于多元回回归必须须进行tt检验和和R、FF间严重重的一种种。检验目的检验方法统计量判断规则检验回归方方程的有有效性相关系数检检验法r复相

12、关系数数检验法法RF检验 F检验回归系系数的有有效性t检验t例题:国外预测模模型简介介全行业运量量预测几个基本问问题及内内在假设设自变量的选选择(回归归分析测测法的程程序)确定预测变变量确定影响预预测变量量的因素素定性性分析,具有经经济上的的意义和和内在的的因果关关系。收集整理预预测变量量及其影影响因素素的历史史统计资资料分析因变量量和自变变量的关关系,确确定回归归模型定量量分析,因因变量与与自变量量、自变变量之间间的相关关系数,判判别因变变量和自自变量是是否显著著相关,显显著相关关的影响响因素作作为自变变量;同同时与因因变量不不相关或或与某个个自变量量高度线线性相关关的自变变量,应应予剔除除

13、。实践经验确确定散点图分析析确定理论试算(计计算拟和和误差(预预测误差差),选选出拟和和程度最最好的模模型求解模型参参数,建建立回归归方程检验回归方方程的有有效性利用检验通通过的回回归方程程进行预预测,并并确定预预测值的的置信区区间多元共线性性(多重重共线性性)概念:回归归分析中中,自变变量之间间存在着着相关关关系,称称这种关关系为多多元共线线性。多元回归分分析的假假设是自自变量之之间是独独立的。得得出的参参数估计计值是不不可靠的的。例如:某省省宏观经经济模型型中,建筑业产值值=2.16884+00.16601*工业总总产值-0.007955*上年年工业总总产值+0.556511*上年年建筑业

14、业产值负号的出现现很难解解释,上上年工业业总产值值和上年年建筑业业产值存存在共线线性。检验多元共共线性的的方法:U22(m-1)分分布Q22(n-m)分分布Syy2(n-1)分分布拟和优度判判定系数数:判定系数法法:把某某自变量量用其它它自变量量进行回回归计算算,计算算相应的的判定系系数R22,若RR2较大,说说明本自自变量可可以用其其它自变变量的线线性组合合替代,存存在多重重共线性性。或者者用因变变量分别别与含有有本自变变量或不不含有本本自变量量的自变变量组合合进行回回归计算算,若两两者计算算的判定定系数差差不多,则则说明本本自变量量与其它它自变量量间存在在多元共共线性。逐步回归法法:逐个个

15、引进自自变量,根根据R22的变化化情况判判断是否否存在多多重共线线性。若若R2变化显显著,则则不存在在多重共共线性,应应引入;若R22无显著著变化,则则无需引引入。偏相关系数数检验法法,计算算两两变变量间的的相关系系数,进进行分析析检验。自相关(序序列相关关)概念:若随随机误差差项在不不同样本本之间存存在相关关性,eei与ej相关,则则称为序序列相关关;较多多的是eei与eI+1之间间序列相相关,称称为自相相关自相关的检检验:达宾沃尔尔森检验验计算出D.W值后后,查达达宾沃尔森森检验表表判定是是否存在在自相关关。冯诺曼比检检验回归检验线性假设回归的另一一假设是是线性假假设,因因变量和和自变量量间的关关系可以以用线性性表示出出来。无无法将其其转化为为线性的的回归方方程,不不能采用用回归分分析方法法,而要要采取别别的方法法,如仿仿真方法法。样本数据样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论