多元回归(多重共线,异方差,残差检验eviews,spss)_第1页
多元回归(多重共线,异方差,残差检验eviews,spss)_第2页
多元回归(多重共线,异方差,残差检验eviews,spss)_第3页
多元回归(多重共线,异方差,残差检验eviews,spss)_第4页
多元回归(多重共线,异方差,残差检验eviews,spss)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据处理:4.3模型建立设年末实有耕地面积,有效灌溉率,农用塑料薄膜使用量,农药使用量,农业机械总动力,农业从业人数,农业投资额分别为X,X,,X;农业产值为Y。在127此我们假设上述七个变量都与农业产值有显著影响,在SPSS中用进入法对其做出预判。表4-3回归预判表模型非标准化系数标准化系数BataT显著性共线性统计B标准误差允差VIF(常数)1.987E-15.018.0001.000年末实有耕地面积.225.291.225.775.464.004239.655有效灌溉率.208.116.2081.797.115.02638.086农用塑料薄膜使用量-.396.489-.396-.810.445.001677.462农药使用量-.426.564-.426-.756.475.001899.494农业机械总动力.831.282.8312.946.022.004225.582农业从业人数.024.179.024.136.895.01190.381农业投资额.197.140.1971.401.204.01855.747因变量:农业产值可以从表中得出回归方程:Y=0.225X+0.208X—0.396X—0.426X—0.831X+0.024X+0.197X1234567从显著性水平上看,小于0.05的只有一个农业机械动力,显然不能够准确的表达出与农业产值之间的关系。根据表中的VIF值均大于10,其中四个大于了100,这说明模型中存在严重的多重共线性。并且在相关系数表中(附表1-2),我们也能够看出各个自变量之间相关系数较大,有较大的相关性。为了保证得到的回归模型能较好的反映真实意义,就要解决多重共线性问题。解决多重共线性我们一般使用逐步回归的方法。4.3.1逐步回归将标准化后的数据输入EVIEWS,首先找出与因变量拟合度最高自变量,的经过回归拟合可以得出7个变量的拟合优度,按降序排列如下表:

表4-4拟合优度表变量拟合优度X50.984325X30.972272X40.972024X10.906987X70.903033X20.84501X60.684597拟合优度的大小也能在一定程度上表现出自变量与因变量的影响大小。这里X是农业机械总动力,说明农业机械总动力对农业产值有较大的影响。在近年5来江苏省整体经济发展迅速,科技水平大大提高,使农业的机械化水平发展迅速,机械设备的使用极大促进了农业产值的提高。由表4-4得,Y与X的拟合优度最高,故YX作为基本方程。依次按拟合55优度降序排列进入模型,检验新进入的变量是否显著并且拟合优度是否提高。拟合优度排第二的是变量X,所以将X进入基础模型。33X进入基本方程,结果如下图:3VariableCoefficientStd.Errort-Sta.tisticProbC1.11E-070.0343293.17E-061.0000X51.07872403530863.0551300.0100X3-0.0870470353085-0.2465310.0094R-squared0.984404Meandependentvar-6.67E-07AdjustedR-squared0.981304S.D.dependentvar1.000000S.E.ofregression0.134392Akaikeinfocriterion-0.991329Sumsquaredresid0.218350Schwarzcriterion-0.850219Loglikelihood10.43872Hannan-Quinncriter.-0.993338F-statistic378.7033□urbin-Watsonstat0.675013Prob(F-statistic)0.000000图4-1变量判断图从图4-1的运行结果我们可以看出,X的估计量对应的p二0.8094大于3

0.05,不显著,所以X不符合回归模型。X是农膜使用量,可以看出其对农业33产值的影响不显著。农膜主要使用在经济作物的种植中,近年来有部分农户利用地膜覆盖技术和塑料大棚进行种植、栽培瓜果蔬菜,获得了可观的收益,但是普及率不是很高,是一个对农业产值的影响不是很大。所以我们不选择变量X,再将X进入基本方程。34VariableCoefficientStd.Errort-StatisticProb.C3.29E-080.0343669.44-E-071.0000X50.9357080.3039193.07S3030.0096X4-0.0563260.303919-0.1869780.0548R-squared0-984370Meandependentvar-6.67E-07AdjustedR-squared0.981765S.D.dependentvar1.000000S.E.ofregression0135037Akaikeinfocriterion-0.989686Sumsquaredresid0218818Schwarzcriterion-0.340076Loglikelihood1042265Hannan-Cluinncriter.-0.991195F-statistic377.8798□urbin-Watsonstat0.642576Prob(F-statistic)0.000000图4-2第一涉逐步回归图由图4-2可以看出,X的估计量对应的p二0.8548值大于0.05,所以没有4显著性,所以X同样不符合回归模型,故删去变量X。X为农药使用量,所444以农药使用量对农业产值没有显著影响。再将X,X,X,X依次进入方程判断最优拟合方程,X,X不显著,X显1726167著,X也是具有显著性的,表明农业投资额,有效灌溉率对农业产值也有显著2影响,但是农业投资额对农业产值的影响大还是有效灌溉率对农业产值的影响大,还需要进一步比较。表4-5拟合优度表变量系数标准差t值p值拟合优度常数-1.57E-070.022013-7.11E-061.00001X50.765190.05788313.219690.00000.9937700X70.2468760.0578834.265180.0011常数8.13E-100.032932.47E-081.00002X20.9999220.08181.2215440.24530.986058X50.9012980.081811.018320.0000由表4-5可得,但由于模型YXX的拟合优度为0.993770,模型YXX5725的拟合优度为0.986058,比较他们两个的拟合优度,发现模型YXX的拟合优57度较大,故选则YXX作为基本方程。然后按照第一次逐步回归法的步骤依次57添加变量,并根据p值判断其显著性。可以得出YXXX为最终方程,p值分别为572p=0.0107,p=0.0000,p=0.0001,均显著。经过逐步回归依次得到农业机222械总动力,农业投资额,有效灌溉率对农业产值的影响较为显著。估计结果如下图:VariableCoefficientStef.Errort-StatisticProb.C-1.59E-070.016&30-9.40E-061.0000X20.1295400.0422323.067S620.0107X&0.6324130.06199710.200330.0000X70.2632080.0447035.8079770.0001R-squared0.996642Meandependentvar-6.67E-07AdjustedR-squared0.995726S.D.dependentvar1.000000S.E.ofregression0.065S76Akaikeinfocriterion-2.394155Sumsquaredresid0.047014Schwarzcriterion-2.205342Loglikelihood21.95616Hannan-Quinncriter.-2.396166F-statistic1003.212□urbin-Watsonstat1.946452Prob(F-statistic)0.000000图4-3逐步回归模型结果图从图4-3中可以得出系数:卩=-1.59X10-7,卩二0.129540,卩二0.263208,卩二0.263208,

0257所以写出对应的估计方程为:Y=-1.59X10-7+0.129540X+0.632418X+0.263208X。257得出估计方程还要进行各项检验,只有通过检验才能说明我们得到的方程有效,才具有实际意义。F检验F检验的原假设和备择假设如下:H:p=p=...=b=0;001nH:p(i=0,1,…,n)不全为零。1i从图4-3中可以看出F检验(F-statistic)对应的p值小于0.05,所以拒绝H,0所以我们得出的估计方程存在显著的线性关系。t检验t检验的原假设和备择假设为:H:0=0;0iH:0丰0。1i由图4-3可以看出变量XXX分别对应的257p=0.0,1£0.7000,p=0.0001均小于0.05,拒绝原假设H。2220同样可以看模型得出的t值,t二3.067362,t二10.20083,t二5.887977,通过257查找t分布表得,用t值与t(11)=2.201进行比较,如果t>t(11),则拒绝原0.052i0.052假设所以回归系数显著。变量XXX对Y有显著影响。5724.3.4异方差检验由于异方差的存在使得最小二乘估计量不再是最好线性无偏估计量,会导致模型的残差不再是同方差的,所以要对模型进行异方差检验。(1)图示法此方法是较为原始的一种检验异方差的方法,可以直观的看出残差平方的散点图是否与样本数据X或Y有明显的关系,若随着X或Y的变化而变化,那么iiii就说明存在异方差性。这里我们可以看出残差平方的散点图呈不规则状,散乱分布,所以我们得出的回归模型不存在异方差性。图4-4异方差散点图(2)怀特(white)检验可以看出模型中有三个解释变量,那么模型辅助回归可以写成:u=a+ax+ax+ax+ax2+exx2+exx2+axx+axx+axx+£t01t12t23t34t15t26t37t1t28t1t39t2t3t其原假设和备择假设分别为:H:a=0,i=1,,9;0iH:a,,a中至少一个不为零。119怀特检验的运行图如下:HeteroskedasticityTest:WhiteF-statistic0595190Prob.F(9,5)0.7651Obs*R-squared7.758316Prob.Chi-Square(9)0.5587ScaledexplainedSS3.437516Prob.Chi-Square(9)0.4907图4-5怀特检验图给定显著性水平0.05,obs*R-squared对应的p=0.5587大于0.05,(错了要改正))拒绝原假设,故不存在异方差。4.3.5自相关检验误差存在自相关时,模型中的系数用最小二乘估计计算会不准确,往往会算出的系数的真实方差值和误差项的方差值会偏小。为了检验得到的方程的准确性,我们进行自相关检验。DW检验的原假设和备择假设分别为:H:p=0(u不存在自相关)0tH:pH0(u存在一阶自相关)1tR-squared0.996642Meandependentvar-6.67E-07AdjustedR-squared0.995726S.D.dependentvar1.000000S.E.ofregression0.06&376Akaikeinfocriterion-2394155Sumsquaredresid0.047014Schwarzcriterion-2.205342Loglikelihood21.95616Hannan-Quinncriter.-2396166F-statistic1008.212Durbin-Watsonstat1.946452ProbfF-statistic)0.000000表4-6DW检验运行结果图从表中得出,DW值为1.964452,通过查找DW表可得,当n=15,k=3时,d=0.82,d=1.75,所以dw值在区间(1.75,2.25)之间。这说明所建立的线LU性回归模型无自相关现象,不需要修正DW值检验。4.3.6残差检验

Series:ResidualsSample2QQQSeries:ResidualsSample2QQQ2014Observations15Mean-5.1S&-1SMedian-D.OOO&7

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论