计量经济学多元线性回归多重共线性异方差实验报告材料_第1页
计量经济学多元线性回归多重共线性异方差实验报告材料_第2页
计量经济学多元线性回归多重共线性异方差实验报告材料_第3页
计量经济学多元线性回归多重共线性异方差实验报告材料_第4页
计量经济学多元线性回归多重共线性异方差实验报告材料_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实用标准文案实用标准文案精彩文档精彩文档实用标准文案精彩文档计量经济学实验报告多元线性回归、多重共线性、异方差实验报告一、研究目的和要求:随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。模型设定根据以上的分析,建立以下模型Y=β+βX+βX+βX+βX+Ut 1 2 0 1 2 3 3 4 4参数说明:Y——旅游景区营业收入/万元X——旅游业从业人员/人1X——旅游景区固定资产/万元2X——旅游外汇收入/万美元3X——城镇居民可支配收入/元4收集到的数据如下(见表2.1):表2.12011年全国旅游景区营业收入及相关数据(按地区分)地地区营业收入从业人数固定资产外汇收入可支配收入北京145249.01145466694252.3054160032903.03天津48712.372478793529.6717555326920.86河北182226.8779643420342.744476518292.23山西29465.0357719121809.745671918123.87内蒙古70313.0736264206819.126709720407.57辽宁25665.306481646573.2727131420466.84吉林20389.302906687827.163852817796.57黑龙江38367.8130341137426.279176215696.18上海194762.391106563007.4457511836230.48江苏316051.651401541195000.6056529726340.73浙江385976.921324591110975.2045417330970.68安安徽79562.7555840139769.0211791818606.13福建155378.9580303151897.6936344424907.40江西54961.664179185528.054150017494.87山东116995.67143026327733.2925507622791.84河南222108.3370164482005.325490318194.80湖北104565.5862767243794.629401818373.87湖南118180.8780615257226.710143418844.05广东476345.502265391160675.4139061926897.48广西66195.5549876143982.0310518818854.06海南29081.603075970386.553761518368.95重庆86713.6750160230124.009680620249.70四川218624.0370756464763.525938317899.12贵贵州42214.142768362415.211350716495.01云南135897.9762679348426.0416086118575.62西藏30406.736023462971.031296316195.56陕西48692.1757077154529.1912950518245.23甘肃30949.003128056684.68174014988.68青海638.4387419851.28265915603.31宁夏49509.861219623149.9062017578.92新疆28993.114045152280.364651915513.62数据来源:1.中国统计年鉴2012,2.中国旅游年鉴2012。参数估计利用Eviews6.0做多元线性回归分析步骤如下:创建工作文件双击Eviews6.0图标,进入其主页。在主菜单中依次点击“File\New\Workfile”,出现对话框“WorkfileRange”。本例中是截面数据,在workfilestructuretype中选择“Unstructured/Undated”,在Daterange中填入observations31,点击ok键,完成工作文件的创建。输入数据在命令框中输入dataYX1X2X3X4,回车出现“Group”窗口数据编辑框,在对应的YX1X2X3X4下输入相应数据,关闭对话框将其命名为group01,点击ok,保存。对数据进行存盘,点击“File/SaveAs”,出现“SaveAs”对话框,选择存入路径,并将文件命名,再点“ok”。参数估计在Eviews6.0命令框中键入“LSYCX1X2X3X4”,按回车键,即出现回归结果。利用Eviews6.0估计模型参数,最小二乘法的回归结果如下:表3.1回归结果 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:14 Sample:131 Includedobservations:31 Coefficient Std.Errort-Statistic Prob.C32390.8339569.490.8185810.4205X10.6036240.3661121.6487410.1112X20.2342650.0412185.6835830.0000X30.0446320.0607550.7346200.4691X4-1.9140342.098257-0.9122020.3700R-squared 0.879720Meandependentvar114619.2AdjustedR-squared0.861215S.D.dependentvar112728.1S.E.ofregression41995.55Akaikeinfocriterion24.27520Sumsquaredresid4.59E+10Schwarzcriterion24.50649Loglikelihood-371.2657Hannan-Quinncriter.24.35060F-statistic47.54049Durbin-Watsonstat2.007191Prob(F-statistic)0.000000 根据表中的样本数据,模型估计结果为 Y^=32390.83+0.603624X +0.234265X+0.044632X-1.914034X 1 2 3 4(39569.49)(0.366112)(0.041218)(0.060755)(2.098257)t=(0.818581)(1.648741)(5.683583)(0.734620)(-0.912202)R2=0.879720R2=0.861215F=47.54049DW=2.007191可以看出,可决系数R2=0.879720,修正的可决系数R2=0.861215。说明模型的拟合程度还可以。但是当α=0.05时,X、X、X系数均不能通过检 1 2 4验,且X的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线4性。四、模型修正1.多重共线性的检验与修正检验选中X1X2X3X4数据,点击右键,选择“Open/asGroup”,在出现的对话框中选择“View/CovarianceAnalysis/correlation”,点击ok,得到相关系数矩阵。计算各个解释变量的相关系数,得到相关系数矩阵。表4.1相关系数矩阵变量X1X2X3X4X11.0000000.8097770.8720930.659239X20.8097771.0000000.7583220.641086X30.8720930.7583221.0000000.716374X40.6592390.6410860.7163741.000000由相关系数矩阵可以看出,解释变量X2、X3之间存在较高的相关系数,证实确实存在严重的多重共线性。多重共线性修正采用逐步回归的办法,检验和回归多重共线性问题。分别作Y对X1、X2、X3、X4的一元回归,在命令窗口分别输入LSYCX1,LSYCX2,LSYCX3,LSYCX4,并保存,整理结果如表4.2所示。表4.2一元回归结果变量X1X2X3X4参数估计值1.9782240.3151200.31694612.54525t统计量8.63511112.474956.9224794.005547R20.7199830.8429240.6229880.356191R20.7103270.8375080.6099880.333991其中,X2的方程R2最大,以X2为基础,顺次加入其它变量逐步回归。在命令窗口中依次输入:LSYCX2X1,LSYCX2X3,LSYCX2X4,并保存结果,整理结果如表4.3所示。表4.3加入新变量的回归结果(一)变量变量变量X1X2X3X42RX2,X10.711446(2.679575)0.230304(5.891959)0.866053X2,X30.258113(7.016265)0.087950(2.043471)0.853546X2X2,X40.312045(9.319239)0.293708(0.143226)0.831828经比较,新加入X1的方程R=0.866053,改进最大,而且各个参数的t检验显著,选择保留X1,再加入其它新变量逐步回归,在命令框中依次输入:LSYCX2X1X3,LSYCX2X1X4,保存结果,整理结果如表4.4所示。表4.4加入新变量的回归结果(二)变量变量X1X2X3X42RX2,X1,X30.603269(1.652919)0.227087(5.630196)0.024860(0.439370)0.862078X2,X1,X40.773017(2.741794)0.237243(5.833838)-1.364110(-0.701920)0.863581当加入X3或X4时,R均没有所增加,且其参数是t检验不显著。从相关系数可以看出X3、X4与X1、X2之间相关系数较高,这说明X3、X4引起了多重共线性,予以剔除。当取α=0.05时,tα/2(n-k-1)=2.048,X1、X2的系数t检验均显著,这是最后消除多重共线性的结果。修正多重共线性影响后的模型为Y^=0.711446X+0.230304X 1 2(0.265507)(0.039088)t=(2.679575)(5.891959) R2=0.874983 R2=0.866053 F=97.98460DW=1.893654在确定模型以后,进行参数估计表4.5消除多重共线性后的回归结果 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:47 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-Statistic Prob.-4316.82C412795.42-0.3373730.7384X10.7114460.2655072.6795750.0122X20.2303040.0390885.8919590.0000R-squared0.874983Meandependentvar114619.2AdjustedR-squared0.866053S.D.dependentvar112728.1S.E.ofregression41257.10Akaikeinfocriterion24.18480Sumsquaredresid4.77E+10Schwarzcriterion24.32357Loglikelihood-371.8644Hannan-Quinncriter.24.23004F-statistic97.98460Durbin-Watsonstat1.893654 Prob(F-statistic) 0.000000 五、异方差检验在实际的经济问题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。(1)检验异方差由表4.5的结果,按路径“View/ResidualTests/HeteroskedasticityTests”,在出现的对话框中选择Specification:White,点击ok.得到White检验结果如下。表5.1White检验结果 HeteroskedasticityTest:White F-statistic 3.676733Prob.F(5,25)0.0125Obs*R-squared 13.13613Prob.Chi-Square(5)0.0221ScaledexplainedSS15.97891Prob.Chi-Square(5)0.0069 TestEquation: DependentVariable:RESID^2 Method:LeastSquares Date:11/14/13Time:21:48 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-StatisticProb.C-1.10E+091.11E+09-0.9927790.3303X1-12789.3630151.30-0.4241730.6751X1^20.4207160.2943321.4293930.1653X1*X2-0.1018140.083576-1.2182160.2345X214604.525047.7012.8933010.0078X2^2-0.0024890.008030-0.3099720.7592R-squared0.423746Meandependentvar1.54E+09AdjustedR-squared0.308495S.D.dependentvar2.70E+09S.E.ofregression2.24E+09Akaikeinfocriterion46.07313Sumsquaredresid1.26E+20Schwarzcriterion 46.35068Loglikelihood-708.1335Hannan-Quinncriter.46.16360F-statistic3.676733Durbin-Watsonstat1.542170Prob(F-statistic)0.012464 从上表可以看出,nR2=13.13613,由White检验可知,在α=0.05下,查2分布表,得临界值χ2(5)=11.0705,比较计算的2统计量与临界值,因为0.05nR2=13.13613>χ2(5)=11.0705,所以拒绝原假设,表明模型存在异方差。0.05(2)异方差的修正①用WLS估计:选择权重w=1/e1^2,其中e1=resid。在命令窗口中输入genre1=resid,点回车键。在消除多重共线性后的回归结果(表4.5的回归结果)对话框中点击Estimate/Options/WeithtedLS/TSLS,并在Weight中输入1/e1^2,点确定,得到如下回归结果。表5.2用权数1/e1^2的回归结果 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:49 Sample:131 Includedobservations:31 Weightingseries:1/E1^2 Coefficie ntStd.Errort-StatisticProb.-7074.87 C 3389.4944-18.16425 0.0000 X1 0.788277 0.01369257.57099 0.0000 X2 0.235806 0.000968 243.6786 0.0000 WeightedStatistics R-squared0.999848Meandependentvar31056.56AdjustedR-squared0.999837S.D.dependentvar171821.4S.E.ofregression4.259384Akaikeinfocriterion5.827892Sumsquaredresid507.9857Schwarzcriterion5.966665Loglikelihood-87.33232Hannan-Quinncriter.5.873128F-statistic92014.78Durbin-Watsonstat1.663366Prob(F-statistic)0.000000 UnweightedStatistics R-squared0.871469Meandependentvar114619.2AdjustedR-squared0.862288S.D.dependentvar112728.1S.E.ofregression41832.86Sumsquaredresid4.90E+10Durbin-Watsonstat1.853343 ②修正后的White检验为在表5.2的回归结果中,按路径“View/ResidualTests/HeteroskedasticityTests”,在出现的对话框中选择Specification:White,点击ok.得到White检验结果如下。表5.3修正后的White检验结果 HeteroskedasticityTest:White F-statistic 0.210748Prob.F(2,28) 0.8113 Obs*R-squared 0.459736Prob.Chi-Square(2) 0.7946 ScaledexplainedSS0.595955Prob.Chi-Square(2) 0.7423 TestEquation: DependentVariable:WGT_RESID^2 Method:LeastSquares Date:11/15/13Time:20:29 Sample:131 Includedobservations:31 CollineartestregressorsdroppedfromspecificationCoefficie ntStd.Errort-StatisticProb.C17.639915.9225942.9784100.0059WGT-256.0052728.8280-0.3512560.7280WGT^28.26192623.571550.3505040.7286 R-squared 0.014830Meandependentvar16.38664-0.05553 AdjustedR-squared 9S.D.dependentvar29.69485S.E.ofregression30.50832Akaikeinfocriterion9.765641 Sumsquaredresid 26061.21Schwarzcriterion9.904414-148.367 Loglikelihood 4Hannan-Quinncriter.9.810878 F-statistic 0.210748Durbin-Watsonstat2.081320 Prob(F-statistic) 0.811251 从上表可知nR2==0.459736<χ2(5)=11.0705,证明模型中的异方差已0.05经被消除了。异方差修正后的模型为Y^=-7074.873+0.788277X1*+0.235806X2*389.49440.0136920.000968t=(-18.16425)(57.57099)(243.6786) R2=0.999848 R2=0.999837 F=92014.78DW=1.663366其中X*=1/e1^2*X,X*=1/e1^2*X,e1=resid。 1 1 2 2六、自相关检验与修正DW检验在显著性水平α=0.05,查DW表,当n=31,k=2时,得上临界值d=1.27,u下临界值d=1.15,DW=1.663365。因为d<DW<4-d ,所以模型不存在l u u序列自相关。由图示法也可以看出随机误差项μ不存在自相关。下图是残差及一阶滞后残i差相关图。实用标准文案实用标准文案精彩文档精彩文档实用标准文案精彩文档图6.1残差与其滞后一阶残差图LM检验在表5.2的回归结果中,按路径“View/ResidualTests/SerialCorrelationLMTests”,在出现的对话框中选择Lagstoinclude:1,点击ok.得到LM检验结果如下。表6.1LM检验结果 Breusch-GodfreySerialCorrelationLMTest: F-statistic 0.809839Prob.F(1,27) 0.3761 Obs*R-squared 0.902738Prob.Chi-Square(1) 0.3420 TestEquation: DependentVariable:RESID Method:LeastSquares Date:11/14/13Time:21:50 Sample:131 Includedobservations:31 Presamplemissingvaluelaggedresidualssettozero. Weightseries:1/E1^2 Coefficie ntStd.Errort-StatisticProb.C-766.3965937.0314-0.8178980.4206X10.0209900.0270700.7753900.4448X2-0.0012730.001716-0.7420020.4645RESID(-1)-0.0070920.007881-0.8999100.3761WeightedStatistics-0.56451 R-squared 0.029121Meandependentvar 3AdjustedR-squared-0.07875S.D.dependentvar4.0747475S.E.ofregression4.273921Akaikeinfocriterion5.862855 Sumsquaredresid 493.1929Schwarzcriterion6.047885-86.8742 Loglikelihood 5Hannan-Quinncriter.5.923170 F-statistic 0.269946Durbin-Watsonstat1.683210 Prob(F-statistic) 0.846488 UnweightedStatistics R-squared-0.01456 -4021.72 9Meandependentvar 2AdjustedR-squared-0.127299S.D.dependentvar40207.07S.E.ofregression42689.59Sumsquaredresid4.92E+10Durbin-Watsonstat1.69E-08 从上表可以看出,nR2=0.902738,由LM检验可知,在α=0.05下,查2分布表,得临界值χ2(5)=11.0705,比较计算的2统计量与临界值,因为0.05nR2=0.902738<χ2(5)=11.0705,所以接受原假设,表明模型不存在自相关。0.05七、模型检验经济意义检验模型估计结果表明,在假定其他变量不变的情况下,当景区固定资产每增长1元时,旅游收入增加0.788277元;在假定其他变量不变的情况下,当景区从业人员每增加1人时,旅游收入增加0.235806万元。这与理论分析判断相一致。统计检验(1)拟合优度:由表中数据可得:R2=0.999848,修正的可决系数为R=0.999837,这说明模型对样本的拟合很好。(2)F检验:针对H0:β1=β2=0,给定显著性水平α=0.05,在F分布表中查出自由度为k=2和n-k-1=28的临界值F(2,28)=3.34。由表中得到αF=92014.78,由于F=92014.78>F(2,28)=3.34,应拒绝原假设,说明回归α方程显著,即“旅游景区固定资产”、“旅游从业人员”等变量联合起来确实对“旅游景区营业收入”有显著影响。(3)t检验:分别对H0:βj=0(j=1,2),给定显著性水平α=0.05,查t分布表得自由度为n-k-1=28临界值tα/2(n-k-1)=2.048。由表中数据可得,^1、^2对应的t统计量分别为57.57099、243.6786,其绝对值均大于tα/2(n-k-1)=2.048,这说明应该分别拒绝H0:βj=0(j=1,2),也就是说,当在其他解释变量不变的情况下,解释变量“旅游景区固定资产”(X1)、“旅游从业人数”(X2)分别对被解释变量“旅游景区营业收入”(Y)影响显著。八、附录以下是多重共线性参数估计备表1对X回归分析1 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:14 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-StatisticProb.C-15595.6 118604.86-0.838255 0.4087X11.978224 0.229091 8.635111 0.0000R-squared0.719983Meandependentvar114619.2AdjustedR-squared0.710327S.D.dependentvar112728.1S.E.ofregression60671.69Akaikeinfocriterion24.92668Sumsquaredresid1.07E+11Schwarzcriterion 25.01920Loglikelihood-384.3636Hannan-Quinncriter.24.95684F-statistic74.56515Durbin-Watsonstat2.090544Prob(F-statistic)0.000000 备表2对X回归分析2 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:15 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-StatisticProb.C15958.73 11364.71 1.404236 0.1709X20.315120 0.025260 12.47495 0.0000R-squared0.842924Meandependentvar114619.2AdjustedR-squared0.837508S.D.dependentvar112728.1S.E.ofregression45441.05Akaikeinfocriterion24.34856Sumsquaredresid5.99E+10Schwarzcriterion 24.44108Loglikelihood-375.4027Hannan-Quinncriter.24.37872F-statistic155.6243Durbin-Watsonstat1.665119Prob(F-statistic)0.000000 备表3对X回归分析3 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:15 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-StatisticProb. C 53599.95 15413.41 3.477488 0.0016 X3 0.316946 0.045785 6.922479 0.0000R-squared0.622988Meandependentvar114619.2AdjustedR-squared0.609988S.D.dependentvar112728.1S.E.ofregression70399.77Akaikeinfocriterion25.22411Sumsquaredresid1.44E+11Schwarzcriterion 25.31662Loglikelihood-388.9737Hannan-Quinncriter.25.25427F-statistic47.92072Durbin-Watsonstat1.724195Prob(F-statistic)0.000000 备表4对X回归分析4 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:15 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-StatisticProb.-143904. C 966622.99-2.159989 0.0392 X4 12.54525 3.131970 4.005547 0.0004 R-squared 0.356191Meandependentvar114619.2AdjustedR-squared0.333991S.D.dependentvar112728.1S.E.ofregression91996.75Akaikeinfocriterion25.75923 Sumsquaredresid2.45E+11Schwarzcriterion 25.85175-397.268 Loglikelihood 1Hannan-Quinncriter.25.78939 F-statistic 16.04440Durbin-Watsonstat1.829839 Prob(F-statistic) 0.000394 备表5对X、X回归分析 2 1 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:15 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-StatisticProb.-4316.82 C 412795.42-0.337373 0.7384 X2 0.230304 0.039088 5.891959 0.0000 X1 0.711446 0.265507 2.679575 0.0122 R-squared 0.874983Meandependentvar114619.2AdjustedR-squared0.866053S.D.dependentvar112728.1S.E.ofregression41257.10Akaikeinfocriterion24.18480 Sumsquaredresid4.77E+10Schwarzcriterion 24.32357-371.864 Loglikelihood 4Hannan-Quinncriter.24.23004 F-statistic 97.98460Durbin-Watsonstat1.893654 Prob(F-statistic) 0.000000 备表6对X、X回归分析 2 3 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:15 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-StatisticProb. C 16874.53 10798.59 1.562660 0.1294 X2 0.258113 0.036788 7.016265 0.0000 X3 0.087950 0.043040 2.043471 0.0505 R-squared 0.863310Meandependentvar114619.2AdjustedR-squared0.853546S.D.dependentvar112728.1S.E.ofregression43140.27Akaikeinfocriterion24.27407 Sumsquaredresid5.21E+10Schwarzcriterion 24.41284-373.248 Loglikelihood 0Hannan-Quinncriter.24.31930 F-statistic 88.42123Durbin-Watsonstat1.600090 Prob(F-statistic) 0.000000 备表7对X、X回归分析 2 4 DependentVariable:Y Method:LeastSquares Date:11/14/13Time:21:15 Sample:131 Includedobservations:31 Coefficie ntStd.Errort-StatisticProb. C 10868.79 37371.23 0.290833 0.7733 X2 0.312045 0.033484 9.319239 0.0000 X4 0.293708

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论