计量经济学多元线性回归、多重共线性、异方差实验报告_第1页
计量经济学多元线性回归、多重共线性、异方差实验报告_第2页
计量经济学多元线性回归、多重共线性、异方差实验报告_第3页
计量经济学多元线性回归、多重共线性、异方差实验报告_第4页
计量经济学多元线性回归、多重共线性、异方差实验报告_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学多元线性回归、多重共线性、异方差实验报告计量经济学实验报告多元线性回归、多重共线性、异方差实验报告一、研究目的和要求:随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。二、模型设定根据以上的分析,建立以下模型Y=β+β1X+β2X+βX+βX+Ut参数说明:Y——旅游景区营业收入/万元X——旅游业从业人员/人X——旅游景区固定资产/万元青海638.4387419851.28265915603.31宁夏49509.861219623149.9062017578.92新疆28993.114045152280.364651915513.62数据来源:1.中国统计年鉴2012,2.中国旅游年鉴2012。三、参数估计利用Eviews6.0做多元线性回归分析步骤如下:1、创建工作文件双击Eviews6.0图标,进入其主页。在主菜单中依次点击“File\New\Workfile”,出现对话框“WorkfileRange”。本例中是截面数据,在workfilestructuretype中选择“Unstructured/Undated”,在Daterange中填入observations31,点击ok键,完成工作文件的创建。2、输入数据在命令框中输入dataYX1X2X3X4,回车出现“Group”窗口数据编辑框,在对应的YX1X2X3X4下输入相应数据,关闭对话框将其命名为group01,点击ok,保存。对数据进行存盘,点击“File/SaveAs”,出现“SaveAs”对话框,选择存入路径,并将文件命名,再点“ok”。3、参数估计在Eviews6.0命令框中键入“LSYCX1X2X3X4”利用Eviews6.0估计模型参数,最小二乘法的回归结果如下:表3.1回归结果DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:14Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C32390.8339569.490.8185810.4205X10.6036240.3661121.6487410.1112X20.2342650.0412185.6835830.0000X30.0446320.0607550.7346200.4691X4-1.9140342.098257-0.9122020.3700R-squared0.879720

Meandependentvar114619.2AdjustedR-squared0.861215

S.D.dependentvar112728.1S.E.ofregression41995.55

Akaikeinfocriterion24.27520Sumsquaredresid4.59E+10

Schwarzcriterion24.50649Loglikelihood-371.2657

Hannan-Quinncriter.24.35060F-statistic47.54049

Durbin-Watsonstat2.007191Prob(F-statistic)0.000000根据表中的样本数据,模型估计结果为=32390.83+0.603624X+0.234265X+0.044632X-1.914034X(39569.49)(0.366112)(0.041218)(0.060755)(2.098257)t=(0.818581)(1.648741)(5.683583)(0.734620)(-0.912202)R2=0.879720=0.861215F=47.54049DW=2.007191可以看出,可决系数R2=0.879720,修正的可决系数=0.861215。说明模型的拟合程度还可以。但是当α=0.05时,X、X、X系数均不能通过检验,且X的系数为负,与经济意义不符,表明模型很可能存在严重的多重共线性。四、模型修正1.多重共线性的检验与修正(1)检验选中X1X2X3X4数据,点击右键,选择“Open/asGroup”,在出现的对话框中选择“View/CovarianceAnalysis/correlation”,点击ok,得到相关系数矩阵。计算各个解释变量的相关系数,得到相关系数矩阵。表4.1相关系数矩阵变量X1X2X3X4X11.0000000.8097770.8720930.659239X20.8097771.0000000.7583220.641086X30.8720930.7583221.0000000.716374X40.6592390.6410860.7163741.000000由相关系数矩阵可以看出,解释变量X2、X3之间存在较高的相关系数,证实确实存在严重的多重共线性。(2)多重共线性修正采用逐步回归的办法,检验和回归多重共线性问题。分别作Y对X1、X2、X3、X4的一元回归,在命令窗口分别输入LSYCX1,LSYCX2,LSYCX3,LSYCX4,并保存,整理结果如表4.2所示。表4.2一元回归结果变量X1X2X3X4参数估计值1.9782240.3151200.31694612.54525t统计量8.63511112.474956.9224794.005547R20.7199830.8429240.6229880.3561910.7103270.8375080.6099880.333991其中,X2的方程最大,以X2为基础,顺次加入其它变量逐步回归。在命令窗口中依次输入:LSYCX2X1,LSYCX2X3,LSYCX2X4,并保存结果,整理结果如表4.3所示。表4.3加入新变量的回归结果(一)变量变量X1X2X3X4X2,X10.711446(2.679575)0.230304(5.891959)0.866053X2,X30.258113(7.016265)0.087950(2.043471)0.853546X2,X40.312045(9.319239)0.293708(0.143226)0.831828经比较,新加入X1的方程=0.866053,改进最大,而且各个参数的t检验显著,选择保留X1,再加入其它新变量逐步回归,在命令框中依次输入:LSYCX2X1X3,LSYCX2X1X4,保存结果,整理结果如表4.4所示。表4.4加入新变量的回归结果(二)变量变量X1X2X3X4X2,X1,X30.603269(1.652919)0.227087(5.630196)0.024860(0.439370)0.862078X2,X1,X40.773017(2.741794)0.237243(5.833838)-1.364110(-0.701920)0.863581当加入X3或X4时,均没有所增加,且其参数是t检验不显著。从相关系数可以看出X3、X4与X1、X2之间相关系数较高,这说明X3、X4引起了多重共线性,予以剔除。当取α=0.05时,tα/2(n-k-1)=2.048,X1、X2的系数t检验均显著,这是最后消除多重共线性的结果。修正多重共线性影响后的模型为=0.711446X+0.230304X(0.265507)(0.039088)t=(2.679575)(5.891959)R2=0.874983=0.866053在确定模型以后,进行参数估计表4.5消除多重共线性后的回归结果DependentVariable:YMethod:LeastSquaresDate:11/14/13Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C-4316.82412795.42-0.3373730.7384X10.7114460.2655072.6795750.0122X20.2303040.0390885.8919590.0000R-squared0.874983

Meandependentvar114619.2AdjustedR-squared0.866053

S.D.dependentvar112728.1S.E.ofregression41257.10

Akaikeinfocriterion24.18480Sumsquaredresid4.77E+10

Schwarzcriterion24.32357Loglikelihood-371.8644

Hannan-Quinncriter.24.23004F-statistic97.98460

Durbin-Watsonstat1.893654Prob(F-statistic)0.000000五、异方差检验在实际的经济问题中经常会出现异方差这种现象,因此建立模型时,必须要注意异方差的检验,否则,在实际中会失去意义。检验异方差由表4.5的结果,按路径“View/ResidualTests/HeteroskedasticityTests”,在出现的对话框中选择Specification:White,点击ok.得到White检验结果如下。表5.1White检验结果HeteroskedasticityTest:WhiteF-statistic3.676733

Prob.F(5,25)0.0125Obs*R-squared13.13613

Prob.Chi-Square(5)0.0221ScaledexplainedSS15.97891

Prob.Chi-Square(5)0.0069TestEquation:DependentVariable:RESID^2Method:LeastSquaresDate:11/14/13Time:21:48Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C-1.10E+091.11E+09-0.9927790.3303X1-12789.3630151.30-0.4241730.6751X1^20.4207160.2943321.4293930.1653X1*X2-0.1018140.083576-1.2182160.2345X214604.525047.7012.8933010.0078X2^2-0.0024890.008030-0.3099720.7592R-squared0.423746

Meandependentvar1.54E+09AdjustedR-squared0.308495

S.D.dependentvar2.70E+09S.E.ofregression2.24E+09

Akaikeinfocriterion46.07313Sumsquaredresid1.26E+20

Schwarzcriterion46.35068Loglikelihood-708.1335

Hannan-Quinncriter.46.16360F-statistic3.676733

Durbin-Watsonstat1.542170Prob(F-statistic)0.012464从上表可以看出,nR=13.13613,由White检验可知,在α=0.05下,查分布表,得临界值χ(5)=11.0705,比较计算的统计量与临界值,因为nR=13.13613>χ(5)=11.0705,所以拒绝原假设,表明模型存在异方差。(2)异方差的修正①用WLS估计:选择权重w=1/e1^2,其中e1=resid。在命令窗口中输入genre1=resid,点回车键。在消除多重共线性后的回归结果(表4.5的回归结果)对话框中点击Estimate/Options/WeithtedLS/TSLS,并在Weight中输入1/e1^2,点确定,得到如下回归结果。表5.2用权数1/e1^2的回归结果DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:49Sample:131Includedobservations:31Weightingseries:1/E1^2CoefficientStd.Errort-StatisticProb.

C-7074.873389.4944-18.164250.0000X10.7882770.01369257.570990.0000X20.2358060.000968243.67860.0000WeightedStatisticsR-squared0.999848

Meandependentvar31056.56AdjustedR-squared0.999837

S.D.dependentvar171821.4S.E.ofregression4.259384

Akaikeinfocriterion5.827892Sumsquaredresid507.9857

Schwarzcriterion5.966665Loglikelihood-87.33232

Hannan-Quinncriter.5.873128F-statistic92014.78

Durbin-Watsonstat1.663366Prob(F-statistic)0.000000UnweightedStatisticsR-squared0.871469

Meandependentvar114619.2AdjustedR-squared0.862288

S.D.dependentvar112728.1S.E.ofregression41832.86

Sumsquaredresid4.90E+10Durbin-Watsonstat1.853343②修正后的White检验为在表5.2的回归结果中,按路径“View/ResidualTests/HeteroskedasticityTests”,在出现的对话框中选择Specification:White,点击ok.得到White检验结果如下。表5.3修正后的White检验结果HeteroskedasticityTest:WhiteF-statistic0.210748

Prob.F(2,28)0.8113Obs*R-squared0.459736

Prob.Chi-Square(2)0.7946ScaledexplainedSS0.595955

Prob.Chi-Square(2)0.7423TestEquation:DependentVariable:WGT_RESID^2Method:LeastSquaresDate:11/15/13Time:20:29Sample:131Includedobservations:31CollineartestregressorsdroppedfromspecificationCoefficientStd.Errort-StatisticProb.

C17.639915.9225942.9784100.0059WGT-256.0052728.8280-0.3512560.7280WGT^28.26192623.571550.3505040.7286R-squared0.014830

Meandependentvar16.38664AdjustedR-squared-0.055539

S.D.dependentvar29.69485S.E.ofregression30.50832

Akaikeinfocriterion9.765641Sumsquaredresid26061.21

Schwarzcriterion9.904414Loglikelihood-148.3674

Hannan-Quinncriter.9.810878F-statistic0.210748

Durbin-Watsonstat2.081320Prob(F-statistic)0.811251从上表可知nR==0.459736<χ(5)=11.0705,证明模型中的异方差已经被消除了。异方差修正后的模型为=-7074.873+0.788277X1*+0.235806X2*389.49440.0136920.000968t=(-18.16425)(57.57099)(243.6786)R2=0.999848=0.999837F=92014.78其中X1*=1/e1^2*X1,X2*=1/e1^2*X2,e1=resid。六、自相关检验与修正(1)DW检验在显著性水平α=0.05,查DW表,当n=31,k=2时,得上临界值d=1.27,下临界值d=1.15,DW=1.663365。因为d<DW<4-d,所以模型不存在序列自相关。由图示法也可以看出随机误差项μi不存在自相关。下图是残差及一阶滞后残差相关图。图6.1残差与其滞后一阶残差图LM检验 在表5.2的回归结果中,按路径“View/ResidualTests/SerialCorrelationLMTests”,在出现的对话框中选择Lagstoinclude:1,点击ok.得到LM检验结果如下。表6.1LM检验结果Breusch-GodfreySerialCorrelationLMTest:F-statistic0.809839

Prob.F(1,27)0.3761Obs*R-squared0.902738

Prob.Chi-Square(1)0.3420TestEquation:DependentVariable:RESIDMethod:LeastSquaresDate:11/14/13Time:21:50Sample:131Includedobservations:31Presamplemissingvaluelaggedresidualssettozero.Weightseries:1/E1^2CoefficientStd.Errort-StatisticProb.

C-766.3965937.0314-0.8178980.4206X10.0209900.0270700.7753900.4448X2-0.0012730.001716-0.7420020.4645RESID(-1)-0.0070920.007881-0.8999100.3761WeightedStatisticsR-squared0.029121

Meandependentvar-0.564513AdjustedR-squared-0.078755

S.D.dependentvar4.074747S.E.ofregression4.273921

Akaikeinfocriterion5.862855Sumsquaredresid493.1929

Schwarzcriterion6.047885Loglikelihood-86.87425

Hannan-Quinncriter.5.923170F-statistic0.269946

Durbin-Watsonstat1.683210Prob(F-statistic)0.846488UnweightedStatisticsR-squared-0.014569

Meandependentvar-4021.722AdjustedR-squared-0.127299

S.D.dependentvar40207.07S.E.ofregression42689.59

Sumsquaredresid4.92E+10Durbin-Watsonstat1.69E-08从上表可以看出,nR=0.902738,由LM检验可知,在α=0.05下,查分布表,得临界值χ(5)=11.0705,比较计算的统计量与临界值,因为nR=0.902738<χ(5)=11.0705,所以接受原假设,表明模型不存在自相关。

七、模型检验经济意义检验模型估计结果表明,在假定其他变量不变的情况下,当景区固定资产每增长1元时,旅游收入增加0.788277元;在假定其他变量不变的情况下,当景区从业人员每增加1人时,旅游收入增加0.235806万元。这与理论分析判断相一致。统计检验(1)拟合优度:由表中数据可得:R2=0.999848,修正的可决系数为=0.999837,这说明模型对样本的拟合很好。(2)F检验:针对H0:β1=β2=0,给定显著性水平α=0.05,在F分布表中查出自由度为k=2和n-k-1=28的临界值Fα(2,28)=3.34。由表中得到F=92014.78,由于F=92014.78>Fα(2,28)=3.34,应拒绝原假设,说明回归方程显著,即“旅游景区固定资产”、“旅游从业人员”等变量联合起来确实对“旅游景区营业收入”有显著影响。(3)t检验:分别对H0:βj=0(j=1,2),给定显著性水平α=0.05,查t分布表得自由度为n-k-1=28临界值tα/2(n-k-1)=2.048。由表中数据可得,、对应的t统计量分别为57.57099、243.6786,其绝对值均大于tα/2(n-k-1)=2.048,这说明应该分别拒绝H0:βj=0(j=1,2),也就是说,当在其他解释变量不变的情况下,解释变量“旅游景区固定资产”(X1)、“旅游从业人数”(X2)分别对被解释变量“旅游景区营业收入”(Y)影响显著。八、附录以下是多重共线性参数估计备表1对X回归分析DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:14Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C-15595.6118604.86-0.8382550.4087X11.9782240.2290918.6351110.0000R-squared0.719983

Meandependentvar114619.2AdjustedR-squared0.710327

S.D.dependentvar112728.1S.E.ofregression60671.69

Akaikeinfocriterion24.92668Sumsquaredresid1.07E+11

Schwarzcriterion25.01920Loglikelihood-384.3636

Hannan-Quinncriter.24.95684F-statistic74.56515

Durbin-Watsonstat2.090544Prob(F-statistic)0.000000备表2对X回归分析DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:15Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C15958.7311364.711.4042360.1709X20.3151200.02526012.474950.0000R-squared0.842924

Meandependentvar114619.2AdjustedR-squared0.837508

S.D.dependentvar112728.1S.E.ofregression45441.05

Akaikeinfocriterion24.34856Sumsquaredresid5.99E+10

Schwarzcriterion24.44108Loglikelihood-375.4027

Hannan-Quinncriter.24.37872F-statistic155.6243

Durbin-Watsonstat1.665119Prob(F-statistic)0.000000备表3对X回归分析DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:15Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C53599.9515413.413.4774880.0016X30.3169460.0457856.9224790.0000R-squared0.622988

Meandependentvar114619.2AdjustedR-squared0.609988

S.D.dependentvar112728.1S.E.ofregression70399.77

Akaikeinfocriterion25.22411Sumsquaredresid1.44E+11

Schwarzcriterion25.31662Loglikelihood-388.9737

Hannan-Quinncriter.25.25427F-statistic47.92072

Durbin-Watsonstat1.724195Prob(F-statistic)0.000000备表4对X回归分析DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:15Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C-143904.966622.99-2.1599890.0392X412.545253.1319704.0055470.0004R-squared0.356191

Meandependentvar114619.2AdjustedR-squared0.333991

S.D.dependentvar112728.1S.E.ofregression91996.75

Akaikeinfocriterion25.75923Sumsquaredresid2.45E+11

Schwarzcriterion25.85175Loglikelihood-397.2681

Hannan-Quinncriter.25.78939F-statistic16.04440

Durbin-Watsonstat1.829839Prob(F-statistic)0.000394备表5对X、X回归分析DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:15Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C-4316.82412795.42-0.3373730.7384X20.2303040.0390885.8919590.0000X10.7114460.2655072.6795750.0122R-squared0.874983

Meandependentvar114619.2AdjustedR-squared0.866053

S.D.dependentvar112728.1S.E.ofregression41257.10

Akaikeinfocriterion24.18480Sumsquaredresid4.77E+10

Schwarzcriterion24.32357Loglikelihood-371.8644

Hannan-Quinncriter.24.23004F-statistic97.98460

Durbin-Watsonstat1.893654Prob(F-statistic)0.000000备表6对X、X回归分析DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:15Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C16874.5310798.591.5626600.1294X20.2581130.0367887.0162650.0000X30.0879500.0430402.0434710.0505R-squared0.863310

Meandependentvar114619.2AdjustedR-squared0.853546

S.D.dependentvar112728.1S.E.ofregression43140.27

Akaikeinfocriterion24.27407Sumsquaredresid5.21E+10

Schwarzcriterion24.41284Loglikelihood-373.2480

Hannan-Quinncriter.24.31930F-statistic88.42123

Durbin-Watsonstat1.600090Prob(F-statistic)0.000000备表7对X、X回归分析DependentVariable:YMethod:LeastSquaresDate:11/14/13Time:21:15Sample:131Includedobservations:31CoefficientStd.Errort-StatisticProb.

C10868.7937371.230.2908330.7733X20.3120450.0334849.3192390.0000X40.2937082.0506600.1432260.8871R-squared0.843039

Meandependentvar114619.2AdjustedR-squared0.831828

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论