版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章回归预测方法3.1引言
3.1.1相关分析变量之间的关系:确定性(函数)关系、非确定性(相关)关系1.函数关系:变量之间存在的确定性的数量依存关系。在这种关系中,当其中一个变量的值确定后,另一个变量的值就会完全确定。2.相关关系:变量之间存在的非确定性的数量依存关系。当一个变量发生变化时,另一个变量也会随之发生变化,但这种数量变化关系并不是严格的一一对应。家庭收入————家庭消费支出身高————体重相关关系商品价格————商品需求量
圆的面积————圆的半径函数关系物体的质量————物体的体积3.相关关系分类:(1)按变量间的相关程度:完全相关(函数关系)、不完全相关、不相关(2)按变量间数量的变化方向:正相关(变动方向一致)、负相关(变动方向相反)(3)按变量间相关关系的表现形式:线性相关、非线性相关(4)按相关关系包括的影响因素的多少:单相关(一个变量对另一个变量的相关影响)和复相关(或多元相关,若干个变量对另一个变量的相关影响)散点图形态:d.完全正相关
e.正相关
f.非线性相关a.完全负相关
b.负相关
c.不相关d.完全正相关e.正相关f.非线性相关散点图形态:4.相关分析:研究两个或两个以上变量之间不确定性依存关系的方法,其目的在于探求变量之间是否存在相关关系,以及相关关系的密切程度。5.相关分析的步骤:(1)根据一定的经济理论和实践经验对现象进行定性分析;(2)绘制散点图来判断变量之间的关系形态;(3)如果两个变量之间是线性关系(即出现图a.b.d.e的形态),用样本相关系数来测度两个变量之间的关系强度,对相关系数进行显著性检验,判断样本所反映的关系能够用来代表两个变量总体上的关系(多个变量间的相关性通过复相关系数与偏相关系数度量)。
6.样本相关系数设已经观察记录得到了两个变量的一组观察值()(),则变量之间的样本相关系数的计算公式为:其中,————样本协方差,
————样本方差简化公式:r的取值范围:。r=1:X和Y完全正相关,X与Y是函数关系;r=-1:X和Y完全负相关,X与Y是函数关系;r=0:X和Y之间不存在线性关系,但可能存在非线性关系;0<|r|<1:Y与X之间存在普通的线性相关关系;|r|越大,X与Y之间的线性相关程度越高。|r|≥0.8:高度相关;0.5≤|r|≤0.8:中度相关;
0.3≤|r|≤0.5:低度相关;|r|<0.3:近似不相关。7.样本相关系数的检验样本相关系数是根据样本得到的统计量,因此具有随机性,只有对样本相关系数进行检验后才能下结论。检验统计量:,总体相关系数提出假设:对于给定的显著水平,计算t的估计量,
——X与Y之间存在线性相关关系;
——X与Y之间不存在线性相关关系。注意:(1)相关分析只表明两个变量之间的相关程度和方向,它并不能说明两个变量间是否有因果关系。(2)相关关系成立的数据范围之内应用这种相关关系,不能随意外推。eg.雨量和农作物的长势。3.1.2回归分析在相关分析的基础上进行回归分析,进一步探讨变量之间的因果关系和具体的数量变动关系。
1.回归分析:研究某一随机变量(因变量)与其他一个或几个普通变量(自变量)之间数量变动关系的一种方法。2.回归分析的主要内容:
(1)根据研究现象之间的内在联系,确定自变量和因变量。
(2)确定回归分析模型的类型及表达式(参数)。
(3)
对回归模型进行检验。包括:拟合度检验、回归系数的显著性检验、回归方程的显著性检验等。
(4)对因变量进行预测。利用回归模型,根据自变量的数值去估计、预测因变量的取值及置信区间,也可利用回归模型进行控制。
3.回归模型的分类
(1)一元回归模型和多元回归模型——模型中包含自变量的个数。
(2)线性回归模型和非线性回归模型——回归模型的形式。
(3)普通回归模型和带虚拟变量的回归模型——模型是否带有虚拟变量。3.1.3相关分析与回归分析的主要区别(1)相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。(2)相关分析中,两个变量要求都是随机变量,并且不必区分自变量和因变量;而回归分析中自变量是普通变量,因变量是随机变量,并且必须明确哪个是因变量,哪些是自变量;(3)相关分析中两变量是对等的,改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,改变两个变量的位置会得到两个不同的回归方程。3.2一元线性回归预测方法
一元线性回归预测法:当两个变量的数据分布大体呈直线趋势时,通过建立一元线性回归模型,从而根据自变量的变化来预测因变量的平均变化。3.2.1一元线性回归模型Y:因变量;X:自变量;a,b:回归系数;:剩余残差项(或随机扰动项)
(1)参数a,b估计利用最小二乘法进行参数估计,得到a,b表达式:(2)回归方程或3.2.2一元线性回归模型的显著性检验1.模型拟合优度的检验拟合优度:由样本数据拟合回归直线的优劣程度。判定系数(决定系数)是衡量模型拟合优度的重要指标。(1)判定系数:
,总离差平方和,回归利差平方和,剩余平方和,越接近1,回归直线的拟合优度越高,如果的取值超过0.8,认为模型的拟合优度比较高。判定系数的平方根就是相关系数r。2.回归方程的显著性检验(F检验)利用统计方法检验所建立的回归方程是否有意义。检验步骤:(1)建立假说。(2)构造F统计量
F服从F(1,n-2)分布。对给定的显著水平,查F分布表可得临界值。(3)根据观察值计算统计量F的估计值,若,拒绝原假设,认为两个变量Y与x间线性关系显著;若,则两个变量Y与x间线性关系不显著,回归模型不能用于预测与控制。3.回归系数的显著性检验(t检验)(一元线性回归中F检验与t检验结果相同)
用于判断每一个自变量与因变量的线性关系是否显著,主要检验参数是否显著异于0。检验步骤:(1)建立假说。(2)构造t统计量,其中t服从t(n-2)分布。对给定的显著水平,查t分布表可得临界值。(3)根据观察值计算统计量t的估计值,若,拒绝原假设,认为b显著异于0;若,则意味着方程中的自变量对于回归模型是不显著的或不重要的。3.2.3一元线性回归预测回归预测:利用回归方程,对于自变量x的一个给定值x0,求出,称为点估计值。对于给定的显著水平,预测区间为:其中,,例题某省1978-1989年国内生产总值和固定资产投资完成额如表所示。试配合适当的回归模型进行显著性检验。若1990年该省固定资产投资完成额为249亿元,当显著水平为0.05时,试估计1990年国内生产总值的预测区间。年份国内生产总值yi固定资产投资完成额xixiyixi2yi219781952039004003802519792102042004004410019802442663446765953619812643592401225696961982294521528827048643619833145617584313698596198436081291606561129600198543213156592171611866241986481149716992220123136119875671639242126569321489198865523215196053824429025198970420214220840804495616合计472011676005661756612190104解题过程1.绘制散点图两者近似呈线性关系。计算相关系数r2.设一元线性回归方程为:3.计算回归系数:
则回归方程为:4.回归模型的显著性检验(1)模型拟合优度的检验
计算可决系数,说明回归平方和占总离差平方和的96.4%,回归直线的拟合程度很高,从而可用x的变动来解释Y的变动。(2)回归方程的显著性检验(F检验)<1>建立假说。
<2>构造F统计量
取显著水平,查表得临界值。拒绝原假设,即认为两个变量Y与x之间线性关系显著,回归方程在统计意义上是显著的。(3)回归系数的显著性检验(t检验)<1>建立假说。<2>构造t统计量,取显著水平,查t分布表可得临界值。,拒绝原假设,即认为b显著异于0,说明方程中的自变量对于回归模型是显著的。5.预测当x0=249亿元时,带入回归方程得到Y的点估计值为亿元。预测区间为一元线性回归预测
Eviews
运算演示1.输入数据(1)建立工作文件:File/New/Workfile(2)输入起止年(3)工作文件初始状态(4)新建对象:Object/NewObject(5)在对象中选择Series,为对象起名字(6)在文件中双击对象名,输入数据edit+/-
(7)数据输入后的结果2.绘制散点图(1)选择Quick/Graph(2)输入绘制散点图的数列(3)选择scatter(4)生成的散点图3.简单相关分析r(1)Quick/GroupStatistics/Correlations(2)输入序列名(3)相关系数计算结果Eviews软件不提供r的检验,因此需要手工处理t分布表1n0.250.20.150.10.050.0250.010.0050.00250.0010.000511.0001.3761.9633.0786.31412.7131.8263.66127.3318.3636.620.8161.0611.3861.8862.9204.3036.9659.92514.0922.3331.6030.7650.9781.2501.6382.3533.1824.5415.8417.45310.2112.9240.7410.9411.1901.5332.1322.7763.7474.6045.5987.1738.61050.7270.9201.1561.4762.0152.5713.3654.0324.7735.8936.86960.7180.9061.1341.4401.9432.4473.1433.7074.3175.2085.95970.7110.8961.1191.4151.8952.3652.9983.4994.0294.7855.40880.7060.8891.1081.3971.8602.3062.8963.3553.8334.5015.04190.7030.8831.1001.3831.8332.2622.8213.2503.6904.2974.781100.7000.8791.0931.3721.8122.2282.7643.1693.5814.1444.587110.6970.8761.0881.3631.7962.2012.7183.1063.4974.0254.437120.6950.8731.0831.3561.7822.1792.6813.0553.4283.9304.318130.6940.8701.0791.3501.7712.1602.6503.0123.3723.8524.221140.6920.8681.0761.3451.7612.1452.6242.9773.3263.7874.140150.6910.8661.0741.3411.7532.1312.6022.9473.2863.7334.073160.6900.8651.0711.3371.7462.1202.5832.9213.2523.6864.015170.6890.8631.0691.3331.7402.1102.5672.8983.2223.6463.965180.6880.8621.0671.3301.7342.1012.5522.8783.1973.6103.922t分布表2n0.250.20.150.10.050.0250.010.0050.00250.0010.0005190.6880.8611.0661.3281.7292.0932.5392.8613.1743.5793.883200.6870.8601.0641.3251.7252.0862.5282.8453.1533.5523.850210.6860.8591.0631.3231.7212.0802.5182.8313.1353.5273.819220.6860.8581.0611.3211.7172.0742.5082.8193.1193.5053.792230.6850.8581.0601.3191.7142.0692.5002.8073.1043.4853.767240.6850.8571.0591.3181.7112.0642.4922.7973.0913.4673.745250.6840.8561.0581.3161.7082.0602.4852.7873.0783.4503.725260.6840.8561.0581.3151.7062.0562.4792.7793.0673.4353.707270.6840.8551.0571.3141.7032.0522.4732.7713.0573.4213.690280.6830.8551.0561.3131.7012.0482.4672.7633.0473.4083.674290.6830.8541.0551.3111.6992.0452.4622.7563.0383.3963.659300.6830.8541.0551.3101.6972.0422.4572.7503.0303.3853.646400.6810.8511.0501.3031.6842.0212.4232.7042.9713.3073.551500.6790.8491.0471.2991.6762.0092.4032.6782.9373.2613.496600.6790.8481.0451.2961.6712.0002.3902.6602.9153.2323.460800.6780.8461.0431.2921.6641.9902.3742.6392.8873.1953.4161000.6770.8451.0421.2901.6601.9842.3642.6262.8713.1743.3901200.6770.8451.0411.2891.6581.9802.3582.6172.8603.1603.373infty0.6740.8421.0361.2821.6451.9602.3262.5762.8074.计算回归系数(1)Quick/EstimateEquation(2)输入模型(3)计算结果5.模型拟合优度的检验(1)系数计算结果中R-squared判定系数R2=0.9661066.回归方程的显著性检验(F检验)
F检验值F-statistic=285.0366为了方便,Eviews中给出了拒绝零假设时犯错误的概率,称为收尾概率或相伴概率Prob(F-statistic)。若此概率值低于事先确定的显著水平,则可拒绝零假设,否则不能拒绝。7.回归系数的显著性检验(t检验)t检验值t-Statisticb:16.88303当收尾概率小于规定的显著水平,则检验通过,否则检验未通过。8.预测双击,改变数据区间双击数据序列gd,添加1990年数据,249亿元在计算结果界面上单击Forecast,修改预测样本区间预测结果双击gnf,1990年gn的预测结果为738.8299区间估计:Sumsquaredresid作业某饮料公司经过长期的观察发现:饮料的销售量与气温之间存在着一定的关系,即气温越高,人们对饮料的需求量越大,从而使得饮料的销售量越大。为此该饮料公司记录了10次不同温度下的饮料销售量,如图。序号12345678910气温/oC3021354237208173525销售量/箱430335520490470210195270400480根据这些数据能够得到结论:饮料的销售量与气温之间一定存在着某种关系?这种关系可否通过数学模型来描述?是否可以根据建立的数学模型预测气温为32
oC时,饮料的销售量。社会经济现象的变化往往受到多个因素的影响,因此,一般要进行多元回归分析,研究某一因变量与多个自变量之间相互关系的理论和方法就是多元线性回归预测法。3.3多元线性回归预测法3.3.1多元线性回归模型1.参数估计多元回归与一元回归类似,可以用最小二乘法估计模型参数。也需对模型及模型参数进行统计检验。设序列的观测值与估计值之间的离差平方和为Q,则为使Q达到最小,分别令Q关于的偏导数等于零。的估计值为
回归系数向量的性质(1)是的无偏估计,即(2)的协方差3.3.2多元线性回归模型的显著性检验1.模型拟合优度的检验
多重判定系数
为了消除自变量数目的影响,采用一个经过校正的判定系数来判断模型的拟合优度越接近于1,则说明模型的拟合程度越高。————复相关系数说明的是在总的离差平方和中,由一组自变量的变动所引起的离差占总离差的百分比;则描述一组自变量与因变量Y之间的线性相关程度。2.回归方程的显著性检验多元线性回归方程效果不显著的原因:(1)影响Y的因素除了一组自变量x1,x2,…,xm之外,还有其他不可忽略的因素;(2)Y与一组自变量x1,x2,…,xm之间的关系不是线性的;(3)Y与一组自变量x1,x2,…,xm之间无关。这时回归模型不能用来预测,应分析原因,另选自变量或改变预测模型的形式。3.回归系数的显著性检验Cjj为矩阵(XTX)-1主对角线上的第j个元素。3.3.3多元线性回归预测2.点预测值3.预测区间因变量的点预测值和预测区间的计算步骤:3.3.3多元线性回归预测因变量的点预测值和预测区间的计算步骤:1.计算估计标准误差2.对任意给定的,因变量的点预测值为,预测误差的样本方差为
3.给定显著性水平,则当预测值为时,其预测区间为在实际预测中,一般可以用SY代替S0近似的估计预测区间。3.3.4多元线性回归分析中的多重共线性
所谓多重共线性是指自变量之间存在着线性关系或接近线性的关系。如果自变量之间共线性的程度很高(相关系数接近于1),将使最小二乘法原理失效,从而使得回归方程中参数变得不确定从而无法求出参数的估计值。因此自变量之间不能存在线性相关关系是应用最小二乘法原理的先决条件。检验多重共线性的方法(1)
经验法:一般的,如果模型的R2很大,F检验通过,但有些系数不能通过参数t检验,模型的自变量之间简单相关系数很高,回归系数的符号与简单相关系数的符号相反,都有理由怀疑存在多重共线性。检验多重共线性的方法(2)
常用的克服多重共线性的方法(1)省略不重要的自变量。(2)差分法。(3)增加样本信息或利用已知信息。对于时间序列数据资料和横剖面数据资料,增大样本容量都回提高参数估计值得精度。将两者结合起来(将历史统计数据和抽样调查数据结合)使用也有助于消除严重的多重共线性。
(4)构造新的自变量。将两个高度相关的自变量,变成一个自变量xi/xj。(5)放弃原有样本,寻求新的样本。注:对于模型的估计是否容许多重共线性的自变量存在,要根据建立模型的具体目的确定。若目的是为了预测,那么只要保证自变量之间相关的类型在预测期内不变,对预测精度的影响就不大。但是,若自变量之间相关类型在预期内发生了变化,如果想得到精确地预测值,就必须克服自变量之间的而严重共线性关系问题。3.3.5多元线性回归分析中的序列相关序列相关的检验法1.图示检验法2.德宾—沃森统计量(D—W)适合随机误差项具有一阶自相关的情况,即与它前一期相关。步骤:
1)建立回归方程并利用最小二乘法求出回归方程的系数,从而求出剩余项ei(i=1~n)
2)计算DW统计量
3)建立假设H0:ρ1=0,H1:ρ1≠0。
4)根据给定的显著性水平α及自变量个数m从DW检验表中查得相应临界值dL,dU,并利用规则判别检验结论。D—W的取值域在0~4之间。
检验法则:在D—W小于等于2时,D—W检验法则规定:如认为,存在正自相关;如认为,无自相关。在D—W大于2时,D—W检验法则规定:如存在负自相关;如无自相关;如,不能确定是否有自相关;补救的方法(1)把略去的重要影响因素引入到回归模型中来。(2)重新选择符合实际的回归模型形式。(3)增加样本容量,改善数据的准确性。异方差如果回归模型中的随机误差项不满足假设条件中的同方差性,即对不同的样本点有:则称存在异方差性。当存在异方差时,如果采用OLS法估计模型参数,可能出现:参数估计值虽然是无偏的,但不是有效的;参数的显著性检验失去意义;预测失效等。异方差的检验法1.图示检验法以某一变量(通常取自变量或因变量的预测值)作为横坐标,以模型的残差e作为纵坐标,根据做出的散点图直观的判断是否存在相关性。如果存在相关性,则存在异方差。2.怀特检验法把e2作为因变量,原先的自变量和自变量的平方作为新自变量建立线性回归模型(还可以加上任意两个变量的交叉项xixj),通过这个模型的拟合情况来检验是否有异方差性。检验的零假设时残差不存在异方差。如对两个自变量的情况,则可建立如下辅助回归模型:怀特检验的统计量:LM=n*R2,m近似服从自由度为k的分布,可又收尾概率作出是否拒绝原假设的结论。异方差的处理加权最小二乘法(WLS)基本思路:残差平方和中的每个观测值的权数不同,从而使新模型的随机误差具有同方差性。以一元回归方程为例,WLS的残差平方和变为:
多元线性回归预测
Eviews
运算演示美国机动车汽油消费量研究
年份obs消费量QMG汽车保有量MOB汽油价格PMG人口数POP国民生产总值GNP195040617285491952120.2721522711090.4195143896887519487960.2761548781179.2195246428148533013290.2871575531226.1195349374047563132810.291601841282.1195451107135586225470.2911630261252.1195554333255626887920.2991659311356.7195656022406651538100.311689031383.5195757415622671249040.3041719841410.2195859154330682965940.3051748821384.7195961596548713544200.3111778301481196062811854738686820.3081806711517.2196163978489759582150.3061836911547.9196262531373791733290.3041865381647.9196364779104827137170.3041892421711.6196467663848863012070.3121918891806.9196570337126903607210.3211943031918.5196673638812939620300.3321965602048.9196776139326969309490.3371987122100.31968807726571010391130.3482007062195.41969854160841035620180.3572026772260.71970886840501068076290.3642050522250.71971921946201112974590.36120766123321972953489041170516380.3882098962465.51973998046001238117410.5242119092602.819741002122101279512540.5722138542564.219751023277501309189180.5952159732530.919761069727401363339340.6312180352680.519771100234101415231970.6572202392822.419781136259601464843360.6782225853115.219791078312201494222050.8572250553192.419801008560701533578761.1912277573187.819811009940401559074731.3112301383248.819821002428701569936941.222232520316619831015152601610179261.1572347993279.119841026036901634329441.292370013489.919851047192301687438171.1152392793585.219861078312201732558500.8572416133676.519871104679801779220000.8972439153847一、数据的预处理预处理是指在正式建模之前运用一些初等方法探讨变量之间的关系,为正式建模做准备。常用的预处理方法包括绘制动态曲线图、绘制散点图、计算变量之间的相关系数等。1.绘制动态曲线图步骤:(1)Quick/Graph(2)输入序列名称输入序列名称参数设置各个变量的动态曲线2.绘制散点图步骤:(1)Quick/Graph(2)输入序列名称3.简单相关分析步骤:(1)Quick/GroupStatistic/Correlation(2)输入序列名称输入序列名样本相关系数计算结果二、最小二乘估计步骤:(1)Quick/EstimateEquation
(2)输入回归方程完整型
QMG=c(1)*+c(2)*MOB+c(3)*PMG+c(4)*POP+c(5)*GNP简单型QMGcMOBPMGPOPGNP注:只有线性模型才可以以简化形式书写。方程对象窗口各统计量的解释:DependentVariable:QMG(因变量)Method:LeastSquares (参数估计方法)Date:10/02/14Time:19:14 Sample:19501987 (样本范围)Includedobservations:38(样本容量)Variable(自变量)Coefficient(参数估计值)Std.Error(参数估计量的样本标准差)t-Statistic(t统计量)Prob.(t统计量的收尾概率)C24553723250796700.9790290.3347MOB1.4185200.2668915.3149770.0000PMG-279957625027085.-5.5689850.0000POP-59.87480198.5517-0.3015580.7649GNP-30540.889557.981-3.1953280.0031R-squared(决定系数)0.966951Meandependentvar(因变量的样本均值)80901846AdjustedR-squared(修正的决定系数)0.962945S.D.dependentvar(因变量的样本标准差)22972717S.E.ofregression(回归标准差)4422197.Akaikeinfocriterion(AIC,赤池信息量准则)33.56425Sumsquaredresid(残差平方和)6.45E+14Schwarzcriterion(SC,施瓦茨准则)33.77972Loglikelihood(对数似然函数)-632.7208Hannan-Quinncriter.(HQC,汉南-奎因准则)33.64091F-statistic(F-统计量)241.3763Durbin-Watsonstat(D.W.统计量)0.626584Prob(F-statistic)(F-统计量的收尾概率)0.000000Loglikelihood(对数似然函数):L取值越大说明模型越精确。但受自变量数目的影响,变量越多L越大,导致不合理,需要改进。Akaikeinfocriterion(AIC,赤池信息量准则):对对数似然函数的改进,取值越小越好。Schwarzcriterion(SC,施瓦茨准则):对对数似然函数的改进,取值越小越好。Hannan-Quinncriter.(HQC,汉南-奎因准则):对对数似然函数的改进,取值越小越好。三、自变量的选择1、t检验法Variable(自变量)t-Statistic(t统计量)Prob.(t统计量的收尾概率)C0.9790290.3347MOB5.3149770.0000PMG-5.5689850.0000POP-0.3015580.7649GNP-3.1953280.0031POP变量的收尾概率为0.7649,可以考虑从模型中删除掉。
2、删除变量POP后,再次回归删除POP后模型的参数估计注:最好一次只检验一个变量;要求原模型与检验模型的样本容量一致(1959-1987)。四、多重共线性
1、多重共线性的诊断(1)观察个别偏回归系数估计值的符号回归结果尽管方程整体线性回归拟合较好,但GNP系数的符号与经济意义相悖,MOB的系数估计值很小。表明模型存在多重共线性。(2)简单相关系数法相关系数相关系数都在0.8以上,解释变量之间存在高度线性相关性。(3)辅助回归法
作每一解释变量对其他解释变量的回归,(F检验)F检验值的收尾概率p都很小,因此,每个解释变量都与其余解释变量至少有一个具有多重共线性。2、多重共线性的补救(1)逐步回归法
1)用因变量对每一个解释变量做回归,并将解释变量的重要性按R2大小排序,R2越大,重要性越高,结合经济意义和统计检验选出拟合效果最好的一元线性回归方程。根据上述对解释变量重要性排序如下:R2MOB>R2GNP>R2PMG2)以对因变量贡献最大的解释变量所对应的回归方程为基础方程,并按解释变量重要性的大小为顺序逐个引入其余的解释变量,该新模型的基础方程QMG=22038951+0.546879*MOB,入解释变量GNP与基础方程QMG=22038951+0.546879*MOB相比,该模型的估计结果中R2有所提高(基础方程R2=0.917016),而且P值很小,但GNP系数前面的符号为负,不符合实际,所以变量GNP在模型中不予以保留。加入解释变量PMG与基础方程QMG=22038951+0.546879*MOB相比,该模型的估计结果中R2有所提高(基础方程R2=0.917016),而且P值很小,且MOB系数前面的符号为正,PMG系数前面的符号为负,符合实际,所以变量GNP在模型中予以保留。样本模型
:Se=(2592695)(0.040936)(4834044.)t=(5.906098)(18.29326)(-5.662563)p=(0.0000)(0.0000)(0.0000)
F=386.5829(2)剔除法设法找到引起共线性的变量并予以剔除。通常剔除未通过系数显著性检验的变量。(3)差分法差分法会带来拟合效果变差,常常丢失一些信息等问题。(4)重新定义方程考虑用人均汽油消费量、人均机动车数量、人均国民生产总值和油价这四个变量建模,取消原模型中的人口数量。减少变量,降低发生共线性的可能。采用逐步回归法(5)有偏估计,如主成分回归、岭回归等。五、序列相关
1、自相关的诊断(1)图示检验法(模型只考虑MOB、PMG两个变量的自相关性)
法一:绘制et和et-1散点图。et和et-1散点图et和et-1的相关性不明朗法二:按时间顺序绘制残差项et的图形。et
时间变化图按时间顺序,et变化有规律,存在自相关性(2)DW检验法DW=0.236393k=2T=38dL=1.37dU=1.59DW<dL,存在正相关附表DW检验临界值表(a=0.05)
Tk=1k=2k=3k=4
k=5
dL
dU
dL
dU
dL
dU
dL
dU
dL
dU
151.081.360.951.540.821.750.691.970.562.21
161.101.370.981.540.861.730.741.930.622.15
171.131.381.021.540.901.710.781.900.672.10
181.161.391.051.530.931.690.821.870.712.06
191.181.401.081.530.971.680.861.850.752.02
201.201.411.101.541.001.680.901.830.791.99
211.221.421.131.541.031.670.931.810.831.96
221.241.431.151.541.051.660.961.800.861.94
231.261.441.171.541.081.660.991.790.901.92
241.271.451.191.551.101.661.011.780.931.90
251.291.451.211.551.121.661.041.770.951.89
261.301.461.221.551.141.651.061.760.981.88
271.321.471.241.561.161.651.081.761.011.86
281.331.481.261.561.181.651.101.751.031.85
291.341.481.271.561.201.651.121.741.051.84
301.351.491.281.571.211.651.141.741.071.83
311.361.501.301.571.231.651.161.741.091.83
321.371.501.311.571.241.651.181.731.111.82
331.381.511.321.581.261.651.191.731.131.81
341.391.511.331.581.271.651.211.731.151.81
351.401.521.341.581.281.651.221.731.161.80
361.411.521.351.591.291.651.241.731.181.80
371.421.531.361.591.311.661.251.721.191.80
381.431.541.371.591.321.661.261.721.211.79
391.431.541.381.601.331.661.271.721.221.79
401.441.541.391.601.341.661.291.721.231.79
451.481.571.431.621.381.671.341.721.291.78
501.501.591.461.631.421.671.381.721.341.77
551.531.601.491.641.451.681.411.721.381.77
601.551.621.511.651.481.691.441.731.411.77
651.571.631.541.661.501.701.471.731.441.77
701.581.641.551.671.521.701.491.741.461.77
751.601.651.571.681.541.711.511.741.491.77
801.611.661.591.691.561.721.531.741.511.77
851.621.671.601.701.571.721.551.751.521.77
901.631.681.611.701.591.731.571.751.541.78
951.641.691.621.711.601.731.581.751.561.781001.651.691.631.721.611.741.591.761.571.78注:1.
表示检验水平,T表示样本容量,
k表示回归模型中解释变量个数(不包括常数项)。2.dU和dL分别表示DW检验上临界值和下临界值。3.摘自Dubrin-Watson(1951)。
D.W.检验法的不足:适合随机误差项具有一阶自相关的情况,不能检验是否有高阶自相关。(3)LM检验法——可以检验是否有高阶自相关原假设:残差不存在从一阶到p阶的自相关。方法一:View/ResidualTests/correlogram-Q-statistics。EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的Ljung-BoxQ统计量。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于零。所有的Q-统计量不显著,并且有大的P值。方法二:View/ResidualTests/SerialcorrelationLMTest,一般地对高阶序列相关的情况执行SerialcorrelationLM(Lagrangemultiplier,拉格朗日乘数检验)。在滞后定义对话框,输入要检验序列的最高阶数。可根据统计量的收尾概率的大小决定原假设的舍去。1阶2阶3阶存在1阶自相关2、自相关的克服方法(1)Cochrane-Orcutt(科克伦‐奥科特)迭代法1)在QUICK-ESTIMATEEQUATION项,在对话框中输入:QMG
C
MOBPMG
AR(1)后得如下结果:DW=1.367840k=2T=38dL=1.37dU=1.59,DW<DL,存在正相关。2)在QUICK-ESTIMATEEQUATION项,在对话框中输入:QMG
C
MOBPMG
AR(1)AR(2)后得如下结果:DW=2.030970k=2T=38dL=1.37dU=1.594-dU=2.41,dU<DW<4-dU,无自相关。,(2)重新定义模型将因变量和自变量重新定义为各变量的年度增长率:DQMGDMOBDPMG,然后建立如下模型,参数估计如下,DW=1.475915,dL=1.36dU=1.59,不能确定是否相关。LM检验View/ResidualTests/correlogram-Q-statistics残差无序列相关。六、异方差1、异方差的诊断(1)图示检验法以某一变量(通常取自变量或因变量的预测值)作为横坐标,以模型的残差e作为纵坐标,根据做出的散点图直观的判断是否存在相关性。如果存在相关性,则存在异方差性。
残差分布图随着自变量MOB、取值得增大,残差e的波动幅度也逐渐增大,这是异方差的典型特征。(2)怀特(White)检验Eviews操作:View/ResidualTests/HeteroskedasticityTests异方差其他检验:格力瑟尔检验(Glejser-test)、哈维检验(Harvey-test)、布罗什-帕甘-古德弗雷检验(Breush-Pagan-Godfrey-test(BPG))收尾概率小于显著水平,存在异方差2、异方差性的处理(1)加权最小二乘法方差扩大的趋势与GNP有关,可用如下函数定义权数:W=GNP^m,m分别取-2,-1.5,-1,-0.5,0,0.5,1,1.5,2。建立九个模型。通过R2的比较,找到表现最好的模型作为选中的模型。加权最小二乘估计的实现与普通最小二乘估计基本相同,只是需要在方程定义对话框中按下Options按钮,在Options栏中选WeightedLs项,并在Weight项中输入权数序列名即可。通过R2的比较,m=-1.5时,模型表现最好最优模型(m=-1.5)的参数估计结果WLS建立的模型的哈维检验结果(2)异方差和自相关相容协方差估计(适用于异方差的形式未知,不能适用WLS来消除异方差)操作:在普通的建模过程中选方程定义对话框的Options按钮;在新对话框选择HeteroskedasticityConsistentCovariances;再从White和Newey-West选择一种,开始估计。White和Newey-WestHAC都不改变参数的点估计,改变的只是估计标准差。可以将其结合其他针对异方差或自相关的方法使用,如可伴随WLS一起估计。七
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 租赁厂房合同协议
- 招标文件评审的实践操作与评审标准
- 家庭护理家政工雇佣合同
- 土地居间合作合同书
- 现金赎楼服务合同还款还款监管政策
- 借款保证协议模板
- 个人社会救助借款合同范本
- 河砂砾石采购协议
- 林业采伐合作合同
- 抗洪项目论证招标
- 电力行业电力调度培训
- 生态安全与国家安全
- 全力以赴备战期末-2024-2025学年上学期备战期末考试主题班会课件
- 2024年保密协议书(政府机关)3篇
- 《视频拍摄与制作:短视频 商品视频 直播视频(第2版)》-课程标准
- 研发部年终总结和规划
- 石油开采技术服务支持合同
- 山东省烟台市2024届高三上学期期末考试英语试题 含解析
- 公司战略与风险管理战略实施
- 2024年-2025年《农作物生产技术》综合知识考试题库及答案
- 广东省广州市白云区2022-2023学年八年级上学期物理期末试卷(含答案)
评论
0/150
提交评论