基于时间序列方法对1952-2014年我国gdp模型建立及预测_第1页
基于时间序列方法对1952-2014年我国gdp模型建立及预测_第2页
基于时间序列方法对1952-2014年我国gdp模型建立及预测_第3页
基于时间序列方法对1952-2014年我国gdp模型建立及预测_第4页
基于时间序列方法对1952-2014年我国gdp模型建立及预测_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计调查与数学建模论文目 录摘要-2 一 引言-2二 时间序列分析方法-4 2.1 时间序列检验的预处理方法-4 2.1.1 平稳性检验-4 2.1.2 白噪声检验-62.2 ARIMA模型简述-7三 基于时间序列的我国1952-2014年GDP建模与预测-93.1 平稳性检验-93.2 白噪声检验-123.3 模型的定阶-133.4模型的检验及拟合-133.5 预测及分析-15四 确定性分析:趋势分析法-16五 20152019年的预测结果及结论-19参考文献-21附录A-22附录B-23基于时间序列的我国1952-2014年GDP建模与预测摘要本文通过对我国19522012年GDP(国内生

2、产总值)的时间序列进行建模分析,分别利用ARIMA模型和趋势分析法建模,将2013及2014年的数据作为测试对象,来区别出最优模型。得出最优为MA(1)模型,对未来五年的GDP进行了预测,预测的误差较小。关键词: GDP,时间序列,ARIMA模型,GDP预测一 引言国内生产总值(Gross Domestic Product,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,还可以反映一国的国力与财富。2012年1月,国家统计局公布2011年重要经济数据,其中GDP增长9

3、.2% ,基本符合预期。2014年中国GDP首破60万亿,同比增7.4%创1990年以来新低。指标GDP的意义:(一)国内生产总值GDP是核算体系中一个重要的综合性统计指标,也是中国新国民经济核算体系中的核 心指标。它反映一国(或地区)的经济实力和市场规模。一个国家或地区的经济究竟处于增长抑或衰退阶段,从这个数字的变化便可以观察到。一般而言,GDP公布的形式不外乎两种,以总额和百分比率为计算单位。当GDP的增长数字处于正数时,即显示该地区经济处于扩张阶段;反之,如果处于负数,即表示该地区的经济进入衰退时期了。国内生产总值是指一定时间内所生产的商品与劳务的总量乘国内生产总值以“货币价格”或“市价

4、”而得到的数字,即名义国内生产总值,而名义国内生产总值增长率等于实际国内生产总值增长率与通货膨胀率之和。因此,即使总产量没有增加,仅价格水平上升,名义国内生产总值仍然是会上升的。在价格上涨的情况下,国内生产总值的上升只是一种假象,有实质性影响的还是实际国内生产总值变化率,所以使用国内生产总值这个指标时,还必须通过GDP缩减指数,对名义国内生产总值做出调整,从而精确地反映产出的实际变动。因此,一个季度GDP缩减指数的增加,便足以表明当季的通货膨胀状况。如果GDP缩减指数大幅度地增加,便会对经济产生负面影响,同时也是货币供给紧缩、利率上升、进而外汇汇率上升的先兆。(二)国内生产总值是反映常住单位生

5、产活动成果的指标。常住单位是指在一国经济领土内具有经济利益中心的经济单位。经济领土是指由一国政府控制或拥有的地理领土,也就是在本国的地理范围基础上,还应包括该国驻外使领馆、科研站和援助机构等,并相应地扣除外国驻本国的上述机构(国际机构不属于任何国家的常住单位,但其雇员则属于所在国家的常住居民)。经济利益中心是指某一单位或个人在一国经济领土内拥有一定活动场所,从事一定的生产和消费活动,并持续经营或居住一年以上的单位或个人,一个机构或个人只能有一个经济利益中心。一般就机构(单位)而言,不论其资产和管理归属哪个国家控制,只要符合上述标准,该机构在所在国就具有了经济利益中心。就个人而言,不论其国籍属于

6、哪个国家,只要符合上述标准,该居民在所在国就具有经济利益中心。因为常住单位的概念严格地规定了一个国家的经济主体范围,所以其对于确定国内生产总值的计算口径,明确国内与国外的核算界限以及各种交易量的范围都具有重要意义。二 时间序列分析方法2.1 时间序列检验的预处理方法2.1.1 平稳性检验平稳性是某些时间序列具有的一种统计特征。对于平稳的序列我们就可以运用已知的时间序列模型对其进行分析预测。因此对数据进行平稳性检验是时间序列分析法的关键步骤。对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。通常我们都选用图检验方法检验

7、序列平稳性并用单位根统计检验法加以辅助。(1) 自相关图法自相关函数和偏自相关函数的定义:构成时间序列的每个序列值,之间的简单相关关系称为自相关。自相关程度由自相关系数度量,表示时间序列中相隔期的观测值之间的相关程度。 (2-1)其中,是样本量,为滞后期,代表样本数据的算术平均值。自相系数的取值范围是并且越小,自相关程度越高。偏自相关是指对于时间序列,在给定的条件下,与之间的条件相关关系。其相关程度用偏自相关系数度量,有。 (2-2)其中是滞后期的自相关系数。如果序列的自相关系数很快地(滞后阶数大于2或3时)趋于0,即落入随机区间,时间序列是平稳的,反之时间序列是非平稳。若有更多的自相关系数落

8、在随机区间以外,即与零有显著不同,时间序列就是不平稳的。自相关图仅仅是从图中直观的判断,我们还需要理论的判断来支撑。(2) 单位根检验法时间序列的平稳性还可以通过单位根检验来判断,单位根检验目前常用的两种方法是DF和ADF。DF检验法是Dickey和Fuller在70年代和80年代的一系列文章中建立的。其基本思想是:一阶回归模型中,时,序列是平稳的。若,则序列是非平稳的,存在单位根,通过检验是否可能为1,判断序列是否平稳序列。(i)DF检验:序列有如下三种形式:不包含常数项和线性时间趋势项 (2-3)包含常数项 (2-4)包含常数项和线性时间趋势项 (2-5)其中,。检验假设为: 序列存在单位

9、根的零假设下,对参数估计值进行显著性检验的t统计量不服从常规的t分布,DF(Diekey&Fuller)于1979年给出了检验用的模拟的临界值,故称检验称为DF检验。一般地,如果序列在0均值上下波动,则应该选择不包含常数和时间趋势项地检验方程,即(2-3)式;如果序列具有非0均值,但没有时间趋势,可选择(2-4)作为检验方程;序列随时间变化有上升或下降趋势,应采用(2-5)的形式。(ii) ADF检验:在DF检验中,对于(2-3)式,常常因为序列存在高阶滞后相关而破坏了随机扰动项是白噪声的假设,ADF检验对此做了改进。它假定序列服从AR(P)过程。检验分程为 (2-6)式中的参数视具体

10、情况而定,一般选择能保证是白噪声的最小的值。与DF检验一样,ADF检验也可以有包含常数项和同时含有常数和线性时间趋势项两形,只需在(2-6)式右边加上或与。2.1.2 白噪声检验如果时间序列Xt满足如下性质:(i) 任取tT,有EXt=;(ii) 任取t,sT,有t,s=2,t=s0,ts称序列Xt为纯随机序列,也称为白噪声(white noise)序列,简记为XtWN(,2)。由白噪声序列的性质知,白噪声序列的各项之间没有相关关系,这种“没有记忆”的序列就是纯随机序列,序列在进行完全无序的随机波动。一旦某个随机事件呈现出纯随机波动的特征,就认为该随机事件没有 包含任何值得提取的有用信息,我们

11、就该终止分析了。如果序列值之间呈现出某种显著的相关关系:(k)0,k0就说明该序列不是纯随机序列,该序列间隔k期的序列值之间存在着一定程度的相互影响关系,这种关系统计上称为相关信息。我们分析的目的就是要想方设法把这种相关信息从观察值序列中提取出来。一旦观察值序列中蕴含的相关信息充分提取出来了,那么剩下的残差序列就应该呈现出纯随机的性质。2.2ARIMA模型简述全称为自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归, p为自回归项; MA为移动平

12、均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。所谓ARIMA模型,是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。ARIMA模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。ARIMA模型预测的基本程序:(I)根据时间序列的散点图、自相关函数和偏自相关函数

13、图以ADF单位根检验其方差、趋势及其季节性变化规律,对序列的平稳性进行识别。一般来讲,经济运行的时间序列都不是平稳序列。(II)对非平稳序列进行平稳化处理。如果数据序列是非平稳的,并存在一定的增长或下降趋势,则需要对数据进行差分处理,如果数据存在异方差,则需对数据进行技术处理,直到处理后的数据的自相关函数值和偏相关函数值无显著地异于零。(III)根据时间序列模型的识别规则,建立相应的模型。表一 ARMA模型定阶的基本原则模型定阶AR(p)MA(q)ARMA(p,q)自相关系数(ACF)拖尾q阶截尾拖尾偏相关系数(PACF)p阶截尾拖尾拖尾(IV)进行参数估计,检验是否具有统计意义。(V)进行假

14、设检验,诊断残差序列是否为白噪声。(VI)利用已通过检验的模型进行预测分析。ARMA模型识别估计模型中未知参数的值模型检验模型优化预测序列将来的走势YNY获得观察值序列平稳性检验差分运算白噪声检 验拟合ARMA模型分析结束NY三 我国19522012年GDP建模及预测建模流程图:N3.1 平稳性检验由图一可得我国1952-2012年GDP时序图,其有明显呈指数攀升,显然也是不平稳的。为了建立模型以及后期预测更加准确,对数据进行自然对数化(取Ln值)。从图二可看出gdplog呈线性趋势递增,显然不平稳。图一 我国1952-2012年GDP时序图图二 我国1952-2012年gdplog时序图图三

15、 取对数化后一阶差分时序图图三为对自然对数化的数据进行的一阶差分,来消除序列中的随机趋势项或常数项,使得数据更加简单分析。通过时序图和后续的自相关系数图,偏自相关系数图以及白噪声检验,选择进行二阶差分。图四便是二阶差分后的时序图,其基本上在零值附近波动,再有图五的自相关系数图知,在一阶延迟时期后,自相关系数均处于二倍标准差范围内,而图六的偏自相关图除了1-3阶和6阶,之后的延迟阶数也处于二倍标准差范围内,暂且猜测二阶差分后是平稳的,当然还需要进行单位根检验。图四 二阶差分后的时序图图五 二阶差分后的自相关系数图图六 二阶差分后的偏自相关图由图七的ADF检验的Pr<Tau知,二阶差分后序列

16、平稳。图七 ADF检验图3.2 白噪声检验通过图八的白噪声检验结果,延迟阶数为6阶和12阶,卡方检验统计量的P值均小于0.05,可以断定序列值之间蕴含着相关关系,为非白噪声序列。图八 白噪声检验结果图3.3 模型的定阶通过图五自相关图和图六偏自相关图,对模型进行定阶,首先通过命令MINIC实现,由图九的最小信息量结果知,BIC信息量最小的为BIC(1,3),所以暂且认为ARIMA(1,2,3)为最优模型。图九 最小信息量输出结果之后对模型进行检验发现,估计参数不显著,也为通过残差自相关检验也未通过,之后进行了多个模型的测试,如表一:模型检验结果AICSBCARMA(1,3)参数估计均不显著,残

17、差自相关检验通过-120.044-111.667ARMA(1,2)参数估计均不显著,残差自相关检验通过-121.656-115.373ARMA(1,1)参数MA(1,1)显著,AR(1,1)不显著,残差自相关检验通过-123.373-119.184最终选择了MA(1)模型。3.4 模型的检验及拟合由图十的消除常数项后的参数估计结果知参数显著(<0.0001).图十 消除常数项后的参数估计结果图十一中延迟各阶的LB统计量的P值均大于(=0.05),所以该拟合模型成立。图十一 estimate命令输出的残差自相关检验结果拟合模型的具体形式为:最后得拟合模型口径为:2Lngdp=t-0.854

18、24t-1.图十二是拟合的difgdplog的实际值,预测值以及95%的置信区间,由图知,拟合效果很好,随着预测时期变长,预测误差越来越大,预测区间呈现为喇叭形。蓝色线为95%的置信区间,红线为预测值,星号表示实际值。而图十三为拟合的gdplog序列预测图,颜色表达同图十二。图十二 我国19522012年difgdplog序列预测图图十三 我国19522012年gdplog序列预测图3.5 预测及分析通过软件可得出gdplog的预测值,再进行数据还原可得20151019年的GDP预测值如下表:年份GDP预测值(单位:百万元)Gdplog预测值201571,228,24518.081432201

19、679,717,52418.194015201789,165,07618.306597201899,852,03518.4191802019111,752,81718.531762四 确定性分析:趋势拟合法根据我们做出的gdplog时序图可以看到,序列长期趋势呈现出线性特征。我们可以采用趋势拟合法,对序列进行预测,再与上述的MA(1)模型预测分析进行比较,选择出较为优秀的预测或模型。通过sas的forecast过程,主要程序如下:proc forecast data=sasuser.kcsjreg method=stepar trend=2 lead=7 out=out outfull out

20、est=est;其中“method=stepar”是指定先使用多项式拟合趋势,拟合好后,再对残差序列进行自回归拟合,然后通过逐步回归的方法,筛选合适的延迟阶数,得到最优AR模型。而trend=2是指序列有线性趋势。图十三显示的在拟合部分,每个时间变量下输出两个信息:观察值和预测值;在预测部分,每个时间变量下输出5个信息:观察值、预测值、残差、95%置信上下限。预测时期标示变量显示为0时,表明这是观察期;显示为1,2,3时,则分别表示这是第1,2,3期的预测信息。图十三 Forecast过程out命令输出数据集图而图十四显示的是预测过程中的相关参数及拟合效果,包括序列的基本信息、关于预测模型的参

21、数估计信息及拟合优度统计量信息。由图中CONSTANT为线性模型的常数估计值;LINEAR为线性模型的斜率;AR01AR13为残差自回归的参数估计值,判断残差序列为AR(2)模型。又由REQUARE,R2值为0.9973008,说明模型拟合很好。图十五是做出的预测模型效果图,红色线为拟合线,绿色为95%置信区间,星号代表实际值。也能说明拟合效果很好。图十四 Forecast过程outest命令输出数据集图示图十五 预测效果图五 20152019年的预测结果及结论ARIMA模型在2013及2014年的预测值、实际值及相对误差:实际值(单位:百万元)预测值(单位:百万元)相对误差201356,88

22、4,50057,148,4600.46%201463,646,30062,888,6341.19%逐步回归法在2013及2014年的预测值、实际值及相对误差:实际值(单位:百万元)预测值(单位:百万元)相对误差201356,884,50056,094,2091.39%201463,646,30060,356,4005.17%可见后者的相对误差较大,所以我们最终采用MA(1)模型来预测我国20152019年GDP,如下表:年份GDP预测值(单位:百万元)Gdplog预测值201571,228,24518.081432201679,717,52418.194015201789,165,07618.

23、306597201899,852,03518.4191802019111,752,81718.531762国内生产总值GDP是核算体系中一个重要的综合性统计指标,也是中国新国民经济核算体系中的核心指标。它反映一国(或地区)的经济实力和市场规模。一个国家或地区的经济究竟处于增长抑或衰退阶段,从这个数字的变化便可以观察到。从表中看出预计今年GDP会达到71.2282万亿,2014年中国GDP首破60万亿,同比增7.4%创1990年以来新低,从国家中国社会科学院2014年度创新工程重大科研成果经济蓝皮书:2015年中国经济形势分析与预测预计2015年中国GDP增长7. 0%左右,主要基于以下考虑:外

24、需难以显著提升,消费总体平稳,投资因制造业产能过剩及创新技术相对不足、房地产库存较高、基础设施投融资体制制约等因素而难以长期维持高速增长,且投资回报率在不断降低。改革开放以来,我国投资效果系数(即单位投资产生的GDP增加额)已经显著下降,19811996年年均为0.53,19972011年年均为0.26,20122014年年均仅为0.11。当前,投资对于稳增长仍起关键作用,但对经济增长的拉动效应在减弱。参考文献1王燕著.应用时间序列分析(第三版)M.北京:中国人民大学出版社,20122王成璋,尤梅芳等译.时间序列分析-预测与控制M.北京:机械工业出版社,20113李正辉,李庭辉.时间序列分析实

25、验M.北京:中国统计出版社,20104刘薇,基于时间序列模型的吉林省GDP预测分析D.东北师范大学,2008附录A 程序主要代码data sasuser.kcsj; input time gdp gdplog; difgdplog=dif(dif(gdplog); cards; ; run; proc print data=sasuser.kcsj; run; proc gplot data=sasuser.kcsj; plot gdplog*time; symbol c=black v=star i=join; run; proc arima data=sasuser.kcsj; ident

26、ify var=difgdplog(1,1) stationarity=(adf=3); run; proc arima data=sasuser.kcsj; identify var=difgdplog(1,1) minic p=(0:6) q=(0:6); run; proc arima data=sasuser.kcsj; identify var=difgdplog(1,1); estimate q=1 noint; forecast lead=5 id=time out=results; run; proc gplot data=results; plot difgdplog*tim

27、e=1 forecast*time=2 l95*time=3 u95*time=3/overlay; symbol1 c=black i=none v=star; symbol2 c=red i=join v=none; symbol3 c=blue i=join v=none; run; proc forecast data=sasuser.kcsjreg method=stepar trend=2 lead=7 out=out outfull outest=est; id time; var gdplog; run; proc gplot data=out; plot gdplog*time=_type_; symbol1 i=none v=star c=black; symbol2 i=join v=none

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论