时间序列期末论文_第1页
时间序列期末论文_第2页
时间序列期末论文_第3页
时间序列期末论文_第4页
时间序列期末论文_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ARIMA模型在全国年底总人口预测中的应用【摘要】:人口发展与社会经济的发展是密不可分的,研究我国总人口的现状,对我国人口数进行分析和预测,有利于及时控制人口的增长,调节人口平衡,利于政府及时了解发展趋势并做出反应对策,使我国人口发展步入健康的轨道。本文利用自回归移动平均模型(auto regressive moving average model,ARMA)及其建模原理和思路,并结合Eviews软件将ARMA模型应用于1980年2012年我国年底总人口数据序列的分析和预测。经检验此模型对原始数据有着较好的拟合度和较高的预测精度。利用此模型可对我国年底总人口进行合理的预测。【关键词】:时间序列

2、;ARMA模型;我国年底总人口;人口预测一、引言我国是世界上人口最多的国家,2008年末中国大陆人口13.28亿,占世界上五分之一人口,亚洲人口的三分之一。中国人口的发展同中国社会的发展一样经过了漫长而曲折的道路。在世纪的进程中,目前我国进入了一个全新的时代,要想在21世纪这个充满竞争与挑战的时代中变的富强、屹立于世界民族之林,全取决于人口的问题能否顺利解决,人口现状等问题,我国必须重视并根据其趋势做出反应对策。因此,认真分析我国当前人口现状,从中发现其变化的趋势,并对未来总人口进行短期预测,及时采取必要的政治及经济措施来解决人口发展问题,对树立未来的发展目标很有必要。总之,人口是构成社会的主

3、体,在我国社会主义现代化建设中,人口问题始终是极为重要的问题,而人口问题的本质是发展问题。人口发展与社会经济的发展也是密不可分的。基于此,我们利用时间序列中的ARMA模型对我国人口进行预测,对人口的控制起到指导作用,有利于政府采取必要的政治及经济措施来进行调控。所以,对其进行分析和测试是非常有意义的工作。二、模型简介自回归求和滑动平均模型(auto regressive integrated moving average model), 称为 ARIMA模型,是将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值进行回归所建立的模型。自回归移动平均过程,是由自回归

4、和移动平均两部分共同构造的随机过程,记为 ARMA(p,q)。其中 p、q 分别表示自回归分量和移动平均分量的最大滞后阶数。它的表达式为:当时间序列非平稳时,首先要通过差分或取对数使序列平稳后再建立时间序列模型。随机过程 若经过 d 次差分后可变换为一个平稳可逆的 ARMA(p,q),则称 为(p,d,q)阶单整自回归移动平均过程,记为ARIMA(p,d,q)。建立时间序列模型通常需要以下步骤:(1)数据预处理在建模之前首先进行平稳化检验,判断是否为平稳序列,可以通过相关图判断。如果一个随机过程是平稳的,则其自相关函数呈指数衰减或正弦衰减,而且衰减得快;相反,如果是非平稳过程,则衰减得很慢 。

5、 也可以用单位根检验,判断随机过程的平稳性。单位根检验是检验时序稳定性的一种正式的方法。若为非平稳序列,则通过差分变换、对数变换对数据进行平稳化、均值化处理。(2)模型的识别与定阶模型的识别主要依赖于对时间序列的相关函数(Autocorrelation Function,ACF)图与偏相关函数(Partial Autocorrelation Function,PACF)图的分析:ACF图表现为拖尾衰减特征,而 PACF 图在 p 期后出现截尾特征,则该过程适合 AR(p);ACF 图在 q 期后出现截尾特征,而 PACF 图表现为拖尾衰减特征,则该过程适合 MA(q);ACF 图与 PACF

6、图都呈拖尾衰减特征通过图形分析选择模型的形式并初步确定 p、q的值。同时利用赤池信息量准则(A-Information Criterion,AIC)和舒瓦兹准则(Schwarz Criterion,SC)对多种 ARMA(p,q)模型进行对比与筛选,选出最优的 ARMA(p,q)。(3)模型的参数估计对 AR(p)模型的参数进行最小二乘法估计,MA(q)和ARMA(p,q)采用迭代式的非线性最小二乘法进行估计。(4)模型的诊断与检验模型的诊断与检验包括被估参数的显著性检验和残差的随机性检验。如果估计的模型中的某些参数不能通过显著性检验,或者残差序列不能近似为一个白噪声序列,则需再次对模型进行识

7、别。(5)模型的预测通过对未来值进行预测,与预留的实际值进行比较,得到相对误差,从而进一步判断所拟合的模型的适合程度。三、文献综述经我们检索发现,目前尚无对我国20132015年底总人口(万人)的预测。四、实证分析(1)数据的收集本文以1980-2012年全国年底总人口数(万人)为样本,原始数据如下表所示:198098,7051990114,3332000126,7432010134,0911981100,0721991115,8232001127,6272011134,7351982101,6541992117,1712002128,4532012135,4041983103,0081993

8、118,5172003129,2271984104,3571994119,8502004129,9881985105,8511995121,1212005130,7561986107,5071996122,3892006131,4481987109,3001997123,6262007132,1291988111,0261998124,7612008132,8021989112,7041999125,7862009133,450表1 年底总人口数(万人)本文利用统计软件Eviews,对1980-2012年全国年底总人口数(万人)数据为样本,并用1980-2010年的数据建立ARIMA模型,预测

9、,预测2010-2015年的年底总人口数。2011-2012年的数据留作模型检验数据,用于跟预测值进行比较,评价预测的精度。(2)数据预处理将时间序列命名为y, 并使用统计软件Eviews对原始数据进行分析,作出该序列的时序图,如图1所示。图1. 年底总人口数(万人)时序图从图1中可以看出,年底总人口数随着时间增加的同时也在逐年上涨,有明显的上升趋势。因此,可以得出这列数据不平稳、方差也不平稳的结论。采用对数变换的方法,对原序列y做对数变换,即取=, 得到新的序列。利用统计软件Eviews,对新的序列做时序图和单位根检验,如图2、表2所示。图2. 序列 的时序图表2. 序列的单位根检验值由图2

10、可知,序列具有明显的上升趋势,不平稳。为进一步确定序列的平稳性,对序列进行单位根检验,由表2可知,序列在1%、5%的显著性水平下,ADF检验值为-2.863362,均大于1%、5%的显著性水平下的临界值。因此,接受存在单位根的结论,说明时间序列是不平稳的。尽管序列在显著性水平为10%时,ADF检验值小于临界值,但P值大于0.05,同样也说明了序列不平稳。结果与定性分析一致,即序列不平稳。因此,在建立模型之前,必须对该序列进行平稳化处理。此例中,我们可以用差分法来消除序列的趋势。一阶差分能够消除线性趋势, 二次差分能够消除二次曲线趋势。我们对序列进行二阶差分,得到新的序列,画出序列的时序图,如图

11、3所示。图3.序列的时序图由图3可以得出,通过对序列进行取对数、二阶差分处理,原始数据具有的趋势性已被消除,序列呈现出比较小的波动性,基本趋于平稳。为了使模型更加精确,进行进一步确定序列的平稳性,我们对该序列进行单位根检验,得到ADF检验结果见表3。表3.序列单位根检验结果由表2可知,序列在1%、5%以及10%显著性水平下,ADF检验值为-4.624002,均小于各显著性水平下的临界值,说明序列 为平稳序列。能够用序列来拟合模型。(3)模型的识别序列滞后18期的自相关和偏自相关函数图(图3)图3. 序列滞后16期的自相关和偏相关图由图3可以看出,该序列偏自相关函数呈现出拖尾性,自相关图呈现出截

12、尾性,初步判定该模型为ARIMA(0,2,1)模型。由于只是初步判定,且这个判断具有较大的主观性,所以不妨对该序列建立ARIMA(0,2,2)、ARIMA(1,2,2)等模型来综合比较比较三个模型的AIC和SC值。(4)模型的估计及检验运用最小二乘法估计,分别对序列进行MA(1)、ARIMA(0,2,2)、ARIMA(1,2,2)进行拟合估计。结果如表4、表5、表6所示。表4. ARIMA(0,2,1)模型估计表5. ARIMA(0,2,2)模型估计表6. ARIMA(1,2,2)模型估计对三个模型进行综合比较,ARIMA模型中的MA(2)的P值显著大于0.05,因此,MA(2)模型不显著。A

13、RIMA(1,2,2)模型的Adjusted R-squared为0.639770,明显高于ARIMA(0,2,1)模型,且该模型的AIC值、SC值均小于ARIMA(0,2,1)模型中对应的各值。但ARIMA(1,2,2)模型的DW值仅为1.741959,明显小于2。通过对比两个模型的Actual、Fitted、Residual Graph图以及Residual Graph图,发现ARIMA(1,2,2)模型的残差序列较ARIMA(0,2,2)有较大的波动。因此,认为ARIMA(0,2,1)模型能更好的拟合该序列。紧接着对残差序列进行白噪声的检验。根据模型ARIMA(0,2,1)对序列进行回归

14、拟合,如图4所示。模型的残差图如图5所示。图4. 模型拟合的折线图图5. 残差折线图从图4中可以得到,图中实际值与拟合值基本一致。从图5中可以看出,残差序列类似白噪声过程,较平稳,没有明显的趋势性,模型拟合效果比较好。对残差的自相关图和偏相关图进行分析,如图6所示。图6. 残差序列的ACF和PACF值由图可以得到,模型的残差并不存在相关序列。为进一步验证结论,对残差序列进行单位根检验,结果如表7所示。表7. 残差序列的单位根检验由表7可以得到,残差序列的ADF检验值为-5.880284,明显小于显著性水平为1%、5%、10%的临界值,因此序列在1%、5%、10%的显著水平下通过检验,被看作是白

15、噪声序列。因此,最终选定ARIMA(0,2,1)为模型对序列进行描述。模型的形式为:。(5)模型的预测运用统计软件Eviews,对拟合模型后的序列进行预测,预测图如图7、图8所示。图7. 模型的动态预测图图中实线代表的是YF的预测值,两条虚线则提供了2倍标准差的置信区间。实际值处于2倍标准差之内。图的右侧给出的是评价预测的一些标准,例如平均预测误差平方和的平方根(RMSE),Theil不相等系数及其分解等。图8. 模型的静态预测图从图8的预测的评价标准中,可以看到,Theil不相等系数为0.000290,非常小。综合其他标准,可以得到,静态得到的预测效果较好。通过静态预测,将2011-2012

16、年的真实值与预测值进行比较,求出预测误差。如表8所示。真实值预测值预测误差20111347351347070.000207820121354041354090.0000369表8.真实值与预测值的比较通过计算出的预测误差,可以知道预测值与实际值是很接近的说明该模型的预测精度比较高,模型用于短期的预测效果是较好的。通过模型的动态预测对20132015年年底总人口数预测,可以得到表9。年份预测值年份预测值年份预测值201315540420141575562015159738表9.2013-2015 年预测值从预测结果可以看出,年底总人口随着时间的增长,仍然保持持续上升的趋势。五、结论一、运用ARIMA 模型进行建模和预测, 并对我国总人口这一组真实数据进行了时间序列分析。分析结果说明,用ARIMA 模型对我国总人口进行建模预测是可行且可靠的,可对我国年底总人口进行合理的预测,有利于政府采取必要的政治及经济措施来进行调控,对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论