基于时间序列分析的江苏省CPI预测模型_第1页
基于时间序列分析的江苏省CPI预测模型_第2页
基于时间序列分析的江苏省CPI预测模型_第3页
基于时间序列分析的江苏省CPI预测模型_第4页
基于时间序列分析的江苏省CPI预测模型_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 南京理工大学课程考核论文课程名称: 应用时间序列分析 论文题目:基于时间序列分析的江苏省 CPI预测模型 姓 名: 孙晗 学 号: 115113001152 成 绩: 任课教师评语: 签名: 年 月 日摘要所谓时间序列,就是按照时间的顺序记录的一列有序数据。时间序列预测方法则是通过时间序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来做出预测。传统的时间序列分析方法在经济中的应用主要是确定性的时间序列分析方法,包括指数平滑法、移动平均法、时间序列的分解等等。随着社会的发展,许多不确定因素在经济生活中的影响越来越大,必须引起人们的重视。在日常生产、生活中,时间序列

2、比比皆是,时间序列分析的应用领域非常广泛。本人就是基于时间序列理论,以江苏省1994至2012年居民消费价格指数(CPI)的月度数据,运用Eviews软件建立一个乘积季节模型,并对数据进行平稳化处理、模型识别、参数估计,对江苏省未来的居民消费价格指数(CPI)进行合理的预测。关键词:时间序列 居民消费价格指数 SARIMA模型 GARCH模型Abstract The so-called time series, is in accordance with the order of the time recorded in a sequence of data. Time series fore

3、casting method is the historical data of time series to reveal the phenomenon of the time variation of the law, will this rule to the future, so as to predict the future of the phenomenon. Application of traditional time series analysis method in economyTime series analysis method, including exponen

4、tial smoothing method, moving average method, time series decomposition and so on. With the development of the society, many uncertain factors have become more and more important in the economic life. In daily production, life, time series are found everywhere, the application of time series analysi

5、s is very extensive.I am based on the theory of time series, the monthly data of the consumer price index (CPI) of Jiangsu province from 1994 to 2012, using Eviews software to establish a product seasonal model, and to carry out the data processing, model identification, parameter estimation, Jiangs

6、u Province in the future of consumer price index (CPI) for a reasonable forecast.KEY WORDS:Time series, Consumer Price Index , SARIMAmodel , GARCHmodel目录摘要2Abstract3一:引言51.1 CPI概述及其分析预测原因51.2时间序列分析简述51.3本文的主要工作5二:时间序列分析基本方法62.1 时间序列分析的预处理62.1.1 差分运算62.1.2 平稳性检验62.2 平稳时间序列基本模型72.2.1 自回归模型(AR)72.2.2 移

7、动平均模型(MA)82.2.3 自回归滑动平均模型(ARMA)82.3 非平稳时间序列ARIMA建模步骤92.3.1 数据平稳化处理92.3.2 模型识别92.3.3 参数估计92.3.4 模型检验9三:基于时间序列分析的CPI预测实例分析103.1 CPI时间序列分析103.1.1 平稳化检查103.1.2 平稳化处理113.2 时间序列模型的建立133.2.1 模型识别133.2.2 模型参数估计与建立143.2.3 模型检验163.3 CPI短期预测和不足17结 论19参 考 文 献20一:引言1.1 CPI概述及其分析预测原因居民消费价格指数(CPI)是用来测定一定时期内居民支付所消费

8、商品和服务价格变化程度的相对对数指标。它既是反映通货膨胀程度的重要指标,也是国民经济核算中的缩减指标。一般说来,当CPI>3% 的增幅时,我们称为通货膨胀;而当CPI>5% 的增幅时,我们把它称为严重的通货膨胀。居民消费价格指数反映的市场价格信号真实带动价格舆论导向正确,有利于改善价格总水平调控。首先,它有利于维护正常的经济生活和市场价格信息秩序。其次,有利于引导消费形成合理的消费价格,促进有效需求。再次,它有利于综合运用价格和其他经济手段,实现价格总水平调控目标。所以,对该指标的分析与预测是非常有意义的工作。本文以江苏省1994-2012年的CPI数据为例,利用时间序列分析方法,

9、建立时间序列模型,并对未来三年消费价格指数做出预测,为宏观经济分析和决策提供依据。1.2时间序列分析简述时间序列是按时间顺序的一组数字序列。时间序列分析就是利用这组数列,应用数理统计方法加以处理,以预测未来事物的发展。时间序列分析是定量预测方法之一,它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推测事物的发展趋势。二是考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。该方法简单易行,便于掌握,但准确性差,一般只适用于短期预测。时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化。时间序列分析的基本模型有:A

10、RMA模型、ARIMA模型和GARCH模型。时间序列分析预测法,首先将预测目标的历史数据按照时间先后的顺序排列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅助信息。1.3本文的主要工作选取1994年1月到2012年3月江苏省居民消费价格指数作为数据,运用时间序列分析,对数据进行模型识别、参数估计和模型检验,应用选定时间序列方法预测未来CPI,并讨论此时间序列类型、误差的主要来源。二:时间序列分析基本方法2.1 时间序列分析的预处理2.1.1 差分运算一阶差分 Xt=

11、Xt-Xt-1P阶差分 pXt=p-1Xt-p-1Xt-1k步差分 k=Xt-Xt-k 差分方法是一种非常简便、有效的确定性信息提取方法,Cramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息。差分运算的实质是使用自回归的方式提取确定性信息dXt=1-BdXt=i=0d-1iCdiXt-i 差分方式的选择: 序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳。 序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响。对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息。2.1.2 平稳性检验平稳性是某些时间序列具有的一种统计特

12、征。对于平稳的序列我们就可以运用已知的时间序列模型对其进行分析预测。因此对数据进行平稳性检验是时间序列分析法的关键步骤。平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列。 对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。通常我们都选用图检验方法检验序列平稳性并用单位根统计检验法加以辅助。(1)自相关图法自相关函数和偏自相关函数的定义:构成时间序列的每个序列值Xt,Xt-1,Xt-k 之间的简单相关关系称为自相关。自相关程度由自相关系数rk度量,表示时间序列中相隔k期的观测值之间的相

13、关程度。rk=t=1n-kXt-XXt+k-Xt=1nXt-X2 (2-1)其中,n是样本量,k为滞后期,x代表样本数据的算术平均值。自相关系数rk的取值范围是-1,1并且rk越小,自相关程度越高。偏自相关是指对于时间序列Xt,在给定Xt-1,Xt-2,Xt-k+1的条件下,Xt与Xt-1之间的条件相关关系。其相关程度用偏自相关系数kk度量,有-1kk1。11=r1kk=rk-i=1k-1k-1,i.rk-i1-i=1k-1i,i.rik=2,3,k,i=k-1,i-kkk-1,i-1(i=1,2,k-1) 其中rk是滞后k期的自相关系数。如果序列的自相关系数很快地(滞后阶数k大于2或3时)趋

14、于0,即落入随机区间,时间序列是平稳的,反之时间序列是非平稳。若有更多的自相关系数落在随机区间以外,即与零有显著不同,时间序列就是不平稳的。自相关图法仅从直观的判断平稳时间序列与非平稳时间序列的区别。也可用以下的方法在理论上检验。(2) 单位根检验法时间序列的平稳性还可以通过单位根检验来判断,单位根检验目前常用的两种方法是DF和ADF。2.2 平稳时间序列基本模型平稳时间序列分析模型分为三种类型:自回归模型(AR) 移动平均模型(MA)自回归移动平均模型(ARMA)2.2.1 自回归模型(AR)如果一个随机过程可表达为Xt=1Xt-1+2Xt-2+pXt-p+t 其中i,i=1,2,p 是自回

15、归参数,t是白噪声过程,则称Xt为p阶自回归过程,用ARp表示。Xt是由它的p个滞后变量的加权和以及t相加而成。若用滞后算子表示1-1L-2L2-pLpXt=LXt=t 其中L=1-1L-2L2-pLp称为特征多项式或自回归算子。与自回归模型常联系在一起的是平稳性问题。对于自回归过程ARp,如果其特征方程:L=1-1L-2L2-pLp=1-G1L1-G2L1-GPL=0的所有根的绝对值都大于1,则ARp是一个平稳的随机过程。2.2.2 移动平均模型(MA)如果一个线性随机过程可用下式表达Xt=t+1t-1+2t-2+qt-q=1+1L+2L2+qLqt =Lt 其中1,2,q是回归参数,t为白

16、噪声过程,则上式称为q阶移动平均过程,记为MAq 。之所以称“移动平均”,是因为Xt是由q+1个t和t滞后项的加权和构造而成。“移动”指t的变化,“平均”指加权和。注意:(1)由定义知任何一个q阶移动平均过程都是由q+1个白噪声变量的加权和组成,所以任何一个移动平均过程都是平稳的。(2)与移动平均过程相联系的一个重要概念是可逆性。移动平均过程具有可逆性的条件是特征方程L=1+1L+2L2+qLq=0的全部根的绝对值必须大于1。 2.2.3 自回归滑动平均模型(ARMA)由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMAp,q, 其中p,q别表示自回归和移动平均部分的

17、最大阶数。ARMAp,q的一般表达式是Xt=1Xt-1+2Xt-2+pXt-p+t +1t-1+2t-2+qt-q即1-1L-2L2-pLpXt=1+1L+2L2+qLqt或LXt=Lt 其中L和L分别表示L的p,q阶特征多项式。表2-1 ARMA模型特征模型自相关系数偏自相关系数ARp拖尾阶截尾MAq阶截尾拖尾ARMAp,q拖尾拖尾2.3 非平稳时间序列ARIMA建模步骤2.3.1 数据平稳化处理首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对序列进行初步的平稳性判断。对非平稳的时间序列,我们可以先对数据进行取对数或进行差分处理,然后判断经处理后序列的平稳性。重复以上过

18、程,直至成为平稳序列。此时差分的次数即为ARIMAp,d,q模型中的阶数d。从理论上而言,足够多次的差分运算可以充分地提取序列中的非平稳确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。因为差分运算是一种对信息的提取、加工过程,每次差分都会有信息的损失,所以在实际应用中差分运算的阶数要适当,应当避免过度差分,简称过差分的现象。数据平稳化处理后,ARIMAp,d,q模型即转化为ARMAp,q模型。2.3.2 模型识别我们引入自相关系数和偏自相关系数这两个统计量来识别ARMAp,q模型的系数特点和模型的阶数。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合AR模型;若平

19、稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合MA模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合ARMA模型。自相关函数成周期规律的序列,可选用季节性乘积模型。自相关函数规律复杂的序列,可能需要作非线性模型拟合。2.3.3 参数估计确定模型阶数后,应对ARMA模型进行参数估计。本文采用最小二乘法进行参数估计。2.3.4 模型检验完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用的模型是否合适。若不合适,应该知道下一步作何种修改。这一阶段主要检验拟合的模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否为白噪声。

20、三:基于时间序列分析的CPI预测实例分析下面以江苏省1994年1月到2012年3月居民消费价格指数数据为例,介绍用时间序列分析法对数据分析的过程,并通过其预测2012年1月,2月,3月的CPI与实际的CPI比较,选取最为合理的预测方法对未来CPI做出预测。(单位:%)1994年1月2012年3月江苏省居民消费价格指数1月2月3月4月5月6月7月8月9月10月11月12月1994年123.9125.9122.6121.4119.8120.6122.3123.4125.5125.6124.9121.61995年120.8119.6119.1118.1118.4117.4115.4113.1112.

21、5112.1111.61121996年112.6111.9111.8111.5109.9108.9109.3109.2107.6106.9106.6105.51997年104.2104.3103.1103102.4101.8101100.8100.9100.199.799.41998年99.599.5100.499.599.4999999.699.299.499.599.21999年98.998.898.197.697.998.799.398.998.999.399.299.32000年100.4101.4100.4100.199.799.699.799.499.599.4100.3100.7

22、2001年101.6100.4101101.9102101.4101.4101.2100.310099.499.32002年99.299.999.398.69999.599.399.499.19999.199.42003年100100.2100.6100.7100.199.6100.3101101.2102.2103.2103.22004年103.2102.4103.6104.3105.1105.6105.3105.5105.1104.1102.5102.12005年102.2104.4103102101.5101.4101.8101.3101.4102.1102102.32006年102.5

23、101.2100.9101.4101.5101.4101.3101.5101.3101102103.12007年102102102.5102.7103.1104105.2106105.9106.2106.5105.62008年106.1107.7107.7107.6107.1106.9106104.6104.3103.5101.9101.42009年101.499.599.698.998.898.39898.899.399.6100.6102.12010年101.7102.4102.4103.2103.7103.5104.1103.9104.6105.2106.11052011年105.110

24、5.7105.6105.3105.7106.9106.4106105.4104.8103.5103.62012年103.9102.9103.53.1 CPI时间序列分析3.1.1 平稳化检查首先我们绘制CPI的时间序列图, 从图3-1可以看出具有很明显的下降趋势和周期性,所以通常是非平稳的。图3-13.1.2 平稳化处理其次在绘制自相关图和偏自相关图,从图3-2可以发现序列的自相关系数递减到零的速度相当缓慢。是非平稳序列的一种典型的自相关图。 图3-2为了能够对序列进行分析,要使其平稳化。故将选择两种方法:取对数法和差分法,对序列进行平稳化处理,从而进一步分析预测。对数据做1阶12步差分DX=

25、D(x,1,12)得到时序图3-3:图3-3由该时序图我们基本可以认为其是平稳的。再做DX自相关图和偏自相关图3-4。图3-4自相关图显示延迟12阶自相关系数显著大于2倍标准差范围。说明差分后序列中仍蕴含着非常显著的季节效应。残差通不过白噪声检验。3.2 时间序列模型的建立3.2.1 模型识别差分运算具有强大的确定性信息提取能力,许多非平稳序列差分后会显示出平稳序列的性质,这时我们称这个非平稳序列为差分平稳序列。对差分平稳序列可以使用ARIMA模型进行拟合。但是,本文中的1994-2012年江苏省居民消费价格指数时间序列的季节效应、长期趋势和随机波动之间有着复杂的相互纠缠关系,简单的ARIMA

26、模型并不足以提取其中的相关关系,这时通常需要采用乘积模型SARIMA。乘积模型的构造原理如下:当序列具有短期相关性时,通常可以使用低阶ARMAp,q模型提取。当序列具有季节效应,季节效应本身还具有相关性时,季节相关性可以使用以周期步长为单位的ARMAP,Q模型提取。由于短期相关性和季节效应之间具有乘积关系,所以拟合模型实质为ARMAp,q和ARMAP,Q的乘积。综合前面的d阶趋势差分和D阶以周期S为步长的季节差分运算,对原观察值序列拟合的乘积模型完整的结构如下:dDxt=LLSLSLt式中,L=1+1L+2L2+qLq,L=1-1L-2L2-pLp,SL=1+1L+2L2+qLQS,L=1-1

27、L-2L2-pLPS,该乘积模型简记为ARIMAp,d,p×P×D×Q。3.2.2 模型参数估计与建立对上述的平稳非白噪声差分序列拟合,普通最小二乘法下,输入D(X,1,12) AR(1) MA(1) SAR(12) SMA(12) ,得到如下图3-5,其中,所有的参数估计量的P值小于0.05,均显著。AIC为1.896653,SC为1.964273 。图3-5普通最小二乘法,输入D(X,1,12)AR(1)MA(1)SAR(12)SAR(24)SMA(12),得到如下图3-6,其中,所有的参数估计量的P值小于0.05,均显著。AIC为1.640316,SC为1.

28、728672 。比较这两个模型,因为第二个模型的SC值小于第一个模型的SC值,所以相对而言,第二个模型是最优模型。模型结果为:1-B1-B12Xt=1-0.815424B1-0.950372B×1-0.913741B121+0.699593B12+0.457944B24t对残差序列进行检验,结果如下图3-6。图3-6可以看出,在原假设为残差序列为随机的情况下,拟合统计量的P值大多显著小于显著性水平0.05,可以认为该残差序列是非随机的,不是白噪声序列,表明残差中仍存在有用信息未被提取。所以,尽管各个参数均显著,但残差序列非随机,用SARIMA模型对原序列建模不是很合适,这是该模型拟合

29、的不足之处。3.2.3 模型检验将序列拟合值和序列观察值联合作图,可以直观地看出该乘积模型对原序列的拟合效果,如图3-7。图3-7对残差平方进行检验,结果如下图3-8。图3-8显然在同方差的假设下,P值小于显著性水平0.05,说明残差序列存在异方差性。3.3 CPI短期预测和不足采用1994-2011年居民消费价格指数的时间序列,预测2012年1月,2月和3月的居民消费价格指数,然后与上表真实值进行比较,看模型拟合效果。2012年1月的CPI预测值为103.8939,2012年2月的CPI预测值为103.4470,2012年3月的CPI预测值为103.4427,而真实值为103.9,102.9,103.5,可以看出,1月和3月的预测值与真实值较相近,而2月的相差0.5。总之,预测结果的误差不算很大,总体来说该模型预测江苏省居民消费价格指数是比较有效的。该模型只考虑了时间序列本身的特性,而没有考虑其他一些不确定因素对居民消费价格指数的影响,因此这些因素在SARIMA模型中是以随机误差项来反映的,该模型仅适合短期预测。但是SARIMA模型也有它的局限性, 如在使用该模型时本人假设残差检验通过了白噪声检验, 在这过程中其实是假定了残差是同方差的, 但实际中残差却经常是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论