基于时间序列模型的gdp预测_第1页
基于时间序列模型的gdp预测_第2页
基于时间序列模型的gdp预测_第3页
基于时间序列模型的gdp预测_第4页
基于时间序列模型的gdp预测_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 基于时间序列模型的 GDP 预测 摘 要 国内生产总值(GDP)是现代国民经济核算体系的核心指标,是衡量一个国家综合国 力的重要指标。国内生产总值(Gross Domestic Product)是指在一定时期内(一个季度或 一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,它反映国家 和地区的经济发展及人民生活水平,常被公认为衡量国家经济状况的最佳指标。这个 指标把国民经济全部活动的产出成果概括在一个极为简明的统计数字之中,为评价和 衡量国家经济状况、经济增长趋势及社会财富的经济表现提供了一个最为综合的尺度。 可以说,它是影响经济生活乃至社会生活的最重要的经济指标。对其进行分

2、析及时准 确的预测具有重要的理论与现实意义。 时间序列是指同一空间、不同时间某一现象的统计指标数值按时间先后顺序形成 的一组动态序列。时间序列预测方法则是通过时间序列的历史数据揭示现象随时间变 化的规律,将这种规律延伸到未来,从而对该现象的未来做出预测。传统的时间序列 分析方法在经济中的应用,主要是确定性的时间序列分析方法,包括指数平滑法、移 动平均法、时间序列的分解等等。随着社会的发展,许多不确定因素在经济生活中的 影响越来越大,必须引起人们的重视。1970 年,Box 和 Jenkins 提出了以随机理论为基 础的时间序列分析方法,使时间序列分析理论上升到了一个新的高度,预测的精度大 大提

3、高。时间序列分析的基本模型有:模型和模型。 ARMAARIMA 本文基于时间序列理论,以我国 1978 年至 2007 年三十年的国内生产总值为基础, 对数据进行平稳化处理、模型识别、参数估计,建立时间序列模型,并对模型进行检 验,确定较适合模型为自回归移动平均模型。利用模型对1,2,2ARIMA1,2,2ARIMA 我国 20062007 年 GDP 作出预测并与实际值比较,结果表明相对误差均在 3%之内, 预测模型良好,继续利用模型对我国未来 5 年的国内生产总值做出预测。1,2,2ARIMA 关键词:时间序列,国内生产总值,模型,模型ARMAARIMA II Time Series Mo

4、del for Forecasting GDP ABSTRACT Gross domestic product (GDP) is the modern heart of the System of National Accounts indicators,is a measure of a country an important indicator of overall national strength.GDP is defined as a certain period of time (one quarter or year),a country or regions economy

5、in the production of all final goods and services of value,it reflects the national and regional economic development and peoples living standards,a measure of a nation is often regarded as the best indicator of economic conditions.This indicator in all the activities of the national economys output

6、 results in a very concise summary of the statistics,and to evaluate and measure the national economic situation,economic growth trends and the economic performance of the wealth of society provides a most comprehensive scale,it can be said It is the impact of economic life and social life as well a

7、s the most important economic indicators. Analysis of timely and accurate forecasts of great theoretical and practical significance. Time series refers to the same space at different times of the statistical indicators of a phenomenon of the time sequence of values formed by a group of dynamic seque

8、nces.The predicting way of time series is achieved by exploring the laws that phenomenal change with time,in the historical statistics of time series.Time series extend the laws to the future so as to predict the future of a phenomenon.The traditional analytical method of time series analysis applie

9、d in economy is mainly the analytical method of time series in a fixed time,such as Exponential Smoothing method,Moving Average method,Decomposition of the time series and so on.With the development of society,many uncertain elements impose influences on economy,which should be attached importance t

10、o people.In 1970,Box and Jenkins proposed an analytical method of time series based on random theory which not only takes the theory of time series analysis to a new level but also promotes the preciseness of prediction.The basic analytical models of time series are model and model.ARMAARIMA Based o

11、n time series theory to China from 1978 to 2007 the gross domestic product of three decades, based on the smooth of the data processing, model identification, parameter estimation, establish a time series model, and model testing, to determine more suitable model for autoregressive moving average mo

12、del . Model of Chinas GDP forecast for 1,2,2ARIMA 2006-2007 and compared with the actual values, results showed that the relative error of 3%, the prediction model a good model to continue to forecast the gross domestic product of China in the next 5 years. KEY WORDS:Time series,Gross domestic produ

13、ct, model, model ARMAARIMA 目 录 摘 要 .I ABSTRACT .II 1 引言 .1 1.1 GDP 概述及其分析预测原因 .1 1.2 时间序列分析法简述 .2 1.3 本文的主要工作 .3 2 时间序列分析基本方法 .4 2.1 时间序列分析的预处理 .4 2.1.1 差分运算 .4 2.1.2 平稳性检验 .4 2.2 时间序列基本模型 .6 2.2.1 自回归模型 .6 2.2.2 移动平均模型 .7 2.2.3 自回归滑动平均模型 .7 2.3 ARIMA 模型建模步骤 .8 2.3.1 数据平稳化处理 .8 2.3.2 模型识别 .8 2.3.3 参

14、数估计 .9 2.3.4 模型检验 .9 3 基于时间序列模型的 GDP 预测实例分析 .10 3.1 我国 GDP 时间序列分析 .10 3.1.1 平稳性检查 .10 3.1.2 平稳化处理 .11 3.2 时间序列模型的建立 .13 3.2.1 模型识别 .13 3.2.2 模型参数估计与建立 .15 3.2.3 模型检验 .16 3.3 我国 GDP 短期预测及分析 .18 结 论 .19 致 谢 .20 参 考 文 献 .21 基于时间序列模型的 GDP 预测1 1 引言 1.1 GDP 概述及其分析预测原因 国内生产总值 (Gross Domestic Product,简称 GDP

15、)是指在一定时期内 (一个季 度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常 被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可 以反映一国的国力与财富。 一般来说,国内生产总值共有四个不同的组成部分,其中包括消费、私人投资、 政府支出和净出口额。用公式表示为:。式中:为消费、GDPCAICBXCA 为私人投资、为政府支出、为净出口额。ICBX 一个国家或地区的经济究竟处于增长抑或衰退阶段,从这个数字的变化便可以 观察到。一般而言, GDP 公布的形式不外乎两种,以总额和百分比率为计算单位。 当 GDP 的增长数字处于正数时,即显示该地区经济处于

16、扩张阶段;反之,如果处 于负数,即表示该地区的经济进入衰退时期了。国内生产总值是指一定时间内所生 产的商品与劳务的总量乘以 “货币价格”或“市价”而得到的数字,即名义国内 生产总值,而名义国内生产总值增长率等于实际国内生产总值增长率与通货膨胀率 之和。因此,即使总产量没有增加,仅价格水平上升,名义国内生产总值仍然是会 上升的。在价格上涨的情况下,国内生产总值的上升只是一种假象,有实质性影响 的还是实际国内生产总值变化率,所以使用国内生产总值这个指标时,还必须通过 GDP 缩减指数,对名义国内生产总值做出调整,从而精确地反映产出的实际变动。 因此,一个季度 GDP 缩减指数的增加,便足以表明当季

17、的通货膨胀状况。如果 GDP 缩减指数大幅度地增加,便会对经济产生负面影响,同时也是货币供给紧缩、 利率上升、进而外汇汇率上升的先兆。 一国的 GDP 大幅增长,反映出该国经济发展蓬勃,国民收入增加,消费能力 也随之增强。在这种情况下,该国中央银行将有可能提高利率,紧缩货币供应,国 家经济表现良好及利率的上升会增加该国货币的吸引力。反过来说,如果一国的 GDP 出现负增长,显示该国经济处于衰退状态,消费能力减低时,该国中央银行 将可能减息以刺激经济再度增长,利率下降加上经济表现不振,该国货币的吸引力 也就随之而减低了。因此,一般来说,高经济增长率会推动本国货币汇率的上涨, 而低经济增长率则会造

18、成该国货币汇率下跌。例如,1995-1999 年,美国 GDP 的 年平均增长率为 4.1%,而欧元区 11 国中除爱尔兰较高外 (9.0%),法、德、意等主 要国家的 GDP 增长率仅为 2.2%、1.5%和 1.2%,大大低于美国的水平。这促使欧 元自 1999 年 1 月 1 日启动以来,对美元汇率一路下滑,在不到两年的时间里贬值 陕西科技大学毕业论文2 了 30%。但实际上,经济增长率差异对汇率变动产生的影响是多方面的: 一是一国经济增长率高,意味着收入增加,国内需求水平提高,将增加该国的 进口,从而导致经常项目逆差,这样,会使本国货币汇率下跌。 二是如果该国经济是以出口导向的,经济增

19、长是为了生产更多的出口产品,则 出口的增长会弥补进口的增加,减缓本国货币汇率下跌的压力。 三是一国经济增长率高,意味着劳动生产率提高很快,成本降低改善本国产品 的竞争地位而有利于增加出口,抑制进口,并且经济增长率高使得该国货币在外汇 市场上被看好,因而该国货币汇率会有上升的趋势。 在美国,国内生产总值由商务部负责分析统计,惯例是每季估计及统计一次。 每次在发表初步预估数据 (The Preliminary Estimates)后,还会有两次的修订公布 (The First Revision & The Final Revision),主要发表时间在每个月的第三个星期。 国内生产总值通常用来跟去

20、年同期作比较,如有增加,就代表经济较快,有利其货 币升值;如减少,则表示经济放缓,其货币便有贬值的压力。以美国来说,国内生 产总值能有 3%的增长,便是理想水平,表明经济发展是健康的,高于此水平表示 有通货压力;低于 1.5%的增长,就显示经济放缓和有步入衰退的迹象。 国内生产总值(GDP)是指一个国家或地区所有常住单位在一定时期内生产活动 的最终成果。这个指标把国民经济全部活动的产出成果概括在一个极为简明的统计数 字之中,为评价和衡量国家经济状况、经济增长趋势及社会财富的经济表现提供了一 个最为综合的尺度,可以说,它是影响经济生活乃至社会生活的最重要的经济指标。 对其进行的分析预测具有重要的

21、理论与现实意义。 本文以我国为例,利用时间序列分析方法,建立我国 GDP 时间序列模型,分析经 济增长的内在特征。并对未来五年我国经济发展做出预测,为政府制定经济发展战略 提供依据。 1.2 时间序列分析法简述 客观现象都是处在不断发展变化之中,对现象发展变化的规律,不仅要从内部结 构、相互关联去认识,而且还应随时间演变的过程去研究,这就需要运用时间序列分 析方法。 时间序列分析是一种广泛应用的数量分析方法,它主要用于描述和探索现象随时间发 展变化的数量规律。 时间序列分析 (Time series analysis)是一种动态数据处理的统计方法。该方法 基于随机过程理论和数理统计学方法,研究

22、随机数据序列所遵从的统计规律,以用 于解决实际问题。它包括一般统计分析 (如自相关分析,谱分析等 ),统计模型的 建立与推断,以及关于时间序列的最优预测、控制与滤波等内容。经典的统计分 析都假定数据序列具有独立性,而时间序列分析则侧重研究数据序列的互相依赖关 基于时间序列模型的 GDP 预测3 系。后者实际上是对离散指标的随机过程的统计分析,所以又可看作是随机过程统 计的一个组成部分。 时间序列是按时间顺序的一组数字序列。时间序列分析就是利用这组数列,应 用数理统计方法加以处理,以预测未来事物的发展。时间序列分析是定量预测方法 之一,它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推

23、测事物 的发展趋势。二是考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响, 为此要利用统计分析中加权平均法对历史数据进行处理。该方法简单易行,便于掌 握,但准确性差,一般只适用于短期预测。时间序列预测一般反映三种实际变化规 律:趋势变化、周期性变化、随机性变化。 时间序列预测方法则是通过时间序列的历史数据揭示现象随时间变化的规律,将 这种规律延伸到未来,从而对该现象的未来做出预测。传统的时间序列分析方法在经 济中的应用,主要是确定性的时间序列分析方法,包括指数平滑法、滑动平均法、时 间序列的分解等等。随着社会的发展,许多不确定因素在经济生活中的影响越来越大, 必须引起人们的重视。197

24、0 年,Box 和 Jenkins 提出了以随机理论为基础的时间序列分 析方法,使时间序列分析理论上升到了一个新的高度,预测的精度大大提高。 时间序列分析的基本模型有:模型和模型。时间序列分析预测法,ARMAARIMA 首先将预测目标的历史数据按照时间先后的顺序排列,然后分析它随时间的变化趋势 及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别 在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅 助信息。 1.3 本文的主要工作 从中国统计年鉴 2008中选取我国 1978 年 2007 年共 30 年的 GDP 作为数据, 运用时间序列分析的基

25、本的分析方法随机时序分析,进行模型识别、参数估计和模型 检验,应用选定时间序列方法预测未来 GDP,并讨论此时间序列类型、误差的主要来 源。 陕西科技大学毕业论文4 2 时间序列分析基本方法1 2.1 时间序列分析的预处理 2.1.1 差分运算 一阶差分 1ttt XXX 阶差分 p 11 1 ppp ttt XXX 步差分 k k tt k XX 差分方法是一种非常简便、有效的确定性信息提取方法,Cramer 分解定理在理论 上保证了适当阶数的差分一定可以充分提取确定性信息。差分运算的实质是使用自回 归的方式提取确定性信息: 0 11 i d d di ttdt i i XBXC X 差分方

26、式的选择: 序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳。 序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响。 对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周 期信息。 2.1.2 平稳性检验 平稳性是某些时间序列具有的一种统计特征。对于平稳的序列我们就可以运用已 知的时间序列模型对其进行分析预测。因此对数据进行平稳性检验是时间序列分析法 的关键步骤。平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间 序列和宽平稳时间序列。 对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出 判断的图检验方法;一种是构

27、造检验统计量进行假设检验的方法。通常我们都选用图 检验方法检验序列平稳性并用单位根统计检验法加以辅助。 (1) 自相关图法 自相关函数和偏自相关函数的定义:构成时间序列的每个序列值, 1 , ttt k XXX 之间的简单相关关系称为自相关。自相关程度由自相关系数度量,表示时间序列中 k r 相隔期的观测值之间的相关程度。k 基于时间序列模型的 GDP 预测5 (2-1) 1 2 1 n k tt k t kn t t XXXX r XX 其中,是样本量,为滞后期,代表样本数据的算术平均值。自相系数的取nkX k r 值范围是并且越小,自相关程度越高。偏自相关是指对于时间序列,在给1,1 k

28、r t X 定的条件下,与之间的条件相关关系。其相关程度用偏自相 121 , ttt k XXX t X t k X 关系数度量,有。 kk 11 kk (2-2) 111 1 1, 1 1 , 1 ,1,1,1 ,2,3, 1 ,1,2,1 k kkik i i kkk i ii i k ikikkki r rr k r ik 其中是滞后期的自相关系数。 k rk 如果序列的自相关系数很快地(滞后阶数大于 2 或 3 时)趋于 0,即落入随机区间,k 时间序列是平稳的,反之时间序列是非平稳。若有更多的自相关系数落在随机区间以 外,即与零有显著不同,时间序列就是不平稳的。 自相关图法仅从直观的

29、判断平稳时间序列与非平稳时间序列的区别。也可用以下 的 方法在理论上检验。 (2) 单位根检验法 时间序列的平稳性还可以通过单位根检验来判断,单位根检验目前常用的两种方 法是 DF 和 ADF。DF 检验法是 Dickey 和 Fuller 在 70 年代和 80 年代的一系列文章中 建立的。其基本思想是:一阶回归模型中,时,序列是平稳的。 1ttt XX 1 t X 若,则序列是非平稳的,存在单位根,通过检验是否可能为 1,判断序列是否1 平稳序列。DF 检验的假设是。 0 1H: (a) DF 检验 序列有如下三种形式: 不包含常数项和线性时间趋势项 (2-3) 1ttt XX 包含常数项

30、 陕西科技大学毕业论文6 (2-4) 1ttt XcX 包含常数项和线性时间趋势项 (2-5) 1ttt XctX 其中,。检验假设为:1rp 0 0H: 1 0H: 序列存在单位根的零假设下,对参数估计值进行显著性检验的 t 统计量不服从常 规的 t 分布,DF(Diekey&Fuller)于 1979 年给出了检验用的模拟的临界值,故称检验称 为 DF 检验。一般地,如果序列在 0 均值上下波动,则应该选择不包含常数和时间趋 t Y 势项地检验方程,即(2-3)式;如果序列具有非 0 均值,但没有时间趋势,可选择(2-4) 作为检验方程;序列随时间变化有上升或下降趋势,应采用(2-5)的形

31、式。 (b) ADF 检验 在 DF 检验中,对于(2-3)式,常常因为序列存在高阶滞后相关而破坏了随机扰动 项是白噪声的假设,ADF 检验对此做了改进。它假定序列服从 AR(P)过程。检验 t t Y 分程为 (2-6) 1112211ttttptpt XXXXX 式中的参数视具体情况而定,一般选择能保证是白噪声的最小的值。p t p 与 DF 检验一样,ADF 检验也可以有包含常数项和同时含有常数和线性时间趋势 项两形,只需在(2-6)式右边加上 或 与。cc t 2.2 时间序列基本模型 随机时间序列分析模型分为三种类型:自回归模型(Auto-regressive model,AR)、

32、移动平均模型(Moving Average model,MA)和自回归移动平均模型(Auto-regressive Moving Average model,ARMA)。 2.2.1 自回归模型 如果一个随机过程可表达为 1122tttptpt XXXX 其中, 是自回归参数,是白噪声过程,则称为阶自回归过 i 1,2,ip t t Xp 程,用表示。是由它的个滞后变量的加权和以及相加而成。 AR p t Xp t 若用滞后算子表示 2 12 1 P pttt LLLXL X 基于时间序列模型的 GDP 预测7 其中称为特征多项式或自回归算子。 2 12 1 P p LLLL 与自回归模型常联

33、系在一起的是平稳性问题。对于自回归过程,如果其特 AR p 征方程: 2 1212 11110 P pP LLLLG LG LG L 的所有根的绝对值都大于 1,则是一个平稳的随机过程。 AR p 过程中最常用的是、过程, AR p 1AR 2AR 11ttt XX 保持其平稳性的条件是特征方程 1 10L 根的绝对值必须大于 1,满足|,也就是:。 1 1/1 1 1 2.2.2 移动平均模型 如果一个线性随机过程可用下式表达 1122 2 12 1 ttttqt q q qtt X LLLL 其中是回归参数,为白噪声过程,则上式称为阶移动平均过程,记为 12 , q t q 。之所以称“移

34、动平均” ,是因为是由个和滞后项的加权和构造 MA q t X1q t t 而成。 “移动”指 的变化, “平均”指加权和。t 注意:(1)由定义知任何一个 阶移动平均过程都是由个白噪声变量的加q1q 权和组成,所以任何一个移动平均过程都是平稳的。 (2)与移动平均过程相联系的一 个重要概念是可逆性。移动平均过程具有可逆性的条件是特征方程 2 12 10 q q LLLL 的全部根的绝对值必须大于 1。 陕西科技大学毕业论文8 2.2.3 自回归滑动平均模型 由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为 , 其中,别表示自回归和移动平均部分的最大阶数。的,ARMA p

35、 qpq,ARMA p q 一般表达式是 11221122tttptptttqt q XXXX 即 22 1212 11 Pq ptqt LLLXLLL 或 tt L XL 其中 和 分别表示的,阶特征多项式。 L LLpq 表 2-1 模型特征ARMA 模型自相关系数偏自相关系数 AR p拖尾阶截尾p MA q阶截尾q拖尾 ,ARMA p q拖尾拖尾 2.3 ARIMA 模型建模步骤 2.3.1 数据平稳化处理2 首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对 序列进行初步的平稳性判断。一般采用 ADF 单位根检验来精确判断该序列的平稳性。 对非平稳的时间序列,我们可

36、以先对数据进行取对数或进行差分处理,然后判断经处 理后序列的平稳性。重复以上过程,直至成为平稳序列。此时差分的次数即为 模型中的阶数。从理论上而言,足够多次的差分运算可以充分地提取, ,ARIMA p d qd 序列中的非平稳确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。因 为差分运算是一种对信息的提取、加工过程,每次差分都会有信息的损失,所以在实 际应用中差分运算的阶数要适当,应当避免过度差分,简称过差分的现象。一般差分 次数不超过 2 次。 数据平稳化处理后,模型即转化为模型。, ,ARIMA p d q,ARMA p q 2.3.2 模型识别 基于时间序列模型的 GDP 预测

37、9 我们引入自相关系数和偏自相关系数这两个统计量来识别模型的系数,ARMA p q 特点和模型的阶数。若平稳序列的偏相关函数是截尾的,而自相关函数是拖尾的,可 断定序列适合模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,AR 则可断定序列适合模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则MA 序列适合模型。自相关函数成周期规律的序列,可选用季节性乘积模型。自ARMA 相关函数规律复杂的序列,可能需要作非线性模型拟合。 在平稳时间序列自相关函数和偏自相关函数 上初步识别模型阶数和,ARMApq 然后利用 AIC 定则准确定阶。AIC 准则3:最小信息准则,同时给出模型阶数AR

38、MA 和参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与 哪一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接近 母体的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算 AIC 值,最后确定使其值最小的阶数是模型的合适阶数。关于模型,AIC 函数,ARMA p q 定义如下: 2 log2AICnpq 式中:平稳序列为样本数,为拟合残差平方和,为参数。n 2 pq AIC 准则定阶方法可写为: , ,min,0,0 k l AIC p qAIC k lkMlH 其中:,为模型阶数的上限值,一般取为根号或。实际应用中MNARMAn/10

39、n ,一般不超过 2。pq 2.3.3 参数估计 确定模型阶数后,应对模型进行参数估计。本文采用最小二乘法 OLS 进行ARMA 参数估计,需要注意的是,模型的参数估计相对困难,应尽量避免使用高阶的移动MA 平均模型或包含高阶移动平均项的模型。ARMA 2.3.4 模型检验4 完成模型的识别与参数估计后,应对估计结果进行诊断与检验,以求发现所选用 的模型是否合适。若不合适,应该知道下一步作何种修改。这一阶段主要检验拟合的 模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序 列是否为白噪声。参数估计值的显著性检验是通过 t 检验完成的 Q 检验的零假设是 即模型的误差项是

40、一个白噪声过程。Q 统计量定义为 012k H:2QT T 陕西科技大学毕业论文10 近似服从分布,其中表示样本容量,表示用残差序列计算的自相关系 2 kpqT k r 数值,表示自相关系数的个数,表示模型自回归部分的最大滞后值,表示移动平kpq 均部分的最大滞后值。用残差序列计算 Q 统计量的值。显然若残差序列不是白噪声, 残差序列中必含有其他成份,自相关系数不等于零。则值将很大,反之值将很小。QQ 判别规则是: 若,则接受。 2 Qkpq 0 H 若,则拒绝。 2 Qkpq 0 H 其中表示检验水平。 3 基于时间序列模型的 GDP 预测实例分析 国内生产总值(GDP)受经济基础、人口增长

41、、资源、科技文化、环境、体制、发 展战略等诸多因素的影响,这些因素之间又有着错综复杂的关系,因此,运用结构性 的因果模型分析和预测 GDP 往往比较困难。将历年的 GDP 作为时间序列,根据过去 的数据得出其变化规律,建立预测模型,用此来预测未来的发展变化,有着重要的意 义。 下面以我国 19782007 年国内生产总值数据(见表 3-1)为例,介绍用时间序列分 基于时间序列模型的 GDP 预测11 析法对数据分析的过程,并通过其预测 2006 及 2007 两年的国内生产总值与实际的国 内生产总值比较,选取最为合理的预测方法对未来 5 年我国 GDP 的做出预测。 表 3-1 我国 1978

42、2007 年国内生产总值5(单位:亿元) 年份GDP年份GDP年份GDP年份GDP年份GDP 19783645.219847208.1199018667.8199671176.62002120332.7 19794062.619859016199121781.51997789732003135822.8 19804545.6198610275.2199226923.5199884402.32004159878.3 19814891.6198712058.6199335333.9199989677.12005183217.4 19825323.4198815042.8199448197.9200

43、099214.62006211923.5 19835962.7198916992.3199560793.72001109655.22007249529.9 3.1 我国 GDP 时间序列分析 在模型中,时间序列是由一个零均值的平稳随机过程产生,即其过程的随ARMA 机性质具有时间上的不变性,在图形上表现为所有样本点都在某一水平线上下随机波 动。对于非平稳时间序列,需要预先对时间序列进行平稳化处理。 3.1.1 平稳性检查 首先我们绘制原始 GDP 的时间序列图, 从图 3-1 可以看出我国 GDP 具有很明显的 上升趋势,可以看出原始序列显然是非平稳的。进一步进行 ADF 单位根检验,从图 3

44、- 2 可以看出,检验未能通过,表明原始 GDP 序列是非平稳的。 为了能够对序列进行分析,要使其平稳化。故将选择两种方法:取对数法和差分 法,对序列进行平稳化处理,从而进一步分析预测。 陕西科技大学毕业论文12 图 3-1 原始 GDP 时序图 图 3-2 原始 GDP 序列 ADF 检验 3.1.2 平稳化处理 先对我国 GDP 数据进行对数化处理,绘制时序图 3-3:Ln GDP 基于时间序列模型的 GDP 预测13 图 3-3 时序图Ln GDP 图 3-4 时序 ADF 检验Ln GDP 显然对数处理后序列仍有明显上升趋势,且通过单位根检验后可知此序列非平稳, 通常低阶(二阶或三阶)

45、差分就可以提取出曲线趋势的影响,我们对取对数后数据进 行一、二阶差分,并验证其平稳性: 图 3-5 一阶差分时序图Ln GDP 图 3-6 一阶差分 ADF 检验Ln GDP 检验结果表明 T 统计量均大于 1%、5%、10%下的检验值,且其值大于 0.05,p 所以我们可以认定差分后的序列是非平稳的6。故还要再次进行差分,二阶差分时序 图如图 3-7: 陕西科技大学毕业论文14 图 3-7 二阶差分时序图Ln GDP 由该时序图我们基本可以认为其是平稳的,进一步做单位根检验: 图3-8 二阶差分ADF检验Ln GDP 检验结果显示,二阶差分序列在 1%的显著性水平下拒绝原假设,接受不存在单位

46、 根的结论,值显著小于 0.05,所以我们可以确定二阶差分后序列平稳。因此可以确p 定序列是 2 阶单整序列7,即。 Ln GDPLn GDP 2I 3.2 时间序列模型的建立 我们研究的序列为一元时间序列,建模的目的是利用其历史值和当前及过去的随 机误差项对该变量变化前景进行预测,通常假定不同时刻的随机误差项为统计独立且 正态分布的随机变量。对于时间序列预测,首先要找到与数据拟合最好的预测模型, 所以阶数的确定和参数的估计是预测的关键。 3.2.1 模型识别 模型的识别与定阶可以通过样本的自相关与偏自相关函数的观察获得。,ARMA p q 基于时间序列模型的 GDP 预测15 二阶差分后自相

47、关与偏自相关系数如图 3-9:Ln GDP 图 3-9 Ln(GDP)二阶差分后自相关图 由图可以看出,二阶差分后序列的自相关系数在滞后二期后呈衰减趋于零,表现为 拖尾性;在偏自相关分析图中,滞后四期的偏自相关系数显著不为零,但之后逐渐衰 减趋于零,也可以认为序列的偏自相关系数也具有拖尾性,因此阶数可由显著不为p 零的偏自相关系数的数目决定8,观察图可以取 1,也可以取 2。但为了检验所选模型 是否合适,我们可以采用 AIC 定则做最优模型识别: 表 3-2 AIC 定则模型识别定阶表 pq AICSC模型平稳检验 22-3.85 -3.65 未通过 03-3.46 -3.32 未通过 23-

48、3.43 -3.19 通过 12-3.38 -3.24 通过 13-3.30 -3.11 未通过 02-3.30 -3.12 通过 01-3.27 -3.23 通过 11-3.22 -3.12 通过 21-3.19 -3.04 通过 32-3.15 -2.09 通过 20-3.11 -3.01 通过 10-3.05 -3.01 通过 31-3.05 -2.86 通过 30-3.02 -2.87 通过 陕西科技大学毕业论文16 由表 3-2 分析可知,在所有模型中最优,次之,,ARMA p q2,3ARMA1,2ARMA 故我们分别选择和模型进行参数估计。2,2,3ARIMA1,2,2ARIMA

49、 3.2.2 模型参数估计与建立 下面分别对和模型进行参数估计:2,2,3ARIMA1,2,2ARIMA 图 3-10 模型参数估计2,2,3ARIMA 图 3-11 模型参数估计1,2,2ARIMA 基于时间序列模型的 GDP 预测17 图3-12及图3-10,3-11参数估计结果显示,和模型的2,2,3ARIMA1,2,2ARIMA 滞后多项式倒数根均落在单位圆内,满足过程的平稳要求9。因调整后的 值前者较后者大,且和值前者较后者小,故选择模 2 Adjusted RAICSC2,2,3ARIMA 型更合适。 图3-12 和滞后多项式倒数根的分布图2,2,3ARIMA1,2,2ARIMA

50、3.2.3 模型检验 首先画出模型的残差序列图:2,2,3ARIMA 图 3-13 模型的残差图2,2,3ARIMA 对模型做残差序列检验,残差相关系数如下:2,2,3ARIMA 陕西科技大学毕业论文18 图 3-14 模型残差序列检验2,2,3ARIMA 结果显示,检验统计量 Q 值均大于对应自由度卡方分布的检验值,且 Prob 列读出 拒绝原假设的概率很小,均小于 0.05,所以残差序列为非白噪声序列10,即 模型检验未通过,故只好做出模型的残差序列图进行检验,2,2,3ARIMA1,2,2ARIMA 残差相关系数如图 3-15,图 3-16: 图 3-15 模型的残差图1,2,2ARIM

51、A 图 3-16 模型残差序列检验1,2,2ARIMA 结果显示,检验统计量 Q 值均小于对应自由度卡方分布的检验值,且 Prob 列读出 拒绝原假设的概率较大,均大于 0.05,所以残差序列为白噪声序列10,即 基于时间序列模型的 GDP 预测19 模型通过检验,所以最终选择模型对我国 GDP 进行分析1,2,2ARIMA1,2,2ARIMA 预测。 因此,从图 3-11 模型参数估计可知,模型为:1,2,2ARIMA1,2,2ARIMA 22 12 1 0.4127160.1917750.780589 ttt tt Ln GDPLn GDP 去掉差分形式可得模型为: 12 12 3 2.4

52、127161.825432 0.4127160.1917750.780589 ttt ttt t Ln GDPLn GDPLn GDP Ln GDP 将对数形式指数化得最终模型为: 12 123 2.4127161.8254320.4127160.1917750.780589 ttt ttt Ln GDPLn GDPLn GDP t GDPe 3.3 我国 GDP 短期预测及分析 我们利用模型对 2006 年2007 年预测:1,2,2ARIMALn GDP 表 3-3 2006 年2007 年预测与实际值比较Ln GDP 年份预测值(亿元)实际值(亿元)相对误差 MAEMAPE 200612

53、.2337866112.26398064-0.25% 200712.4425964212.427334030.12% 0.0227280.184507 由此可计算得到我国 2006 年2007 年 GDP 值如下: 表 3-4 2006 年2007 年预测值与实际值比较GDP 年份预测值(亿元)实际值(亿元)相对误差 2006205620.3211923.5-2.97% 2007253367.5249529.91.54% 由上表可知,预测模型 MAE 和 MAPE 值均很小,表明预测模型较好11,通过 2006 年2007 年的数据验证,预测相对误差误差均小于 3%,预测效果良好。 因此,选择最模型对我国未来 5 年的 GDP 作出预测:1,2,2ARIMA 表 3-5 2008 年2012 年我国预测值GDP 年份20082009201020112012 Ln(GDP)(亿元) 12.57739 12.73388 12.89301 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论