版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、应用时间序列分析课程论文目 录一、研究背景与文献综述2二、arima模型的基本思想及数学模型3三、我国财政教育支出的arima(p,q)模型51、数据的选择及平稳化处理52、单位根检验73、非白噪声检验74、模型的识别定阶与参数估计85、模型的检验96、预测及其效果分析10四、我国财政教育支出组合模型的建立与预测111、建立趋势-arma组合模型的原理122、趋势项的估计123、残差项的arma模型建立144、组合模型的预测及其效果分析18五、总结与政策建议19六、结束语20参考文献21 第 22 页 共 22 页我国财政教育支出时间序列预测-基于arima模型与趋势-arma组合模型的比较分
2、析摘要:随着我国经济的快速发展,政府对教育投入规模不断扩大。本文基于19522010年财政教育支出的数据,利用arima模型和趋势-arma组合模型,对我国未来几年的教育支出进行了定量预测。预测结果显示:该模型预测值与实际数据相比误差小,预测结果较为精确。关键词:时间序列 教育支出 平稳性 arima模型 趋势-arma模型 预测一、研究背景与文献综述在当今世界,知识经济已成为占主导地位的经济形态,国家的综合实力将越来越取决于教育的发展、科技的进步和知识创新的水平,而教育是提高劳动者素质、发展科学技术和培养专门人才的基础,在现代化建设中具有先导性、全局性作用,整个教育事业的发展水平和发展质量关
3、系到国民经济的发展水平和国家综合国力的提高,关系到社会主义现代化建设的全局和未来,教育公平是实现社会公平、构建和谐社会的重要途径,教育事业必须摆在优先发展的战略地位。最早把教育看作投资的是亚当斯密,他认为,“学习固然要花费一笔费用,但这种费用可以得到偿还,同时得到利润”。美国著名经济学家舒尔茨1962年运用大量统计数据,得出1929-1957年美国经济增长有33%的份额要归因于美国教育的发展;在20世纪80年代,罗默和和卢卡斯就间接指出了教育对经济增长的贡献。此后,当代美国著名的经济学家加里贝克尔进一步论证了教育投资对经济发展的巨大影响,提出人力资本形成的主要途径是教育。前苏联著名学者斯特鲁米
4、林运用劳动简化率算得1940-1960国民收入增长额中有30%由于教育投资提高了劳动者整体文化程度,而近二十年该比例还有所提高。再看近代日本和亚洲四小龙创造的经济奇迹,他们具有一个共同的特点:高度重视国民教育投资,人力资本在经济发展中处于绝对重要的地位。在知识经济时代,经济发展的支撑重点转移于人力资源,许多经济学家称“开发人力资源,增加人力资本投资”是促进经济、科技、社会全面发展的第一原动力。政府教育支出作为人力资本投资的一部分能极大地促进社会劳动生产率的提高和技术进步,从而对宏观经济的长期、稳定增长产生巨大影响。对教育而言,既具有公共产品的部分特性,又具有私人产品的部分特性,市场经济的发展并
5、不能使一个国家真正将教育全面推向市场,政府仍然必须是教育的主要投资者,政府在教育发展上负有不可推卸的责任,大力增加教育投资是当今世界各国教育事业发展的主要潮流。世界各国尤其是发达国家为在国际经济竞争中争取主动权, 纷纷把推动人才教育作为国家发展战略, 大幅度提高教育投入。我国政府亦明确提出, 实现长期可持续发展要依靠科技进步和劳动力素质的提高, 要深入实施科教兴国战略和人才强国战略。科技进步的核心因素是教育,随着经济的发展, 我国的教育投入经费也在快速增长。现代国内有关教育投资的文献很多,研究的角度也各不相同,如:李艳、刘锐、武志鸿、刘惠生等研究的角度是纵向比较我国教育支出经费情况,揭示我国教
6、育投资的现状以及存在的问题;王莹、陈平等主要从政府教育投资与经济增长的关系进行研究的,进而揭示教育投资对经济增长的促进。从上述研究来看,由于采用的数据以及时间跨度不同、数学模型和计量方法的差异,得出的结果不尽相同。因财政教育支出受经济基础、人口、环境等诸多因素的影响,这些因素之间又有着错综复杂的关系,运用结构性的因果模型分析和预测其值往往比较困难,所以,本文在借鉴诸位专家学者的基础上,结合本人所学时间序列的知识,从历年的数据出发,拟合arima 模型和趋势-arma组合模型分别来预测未来我国财政教育支出的趋势。二、arima模型的基本思想及数学模型时间序列是指同一种现象在不同时间上的相继观察值
7、排列而成的一组数字序列。现实中的时间序列一般是长期趋势、循环变动、季节性变动以及随机变动等几种变化形式的叠加或组合。对时间序列进行观察、研究、找寻它的变化发展的规律,预测它未来的走势即时间序列分析,作为时间序列分析的主要用途就是预测,即通过对预测目标本身时间序列的处理,研究预测目标的变化趋势。时间序列预测方法的基本思想是:预测一个现象的未来变化时,用该现象的过去行为来预测未来。即通过时间序列的历史数据揭示现象随时间变化的规律,将这种规律延伸到未来,从而对该现象的未来做出预测。arima模型是迄今为止运用最广泛的时间序列预测方法。arima模型是通过差分等方法将非平稳序列转变为平稳随机序列,再运
8、用目前已经相当成熟的arma模型进行拟合,效果十分显著。对于非平稳时间序列,首先必须将其差分d次,把它变为平稳的,然后用arma(p,q)作为它的模型,那么就说这个原始的时间序列是arima(p,d,q),即自回归求和移动平均模型(其中p指自回归项数,d指序列成为平稳之前必须取其差分的次数,而q指移动平均数)。显然,arima(p,d,q)模型的实质就是d阶差分运算与arma(p,q)模型的组合。而对于arma(p,q)模型,它是一类常用的随机时序模型,它是一种精度较高的时间序列预测方法。其基本思想是:某些时间序列是依赖于时间t的一族随机变量,构成该时序的单个序列值虽然具有不确定性,但整个序列
9、的变化却有一定的规律可以用相应的数学模型近似描述。通过对该数学模型的分析,能够更本质的认识时间序列的结构和特征,达到最小方差意义下的最预测。在现实生活中,我们常常运用arma(p,q)模型对经济体进行预测和分析,得到较为满意的效果。 arma(p,q)模型有三种基本类型:自回归(ar:auto-regressive)模型、移动平均(ma:moving average)模型以及自回归移动平均(arma:auto-regressive moving average)模型。(1)自回归模型(ar)如果时间序列yt,是它的前期值和随机项的线性函数,即可表示为: (2.1)则该时间序列是p阶自回归序列,
10、记为ar(p)。随机项,与之后变量不相关,是相互独立的白噪声序列,且服从均值为0、方差为的正态分布。(2)移动平均模型(ma)如果时间序列yt,是它的当期和前期的随机误差项的线性函数,即可表示为: (2.2)则称该时间序列是q阶移动平均序列,记为ma(q)。移动平均过程无条件平稳。(3)自回归移动平均模型(arma)如果时间序列yt,是它的当期和前期的随机误差项以及前期值的线性函数,即可表示为: (2.3)则称yt是自回归移动平均,记为arma(p,q)。arma(p,q)模型等于无穷阶的ar或ma过程。当该过程平稳时,它的均值不随时间变化,由此得过程平稳的一个必要条件,即。三、我国财政教育支
11、出的arima(p,q)模型建模流程如下:图一 建模流程图1、数据的选择及平稳化处理本文的数据来自中国统计出版社出版的新中国五十五年统计资料汇编和中国统计年鉴,原始数据见附表。从1952年至2010年共59个数据。本文的所有数据处理过程均使用eviews6.0进行。图二 1952-2010我国财政教育支出(education)序列图由图二可见,该序列不具有明显的周期变化和季节波动,但呈现出明显的增长趋势,是非平稳的,而arma(p,q)模型应用有一个前提条件,就是要求时间序列是平稳的,也就是其均值与时间无关,其方差是有限的。在现实经济生活中,许多时间序列都是非平稳的,把非平稳序列转化为平稳序列
12、最常用的方法是对数和差分方式。为保证信息的准确,尽量避免过度差分,在此,先考虑用对数来消解数据的趋势性。图三 原始数据取对数序列图由图三可见,序列仍呈现明显增长趋势,是非平稳的,鉴于其趋近于线性增长,故对其做一阶差分以期望平稳。图四 原始数据取对数后一阶差分x序列图从图四可以初步判断,x序列平稳,这只是直观感觉,需进一步采用adf单位根检验来精确判断。2、单位根检验下面采用单位根检验,检验结果如下:表1 单位根检验adf统计量educationx=d(log(education))augmented dickey-fuller test statistic-1.339845-5.1268371
13、-2.613010-2.6130105-1.947665-1.94766510-1.612573-1.612573结论非平稳平稳从表1中数据可以看出,x序列adf检验结果表明x是平稳的,因此arima(p,d,q)的差分阶数d=1。3、非白噪声检验对平稳序列还需进行纯随机性检验(白噪声检验)。因为白噪声序列就没有了分析的必要,对于平稳的非白噪声序列才可以进行arma(p,q) 模型拟合。白噪声检验通常观察所得平稳序列的自相关系数和偏相关系数图来判断。图五 x的自相关图和偏自相关图如图五所示,显然x不是纯随机性序列(即非白噪声),因此可以对此序列进行arma建模。4、模型的识别定阶与参数估计利用
14、自相关图和偏相关图找出适当得p、d、q值,arima模型选择原则如下:表2 arima模型选择原则模型自相关系数偏相关系数ar(p)拖尾p阶截尾ma(q)q阶截尾拖尾arma(p,q)拖尾拖尾一般而言,样本的相关系数不会呈现出理论截尾的完美情况,本应结尾的相关系数仍会出现小幅振荡的情况,但随着延迟阶数的增大,相关系数都会衰减至零值附近作小幅波动。对模型中的p 和q 参数两个参数进行多种组合,利用aic 和sc准则从arma(p , q)模型中选出最优的。通过观察图五可以看出七阶差分后序列的自相关系数和偏相关系数都是截尾的,所以我们初步确定采用arma模型的疏系数形式进行拟合。通过使用软件多次推
15、算,利用aic 和sc 准则选出最优的模型形式为: (1-b) log (education) =c+ (1-1b6-2b7)利用最小二乘法估计参数得:表3 回归结果参数系数标准差tpc0.1086160.0223684.8557800.0000ma(6)0.4148950.1063823.9000640.0003ma(7)0.5954020.1062975.6013300.0000r-squared0.499196mean dependent var0.110115adjusted r-squared0.480985s.d. dependent var0.137918s.e.of regre
16、ssion0.099360akaike info criterion-1.729793sum squared resid0.542984schwarz criterion-1.623218log likelihood53.16398hannan-quinn criter.-1.688280f-statistic27.41170durbin-watson stat1.621746prob(f-statistic)0.000000最终模型为: (1-b) log (education) =0.108616+ (1+0.414895b6+0.595402b7)5、模型的检验模型的检验主要是检验模型的
17、有效性。一个模型是否有效主要看它提取信息是否充分。一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息,换言之,拟合残差项中将不含任何相关信息,即残差项序列应该为白噪声序列。若是白噪声,则接受选择的模型;否则,要重新进行模型识别、定阶、估计、检验。现采用q统计量对模型残差进行适应性检验,得到残差的自相关图和偏相关图见下: 图六 残差的q统计量检验图由图六可以看出模型残差的自相关系数和偏相关系数都在置信区间内,与零无显著差异,初步可以认为残差是线性无关的,趋近于白噪声序列。再作残差关于其滞后一阶的散点图(见下页)。图七 残差的q统计量检验图由图七可知,残差为序列无关。因此,可以认为该模
18、型是可取的,可用于接下来的预测。6、预测及其效果分析下面利用上面时间的arma模型对某一时间段进行预测检验,用eduf1表示财政教育投资的预测值,我们首先利用arma模型对2008年到2010年的财政教育投资进行预测,预测值和实际值比较如下:(单位:亿元) 表4预测值和实际值比较(单位:亿元,下同)指标时间实际值预测值绝对误差相对误差(%)相对误差平均值(%)2008年5389.3975416.99127.593610.12000.8532009年6006.7706080.45773.686921.22672010年6550.6336604.36153.727580.8202图八 预测值与实际
19、值的图形趋势(为了看清楚将区间缩小)从表4可以看出,预测值与实际值的相对误差小,说明该模型在短期内预测比较准确,但随着预测期的逐渐增大,预测误差可能会逐渐增大。下面是对2011年到2013年的情况进行预测:(单位:亿元)表5 arima(0,1,(6,7)对2011年-2013年预测时间201120122013预测值7337.1828020.6899114.252至此,arima模型的建立过程已经结束,模型整体好,达到预期效果。但是在对不肯定事物做出科学的预测时,只局限于一种方法是不可靠的,因为不同的预测方法往往只能提供某一方面的有用信息,在选择了某种预测方法后,不可避免的会丢失另外一些有用信
20、息,单一种模型大都缺乏普遍适用性。一种更为科学的做法就是将不同的预测方法以某种方式进行适当的组合,综合利用各种预测方法所提供的信息,尽可能地提高预测精度,于是就形成了组合预测方法。目前有许多种组合方法进行组合预测,下面采用趋势-arma组合预测。四、我国财政教育支出组合模型的建立与预测组合预测方法最初是由bates j m和granger cw j在20世纪60年代提出来的,所谓的组合预测是将两个或两个以上的单一预测模型组合起来以提高预测精度和稳健性的一种预测方法。多年的实践证明:组合预测由于比单一预测更有效、更能提高模型的拟合精度和预测能力。1、建立趋势-arma组合模型的原理当预测对象依时
21、间变化呈现某种上升或下降的趋势,并且无明显的季节波动,又能找到一条合适的函数曲线反映这种变化趋势时,可以以时间t为自变量,该时间序列为因变量,建立趋势模型:模型中的 f (t) 包含了反映各种主要因素对y t长期变化趋势的影响,残差项u t既反映y t的长期趋势中随机波动的影响,又包含构成y t预测模型的主要因素之外的其它因素的影响。 f (t) 为何种函数形式,取决于时间序列本身的变化规律和所采用的预测方法,它常常表现为线性回归、指数函数、多项式和一些特定的函数,并非杂乱无章,而是具有一定的规律性。在用传统方法得到f (t) 的估计后,利用时间序列分析,再对产生的残差项u t建立arma(p
22、,q)模型,这样就构成了组合时间序列模型:为服从正态分布的白噪声序列。 从理论上而言,组合时间序列arma模型比单一arma模型的预测效果好,这是由于它既包含了可由时间变量t解释的y t 变的那部分,又包含了时间变量不可解释的但可由arma模型解释的yt 的变差的另一部分。因此建立组合模型的方法,简单地说是选用最小二乘法按照某类函数拟合数据序列的确定性部分,即先将趋势(线性或指数)性拟合提出,建立其趋势方程,然后将残差序列建立合适的arma(p,q)模型。2、趋势项的估计由图1大致可以看出,呈递增的走势,但是由于1990年以前的数据过于密集,所以采用分段看图像的走势后,决定引入两个虚拟变量19
23、70年以后1952年1970年1990年以后1952年1990年将原时间序列进行拟合,得出趋势项 f(t),再对剩余残差ut进行arma模型估计,最后综合在一起对模型进行预测。下面是加入虚拟变量拟后的最小二乘回归结果(已对变量进行了筛选):表6回归结果 variablecoefficientstd. errort-statisticprob.c30.0252016.341331.8373780.0718d215475.921102.34414.039090.0000d1*t-12.405853.294565-3.7655510.0004d2*t-822.375145.58694-18.0397
24、10.0000t2*d10.5476440.1006875.4390560.0000t2*d210.987810.47407023.177610.0000r-squared0.998451mean dependent var1025.036adjusted r-squared0.998305s.d. dependent var1685.292s.e. of regression69.38411akaike info criterion11.41334sum squared resid255150.2schwarz criterion11.62461log likelihood-330.6934
25、hannan-quinn criter.11.49581f-statistic6833.060durbin-watson stat0.869737prob(f-statistic)0.000000回归方程为: yt= 30.02520+15475.92*d2-12.40585*d1*t-822.3751* d2*t+0.547644 *t2* d1+10.98781 *t2* d2+ut拟合效果图如下:图九 拟合效果图从表6可以看出,该模型的拟合度达到了99.84%,再结合图九,可知拟合效果很好。3、残差项的arma模型建立下面对残差ut进行估计,方法同前面所述,这里就不再重复。先进行单位根检
26、验,结果如下:表7 ut单位根检验adf统计量utprob.*augmented dickey-fuller test statistic-3.4697700.00091-2.6130105-1.94766510-1.612573结论平稳下面是残差的自相关和偏自相关图:图十 残差的自相关和偏自相关图经过多次试验,识别定阶,最终回归结果如下:variablecoefficientstd. errort-statisticprob.c-3.7642460.979472-3.8431380.0004ar(1)0.6103470.05570910.956080.0000ar(3)-0.8497080.
27、057969-14.658070.0000ma(1)-0.7256180.111803-6.4901260.0000ma(4)-0.3416010.060735-5.6244670.0000ma(7)0.3596050.0819464.3883150.0001ma(8)-1.4908490.071002-20.997310.0000ma(10)0.3700840.1332492.7773920.0078ma(11)-0.7302260.067937-10.748610.0000r-squared0.898972mean dependent var0.711171adjusted r-squar
28、ed0.881776s.d. dependent var68.02991s.e. of regression23.39119akaike info criterion9.288820sum squared resid25715.94schwarz criterion9.614323log likelihood-251.0870hannan-quinn criter.9.415017f-statistic52.27744durbin-watson stat1.988274prob(f-statistic)0.000000表8 组合模型残差arma模型回归结果结果中t检验均通过,拟合度为0.899
29、,因而,此模型拟合程度尚可,下面进行适应性检验。图十一 q统计量检验图再作回归后残差关于其滞后一阶的散点图:图十二 由图十一可见,q统计量均通过检验,说明残差序列为白噪声。由图十二可知,残差为序列无关。因此,模型的检验效果好,可以用于预测。4、组合模型的预测及其效果分析在进行预测时,f(t)分解出来的两部分采取分别进行预测,最后将预测值相加,进而与实际值进行比较。用eduf2表示财政教育投资的预测值,同前面进行的预测一样,,我们首先利用组合模型对2008年到2010年的财政教育投资进行预测,预测值和实际值比较如下:(单位:亿元)表9 预测值和实际值比较指标时间真实值预测值绝对误差相对误差(%)
30、相对误差平均(%)2008年5389.3975364.25825.1393450.466460.40282009年6006.776044.68637.9160510.631222010年6550.6336543.397.24300430.11057图十三 预测值与实际值的图形趋势(同样为了看清楚将区间缩小)从表可以看出,预测值与实际值的相对误差较小,说明模型预测的效果很好。下面表4是对2011年到2013年的预测:表10 时间201120122013预测值7133.147467.8547877.381至此,组合模型的建立过程已经结束,模型整体不错,达到预期效果。下面把两种方法预测的结果进行简要
31、的对比表11200820092010201120122013真实值5389.3976006.776550.633预测值15416.9916080.4576604.3617337.1828020.6899114.252预测值25364.2586044.6866543.397133.147467.8547877.381图十三 真实值与两次预测值的图像由表11和图十三所示,2008-2010这三年的两次预测值比较接近,与真实值也十分接近,说明这两种方法进行短期的预测效果不错,但2011-2013这三年的预测两种方法得出的结果相差比较大,具体哪一种更接近真实值,有待于进一步论证。五、总结与政策建议本文
32、采用自回归移动平均模型(arma)和组合时间序列两种方法,分别对我国财政教育投资进行了短期预测,绕开了对传统影响教育支出的种种因素作用机理的分析,而围绕这些众多因素共同作用下所表现出的实际数据展开研究,这种类似于抛开“黑箱”关注结果的研究方法,正是时间序列分析的魅力所在!正因为其对数据的要求比较单一,所以在实际中的实用性比较广泛。总的来说,arma模型从定量的角度反应了一定的问题,作出了较为精确的预测,尽管不能完全代表现实,但对我国教育事业蒸蒸日上的今天,我们把握教育支出的趋势具有较好的借鉴意义。当前,我国政府财政教育投入的大幅增加,有力地支持了各类教育事业的发展。但是,我国作为世界上最大的发
33、展中国家,人口众多,人均经济发展水平低,国家财力有限,对教育投入的努力程度还不够,在教育投入规模和教育发展水平与发达国家相比还存在较大差距,仍然处于“穷国办大教育”的局面,还有很多问题需要解决。通过参阅相关文献并结合自己的想法,现提出如下几点建议,望抛砖引玉。1、加大国家财政教育投资占gdp的比重。虽然改革开放后,我国财政对教育投入了大量的财力,财政教育投资近年来有了大幅度增加,但是我国财政教育投资占gdp的比重仍远远低于国际水平,因此增加教育投资是国家财政今后一段时间内的当务之急,争取早日实现财政教育经费支出占gdp的比重达到4%的目标。2、优化教育投资结构。主要是从级别结构和地区结构两方面
34、入手。从级别结构看,我国2000年高等教育投资的比重为22%,位于其他国家的前列,不仅大大高于一般的发展中国家,而且高于一些发达国家,而我国对初等、中等教育的支出与大多数国家相比显得相对不足。这既不符合国际惯例,又不利于我国经济发展。所以在今后保持高等教育的支出适当的增加的前提下,应着重考虑基础教育的支出。从地区结构看,城市和农村财政教育投资不均衡问题,无论是小学的生均教育经费投资,还是初中生均教育经费投资,城市的数量都大于农村。这种教育投资的悬殊与各地区经济、社会发展的差距互为因果,影响了我国整个经济、社会的均衡发展。3、完善各种监督机制,保障财政教育投资落实到位。六、结束语本文的构思和写作可谓尽心尽力,但是未免有遗憾。一是由于知识所限,特别是数学功底的不扎实,模型的定阶方面仍然有些许盲目,缺乏足够的理论支撑,以后的学习中一定要不断加强,争取从更理性的角度去建立模型。再者是组合预测仅仅是局限在两个模型的组合,随着以后的学习深入,我们可以根据实际情况灵活地进行更多的模型、更多的组合方法组合,从而获得精度更好的组合模型。将组合预测模型不仅运用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 水粉烟花课件教学课件
- 出游应急预案
- 旅游业安全规范解析
- 2024年大型并网风力发电机组发电机项目资金需求报告代可行性研究报告
- 物业小区危险源识别
- 吉林省2024七年级数学上册第1章有理数1.7有理数的减法课件新版华东师大版
- 彩色的雨教案反思
- 建筑业薪酬政策
- 林业安防施工合同
- 影视制作薪酬管理
- 动静脉内瘘栓塞的原因分析及干预措施课件
- 小学一年级10以内加减法口诀表
- 换热站的安装调试
- 幼儿园中班数学鲜花分一分教案ppt【幼教课件】
- 防洪评价课件
- 普通地质学教材
- 我的连衣裙【经典绘本】
- 农村公路畅通工程质量检测方案第三方检测及交工验收
- 急性冠脉综合征特殊人群抗血小板治疗中国专家建议解读
- 1 220kV外护套电缆试验报告
- 毛泽东思想概论
评论
0/150
提交评论