基于SPSS的时间序列分析技术研究_第1页
基于SPSS的时间序列分析技术研究_第2页
基于SPSS的时间序列分析技术研究_第3页
基于SPSS的时间序列分析技术研究_第4页
基于SPSS的时间序列分析技术研究_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 摘 要国内生产总值(GDP)预测问题,由于其输入向量维数多,影响因素复杂,具有很强的非线性,输入向量的各分量间存在着复杂的耦合关系,是典型的“黑箱”模型,各数据直接的相互影响关系没有明确的表达式等原因,预测难度比较大。考虑到支出法计算GDP,综合前人的研究成果本文认为,影响GDP的指标有多个,但起主要作用的只有四个:固定资产投资、人口数量、资本形成总额和居民消费。研究工作中,我收集了我国1992到2011共20年的GDP作为数据,运用时间序列分析的基本的分析方法随机时序分析,进行模型识别、参数估计和模型检验,应用选定时间序列方法预测未来GDP,并讨论此时间序列类型、误差的主要来源。关键词:国

2、内生产总值(GDP) GDP预测 时间序列分析 参数评估 32北京邮电大学世纪学院毕业设计(论文) ABSTRACTABSTRACTGross domestic product (GDP) forecast of the input vector dimension, affecting factors are very complex, highly nonlinear and complex coupling between the input vector component is a typical black box modelthe data directly there is n

3、o clear interaction between the expression of reason, forecasting more difficult. Taking into account the expenditure approach of GDP, integrated previous research paper argues that indicators of the impact of GDP, but the total amount of only four plays a major role: investment in fixed assets, pop

4、ulation, capital formation and household consumption.Research, I collected the 1992-2011 total of 20 years of GDP as data, use the random timing of the basic analysis methods of analysis of time series analysis, model identification, parameter estimation and model checking, application of the select

5、ed time series methods to predict the futureGDP, and discuss the main source of this type of time series error.Keywords: gross domestic product (GDP) GDP forecasts time series analysis parameter estimation 北京邮电大学世纪学院毕业设计(论文) 目录目 录摘 要IABSTRACTII目 录III绪 论11.1 问题提出的背景和内容11.1.1 问题提出的背景11.1.2 问题研究的内容11.2

6、 国内外研究现状21.2.1关于SPSS21.2.2关于时间序列技术31.2.3关于GDP31.3 GDP的概念及其核算51.4 GDP 预测的意义61.5 中国经济发展的现状61.6论文的主要研究内容71.6.1 基本思路71.6.2 文章结构安排7第2章 GDP时间序列预测模型82.1指数平滑模型82.1.1 指数平滑概念82.1.2 指数平滑计算82.2自回归模型建模112.2.1 自回归概念112.2.2 自回归建模112.3 ARIMA模型建模步骤112.3.1数据平稳化处理112.3.2模型识别122.3.3参数估计132.3.4参数估计13第3章 GDP时间序列预测模型的构建14

7、3.1 指标选取与数据处理143.2 我国GDP的时间序列模型153.3 模型预测及分析分析23结论25参考文献26致 谢27北京邮电大学世纪学院毕业设计(论文) 绪论绪 论1.1 问题提出的背景和内容1.1.1 问题提出的背景国内生产总值(GDP)受经济基础、人口增长、资源、科技文化、环境、体制、发展战略等诸多因素的影响,这些因素之间又有着错综复杂的关系,因此,运用结构性的时间序列模型分析和预测GDP往往比较困难。将历年的GDP 作为时间序列,根据过去的数据得出其变化规律,建立预测模型,用此来预测未来的发展变化,有着重要的意义。改革开放以来,我国经济飞速发展。2001年排名已升到世界第六位,

8、而到2011年已排名世界第二。GDP反映了全社会最终产品和劳务产品的总价值,是衡量一个国家和地区经济发展的重要指标。因此,对我国GDP变化趋势的研究,能够更准确地把握我国经济发展的动向。使我国能够有一个稳定明确的目标,达到更好的发展。1.1.2 问题研究的内容通过本课题的研究,学习并熟练掌握SPSS软件技术,利用时间序列分析方法,建立我国GDP时间序列模型,分析经济增长的内在特征。并对未来我国经济发展做出预测,为政府制定经济发展战略提供依据。GDP反映了全社会最终产品和劳务产品的总价值,是衡量一个国家和地区经济发展的重要指标。因此,对我国GDP变化趋势的研究,能够更准确地把握我国经济发展的动向

9、。国内生产总值受经济基础、人口增长、资源、科技文化、环境、体制、发展战略等诸多因素的影响,这些因素之间又有着错综复杂的关系,因此,运用结构性的时间序列模型分析和预测GDP往往比较困难。将历年的GDP 作为时间序列,根据过去的数据得出其变化规律,建立预测模型,用此来预测未来的发展变化。因此,在本课题中我们要收集历年的GDP数值,即数据的准备阶段;然后对数据进行观察及检验,总体把握时间序列发展变化的特征,这是选择恰当模型进而对数据进行深入分析的前提;通过数据的观察和检验阶段得到对序列变化特征的总体把握后,就可根据分析的需要对数据进行不要的变换等预处理;之后根据时间序列的特征和分析的要求,选择恰当模

10、型进行数据建模和分析。运用经过比较选择之后的最优模型对我国未来GDP进行预测,并根据结果对当前的状况找出改善的途径和方法。1.2 国内外研究现状1.2.1关于SPSSSPSS是软件英文名称的首字母缩写,愿意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。最近伴随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已经决定将之英文全称更改为Statictial Product and Service solution,意为“统计产品与服务解决方案”。1968年,美国三位斯坦福大学的学生开发了最早的SPSS统计软件系统,并基

11、于这一系统于1975年在芝加哥合伙成立了SPSS公司。迄今SPSS软件已经有30余年的成长历史。全球约有25万家产品用户,它们分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。1994年至1998年间,SPSS公司陆续并购了SYSTAT公司、BMDP软件公司、Quantime公司、ISL公司等,并将各公司的主打产品收纳到SPSS旗下,从而使SPSS公司由原来的单一统计产品开发与销售转向企业、

12、教育科研及政府机构提供全面信息统计决策支持服务,成为走在了最新流行的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。SPSS为您提供揭示客户需求、预测客户行为的解决方案,并把客户关系管理(CRM)和商业智能(Business intelligengce)有机地结合在一起,使您和您的客户之间可以建立更好的互动关系。SPSS解决方案广泛应用于市场研究、电信、卫生保健、银行、财务、金融、保险、制造业、零售等领域。总之,SPSS是全球专业统计分析软件和解决方案的领导者。SPSS向用户提供包括统计分析和数据挖掘的专业软件产品,SPSS预测分析技术把数据应用于战略工作中,有效判定当前状况并对未来

13、重大事件进行预测。全球有25万多的商业、学术和公共行业用户采用SPSS技术增加收入、降低成本,优化业务流程,发现并购防欺诈。在全球财富1000家企业中,有95%的企业是SPSS的客户。1988年,中国高教学会首次推广了这种软件,从此成为国内教育科研人员最常用的工具。1.2.2关于时间序列技术时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。时间序列法是一种定量预测方法,亦称简单外延方法。在统计学中作为一种常用的预测手段被广泛应用。时间序列分析在第二次世界大战前应用于经济预测。二次大战中和战后,在军事科学、空间科学、气象预报和工业自动化等部门的应用更加广

14、泛。时间序列分析(Time series analysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。时间序列分析的作用有很多。可以反映社会经济现象的发展变化过程,描述现象的发展状态和结果;可以研究社会经济现象的发展趋势和发展速度;可以探索现象发展变化的规律,对某些社会经济现象进行预测;利用时间序列可以在不同地区或国家之间进行对比分析,这也是统计分析的重要方法之一。近年来,时间序列分析已经渗入到交通运输,智能控制,神经网络模拟,生物,医学,水文,气象,经济学,空间科学等众多领域,发挥着无可比拟的作用。时间序列分析

15、技术在国内外都运用的非常广泛,发挥着很重要的作用。1.2.3关于GDP近几年来,世界经济已摆脱连续4年的增长缓慢和不景气状态,并开始步入新一轮的经济上升周期,世界经济增长率在1991年下降到04的基础上,1992年提高到08,1993年为17,1994年上升到31,预计1995年可达35,90年代下半期大体可保持3的增长率,略高于80年代29的水平。而2007年8月以来,随着美国次贷危机的全面爆发,美、欧金融市场受到了较大的负面影响,这种影响不可避免地渗透到实体经济当中,且不断向其他国家和地区扩散。面对各种经济危机,要想更好更快更准的掌握自己经济的发展,对经济的研究与预测是必不可少的,而国内生

16、产总值是衡量一个国家实力的重要指标。因此,各国对各自国内生产总值的研究与预测也格外重视。在美国,国内生产总值由商务部负责分析统计,惯例是每季估计及统计一次。每次在发表初步预估数据(The Preliminary Estimates)后,还会有两次的修订公布(The First Revision & The Final Revision),主要发表时间在每个月的第三个星期。国内生产总值通常用来跟去年同期作比较,如有增加,就代表经济较快,有利其货币升值;如减少,则表示经济放缓,其货币便有贬值的压力。以美国来说,国内生产总值能有3%的增长,便是理想水平,表明经济发展是健康的,高于此水平表示有通货压力

17、;低于1.5%的增长,就显示经济放缓和有步入衰退的迹象。1978 年到2001 年,中国GDP 年均增长超过9 %。2001 年GDP超过1. 1 万亿美元,排名升到世界第六位。GDP反映了全社会最终产品和劳务产品的总价值,是衡量一个国家和地区经济发展的重要指标。今年上半年,在汽车和楼市两大市场调整的影响下,我国消费增速明显减缓。2011年1-6月,社会消费品零售总额累计同比增长16.8%,较上年同期回落1.4个百分点。与一季度相比,二季度消费对GDP的贡献减少,也成为GDP小幅降温的主要原因。交通银行金融研究中心高级宏观分析师唐建伟认为,受高通胀抑制、消费淡季以及汽车和房产两大市场仍将继续调

18、整的影响,三季度可能难以看到社会消费品增速的显著反弹。今年上半年农村居民人均现金收入实际增长13.7%,连续三个季度超过GDP增速和城镇居民收入增速。预计下半年随着物价涨幅的回落,居民实际收入仍将保持增长态势,这将促使今年三季度末到四季度,社会消费品零售总额同比增速或将触底反弹。唐建伟预计,2011年全年社会消费品零售名义增速将能保持在17%左右。盛来运表示,下半年中国宏观经济运行中面临最大的挑战仍是如何进一步处理好保持经济平稳较快发展、调整经济结构和管理通胀预期的关系。今年以来,央行已连续三次上调金融机构人民币存贷款基准利率和连续六次上调存款准备金率。“目前的货币政策效果有所显现,但还没有完

19、全发挥出来。下半年的总体政策还会偏紧,但是应该不会出现连续加息和调整存款准备金率等大幅度的政策调整。预测三季度还会有一次加息。” 中国银行金融研究所研究员周景彤说。随着时代的进步,我国发展迅速,国家经济将会不断繁荣。1.3 GDP的概念及其核算国内生产总值(GDP)就是在一定时期内(通常是一年)某国(地区)境内生产要素所生产的全部最终产品(物品和劳务)市场价值的总和。从1978年到2007年,我国的GDP数值从3624亿元增加到246619亿元,2009年进一步增加到335353 亿元。1)GDP是生产要素所有者的报酬,生产要素:指企业进行生产活动必须使用的投入品。生产的价值,都要转化为生产要

20、素报酬和企业利润,即转化为要素提供者和企业经营者的收入。生产要素资本劳动土地企业家才能要素报酬利息工资租金利润2)GDP测算的是最终产品的价值,中间产品价值不计入GDP,否则会造成重复计算。最终产品是由最后使用者购买的产品(或劳务)(如衣服)中间产品是供生产别种产品使用的产品(如棉花、纱、布)。3)GDP是一个生产概念,GDP测算的是一定时期内所生产的而不是售出的最终产品价值定义:库存变动(存货投资)生产额销售额。不包括二手物品、不包括金融资产。4)GDP是一个地域概念,GDP表示某个地域范围内的最终产品价值,GNP(国民生产总值)是一个国民概念。5)GDP是一个市场价值概念,GDP是市场活动

21、导致的价值,并且用货币加以衡量。计算公式如下:其要求,非市场活动(家务劳动、自己自足生产),不统计在GDP之内;按不同年份的价格计算的GDP不同;GDP的国际比较需使用PPP进行调整。GDP平减指数计算如下:GDP核算有三种方法:生产法(增值法、部门法)、支出法、收入法。(1) 产生算法:生产法又称为部门法或增值法,各部门新创造的价值加总。增值产出投入。每个生产阶段增值该阶段各生产要素报酬之和整个生产阶段增值总和所有最终产品的价值总和(2) 支出算法:通过核算整个社会在一定时期内购买最终产品的总支出,即最终产品的总卖价来计量GDP。(3) 收入算法总产出 = 总收入收入法是用产出带来的收入来核

22、算GDP观察:从根本上来讲,一个经济社会的收入都是属于私人的;收入与产出永远相等,因为产出形成之时,也是获得收入之时。1.4 GDP 预测的意义国内生产总值(GDP)受经济基础、人口增长、资源、科技文化、环境、体制、发展战略等诸多因素的影响,这些因素之间又有着错综复杂的关系,因此,运用结构性的时间序列模型分析和预测GDP往往比较困难。将历年的GDP 作为时间序列,根据过去的数据得出其变化规律,建立预测模型,用此来预测未来的发展变化,有着重要的意义。改革开放以来,我国经济飞速发展。2001年排名已升到世界第六位,而到2011年已排名世界第二。GDP反映了全社会最终产品和劳务产品的总价值,是衡量一

23、个国家和地区经济发展的重要指标。因此,对我国GDP变化趋势的研究,能够更准确地把握我国经济发展的动向。使我国能够有一个稳定明确的目标,达到更好的发展。1.5 中国经济发展的现状在1978年到2010年的32年间,中国的经济年平均增长9.9%,接近10%。在十一五的五年中即2006年到2010年,中国经济实际年均增长为11.2%。7%是家宝总理3月份在两会政府工作报告所说的,十二五经济增长预期目标,是在明显提高质量和效益的基础上,年均增长7%。这是否说明十二五跟十一五相比,中国的经济增长出现了大幅度地滑坡呢?可以从以下两个角度来分析:1、从经济增长的预期目标来看,十一五经济增长预期目标是7.5%

24、,十二五经济增长预期目标是7%,十二五跟十一五相比,只是回落了0.5个百分点,并没有出现大幅度地下降。2、十一五经济实际增长是11.2%,在十二五的五年中,中国经济年平均增长9%,有的高于9%,从经济实际增长的情况来看,十二五和十一五相比,经济的实际增长虽然出现了两个百分点左右的回落,但是并没有大幅度的回落。由于过去的32年中国经济年均增长9.9%,被国际社会誉为“中国经济奇迹”。从世界经济历史来看,被称之为“经济奇迹”的国家不多,日本经济奇迹在二战以后,保持了20多年的年均10%的高速增长,德国保持年均接近10%的经济的高增长。在未来30年中,中国如果能够保持年均6%的经济增长,就可再造中国

25、经济奇迹。1.6论文的主要研究内容1.6.1 基本思路通过本课题的研究,学习并熟练掌握SPSS软件技术,利用时间序列分析方法,建立我国GDP时间序列模型,分析经济增长的内在特征。并对未来我国经济发展做出预测,为政府制定经济发展战略提供依据。1.6.2 文章结构安排第一章为绪论。第二章为GDP时间序列预测模型。第一节简单介绍了SPSS软件技术、要素及构成;第二节介绍了时间序列预测模型的发展及现状;第三节详细介绍了时间序列预测模型的算法。第三章为我国GDP时间序列模型的构建。第四章为模型的比较。指数平滑法、自回归法、ARIMA模型和季节调整方法进行分析第五章是本文的结尾章,对全文做了总结与概括。北

26、京邮电大学世纪学院毕业设计(论文) 第2章 GDP时间序列预测基本方法2.1时间序列分析的数据预处理2.1.1 差分运算一阶差分 阶差分 步差分 差分方法是一种非常简便、有效的确定性信息提取方法,Cramer分解定理在理论上保证了适当阶数的差分一定可以充分提取确定性信息。差分运算的实质是使用自回归的方式提取确定性信息: 差分方式的选择: 序列蕴含着显著的线性趋势,一阶差分就可以实现趋势平稳。 序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响。对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息。2.1.2 平稳性检验平稳性是某些时间序列具有的

27、一种统计特征。对于平稳的序列我们就可以运用已知的时间序列模型对其进行分析预测。因此对数据进行平稳性检验是时间序列分析法的关键步骤。平稳时间序列有两种定义,根据限制条件的严格程度,分为严平稳时间序列和宽平稳时间序列。 对序列的平稳性有两种检验方法,一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一种是构造检验统计量进行假设检验的方法。通常我们都选用图检验方法检验序列平稳性并用单位根统计检验法加以辅助。(1) 自相关图法自相关函数和偏自相关函数的定义:构成时间序列的每个序列值,之间的简单相关关系称为自相关。自相关程度由自相关系数度量,表示时间序列中相隔期的观测值之间的相关程度。 (2-1

28、)其中,是样本量,为滞后期,代表样本数据的算术平均值。自相系数的取值范围是并且越小,自相关程度越高。偏自相关是指对于时间序列,在给定的条件下,与之间的条件相关关系。其相关程度用偏自相关系数度量,有。 (2-2)其中是滞后期的自相关系数。如果序列的自相关系数很快地(滞后阶数大于2或3时)趋于0,即落入随机区间,时间序列是平稳的,反之时间序列是非平稳。若有更多的自相关系数落在随机区间以外,即与零有显著不同,时间序列就是不平稳的。自相关图法仅从直观的判断平稳时间序列与非平稳时间序列的区别。也可用以下的方法在理论上检验。(2) 单位根检验法时间序列的平稳性还可以通过单位根检验来判断,单位根检验目前常用

29、的两种方法是DF和ADF。DF检验法是Dickey和Fuller在70年代和80年代的一系列文章中建立的。其基本思想是:一阶回归模型中,时,序列是平稳的。若,则序列是非平稳的,存在单位根,通过检验是否可能为1,判断序列是否平稳序列。DF检验的假设是。(a) DF检验序列有如下三种形式:不包含常数项和线性时间趋势项 (2-3)包含常数项 (2-4)包含常数项和线性时间趋势项 (2-5)其中,。检验假设为: 序列存在单位根的零假设下,对参数估计值进行显著性检验的t统计量不服从常规的t分布,DF(Diekey&Fuller)于1979年给出了检验用的模拟的临界值,故称检验称为DF检验。一般地,如果序

30、列在0均值上下波动,则应该选择不包含常数和时间趋势项地检验方程,即(2-3)式;如果序列具有非0均值,但没有时间趋势,可选择(2-4)作为检验方程;序列随时间变化有上升或下降趋势,应采用(2-5)的形式。(b) ADF检验在DF检验中,对于(2-3)式,常常因为序列存在高阶滞后相关而破坏了随机扰动项是白噪声的假设,ADF检验对此做了改进。它假定序列服从AR(P)过程。检验分程为 (2-6)式中的参数视具体情况而定,一般选择能保证是白噪声的最小的值。与DF检验一样,ADF检验也可以有包含常数项和同时含有常数和线性时间趋势项两形,只需在(2-6)式右边加上或与。2.2时间序列分析基本模型2.2.1

31、指数平滑模型2.2.1.1 指数平滑概念指数平滑法是布朗(Robert G.Brown)所提出,布朗(Robert G.Brown)认为时间序列的态势具有稳定性或规则性,所以时间序列可被合理地顺势推延;他认为最近的过去态势,在某种程度上会持续到最近的未来,所以将较大的权数放在最近的资料。 指数平滑法是生产预测中常用的一种方法。也用于中短期经济发展趋势预测,所有预测方法中,指数平滑是用得最多的一种。简单的全期平均法是对时间数列的过去数据一个不漏地全部加以同等利用;移动平均法则不考虑较远期的数据,并在加权移动平均法中给予近期资料更大的权重;而指数平滑法则兼容了全期平均和移动平均所长,不舍弃过去的数

32、据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。 也就是说指数平滑法是在移动平均法基础上发展起来的一种时间序列分析预测法,它是通过计算指数平滑值,配合一定的时间序列预测模型对现象的未来进行预测。其原理是任一期的指数平滑值都是本期实际观察值与前一期指数平滑值的加权平均。2.2.1.2 指数平滑计算指数平滑法的基本公式是: 式中, St-时间t的平滑值; yt-时间t的实际值; St 1-时间t-1的平滑值; a-平滑常数,其取值范围为0,1; 由该公式可知: 1.St是yt和 St 1的加权算数平均数,随着a取值的大小变化,决定yt和 St 1对St的影响程度,当a取

33、1时,St = yt;当a取0时,St = St 1。 2.St具有逐期追溯性质,可探源至St t + 1为止,包括全部数据。其过程中,平滑常数以指数形式递减,故称之为指数平滑法。指数平滑常数取值至关重要。平滑常数决定了平滑水平以及对预测值与实际结果之间差异的响应速度。平滑常数a越接近于1,远期实际值对本期平滑值影响程度的下降越迅速;平滑常数a越接近于 0,远期实际值对本期平滑值影响程度的下降越缓慢。由此,当时间数列相对平稳时,可取较大的a;当时间数列波动较大时,应取较小的a,以不忽略远期实际值的影响。生产预测中,平滑常数的值取决于产品本身和管理者对良好响应率内涵的理解。 3.尽管St包含有全

34、期数据的影响,但实际计算时,仅需要两个数值,即yt和St1,再加上一个常数a,这就使指数滑动平均具逐期递推性质,从而给预测带来了极大的方便。 4.根据公式,当欲用指数平滑法时才开始收集数据,则不存在y0。无从产生S0,自然无法据指数平滑公式求出S1,指数平滑法定义S1为初始值。初始值的确定也是指数平滑过程的一个重要条件。 如果能够找到y1以前的历史资料,那么,初始值S1的确定是不成问题的。数据较少时可用全期平均、移动平均法;数据较多时,可用最小二乘法。但不能使用指数平滑法本身确定初始值,因为数据必会枯竭。 如果仅有从y1开始的数据,那么确定初始值的方法有: 1)取S1等于y1; 2)待积累若干

35、数据后,取S1等于前面若干数据的简单算术平均数,如:S1=(y1+ y2+y3)/3等等。 据平滑次数不同,指数平滑法分为:一次指数平滑法、二次指数平滑法和三次指数平滑法等。 (一) 一次指数平滑预测 当时间数列无明显的趋势变化,可用一次指数平滑预测。其预测公式为: yt+1=ayt+(1-a)yt 式中, yt+1-t+1期的预测值,即本期(t期)的平滑值St ; yt-t期的实际值; yt-t期的预测值,即上期的平滑值St-1 。 该公式又可以写作:yt+1=yt+a(yt- yt)。可见,下期预测值又是本期预测值与以a为折扣的本期实际值与预测值误差之和。 (二) 二次指数平滑预测 二次指

36、数平滑是对一次指数平滑的再平滑。它适用于具线性趋势的时间数列。其预测公式为: yt+m=(2+am/(1-a)yt-(1+am/(1-a)yt=(2yt-yt)+m(yt-yt) a/(1-a) 式中,yt= ayt-1+(1-a)yt-1 显然,二次指数平滑是一直线方程,其截距为:(2yt-yt),斜率为:(yt-yt) a/(1-a),自变量为预测天数。 (三) 三次指数平滑预测 三次指数平滑预测是二次平滑基础上的再平滑。其预测公式是: yt+m=(3yt-3yt+yt)+(6-5a)yt-(10-8a)yt+(4-3a)yt*am/2(1-a)2+ (yt-2yt+yt)*a2m2/2(

37、1-a)2 式中,yt=ayt-1+(1-a)yt-1 它们的基本思想都是:预测值是以前观测值的加权和,且对不同的数据给予不同的权,新数据给较大的权,旧数据给较小的权。指数平滑法的趋势调整 一段时间内收集到的数据所呈现的上升或下降趋势将导致指数预测滞后于实际需求。通过趋势调整,添加趋势修正值,可以在一定程度上改进指数平滑预测结果。调整后的指数平滑法的公式为: 包含趋势预测(YITt)=新预测(Yt)+趋势校正(Tt) 进行趋势调整的指数平滑预测有三个步骤: 1、 利用前面介绍的方法计算第t期的简单指数平滑预测(Yt); 2、 计算趋势。其公式为: Tt=(1-b)Tt-1+b(Yt-Yt-1)

38、其中, Tt=第t期经过平滑的趋势; Tt-1=第t期上期经过平滑的趋势; b=选择的趋势平滑系数; Yt=对第t期简单指数平滑预测; Yt-1=对第t期上期简单指数平滑预测。 3、计算趋势调整后的指数平滑预测值(YITt)。计算公式为:YITt=Yt+Tt2.3自回归模型建模2.3.1 自回归概念向量自回归模型(简称自回归模型VAR模型)是一种常用的计量经济模型,由克里斯托弗西姆斯(Christopher Sims)提出。它是AR模型的推广。2.3.2 自回归建模VAR模型描述在同一样本期间内的n个变量(内生变量)可以作为它们过去值的线性函数。 例1Yt = +Xt-1 + ut,t = 1

39、,2,n 本例中Y的现期值与X的一期滞后值相联系,比较一般的情况是: Yt = +0Xt +1Xt-1 +sXt-s + ut,t = 1,2,n 即Y的现期值不仅依赖于X的现期值,而且依赖于X的若干期滞后值。这类模型称为分布滞后模型,因为X变量的影响分布于若干周期。 例2Yt = +Yt-1 + ut, t = 1,2,n 本例中Y的现期值与它自身的一期滞后值相联系,即依赖于它的过去值。一般情况可能是: Yt = f (Yt-1, Yt-2, , X2t, X3t, ) 即Y的现期值依赖于它自身若干期的滞后值,还依赖于其它解释变量。 在本例中,滞后的因变量(内生变量)作为解释变量出现在方程的

40、右端。这种包含了内生变量滞后项的模型称为自回归模型。 在这类模型中,由于在X和它的若干期滞后之间往往存在数据的高度相关,从而导致严重多重共线性问题。因此,分布滞后模型极少按(1)式这样的一般形式被估计。通常采用对模型各系数j施加某种先验的约束条件的方法来减少待估计的独立参数的数目,从而避免多重共线性问题,或至少将其影响减至最小。这方面最著名的两种方法是科克方法和阿尔蒙方法。2.4季节分解模型时间序列可以认为是四个基本部分共同组成的,及趋势T,周期C,季节S,随机R。组成方式可以分为加法型和乘法型。在实际中很难讲趋势和周期彻底分开,因此可以将这两个放在一起考虑。操作步骤:第一步:创建时间序列,通

41、过序列图和ACF观察趋势。第二步:使用分解法对数据进行预测。(1)分解数据。对price变量进行分解,分解后得到ERR_1,SAS_1,SAF_1,STC_1四个变量。(2)创建一个常数序列,t=1,2,3.n。(3)对STC_1和t序列进行曲线回归。比较各个模型得出的结果,看哪个模型的R方最大,通过显著性检验,也要在相关性表格中看是否通过了t检验。有的模型R方大,单是没有通过F检验,或者自变量没有通过t检验。(4)选择拟合度最优的模型,写出该模型的方程trend=常数+*t(常数和阿尔法是最优模型的参数)。(5)若使用乘法型分解法,预测变量f=trend*SAF_1,若使用乘法模型,则f=t

42、rend+SAF_1。该变量剔除了随机因素的影响,包括季节因素、周期因素、趋势因素的影响。(6)拟合price观测值与预测值f的趋势。SPSS操作 (1)分析-预测-季节性分解;(2)在Excel中创建t,拷贝到SPPS中;(3)分析-回归-曲线估计,因变量选择STC_1,自变量选择t,选择所有的模型,显示ANOVA表格;(4)转换-计算变量;(5)转换-计算变量;(6)分析-预测-序列图;第三步进行结果分析。2.5 ARIMA模型建模步骤2.5.1数据平稳化处理首先要对时间序列数据进行平稳性检验。可以通过时间序列的散点图或折线图对序列进行初步的平稳性判断。一般采用ADF单位根检验来精确判断该

43、序列的平稳性。对非平稳的时间序列,我们可以先对数据进行取对数或进行差分处理,然后判断经处理后序列的平稳性。重复以上过程,直至成为平稳序列。此时差分的次数即为 模型中的阶数。从理论上而言,足够多次的差分运算可以充分地提取序列中的非平稳确定性信息。但应当注意的是,差分运算的阶数并不是越多越好。因为差分运算是一种对信息的提取、加工过程,每次差分都会有信息的损失,所以在实际应用中差分运算的阶数要适当,应当避免过度差分,简称过差分的现象。一般差分次数不超过2次。 数据平稳化处理后,模型即转化为模型。2.5.2模型识别我们引入自相关系数和偏自相关系数这两个统计量来识别模型的系数特点和模型的阶数。若平稳序列

44、的偏相关函数是截尾的,而自相关函数是拖尾的,可断定序列适合模型;若平稳序列的偏相关函数是拖尾的,而自相关函数是截尾的,则可断定序列适合模型;若平稳序列的偏相关函数和自相关函数均是拖尾的,则序列适合模型。自相关函数成周期规律的序列,可选用季节性乘积模型。自相关函数规律复杂的序列,可能需要作非线性模型拟合。在平稳时间序列自相关函数和偏自相关函数上初步识别ARMA模型阶数和q,然后利用AIC定则准确定阶。AIC准则3:最小信息准则,同时给出ARMA模型阶数和参数的最佳估计,适用于样本数据较少的问题。目的是判断预测目标的发展过程与哪一随机过程最为接近。因为只有当样本量足够大时,样本的自相关函数才非常接

45、近母体的自相关函数。具体运用时,在规定范围内使模型阶数从低到高,分别计算AIC值,最后确定使其值最小的阶数是模型的合适阶数。关于模型,AIC函数定义如下:式中:n平稳序列为样本数,为拟合残差平方和p,q为参数。 AIC准则定阶方法可写为:其中:M,N为ARMA模型阶数的上限值,一般取为根号n或n/10。实际应用中p,q一般不超过2。2.5.3参数估计确定模型阶数后,应对ARMA模型进行参数估计。本文采用最小二乘法OLS进行参数估计,需要注意的是,模型的参数估计相对困难,应尽量避免使用高阶的移动平均模型或包含高阶移动平均项的ARMA模型。2.5.4参数估计完成模型的识别与参数估计后,应对估计结果

46、进行诊断与检验,以求发现所选用的模型是否合适。若不合适,应该知道下一步作何种修改。这一阶段主要检验拟合的模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否为白噪声。参数估计值的显著性检验是通过t检验完成的Q检验的零假设是即模型的误差项是一个白噪声过程。Q统计量定义为近似服从分布,其中表示样本容量,表示用残差序列计算的自相关系数值,表示自相关系数的个数,表示模型自回归部分的最大滞后值,表示移动平均部分的最大滞后值。用残差序列计算Q统计量的值。显然若残差序列不是白噪声,残差序列中必含有其他成份,自相关系数不等于零。则Q值将很大,反之值将很小。判别规则是: 若,则接受。

47、 若,则拒绝。其中表示检验水平。第3章 GDP时间序列预测模型的构建3.1 指标选取与数据处理 关于数据的选取方面,由于考虑到改革开放近30年中国的经济高速发展,相比之前的二三十年这个时间段的GDP增速较高,如果很笼统的囊括了六七十年代的数据的话,模型的分析以及预测效果可能并不是非常的理想,或者说和改革开放后的30多年相比,之前的发展阶段不一样的年代的数据对本文所构建模型的分析及预测显得并不是很重要。下面以我国19812010年国内生产总值数据为例,该数据从中国统计年鉴 2011中查找。介绍用时间序列分析法对数据分析的过程,并通过其预测2009及2010两年的国内生产总值与实际的国内生产总值比

48、较,选取最为合理的预测方法对未来5年我国GDP的做出预测。实际上2011年的GDP数据已经可以查阅,但为了数据的权威性,选择了中国统计年鉴 2011中GDP数据,而且并不影响模型的分析和预测效果。根据应用时间序列的基本原理知识我们得知,在进行建模之前,首先要对数据进行一些简单的处理。本文主要是对GDP时间序列数据进行平稳性检查,然后再进行平稳化处理。另外本文的实证分析,采用了Eviews软件来对数据进行各种处理和分析。YEAR1234GDP总和1992497463587119847226923.519936500804490481174235333.9199490651108512447156

49、0148197.919951185814110155351929160793.719961426116601176712264471176.61997162571833719148248717897319981750119732203722680784402.319991879020765218592826389677.120002064723101243403112799214.6200123300256512686733837109655.2200225376279652971637276120332.7200328861.831007.133460.442493.5135822.8200

50、433420.636985.339561.749910.7159878.3200539117.442795.244744.458280.4184937.4200645315.850112.751912.868973.1216314.4200754755.96124364102.285709.2265810.3200866283.87419476548.397019.3314045.4200969816.978386.783099.7109599.5340902.8201082613.492265.497747.9128886.1401512.8201197101.2108674.2115443

51、.7150344.6471563.73.2 我国GDP的时间序列模型从3.1的数据中得出本节的指数平滑模型,如下图:图-图-模型拟合拟合统计量均值SE最小值最大值百分位5102550759095平稳的 R 方-1.478.-1.478-1.478-1.478-1.478-1.478-1.478-1.478-1.478-1.478R 方.945.945.945.945.945.945.945.945.945.945RMSE30301.565.30301.56530301.56530301.56530301.56530301.56530301.56530301.56530301.56530301.

52、565MAPE13.116.13.11613.11613.11613.11613.11613.11613.11613.11613.116MaxAPE26.691.26.69126.69126.69126.69126.69126.69126.69126.69126.691MAE22232.838.22232.83822232.83822232.83822232.83822232.83822232.83822232.83822232.83822232.838MaxAE70053.520.70053.52070053.52070053.52070053.52070053.52070053.52070

53、053.52070053.52070053.520正态化的 BIC20.788.20.78820.78820.78820.78820.78820.78820.78820.78820.788模型统计量模型预测变量数模型拟合统计量Ljung-Box Q(18)离群值数平稳的 R 方正态化的 BIC统计量DFSig.GDP总和-模型_10-1.47820.78871.83217.0000指数平滑法模型参数模型估计SEtSig.GDP总和-模型_1无转换Alpha (水平)1.000.2703.706.001图-自回归模型,如下:自相关图序列:GDP总和滞后自相关标准 误差aBox-Ljung 统计量值dfSig.b1.793.20814.5801.0002.615.20223.8152.0003.465.19729

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论