版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二篇预测方法与模型预测是研究客观事物未来开展方向与趋势的一门科学。统计预测是以统计调查资料为依据,以经济、社会、科学技术理论为根底,以数学模型为主要手段,对客观事物未来开展所作的定量推断和估计。根据社会、经济、科技的预测结论,人们可以调整开展战略,制定管理措施,平衡市场供求,进行各种各样的决策。预测也是制定政策,编制规划、方案,具体组织生产经营活动的科学根底。20世纪三四十年代以来,随着人类社会生产力水平的不断提高和科学技术的迅猛开展,特别是近年来以计算机为主的信息技术的飞速开展,更进一步推动了预测技术在国民经济、社会开展和科学技术各个领域的应用。预测包含定性预测法、因果关系预测法和时间序列预测法三类。本篇对定性预测法不加以介绍,对后两类方法选择以下几种介绍方法的原理、模型的建立和实际应用,分别为:时间序列分析、微分方程模型、灰色预测模型、人工神经网络。第五章时间序列分析在预测实践中,预测者们发现和总结了许多行之有效的预测理论和方法,但以概率统计理论为根底的预测方法目前仍然是最根本和最常用的方法。本章介绍其中的时间序列分析预测法。此方法是根据预测对象过去的统计数据找到其随时间变化的规律,建立时间序列模型,以推断未来数值的预测方法。时间序列分析在微观经济计量模型、宏观经济计量模型以及经济控制论中有广泛的应用。第一节时间序列简介所谓时间序列是指将同一现象在不同时间的观测值,按时间先后顺序排列所形成的数列。时间序列一般用J,J,…,J,…来表示,可以简记为{^}。它的时间单位可以是分钟、1 2 n t时、日、周、旬、月、季、年等。一、时间序列预测法时间序列预测法就是通过编制和分析时间序列,根据时间序列所反响出来的开展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后假设干年内可能到达的水平。其内容包括:收集与整理某种社会现象的历史资料;将这些资料进行检查鉴别,排成数列;分析时间序列,从中寻找该社会现象随时间变化而变化的规律,得出一定的模型,以此模型去预测该社会现象将来的情况。二、时间序列数据的特点通常,时间序列经过合理的函数变换后都可以看作是由三个局部叠加而成,这三个局部是趋势项局部、周期项局部和随机项局部。趋势性许多序列的一个最主要的特征就是存在趋势。这种趋势可能是向下的也可能是向上的,也许比拟陡,也许比拟平缓,或者是指数增长,或者近似线性。总之,时间序列的趋势性是依据时间序列进行预测的本质所在。季节性/周期性当数据按照月或季观测时,通常的情况是这样的:时间序列会呈现出明显的季节性。对季节性也不存在一个非常精确的定义。通常,当某个季节的观测值具有与其它季节的观测值明显不同的特征时,就称之为季节性。异常观测值异常观测值指那些严重偏离趋势范围的特殊点。异常观测值的出现往往是由于某些不可抗拒的外部条件的影响。如1958-1960年自然灾害和1966年左右“文化大革命〃对我国经济的影响,造成经济指标陡然下降现象;1992年,我国银行紧缩政策造成的房地产业泡沫破灭,而使得房地产业的经济数据发生突然变化的例子等等。条件异方差性所谓条件异方差性,表现出来就是异常数据观测值成群地出现,故也称为“波动积聚性〃。由于方差是风险的测度,因此波动存在的积聚性的预测对于评估投资决策是很有用的,对于期权和其它金融衍生产品的买卖决策也是有益的。非线性对非线性的最好定义就是“线性以外的一切〃。非线性常常表现为“机制转换〃(regimewitches)或者“状态依赖(Statependence)。其中状态依赖意味着时间序列的特征依赖于其现时的状态;不同的时刻,其特征不一样。当时间序列的特征在所有的离散状态都不一样时,就成为机制转换特性。三、时间序列的分类按研究的对象的多少可分为单变量时间序列和多变量时间序列。如果所研究的对象是一个变量,如某个国家的国内生产总值,即为单变量时间序列。果所研究的对象是多个变量,如按年、月顺序排列的气温、气压、雨量数据,为多变量时间序列。多变量时间序列不仅描述了各个变量的变化规律,而且还表示了各变量间相互依存关系的动态规律性。按时间的连续性可将时间序列分为离散时间序列和连续时间序列。如果某一序列中的每一个序列值所对应的时间参数为间断点,那么该序列就是一个离散时间序列。如果某一序列中的每个序列值所对应的时间参数为连续函数,那么该序列就是一个连续时间序列。按序列的统计特性可分为平稳时间序列和非平稳时间序列两类。如果某个时间序列的概率分布与时间t无关,那么称该序列为严格的〔狭义的〕平稳时间序列。如果序列的一、二阶矩存在,而且对任意时刻t满足:〔1〕均值为常数〔2〕协方差为时间间隔的函数那么称该序列为宽平稳时间序列,也叫广义平稳时间序列。反之,不具有平稳性,即序列均值不为常数或协方差与时间有关的序列称为非平稳序列。按序列的分布规律可分为高斯型时间序列和非高斯时间序列。服从高斯分布(正态分布)的时间序列叫做高斯时间序列,否那么叫做非高斯型时间序列。对于一些非高斯序列,往往可以通过适当的变换,可近似地看成是高斯型时间序列。四、常用的时间序列分析法时间序列分析预测分为确定性时序分析预测方法和随机性时序分析预测方法两大类。确定性时序分析假设一个时间序列的未来值被某一个数学函数严格确定,例如:y=cos(2兀ft)这种形式,那么称该时间序列为确定性的。确定性时间序列分析模型主要包括:移动平均模型、二次滑动平均模型、指数平滑模型、二次指数平滑模型和三次指数平滑模型。随机时间序列分析假设一个时间序列的未来值只能用概率分布加以描述,那么称之为非确定性的时间序列或称随机时间序列。随机时间序列分析模型分为三种类型:自回归模型〔Auto-regressiveModel〕、滑动平均模型〔MovingAverageModel〕和自回归滑动平均模型〔Auto-regressiveMovingAverageModel〕。随机时序分析以随机过程理论作为其数学根底,通过对时序数据进行分析,完成对时序系统的预测、建模和控制。五、针对时间序列数据的建模步骤时间序列模型最主要的特征就是成认观测值之间的依赖关系和相关性,它是一种动态模型,能够应用于动态预测。时间序列预测方法的一般步骤为:确定预测目标明确预测的目标是进行有效预测的前提。预测的目标不同,所需的资料和采用的预测方法也有所不同。有了明确具体的预测目标,才能有的放矢地收集资料。预测目标确实定应尽量明细化、数量化,以利于预测工作的顺利开展。收集资料并进行数据的预处理准确调查的统计资料是统计预测的根底。预测之前,必须掌握大量的、全面的、准确有用的数据和情况。为保证统计资料的准确性,必须对资料进行审核、调整和推算。比方缺损值问题,它破坏了系统运行的连续性,特别是对于时间序列来说,缺损值违背了时间序列“顺序的重要性〃原那么。严格来说,不能依据一个“残缺〃的序列进行分析,即使强制进行了分析,其结果也是无意义的。因此必须对缺损值进行预处理:如缺失较少,且缺失数据前后无大的波动,那么可用平滑法、开展速度推算法、比例推算法、插值估算法等方式填充数据。这些方式既完善了数据,也不会使数据信息丧失太多。对于数据缺失较多的情况,如时间序列中连续一段时间缺失数据,就不能简单地用平滑的方式填充,因为这样可能丧失很重要的信息,这种情况下建模毫无意义,只能通过其他途径重新收集资料。此外,还要对序列中每一个数据的指标口径、计算范围、计算方法、计量单位等进行认真检查,假设存在不一致,那么要运用科学的方法进行调整,使整个序列中的每一个数据除时间属性不同之外,其所代表的实际意义完全一致。对资料进行初步分析对经审核的数据应进行初步分析,画出统计图形,以观察统计数据的性质和分布,以此作为选择适当预测模型的依据。〔1〕观察统计图形是否具有大的波动,如果存在,可能是数据采样时的误差,也可能是某些经济、政治等偶然性因素的冲击。特别是在国际期货、现货市场上,这种偶然性更是经常发生,使得期货市场呈现较大波动,现货市场也随之波动。这种冲击或误差造成的结果可能是结构性突变,在统计图形上就表现为突然的持续上涨或下降。不管是什么原因引起的,如果建模时忽略结构性突变,可能会得到虚假的结论,即伪结论。〔2〕观察其统计图形的大致走势,是否具有趋势性、季节性、周期性或随机性的特征,以初步判断这个序列适用哪种时序预测模型。选择预测方法一方面,通过对资料数据的整理、分析,清楚地了解到预测对象的变化情况;另一方面通过对各种时序预测方法在适宜性、费用和精确度方面的综合衡量,我们就可以选择出适当的预测方法。预测和结果评价进行预测时,不能简单地依靠某一理论或套用某一模型加以预测,要综合考虑各方面的情况,因为实际情况错综复杂,影响因素众多。借助于经验判断、逻辑推理、统计分析等方面的预测判断,能够使预测的结果更为合理,从而得出最后的预测结果。对预测结果的评价主要是通过对预测误差的分析进行的。分析预测的误差时要考虑以下两种情况:一是理论预测误差,即在选用预测方案之前,利用数学统计模型所估计的理论预测值,与同期的实际观察值相比而产生的误差,然后分析、改良,选择较为适宜的数学统计模型。二是实际预测误差,即在选用预测方案之后,追踪、检查预测方案的结果是否符合实际的情况,分析预测误差的大小以及所造成的原因,总结经验教训,进一步改良今后的预测工作。对预测结果的评价,主要从统计检验和直观判断两个方面着手来判断预测结果的可信度、是否跟实际情况相吻合等,然后根据对预测结果的分析与评价,确定最终的预测值。六、时间序列的优、缺点优点〔1〕时间序列预测法只需要一个变量在不同时刻的观测值即可建模,因而得到广泛应用。〔2〕时间序列预测法没有过于严格的假定条件。〔3〕应用随机时间序列分析时,无需一开始就假设一个固定的模式,而是先假设一个试用模式,然后根据误差等各种信息来判断初步假设的模式是否恰当。如果恰当,那么进行预测;如不恰当,那么修正模型。反复这个过程,可在根本模式方面获得一个最优预测模型,使误差为最小。所以随机时间序列预测方法特别适合于处理复杂的时间序列,以及存在多种模式的预测情况,它能利用一套明确规定的准那么来处理这些复杂的模式。〔4〕时间序列是一种精确度很高的短期预测方法,而且既可以做点预测,也可以做区间预测。缺点事实上,大多经济现象的变化开展是千变万化的,在一个较长时间内外界影响因素变化的可能性较大,而时间序列分析预测法是根据预测对象过去和现在的开展变化规律和趋势来预测未来的,所以它只能在较短时间内做出有效预测。预测的超前时间一般不应超过时间序列历史区间的十五分之一。也就是说,假设时间序列采集的历史统计数据的时间区间是五年,那么最多只能在此后三到四个月内做出较为有效的预测,并且预测时间越长,预测误差越大。第二节移动平均模型移动平均法就是根据历史统计数据的变化规律,使用最近时期数据的平均数,利用上一个或几个时期的数据产生下一期的预测值。移动平均法是一种常用确实定性时间序列预测法,本节主要介绍一次移动平均预测法和加权一次移动平均预测法。一、简单一次移动平均预测法序列J,J,,J是预测前的实际数据组成的时间序列。如果过早的数据已失去意义,1 2 n不能反映当前数据的规律,那么可以用一次移动平均法来作预测。即保存最近一个时间区间内的数据,用其算术平均数作为预测值。
(5.2.1)设时间序列为{yt},取移动平均的项数为n,那么第t+(5.2.1)八 y+y++y1寸y=M(1)=—t 1—1 1—n+1=―乙yn nj=1 J其中:七表示第t期实际值;§表示第t+1期预测值〔t>0〕。t+1预测标准误差为:(5.2.2)上式中,N为时间序列{y}所含原始数据的个数。当预测目标的根本趋势是在某一水平上上下波动时,可用一次移动平均法建立预测模型,即用最近n期序列值的平均值作为未来各期的预测结果。项数n的数值,要根据时间序列的特点而定,不宜过大或过小。n过大会降低移动平均数的敏感性,影响预测的准确性;n过小,移动平均数易受随机变动的影响,难以反映实际趋势。一般取n的大小能包含季节变动和周期变动的时期为好,这样可消除它们的影响。对于没有季节变动和周期变动的时间序列,项数n的取值要视历史数据的趋势类型而定。一般来说,如果历史数据的类型呈水平型的开展趋势,那么项数n的数值可取较大的数;如果历史数据的类型呈上升〔或下降〕的开展趋势,那么项数n的数值应取较小的数,这样能够取得较好的预测结果。例1表5—1第二行为某种商品一月到十二月的实际销售量。假定未来的销售情况与近期销售情况有关,而与较远时间的销售情况联系不大,试用一次移动平均法预测下一年一月份的销售量。表5—1 某种商品的实际销售量单位:件月份 123456789 1011 12实际 _ _ __ 一15001725 15101720133015351740181017601930销售20001858三个月1578165215201528153516951770平滑值18331897五个月15571564156716271635平滑值17551848解用三个月移动平均预测下一年一月份的销售量为x13=气2+气]+气°=1858+2000+1930〜1929x13=__3~~10 3用五个月移动平均值预测下一年一月份的销售量为八x+x+x+x+x1858+2000+1930+1760+1810…°x= h 10 9 = 浇187213 5 5由于五个月移动平均值对十二月份的销售量拟合较好〔参照表5-1最后一列〕,可以认为预测值1872比1929准确。二、加权一次移动平均预测法简单一次移动平均预测法,是把参与平均的数据在预测中所起的作用同等看待,但实际中参与平均的各期数据所起的作用往往是不同的。为此,需要采用加权移动平均法进行预测,加权一次移动平均预测法是其中比拟简单的一种。计算公式如下:八Wy+Wy+ +Wyy=—1―t 2―t n―tn+1=LWy:W V5.2.3Jt+1 W+W+…+W it—i+1, i1 2 n i=1 i=1其中:yt表示第t期的实际值;y表示第t+1期预测值;t+1W表示权数;in表示移动平均的项数。预测标准误差的计算公式与简单一次移动平均预测法的相同。例2某企业1-11月份的销售收入时间序列如表5—2中的第2列所示。取n=3,并取权数W=3,W2=2,W3=1,试用加权一次移动平均预测法预测12月份的销售收入。解八Wy+Wy+Wy3x606.9+2x574.6+1x533.8y=巳土S= =584.0吗+W2+W3 3+2+1其余依次类推,那么八Wy+Wy+Wy 3x1102.7+2x1015.1+1x963.9y=———= 3——2~1 =1050.41 2 3其预测标准误差为=100.1e .'80180.7=100.1S =11—3故第12月份销售收入的预测值为1050.4元。其它月份的预测值见表5—2。单位:万元月份t销售收入yt三个月加权移动平均预测值yt+1yt+1-yt+1rav[yt+1-yt+J1234561034789101112Z移动平均法适合于短期预测。这种方法的优点就在于简单方便,但是对于波动较大的时序数据,预测的精度不高,误差很大。一般来说历史数据对未来值的影响是随着时间间隔的增长而递减的,或者数据的变化呈现某种周期性或季节性等特性,所以移动平均法权重的赋予方式就会使计算结果产生很大的误差。第三节指数平滑模型与移动平均预测法不同,指数平滑法采用了更切合实际的方法,即对各期观测值依时间顺序进行加权平均作为预测值。本节主要介绍一次指数平滑法和二次指数平滑法。一、一次指数平滑法一次指数平滑法是利用前一时刻的数据进行预测的方法。它适用于变化比拟平稳,增长或下降趋势不明显的时间序列数据的下一期的预测。其模型是J广ky^1+(1-k)y,1 G.3.1)其中:y表示第t-1期实际值;t-1yt表示第t期预测值;k称为平滑系数,0<k<1。G.3.1)式说明只需前一时期的观测值及预测值即可预测本期值。每期预测值虽然只用了上期的观测值和预测值,但实际上包含了以前各个时刻数据的影响。从而,指数平均法可看成是移动平均法的推广。平滑系数k的取值对预测值的影响是很大的,但目前还没有一个很好的统一选值方法,一般是根据经验来确定的。当时间序列数据是水平型的开展趋势类型,k可取较小的值,一般在0~0.3之间;当时间序列数据是上升〔或下降〕的开展趋势类型,k应取较大的值,一般在0.6~1之间。在进行实际预测时,可选不同的k值进行比拟,从中选择一个比拟适宜的。
在实际预测时,还要确定初始值。一般来说,如果只有一期数据或少量数据,没有其它任何信息,可以取序列的第一个数据为初值;如果数据较多,可以取前几期的数据或前一半的数据的平均值作为初值;也可以用专家估计方法或其它预测方法预测出的第一期数据作为初值;如对初值的选取把握不大,开始时可选取较大的知以减轻预测值对初值的依赖,过一段时间后再把k值降下来。例1某仓库2002年1月至12月钻头的实际使用量如表5-3所示,要求对2003年1月钻头需求量进行预测。表5-3钻头实际用量表单位:个月份123456 7 891011 12使用量273533373538 48 41434937 40解假设取上年度〔2001年〕钻头使用的实际平均值35作为2002年1月份的初始预测值,即宁广35;取不同平滑系数k=0.2、0.5、0.8,每个月的预测数据如表5-4所示。表5-4钻头实际用量—预测用量对照日期实际用量预测值k=0.2k=0.5k=0.82002年1月273535352002年2月35312002年3月33332002年4月37332002年5月35352002年6月38352002年7月482002年8月412002年9月4342002年10月492002年11月372002年12月402003年1月二、二次指数平滑法二次指数平滑预测法是对一次指数平滑值再作一次指数平滑来进行预测的一种方法,但第t+1期预测值并非第t期的二次指数平滑值,而是采用以下计算公式进行预测:(5.3.2)叩="+(1-k)项(5.3.2)<S⑵=kS⑴+(1-k)S⑵t t t-1§ =a+bTVt+T tt其中:S⑴表示第t期的一次指数平滑值;tS⑵表示第t期的二次指数平滑值;t七表示第t期实际值;§*t表示第t+T期预测值;k表示平滑系数;a=2S(1)-S(2)b=-^SQ)—S(2))^ 1—k* * 。初值S⑴S(2)的取值方法与y的取法相同。0、 0 1例2表5—5中第2列数据是某股票在8个连续交易日的收盘价,试用二次指数平滑法预测第9个交易日的收盘价。〔S0D=S02)=七,k=0.4〕表5—5某股票价格 单位:元ty*S⑴S(2)Ayt+1-yt+1rav[y*+1-y*+J2009Z解利用公式G.3.2)计算得到的一、二次平滑值如表5—5第3、4列所示。因此a=2S⑴—S(2)=2x17.18—16.98=17.388k(8 )04b-S⑴-S(2))= .X(17.18-16.98)^0.138 1一k8 8 1一0.4于是,有y=a+bT=17.38+0.13T8+T 8 8取T=1,得到y=a+bT=17.38+0.13=17.51〔元〕8+1 8 8故而得到第9个交易日收盘价的预测值为17.51元。第四节随机时间序列模型随机时间序列模型是一种精确度较高的短期预测方法。其根本思想是:某些时间序列是依赖于时间*的一组随机变量,构成该序列的单个序列值虽然具有不确定性,但整个序列的变化却有一定的规律性,可以用相应的数学模型近似描述。通过对该数学模型的分析研究,能够更本质地认识时间序列的结构与特征,到达最小方差意义下的最优预测。本节将对随机
时间序列分析的三种模型的模型识别及参数估计作简要的介绍。一'自回归模型假设时间序列yt为它的前期值和随机项的线性函数,表示为y=甲y+甲y+…+甲y+日t1t—1 2t—2 pt—p t那么称该时间序列{y}为自回归序列,该模型为p阶自回归模型〔Auto-regressiveModel〕,t记为AR(p)。其中:参数甲],%,-,甲为自回归参数,是模型的待估参数;随机项已是白噪声序列〔旦是互相独立的并且服从均值为 0、方差为52的正态分布〕;并且随机项旦与t |1 ty,y,…,y 不相关。t—1t—2 t—p,t t—1y=中By+中B,t t—1y=中By+中B2yh 中Bpy+Rt1t2t ptt其中进一步有(5.4.2)其中进一步有By=y,B2y=y,…,Bpy=y
t t—1 t t—2 t t—p—甲B—中B2 ^Bp>y=^中(B)=1—中B—中B2 中Bp(5.4.3(5.4.3)平(B)y,=气对自回归序列考虑其平稳性条件,可以从最简单的一阶自回归序列进行分析。假设一阶自回归序列的模型为y=甲y+旦,同样y=甲y+旦,迭代下去有t t—1t t—1 t—2 t—1y=日+甲日+甲2日+甲3日…对于一阶自回归序列来讲,假设系数中的绝对值H<1,那么称这个序列是渐进平稳的。对于。阶自回归序列来讲,如果是平稳时间序列,它要求滞后算子多项式中(B)的特征方程1—甲Z—中Z2 中zp=0的所有根的绝对值皆大于1。即p阶自回归序列的渐平稳条件为|z|>1。二、滑动〔移动〕平均模型假设时间序列{yt}中的yt为它前期的误差和随机项的线性函数,可以表示为y=日-。日-。日 0日 (5.4.4)tt1t—1 2t—2 qt—q那么称该时间序列{yt}为滑动平均序列,该模型为q阶滑动〔移动〕平均模型〔MovingAverageModel〕,记为MA(q)。参数0「02,—,0为滑动平均参数,是模型的待估参数。G.4.5)引入滞后算子B,同样(5.4.4)G.4.5)1—0]B—02B2 0Bqh=y令0(B)=1-0B-0B2 0Bq那么模型可写为 qj=0(B川 (5.4.6)为使得MA(q)过程可以转换成一个自回归过程:需要0-1(B)收敛。而0-1(B)收敛的充分必要条件是0(B)的特征方程1-0z-0Z2 0zq=0的所有根的绝对值皆大于1,即|z|>1。这个条件是MA(q)序列的必须满足的可逆性条件,而且当这个可逆性条件满足时,有限阶自回归序列等价于某个无限阶移动平均序列。三、自回归滑动平均模型假设时间序列3」中七为它的当前值与前期的误差和随机项的线性函数,那么可以表示为j=甲j+甲j+…+甲j+p-0p-0p 0p (5.4.7)t1 t-1 2 t-2 p t—p t1 t-1 2 t-2 q t-q那么称该时间序列{jt}为自回归滑动平均序列。又由于模型包含P项自回归模型和q项滑动平均模型,因此该模型称为自回归滑动平均模型〔Auto-regressiveMovingAverageMode〕,记为ARMA(p,q)。参数甲,甲,…,甲为自回归参数,0,0,-",0为滑动平均参数,是模1 2 /P、 1 2q型的待估参数。引入滞后算子B,(5.4.7)式可以表示为甲(B)j=0(B)p (5.4.8)对于ARMA(p,q)模型,其平稳性条件同AR(p)和MA(q)。四、随机时间序列分析模型〔AR,MA,ARMA〕的识别自回归滑动平均模型〔ARMA〕是随机时间序列分析模型的普遍形式,自回归模型〔AR〕和滑动平均模型〔MA〕是它的特殊情况。关于这几类模型的研究,是时间序列的重点内容,本节主要介绍模型的识别的方法和进行模型参数估计时常用的一些方法。1.自相关函数和偏相关函数对于ARMA模型,在进行参数估计之前,需要进行模型的识别。识别的根本的任务是找出ARMA(p,q)、AR(p)、MA(q)模型的具体特征,最主要的是确定模型的阶,即ARMA(p,q)中的p和q,AR(p)中的p以及MA(q)中的q。识别的方法是利用时间序列样本的自相关函数和偏相关函数。〔1〕AR(p)的自相关函数模型(5.4.1)j=甲j+甲j+…+甲j+Pt 1t-1 2t-2 pt-p t的自协方差函数为疽El'+=甲r+甲r+…+甲r1k-1 2k-2 pk一p
从而有自相关函数P=二=pP+甲P+…+甲P
kr1k-1 2k-2 pk-p从而有自相关函数0(5.4.9)AR(p)序列的自相关函数是非截尾序列,或称为拖尾序列,所谓的拖尾型是指咨趋于无穷大时Pk呈负指数衰减趋于零。换句话说AR(p)序列的自相关函数不能在某一步之后为零,而是按负指数率衰减。自相关函数的拖尾现象是AR(p(5.4.9)由(5.4.9),利用Pk=Pk,得到如下方程组:P=甲+甲P+…+甲P1 1 21 pp-1P=甲P+甲P+…+P(5.4.10)P=甲P+甲P=甲P+甲P+…+P(5.4.10)此方程组被称为Yule—Walker方程组。假设模型参数甲],甲2,…,甲,可求P,P,…,P,然后递推下去,可求得P(k>p);反过来,假设P,P,…,P",模型参12 p k 12 p数通过求解方程组得到甲],%,-,*。〔2〕MA(q)的自相关函数模型(5.4.4)y=日—0日—0日—・•,—0日tt1t—1 2t—2 qt—q自相关函数为P二」Io
kP二」Io
kr k0l0+991k+1+...+99)(+92+92+...+92)q-kq. 1 2 qk=01<k<qk>q(5.4.11)由此可见,当k>q时,yt与y*k不相关,并且Pk=0,这种现象称为截尾。换句话说,可以根据自相关系数是否从某一点开始一直为零来判断MA(q)模型的阶。〔3〕ARMA(p,q)的自相关函数ARMA(p,q)的自相关函数可以看作MA(q)的自相关函数和AR(p)的自相关函数的混合。当p=0时,它具有截尾性质;当q=0时,它具有拖尾性质,当p、q都不为零时,它具有拖尾性质。经过推导得到ARMA(p,q)的自协方差函数为r=甲r+甲r+ 甲rk1k-12k-2 pk-p+r(k)-9r(k-1) 9r(k-q)y日 1y日 qy日
其中/X[0 k>0匕(k)=E"七k2甲 k<0Ip-k所以,当k>q时,r二甲r+甲rH 甲rk 1k-12k-2 pk-p(5.4.12)ARMA(p,q)的自相关函数为(5.4.12)p=L=pp+甲p+…+甲pkr1k-1 2k-2 pk-p0可见,ARMA(p,q)的自相关函数Pk,当k>q时,仅依赖于模型参数甲],%,…,甲,以及Pk1,Pk2,…,Pkp。〔4〕偏相关函数所谓偏相关函数,是随机序列模型的另一个统计特征,它是在序列值七-1,七-2,…,七-k-1的条件下,关于七,y『k之间关系的度量。下面以AR(p)为例认识偏相关函数的定义。假定先以AR(k-1)去拟合一个序列,然后又用AR(k)去拟合,后者比前者增加了一个滞后变量y_。如果中持表示后者的自回归系数,那么相应于滞后变量y的系数就是平,称为偏自相关系数。根据AR(p)的拖尾性t-k kk质以及偏自相关系数的含义,可以采用方差最小原那么来求得偏自相关系数m 当1<j<p,k=p,p+1,…^=\j,kj[。当j>p由此得到AR(p)的主要特征是k>p时,Pkk=0,既是Pkk在p以后截尾。对于ARMA(p,q)与MA(q)模型,可以证明它们的偏相关函数是拖尾的。2.模型的识别〔1〕AR(p)模型的识别。假设y,的偏自相关函数Pkk在p以后截尾,即k>p时,平以二0,而且它的自相关函数Pk是拖尾的,那么此序列是适合自回归模型的序列。〔2〕MA(q)模型的识别。假设随机序列的自相关函数截尾,即自q以后P广0,k>q,而它的偏相关函数是拖尾的,那么此序列是适合滑动平均模型的序列。〔3〕ARMA(p,q)模型的识别。假设随机序列的自相关函数和偏相关函数都是拖尾的,那么此序列是适合自回归滑动平均模型的序列。至于模型中p和q的识别,那么要从低阶开始逐步试探,直到定出适宜的模型为止。五、随机时间序列分析模型〔AR,MA,ARMA〕的参数估计经过模型识别,确定了时间序列分析模型的模型结构,接着就可以对模型进行参数估计。AR(p)、MA(q)、ARMA(p,q)模型参数的估计方法较多,大体上分为三类:最小二乘估
计、矩估计和利用自相关函数直接估计。下面有选择地加以介绍。1.AR(p)的最小二乘估计假设模型(5.4.1)的参数估计值P,P,•••©已经得到,有12 p△+△+|L1t-2yt=P1yt1+P_yt-2残差的平方和为顶△2
=乙口t顶△2
=乙口tt=p+1方Pt=p+11yt—1t-2A2p't一。j(5.4.13)根据最小二乘原理,所要求的参数估计值P一,P_,.pp应该使得(5413)到达极小。所以它们应该是以下方程组的解:j=1,2,…,pt=p+1r t=p+1r ,△\L1yt一"2-t—2△-Ppt-pJy--j=0 jT,2,…,p(5.4.14)解该方程组,就可得到待估参数的估计值。2.MA0)模型的矩估计将MA(q)模型的自协方差函数中的各个量用估计值代替,得到,2A1—9+00+...+0 0k1k+k1k+1kk62(1+c2+°2+...+C四22(5.4.15)12k0利用实际时间序列提供的信息,首先求得自协方差函数的估计值,于是(5.4.15)是一个包含(q+1)个待估参数估计值9『92,.,0q,62的非线性方程组,可以用直接法或迭代法求解。常用的迭代法有线性迭代法和Newton-Raphsan迭代法。具体的求解过程不再赘述,读者可参考其它时间序列分析的教科书。3.ARMA(p,q)模型的矩估计在ARMA(p,q)中共有(p+q+1)个待估参数P,P,…,P与9,0,…,0以及62,12p12q |1其估计量计算步骤及公式如下:〔1〕估计P],P2,…,Pp
八中八中A1中2:=APAqPq+1:APq—1APq……APq—p+1PAq一p—1AP"Aq+2©APAP…APpLp」Lq+p—1q+p—2quq+p-1(5.4.16)其中P.是样本的自相关函数的估计值,由观测数据计算得到。〔2〕改写模型,求°,0,…,0及n2的估计值12qR将模型(5.4.7)改写为j一甲j一甲j 甲j=日一0日一0日 0日t1 t—1 2 t—2 p t—p t1 t—1 2 t—2 q t—q令〜 △ △ △J=J一甲J一甲J 甲Jtt1t—12t—2 pt—p于是上式可以写成J=R-0R-0R-,,,一0Rtt1t—12t—2 qt—q构成一个MA(q)模型。按照估计MA(q)模型参数的估计方法,可以得到0,0,…,0及。212q |1的估计值。第五节随机时间序列模型应用时间序列模型的应用是广泛的,下面通过一个例子探讨如何利用样本建立时间序列模型,并通过时间序列模型对某种经济现象进行分析和预测。一、时间序列模型的计算公式TOC\o"1-5"\h\z设有模型J,如果J(/)表示在J,J,…的条件下,对J作出的预测值,称它为l步t t tt—1 t+l预测,其l步预测误差为:u(l)=J—J(l)t t+l t并且最优的预测值就是其条件期望值:J=J(l)=E(jJ,j,…,J)t+l t t+ltt—1 1假设有一平稳可逆的ARMA(p,q)模型,它可以表示为三种等价形式:8(l)J=0(l)u (5.5.1)j=w(l)u (5.5.2)u=兀(l)j (5.5.3)其中:w(l)=8-1(l)0(l)=1+工Wlj;jj=1兀(l)=0-1(l)8(l)=1一切兀lj。j=1如果考虑向前l步预测,也就是说用第t期及前期的序列观测值,即jt,Jt—],…对未来时
并假设(5.5.4)TOC\o"1-5"\h\z刻t+/的序列七+z的值进行估计。假设以时刻t为起点,l步的预测值为*(/)宁(l)=CJ+CJ+CJ+…t 0t1t-1 2t-并假设(5.5.4)显然这种预测是线性的,选择系数C,j=0,1,2,…使得预测误差£(l)=y-y(l)的方j t t+l t差到达最小,即使E(s2(l))=E[y-y(l)]2到达最小。于是就称y(l)为线性最小方差预/ 、/t、 t+l t t测。由式6.5.2)和(5.5.4)有y(l)**〃+w*u +w*u+…t ltl+1t-1 l+2t-2这样 E(s2(l))=E[u+乙Wu 一乙w*u]2t t+l jt+l一j l+jt一jTOC\o"1-5"\h\zj=1 j=0=(1+W2+…+W2)b2+]E(W -W*)2b21 l-1 u j+1 l+j uj=0由上式知当W*=W.(j=0,1,2…)时,预测误差的方差最小,且有j+l j+lE(s2(l))=(1+W2+...+W2)b2由此可以看出预测误差同预测的起点无关,而是随l增大而增大。这样预测值可表示为:y(l)=wu+wu+wu+…=乙Wut lt l+1t-1 l+2t-2 l+jt-jj=0利用条件期望的根本性质,不难推导出ARMA(p,q)模型的预测的更简明的公式。譬如:一步预测公式:y(1)=E(y|y,y,…,y)+ut「£0j=1=E(2L+ut「£0j=1=E(2L©ytj+1j=1y+u|y,y,…,y)jt一j+1 t+1tt-1 1=6y+6y+ $y -O'u-O'u O'u1t2t-1 pt-p+1 1t2t-1 qt-q+1其中u,u_],…是可计算的观测残差。二步预测公式:y(2)=E(y|y,y,…,y)t t+2tt-1 1=6y(1)+6y+ 6y -O'u O'u1t 2t pt-p+2 2t qt-q+2类似的可以求出3步直至l步预测公式。l步预测公式为:y(l)=6y(l-1)+—6y -§u—O'u (5.5.5)t 1t pt-p+l lt qt-q+l特别是当/>p,l>q时,那么式(5.5.5)就为y(i)=6y(特别是当/>p,l>q时,那么式(5.5.5)就为y(i)=6y(i—1)+…+6y(i—p)t 1t pt二、时间序列模型的应用例1ARMA〔1,1〕模型预测值的计算。假设模型为y=8y+u—0u (5.5.6)t+1 1t t+1 1ty的现在值y和t时刻以前的值y,…,y,求一步预测值y(1)和二步预测值y(2)。t t t—1 1 t解根据上面的公式,我们有y⑴=E(y|y,y,…,y)
t t+1tt—1 1=eGy+u—0u\y,y,…,y)1t t+1 1Ctt—1 1(5.5.7)利用y在t时刻的值y以及t时刻以前的值y,…,y通过所给定的模型(5.5.6)来计t t t—1 1算u。由于所给的模型满足平稳可逆条件,所以8,0分别在平稳与可逆域内。为了求出ut 1 1的表达式,将所给的模型改写成为(u 一y)=0(u一y)+(0—8)yt+1 t+1 tt 1 1t(5.5.8)从而有气一y=0.(u-y)+(0-8)yt1 t—1 t—1 1 1 t—1=0[0(u —y)+(0—8)y ]+(0—8)y11 t—2 t—2 1 1 t—2 1 1 t—1由于0]|<1,所以当七=01-10(u—y)+(0—8)*101-1-jyt0 t0 1 1 jj=t0上式右边第一项趋于零,这样得到t—t01t-1-jy11 1jj=—3(5.5.9)将式(5.5.9)代入式G.5.7)得到y,(1)=81yt—01yt-01(01—81)如01t-1-jy,j=—3(5.5.10)=(8—0)£0t一jy.j=—3公式(5.5.10)可以修改为逆推方程的形式y⑴=(8―。)(y+E。*-jy)
t iit ijj=—»=(8-0)(y+0旧0t-1-jy^)j=-8=01yt-1(1)+(81-01)yt (5.5.11)这里yt-1(i)是在时刻t—i时一步预测。同理可求二步预测值yt(2)。例2我们考察某种商品的销售情况,假设某种商品销售量已进入稳定状态期,销量的数据记录可以认为是一个平稳随机序列。现利用50个月的销售记录,通过整理得到月平均销售量为30万件,月销售量与平均值的差〔简称“月销售量距平〃〕的数据如表5—6所示。表5—6月销售量与平均销售量的差单位:万件序号t月销量距平Yt序号t月销量距平Yt序号t月销量距平Yt序号t月销量距平YtII427402I5284i3I629424I730435I83i446I93245720334682i34479223548I0233649ii243750I22538I32639解利用表5—6中的数据建立时间序列模型,并且利用它来作预测分析。首先根据自相关函数和偏相关函数的计算公式估算由表5—6中数据作为样本序列的自相关函数值和偏相关函数值。计算结果如表5-7所示。表5-7自相关函数和偏相关函数k8kkApkk8kkApkI728394I05ii12由表5-7可看出,pk的值随着k的增大而变小,呈衰减的趋势,也就是逐渐收敛于零,所以,可以认为它是拖尾的。而虹在k大于2以后,在零的附近波动,而且|>MR0.28的点一个也没有,因而可以认为8以后是截尾的。kkv50 kk根据AR模型的识别准那么,由上述样本数据我们可以判断该序列是AR(2)序列。其模型的形式为yt=8]yt1+巾2yt2+£,现在对参数8,8作出估计,由式G.4.16)有1 2[8+0.9(f)=0.91I。%+82=0.84解此方程组得8”=0.7538,8”=0.158TOC\o"1-5"\h\z1 2这样由一步预测公式得到一步预测方程为y⑴=0.7538y+0.158yt t t—1二步预测方程为y(2)=0.7538y⑴+0.158yt t t三步预测方程为y(3)=0.7538y
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《2型糖尿病血管内皮Cav-1与AMPK信号通路相关性研究》
- 冷库建设保温保冷施工方案
- 吉林工程技术师范学院《苗圃学实践》2023-2024学年第一学期期末试卷
- 吉林动画学院《奥尔夫音乐教育与教法》2023-2024学年第一学期期末试卷
- 绿化工程土石方施工方案
- 电力工程施工安全培训方案
- 汽车租赁公司停车位合同
- 公益活动赞助合作协议书
- 工业园区混凝土护坡施工方案
- 吉安职业技术学院《教育学英文文献》2023-2024学年第一学期期末试卷
- 肺癌的临床表现及治疗
- GB/T 9722-2006化学试剂气相色谱法通则
- GB/T 7631.5-1989润滑剂和有关产品(L类)的分类第5部分:M组(金属加工)
- GB/T 3985-1995石棉橡胶板
- GB/T 26988-2011汽车部件可回收利用性标识
- 中文版AutoCAD2020超实用超详教程免费提供
- 第10课 古代的村落、集镇和城市 课件【知识精讲+备课精研】 高中历史统编版(2019)选择性必修2
- 南方中证500ETF介绍课件
- 《物流系统规划与设计》课程教学大纲
- 护理质控分析整改措施(共5篇)
- 金属矿山安全教育课件
评论
0/150
提交评论