




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
时间序列分析法3.时间序列分析法对于预测,有定性和定量两类方法,定性的方法主要是作一些趋势性或转折点的判定。常用的方法有专家座谈会法,德尔菲法等。常用的定量预测方法有两种,一种是回归分析法,另一种常用方法就是时间序列分析法。这一章主要介绍有关时间序列分析法的有所谓时间序列就是一组按照一定的时间间隔排列的一组数据。这一组数据可以表示各种各样的含义的数值,如对某种产品的需求量、产量,销售额,等。其时间间隔可以是任意的时间单位,如小时、日、周、月等。通常,对于这些量的预测,由于很难确定它与其他因变量的关系,或收集因变量的数据非常困难,这时我们就不能采用回归分析方法进行预测,或者说,有时对预测的精度要求不是特别高,这时我们都可以使用时间序列分析方当然,时间序列分析法并非只是一种简单的预测分析方法,其实,基本的时间序列分采用时间序列分析进行预测时需要用到一系列的模型,这种模型统称为时间序列模型。在使用这种时间序列模型时,总是假定某一种数据变化模式或某一种组合模式总是会重复发生的。因此可以首先识别出这种模式,然后采用外推的方式就可以进行预测了。采用时间序列模型时,显然其关键在于假定数据的变化模式(样式)是可以根据历史数据识别出来;同时,决策者所采取的行动对这个时间序列的影响是很小的,因此这种方法主要用来对一些环境因素,或不受决策者控制的因素进行预测,如宏观经济情况,就业水平,某些产品的需求量;而对于受人的行为影响较大的事物进行预测则是不合适的,如股票价格,改变产品价格后的产品的需求量等。这种方法的主要优点是数据很容易得到。相对说来成本较低。而且容易被决策者所理解。计算相对简单。(当然对于高级时间序列分析法,其计算也是非常复杂的。)此外,时间序列分析法常常用于中短期预测,因为在相对短的时间内,数据变化的模式不会特别显着。1.关于在预测中误差的一些常用表示方法:exFiii其中x表示i时刻的真实值或观察值;F表示i时刻的预测值;e表示i时刻的误iii差。差平均误差(Meanerror)ii=1平均绝对误差(Meanabsolutedeviation)ii=1均方差(Meansquarederror)ii=1标准差(Standarddeviationoferrors)n1ii=1百分比误差(percentageerror)txt平均百分比误差(Meanpercentageerror)tnii=1平均百分比绝对误差(Meanabsolutepercentageerror)tnii=1所有有规律的时间序列,都是由一种或几种基本类型的时间序列样式或模式构成的。水平型,线性趋势型,非线性趋势型,季节型和周期型。因此对于一个实际时间序列,可以根据其类型的不同,采用不同的模型进行预测和分这是时间序列分析方法中最简单的一种。3.2.1.简单滑动平均法(simplemovingaverage)xxx其中x表示t时刻的真实值或观察值;F表示t+1时刻的预测值;tt+1由此式可以看出,随着所使用的历史数据或样本点的数量n的增加,平滑作用逐渐加简单滑动平均法显然只适合于水平样式的数据,如果历史数据中存在明显的上升或下降趋势,或者有季节性波动则这种方法是不适用的。因此它只能用来对一些变化平衡或缓慢量进行预测,如对需求量稳定的商品的销量进行预测。对于(1)或(2)式,如果其中的n等于1,则成为:也就是说,t+1时刻的预测值就是t时刻的观察值,或者说是用当前的观察值来预测下一期的数值。这种方法称为naive(天真)预测法。这种方法虽然过于简单,可以说是没有进行预测,但是它可以作为评价其他时间序列法预测结果好坏的一个标准。如果你使用了一个非常复杂的时间序列分析模型来对某一个问题进行预测,其误差比这种简单的天真预测法还糟糕,则这个模型显然不是一个好的预测模型。3.2.2.单指数平滑法由于(1)或(2)式在实际应用中存在许多缺点,如零权值问题,数据存贮量大问题。因此人们希望有一种简单的法来用于实际预测,这样就提出来了指数平滑法,其中最简单的就是单指数平滑法。由于数据是呈水平趋势变化,因此在(2)式中用F来代替x不会引起太大误差,因tt-1t+1ntttt+1ntnt(3)这就是所谓的单指数平滑法公式。其中α为预测值的平滑系数。上式不仅计算简便,而且所需历史数据极少,只有一个。同时,上式中实际上包含了所有的历史数据,也就是说克服了所谓零权值的问题,因为将(3)式展开后可以写如下形F=x+(1)x+(1)2x+(1)3x+…(4)ttt1t2t3(3)式也可以写成如下形式,F=F+(xF)t+1ttt由于e=(xF),所以tttF=F+et+1tt(5)由(5)式可以看出,预测值实际上就是在上一次预测值的基础上加上α乘以上次预测小,预测值或预测曲线趋于平缓。因此,单指数平滑法适用的范围与简单平滑法相同,只适用于水平样式的数据。例:罗宾逊拆卸公司生产的取钉器的需求量预测。观察值及预测值如下表所示。需求(单需求(单123456789a=a=突出优点是只需要一个实际数据来计算新的使用指数平滑法时的几个应注意的问题与移动平均法的相似性N=2或=(6)增大a来调整权值在指数平滑法中以前的数据作用是逐步衰减人,或者说老的数据被逐渐这是因为在方程1中老的平均值被乘以(1-a),因此老的数据的权值随着a的增大而迅速衰减。也就是说,越是大的a,在预测中老数据(S)t-1的影响越小。(问题17和19表明了当数据逐步变老时其作用是呈指数减小的,这也是为什么这种方法称为指数平滑法的原因。)平滑与响应aa值会导致平均初值在计算指数平滑法的第一个值或初值时我们需要进行一些特殊的处理。这个问题称为初始化,而且是在指数平滑法中常常不为人们所重视的问题。然而,在后面我们将看到这是一个极为重要的问题。注意目前我们用前四个月的平均值作为指数平滑法的初值(见表7-1)。3.2.3.线性指数平滑法(Holt's)如果时间序列呈现一种趋势(上升或下降),则单指数平滑法会有一种滞后性。因此在这种情况下要采用其他方法。如果这种趋势是一种线性上升或下降的趋势,则可采用Holt's的方法,T=(SS)+(1)Tttt1t1(7)ttt1t1(8)t+mtt(9)其中,S为预测值的平滑值;α为预测值的平滑系数;T为趋势值(斜率)的平滑tt值;β为趋势值的平滑系数;F为t+m时刻的预测值。注意这里可以进行m步以后的预t+m测,而简单平滑法或单指数平滑法只能进行一步以所的预测。例:对下表中的观察值进行预测。单单指数平滑值=369观察值369123456789333333333221t211111S=(1)x+(0)(S+T)=933223101099由此可以看出,在计算过程中,每次首先更新S的值,然后再更新T的值。有了这现两项数值,就可以进行预测值的计算。例如对时期11,有,1011121313当然在上述例子中,观察值中不包含随机成份,所以平滑系数值都取的是1且误差为0。如果实际观察值是包含随机成份的,则平滑系数值要小于1,且预测误差也不会等于在上面的这一组公式中,(7)式实际上就是对(S一S)取平滑值。而(8)式与单指数平滑法的(3)式相比较可以看出,只是在第二项中多了前一步的趋势增加值S。而t-1预测值就是当前的平滑值再加上趋势增加值。tttttt一1t所以(7)至(9)式也可以写成下列形式,S=F+e(7)tttT=T+e(8)t+mttt+mtt(9)3.2.4.季节性指数平滑法(Winters')在实际工作中,常常会遇到一些带有季节性变动的数据,对此可以使用Winters'的季节性指数平滑法模型进行预测。其模型为,IxtItt1T=(SS)+(1)Tttt1t1(10)(11)xtStLt(12)F=(S+mT)I(13)t+mtttL+mtt其中,S为消除了季节因素影响的平滑值;α为预测值的平滑系数;Tttt率)的平滑值;β为趋势值的平滑系数;I为季节因素的平滑值;γ为趋势值的平滑系t数;L为季节的长度(如在一年中一个季节中所包含的月数);F为t+mtx实际观察值t=S平滑趋势值t它表明了季节因素的影响,其含义可以通过下图看出,xxtSt例:现有如下按季节收集的销售数据:年年(1000)季节系数(前T平滑值预测值四个为初值)m=11123423412356798448123494734741234123412345424232320S=(0.2)x24+(10.2)(S+T)24I232323S244=0.05661对于季节性线性指数平滑模型(10)至(13)也可以写成下列简单形式,S=S+T+ae/I(14)tt1t1ttLT=T+ae/Itt1ttL(15)I=I+y(1a)e/SttLtt(16)F=(S+mT)I(17)t+mtttL+m3.2.5.阻尼趋势指数平滑法阻尼趋势指数平滑法(Dampedtrendexponentialsmoothin)g是另一种常用的指数平滑法。因为在实际工作中,一个量的增长或下降趋势是不会永久持续下去的,而是经过一段时间的增长或下降后其趋势会逐渐消失,这种现象类似于物理中的阻尼现象,所以我们称具有这种特性的指数平滑模型为阻尼趋势指数平滑法。这时的模型为,tttt1(18)T=(SS)+(1)T0ttt1t1(19)t+mtti=1(20)下面的形式,e=(xF)tttS=S+0T+aett1t1tT=0T+ett1t(21)(22)(23)3.2.6.指数平滑法的计算问题对于单指数平滑法:F=x11121121另一类方法是采用最小二乘法,列出方程后求出最优初值。法是通过搜索法,比较不同数值下的MSE或MAD,求出最小误差所对应的系数值。上述各种方法是否能用于实际问题的预测,其关键在于其误差e=(xF)的分布,ttt如果误差的均值为0,方差为常数,则方法或模型的选择是适当的,否则就需要寻求其他第二类常用的时间序列分析方法就是所谓的时间序列分解法。这种方法的基本假定与所有的时间序列分析法的假定相同,即认为实际数据是由模式值加上随机误差组成的。但是,所不同的是认为模式值是由趋势、季节和周期的共同影响而构成的,而且每一种影响是可以识别出来的。用数学表达式表示就是,ttttt(24)x=STCR(25)ttttt显然随机部分是没有办法预测的,所以我们认为变量的预测值就是前三部分的乘积。下面以一个例题为例说明进行分解的步骤。某造纸厂的按季度观察到的销售量及有关计算数据如下表所示:季节观察值滑动平均值比值T*CS*R*100123456789假设这里对最前面四个季度(即1986年的四个季度)的销售量相加然后计算其平均这里的平均值显然是不包含季节因素的(因其为全年各季度的和),而且这个值中不包含或只包含很少的随机成份,因为随机误差的均值为零,所以当多项观察值相加后正负随机误差相互抵消了。因此,通过这样的方式计算出来的平均值实际上只包含趋势和周期与此类似,如果将第二至五项观察值相加然后求出平均值就可以得到,这里也是四个不同季节的数值的均值,它也不包含季节因素,同时不包含或极少包含随机的成份。同样的方式可以计算出表中的第三列数值。由此可以看出这种计算的方式就是在计算均值的过程中将老的观察值放弃掉同时换上最新的一个观察值,即采取滑动的方式进行计算。所这这样计算出来的值也称为滑动平均值,由于滑动平均值的特性,我们有如下关系式,2.季节与随机的分解由于表中的第三列表示了T*C,而表中的第二列是观察值,或原始数据,根据定义它实际上表示了T*C*S*R。因此如果将第二列的数除以第三列的数,其比值为第四列的值,MATC因此这一列的值只包含季节与随机成份,为了方便起见,这里的数值乘上了100。由于这一列比值中包含季节成份,所以可以由它来计算季节系数。季节系数的含义与前面所在第四列数值中,它包含了随机误差。由于随机误差所具有的特性,即均值为0,因按每一个值所属的季节排列成下表的形式,年年一季度二季度三季度四季度S400/然后对每一个季度的数值求平均值,由于求平均值就可以消除随机误差的影响,所以 因此可以计算出每个季度的平均值,也就是季节系数的平均值S。由于将这样计算出来的各个季度的季节系数相加再求平均值,其值不一定正好为100,因此需要对其进行调季节系数的调整非常简单。由于我们要求调整后的季节系数值之和为400,所以将400除以现在的和,得到一个修正系数值;然后将每一个季节系数值S乘以这个调整系数值,就可以得到最终的调整后的季节系数值,如上表所示。1).中心滑动平均值度的位置上,但是只要我们仔细一想会发现这里有问题。因为,我们计算出来的第1至4季度的平均值严格地说应该是第季的平均值;第2至5季度的平均值严格地说应该是第季的平均值,而在实际中并没有季和季。为了得到每个季节的真正平均值我们还需要做一点工作,这就是对季的平均值和季的平均值再求一次平均值,这样就可以得到第3季度的真正平均值,即(+)/2=3。这样求出来的平均值,(+)/2=称为中心滑动平均值。注意,采用这种方式计算平均值,最终所得到的平滑值比前面的方法还要要少一个(通常,如果中心平均值了,因为它本身就是中心平均值。现在按中心平均值的方法重新计算,可以得到下表中的数据。动平均值S*R*100123456789当然相应的季节系数值也需要重新计算,其结果如下表所示,年年一季度二季度三季度四季度S2)中位平均值仔细观察关于季节系数的计算过程,可以发现,在每一个季节所属的列中,总会有一个值特别大或小,这往往是由于一些特殊发问所引起的,如异常天气、罢工、促销活动、战争等,而这些情况并不是总会发生的,所以在计算的过程中应该忽略其影响,所以在求季节系数时,应该剔出异常值,简单地说就是去掉一列中的最大值和最小值后所剩余的中位值中再求其平均值,这样就等到了比较真实的季节系数值。由于MA=T*C,现在需要将周期部分分离出来。在此可以对MA这一列数据采用线性回归分析的方式,得到一条回归直线y=a+bt,其参数为,btMATC==CTT如此例中,因为X=S*T*C*RMA=T*C之样就可以分离出随机误差。这一部分虽然不能用于预测,但可以用来检验。也就是说用来检验我们前面的时间序列分解的是否合适与有效。了下列表达式,x=STCRttttt在进行预测时,由于随机误差部分是没有办法预测的,因此作为预测,我们可以使用F=STCtttt从季节系数的计算表中可知对应的季节系数为。最后,周期部分必须要人为地予以估计,即靠我们的判断一确定。由于第48期的周期值为98,如果我们没有其他更多的信息为,112.03F=TCS=4644.694=5099.4对应的季节系数为,周期值可以估计为99。因此,最终的预测值为,99109.35F=TCS=4683.65=5073.8确定季节系数。通过计算中心滑动平均值和中位平均值,得到每一期(月)的季节系1.确定趋势值。对中心滑动平均值通过回归分析得到回归方程y=a+bt。2.确定周期系数。将中心滑动平均值除以趋势值就可以得到周期值。3.如果有条件的话,通过更多的数据来确定周期值。4.准备预测。采用F=STC的公式计算预测值。tttt3.4自回归积分滑动平均法(ARIMA)前面介绍了一些基本的时间序列分析法,这些方法分别适用于不同的情况。尽管这些方法很简单,但是在使用时常常受到一些限制,而且其方法的理论基础产不是很坚实。这的方法,这就是ARIMA类方法。3.4.1.自相关(Autocorrelation)在回归分析中,我们知道量与量之间存在着一种相关关系,即一个量发生变化时,另一个量也会发生相应变化,且呈线性关系。这种相互关联的程度可以用相关系数r(-1<r<1)来描述,若r1,则表示一个量增长,另一个量也增长;若r1,则表示一个量增长,另一个量减少。若r0,则表示它们完全不相关,即一个量发生变化,另一个量不律的变化。自相关的含义类似于相关关系,自相关系数类似于相关系数,只不过在自相关关系中,它描述的不是两个不同的量之间的关系,而是描述的同一个变量在不同时间之间的相提取出来的,即A的第二个值是B的第一个值,A的第三个值是B的第二个值,如此类推。推9等5489AB可以视为两个不同的变量,然后采用同样的处理方法进行相关处理。与此类似,设有时间序列Y,采用相同的构造方法,可以构造出Y,Y,或Y等不同1231-25-6-621-34225-6-621-3423-25-6-621-3423-6-621-342现在可以将Y与Y1视为两个变量,作为一组变量计算其相关系数(当然在计算中只能若计算出来的Y与Y2之间的相关系数为,则说明任意两个间隔一个时间单位的两个量是负相关的,即一个量增长,另一个量向相反的方向变化。。。。由于时间序列Y,Y,和Y实际上都是从一个变量Y得到的,所以这种相关关系称为123自相关关系提供了关于数据模式的重要信息。对于一个纯粹随机的序列,其自相关系数必然接近或等于零。但是对于呈现很强的季节性或周期性特征的数据,必然是高度自相例,对某地区的月平均气温进行自相关处理,观察其自相关系数。从计算出的自相关系数值可以看出,这个序列呈现一种很强的季节性,因为它的最大值每隔12个月出现一次,如r=0.86,说明相隔12个月的温度呈现正相关。正是采用这种方法计算出来的自相关系数得到的信息可以用来构造高级的时间序列模型。如果我们有多年的月平均气温数据,则可以计算出Y与滞后1、2、3、…个时间单位相关系数都较大,因此我们不难想象可以用这样的时间序列模型来进行预测,Y=YY+YY=t12t24t2Y+Y+YYtt24t36t3Y+Y+Y+Y或Y=t12t24t36t48t4等类似的模型来进行预测。此外,还有一个与多元回归分析中的偏相关系数类似的“偏自相关系数”(partialautocorrelation)。其作用将在后面介绍具体计算方法时再作介绍。有三种主要类型的时间序列分析模型可以用来描述各种形态的时间序列,它们分别是1)自回归AR;2)滑支平均MA;3)自回归滑动平均ARMA。Y=0Y+0Y+…+0Y+et1t12t2ptpt(1)YY…YYY…Yp同的时刻。最后,e是误差或残差项,表示随机误差部分,它是不能用任何模型来解释可t方程(1)称为自回归模型,因为它与通常的回归分析模型,xbx11kk如果我们能够1)确定方程(1)就是我们所需的合适的模型;2)确定p的值;3)估计出自回归系数0,0,…,0的值。我们就能用方程(1)来进行预测。12p例:p=3,0=0.8,0=0.5,0=0.4,且有如下数据,23差2-5-10t-13Y=0Y+0Y+0Y+et1t12t23t3te随机误差。t并非所有的时间序列都可以用方程(1)来描述。对于某些时间序列我们需要另一种类Y=e9e9e…9ett1t12t2qtq(2)e与前面相同是随机误差;而e,e,…,e为以前各期的预测误差。θ为平tt1t2tq方程(2)与(1)相似,只不过是将以前各期的变量值换成以前各期的预测误差值。因此,从本质上讲这种模型本身也是一种自回归模型,只不过是与自己的误差相关而已。这种模型之所以称为滑动平均模型,是因为它与我们前面提到的简单指数平滑模型类似,都是与自己的误差有关。qt2te随机误差。t对于所有的时间序列,只要其中不包含趋势,都可以用方程(3)来描述。即自回归与(3)显然方程(3)是方程(1)与方程(2)相结合的产物。由于此模型中包含了p项Y的历史数据,q项预测值与实际观察值的误差,所以这种模型也可以简单地称为ARMA (p,q)。方程(3)表面上看起来虽然很简单,但是实际上它是一个非常复杂的时间序列模型。这了说明这一点让我们先看一下MA(1)和AR(1)模型。一阶滑动平均模型MA(1)为,=e一9[Y+9e]由此看出它实际上就是无穷阶自回归模型,或AR()。此外,将此式与单指数平滑模型的展开式比较,不难理解为什么称此类包含误差项的模型为滑动平均模型。现在我们再来看一阶自回归模型,即AR(1),Y=0Y+et1t1tY=0Y+e=e+0YY=0Y+e=e+0Ytt3t2t21t3Y=0Y+e=e+0Y…Y=0Y+et1t1t=0[e+0Y]+et1t2t=0e+02[e+0Y]+ett1t3ttt21t3ttt1t11t21tn由此看出它实际上就是无穷阶滑动平均模型,或MA()。同样对于一个简单的ARMA(1,1)模型可以采用同样的方式将其转化成单纯的AR模型或MA模型。从中不难看出,ARMA(p,q)实际上是用一种非常简明的形式来表达了非常混合的ARMA(p,q)模型是在1954年提出来的,但是这些模型一直都没有进一步的发展,也没有看到什么应用,其主要原因是计算量太大,无法在实际中应用。随着计算机的广泛应用和普及,ARMA类模型在实际中的应用才成为可能。其中首先提出实际应用方法的是3.4.3.Box-Jenkins方法(ARIMA模型)前面虽然给出了ARMA(p,q)模型的表达式,但是要想将其用于实际预测还有许多问题要解决,如p=,q=,0,0,…,0=,9,9,…,9=即如何确定具体的模型12p12q段段段首先假定ARMA(p,q)模型对于给定的问题是成立的,或对这个问题是合适的。然后通过三个阶段完成预测工作。第一阶段,根据历史数据辨识出一个试验性的模型;第二阶段,采用历史数据,找出最适合于这个试验模型的参数并进行检验;如果判断出不满足要求,则回到第一阶段选用另一个试验模型;如果模型可以被接第三阶段,根据模型进行预测。1.第一阶段,辨识出一个试验性的模型Box-Jenkins方法中最困难的部分就是辨识出合适的模型。一般ARMA模型有两类参数,即p和q,及对应的0,0,…,0和9,9,…,9。这一阶段可以分为三步来完成。12p12qq (stationarity)。当然,现实中的数据不可能都是没有趋势的数据。为了得到静态数据,可以采用差分的方法。如果实际数据包含线性趋势则可以通过一阶差分获使之成为静态数据。如果实际数据包含类似二次函数的非线性趋势则可以通过二阶差分获使之成为静态数据。对于其他类型的非线性趋势,我们总可以通过连续差分的方式使之成为不包含趋势的数据。下面通过几个例子说明差分的方法。首先看下列包含线性趋势的数据的差分情况,2224222-6222-810-8=2从上表中可以看出一阶差分的方法就是,Y'=YYttt1从上表中还可以看出,由原序列差分后得到的新序列是一组常数,这是因为原数据中不包含随机因素。如果实际数据中既包含其他数据模式又包含随机因素,差分仅仅只会移去趋势部分,对于其他则毫无影响。对于包含非线性趋势的数据也同样可以通过差分使其静止。例如,(新序列)22222257949如果上述差分,也称为短差分后的数据还存在季节波动,则可以通过长差分或季节差分使其静止。如按月排列的数据,可以用今年元月份的数据减去去年元月份的数据。也就是说,在静态数据中不仅不能包含趋势,也不能包含季节或周期性变动。差分后的数据与原数据显然有很大差别,最后在预测时显然需要有一个还原的过程,二步,识别p,q一旦数据达到静止,可以对达到静止的新序列计算其自相关系数和偏相关系数。通过这两个相关系数序列的值就可以确定p和q的值。其中自相关系数和偏相关系数的表达式假设观察值(时间序列)为,YY1…Ym----y1y2…yY…xY1……………xm1xm2…xYmii=1(ii=1(xx)2(yy)2iirxyrr=jQjj[y(a+bx+bx+…+bxi11i22immii=1Q=n[y(a+bx+bx+…+bx+bx+…+bx)]2ji11i22ij1(j1)ij+1(j+1)immii=1显然,对于每一个时间序列来说,可以计算出对于每一个Y的自回归系数和偏自回归i系数,这样它们就形成了一个序列,可以将其在座标图上表示出来。具体的识别方法是根据计算出的自回归系数和偏自回归系数所形成的形态来判断。下面的图形显示了在不同的ACk--ACk--上述系统适用AR(1)模型ACACACkk上述系统适用MA(1)模型,等等。1.如果AC呈指数衰减到0,则(可能)为AR模型,其阶数由PAC中显着不为0的2.如果PAC呈指数衰减到0,则(可能)为MA模型,其阶数由AC中显着不为0的Q计方法与原理同短差分相同。第二阶段,参数估计与检验第一步,参数估计根据自回归系数和偏自回归系数可以初步给出变量的模型,这个模型也称为试验性模Y=0Y+e9et1t1t12t121121120=0.2,9=0.4等。究竟哪一组系数值最合适呢确定的方法仍然是比较在不同的参数值下的预测误差值e的MSE。最小的MSE所对应的参数值就是所估计的模型中的最优参数。t具体操作也是通过搜索法进行。第二步,模型诊断当得到最优模型参数后(MSE最小),试验模型也就随之确定了。这时会有两种情况发生,一种是预测误差值e形成的序列是完全随机的,这说明试验模型已经完全找出了变t量序列中的模式,这个试验模型就是所求的预测模型;另一种是试验模型没有完全找出变量序列中的模式,预测误差值e形成的序列不是随机的,这时这个试验模型还不能用。t怎样才能确定是哪一种情况呢有一种非常简单的方法,这就是计算预测误差值e形成t的序列的自相关系数。如果没有一个不同滞后时间的自相关系数值在95%的置信水平下不等于0,则是第一种情况,即这个试验模型是合适的模型。否则需要重新识别新的试验模第三阶段,准备预测当我们得到的模型是合适的,就可以利用这个模型进行预测。采用ARMA模型进行预测,不仅可以得到预测值,同时还可以得到预测值的95%或99%的置信区间。所以,ARIMA模型是一个统计模型,这是普通时间序列分析方法所不能获得的。值得说明的是,ARIMA模型实际上是一类模型,在标准ARIMA模型的基础上还衍生出由于ARIMA模型的计算复杂,计算量极大,因此通常都需要借助于计算机来进行计3.5.1.基本数据处理方法列曲线图,通过该图可以大致判断出时间序列的样式或规律,从而初步确定所用的时间序据处理的基本方法。下图显示的是部分原始数据:上图中的数据没有定义时间。定义时间序列时间的操作方法是选择Data(数据)菜单中的Definedates…(定义时间)命令。这时将出现Definedates(定义时间)对话框窗由于现在的数据是月度数据,且起始月份为以1978年10月,因此在上述对话框中的“Caseare”选项下选择“Years,months”,然后在“FirstCaseIs”选项下填写年月完成上述对话框的设置后,单击OK按钮即可定义时间序列的时间值。这时的数据窗口定义了时间后就可以作出时间序列图。操作方法是选择“Graphs”(图形)菜单中的“Sequence…”(序列)命令。这时将出现Sequence…”(序列)对话框,如下图所示:“Variables”选项中。然后单击OK按钮即可得到如下图所示的时间序曲线图从上图中可以看出现在的曲线还不完整,也就是说时间序列中有许多缺失值。如果不作处理,是不能进行时间序列分析的。下面是处理时间序列缺失值的操作方法。选择“Transform”(变换)菜单中的“ReplaceMissingValues…”(替换缺失值)执行上述命令后将出现“ReplaceMissingValues…”(替换缺失值)对话框。从对话框左边选择要处理的变量进入右边的“NewVariable(s)”(新变量),这里选择“ozone”。然后在“NameandMethod”选项中选择一种处理方法。Seriesmean序列均值:按整个时间序列的均值作为所有缺失值点的插值。Meanofnearbypoints临近点均值:按时间序列缺失值点临近点的均值作为插Medianofnearbypoints临近点中位数:按时间序列缺失值点临近点的中位数Linearinterpolation线性插值:按时间序列缺失值点临近点两端的数值进行线性插值。如果某一缺失值点临近点两端的数值分别为10和16,则线性插值为13;如果某二个连续缺失值点临近点两端的数值分别为10和16,则线性插值分Lineartrendatpoint线性趋势值:按时间序列缺失值点临近点左边的数值进行线性趋势插值。如果某一缺失值点临近点左边的数值分别为10和12,则线性插值为14;如果某二个连续缺失值点临近点左的数值分别为10和12,则线性插根据前面做出的时间序列曲线图可以看出,这里处理缺失值的方法应该选择“Linear“interpolation”;然后单击“Change”按钮。选定插值方法后的画面如上图所示。最后进行缺失值处理后的数据窗口中增加了一个新的变量,即“ozone-1”。如下图所示:以后的分析都是针对新变量“ozone-1”进行的。下面是“ozone-1”的曲线图。不难发现图中的曲线是连续不断的。OZO3.5.2.指数平滑法指数平滑法是时间序列分析中经常使用的一类方法。下面以某企业最近四年的29寸彩电销售量为例说明几种常用指数平滑法的使用及使用过程中的一些问题。根据上述数据制作的时间序列曲线图如下:对于上述数据,如果采用简单指数平滑法进行处理,其操作方法如下:Smoothing…”(指数平滑)。选择“ExponentialSmoothing…”命令后将出现“ExponentialSmoothing”对话将左边变量列表中的“t29寸”作为要处理的变量。然后在“Model”(模型)选项中Save保存:如果需要保存预测结果,则可单击该按钮。由于现在还不知道模型效果如何,所以还谈不上保存结果,后面将说明具体其用法。Parameters参数:进行模型参数的优化优化或设定。单击该按钮将出现如下图所示的在参数设置对话框中的“General(alpha)”选项中选择“GridSearch”,并且在“Start”、“Stop”、及“By”中分别设定数值0、1、及。然后单击“Continue”(继续)按钮回到上一级对话框,即指数平滑法对话框。最后单击该对话框中的OK按钮即可进行单指数平滑法的有关计算。其主要计算结果如下:MODEL:MOD_3.ResultsofEXSMOOTHprocedureforVariableT29寸MODEL=NN(Notrend,noseasonality)Initialvalues:SeriesNotusedTrendDFE=53.SSEThe10smallestSSE'sare:SSE.9400000.9300000.9500000.9200000.9600000.9100000.9700000.9000000.9800000.8900000Thefollowingnewvariablesarebeingcreated:NAMEFIT_1ERR_1LABELFitforT29寸fromEXSMOOTH,MOD_3NNA.94ErrorforT29寸fromEXSMOOTH,MOD_3NNA.94由上述计算结果得到的最优平滑指数为,该指数值对应的SSE(误差平方和)是最小的。由于最优指数值非常接近1,说明简单指数平滑法不适用现在的实际观察值。或者说简单指数平滑法不能识别出当前数据的变化模式或规律。通常如果得到的最优平滑值为左右,则说明简单指数平滑法是适用的;如果该值超过则表明不能使用简单指数平滑法。此外,上表结果还显示在数据窗口中增加了两列数据,一列是估计值(FIT_1),另一列是估计值与实际观察值之间(ERR_1)。如下图所示:由于简单指数平滑法不适用,因此下面尝试线性指数平滑法,或Holt方法。使用Holt方法的操作过程与简单指数平滑法过程几乎相同,但是由于Holt方法中有两个平滑指数,因此其差别就在于参数设置,此时的设置如一图所示:MODEL:MOD_4._ResultsofEXSMOOTHprocedureforVariableT29寸MODEL=HOLT(Lineartrend,noseasonality)Initialvalues:SeriesTrendDFE=52.The10smallestSSE'sare:AlphaGammaSSE.9100000.0000000.9200000.0000000.9000000.0000000.9300000.0000000.8900000.0000000.9400000.0000000.8800000.0000000.9500000.0000000.8700000.0000000.9600000.0000000Thefollowingnewvariablesarebeingcreated:NAMEFIT_2ERR_2LABELFitforT29寸fromEXSMOOTH,MOD_4HOA.91G.00ErrorforT29寸fromEXSMOOTH,MOD_4HOA.91G.00上述计算结果比简单指数平滑法要好,因其最小SSE为小于简单指数平滑法的最小SSE,该值为小。但是从最优平滑指数值看,它们分别为和,此方法仍然不理想。其道理与由于在彩电销售量的序列曲线图中可以看出该值呈现较为明显的季节性变化,因此选择季节型指数平滑法,或Winters方法是较为合适的。在Winters模型中有三个平滑指数,因此其参数设置更为复杂一些,下图显示的是参数设置结果:注意在上述参数设置中,对于趋势指数和季节指数的起始值及步长值都设得较小,其主要原因是为了减少计算量。如果将步长值设得过小,而同时将起始值的范围设得过大,则会产生计算溢出,造成计算中止的现象。利用上述参数计算出的结果如下:MODEL:MOD_5._ResultsofEXSMOOTHprocedureforVariableT29寸Period=12MODEL=WINTERS(Lineartrend,multiplicativePeriod=12Seasonalindices:123456789_ResultsofEXSMOOTHprocedureforVariableT29寸(CONTINUED)MODEL=WINTERS(Lineartrend,multiplicativeseasonality)Period=12Initialvalues:SeriesTrendDFE=41.The10smallestSSE'sare:AlphaGammaDeltaSSE..7300000.0040000.0100000.7300000.0030000.0040000.7300000.0040000.0090000.7300000.0030000.0050000.7300000.0040000.0080000.7300000.0030000.0030000.7300000.0040000.0070000.3800000.0070000.0030000.3800000.0060000.0100000.3800000.0070000.0040000Thefollowingnewvariablesarebeingcreated:NAMEFIT_3ERR_3LABELFitforT29寸fromEXSMOOTH,MOD_5WIA.73G.00D.01ErrorforT29寸fromEXSMOOTH,MOD_5WIA.73G.00D.01上述计算结果中的最好SSE值为,该值明显好于简单指数平滑法和线性指数平滑法的注意在上述结果中,同时还显示出了季节系数,它们分别是:Seasonalindices季节系数:份123456789季节系数由季节系数值的变化不难看出,该规格彩电销售的高峰在元月及十二月份,三、四月份及十月份分别也有一个小高潮。这与实际销售情况是比较吻合的。元月份通常是春节所在月份,肯定是销售旺季;十月份是国庆节也是一个旺季;由于厂家为春节准备了充足的货源,而过完春节肯定是淡季,因此厂家此时会大量降价促销,由此产生了三月份的小高确定了模型及参数后,下面的工作就是要对未来一年的各月销售量进行预测。利用Winters方法进行预测的操作过程与前类似,只是需要对“ExponentialSmoothing”(指数平滑)对话框中的“Save”(保存)命令按钮下的对话框进行设置。其操作方法如下:单击“ExponentialSmoothing”(指数平滑)对话框中的“Save”(保存)命令按钮,这时将显示,“Save”(保存)对话框,如下图所示:在“CreateVariables”(生成变量)选项中选择“Addtofile”(增加到文件),该值为SPSS默认值;然后在“PredictCases”(预测)选项中选择“Predictthrough” (预测到…),并且在“Year”(年)、Month(月)文本框中分别填写2000和6。因为最后单击“ExponentialSmoothi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国面膜行业竞争格局及投资战略研究报告
- 2025-2030年中国隔音玻璃产业运营状况与发展潜力分析报告
- 2025-2030年中国链锯行业十三五规划与发展趋势预测报告
- 2025-2030年中国资产管理行业运行动态与营销策略研究报告
- 2025-2030年中国聚苯醚行业风险评估规划分析报告
- 南宁理工学院《美国文学选读》2023-2024学年第二学期期末试卷
- 邢台医学高等专科学校《生态文明建设理论与实践前沿》2023-2024学年第二学期期末试卷
- 江西科技学院《公共管理与服务课程开发与教材分析》2023-2024学年第二学期期末试卷
- 赣南师范大学科技学院《海报设计(数字方向)》2023-2024学年第二学期期末试卷
- 2025安徽省安全员知识题库及答案
- 高教版2023年中职教科书《语文》(基础模块)下册教案全册
- 无人机警用解决方案样本
- 健康体检项目目录
- 现代交换原理与技术课件:第5章 分组交换技术
- 学校传染病报告处置流程图
- 大小嶝造地工程陆域形成及地基处理标段1施工组织设计
- 物理化学(全套427页PPT课件)
- 肺断层解剖及CT图像(77页)
- LeapMotion教程之手势识别
- 静脉导管的护理与固定方法
- word上机操作题
评论
0/150
提交评论