




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四十一课 非平稳序列的确定性分析在实际情况中,绝大部分序列都是非平稳的,因而对非平稳序列的分析更普遍、更重要,相应地各种分析方法也更多。通常,把非平稳时间序列的分析方法分为:确定性时间序列分析和随机性时间序列分析两大类。所谓非平稳确定性时间序列是指在自然界中由确定性因素导致的非平稳时间序列,通常这种非平稳的时间序列显示出非常明显的规律性,比如有显著的趋势或有固定的变化周期,这种规律性信息一般比较容易提取。所谓非平稳随机性时间序列是指由随机因素导致的的非平稳时间序列,通常这种随机波动非常难以确定和分析。传统的时间序列分析方法通常都把分析的重点放在确定性信息的提取上,而忽视对随机信息的提取。通常
2、将序列简单地假定为,如果是均值为零的白噪声序列,那么就可以采用确定性分析方法。一、 时间序列的平滑技术有些时间序列具有非常显著的趋势,有时我们分析的目的就是要找到序列中的这种趋势,并利用这种趋势对序列的发展作出合理的预测。对趋势进行分析和预测常用方法有:l 趋势拟合法把时间作为自变量,相应的序列观察值作为因变量,建立序列值随时间变化的回归模型的方法。根据序列所表现出的线性或非线性特征,我们的拟合方法又可以具体分为线性拟合和曲线拟合。l 平滑法利用修匀技术,消弱短期随机波动对序列的影响,使序列平滑化,从而显示出变化的规律。根据所用的平滑技术的不同,又可具体分为移动平均法和指数平滑法。1. 滑动平
3、均与加权滑动平均法一般说来,已知序列值为,欲预测 的值,则其预测值为:(41.1)这种均值随的变化而变化,称它为滑动平均值。这里N称为滑动平均的时段长。滑动平均的目的主要是平滑数据,消除一些干扰,使趋势变化显示出来,从而可以用于趋势预测。在计算滑动平均值时,若对各序列值不作同等看待,而是对每个序列值乘上一个加权因子,然后再作平均,则称此为加权滑动平均,称下述预测值(41.2)为加权滑动平均拟合值,a1,a2,aN 为加权因子,满足例如,当N3时,a1 =1.5, a2 1,a3 0.5,有滑动平均值与所选的时段长短有关,时段长时的滑动平均值比时段短时的滑动平均值的反应速度慢,这是对于干扰的敏感
4、性降低的结果。造成这种现象的原因,主要是参数滑动平均的数据一律平等对待,不分先后。实际上最新数据更能反映销售的趋势。因此,要特别强调新数据的影响,突出新数据的作用;为达此目的,可采用加权滑动平均法。最后指出,滑动平均时段N的选择带有一定的经验性,N过长或过短,各有利弊,不妨多算几个方案加以比较,择优决定,同样,加权数的选择,涉及预测者的预测艺术水平。一般的规律是对新数据加的权大,老数据加的权小,至于大到什么程度和小到什么程度,完全靠预测者对序列作全面的了解和分析。2. 二次滑动平均预测法在以上,我们已见到对于有线性增长趋势的序列,运用滑动平均法去作预测比用全体历史数据的平均法好。但是,必须指出
5、,对于有线性增长(减少)趋势的序列,运用滑动平均法去作预测,也不是最佳的预测,其预测值会出现明显的滞后于观察值的现象。例如,线性趋势方程是:(41.3)这里,是常数。当上式增加一个单位时间时,就有一个增量为:(41.4)它不随时间的改变而改变,因此,当时间从增至时,序列值,但是,采用滑动平均法计算的序列的拟合值是:比滞后了 ,为了消除上述滞后现象,对上述的滑动平均法应加以改进,改进的办法是对已取得的滑动平均值,再进行一次滑动平均,并称这种滑动平均为二次滑动平均。3. 指数平滑法在介绍了的滑动平均和加权滑动平均预测法中,均受到一定的限制,那就是必须使用N个历史的观察值;这种方法受了两方面的约束,
6、一是必须有N个历史数据,二是预测值仅包含了这N个数据的信息,而不能反映更多的历史数据的信息。我们希望找出一种更理想的方法,使预测值能较多地反映最新观察值的信息,也能反映大量的历史资料的信息,但计算量要尽可能地少,需要存储的历史数据也不多。这种方法就是指数平滑预测法。设时间序列的n次实测记录,为平滑预测值,则平滑预测值是由下述公式求得:(41.5)则称此预测法为指数平滑法,此处a称为平滑常数,0al,称为预测误差。可将式(41.5)作适当的推导得:(41.6)从式 (41.6)中看出,第步的预测值,其主要部分可以表为前步实测值作了指数形式的加权和, 为初始预测值,由于1a是介于零和1之间的一个数
7、,故当很大时,这一项可以忽略,也即初始预测值的影响甚微。通常取为最初几个实测数据的均值。以上所述是本法命名的由来。4. 二次指数平滑法和三次指数平滑法在指数平滑预测公式中,不论是一步预测还是多步预测都是同一公式,这对没有趋势的稳定序列是可行的。但是,用在上升或下降趋势明显的需求序列上就不够理想。二次指数平滑就是为弥补这种缺陷的一种方法,但它不是直接用于序列预测的方法,而是为计算有线性趋势的线性预测方程的系数服务的。所谓二次指数的平滑法,是对一次指数平滑后的序列数据再作一次指数的平滑,其平滑公式是:(41.7)其中,二次指数平滑值,a为指数平滑常数。二次指数平滑公式的运用,同一次指数平滑公式一样
8、,也涉及初始值的选取问题。但随着时间的推移,初姑值的影响是很小的,因此可选取。若时间序列数据点的分布出现曲率,则使用二次指数平滑法于转折点仍然出现较大的误差,因此必须采用三次指数平滑法。所谓三次指数平滑是将二次指数平滑得到的平滑数据,再进行一次指数平滑。平滑公式如下:(41.8)其中a为指数平滑常数,其初始平滑值可选取等于。同样可推广到m次指数平滑。5. Holt两参数指数平滑Holt两参数指数平滑适用于对含有线性趋势的序列进行修匀。它的基本思想是假定序列有一个比较固定的线性趋势每期都递增或递减,那么第期的估计值就应该等于第期的观察值加上每期固定的趋势变动值。但是,由于随机因素的影响,使得每期
9、的递增或递减值不会恒定为,它会随着时间变化上下波动,因而(41.9)考虑用第期的观察值和第期的估计值的加权平均数作为第期的修匀值,且用第期的修匀值代替观察值,即有(41.10)因为趋势序列也是一个随机序列,为了让修匀序列更平滑,对序列也进行一次修匀处理:(41.11)把式(41.11)代入式(41.10)就是Holt两参数和指数平滑法。对于初始值的确定:平滑序列初始值,最简单的指定;趋势序列初始值,最简单的方法用任意指定一段区间的平均趋势,即:假定最后一期的修匀值为,那么使用Holt两参数指数平滑法向前期的预测值为:(41.12)二、 时间序列的分解1. Wold和Gramer分解定理H.Wo
10、ld(1938)提出了著名的Wold分解定理:对于任何一个离散平稳过程,它都可以分解为两个不相关的平稳序列之和,其中一个为确定性的,另一个为随机性的,不妨记作(41.13)式中为确定性序列,为随机序列,且。它们需要满足三个条件:为均值是零的白噪声;的方差是有界的;确定性序列与随机序列无关。对于(8.2.13)式,可以写出q期之前的线性回归表达式:(41.14)式中为回归残差,的方差。显然,且随着的增大而增大,也就是说是非减有界的序列。2q的大小可以衡量历史信息()对现在值的预测精度。如果,则说明序列的发展有很强的规律性或者说确定性,即历史数据可以很好地预测未来,这时称序列是确定序列;如果,则说
11、明序列随着时间的发展有很强的随机性,即遥远的过去对于现在值的估计效果是很差的,这时称序列是随机序列。尽管Wold提出的这个分解定理只是为了分析平稳序列的构成,但Gramer已于1961年证明这种分解思路同样可以用于非平稳序列。Gramer定理:对于任何一个离散平稳过程,它都可以分解为两部分的叠加,其中一部分是由多项式决定的确定性趋势成分,另一部分是平稳的零均值误差成分,不妨记作(41.15)式中为常数系数,为多项式的项数,为零均值的白噪声序列,为延迟函数。其中,均值序列反映了受到的确定性影响;而反映了受到的随机性影响。Gramer定理说明:任何一个序列的波动都可以视为同时受到了确定性影响和随机
12、性影响的综合作用。平稳序列要求这两方面的影响都是稳定的,这是上节所研究的问题。而非平稳序列产生的机理就在于它所受到的这两方面的影响至少有一方面是不稳定的。本节所研究的非平稳序列是指随机性影响是稳定的而确定性影响是不稳定的。我们将在下节研究随机性影响不稳定的情况。2. 时间序列的结构形式对于非平稳的确定性序列,按照时间序列的传统观点认为,确定性因素依时间变化是由于受到下列4种因素的影响所致。这些因素是:l 趋势变化因素。当时间序列值依时间变化时,表现出某种倾向,按某种规则稳步地增长或下降,或在某一水平上波动。l 季节变化因素。这是受一种周期性变化因素所影响。这种周期是固定的,例如一年四季。l 循
13、环变化因素。即周期不固定的波动变化。l 不规则因素。这又叫随机波动,它是由许多不可控的因素影响而引起的变化。 设时间序列值以 表示,趋势变化以表示,季节变化以 表示,循环变化以表示,随机变化以表示,那么时间序列 的结构形式就有以下3种模式:1) 加法模式(41.16)2) 乘法模式(41.17)3) 混合模式(41.18)在上述模式中,趋势变化是基础,其他变化与趋势变化结合,构成序列值。在加法模式中,各变化因素、均与的单位相同。在乘法模式中,除与有相同的单位和量纲外,其他因素的变化均是比例值。在混合模型中,、均与有相同的单位,与是比例值。各式中的随机因素 ,均假定满足,这说明随机波动有正有负,
14、正负可以抵消,故均值为零,随机波动影响消失。上述的各条件综合起来,说明是一独立的、方差不变的、均值为零的随机变量序列,即均值为零的白噪声序列。在这些假定下,我们可以将序列进行分解。3. 时间序列的分解步骤根据上面介绍的时间序列的结构模式,按其结构形成的原理,可以将序列进行分解,求出序列的各种因素影响的大小。现介绍分解方法的应用步骤如下:1) 分解出长期趋势因素与循环因素假设序列的季节长度为4,即一年分为4季。由假定,故只要将序列作滑动长度为4的滑动平均时,就可消除季节和随机波动的影响。因为,随机波动有正波动和负波动,平均起来,正负波动就相互抵消,随机波动影响就接近于零。记滑动平均值为:(41.
15、19)则滑动平均后的序列,即为序列的趋势因素和循环因素。若序列的季节周期长为12,则也有类似的结果。2) 分解季节因素与随机因素根据序列的式(41.17),有,那么,将上式两边除以的值,得到:(41.20)式(41.20)只含季节因素与随机因素两种成分。因此,它含有确定季节因素所必须的信息。若它的比值大于100(按习惯这些比值是乘上了100的),就意味着序列的实际值比滑动平均值要大,反之要小。 因此,当这个比值大于100时,就意味着这个季度的季节性和随机性高于平均数,反之低于平均数。3) 从中分解季节因素 式(41.20)中的包含了季节性和随机性,因此,要分解出季节性就必须除掉随机性。由于随机
16、波动满足,故采用平均的方法是可以消除随机波动影响的。但是,若采用式(41.19)的平均,则把季节性也消除了,因此,必须另寻方法。为保留季节性,消除随机性,我们采取了按季节平均的方法,将由式(41.20)所得的序列 逐年逐季排列起来,然后将各年的相同季节的相加起来,进行平均,这就达到了既保留季节性,又消除了随机性的目的。4) 从序列中分解出序列 包含了趋势因素与循环因素,要把这两者分离出来,首先要确定一种能最好地描述数据的长期趋势变化的曲线类型。趋势变化曲线,可能有以下几种类型,例如:线性趋势:(41.21)指数曲线:(41.22) S 型曲线:(41.23)属于何种趋势曲线,要根据序列的数值进
17、行判断,并运用最小二乘法,估计出有关参数,曲线识别和参数估计方法可参考有关的书。确定趋势值以后,以 除,即得:(41.24)值表示循环指数,如同季节指数一样,也围绕100波动。如循环指数 低于100,这意味着第t年的经济活动水平低于所有年份的平均水平;若高于100,则经济活动水平高于所有年份的平均水平。以上是传统分解法的基本原理和步骤。式(41.19)分解出趋势因素与循环因素,式(41.20)分解出季节因素和随机性,式(41.24)分解出循环因素。整个原理和分解步骤均简明直观,只使用了加、减、乘、除四则运算,易为广大企业和经济管理人员所理解和接受,是一种行之有效、使用广泛的预测方法之一。4.
18、温特线性和季节性指数平滑前面介绍的时间序列的平滑技术所处理的数据均是非季节性的数据。但是常常遇到的不仅是含有季节性,而且含有趋势分量,如何对含有线性趋势和季节性的数据进行处理和预测,乃是这里讨论的内容。在此,我们将介绍温特(Winter)线性和季节性指数平滑方法,模型形式为。识别数据模型是否有季节性的基本方法有两种。其一是直观判断法,将数据依时间序列变化点绘在坐标纸上,直接观察其变化规律,以判断它有无季节性,并确定季节的长度。这种方法的优点是直观,但判断时略带主观性,而且费时。其二是解析法,即研究数据序列的自相关性,这种方法比较客观,有客观的检验标准。温特方法由三个基础的平滑公式和一个预测方程
19、组成,每个平滑公式都含有一个平滑系数,这些公式的推导过程在此就不详述了,但对每个公式的意义作适当的阐述,以便更好地理解和应用。总体平滑公式:(41.25)趋势平滑公式:(41.26)季节的平滑公式:(41.27)预测公式:(41.28)在式(41.25)(41.28)中,、和是三个不同的平滑系数,是消除季节因素后的趋势平滑值, 是序列的实际值,是趋势增加或减少量序列,是季节调整因子,是季节的长度(如一年中的月数12或季度数4),是向前预测期数,是向前期的预测值。式(41.25) 和式(41.26)是序列消除季节因素后,Holt两参数和指数平滑法。式(41.27) 是序列消除趋势因素后,季节指数
20、的加权平均修匀值。以当前观察的季节指数 和上期季节指数进行加权平均。对于乘法模型来说,季节指数围绕1波动,可能大于1,也可能小于1。在拟合模型时可以通过求解最小的均方误差MSE得到三个平滑系数的具体值,式(41.28)是利用拟合模型短期向前预测期的预测值公式。三、 X11季节调整过程X11过程是根据美国国情调查局编制的时间序列季节调整过程X-11改编的,它可以对月度或季度时间序列进行季节调整。它的基本原理就是时间序列的确定性因素分解方法。X11过程是基于这样的假定:任何时间序列都可以拆分成长期趋势波动、季节波动、不规则波动的影响。又有经济学家发现在经济时间序列中交易日也是一个很重要的影响因素,
21、因此任何一个时间序列可以分解乘法模型或加法模型。由于宏观调控部门主要关注的是序列的长期趋势波动的规律,所以X11过程主要的目的是要从原序列中剔除季节影响、交易日影响和不规则波动影响,得到尽可能准确的长期趋势规律。而采取的方法就是我们上面介绍的因素剔除法和平滑技术。因为X11过程不依赖任何模型,所以普遍采用移动平均法。用多次短期中心移动平均法消除不规则波动,用周期移动平均消除趋势,用交易周期移动平均消除交易日的影响。在整个过程中总共要用到11次移动平均,所以得名为X11过程。X11过程一般由下列语句控制:proc x11 data=数据集 ;monthly 选项列表;quarterlly 选项列
22、表;arima 选项列表;macurves 选项;output out=数据集 ;pdweights 变量tables 表名列表;var 变量列表;by 变量;Id 变量列表;run ; 其中,至少要有monthly语句或quarterly语句,用以说明输入数据集中的时间序列数据是月度序列还是季度序列。Pdweights和macurves语句只能与monthly语句同用,分别用以指定星期几的权重和月份的滑动平均长度。Tables语句控制各种表格的输出。Output语句语句控制生成out=后指定的数据集。X11过程的输出表格的命名沿用美国国情调查局X-11季节调整程序的规定。AC部的表格是中间结
23、果。D部表格(D1D13)给出了各成份的最终估计:其中,表D10为季节波动的最终估计;表D12为长期趋势波动的最终估计;表D13为不规则波动的最终估计;表D11为最终经过季节调整过的时间序列。如果你不关心中间过程和诊断分析,只需要参阅D11表。G部表格(G1G4)给出了最终季节调整后的一些图表。1. proc x11语句。l outtdr数据集名指定一个数据集用来保存交易日回归的结果(B15表和C15表中的内容)。l outstb数据集名指定一个数据集用来存放稳定季节性检验的结果(表D8中的内容)。l outex把在arima处理过程中预测的观察加到out=输出数据集中。l noprint取消
24、所有打印输出。2. arima语句。X-11方法用一系列中心化滑动平均来估计季节成分,但在起始和结尾处只能用非对称权重。非对称权重可以导致季节因子估计不准,因此有了新数据以后就可能造成大的更改。加拿大统计局开发了一种X-11-ARIMA方法来处理这个问题。在proc x11过程中使用arima语句,就是对在var语句中指定的序列应用X-11-ARIMA方法。此方法从原始数据估计一个arima模型,这个arima模型或者使用用户指定的模型,或者通过五个预先定义的arima模型中选择一个最优的,然后用此模型把序列外推一年或几年。再根据这个延长了序列进行季节调整,此时原序列的尾部就可用对称权重了。a
25、rima语句的各选项可以控制选用什么样的arima模型,并控制模型的估计、预报和打印输出。l backcastn指定序列反向外推的年数。缺省值为0。l chicr值指定Box-Ljung拟合不足卡方检验时所用的显著水平值。缺省值为0.05。原假设为预定的模型无拟合不足。共有5个预先定义的模型。l forecastn指定预报的年数。缺省值为1。l mape值指定平均相对误差的临界值,取值在1到100之间,缺省值为15。mape值作为接受还是拒绝一个模型的临界值。模型的mape值小于临界值说明模型可用,反之模型被拒绝。mape值的计算公式如下:(8.2.29)l 其中n=36(最后三年月度数据个数
26、)或12(最后三年季度数据个数),为原始序列的最后三年的观察值。l maxitern指定估计过程中最多允许的迭代次数。取值为1到60之间,缺省值为15。l methodcls/uls/ml指定估计方法。cls为条件最小二乘法;uls为无条件最小二乘法;ml为最大似然估计。l model(P=n1 Q=n2 SP=n3 SQ=n4 DIF=n5 SDIF=n6)指定arima模型。AR和MA的阶分别为n1和n2,季节AR和MA的阶分别为n3和n4,差分和季节差分的阶数分别为n5和n6。季节s所对应的12月延迟由monthly语句决定,4季度延迟由quarterly语句决定。例如,指定一个(0,1
27、,1)(0,1,1)s模型,表示(P,DIF,Q)(SP,SDIF,SQ)s模型,即n1=0,n5=1,n2=1,n3=0,n6=1,n4=1,s=12或4。假设考虑月度序列s=12,且,那么具体模型形式为:下表41.1所示为五个预先定义的模型。表41.1 五个预先定义的模型模型序号模型阶数乘性(先对数变换)加性(不变换)1(0,1,1)(0,1,1)s对数变换不变换2(0,1,2)(0,1,1)s对数变换不变换3(2,1,0)(0,1,1)s对数变换不变换4(0,2,2)(0,1,1)s对数变换不变换5(2,1,2)(0,1,1)s不变换不变换l ovdifcr值l 如果,则等式两边可以消去
28、项,得到低阶模型。类似地,如果,则又可以消去项,得到低阶模型。因为参数估计必定有误差,要求小于1是不合理的。因此,过度差分检验的要求为:大于0.9应拒绝此模型。l transform(log)/(a*b)允许在对模型进行估计之前先进行用户指定的一些变换。(log)变换要求用序列的自然对数去作估计,产生预报值后再变换回原来的取值。(a*b)变换指定一般的乘方变换。3. macurves语句。macurves语句为任一月份指定估计季节因子时所用的滑动平均曲线的长度。此语句只适用于月度数据。选项表达式为:月份=选项值。例如下面的语句:macurves jan=3 feb=3x5 mar=stable
29、;指定:使用连续三年的一月份滑动平均估计作为一月份的季节因子;使用连续三年的一月份滑动平均值结果再进行五项滑动平均估计作为二月份的季节因子;使用三月份的所有值的平均值作为三月份的季节因子,这是一个恒定的季节因子。macurves语句中省略月份的缺省值为第一次估计为3x3滑动平均,第二次估计为3x5滑动平均。4. monthly语句。当X11过程输入月度时间序列数据集时必须使用monthly语句。主要选项为:l additive指定进行加法季节调整。缺省此选项为乘法季节调整。l chartsstandard/full/none指定过程产生的图表类型。缺省值为standard ,它指定12月度季节
30、性图表和一个趋势起伏图表;如果为full值,过程还额外输出不规则项和季节因子的图表;如果为none值,则不打印任何图表。l data日期变量指定输入的时间序列数据集中的日期变量。日期变量的第一个值为开始日期,最后一个值为结束日期。如果不指定此选项,则必须指定start=选项。l start=mmmyy对data=给定的日期序列指定开始日期。如果没有data=选项,指定第一条输入观察的日期为start=中的日期值。l endmmmyy对data=给定的日期序列指定结束日期。例如,输入时间序列数据集中有一个日期字段名为date,有1981年1月到2005年12月的月度数据,现在只想对1990年1月
31、开始到1999年12月进行季节调整,指定语句如下:l monthly date=date start=jan90 end=dec99;exclude=值pmfactor=月份因素变量指定输入的时间序列数据集中的月份因素变量。月份因素变量中存放的是月份调整因子的先验值。主要用于调整已经知道特殊原因的月份数据。例如,ABC公司在2005年1月份罢工,销售额sales比往常下降了约50%,这是一个一次性的事件,原因已知,应该预先修正这个月份的销售额数据,才能排除罢工的影响。在原时间序列数据集中设置一个反映月份因素的新变量x,其他月份的新变量x值都设定为100,即sales=sales/x100=sa
32、les,销售额没有进行调整;2005年1月份的新变量值x设定为50,即sales=sales/x100=2sales,销售额还原成经验值。X11过程中的monthly语句定义为:l monthly date=date pmfactor=x;l fullweight=值设定观察值距离均值小于指定选项值倍数的标准差,将赋予观察值的权数为最大值1。缺省值为1.5。l zeroweight=值设定观察值距离均值大于指定选项值倍数的标准差,将赋予观察值的权数为最小值0。缺省值为2.5。选项zeroweight=的值必须大于选项fullweight=的值。观察值距离均值落入fullweight=值和zer
33、oweight=值之间,将被赋予0到1之间的一个线性分级的权重值。l printout=standard/long/full/none指定打印哪些表格。5. quarterly语句。当X11过程输入季度时间序列数据集时必须使用quarterly语句。它的主要选项和用法与monthly语句的选项和用法类似。如选项additive、charts、data、start=、end、fullweight=、zeroweight=、printout=。季度时间值的格式为:1999年第一季度为99Q1; 1999年第二季度为99Q2 ;1999年第三季度为99Q3 ;1999年第四季度为99Q4。6. pd
34、weights语句。pdweights语句可以用来指定星期一到星期七的权重值。此语句只能用于月度数据。选项格式为:星期几=权重值。这些权重值是用来计算先验交易日因子,而先验交易日因子是在季节调整过程之前对原始序列进行修正的。只需要给出相对权重,X11过程会自动把这些权重调整到相加为7。例如一条pdweights语句定义如下:pdweights sun=0.1 mon=0.9 tue=1 wed=1 thu=1 fri=0.7 sat=0.3;7. tables语句。tables语句用来指定打印除monthly语句或quarterly语句中选项printout=规定打印的表格之外的一些额外表格。
35、例如,如果省略选项printout=,下面语句只打印最终季节因子和最终季节调整过的序列。tables d10 d11;8. output语句。output语句生成包含指定表格的输出数据集。输出数据集名由选项out=给出。对每一张要进入输出数据集的表格,由选项:表格名=新变量名列表,来指定。下面是一个var语句和output语句的示例:var z1 z2 z3;output out=out_x11 b1=x1 d11=t1 t2 t3;首先var语句指定输入数据集中三个数值型变量z1、z2和z3分别进行季节调整过程分析。output语句中的out=选项指定输出数据集名为out_x11;选项b1=
36、x1指定对变量z1进行分析,结果b1表格存入到新变量x1中;选项d11=t1 t2 t3指定对三个数值变量z1、z2和z3进行分析,三个结果b11表格分别存入到新变量t1、t2和t3中。四、 实例分析例41.1 对19932005年中国社会消费品96个月份零售总额序列,使用X11过程进行季节调整,假设先不考虑日历效应和不需要对数据进行任何预先的调整。其数据列于表41.2所示。由于没有交易日的影响,我们考虑使用乘法模型。表41.2 1993年至2000年中国社会消费品月度零售总额1993年1994年1995年1996年1997年1998年1999年2000年1月977.51192.21602.2
37、1909.12288.52549.52662.12774.72月892.51162.71491.51911.22213.52306.42538.42805.03月942.31167.51533.31860.12130.92279.72403.12627.04月941.31170.41548.71854.82100.52252.72356.82572.05月962.21213.71585.41898.32108.22265.22364.02637.06月1005.71281.11639.71966.02164.72326.02428.82645.07月963.81251.51623.61888.
38、72102.52286.12380.32597.08月959.81286.01637.11916.42104.42314.62410.92636.09月1023.31396.21756.02083.52239.62443.12604.32854.010月1051.11444.11818.02148.32348.02536.02743.93029.011月1102.01553.81935.22290.12454.92652.22781.53108.012月1415.51932.22389.52848.62881.73131.43405.73680.01. 建立月度时间序列数据集。程序如下:dat
39、a sales ;input sales ;date=intnx(month,01jan1993d,_n_-1);format date monyy.;cards ;977.5 892.5 942.3 1051.1 1102.0 1415.51192.2 1162.7 1167.5 1444.1 1553.8 1932.2 2774.7 2805.0 2627.0 3029.0 3108.0 3680.0;proc print data=sales;run ;程序说明:输入变量sales依此从第一行左边读入数据到右边,然后读入第二行中数据。同时,相应地输入变量date也从intnx()函数获得
40、从1993年1月1日开始每过一个月的时间。format语句将变量date的输出格式换成月年格式。intnx()函数包括三个参数:第一个参数是指定等时间间隔,本例中指定等时间间隔为月month,该参数还可以取天day、星期week、季度quarter、年year等;第二个参数是指定参照时间,本例的参照时间是01jan1993;第三个参数是指定开始的时间指针_n_k,k为整数。k取正值,开始时间为参照时间(不包括参照时间)向未来拨k期,例如如果本例k=1,那么开始时间为1993年2月1日。k取负值,开始时间为参照时间向过去(包括参照时间)拨k期,例如如果本例k=-2,那么开始时间为1992年12月
41、1日。2. 调用季节调整X11过程。程序如下:proc x11 data=sales;monthly date=date;var sales;arima maxit=60;tables d11;output out=out b1=series d10=season d11=adjusted d12=trend d13=irr; proc print data=out;run ;程序说明:调用季节调整X11过程之前,应该先绘制原始时间序列的散点图,直观判断一下是否存在确定性季节波动,以便确定能否调用X11过程。如果的确存在季节性波动,还需要判断一下季节性的时间周期为月份还是季节。本例时间序列数据
42、集sales,是以月度时间为观察值建立的,月份值输入在date变量中,因此必须要用monthly date=date语句来说明。对sales数据集中哪些变量存放季节性数据及需要进行分析,由var sales语句来指明。arima语句的作用是把时间序列延长,这样一来序列尾部就可以使用对称滑动平均方法,用以解决减少对序列尾部的更正。对时间序列延长的模型,从五个预先定义的模型中择优录用来拟合,当然arima模型也可以通过选项model=来自己定义。参数maxit=60指定估计过程最多允许迭代60次,特别是对于高阶arima模型,缺省值最多允许迭代15次可能不够。tables d11语句指定打印d11
43、表格,它输出最终的季节调节后的序列。output语句把部分结果输出到out数据集,把列出的表输出到一个指定的字段名中,表b1中的原序列值输出到series字段名中,表d10中的最终季节因子输出到season字段名中,表d11中的最终季节调节后的序列值输出到adjusted字段名中,表d12中的最终趋势起伏值输出到trend字段名中,表d13中的最终不规则序列值输出到irr字段名中。程序运行后结果见表41.3、表41.4和表41.5所示。表 41.3 X11季节调整过程的概述表 X11 Procedure X-11 Seasonal Adjustment Program U. S. Bureau
44、 of the Census Economic Research and Analysis Division November 1, 1968 The X-11 program is divided into seven major parts. Part Description A. Prior adjustments, if any B. Preliminary estimates of irregular component weights and regression trading day factors C. Final estimates of above D. Final es
45、timates of seasonal, trend-cycle and irregular components E. Analytical tables F. Summary measures G. Charts Series - SALES Period covered - 1/1993 to 12/2000 Type of run multiplicative seasonal adjustment. No printout. No charts. Sigma limits for graduating extreme values are 1.5 and 2.5 Irregular
46、values outside of 2.5-sigma limits are excluded from trading day regression X11 Procedure Seasonal Adjustment of - SALES Conditional Least Squares Estimation Approx. Parameter Estimate Std Error T Ratio Lag MU 0.62590 4.49392 0.14 0 MA1,1 0.05113 0.25977 0.20 1 MA1,2 -0.55110 0.14925 -3.69 2 MA2,1 0
47、.05703 0.12311 0.46 12 AR1,1 -0.51557 0.27329 -1.89 1 AR1,2 -0.44416 0.20261 -2.19 2 Constant Estimate = 1.22659 Variance Estimate = 3164.8 Std Error Estimate = 56.25690 AIC = 910.284033* SBC = 924.797076* Number of Residuals= 83 * Does not include log determinant. Criteria Summary for Model 5: (2,1
48、,2)(0,1,1)s, No Transformation Box-Ljung Chi-square: 17.51 with 19 df Prob= 0.56 (Criteria prob 0.05) Test for over-differencing: sum of MA parameters = 0.06 (must be 0.90) MAPE - Last Three Years: 1.49 (Must be 15.00 %) - Last Year: 1.37 - Next to Last Year: 1.76 - Third from Last Year: 1.34表 41.4 X11过程的arima模型选择表 41.5 最终季节调整后的销售额 3. 绘制G1G4四张图表 X11 Procedure Seasonal Adjustment of - SALESD11 Final Seasonally Adjusted SeriesYear JAN FEB MAR APR MAY JUN1993 938.400 903.801 978.115 995.791 1013 10351994 1144 1175 1212 1239 1279 13201995 1536 1503 1594 1641 1674 16951996 1830 1922 1939 1970 201
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高校辅导员考试:班级管理策略与班级文化建设试题
- 语言能力及文化素养结合的综合测试试题及答案
- 2025年护士执业资格考试题库-急危重症护理学护理教育改革伦理试题
- 国开《幼儿园一日生活组织与实施》第1-6单元在线测试
- 家庭安全常识培训
- 二零二五版饭店租赁协议合同书
- 商铺装修协议合同二零二五年
- 专业人才补贴服务协议二零二五年
- 总经理聘用协议集锦
- 二零二五版实习教师协议合同
- 救护车使用培训课件
- 经典成语故事郑人买履
- 人血白蛋白介绍演示培训课件
- 大学军事理论课教程第三章军事思想第四节当代中国军事思想
- 茶叶加工工理论试卷及答案
- 建筑企业法律服务方案
- 空调维保服务投标方案(技术标)
- 幼儿园户外自主游戏
- 22S803 圆形钢筋混凝土蓄水池
- 烟供.火供.火施仪轨
- Python语言程序设计 课件全套 清华 第1-12章 计算机科学基础 - 其他常用库介绍
评论
0/150
提交评论