版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
{管理信息化VR虚拟现实}第六章ARIMA某模型第六章ARIMAX模型一、ARIMAX模型的概念ARIMA模型也称为ARIMAX模型。Box和刁锦寰提出ARIMAX模型。例子1)9.11事件对道琼斯指数的影响2)广告对销售量的效应3)美国月批发物价指数对零售价指数的影响4)1960年前后时间X1、冬季X2、夏季X3对臭氧数据Yt5)固有股减少X1、道琼斯指数X2、石油价格X3对上证指数数学模型i=1,…,k)其中,Xt(1)Xt(2)…xt(k).注:为减少参数个数,通常考虑简化为:其中(i=1,……,k)=称上述模型为ARIMAX模型,又称为带有干预序列的ARIMA模型或动态回归模型。这个模型
列也称为相依序列或输出序列,输入序列也称为独立序列或预测因子序列。二、两个独立滑动平均过程之和它是阶数分别为的两个独立平均过程之和即均是均值为零的白噪声且相互独立记可得的自相关函数当时为零故可表示成阶的单一滑动平均过程为零均值白噪声(证明可参考Hamiton三、附加噪声对一般模型的影响考虑ARIMA设本身不可观测,只能观测到表示有关的附加的噪声,则对有若对有即则有四、带有回归项和时间序列误差的模型为解释变量,而误差是一个ARMA(p,q,的最小二乘估计为,并具有性质。的样本性质和统计推断的方=1t-统计量及置信区间等就不再有效。例:,的子协方差为。的最小二乘估计为,它的方差为:如果模型中误差为不相关的,我们会取,而这会引起明显的错误推断。的残差称为广义最小二乘估计为。在实际中,根据噪声项确定具体的ARMA模型,可以确定协方差的具体形式,并可找到一个
以必须在计算和极大似然估计以及模型中的参数之间迭代。(BOXJENKINSp415-420)三、附加噪声的传递函数模型干扰或噪声和的水平独立,且添加到有关的影响上,它们可以写成干预序列如果噪声模型可以用ARIMA(p,d,q)过程表示这里是白噪声,则模型最终可以写成:互协方差和互相关系数一般地,一个双变量随机过程无须是平稳的,但适当进行差分后的过程是平稳的,这里。一般,但称之为互协方差,和互相关系数P470)互协方差和互相关的估计假设对原始的输入输出序列作了d次差分后有n=N-dk互协方差系数的估计值为:传递函数模型的识别对预白噪化输入的传递函数模型的识别稳的,并且可由ARMA模型来描述,那么可以对用通常的识别和估计方法得到一个模型:计。如果我们对使用同样的变换得到:则原模型可以写为:其中转换后的噪声序列有将上式两边同时乘以并取数学期望,我们得到:于是应函数成正比。在实际中我们并不知道理论互相关函数,故我们可以用其估计量替代:噪声模型的识别假设模型可以写成(如果必要,做适当的差分之后)用前面所述方法给出传递函数的初步估计后,噪声序列的估计由下式得到:还可以用初步识别所确定的试用传递函数模型来替代。于是的计算:先通过写为递推计算出,然后由计算噪声序列。假如输入可以被完全白燥化,出了独立性的假设,从而也独立。由此计算得到模型识别后可以用条件平方和法进行参数的计算。干预模型其中代表干预事件的影响是噪声它表示在没有干预影响时序列的变化一般可设是一个ARIMA(p,d,q)即干预序列分为脉冲式干预序列和持续式干预序。列。脉冲式干预序列:
持续式干预序列:一般有两种通用的形式①它表示在时刻T之后干预的影响仍保留下去的情形②它可表示暂时或瞬间干预的影响干预分析模型可表示为+持续式干预序列需预白噪声化,即先将干预序列拟合ARIMA模型。预白噪声:用途:①对非脉冲干预因子,有可能计算机不好计算②估计干预因子对应的传递函数的推移算子有关附加异常值与新息异常值模型1.设~ARIMA(p,d,q)若在时刻T附加异常值,则有称之为附加异常值模型(AOModel)2.新息异常值(IO)模型=[]第三节SAS实现计算一、差分输入序列的差分由CROSSCORR=选项来指定,并且如同相应序列的差分那样工作。例如Identify=var=y(1)crosscorr=(x1(1)x2(1))表示对Y作一阶差分,对X1,X2作一阶差分,在随后的ESTIMATE语句中,任何在INPUT=选
项中用到X1和X2时,这些名字指差分序列。二、使用输入序列identifycrosscorr=选项中列出输入序列,并在随后的ESTIMATE语句中用INPUT=选项说明它们是如何进入模型的。Procarimadata=a;Identifyvar=salescrosscorr=price;Estimateinput=price;本例使用一个称作price的序列来帮组对salessales关于price的简单线性回归,生成和procreg过程相同的结果。由这些语句所得出的估计模型的数学形式为:模型中可以使用任意多个输入变量,例如:Procarimadata=a;Identifyvar=salescrosscorr=(priceine);Estimateinput=(priceine);由这些语句所得出的估计模型的数学形式为:三、延迟和差分输入序列procarimadata=a;identifyvar=sales(1)crosscorr=price(1);estimateinput=(1$price);run;这些语句给出估计模型其中price的一阶滞后由input=(1$price).说明。四、带ARMA误差的回归可以把输入序列与关于误差的ARMA模型结合起来。建立回归模型,但回归模型的误差(噪声序列)假定是一个时间序列模型。procarimadata=a;identifyvar=salescrosscorr=(priceine);estimatep=1q=1input=(priceine);run;这些语句给出估计模型:五、平稳性和输入序列声序列相同,但是如果存在输入,则在输入的影响消除后,噪声序列变为残差。
声是平稳的。当使用输入序列时,你可以首先不假定误差为ARMA模型的情况下拟合输入变量,然后再对
噪声部分拟合一个ARMA模型前考虑一下残差的平稳性。识别带有ARMA误差的回归模型对于ARIMA模型可以用identify语句进行识别。当响应序列依赖于输入变量时,这种识别ARIMA均值调整后的序列不再是噪声序列的一个估计。然后对此残差序列应用ARIMA模型识别过程。通常此时我们假定噪声过程是平稳的。ESTIMATE语句中的PLOT选项为模型的残差生成与IDENTIFY语句为响应序列生成的一样的散点图。PLOT选项打印出残差序列的自相关、偏相关和逆相关系数图。
下列语句演示了识别带回归变量,噪声过程为ARMA(1,1)模型procarimadata=a;identifyvar=salescrosscorr=(priceine)noprint;estimateinput=(priceine)plot;run;estimatep=1q=1input=(priceine)plot;run;此例中,IDENTIFY语句包括NOPRINT选项是因为响应变量的自相关图在序列依赖于输入变量时是没有什么作用的,所以不显示出来。第一个ESTIMATEPLOT选项生成了对于pricehe和ine回归的残差的自相关、偏相关和逆相关系数图。通过PLOTARMA(1,1)个ESTIMATE语句拟合最终的模型。为ARIMA模型的识别。六、干预模型和中断时间序列脉冲干预此时,输入变量在某时刻为1而在其它时间为0。这类干预变量也称为脉冲函数。下列语句假设SALES是月度数据,一个广告是在March1992。下列语句假设saless是ARMA(1,1)。估计干预的效果。dataa;seta;ad=date='1mar1992'd;
run;procarimadata=a;identifyvar=salescrosscorr=ad;estimatep=1q=1input=ad;run;连续干预梯函数。例:考虑新闻对某产品需求的影响。假设1992年三月有报道说某产品可预防心脏病,那么在此后sales持续的较高。下列程序对这种干预效果进行建模。dataa;seta;news=date>='1jul1996'd;run;procarimadata=a;identifyvar=salescrosscorr=news;estimatep=1q=1input=news;run;相互作用可以在模型中包含多个干预变量。干预变量可以是脉冲式的也可以是连续干预等任何形式。的时间序列,你就可以通过利用输入变量用PROCARIMA对于误差过程拟合任何一个ARMA模型相连的一般线性模型。此时输入变脸对应于线性模型中的设计矩阵。有理转移函数和分布时滞模型输入序列进入模型的途径也叫转移函数。因此带输入序列的ARIAM模型也叫转移函数模型。有理函数的复杂转移函数。这些转移函数如同作用于ARMA或误差项一样作用于输入序列。分子因子procarimadata=a;identifyvar=salescrosscorr=price;estimateinput=((123)price);run;这些语句估计下列模型:该模型把PRICE对SALES的影响拟合为PRICESALES关于和PRICE,LAG(PRICE),LAG2(PRICE),和LAG3(PRICE)的多元线性回归。
列所满足ARMA的MA部分。分母因子所满足ARMA的AR部分。分母因子是把指数加权和无穷分布时滞引入转移函数。为了说明带分母因子的转移函数,需将分母因子置于INPUT=选项的斜杠号(/)之后。procarimadata=a;identifyvar=salescrosscorr=price;estimateinput=(/(1)price);
run;上述转移韩式为:这个转移函数也可以等价地写为:某个极限值。有理转移函数在INPUT=选项中组合各种分子分母因子,就可以指定任意复杂程度的有理转移函数。input=(k$(-lags)/(-lags)x)INPUT和转移函数的进一步说明:输入变量及其转移函数可以通过ESTIMATE语句的INPUT=选项指定,这些变量必须在IDENTIFY语句的CROSSCORR=选项中列出。如果在CROSSCORR中给出的是差分,那么也是差分变量作为在INPUT中用于转移函数的。ESTIMATE...INPUT=(transfer-functionvariable...)转移函数可以用作纯回归转移函数可以特殊化为:S$(L1,1,L1,2,...)(L2,1,...).../(Li,1,Li,2,...)(Li+1,1,...)...S是输入变量的延迟时间(lag)(/)之前为分子及其因子,之后为分母及其因子。各个不同的变量用逗号隔开。项Li,1,Li,2,...,Li,k表示下列形式:第一个分母因子的形式依赖于ALTPARM1被自由参数替代。.AlternativeModelParameterizationALTPARMOptionINPUT=OptionALTPARMModelINPUT=((12)(12)/(1)X)No;Yes差分和输入变量如果对响应变量和输入变量作差分,那么差分运算并不改变模型的意义。如要拟合模型:那么IDENTIFY语句为:identifyvar=y(1,12)crosscorr=x(1,12);estimateq=1input=(/(1)x)noconstant;如果差分部分写为:identifyvar=y(1,12)crosscorr=x;estimateq=1input=(/(1)x)noconstant;那么模型为:由VAR=分。识别转移函数模型Identify语句中的CROSSCORR=选项打印出了不同时间间隔的响应序列和输入序列的样本互必须对输入序列的预白燥化模型对输入和响应变量序列进行滤波。预白噪声处理对于两者之间的关系会给出误导性指示。解决这个问题的方法就是预白噪声处理。首先用一个ARIMA样的模型过滤响应序列,并计算过滤后响应序列和过滤后输入序列的互相关序列。当在用响应序列的IDENTIFY语句前,使用IDENTIFY和ESTIMATE语句来拟合关于输入序列的模型时,ARIMA过程自动地执行这个预白燥化。如果一个不带输入的模型先用来拟合CROSSCORR=理,然后才可以计算输入序列的互相关函数。例procarimadata=in;identifyvar=x;estimatep=1q=1;identifyvar=ycrosscorr=x;X和Y都被ARMA(1,1)模型过滤,然后计算过滤后的互相关系数。ESTIMATE和FORECAST语句中使用未过滤序列,并且Y在自身时间间隔上的相关系数利用未经过滤的Y序列计算。但ESTIMATE预白燥化处理的结果不同。为了取消对输入变量的预白燥化的处理,可以在IDENTIFY语句中使用CLEAR选项,以使PROCARIMA忘记以前所有模型。预白噪声化合差分如果VAR=和CROSSCORR=选项指定了差分操作,则序列在预白噪声化前作差分。带输入变量的预测为了使用带输入的ARIMADATA=dataset中给出预测时刻的输入变量值,或者用PROCARIMA预测输入变量的值。如果在FORECAST语句使用的数据集中没有输入变量的未来值,则你必须在ARIMA模型过程ARIMA模型来拟合需要预测FORECAST语句自动对于输入序列使用ARIMA模型以生成所需输入的预测值。下列语句在拟合和预测SALES之前,用AR(2)拟合PRICE的变化量。FORECAST语句使用此AR(2)自动地预测PRICE来获取生成SALES预测的未来输入值。procarimadata=a;identifyvar=price(1);estimatep=2;identifyvar=sales(1)crosscorr=price(1);estimatep=1q=1input=price;forecastlead=12interval=monthid=dateout=results;run;来自DATA数据集的输入值和由PROCARIMA预测的输入值可以结合起来。例如关于SALES的
模型可以有三个输入序列:PRICE,INCOME,andTAXRATE从另一途径获取的INCOME预测值,但这仅仅是你想获得的最初几个时刻的SALES预测值。
没有用前面例子中的方法预测的PRICE的未来值。SALES和PRICE赋值为丢
失值,对TAXRATE赋值为它的上一个真实值,而对于INCOME在有预测值的时刻赋值为预测
值而在以后的时刻赋值为丢失值。在PROCARIMA阶段,先要估计关于PRICE和INCOME的
ARIMA模型,然后再估计SALES的模型。procarimadata=a;identifyvar=price(1);estimatep=2;identifyvar=ine(1);estimatep=2;identifyvar=sales(1)crosscorr=(price(1)ine(1)taxrate);estimatep=1q=1input=(priceinetaxrate);forecastlead=12interval=monthid=dateout=results;run;在预测SALES,ARIMA过程用做输入的值是使用ARIMA模型产生的PRICE的预测值,DATA=的数据集中的TAXRATEDATA=的数据集中找到的INCOMEARIMA模型在INCOME缺失时所得的预测值。例5.41955年至1977年大气臭氧数据,试建立ARIMAX模型,以1966年前后,1965年后的冬夏为干预引子,并预报1978年臭氧数据。解:用ozone表示臭氧数据,x1表示1966年前后不同(1966年前为0,1966年后为1summer,winter表示夏冬(夏冬分别表示为1,其余为0ozone作年差分以便绝大部分为0。模型如下:(1-B12)(0zonet-a*x1t)=c*summer+d*winter+(1-eB)(1-Fb12)at程序如下:dataair;dot=1to228/*最后10个为预报值*/;inputozone@@;year=int((t-0.2)/12)+1955;month=(t-(year-1955)*12);x1=year>=1960;summer=(5<month<11)*(year>1965);winter=(year>1965)-summer;output;end;cards;...;procarimadata=air;identifyvar=ozone(12)crosscorr=(x1(12)summerwinter)noprint;
estimateq=(1)(12)input=(x1summerwinter)noconstantmethod=mlitprint;
forecastlead=12id=tinterval=month;run;quit;/*结束arima程序*/参数的最大似然估计ParameterEstimatetValueApproxPr>|t|VariableMA1,1-0.26684-3.98<.0001ozoneMA2,10..83<.0001ozoneNUM1-1.33062-6.92<.0001x1NUM2-0.23936-4.02<.0001summerNUM3-0.08021-1.610.1071winter/*可尝试去掉*/AIC=501.7696SBC=518.3602适应性检验(通过)Lagchisquarepr>chisq67.470.11321210.210.42201814.530.55932419.990.58343027.000.51803632.650.5336给出模型Nomeanterminthismodel.(无均值)MovingAverageFactors(滑动平均因子)第一个因子:Factor1:1+0.26684B**(1)第二个因子:Factor2:1-0.76665B**(12)输入因子:InputNumber1(第一个输入(干预)因子)InputVariable(变量名):x1Period(s)ofDifferencing(差分阶数):12OverallRegressionFactor(系数):-1.33062InputNumber2(第二个输入因子)InputVariable(变量名):summerOverallRegressionFactor(系数):-0.23936InputNumber3(第三个输入因子)InputVariable(变量名):winterOverallRegressionFactor(系数):-0.0802模型为:给出预报值:Forecastsforvariableozone
ObsForecastStdError95%ConfidenceLimits2171.42050.7966-0.14072.98172181.84460.82440.22873.46042192.45670.82440.84084.07252202.85900.82441.24314.47482213.15010.82441.53424.76592222.72110.82441.10534.33702233.31470.82441.69894.93062243.47870.82441.86295.09462252.94050.82441.32474.55642262.35870.82440.74293.97462271.85880.82440.24293.47462281.28980.8244-0.32602.9057例5.5某天然气炉的天然气输入速率x和co2输出速率y,3044个co2x为干预因子,建立ARIMAX数学模型并预报下5个co2值。解:先对x实行预白噪声化:dataseriesj;dot=1to300;inputxy@@;output;end;cards;...;procarimadata=seriesj;identifyvar=xnlags=10;run;输出结果:样本自相关函数指数衰减;偏、逆自相关函数截尾。可认为是AR(p)模型,并试用AR(p)模型。程序如下:estimatep=3;run;输出结果:ConditionalLeastSquaresEstimation(参数的条件最小方差估计)StandardApproxParameterEstimateErrortValuePr>|t|Lag
MU-0.118050.10911-1.080.28010AR1,11.969720..95<.00011AR1,2-1.365360.09922-13.76<.00012AR1,30.339750.054806.20<.00013AIC-142.256SBC-127.441AutocorrelationCheckofResiduals(适应性检验)ToChi-Pr>LagSquareDFChiSq69.3630.02491218.3090.03191826.73150.03112430.02210.09153034.15270.16173639.22330.21094242.22390.33364843.90450.5185表明基本符合白噪声条件,可认为预白噪声成功。再采用干预模型。试用模型:程序为:identifyvar=ycrosscorr=(x)nlags=10;estimateinput=(3$(1,2)/(1,2)x)plot;run;输出结果:ConditionalLeastSquaresEstimation(参数估计值)StandardApproxParameterEstimateErrortValuePr>|t|LagVariableMU53.322370.81.24<.00010yNUM1-0.628610.25385-2.480.01390xNUM1,10.472670.622580.760.44831xNUM1,20.736340.810520.910.36442xDEN1,10.154290.905390.170.86481xDEN1,20.277630.573800.480.62892xAIC729.7249SBC751.7648
AutocorrelationCheckofResiduals
ToChi-Pr>LagSquareDFChiSq6496.456<.000112498.5812<.000118539.3818<.000124561.8724<.000130585.9030<.000136592.4236<.000142593.4442<.000148601.9448<.0001由于chisquare值很大,prob值很小,表明残差序列相关,模型拟合得不好。CrosscorrelationCheckofResidualswithInputxToChi-Pr>LagSquareDFChiSq50.4820.7856110.9380.9987172.68140.99952319.50200.48942920.44260.77033524.62320.82104131.13380.77744732.13440.9080残差序列不互相关,不需变动干预因子试用模型:程序为:estimatep=2input=(3$(1,2)/(1,2)x);run;输出结果:ConditionalLeastSquaresEstimation(参数的条件最小方差估计值)StandardApproxParameterEstimateErrortValuePr>|t|LagVariableMU53.263370.4.30<.00010yAR1,11.533030..19<.00011yAR1,2-0.632860.05017-12.62<.00012yNUM1-0.536170.07552-7.10<.00010xNUM1,10.363790.149402.430.01551xNUM1,20.507420.157623.220.00142xDEN1,10.571120.209302.730.00681xDEN1,2-0.016450.14486-0.110.90972xAIC10.27807(偏大)SBC39.66466(偏大)试用模型:程序为:estimatep=2input=(3$(1,2)/(1)x);run;输出结果:ConditionalLeastSquaresEstimation(参数的条件最小方差估计值)StandardApproxParameterEstimateErrortValuePr>|t|LagVariableMU53.263060.6.60<.00010yAR1,11.532910..25<.00011yAR1,2-0.632970.05006-12.64<.00012yNUM1-0.535220.07482-7.15<.00010xNUM1,10.376020.102873.660.00031xNUM1,20.518940.107834.81<.00012xDEN1,10.548410..35<.00011xAIC8.29281SBC34.00607AutocorrelationCheckofResiduals(适应性检验)ToChi-Pr>LagSquareDFChiSq68.6140.07171215.43100.11721821.13160.17342427.52220.19223036.94280.12023644.26340.11184245.62400.25004848.60460.3688适应性检验通过。给出模型:ModelforvariableyEstimatedIntercept(均值估计值)53.26306
AutoregressiveFactors(自回归因子)
Factor1:1-1.53291B**(1)+0.63297B**(2)
InputNumber1(第一个干预因子)InputVariable(变量名):xShift(差分阶数):3NumeratorFactors(分子因子)Factor1:-0.5352-0.37602B**(1)-0.51894B**(2)
DenominatorFactors(分母因子)
Factor1:1-0.54841B**(1)模型为:预报语句:forecastlead=5;run;输出结果:ForecastsforvariableyObsForecastStdError95%ConfidenceLimits29756.52660.242556.051257.002029856.04370.443955.173656.913829955.60200.608754.409056.794930055.21110.737053.766656.655630154.81170.880653.085756.5376作业:设太阳黑子和某地年降水数据分别是,用ARIMAX模型拟合,写出相应的程序。第四节单位根检验含单位根的单元过程一.AR(1)~iidN(0,且y0,得到…,可得的OLS估计得=,如果的真实值的绝对值小于1。则有如果在时,上式也成立,则似乎可断言有零方差,或者这一分布聚向零点:但上式无法检验:,为了得到单位根情形下的非退化渐近分布,我们必须乘以T,即此时以更快的速度收敛于1若时()=(*)首先考察上式的分子,在时,该模型描述了一个随机游动。有…故~,又-因两边同时除以得而~意味着~。而也是T个i.i.d随机变量的和,每个的均值为。由大数定律知故,其中~。对于(*故,为了获得一个具有收敛分布的随机变量,量要除以,正如(*)的分母一样。
OLS估计距真实值的偏离要乘以T以得到一个渐近
标准分布的比。的渐近分布在后面论述。二、布朗运动~iidN(0,1)~N(0,t)且对任意时期,它独立于时期r和q之间的变化。考察到之间的变化。如果将看成两个独立的高斯变量之和将与和在某个中间点(如)的值间的变化联系起来:数时期和非整数期的性质。即,且独立与任何其它非重叠区间上的变化。同理,可设想将t-1和t的区间的变化分成N个不同的子时期有。当时的极限,是一个连续时间过程,称为标准布朗运动,该过程在t时之值记为w(t)定义:标准的布朗运动是一个连续时间过程,与每一个时期对应的数值为w(t),它是有:是多元高斯的且(c):对任意实现w(t)以概率为1关于t连续。三、函数形式的中心极限定理布朗运动的用途之一是允许中心极限定理有更为一般的结论。如果有零均值和方差,则样本均值(中心极限定理)当给定容量为T的一个样本,我们计算前半个样本的均值,而将其余观测值抛开:另外,这一估计量独立于用后半个样本的估计量。一般地,取定义则,它是r的分段函数,有:于是:但是而,故有(1)对于,如果我们考察基于观测值的样本均值的行为,我们可以得到的结论也是渐近正态的:并且独立于(1)中的估计量,其条件是。更一般的有:上式称为是函数形式的中心极限定理。特别地:。随机过程,而表示它在时刻t1是r的连续函数。对于这样一个连续函数序列。我们称,如果下面(a)(b)(c)全成立:(a)对于任意k有限时期K维随机向量序列收敛于向量的分布,其中(b)T一致地趋于零。(c)当时,关于T一致地成立。连续映射定理其中g是一个连续函数。对于随机函数序列也有一个相似的结果成立。连续映射定理表明,只要,且是一个连续泛函,则有:。连续映射定理也可以应用到(0,1)上的一个连续有界
函数映射到(0,1)上的另一个连续有界函数的连续泛函。故有:,由于,意味着考察在r的值为则单位根过程的应用对将上式两边同乘以得到当故有:又:则有故它是个具有N的随机变量之前定义的:故可得:类似的可得:上述结果综述如下:定理:假设是一个随机游动,,则有:(a)(b)(c)(d)(e)(f)(g)(h)上述定理用W(r)a(b)是一个分布,(c)d)是分布。该定理可用于计算含单位根的统计量的渐近分布。下面讨论几种重要形式的DF检验:1.无常数或时间趋势的回归:真实过程是一个随机游动考察下式关于的OLS估计其ols估计:,当=1时,由(b)和(e)得到(1)另一个检验零假设=1的常用统计量基于如下假设的普通olst检验:
是估计系数的OLS标准差,是残差方差的OLS估计。故有:(2)(12)称为DF检验。2.回归含常数项但不含时间趋势项:真实过程是一个随机游动真实过程是随机游动:而参数的估计根据:其ols估计为:若,则:可得:(1)(2)3.回归含常数项不含时间趋势:真实过程为含位移的随机游动真实过程为:参数还是根据来计算其OLS估计。其中t=1,2,….T其中因此在这种情形下,两个估计的系数都是渐近高斯的。4.回归含常数项和时间趋势:真实过程是含或不含位移的随机游动真实模型为:参数根据:来估计。时的ols的t检验的渐进分布为;其中:。我们看到当的真实值为1时,OLS估计的性质取决于要估计的回归中是否包含常数项或时间趋势,以及描述的真实过程的随机游动是否包含一个位移。哪一个是用于检验单位根零假设的“正确情形取决于我们为什么对检验单位根感兴趣。如定限制。这一原理可建议对含明显趋势项的序列应用情形4序列应用情形2的检验。DF检验为单边检验,当显著性水平为时,为其DF检验的分为点,则时,拒绝原假设,认为序列显著平稳;时,接受原假设,认为序列平稳。含一般序列相关的单位根过程的渐近结果定理令,其中,且是i.i.d序列,其均值为零,方差为,且四阶矩有限。定义且有。则(a)(b)(c)(d)(e)(f)(g)(h)(i)(j)(k)菲利普斯-佩龙单位根检验情形2,真实过程是随机游动:,而参数的估计根据:在下来计算其ols估计为。菲利普斯-佩龙将这些结果推广到序列相关以及可使异方差的情形。情形2现在假设真是过程为考察则有:(1)(参考hamiton《时间序列分析》P613—624)(2)其中:同样在情形1和4下响应的检验统计量为:情形1:考察(1)(2)情形4:真实模型为:,参数根据:来估计。(见Hamilton《时间序列分析》P652-653)P阶自回归的性质和扩展的DF单位根检验假定数据由一个AR(p)过程生成:
(1)其中序列,均值为零,方差为,四阶矩有限。定义:(2)(3)而(4)因此(1)可以等价地表示为:(5)或(6)假定生成过程包含一个单个的单位根,其它的根都在单位元之外。即(7)的一个根为一。(8)上式表明上述。另外,当时,(4)意味着(9)在使(9)左边为0的p个z值中,其一是,其余预定全落在单位元之外。对于右边也同样为真。在下,(5)可写作:或(10)123的结果,如果含有常数项和一个时间趋势,则得到情形4的结果。情形2:估计的自回归包含一个常数项,但数据确由一个无位移的单位根自回归生成假定数据由一个AR(p)过程生成:或按照通常的自回归的OLS估计的方法,假定初始样本容量为T+p,其观测值为,以前的p个观测值为条件。对(11)的OLS估计。设(1*)其中表示最后的位置为一,其余皆为零的(p+1)维向量。情形1:估计的自回归不包含一个常数项,但数据确由一个无位移的单位根自回归生成真实过程为:估计由情形4:估计的自回归包含一个常数项和时间趋势,但数据确由一个无位移或含位移的的单位根自回归生成真实过程为:估计由见P655SAS计算平稳性检验当时间序列具有单位根时,序列是非平稳的,传统的OLS估计就不是正态的。Dickey(1976)和DickeyandFuller(1979)研究了带单位根的自回归模型的最小二乘估计的极限分布,Dickey,Hasza,andFuller(1984)获得了带有季节单位根的时间序列模型的OLS估计的极限分布,Hamilton(1994)讨论了各种类型的单位根的的检验问题。在SAS计算中的实现可以通过PROCARIMA过程中identify语句中的选项STATIONARITY=;PROBDF函数或者宏DFTESTMacro来实现。1、STATIONARITY=test=armaxtest=(ar1,..,arn)给出一个列表来确定,其中,test是ADF,PP,orRW.缺损值为(0,1,2).STATIONARITY=(ADF=ARordersDLAG=s)STATIONARITY=(DICKEY=ARordersDLAG=s)执行ADFDLAG=s中s大于1则做季节性DFs是12.缺损值是1。下列代码对自回归阶数分别为2和5做ADF检验。procarimadata=test;identifyvar=xstationarity=(adf=(2,5));run;STATIONARITY=(PP=ARorders)STATIONARITY=(PHILLIPS=ARorders)执行Phillips-Perrontests.下列代码执行自回归阶数从0到6阶执行扩展的Phillips-Perrontestsprocarimadata=test;identifyvar=xstationarity=(pp=6);run;STATIONARITY=(RW=ARorders)STATIONARITY=(RANDOMWALK=ARorders)执行带位移的随机游动检验。下列代码执行自回归阶数从0到2的带位移的随机游动检验。procarimadata=test;identifyvar=xstationarity=(rw);run;PROBDF函数做Dickey-FullerTestsPROBDF函数对时间序列的单位根做Dickey-Fullertests计算其显著性概率。该函数可以用于任何SAS库函数,包括DATA步程序、SCL程序和PROC。其语法为:PROBDF(x,n[,d[,type]])xistheteststatistic.nisthesamplesize.Theminimumvalueofnalloweddependsonthevaluespecifiedforthesecondargumentd.Fordintheset(1,2,4,6,12),nmustbeanintegergreaterthanorequaltomax(2d,5);forothervaluesofdtheminimumvalueofnis24.disanoptionalintegergivingthedegreeoftheunitroottestedfor.Specifyd=1fortestsofasimpleunitroot(1-B).Specifydequaltotheseasonalcyclelengthfortestsforaseasonalunitroot(1-Bd).Thedefaultvalueofdis1;thatis,atestforasimpleunitroot(1-B)isassumedifdisnotspecified.Themaximumvalueofdallowedis12.typeisanoptionalcharacterargumentthatspecifiesthetypeofteststatisticused.ThevaluesoftypeareSZMstudentizedteststatisticforthezeromean(nointercept)caseRZMregressionteststatisticforthezeromean(nointercept)caseSSMstudentizedteststatisticforthesinglemean(intercept)case
RSMregressionteststatisticforthesinglemean(intercept)caseSTRstudentizedteststatisticforthedeterministictimetrendcaseRTRregressionteststatisticforthedeterministictimetrendcaseThevaluesSTRandRTRareallowedonlywhend=1.ThedefaultvalueoftypeisSZM.DetailsTheoreticalBackgroundWhenatimeserieshasaunitroot,theseriesisnonstationaryandtheordinaryleastsquares(OLS)estimatorisnotnormallydistributed.Dickey(1976)andDickeyandFuller(1979)studiedthelimitingdistributionoftheOLSestimatorofautoregressivemodelsfortimeserieswithasimpleunitroot.Dickey,Hasza,andFuller(1984)obtainedthelimitingdistributionfortimeserieswithseasonalunitroots.Considerthe(p+1)thorderautoregressivetimeseriesanditscharacteristicequationIfallthecharacteristicrootsarelessthan1inabsolutevalue,Ytisstationary.Ytisnonstationaryifthereisaunitroot.Ifthereisaunitroot,thesumoftheautoregressiveparametersis1,and,hence,youcantestforaunitrootbytestingwhetherthesumoftheautoregressiveparametersis1ornot.Forconvenience,themodelisparameterizedaswhereandTheestimatorsareobtainedbyregressingon.Thetstatisticoftheordinaryleastsquaresestimatorofistheteststatisticfortheunitroottest.IftheTREND=1optionisused,theautoregressivemodelincludesameanterm.IfTREND=2,themodelalsoincludesatimetrendtermandthemodelisasfollows:Fortestingforaseasonalunitroot,considerthemultiplicativemodelLet.Theteststatisticiscalculatedinthefollowingsteps:1.Regressontoobtaintheinitialestimatorsandputeresiduals.Underthenullhypothesisthat,areconsistentestimatorsof.2.Regresson,...,toobtainestimatesofand.Thetratiofortheestimateofproducedbythesecondstepisusedasateststatisticfortestingforaseasonalunitroot.Theestimatesofareobtainedbyaddingtheestimatesoffromthesecondsteptofromthefirststep.TheestimatesofandaresavedintheOUTSTAT=datasetiftheOUTSTAT=optionisspecified.Theseries(1-Bd)Ytisassumedtobestationary,wheredisthevalueoftheDLAG=option.IftheOUTSTAT=optionisspecified,theOUTSTAT=datasetcontainsestimates.IftheseriesisanARMAprocess,alargevalueoftheAR=optionmaybedesirableinordertoobtainareliableteststatistic.TodetermineanappropriatevaluefortheAR=optionforanARMAprocess,refertoSaidandDickey(1984).TestStatisticsTheDickey-Fullertestisusedtotestthenullhypothesisthatthetimeseriesexhibitsalagdunitrootagainstthealternativeofstationarity.ThePROBDFfunctionputestheprobabilityofobservingateststatisticmoreextremethanxundertheassumptionthatthenullhypothesisistrue.YoushouldrejecttheunitroothypothesiswhenPROBDFreturnsasmall(significant)probabilityvalue.ThereareseveraldifferentversionsoftheDickey-Fullertest.ThePROBDFfunctionsupportssixversions,asselectedbythetypeargument.Specifythetypevaluethatcorrespondstothewaythatyoucalculatedtheteststatisticx.ThelasttwocharactersofthetypevaluespecifythekindofregressionmodelusedtoputetheDickey-Fullerteststatistic.Themeaningofthelasttwocharactersofthetypevalueareasfollows.ZMzeromeanornointerceptcase.TheteststatisticxisassumedtobeputedfromtheregressionmodelSMsinglemeanorinterceptcase.TheteststatisticxisassumedtobeputedfromtheregressionmodelTRinterceptanddeterministictimetrendcase.TheteststatisticxisassumedtobeputedfromtheregressionmodelThefirstcharacterofthetypevaluespecifieswhethertheregressionteststatisticorthestudentizedteststatisticisused.Letbetheestimatedregressioncoefficientforthedthlagoftheseries,andletbethestandarderrorof.Themeaningofthefirstcharacterofthetypevalueisasfollows.Rtheregressioncoefficient-basedteststatistic.Theteststatisticis
Sthestudentizedteststatistic.TheteststatisticisRefertoDickeyandFuller(1979)andDickey,Hasza,andFuller(1984)formoreinformationabouttheDickey-Fullertestnulldistribution.TheprecedingformulasareforthebasicDickey-Fullertest.ThePROBDFfunctioncanalsobeusedfortheaugmentedDickey-Fullertest,inwhichtheerrortermetismodeledasanautoregressiveprocess;however,theteststatisticisputedsomewhatdifferentlyfortheaugmentedDickey-Fullertest.RefertoDickey,Hasza,andFuller(1984)andHamilton(1994)forinformationaboutseasonalandnonseasonalaugmentedDickey-Fullertests.ThePROBDFfunctioniscalculatedfromapproximatingfunctionsfittoempiricalquantilesproducedbyMonteCarlosimulationemploying108replicationsforeachsimulation.Separatesimulationswereperformedforselectedvaluesofnandford=1,2,4,6,12.ThemaximumerrorofthePROBDFfunctionisapproximatelyfordintheset(1,2,4,6,12)andmaybeslightlylargerforotherdvalues.(BecausethenumberofsimulationreplicationsusedtoproducethePROBDFfunctionismuchgreaterthanthe60,000replicationsusedbyDickeyandFuller(1979)andDickey,Hasza,andFuller(1984),thePROBDFfunctioncanbeexpectedtoproduceresultsthataresubstantiallymoreaccuratethanthecriticalvaluesreportedinthosepapers.)ExamplesSupposethedatasetTESTcontains104observationsofthetimeseriesvariableY,andyouwanttotestthenullhypothesisthatthereexistsalag4seasonalunitrootintheYseries.Thefollowingstatementsillustratehowtoperformthesingle-meanDickey-FullerregressioncoefficienttestusingPROCREGandPROBDF.datatest1;settest;y4=lag4(y);run;procregdata=test1outest=alpha;modely=y4/noprint;run;data_null_;setalpha;x=100*(y4-1);p=probdf(x,100,4,"RSM");putp=pvalue5.3;run;ToperformtheaugmentedDickey-Fullertest,regressthedifferencesoftheseriesonlaggeddifferencesandonthelaggedvalueoftheseries,andputetheteststatisticfromtheregressioncoefficientforthelaggedseries.Thefollowingstatementsillustratehowtoperformthesingle-meanaugmentedDickey-FullerstudentizedtestusingPROCREGandPROBDF.datatest1;settest;yl=lag(y);yd=dif(y);yd1=lag1(yd);yd2=lag2(yd);
yd3=lag3(yd);yd4=lag4(yd);run;procregdata=test1outest=alphacovout;modelyd=ylyd1-yd4/noprint;run;data_null_;setalpha;retaina;if_type_='PARMS'thena=yl-1;if_type_='COV'&_NAME_='YL'thendo;x=a/sqrt(yl);p=probdf(x,99,1,"SSM");putp=pvalue5.3;end;run;The%DFTESTmacroprovidesaneasierwaytoperformDickey-Fullertests.Thefollowingstatementsperformthesametestsastheprecedingexample.%dftest(test,y,ar=4);%putp=&dftest;DFTESTMacroThe%DFTESTmacroperformstheDickey-Fullerunitroottest.Youcanusethe%DFTESTmacrotod
ecideifatimeseriesisstationaryandtodeterminetheorderofdifferencingrequiredforth
etimeseriesanalysisofanonstationaryseries.Mosttimeseriesanalysismethodsrequirethattheseriestobeanalyzedisstationary.Howev
er,manyeconomictimeseriesarenonstationaryprocesses.Theusualapproachtothisproble
mistodifferencetheseries.Atimeserieswhichcanbemadestationarybydifferencingissaidtohaveaunitroot.Formoreinformation,seethediscussionofthisissueinthe"GettingStarted"sectionofChapter9,"TheARIMAProcedure."TheDickey-Fullertestisamethodfortestingwhetheratimeserieshasaunitroot.The%DFTESTmacroteststhehypothesisH0:"Thetimeserieshasaunitroot"vs.Ha:"Thetimeseriesisstationary"basedontablesprovidedinDickey(1976)andDickey,Hasza,andFuller(1984).Thetestcanbeappliedforasimpleunitrootwithlag1,orforseasonalunitrootsatlag2,4,or12.Notethatthe%DFTESTmacrohasbeensupersededbythePROCARIMAstationaritytests.SeeChapter9,"TheARIMAProcedure,"fordetails.SyntaxThe%DFTESTmacrohasthefollowingform:%DFTEST(SAS-data-set,variable[,options])Thefirstargument,SAS-data-set,specifiesthenameoftheSASdatasetcontainingthetimeseriesvariabletobeanalyzed.Thesecondargument,variable,specifiesthetimeseriesvariablenametobeanalyzed.Thefirsttwoargumentsarerequired.Thefollowingoptionscanbeusedwiththe%DFTESTmacro.Optionsmustfollowtherequiredargumentsandareseparatedbymas.AR=nspecifiestheorderofautoregressivemodelfitafteranydifferencingspecifiedbytheDIF=andDLAG=options.ThedefaultisAR=3.DIF=(differencing-list)specifiesthedegreesofdifferencingtobeappliedtotheseries.Thedifferencinglistisalistofpositiveintegersseparatedbymasandenclosedinparentheses.Forexample,DIF=(1,12)specifiesthattheseriesbedifferencedonceatlag1andonceatlag12.Formoredetails,seethe"IDENTIFYStatement"sectioninChapter9,"TheARIMAProcedure."IftheoptionDIF=(d1,...,dk)isspecified,theseriesanalyzedis(1-Bd1)...(1-Bdk)Yt,whereYtisthevariablespecified,andBisthebackshiftoperatordefinedbyBYt=Yt-1.DLAG=1|2|4|12specifiesthelagtobetestedforaunitroot.ThedefaultisDLAG=1.OUT=SAS-data-setwritesresidualstoanoutputdataset.OUTSTAT=SAS-data-setwritestheteststatistic,parameterestimates,andotherstatisticstoanoutputdataset.TREND=0|1|2specifiesthedegreeofdeterministictimetrendincludedinthemodel.TREND=0includesnodeterministictermandassumestheserieshasazeromean.TREND=1includesaninterceptterm.TREND=2specifiesaninterceptandalineartimetrendterm.ThedefaultisTREND=1.TREND=2isnotallowedwithDLAG=2,4,or12.ResultsTheputedp-valueisreturnedinthemacrovariable&DFTEST.Ifthep-valueislessthan0.01orlargerthan0.99,themacrovariable&DFTESTissetto0.01or0.99,respectively.(Thesamevalueisgiveninthemacrovariable&DFPVALUEreturnedbythe%DFPVALUEmacro,whichisusedbythe%DFTESTmacrotoputethep-value.)ResultscanbestoredinSASdatasetswiththeOUT=andOUTSTAT=options.DetailsMinimumObservationsTheminimumnumberofobservationsrequiredbythe%DFTESTmacrodependsonthevalueoftheDLAG=option.LetsbethesumofthedifferencingordersspecifiedbytheDIF=option,lettbethevalueoftheTREND=option,andletpbethevalueoftheAR=option.Theminimumnumberofobservationsrequiredisasfollows:DLAG=Min.Obs.11+p+s+max(9,p+t+2)22+p+s+max(6,p+t+2)44+p+s+max(4,p+t+2)1212+p+s+max(12,p+t+2)Observationsarenotusediftheyhavemissingvaluesfortheseriesorforanylagordifferenceusedintheautoregressivemodel.Example9.6:DetectionofLevelChangesintheNileRiverDataThisexampleisdiscussedindeJongandPenzer(1998).ThedataconsistofreadingsoftheannualflowvolumeoftheNileRiveratAswanfrom1871to1970.ThesedatahavealsobeenstudiedbyCobb(1978).Thesestudiesindicatethatlevelsintheyears1877and1913arestrongcandidatesforadditiveoutliers,andthattherewasashiftintheflowlevelsstartingfromtheyear1899.Thisshiftin1899isattributedpartlytotheweatherchangesandpartlytothestartofconstructionworkforanewdamatAswan.datanile;inputlevel@@;year=intnx('year','1jan1871'd,_n_-1);formatyearyear4.;datalines;;run;YoucanstartthemodelingprocesswiththeARIMA(0,1,1)model,anARIMAmodelclosetotheStructuralmodelsuggestedindeJongandPenzer(1998),andexaminetheparameterestimates,theresidualautocorrelations,carimadata=nile;identifyvar=level(1)noprint;estimateq=1nointmethod=mlplot;outliermaxnum=5id=year;run;AportionoftheestimationandtheoutlierdetectionoutputisshowninFigure9.6.1.Output9.6.1:ARIMA(0,1,1)ModelTheARIMAProcedureOutlierDetectionSummaryMaximumnumbersearched5Numberfound5Significanceused0.05OutlierDetailsObsTimeIDTypeEstimateChi-SquareApproxProb>ChiSq291899Shift-315.7534613.130.0003431913Additive-403.9710511.830.000671877Additive-335.493517.690.0055941964Additive305.035686.160.0131181888Additive-287.814846.000.0143Notethatthefirstthreeoutliersdetectedareindeedtheonesdiscussedearlier.YoucanincludetheshocksignaturescorrespondingtothesethreeoutliersintheNiledataset.datanile;setnile;ifyear='1jan1877'dthenAO1877=1.0;elseAO1877=0.0;ifyear='1jan1913'dthenAO1913=1.0;elseAO1913=0.0;ifyear>='1jan1899'dthenLS1899=1.0;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 膝挫伤的健康宣教
- 作文讲座课件标准
- 部编人教版三年级语文下册知识分类专项训练(附答案)
- 肝胆急症的护理
- 2021年润滑油添加剂行业瑞丰新材分析报告
- 体积和表面积的比较课件
- 《教材和原教材的》课件
- 急性女阴溃疡的临床护理
- 晕车的健康宣教
- 产后脚跟痛的健康宣教
- 2023年毛概材料分析题库
- GB/T 1002-2021家用和类似用途单相插头插座型式、基本参数和尺寸
- 泌尿外科应用PDCA提高留取24小时尿液标本正确率
- (完整版)工程交付验收标准
- 银行授信尽职调查课件
- 《机械设计基础》教学教案
- 个人优秀反诈中心辅警陈述报告
- 2023年版义务教育音乐课程标准(标准版)
- 部编人教版小学四年级语文下册教案(全册)
- 临床常用抗凝药物的应用培训课件
- 重庆开县井喷事故
评论
0/150
提交评论