课程-金融计量学lecturearma_第1页
课程-金融计量学lecturearma_第2页
课程-金融计量学lecturearma_第3页
课程-金融计量学lecturearma_第4页
课程-金融计量学lecturearma_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ARMAModelOutline1Introduction2Autoregressivemodel3Movingaveragemodel4ARMAmodel5Unitrootprocess6Seasonalmodel7ARMAmodelapplication:PPIforecasting1IntroductionARMA模型,一元线性时间系列模型的标准形式,构成了时间系列计量经济学的基础。其一般形式为我们讨论这个模型有以下几个理由:它本身是一个预测模型,特别是用于季节性问题时帮助我们了解时间系列模型及数据的平稳性问题帮助我们了解时间系列模型的参数估计,模型选择及预测是随机波动率模型(GARCH)的基础是多元线性时间系列模型(VAR)的基础它由两部分组成:AR(自回归)和MA(移动平均)。我们先分别讨论这两部分。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。5ARMAmodelapplication:PPIforecasting2AutoregressiveModelAR模型是最简单的预测模型。什么是预测?让历史告诉未来,最简单的是本身的历史,即AR模型。比如今年的GDP增长如何依赖去年的GDP的增长。为了更好地理解AR模型,我们先看看他的确定性部分这时一个差分方程因为AR(p)的许多性质与差分方程类似,而差分方程容易分析得多,我们先看差分方程DifferenceequationPropertiesofARprocess把扰动项加到差分方程,就是我们的AR模型。平均来看,扰动为零。差分方程的性质就是AR模型的性质稳定的条件?均值和方差?自回归系数方程:快速下降到0后面要讨论的单位根过程是一个特殊的AR(1)过程0>j1>-1也是mean-reverting,但是正负跳跃地回归。不如前面的有persistencehalf-life:tomeasurethespeedofmean-reverting.Itisthenumberofperiodrequiredsothatthefuturevalue(frommean)isonlyhalfofitsorigin(frommean)自相关系数可以有跳跃(正负间)平稳条件、均值、方差、协方差等的推导过程如AR(2)AR(k),k>1可能有周期性,example2.1(Tsey38)特征方程为有一个收敛实根-0.52,两个收敛虚根d=-0.323<0,由于虚根,所以有周期性,周期为10.83,计算过程为因此,美国GNP表现为一个均值回归与一个以10.83个季度为周期的两个过程的合成。那上面的模型哪来的?需要模型的设定和估计。我们先讨论估计问题IdentifyingARmodelIdentifyingARmodel包括两部分:Order(model)selection,Parameterestimation我们先讨论parameterestimation在模型给定(AR(k))的情况下,我们可以用OLS来估计模型参数?由于AR模型不可能满足严格外生的条件,因此只有在满足当期外生及弱相关的条件时,可以用OLS。而平稳的AR过程肯定是弱相关,这也是我们为什么前面花大量的时间讨论平稳的原因我们前面讨论了什么样的AR过程是平稳的,但那是在AR模型的参数已知的情况下。如何事前判断?后面讨论事实上,在误差为正态分布时,AR模型的OLS估计等同于MLE估计为了模型选择的原因,我们将介绍MLE估计ModelEstimationMLEIdea:在所有可能的分布中(由参数刻画),找出那个与数据最接近的那个,也即是使样本的后验概率最大那个分布。与OLS一样,有两个步骤:目标函数:OLS:fittingerrorMLE:似然函数GMM:distancebetweenpopulationmomentsandsamplemoments最大化比如估计正态分布的均值对线性回归模型,误差为正态分布时,Beta的MLE估计与OLS估计一样19MLEofAR(p)Model假定我们有某时间序列的T个样本观测值和AR(1)的未知参数联合分布密度函数(似然函数)为where20Example:exer10_arima.sas/******simulateddataAR(1)*/dataone;y1=0;dotime=-10to500;u=rannor(12346);y=1.2+0.5*y1+0.5*u;iftime>0thenoutput;y1=y;end;run;procarimadata=one;identifyvar=y;estimatep=2;run;

但AR2部分不显著没有报告常数项,而是报告均值muIdentifyingARmodel(OrderSelection)那给定观察数据,如何知道该用几阶?前面用AR(2)显然不对。首先看偏自相关函数的变化规律,什么是偏自相关函数?估计以下AR模型组:即控制了更近的历史时的自相关Cutoffvalue:closetozero如同横截面模型中用t-统计量选择变量procarimadata=one;identifyvar=y;estimatep=2;run;

比较自相关系数与偏自相关系数可以看见什么是控制了更近的历史IdentifyingARmodel(OrderSelection)那如何知道用几阶?在经典线性模型的选择中,我们用t-值和调整R2来进行。这里用类似adj-R2的方法AkaikeinformationCriterion:

AIC(p)=-{2/T(maxlog-likelihood)-2/T(No.parameters)}

Thefirstpartmeasuresthelackoffitandthesecondpartpenalizesthecomplexityofthemodel.PrefersmallerAICmodelBayesianinformationcriterion(orSBC):

BIC(p)=-2/T(maxlog-likelihood)+Log(T)/T(No.parameters)SimilartoAICBICpenalizemoreonthecomplexityofmodelthanAIC,所以BIC偏好更小的模型试不同的K,比较AIC,BICprocarimadata=one;identifyvar=y;estimatep=1;run;procarimadata=one;identifyvar=y;estimatep=2;run;AR(1)的AIC(BIC)都比AR(2)的小,故选AR(1)。选对了Ifthey(AIC,BIC)givedifferentorder,whattodo?ModelcheckingbasedonforecastingForecastingAttimeT,wewanttouseallavailableinformationtoforecastitsvalueattimeT+m用得最多的是条件均值,也有中位数(分析师预测的consensus)等Forecastingerrorconsistsoftwocomponents:parameterestimationerrorandmodelerrorThesecondcomponentisthemajorpartTwo-stepaheadforecasting:whichislargerthanone-steperror,impliesthatuncertaintyinforecastsincreasesasthenumberofstepsincreases.Exer10_arima.sas(in-samplefitting&out-sampleforecast)dataone;setwang.aindex;run;procarimadata=one;identifyvar=dreteq;estimatep=2;forecastlead=5id=dateout=out;quit;TheforecastingerrorvariancecanbeusedtoconstructconfidenceintervalifwefurtherassumenormalityModelchecking有了预测值(拟合值),就可以做模型检验。首先,对任何一个合适的模型都应该是:拟合误差再也没有可预测性计算拟合误差对误差进行Q检验。但这时自由度应该为m-k。M为本应该的(Thechoiceofm:approximatelyln(T)),k为这里AR的阶数其次,样本外预测(out-sample)没有明显系统偏差Rollingout-sampleforecasterror,50%obs.arepreserved.比如说有2T个一般,先用(1,…,T)样本估计模型,预测(T+1)时的值,再用(2,…,T+1)样本估计模型,预测(T+2)时的值,…得到T个out-sample预测yhat,但我们有其观察值y把y对yhat回归,H0:alpha=0,beta=1,F检验如果有多个模型的比较,比如前面说的AIC和BIC给出不同的选择,我们要用预测误差的精度进一步选择Out-sampleforecasterrorcomparisonModelcomparisonOut-sampleforecasterrorcomparisonFtest显然第三个条件不满足Granger-NewboldtestGrangerandNewbold(1976)提出Diebold-MarianotestDieboldandMariano(1995)年发展了Granger-Newboldtest,只要上面假设2.在进一步介绍AR模型的应用之前,先介绍完ARMA模型3Movingaveragemodel另一种简单的模型是MA过程MA(1)modelStationarity:alwaysstationaryMean:muFinitememory!MA(1)modelsdonotrememberwhathappentwotimeperiodsago.MA(1)显然比AR(1)简单多了MA(k)model性质类似于MA(1)MAmodelparameterestimationOLS?MLEMA(1)的MLE如果前一时期的扰动项已知,当前时期样本观测值的条件分布而除第一个外,其它的扰动项可以用观察值迭代得出因此,如果知道第一个扰动项,就可以写出似然函数方法1:假设它为0(绝对均值为0)方法2:把它当做参数估计SASdoitforyou:Exer10_arima.sas31Example:exer10_arima.sas/******simulateddataMA(1)*/dataone;u1=0;dotime=-10to500;u=0.5*rannor(12346);y=1.2+0.3*u1+u;iftime>0thenoutput;u1=u;end;run;procarimadata=one;identifyvar=y;estimateq=2;run;AR(2)模型是p=2truevalue为0.3和0,估计值为0.25038和0.05277.SAS表示的是其相反数

MA(2)部分不显著常数项就是均值muOrderselectionSameasAR(k)modelCrossrepresentationbetweenMAandAR这里Taylor级数收敛的条件是phi_1的绝对值小于1正好是AR(1)的平稳条件满足这个条件的MA过程称作“可反转性(Invertibility)”InvertibilityofMAmodelsisthedualpropertyofstationarityforARmodels.Provideamodelsimplifyingmethod:representMA(q)asAR(1)forlargeq,orrepresentAR(p)asMA(1)forlargepThismethodisusedinGARCHmodel4ARMAmodelARMA(p,q)ismixedofAR(p)andMA(q),forexampleARMA(1,1)Essentially,itisAR(p)-typemeanwithaMA-typeautocorrelatederrorsAR(p)isusefulinfinance,butMAisnotwidelyusedButAR(p)oftenhaveauto-correlatederrorsWeexplicitlymodeltheerrorusingMA(q),thisiswhyweneedaARMAmodelPropertiesofARMA(p,q)Stationarity:thesameasAR(p)Mean:thesameasAR(p)Variance:Autocorrelation:fork>q,thesameasAR(p),i.e.,Yule-WalkerequationholdsFork<=q,itisdifferentThreemodelrepresentations(byback-shiftoperator):ARMAform:compact,usefulinestimationandforecastingARrepresentation:ittellshowytdependsonitspastvalueMArepresentation:ittellshowitdependsonitspastshockTheMArepresentationisparticularlyusefulincomputingvariancesofforecasterrors.Modelestimation:MLEprocarimadata=wang.mthlyindex;identifyvar=dreteq;estimatep=1q=1;run;procarimadata=wang.mthlyindex;identifyvar=dreteq;estimatep=(1,4)q=(1,3);Run;procarimadata=wang.mthlyindex;identifyvar=dreteq;estimatep=(1)(4)q=1;Run;为什么要这样的模型?比ARMA((1,4,5),1)少一个待估计参数Modelselection:thesameasAR(p)Forecasting:Forsteps>q,thesameasAR(p)Forsteps<=q,currenterrortermmattersasMA(q)5非平稳过程前面讨论的都是平稳过程,但经济金融中,经常有非平稳的数据,比如股价,GDP等。最简单、最常见的随机趋势过程,是随机游走过程

它也被叫做单位根因为作为AR(1)过程,其特征方程的根为1说它有趋势,两个原因一次随机冲击,永久的影响方差有确定性的趋势还有带漂移的单位根:带漂移的单位根过程与确定性趋势有相近的均值趋势,确定性时间趋势模型:差别在扰动项这一类模型有伪回归问题

单位根过程非平稳,而OLS对几乎所有非平稳过程没法保证无偏、一致等性质

因此我们要检验是否有单位根。Dickey-Fuller检验随机游走序列Yt=Yt-1+et

可以看着AR(1)模型Yt-=(Yt-1-)+et中参数=1时的情形。也就是说,检验一个时间序列Yt的平稳性,可通过检验带有截距项的一阶自回归模型Yt=(1-)+Yt-1+et中的参数是否小于1。注意,H0=1意味不平稳,

H1<1大于1?也不平稳。但能够容易发现,但小于1不那么明显

但我们更喜欢检验它的变换形式Yt-Yt-1=m(1-r)+(r-1)Yt-1+et,即

Yt=a0+Yt-1+et中的参数是否小于0。上述检验似乎可通过OLS下的t检验完成。但是,在零假设下,序列非平稳,我们没有通常的大样本性质。幸运的是,一致性还成立,渐进正态分布也成立,只是收敛速度为T。Phillips在80年代末有一系列关于收敛的研究因此即使在大样本下t统计量也是有偏误的(方差被低估了),通常的t检验无法使用而Dickey和Fuller于1976年通过模拟的方法提出了这一情形下t统计量服从的分布(这时的t统计量称为统计量),即DF分布

在上面的回归检验Yt=a0+Yt-1+et中,我们的模型是AR(1)模型Yt-=(Yt-1-)+et,这里=0可以成立,也可以不成立.在H0(单位根存在)下,是否为零没关系,但在H1下有无不一样,AR(1)的均值等于如果我们规定=0,即H0是没有漂移的单位根,这时应该回归Yt=Yt-1+et,即,没有常数项。但这时DF分布就不一样了。另外,我们知道许多时间系列数据,除了可能是单位根,也可能是确定性的趋势,即AR(1)过程可能会有一个确定性时间趋势:Yt-=bt+(Yt-1-)+et这时我们应该回归检验模型Yt=a0+Yt-1+a2t+et中的参数是否小于0如果检验中不控制t,会影响检验结果而控制了t时,DF分布又不一样了这两种情况下,我们有通过模拟的方法得到的DF分布

在上述使用Yt-=bt+(Yt-1-)+et对时间序列进行平稳性检验中,实际上假定了时间序列是由具有白噪声随机误差项(et)的一阶自回归过程AR(1)生成的。但在实际检验中,时间序列可能由更高阶的自回归过程生成的,比如AR(3),它也可能是不平稳

或者随机误差项并非是白噪声,这样用OLS法进行估计均会表现出随机误差项出现自相关(autocorrelation),导致DF检验无效。为了保证DF检验中随机误差项的白噪声特性,Dickey和Fuller对DF检验进行了扩充,即加入DYt的滞后项,成了ADF(AugmentDickey-Fuller)检验。Yt-m=a1(Yt-1-m)+a2(Yt-2-m)+a3(Yt-3-m)+bt+

et

DYt=Yt-Yt-1=

-(1-a1-a2-a3)(Yt-1-m)-(a2+a3)DYt-1-a3DYt-2+bt+et

[coefficient]Augmentinglags

即RegressYt-Yt-1on1,t,Yt-1,Yt-1-Yt-2,Yt-2-Yt-3

注意,可以是没有1,t两项总之,ADF检验是通过下面三个模型完成的:

检验的假设都是:针对H1:<0,检验H0:=0,即存在一单位根。模型1与另两模型的差别在于是否包含有常数项和趋势项。我们有六个模型,用哪个?

先看是否加入滞后性?滞后的order取多少?每个模型中选取适当的滞后差分项,以使模型的残差项是一个白噪声(主要保证不存在自相关)

可以用回归系数的t-值判定

或者,从一个最大的order=[12*(T/100)^0.25]开始,试所有可能的order,如果所有的模型都不拒绝,就不要滞后。如果有一个拒绝,停止检验,没有单位根。是否加入常数项和趋势项?从最一般的模型3开始,如果拒绝零假设,即原序列为平稳序列,检验停止。否则继续

然后模型2,如果拒绝零假设,即原序列为平稳序列,检验停止。否则继续

最后模型1。

这样做的原因是使得接受H0的typeII错误最小,工作量最少。因为三个模型中,模型3最可能拒绝H0。

一般步骤:最一般的模型(包含常数项、趋势项和滞后项)开始,如果拒绝零假设,即原序列为平稳序列,检验停止。否则继续检验简单一些的模型Exer10_ARIMA.sas:中国的CPI_levelprocarimadata=one;identifyvar=cpilevelstationaity=(adf=3);quit;cpivscpi_levelTau检验都不能拒接H0,即有单位根

检验发现有单位根怎么办?

差分。

差分后的过程如果是平稳的,基本的计量模型就可以用差分后的过程平稳?/*adftestafterfirstdiffernececpi(1)*/procarimadata=one;identifyvar=cpilevel(1)stationaity=(adf=3);quit;所有的tau检验都可以拒绝单位根。如果差分后还是单位根过程?再差分实证中比较少/*Phillips-Perronunitroottest*/procarimadata=wang.cpi_china;identifyvar=cpistationaity=(pp=2);quit;在处理数据(差分)之前,首先看是否需要取log。Log在线性模型的两个功能Beta表示增长率均值与残差的关系:积的关系(而不是和的关系)因此,如果残差(波动程度)随着均值程度的增加而递增,我们应该取log(如果是正数)Forexample,theexportdataForexample,theexportdata它看来是一个取log后的确定性趋势过程与带漂移项的随机游走相似,取log后的确定性趋势过程也是方差越来越大。但差别是,去掉时变的均值后,带漂移项的随机游走的方差还随时间增加而增加,而取log后的确定性趋势过程的方差平稳(比如上面export例子)也就是说,拿到一个有明显趋势的数据,首先看它是否应该取log(看均值与波动的关系)再看是确定性趋势还是带漂移的随机趋势(看取均值后的波动与时间的关系)6Seasonality许多时间系列数据,特别是宏观经济数据和销售数据,具有一定的季节趋势。中国的GDP增长率美国的白酒销售中国房价暴跌已悄然开始部分城市成交量“腰斩”2014年02月16日09:17,来源:财经综合报道作者:价值中国网多年来,中国房价一直牵动着人民的心,但连地产大佬王石也认为2014年楼市“非常不妙”,这可能才是真正对楼市来讲,是最危险的信号!使得一些地方政府,比如武汉、郑州、长沙、合肥等,也开始逐步放开所谓的限购来救市!九成城市楼市成交量下跌,部分城市“腰斩”某机构统计数据显示,1月份北京商品住宅共成交6908套,成交面积74.42万平方米,成交套数、成交面积的环比、同比均萎缩了四至五成左右。和北京情况类似,根据中指院对1月份包括北上广深四大一线城市在内的43个主要城市住宅市场交易情况的监测发现,超过九成城市楼市成交量环比下跌。中指院分析认为,总体而言,2014年1月受春节影响,大多数城市成交量较上月出现明显回落。在价格上,则呈现出一二线城市稳中有涨,三四线城市稳中微降的趋势。另外,有新闻指出,三四线城市房地产市场冷热不均,整体而言,未来两三年供给过剩将是最大的问题。从2013年开始,不少大型开发商已从三四线城市撤离,回归一二线城市。有分析认为,房地产投资资金的撤出将加剧这种风险,不仅会导致房价出现下跌,也可能使得部分城市出现一批烂尾楼。这种局面不仅在鄂尔多斯和温州曾出现过,且与近期香港楼市降价的逻辑如出一辙。问题:到底有没有回落?如果没有春节的原因,回落多少?季节性产生的原因:自然、技术因素:天气变化对生产(蔬菜价格),猪周期法律法规因素:市场规则对交易的影响:比如期权到期对现货市场社会文化宗教:节(假)日对旅游、销售、生产等的影响:GDP等但中国的许多节日是根据农历,而对应的公历经常变化,比如春节有时在1月,有时在2月。这使得中国的季节问题更加复杂对有这种季节性增长率问题,一种简单的办法是用同比中国的CPI有同步和环比,环比CPI有季节性问题,而同比CPI有翘尾问题“翘尾”因素,(carryovereffects),也称滞后影响,是计算同比价格指数中独有的、上年商品价格上涨对下一年价格指数的影响部分。如某一商品1995年前6个月价格均为每公斤0.5元,7月份上涨到1元,一直到1996年12月份均保持同一价格,虽然1996年价格保持稳定,但计算出来的1996年前6个月的同比价格指数却为200%,表明价格上涨一倍,这就是这一商品价格指数中的“翘尾”因素,是上年7月份价格上涨对下一年上半年价格指数的滞后影响。中国的GDP增长公布的数据一般也是同比(前面是合成的环比增长率,不是统计局公布的增长率)问题是,基准点是去年同期,不能准确地反映最近的变化所以比较理想的是用除掉季节问题的环比增长率美国统计局不说翘尾,他们用季节调整研究季节性,还可以帮助我们很多,比如predictingquarterlyearningspricingweather-relatedderivativesanalysisoftransactionsdata(high-frequencydata),e.g.,U-shapedpatterninintradaydata三种季节模型确定性,随机性,确定性与随机性的合体确定性季节趋势多由节(假)日安排影响,比如二月的工作日少休假多在7、8月的暑假我们通过控制季节虚拟变量和有效工作日处理比如二月的工作日少,按照日历,我们可以有数据控制休假多在7、8月的暑假,没有确切的休假数据,但能用dummy控制估计方法:OLS或MLE,依赖于epsilon的分布第二种季节模型:随机季节模型我们先介绍基于ARMA的季节模型这是最简单的季节性模型。更一般的是multiplicativeseasonalmodelsuchas第二种季节模型:随机季节模型Multiplicativeseasonalmodelispreferredbecause产生随机季节性现象的原因多是有技术、天气等自然条件等ThiskindmodelissimplyspecialcaseofARMA.Henceitsmodelestimationandspecificationcanbedonebythestandardprocedurewealreadydiscussed第三种季节模型:合体Z=Y-betaX,ZismodeledasARMAprocess除了用模型直接模拟季节数据,还有一种处理是季节性调整为什么要调整季节性?便于理解,比如CPI到底是涨还是跌?翘尾不是很直观有些数据和模型中,除了季节性外,其它部分不一定是IID的,比如GARCH或ARMA。如何处理这些季节性的数据?一种办法是同时处理(MLE),前面已讨论另一种办法把季节部分先去掉,即季节调整。这样做的优点简单,可以用很复杂的模型讨论调整过的数据稳健,把季节性和复杂的其它部分放在一起,会导致模型的不稳健缺点?如果模型是比较正确的,分开会低效第一步:additive

ormultiplicative?ifthemagnitudeofseasonalfluctuationsisproportionaltolevelofseries,multiplicativeOrtakelogarithmsandusingadditive第二步:确定性部分RegressorXcanbenumberofdays(tradingdayandholidayorcalendareffects),timedummy(weekday,month,quarter),additiveoutliers,temporarychanges,levelshifts,68第二步:确定性部分RegressorXcanbenumberofdays(tradingdayandholidayorcalendareffects),timedummy(weekday,month,quarter),additiveoutliers,temporarychanges,levelshifts,otheruser-definedeffectsZ是随机部分如果Z是白噪声,直接回归(OLS)分解就可比如只有季度dummy的,计算调整后的增长率,四个dummies(加合为0的约束),每个dummy的系数就是调整值Example:Liquidsale第二步:确定性部分RegressorXcanbenumberofdays(tradingdayandholidayorcalendareffects),timedummy(weekday,month,quarter),additiveoutliers,temporarychanges,levelshifts,otheruser-definedeffectsZ是随机部分如果Z是白噪声,直接回归(OLS)分解就可如果Z不是白噪声,即还有随机季节性存在,这时我们需要其它办法。74Currentmethods(andsoftware)forseasonaladjustmentNon-parametricmethodsTheX-11family(U.S.CensusBureau,StatisticsCanada)Parametric(model-based)methodsTRAMO/SEATS(BankofSpain,otherEuropeancountries)TRAMO(TimeseriesRegression

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论