




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章金融计量学初步
1.1金融计量学的范畴
1.2金融时间序列数据
1.3金融计量分析中的基本概念
1.4金融计量软件介绍
1.1金融计量学的范畴金融计量学的范畴涵盖微观和宏观两个层面。资产定价模型(CAPM)、行为金融分析中的事件研究方法等属于微观金融领域的计量分析,而动态时间序列模型更多地用在宏观金融领域。
1.2金融时间序列数据
广义地讲,将某种金融随机变量按出现时间的顺序排列起来称为金融时间序列。
从现实世界的角度看,金融时间序列就是指在一定时期内按时间先后顺序排列的金融随机变量。
图1.1
上证综合指数时间序列数据上证综合指数:2000年1月-2010年10月数据来源:国泰安数据库图1.1
上证综合指数时间序列数据(b)2004年7月1日-2010年10月29日(5天/周)数据来源:国泰安数据库图1.2人民币/美元汇率
人民币/美元汇率:2005年7月1日-2010年11月12日数据来源:FederalReserveBankofSt.Louis图1.3
美元/英镑汇率
美元/英镑汇率:1971年1月4日-2010年11月12日数据来源:FederalReserveBankofSt.Louis图1.4
中国CPI通胀率
中国CPI通胀率:1995年1月-2010年9月数据来源:中国国家统计局、经济景气月报图1.5
中国M1增长率(环比)
2002年M01-2010年M11数据来源:中国人民银行(经作者计算)
从这几幅图中可以看到,不同的金融时间序列变量展示出各种各样的变动轨迹,经济学者经常把金融时间序列变量的这种随时间变化的轨迹称为“动态路径”,其中“动态”一词的含义实质上就是指“随时间变化”。1.3金融计量分析中的基本概念收益率:yield;rateofreturn用pt表示t时刻的价格用Rt表示从t-1到t时刻的收益率
div表示红利
nfor1,表示把1股股票拆分成n股1.3金融计量分析中的基本概念
简单净收益率(SimpleNetReturn):
连续复合收益率(ContinuouslyCompoundedReturn):对于多期(multi-period)来说,……股票周期简单收益率的计算带分红时的计算方法(如果支付红利的话,价格pt是支付红利后的价格。)拆分股票时的计算方法周期对数收益率对数收益率支付红利或拆股的资产的对数收益率
对于季度频率数据,年度化的增长率计算公式为:
对于月度频率数据,年度化的增长率计算公式是:比较不同投资活动以利息支付为一个周期,如果不同周期收益率不同首先计算出平均的周期收益率?计算方法是计算几何平均。然后再按照前面的方法,把平均周期收益率年度化.1.3.2随机变量与随机过程
什么是随机变量?什么是随机变量的累积分布函数?F(x)=P(X≤x)正态分布:
X~N(
,
2)随机变量:
误差项
就是一个随机变量,这里假设这一随机误差变量服从正态分布。在更多的情形下,随机变量
被假设服从独立一致性分布(independentlyandidenticallydistributed),或者简记做i.i.d.。
对数正态分布如果某随机变量X取自然对数之后服从正态分布LN(X)=Y~N(
,
2),那么该随机变量X服从对数正态分布。对数正态分布的均值与方差:对数正态分布的形状分布图
与随机变量紧密相关但又有区别的一个概念就是随机过程。当我们希望对一个金融时间序列进行分析时,通常把看作是一个随机过程的实现。宽泛地说,随机过程就是定义在一定概率空间的一组具有相同特性的随机变量。
1.3.3概率分布:
X和Y的联合分布可定义为:
其中:
为联合分布函数中的参数。假定X与Y的联合概率密度函数,并且严格有定义,则有:
与联合分布相对的概念是边际分布。例如,X的边际分布可以通过将联合分布中与X不相关的赋值设为来获得:
当X是一个一维的随机变量而不是向量形式时,边际分布的定义就成为下面常见的形式:这一公式在统计学中也称为X的累积分布函数,其取值范围在0与1之间。虽然CDF的概念稍微有些抽象,但是其在金融计量学中有着广泛的应用,特别是在计算统计量的p-值过程中非常有用。例如,利用F分布的累积分布函数可以计算F检验统计量的p-值。
条件分布,顾名思义,就是随机变量在给定条件下的分布。例如,给定的条件,
X的条件分布可以定义为:
如果利用前面提到的概率密度函数的概念,还可以写成:其中,表示边际分布函数,并且满足1.3.4随机变量的期望与矩随机变量的期望:
=E(X)随机变量的方差:
2=E[(X-
)2]k-阶矩E(Xk),k-阶中心矩E[(X-
)k]偏度:S=E[(X-
)3/
3]峰度:K=E[(X-
)4/
4]偏度S=0S>0S<0均值=中位数均值>中位数均值<中位数峰度K=3K>3K<3正态分布的峰度=3基本的统计概念:描述统计
样本均值Mean基本的统计概念样本方差variance基本的统计概念样本偏度(Skewness)基本的统计概念样本峰度kurtosis有用的运算规则:检验数据是否是正态分布检验统计量其中S是偏度的某种度量,K是峰度的度量,n是样本个数。
1.3.5金融计量模型
金融计量模型中的随机扰动因素,用以捕捉其他可能影响金融方程等式左侧变量的因素。虽然这种随机因素一般是不可观测的,但是我们总可以对其统计分布特征加以假设或者约束,从而实现对金融计量模型的回归估计。
刚才提到的金融计量模型实际上就是资产定价模型:其中ut是模型中的随机扰动项。
441.4金融计量软件介绍EViewsS-PLUSStataPc-GiveSASGaussRATSC++
近年来,随着计算机技术的发展,计量软件的应用越来越广泛。相应地,计量软件的数量也越来越多,例如,常见的计量软件包括Eviews、PC-GIVE、STATA、WinRATS、SAS、SHAZAM、MATLAB和GAUSS等等。
451.4.1综合介绍Econometrics专用软件:Eviews
1.3.2Eviews使用简介
EViews是EconometricsViews的缩写,其前身是计量软件TSP。
除了处理金融时间序列数据模型,EViews在管理和处理横截面数据和面板数据方面也非常方便,并具有强大的命令功能和丰富的程序处理语句。
1)启动EViews
4849
2)创建工作文档
3)创建对象
514)导入数据
如果待处理和使用的数据存放在Excel工具中,可以使用以下步骤直接进行导入:首先,在主菜单中选择“PROCS”->“IMPORT”->“READTEXTLOTUSEXCEL”;然后选择存放数据的Excel文件;接着按提示内容对话框填写相关信息,最后点击“OK”。
如果数据量不大,更快捷的一种导入数据的方式就是拷贝与粘贴。例如,可以直接拷贝待使用的数据,然后粘贴到工作文档中的相应对象中。如果在工作文档中尚未建立相应的对象,需要首先利用上文介绍的方法创建对象,然后粘贴数据。53
5)绘制图示
6)回归分析
在了解了EViews的工作文档建立和数据导入等知识后,就可以进行初步的计量回归分析了。假定当前工作文档中含有两个变量序列,分别示"y"和"x"。如果我们想要使用"y"对"x"回归,即:
在主菜单中选择Quick/EstimateEquation,随后跳出回归设立的对话框,在相应的对话框内填写信息,如在“Equationspecification”对话框内按顺序写上“ycx”,其中c是EViews默认的常数项,然后在EsimatingSettings/Method选项内选择使用的回归估计方法。7)常用的EViews命令log(x)
计算x的自然对数x(-1)x滞后1期x(-2)x滞后2期
d(x)计算x的一次差分,即x–x(-1)
scalara=21.3
对a进行赋值scalarb=3^3
对b赋值,让其等于3*3*3=27genra=b*b
生成一个序列,等于b的平方smpl1990:12001:1定义样本区间
1990Q1-2001Q1588)EViews使用的一个简单实例
接下来,我们使用一个实际操作的例子,利用1980年至2005年中国居民消费支出与可支配收入数据,数据为年度频率。
2.1一阶差分方程方法性工具:P阶差分相距一期的两个序列值之间的减法运算称为一阶差分运算;对一阶差分后序列再进行一次差分称为二阶差分;依此类推有P阶差分运算.K步差分相距k期的两个序列值之间的减法运算称为k步差分运算.线性差分方程定义:称如下形式的方程为序列{yt}的线性差分方程:式中:特别地,若h(t)=0,则差分方程被称为齐次线性差分方程.
(2.1)
一个差分方程就是指将一个变量的当期值定义为它的前一期和一个当期的随机扰动因素的函数。模型(2.1)等式的右侧只有因变量的一次滞后期出现,这样的差分方程称为一阶差分方程。7071一些差分运算常用的表达式:n阶差分方程的解法:迭代法解方程;备选解法具体步骤:1.建立齐次方程,求出n个齐次解;2.求出一个特解;3.将特解与所有齐次解的一个线性组合求和得出通解;4.将初始条件代出通解中,消去任意常数.73一阶差分方程的求解(反复迭代法):74
可以观察到,(1)如果,那么
的取值随着m的不断增大而减小,最终减为0,此时
称为收敛序列。(2)如果
,那么的取值随着m的不断增大将不会逐渐减小为0,而是趋近于无穷大。此时称为非收敛序列。
(3)如果,差分方程描绘的变量序列仍然是非收敛序列,但这种特殊情况下的差分方程对应一个专门的名称,叫做随机游走过程。
经过以上分析,可以得出结论:一阶差分方程中的一阶滞后项的系数的大小关键性地决定了差分方程的求解结果。实际上,这个系数的取值也关键性地决定了时间序列变量的动态走势特征。后面的图即描绘了一阶差分方程中不同系数的所对应的序列的动态路径。图2-2(a)79图2-2(b)80图2-2(c)81图2-2(d)82图2-2(e)83图2-2(f)2.2动态乘数与脉冲响应函数(1)动态乘数(dynamicmultiplier)(2)脉冲响应函数(impulseresponsefunction,IRF)(1)动态乘数
(2)脉冲响应函数
从动态乘数的定义可知,对应每一个时期跨度j,有一个对应的动态乘数,那么如果将不同时期跨度j的动态乘数按j从小到大的顺序摆放在一起,形成一个路径,就成为了脉冲响应函数。
累积脉冲响应函数:
累积脉冲响应函数用来衡量随机扰动因素出现永久性变化后,即都变化一个单位,对造成的影响和冲击情况。
从模型可知,如果
条件满足,在极限情况下,累积脉冲响应函数就等于。
无论是脉冲响应函数还是累积脉冲响应函数,其根本特性都由一阶滞后项系数决定。
图2-3
(a)
(b)(c)
(d)
(e)
(f)
图2-3非常清晰地显示出,不同的取值,对应的脉冲响应函数图表现非常不同。归纳来说:在
的情况下,如(a)和(b)情形,体现在脉冲响应函数中的动态乘数随时间跨度j的增加而呈现几何式递减并最终趋近于0的趋势。
当时,如(e)情形,动态乘数的取值正负号交替变化,但是这些动态乘数的绝对值是呈现逐渐递减至0的,这种情形经常被形象地称作“震荡式衰减”。这样,对于
的情况,从脉冲响应函数图来看,随机扰动因素对序列
的冲击将最终消失,而对应的一阶差分方程在这种情况下就是一个稳定的系统。
再来考察其它可能的情况:首先,如果
,如(c),动态乘数始终等于1,而不管时间跨度j如何变化。这样,一个单位的变化将导致序列
永久性地变化一个单位。
其次,对于
的情况,(d)描绘了对应例子的脉冲响应函数图,可以看出,动态乘数随时间跨度j的增加呈现几何式上升趋势。而当时,动态乘数表现出震荡式不断上升的变化。可见,在的条件下,对应的一阶差分方程为不稳定系统。2.3高阶差分方程
一阶差分方程可以拓展到二阶以及更高阶的差分方程,为方便起见,把高于一阶的差分方程统一称为高阶差分方程。假设差分方程的阶数为p,则p阶差分方程的一般表达式可以写成:
要从高阶向1阶转化,首先定义几个常用矩阵:
例如p=5时,
现在,p阶差分方程就可以转化为:即,
通过反复迭代,可以得到:
对模型进行向前迭代,可以得到:
其中:
表示矩阵F的j次幂。这样,对比F矩阵与Y矩阵的定义,可以获得p阶差分方程的动态乘数,即:
对比F矩阵与Y矩阵的定义,可以获得p阶差分方程的动态乘数,即:
其中:
为矩阵的第1行第1列位置上的元素。一旦动态乘数的解析表达式求解出来了,对应的p阶差分方程的脉冲响应方程就可以很容易获得了。
2.4滞后算子与滞后运算法1)滞后算子定义与性质
滞后算子以英文单词“lag”的大写首字母L表示,基本的运算规则如下:
根据这个定义,二阶差分方程:
可以写成:
滞后算子运算还符合标准的“结合律”与“交换律”等如下运算法则:(1)
(2)对任何常数A取滞后运算还等于原常数,即。
(3)结合与分配律,即
。(4)交换律,即。
运用以上介绍的滞后算子运算规律,可以将二阶差分方程写成:即
这里常被称为滞后算子多项式。
因此,差分方程也可以写成:初次学习滞后算子,可以把滞后算子与经济学中常用的期望联系起来理解。滞后算子操作符也属于类似的概念范畴,也就是说,L在这里不仅仅是一个符号,它代表了一种运算过程。一个非常有用的性质:
对于二阶差分方程
其中,c表示常数项。利用滞后算子,模型可以写成:在等式两边同除以
,则得到:
对于模型:
根据滞后算子的性质,滞后算子对常数项并不产生影响,所以模型等号右侧的第一项就是。从而,模型可以写成:
利用滞后算子,还可以简化高阶差分方程的表达式。例如,对于p阶差分方程,利用滞后算子可以写作:(2.39)或者写出更为简洁的形式:其中:。由此可知,。2)差分方程的稳定性
差分方程的稳定性是指由差分方程生成的数据的收敛性。这里需要介绍与差分方程相关的特征方程和逆特征方程。对于一般的p阶差分方程来说,其特征方程为:(2.40)
如果差分方程中的系数均为已知,则可以求出特征方程(2.40)的根,称为特征根,而这些特征根的大小决定了相应的差分方程系统的稳定性。可以证明,如果特征方程的所有根(或者根的模)均落在单位圆内,那么差分方程系统是稳定的。之所以经常使用“单位圆”来比照特征根的“大小”,是因为特征根可能是实数也可能是复数。图2-4差分方程的特征根与单位圆
与特征方程仅有一字之差的逆特征方程,也经常被许多教材和相关文献使用,所以这里同样给出逆特征方程的概念。与p阶差分方程相对应的逆特征方程表达式为:图2-5差分方程的逆特征根与单位圆作业:1.考察差分方程,初始条件为.甲同学用后向迭代的方法解差分方程乙同学将齐次解与特解相加得到(1)证明:当时,两种解相等.(2)证明:当时,甲同学的解等同于.
当时,应当如何采用乙同学的方法得到相同的结论呢?122/613.1基本概念
3.1.1随机过程与数据生成过程
随机过程:如前所述,随机过程是一系列或一组随机变量的集合,用来描绘随机现象在接连不断地观测过程中的实现结果。对于每一次观测,得到一个观测到的随机变量。123/61
随机过程的定义stochasticprocess
对于每个,是个随机变量,进而随机变量族称为随机过程,随机过程一次实验的结果是定义在T上的函数,称为随机过程的一次实现。当参数t的变化范围T是个整数集合,则称为随机序列。当T只含有一个或有限个元素,就是概率论中研究过的随机变量或随机矢量。124/61数据生成过程:
datagenerateprocess,DGP利用下面的回归模型来说明,即:
假设模型中所有系数已知或者是已经设立了的,那么给定解释变量
的一组观测值,回归模型就可以生成对应的一组值,则模型就是一个数据生成过程。
125/61
DGP适用于理论上的问题与真实世界的事例之间的比较。
例如:中国国际股票指数和随机游走过程看上去相似吗?股票的收益率序列符合白噪音过程吗?126/61127/613.1.2自协方差与自相关函数
autocovariance&autocorrelation
假定
是一个随机变量,自协方差定义的是
与其自身滞后期之间的协方差,即“自身的协方差”。常见的协方差的基本定义是:
其中:
表示期望。从而可以知道,与其自身滞后j期
之间的协方差定义为:128/61
对于均值保持不变的随机过程来说,
时,即为方差:…129/61随机变量x和y的相关系数模型为:
自相关函数,即
与
的自相关函数定义为:
一般将
相对于滞后期数j绘制出的图示称为自相关图。130/61
3.1.3弱平稳与严平稳的定义弱平稳(weaklystationary)有时也叫协方差平稳(covariance-stationary)或二阶平稳(second-orderstationary)。131/61弱平稳的定义:对于随机时间序列
,如果其期望值、方差以及自协方差均不随时间t变化而变化,则称
为弱平稳随机变量,即对于所有时间t,
必须满足以下条件:
(i)为不变的常数;
(ii)为不变的常数;
(iii)132/61
平稳还暗示着:请同学们自己动手进行证明。133/61
对于一个弱平稳过程,自相关函数并且:…134/61严平稳的定义:
时间序列称为严平稳(strictlystationary)的,如果有:
对所有的t,任意正整数k和任意k个正整数,的联合分布与的联合分布是相同的。换言之,严平稳性要求的联合分布在时间的平移变换下保持不变。135/613.1.4白噪音过程
(whitenoiseprocess)
一个随机过程如被称为白噪音过程,则组成该过程的所有随机变量彼此互相独立,并且均值为0,方差为恒定不变值。对于所有时间t,如果满足下列条件
(i)(ii)(iii)
则是白噪音过程。136/61图3-3白噪音过程的
自相关图137/61
对于白噪音过程,总有如下等式成立:
以及
白噪音过程中的观测值彼此之间互相独立,白噪音过程不能由其以前的信息来预测,至少从线性角度看是这样的。138/61
如果一个白噪音过程还满足正态分布的条件,即服从正态分布,这样的过程称为高斯白噪音过程。例如:
就是一个典型的样本为T的白噪音过程。139/613.2一阶自回归模型
(AR(1)process)3.2.1AR(1)过程的基本定义和性质
AR(1)模型可以写成:140/61如果则有因此,AR(1)实际上是一个无穷阶移动平均过程.141/613.2.2平稳AR(1)的均值
142/613.2.3AR(1)过程的方差………143/61
平稳序列的观测值表现出一种向其均值水平回复的特征,这种特征在金融时间序列分析中称“均值回复”,对应的英文名词是“mean-reverting”。144/61
图3-4AR(1)模拟生成的序列图与相关统计量145/61146/613.2.4AR(1)过程的自协方差与自相关函数…………147/61
所以,,而对于,其取值越靠近于1,则暗示序列相邻观测值之间的相关性越强。很明显,平稳AR(1)过程的自相关函数图应该是随着滞后期数的增加而呈现逐渐衰减的态势。148/61
3.2.5一阶自回归系数的影响下面利用实际例子进一步演示自回归系数取值不同对自相关系数以及序列动态走势的影响。149/61ACF的图示说明150/61151/61基于AR(1)的模拟序列152/61153/61154/61155/613.3二阶自回归模型
(AR(2)process)3.3.1AR(2)过程的基本定义和性质
156/61与滞后算子多项式对应的特征方程(characteristicequation)为157/61…158/612…159/613.3.2AR(2)过程的均值160/613.3.3AR(2)的方差、自协方差与自相关函数161/61162/61
因此,又因为自相关函数具有以下性质可得自相关函数在前2期的解析表达式
163/61
进而可推导出平稳AR(2)模型的方差解析表达式:164/61图3-8AR(2)模型生成的序列数据165/61166/61167/613.4p阶自回归模型AR(p)process3.4.1AR(p)过程的基本定义和性质……168/61……169/613.4.2AR(p)过程的均值……………170/613.4.3AR(p)过程的方差和自协方差与处理AR(2)同样的思路171/61故有:
(3.77)172/61利用平稳AR过程的性质,式3.77中第2个等式就是分析可行,对于j=0,1,2,…,p,上式实际上是给出了P+1个等式,用以刻画自协方差、自回归系数和白噪声过程的方差之间的关系。173/613.4.4AR(p)过程的自相关函数
ACF服从于勒-沃克等式(Yule-Walkerequations)174/61
例子:在AR(2)过程里,
……175/61实例应用AR(2)过程:其逆特征根方程为:176/61图3-9177/61图3-10178/61
需要注意,对于AR(2)模型来说,随着滞后期j的增大,自相关函数(绝对值)不一定总是单调递减的!这一点与AR(1)模型不同,因为对于平稳AR(1)模型来说,自相关函数的绝对值一定是单调递减的。为了说明这一点,现在考虑另外一个AR(2)模型:
179/61图3-11180/61图3-12181/61
作为最后一个示范,图3-12给出了另外一个AR(2)模型对应的自相关函数图。请读者思考,这个自相关函数图为什么会出现震荡式衰减形式?是什么因素决定了这种表现形式?如果给定一个AR(3)模型,如何绘制对应的自相关函数图呢?4.1移动平均过程4.1.1MA(1)模型图-4.1模拟生成的MA(1)序列均值方差自协方差111自相关函数
如果
换成它的倒数形式
,表达式
是保持不变的。图4-2MA(1)过程的
理论自相关函数图可逆性(Invertibility)……
对进行整理,不难看出其是一种无穷AR过程,或写成,即:
以上推导过程说明了一个MA(1)过程的可逆条件,即当
时,MA(1)过程可逆。在这种情况下,MA(1)过程可以“逆”过来写成
的形式。………4.1.2MA(2)模型图4-3MA(2)过程模拟生成的序列4-4MA(2)过程的理论自相关函数图
与MA(1)过程对应的概念类似,MA(2)过程的可逆性是指将MA(2)过程转化写成
的特性。MA(2)过程可逆,要求逆特征方程的根要全部落在单位圆外。MA(2)过程的可逆4.1.3MA(q)模型
q
阶移动平均过程:…………………
MA(q)过程的可逆条件:
逆特征方程
的所有根都落在单位圆外。…4.2自回归移动平均过程4.2.1ARMA(p,q)过程的基本定义……其中,滞后算子多项式满足和。
…………4.2.2ARMA(p,q)过程的平稳性与可逆性
从MA过程的特性知道,MA过程在任何条件下都是平稳过程,所以,对于ARMA过程的平稳性要求,就完全表现在对AR部分的要求上。平稳性对于任意一个ARMA过程其平稳性要求是,等式的根都要落在单位圆外。………
可逆性
ARMA(p,q)过程的可逆条件是都要落在单位圆外,与纯MA(q)过程的可逆条件完全相同。…4.2.3ARMA(p,q)过程的均值、方差和自协方差………
…………………4.2.4ARMA(p,q)过程的自相关函数………图4-5ARMA(1,1)的理论自相关函数图4.2.5AR与MA模型的相互转化
如果平稳性和可逆性都满足,那么AR、MA和ARMA之间可以相互转化。ARMA转化为MAARMA转化为AR
利用滞后算子的特性,可以进一步写成更为直观的形式,即:其中:
,并且滞后算子。
一般来说,将ARMA模型转化成MA模型的目的,是可以清楚地考查以往的随机冲击因素当前的影响效果。所以在实证研究中,MA模型或者MA的表达形式经常被用来分析随机扰动因素对代表特定含义的金融或经济变量的影响情况。典型的例子就是我们在第2章介绍的脉冲相应函数。
另一方面,将ARMA模型转化成AR模型的形式,经常可以用来刻画某些金融时间序列变量的动态路径。4.3部分自相关函数
部分自相关函数是指
与
之间,在剔除了这两期通过中间的
形成的线性依赖关系后,而存在的相关性。
对于一个AR(1)模型,因为如果不考虑在与
之间的“桥梁”和“纽带”作用,剔除了它的中间影响,那么PACF在第2个滞后期就应该是0。图4-6AR(1)模型的理论PACF……
在实际中,还有一种估计PACF的方法…PACF可以用来区分AR与MA过程,因为对于一个AR(p)模型,其PACF应该在p个滞后期之后陡然降为0,而对于MA(q)模型来说,由于它可以转化为的形式,所以其对应的PACF应该呈现出逐渐衰减、向0趋近的态势。
无论对于ACF还是PACF,如果图示出现在某一期陡然减小为0(并且之后也为0)的现象,通常可以形象地描述为ACF或PACF“在某期后出现截尾特征”。相反,如果图示出现逐渐衰减的态势,则可以描述为“拖尾特征”。图4-7AR与MA模型的PACF比较表4-1
AR与MA模型的ACF与PACF特征比较AR(p)模型MA(q)模型ACF拖尾q期后截尾PACFp期后截尾拖尾4.4样本自相关与部分自相关函数4.4.1样本自相关函数(SACF)Ljung和Box(1978)Q-统计量Q-统计量是用来检验一系列自相关性是否具有统计显著性,原假设是等检验的变量从1至K期没有自相关性。原假设是所有的,在原假设条件下,Q-统计量服从渐进分布,自由度为自相关的个数k。4.4.2样本部分自相关函数(SPACF)在EViews软件中,样本部分自相关函数的求解过程通过下面的步骤实现:
1)利用样本数据和SACF的模型求出2)利用模型进行循环计算获得SPACF在其它各滞后期的值,即4.4.3实例演示4.5自相关性检验
4.5.1Breusch-GodfreyLM序列相关性检验基本思路:
将原始回归模型写成一般形式:
其中:
表示包括常数项在内的一组解释变量。
下面,就可以写出
Breusch-GodfreyLM检验利用的辅助回归等式,即:Breusch-GodfreyLM检验的原假设是,待检验的序列不存在最多至m期的序列相关性,即:
而备择假设是:
……
Breusch-GodfreyLM检验的统计量等于有效样本大小乘以回归得到的拟合优度(goodnessoffit),即
LM检验统计量在原假设条件下,Breusch-GodfreyLM检验的统计量服从自由度为m的卡方分布()。荷兰计量经济学家Kiviet(1986):Breusch-GodfreyLM检验过程中,最好使用与原假设合备择建设相对应的F-统计量,即:其中:
和
分别表示在有约束条件下和无约束条件下回归等式的残差平方和,而k表示辅助回归等式中解释变量的总共个数。4.5.2DurbinWatson序列相关性检验
D-W检验的统计量定义为:
该检验的原假设为待检验的序列不存在一阶序列相关性,备择假设是存在一阶自相关性。注意,该检验只局限在对一阶序列相关性的检验。
若将统计量中的分子项展开,可得:将上式代入到统计量中,同时注意到:那么,可以得到D-W检验统计量的另外一个近似表达式,即:
由
的数量关系可以得到:若不存在序列相关性,即
接近于0,那么D-W统计量应该非常接近于2,若序列相关性非常强,即
接近于1或者-1,则D-W统计量应该非常接近于0或者4。在现实中,通过D-W统计量快速判断是否存在一阶自相关性的方法之一就是看D-W统计量与2的比较。D-W检验存在至少三个方面的弱点:
1.D-W检验只能检验一阶自相关性,不能用来检验高于一阶的情况。
2.D-W检验要求原始回归方程中一定不能含有被解释变量的滞后项。
3.D-W检验存在无法判定的检验区域即在某个实数域内,如果检验统计量落在了这个域内,则D-W检验无法判断是否拒绝原假设。4.6ARMA模型的实证分析与应用4.6.1ARMA模型的滞后期设立
使用ARMA模型分析实际问题,首先需要处理的问题就是模型中的滞后期数。如何设立一个“最优”的滞后期数?对这个问题的回答,可以归结到著名的Box-Jenkins模型选择原则,基本思想是在确立滞后期时,应该兼顾模型的简约度和拟合程度。一般有两种常见的方法可供选择滞后期使用。
第一种方法称为“向下检验”法。“向下检验”法的基本内容是,从一个最大滞后期开始检验最后一个滞后项的系数是否显著,如果不显著,则去掉该滞后项,依此类推进行下去直至最后一个滞后项系数显著为止。
以AR模型为例,首先可以根据具体问题设定一个最大的滞后期数,如
,然后估计AR()模型,即:
“向下检验”法首先进行以下检验:
若拒绝原假设,则最优滞后阶数为
,从而确定AR()为实证估计模型。
…
相反,如果原假设不能被拒绝,那么开始下一轮估计与检验,即估计:
并检验:
如果原假设被拒绝,那么“向下检验”的步骤到此为止,对应选择的最优滞后期数为(-1)。…
另一个经常使用的滞后期数选择的方法是所谓的信息准则法,常用的信息准则包括AkaikeInformationCriterion(AIC)和SchwartzInformationCriterion(SIC),SIC有时也写成BIC。
假定分析的模型是类似
样的AR模型,对应的有效样本大小为
,那么AIC和SIC的定义如下:…4.6.2ARMA模型的回归估计
假设我们估计下面的AR模型:
假设模型不存在序列相关性,那么可以使用传统的OLS估计,即用当前期的
作为被解释变量,对一个常数项和它本身的p个滞后期进行回归。……
尽管模型可以看作一个传统的回归方程,但是,又存在一个特殊的实践性问题,那就是如何处理初始值。例如,在t=1时,回归方程应该写成:……图4-12AR模型回归估计中滞后造成的观测值缺失及处理4.7实例应用:中国CPI通胀率的AR模型
例:考查中国的季度CPI通胀率的动态模型设立与估计。我们使用公布的月度价格指数(上年同月)的季末月份观测值(减100)作为研究的季度数据,以减少由月度平均数作为季度数据可能带来的序列相关性。首先考虑AR还是MA模型比较适合用来捕捉我国通胀率的动态路径。图4-13中国季度CPI通胀率(%)1981Q1-2006Q2
模型是否可能包含滑动平均(MA)项呢?如果通胀率随机时序轨迹的真实数据生成过程含有MA成份,其部分自相关函数应该呈现拖尾态势,而ACF会出现截尾现象。从图中看到,通胀率变量的PACF在一定滞后期数后陡然切断到0,而SACF则呈现出拖尾现象,从而表明用AR(p)模型来刻画我国通胀率的时序特性比较合理。
要利用AR模型获得相对合理可靠的估计,AR模型的滞后期数应该科学有据地选取。可以初始设定8期,然后根据AIC标准来确定最优滞后期数(循环减少期数直至AIC达到最小值),从而也符合计量中模型确立的“从一般到特殊”的规则。在实践中,依据BIC标准选择的结果也完全一致。图4-14中国CPI通胀率的PACF与SACF
根据以上分析,基本的模型设定为:其中:
代表通胀率,
是截矩项,
是序列不相关的随机扰动误差项。图4.15AR(1)模型回归的残差序列2635.1基本概念与预测初步
5.1.1基本概念
预测集:考虑一个时序变量y,拥有历史数据从1到T。假定没有任何其他信息,那么对y的未来预测所依据的信息集可以写成:这种信息集称为单变量信息集。264
如果还有其他变量x也影响y的未来走势,那么就形成多变量信息集,即:265预测期
预测期(forecastinghorizon)是指当期与预测对应的日期之间的时间间隔。预测分析中经常使用“向前h-期预测”这样的表述,其中h就表示预测期。266图5-1预测期为4期的点预测
267
最优预测最优预测(optimalforecast)是指在给定信息集下,预测结果能够最小化预测损失(假定存在损失函数)。在一般情况下,可以证明给定信息集下的条件期望就是最优预测,即E(yT+h|ΩT)。2685.1.2预测初步:基于时间趋势模型的预测(1)线性时间趋势模型如果我们考虑变量yt对时间t进行计量回归,并且考虑带有常数项c,那么对应的线性时间趋势模型就是269
其中ε表示随机扰动项,暂时假设为独立同分布;β是回归模型的斜率系数,其正负决定了y是增长趋势还是减弱趋势序列,其大小决定了趋势序列的陡峭程度。另外,在模型中,t的取值完全和时间一一对应。在初始时点t=1,在第二个时点t=2,以此类推。如果样本为T,那么t的取值就是(1,2,…,T-1,T)。270图5-2基于不同参数取值的时间趋势序列271基于EViews的程序:272图5-3美国平民劳动力人口与线性时间趋势模型拟合结果
273
图5-3描绘了美国平民劳动力人口数量(CivilianLaborForce,以CLF表示)的原始序列,同时报告了以CLF作为因变量的线性时间趋势模型回归后(使用OLS回归)的拟合序列。
274
从图5-3中不难看出,CLF似乎可以大致用线性趋势模型来刻画其动态路径。从拟合结果来看,在1980年之后的区间内线性趋势模型对CLF的拟合程度相对之前更高。275图5-4(2)非线性时间趋势模型276
图5-4描绘的从1995年6月至2011年4月上海证券交易所证券交易总额的月度时间序列,从中我们就看到非常明显的非线性走势。277
二次型时间趋势模型是非线性趋势模型中比较简单和常见的类型之一,其模型可以写成因为上面的模型中时间趋势项的最高阶是二次方的形式,所以这样的模型称为二次型时间趋势模型。
278图5-5上交所证券交易总额与二次型时间趋势模型拟合结果
279
需要说明的是,单纯从拟合效果来判定模型设立形式并不一定是最合适的选择,因为计量模型设立的另外一个重要原则是简约(parsimony)。对于非线性时间趋势模型更是如此。280(3)基于时间趋势模型的预测分析
假定我们现在处于时刻T,我们的预测期是h,那么根据线性时间趋势模型,我们可以写出h期以后序列y的点预测值对应的表达式,即281实践中的预测结果实际上可以写成282
获得了点预测值之后,还可以进一步计算其对应的置信区间。以95%的置信区间为例,置信区间上限界为,其中表示回归模型中扰动项的标准差估计值。283
上述过程以线性时间趋势模型为例,但对于非线性时间趋势模型,我们仍然可以用类似的过程来进行预测。284预测-基本概念事前预测,事后预测,模拟预测假设收集到N个数据,使用1到T来估计模型.对N时刻以后预测事前预测;对T到N预测事后预测或样本外预测;对1到T之间的预测是模拟,或拟和。1TN285预测-基本概念h步预测:预测变量YT+h的取值,h>0,称为h-步预测假设时刻T之前的所有数值YT,YT-1,…,Y1…预测估计量:用表示基于T时刻之前的观测对YT+h的预测预测误差估计量:预测均方误差,记为MSE()286预测最优预测:选择合适的函数形式,使得预测均方误差最小的预测是最优预测。可以证明求YT+h基于YT,YT-1,…,Y1,…的条件期望是使均方误差最小的预测,条件期望表示为:E(YT+h|YT,YT-1,…,Y1…)=287预测值的计算
t=c+
1
t-1+
2
t-2+…+
p
t-p+不可能知道T时刻前的所有观测,观测值是YT,YT-1,…Y1,所以是近似预测。假设参数已知,实际只能用估计的参数代替真实参数。预测是递推进行288预测值的计算1-步预测2-步预测289预测值的计算一般预测公式290预测值的计算AR(1)模型的h步预测
t=c+
t-1+
t291预测值的计算MA(q)模型的h步预测
292预测值的计算计算残差的估计值,假设0,
1,…
-q+1=0根据下面的公式递推计算:293预测值的计算ARMA(1,1)模型的预测
t=c+
1Yt-1+
t+
1
t-1
294预测值的计算残差的计算与MA模型类似,以ARMA(1,1)为例。
1=
1-c-
1Y0-
1
0假设
0=0,
0已知。所以实际用的数据个数为T+1个;如果
0未知,用样本均值代替。
2=
2-c-
1Y1-
1
1…
T=
T-c-
1YT-1-
1
T-1295预测置信区间ARMA模型表示成MA(
)模型
t-
=
t+
1
t-1+
2
t-2+…h步预测是在基于T时刻前的信息求条件期望,结果如下:预测误差:
296预测方差一步预测方差等于残差的方差。预测方差随着预测步长的增加越来越大。预测方差趋于Y的无条件方差297预测的置信区间95%置信水平下,h-步预测的置信区间,假设服从正态分布
298预测的评价
1)均方根误差2)均方误差3)绝对预测误差百分率平均值4)建立回归模型,如果预测准确截距等于0,斜率等于1299预测的评价(5)平均预测误差(6)平均绝对预测误差(7)均方根预测误差百分率300预测的评价评价预测效果可以根据前面介绍的7个指标,预测误差越小,说明预测越精确。得到多个1-步预测的方法有:静态预测,滚动预测和递推预测。假设收集到数据95:1:1到99:12:10。使用95:1:1到99:11:30估计模型,对99:12:1-99:12:10日的数据进行预测。静态预测在预测时,把99:12:1到99:12:9日的真实观测值带入预测公式即可。
301预测评价滚动预测是滚动估计区间,然后进行1-步预测,递推预测是不断增加估计样本区间,然后进行1-步预测,例如:预测
滚动估计样本范围
递推估计样本范围195:1:1-99:11:3095:1:1-99:11:30295:1:2-99:12:195:1:1-99:12:1395:1:3-99:12:295:1:1-99:12:23026.1确定性趋势(deterministictrend)
确定性趋势是指模型中含有明确的时间t变量,从而使得某一时序变量随着时间而明确地向上增长。303最简单的线性确定性趋势模型可以写成
其中表示均值为0的平稳随机变量。
两边同取期望,可得
此式表明,在系数不为0的情况下,该序列的均值随时间推移而不断增大。正因为这个特点,确定性趋势模型也称为“均值非平稳”过程304图6-1中国真实GDP305美国真实GDP306...3076.2随机性趋势(stochastictrend)6.2.1随机趋势模型的基本定义
考虑AR(1)模型:其中代表方差为的白噪音过程。
将模型写成:。
如果假设初始观测值为,那么通过反复迭代可以得到:
308
这个表达式可以看成是一种随机常数项,由于每个随机扰动因子对
的条件均值的影响都是永久性的,所以这样的模型经常被称为随机趋势模型。3096.2.2随机游走模型(randomwalk)
实际上,模型的形式就是一个随机游走过程。那么随机游走过程的特点有哪些呢?首先,从基本定义式可以看到,随机游走过程就是一个常数项为0并且自回归系数为1的AR(1)模型。310
进一步考察随机过程的均值和方差:311根据自协方差的定义,有:………312进而,可以获得自相关函数的表达式:313图6-2
随机游走过程与高持久性AR(1)比较3143153163176.2.3带有截距项的随机游走模型
如果现在假设模型(6.8)中增加了一个常数项,即
(6.16)其它假设均不变。此时的模型称为带有截距项的随机游走过程(randomwalkwithadrift)。318
RWD的均值、方差:………319RWD的自协方差:
………320RWD的自相关函数:321
图6-3带有截距项的随机游走过程322RWD的样本自相关函数3236.3去除趋势的方法
在实际应用当中,平稳时间序列要比非平稳时间序列具有更多吸引人的特性。另外,平稳时间序列与非平稳时间序列在某些重要特性方面差异明显。324
但是,含有趋势的时间序列却永远也不会回复到一个长期的固定水平。随机扰动对含有趋势的时间序列的影响将是长久的,表现出一种长期的记忆性。325
如果含有趋势成分的非平稳时间序列参与到计量回归中,许多经典的回归估计假设条件将不再满足,所以就必须小心解释相应的统计检验和统计推断,有的情况下会出现所谓的“伪回归”现象,而有的条件下需要应用协整分析方法。326
一般来说,常用的去除趋势的方法有差分法和去除趋势法,前者主要针对随机趋势非平稳时间序列,而后者主要针对含有确定性趋势的非平稳时间序列。3276.3.1差分法(differencemethod)
差分法一般用来去除含有随机趋势的非平稳时间序列。如果从AR模型的平稳性条件来考虑,它非平稳,就是因为它的特征方程的根含有一个单位根。所以也被称为“单位根过程”,或者“一阶单整过程”,记做I(1),其中“I”表示单整,“(1)”表示单整的阶数。328
随机趋势非平稳过程可以通过差分法变为平稳过程。如果是I(1),则一次差分即可实现,而对于I(2)过程,则可以通过两次差分获得平稳过程。
以随机游走过程为例,一阶差分就是指使用原过程获得一次差分项的表达式,其中“
”表示差分符号。所以:
329
从模型可以看出,基于随机游走过程的一次差分是一个平稳的随机时序变量,因为等于平稳白噪音过程。330图6-4RWD及其一次差分后序列331332
以上处理方法很容易拓展到高阶单整序列。例如,假设是一个I(2)过程,那么对其二次差分就可以获得平稳序列,即:其中:“
”表示二次差分符号。依此类推,“
”表表示三次差分符号,而“
”表示n次差分符号。333对于ARIMA(p,1,q)来说,334
虽然我们这里讨论的是一阶单整形式的ARIMA模型,但二阶或者其他高阶ARIMA模型可以运用类似的思路获得平稳的差分序列。概括地说,一个ARIMA(p,d,q)过程,经过d次差分后就可以获得对应的平稳过程。3356.3.2去除趋势法
(detrendmethod)336
当然,如果不能确定时间趋势成分是否仅为一次幂的形式,还可以采用更一般的确定性趋势非平稳序列的模型形式,如:。然后可以通过OLS回归,运用“向下检验法”的原则或者信息准则法确定出的阶数,最终获得平稳序列的估计值即可。…3376.3.3去除趋势的方法比较
前面小节讨论了差分法和去除时间趋势法,并且认识到不同的趋势非平稳序列需要采用不同的去除趋势成分的方法。实际上,去除含有趋势成分的非平稳时间序列的方法还有很多滤波方法。常见的有HP滤波、卡尔曼滤波,以及近年来新发展起来的BK滤波和CF滤波。338图6-5去除线性时间趋势法
获得的序列339去除线性时间趋势法获得的差分序列的ACF图340图6-6差分法获得的序列341差分法获得的序列的ACF图342
本小节开始我们还提到过其他一些常用的滤波法,利用这些方法也可以获得非平稳时间序列的平稳序列成分。HP滤波就是很常用的一种。343Hodrick-Prescott(HP)滤波
在宏观经济学中,人们非常关心序列组成成分中的长期趋势,Hodrick-Prescott滤波是被广泛使用的一种方法。该方法在HodrickandPrescott(1980)分析战后美国经济周期的论文中首次使用。我们简要介绍这种方法的原理。设{Yt}是包含趋势成分和波动成分的经济时间序列,{YtT}是其中含有的趋势成分,{YtC}是其中含有的波动成分。则
(1)计算HP滤波就是从{Yt}中将{YtT}分离出来。344
一般地,时间序列{Yt}中的不可观测部分趋势{YtT}常被定义为下面最小化问题的解:其中:c(L)是延迟算子多项式将式(3)代入式(2),则HP滤波的问题就是使下面损失函数最小,即345
最小化问题用[c(L)YtT]2来调整趋势的变化,并随着
的增大而增大。这里存在一个权衡问题,要在趋势要素对实际序列的跟踪程度和趋势光滑度之间作一个选择。
=0时,满足最小化问题的趋势等于序列{Yt};
增加时,估计趋势中的变化总数相对于序列中的变化减少,即
越大,估计趋势越光滑;
趋于无穷大时,估计趋势将接近线性函数。一般经验地,
的取值如下:346
HP滤波的运用比较灵活,它不象阶段平均法那样依赖于经济周期峰和谷的确定。它把经济周期看成宏观经济波动对某些缓慢变动路径的偏离,这种路径在期间内单调地增长,所以称之为趋势。HP滤波增大了经济周期的频率,使周期波动减弱。347
使用Hodrick-Prescott滤波来平滑序列,选择Procs/HodrickPrescottFilter出现下面的HP滤波对话框:
首先对平滑后的序列给一个名字,EViews将默认一个名字,也可填入一个新的名字。然后给定平滑参数的值,年度数据取100,季度和月度数据分别取1600和14400。不允许填入非整数的数据。点击OK后,EViews与原序列一起显示处理后的序列。注意只有包括在当前工作文件样本区间内的数据才被处理,平滑后序列区间外的数据都为NA。348
例1利用HP滤波方法求经济时间序列的趋势项T
利用HP滤波方法求中国社会消费品零售总额月度时间序列和中国GDP季度时间序列的趋势项。图4实线表示GDP序列、虚线表示趋势T序列图5实线表示社会消费品零售
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三年级上册数学教案-2.1千克的认识|苏教版
- 糖尿病戒烟教育
- 双十一营销活动动员致辞
- Unit 1 wrapping up the topic Project 教学设计 -2024-2025学年仁爱科普版英语七年级上册
- 2025年高空施工协议书模板
- 三年级上册数学教案-第六单元 乘加、乘减两步混合运算练习 青岛版
- 2024-2025学年八年级政治上册 第一单元 让爱驻我家 第二课 我们共有一个家 第1框《我爱你中国》教学实录 鲁教版
- 生活中的数(教案)2024-2025学年数学一年级上册-北师大版
- 2025年临沂货车从业资格证考试试题
- 立体构成设计课件
- pisa数学素养测试题及答案
- 2025年安徽电气工程职业技术学院单招职业技能考试题库汇编
- 2025年锡林郭勒职业学院单招职业技能测试题库汇编
- 2025年合肥财经职业学院单招职业适应性测试题库必考题
- 矿山化验室安全培训
- 清华大学告诉你普通人如何抓住DeepSeek红利
- 《法律职业伦理》课件-第四讲 律师职业伦理
- (2025)辅警招聘公安基础知识必刷题库及参考答案
- 人教版(2024)七年级下册英语Unit 5 Here and Now 单元教学设计(共6课时)
- 动态博弈模型构建-深度研究
- 二零二五年度城市排水管网运维合作协议4篇
评论
0/150
提交评论