状态空间模型和卡尔曼滤波课件_第1页
状态空间模型和卡尔曼滤波课件_第2页
状态空间模型和卡尔曼滤波课件_第3页
状态空间模型和卡尔曼滤波课件_第4页
状态空间模型和卡尔曼滤波课件_第5页
已阅读5页,还剩221页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

状态空间模型和卡尔曼滤波StateSpaceModelsandKalmanFilter

60年代初,由于工程控制领域的需要,产生了卡尔曼滤波(KalmanFiltering)。进入70年代初,人们明确提出了状态空间模型的标准形式,并开始将其应用到经济领域。80年代以后,状态空间模型已成为一种有力的建模工具。许多时间序列模型,包括典型的线性回归模型和ARIMA模型都能作为特例写成状态空间的形式,并估计参数值。在计量经济学文献中,状态空间模型被用来估计不可观测的时间变量:理性预期,测量误差,长期收入,不可观测因素(趋势和循环要素)。状态空间模型在经济计量学领域其他方面的大量应用请参见Harvey(1989)和Hamilton(1994)。

1状态空间模型和卡尔曼滤波60年代初,由于工程控制领

在一般的统计模型中出现的变量都是可以观测到的,这些模型以反映过去经济变动的时间序列数据为基础,利用回归分析或时间序列分析等方法估计参数,进而预测未来的值。状态空间模型的特点是提出了“状态”这一概念。而实际上,无论是工程控制问题中出现的某些状态(如导弹轨迹的控制问题)还是经济系统所存在的某些状态都是一种不可观测的变量,正是这种观测不到的变量反映了系统所具有的真实状态,所以被称为状态向量。这种含有不可观测变量的模型被称为UC模型(UnobservableComponentModel)。2在一般的统计模型中出现的变量都是可以观测到的,这些UC模型通过通常的回归方程式来估计是不可能的,必须利用状态空间模型来求解。状态空间模型建立了可观测变量和系统内部状态之间的关系,从而可以通过估计各种不同的状态向量达到分析和观测的目的。

EViews状态空间对象对单方程或多方程动态系统提供了一个直接的、易于使用的界面来建立、估计及分析方程结果。它提供了大量的建立、平滑、滤波及预测工具,帮助我们利用状态空间形式来分析动态系统。

3UC模型通过通常的回归方程式来估计是不可能

利用状态空间形式表示动态系统主要有两个优点:第一,状态空间模型将不可观测的变量(状态变量)并入可观测模型并与其一起得到估计结果;其次,状态空间模型是利用强有效的递归算法——卡尔曼滤波来估计的。卡尔曼滤波可以用来估计单变量和多变量的ARMA模型、MIMIC(多指标和多因果)模型、马尔可夫转换模型以及变参数模型。4利用状态空间形式表示动态系统主要有两个优点:背景介绍时间序列按统计特性可分为平稳时间序列和非平稳时间序列。在金融领域,大量的经验证据表明,大多数时间序列是非平稳的,往往表现出明显的趋势性或周期性。因此研究非平稳时间序列有着重要的现实意义。传统的非平稳时间序列是以概率论、数理统计和频谱分析等数学方法研究随机数据序列所遵从的统计规律,其建模方法主要有ARIMA模型法、季节性模型法和X一11法。5背景介绍时间序列按统计特性可分为平稳时间序列和非平稳时间序列由于ARIMA模型法只考虑时间序列本身的特性,没有考虑事物本身受许多不可预测的复杂因素影响,因此一些突然变化的因素在ARIMA模型只以随机扰动项来表示,这使其只在短期内的预测结果能够令人满意;对于季节性模型法,当确定其差分阶数时,目前的统计检验方法只适用没有季节波动的ARIMA模型。状态空间模型法一种时域方法,它建立了可观测变量和系统内部之间的关系,从而可以通过估计各种不同的状态向量达到分析和预测的目的,因此状态空间模型为非平稳时间序列预测提供了一种新的有效方法。背景介绍6由于ARIMA模型法只考虑时间序列本身的特性,没有考虑事物本状态空间模型是近40年发展起来的新兴的数学分支,也是目前数学界和工程界讨论最多的话题之一,并且己经在通讯、信号处理、石油地震勘探、跟踪、制导、故障诊断、图像处理等众多学科中得到了广泛应用,但在金融时间序列分析和建模中的应用却相对较少。但是近年来,状态空间模型在金融时间序列分析中的重要地位己经越来越受到人们普遍关注,如国家自然科学基金委“九五”重大项目《金融数学、金融工程、金融管理》的项目研究人员己经开始采用状态空间模型对诸多金融问题进行深入的定量研究,这将为我国今后制定合理有效的资金运作策略,规避一定的金融风险起到更为积极的作用。因而可见状态空间模型在金融时间序列方面的应用,是一个值得深入研究的课题。背景介绍7背景介绍7状态空间方法的提出现代控制理论创始人之一R.E.Kalman于1960年在论文《ANewApproachtoLinearFilteringandPredictionProblem》提出了状态空间方法。状态空间方法是一种时域方法,其中引入了状态变量概念,用状态方程描写动态系统,用量测方程描写量测信息,由状态方程和量测方程构成状态空间模型。8状态空间方法的提出现代控制理论创始人之一R.E.Kalman状态空间方法的应用在国内,1994年,顾岚在自己的著作《时间序列分析在经济预测中的应用》中提到时间序列的状态空间的研究方法。1998年,高紫光、路磊在“非平稳时间序列的状态空间建模与预测”的文章中给出结合Kalman滤波的状态空间方法的一些理论介绍。2000年,任光和张均动教授正式将现代控制理论的状态空间技术和时间序列分析相结合的时间序列状态空间技术引入我国。他们从离散系统出发,从空间映射的角度系统地论述了整个建模过程,形成了比较完整和系统的时间序列的状态空问建模理论,并将该理论应用到实际中。2001年,苗敬毅在文章“关于状态空间方法中超参数估计的札记”中对状态空间方法中超参数估计的基本思想进行了论述,并对一般文献中未详细证明的部分给出了证明。9状态空间方法的应用在国内,1994年,顾岚在自己的著作《时间状态空间方法的应用2002年,于福江、张占海、林一弊在文章“一个稳态Kalman滤波风暴潮数值预报模式”中用迭代法得到状态向量的稳态Kalman滤波,进而得到最优线性校正结果利用这种资料同化技术,对1956年发生在东海的一次强风暴潮过程进行了后报试验,结果表明,该同化方法对短期风暴潮水位后(预)报有一定的改进。2006年2月,仇伟杰在文章“基于状态空间模型与KALMAN滤波的中国电力需求分析”中利用状态空间模型和Kalman滤波技术预测了未来5年中国电力需求增长状况,取得很好的结果,对中国的电力工业未来的发展具有重要的指导意义。2006年8月,孙宏义、陈平、朱梅、陈建丽在“股票指数的时间序列模型分析”中将把与滤波结合的状态空间模型的分析结果和常见的时间序列模型如:ARIMA模型、逐步自回归模型以及指数平滑模型的分析结果进行比较,比较的结果说明结合滤波的状态空间模型分析的结果比后三种的结果更加精确。10状态空间方法的应用2002年,于福江、张占海、林一弊在文章“近年来,出现了许多以状态空间模型为框架的时间序列预测方法,这种方法首先将时间序列转化为状态空间,然后采用Kalman滤波对非平稳时间序列进行外推、内插以及平滑,同时还可以利用Kalman滤波对模型的未知参数进行极大似然估计,Kitagawa、Harvey、YoungP.C等都在这方面做出了贡献。小结11近年来,出现了许多以状态空间模型为框架的时间序列预测方法,这状态空间方法是一种时域方法,其中引入了状态变量概念,用状态方程描写动态系统,用量测方程描写量测信息,其关键和核心思想是:(l)状态变量概念的引入;(2)建立了描述状态变化的模型一一状态方程;(3)给出了对状态方程进行量测的量测方程。由状态方程和量测方程构成状态空间模型。状态空间模型是通过辅助变量来表示一个多元时间序列,这些辅助变量的某些部分可能不能直接观测到,这些辅助变量称为状态向量。它概括了所有与时间序列将来值的预测值相关的时间序列的当前和过去信息,量测的时间序列被表示成状态向量的线性组合。状态空间模型也被称为多元时间序列过程的马尔可夫表示,或典型表示。§1.1

状态空间模型的定义

12状态空间方法是一种时域方法,其中引入了状态变量概念,用状态方§1.1

状态空间模型的定义

这里仅就如何定义并预测一个线性状态空间模型做以简要的讨论。状态空间模型一般应用于多变量时间序列。设

yt

是包含k个经济变量的k1维可观测向量。这些变量与m1维向量t有关,t被称为状态向量。定义“量测方程”(measurementequation)或称“信号方程”(signalequation)为(1.1)其中:T表示样本长度,Zt

表示km矩阵,称为量测矩阵,dt表示k1向量,ut表示k1向量,是均值为0,协方差矩阵为Ht的不相关扰动项,即(1.2)13§1.1状态空间模型的定义13

一般地,t的元素是不可观测的,然而可表示成一阶马尔可夫(Markov)过程。下面定义转移方程(transitionequation)或称状态方程(stateequation)为

(1.3)其中:Tt表示mm矩阵,称为状态矩阵,ct表示m1向量,Rt表示mg矩阵,t表示g1向量,是均值为0,协方差矩阵为Qt的连续的不相关扰动项,即(1.4)量测方程和状态方程的扰动项的协方差矩阵用表示14一般地,t的元素是不可观测的,然而可表

当k

1时,变为单变量模型,量测方程可以写为

(1.5)其中:Zt表示1m矩阵,t表示m1状态向量,ut是方差为2的扰动项。15当k1时,变为单变量模型,量测方

若使上述的状态空间模型成立,还需要满足下面两个假定:

(1)初始状态向量0的均值为a0,协方差矩阵为P0,即

(1.6)(2)在所有的时间区间上,扰动项ut和t相互独立,而且它们和初始状态0也不相关,即

(1.7)且

(1.8)1616

量测方程中的矩阵Zt,dt,Ht与转移方程中的矩阵Tt,ct,Rt,Qt统称为系统矩阵。如不特殊指出,它们都被假定为非随机的。因此,尽管它们能随时间改变,但是都是可以预先确定的。对于任一时刻t,yt能够被表示为当前的和过去的ut和t及初始向量0的线性组合,所以模型是线性的。17量测方程中的矩阵Zt,dt,Ht

例1.1

一阶移动平均模型MA(1)

(1.9)其中:E(t)=0,var(t)=

2,cov(t,

t-s)=0,

通过定义状态向量t=(yt,t)可以写成状态空间形式

量测方程:(1.10)

状态方程:(1.11)这种形式的特点是不存在量测方程噪声。18例1.1一阶移动平均模型MA(1)

对于任何特殊的统计模型,状态向量t

的定义是由结构确定的。它的元素一般包含具有实际解释意义的成分,例如趋势或季节要素。状态空间模型的目标是,所建立的状态向量t

包含了系统在时刻

t的所有有关信息,同时又使用尽可能少的元素。所以如果状态空间模型的状态向量具有最小维数,则称为最小实现(MinimalRealization)。对一个好的状态空间模型,最小实现是一个基本准则。然而对于任一特殊问题的状态空间模型的表示形式却不是惟一的,这一点很容易验证。19对于任何特殊的统计模型,状态向量t的定义是由结

考虑通过定义一个任意的非奇异矩阵B,得到t*=Bt

,为新的状态向量。用B矩阵左乘状态方程(1.3),得到

(1.12)式中Tt*=BTtB-1,ct*=Bct,Rt*=BRt

。相应的量测方程是

(1.13)式中Zt*=ZtB-1

。20考虑通过定义一个任意的非奇异矩阵B,得到t*=B例1.2二阶自回归模型AR(2)(1.14)其中:E(ut)=0,var(ut)=

2,cov(ut,

ut-s)=0,考虑两个可能的状态空间形式(k=1,m=2)是

(1.15)

(1.16)换一种形式

(1.17)

21例1.2二阶自回归模型AR(2)21

系统矩阵Zt,Ht,Tt,Rt,Qt可以依赖于一个未知参数的集合。状态空间模型的一个主要的任务就是估计这些参数,在例11.1的MA(1)模型中的参数{,

2}和例11.2的AR(2)模型中的参数{

1,

2,

2}是未知的,这些参数将通过

向量表示,并被称为超参数(hyperparameters)。超参数确定了模型的随机性质,在ct和dt中出现的参数仅影响确定性的可观测变量和状态的期望值。在状态空间模型中可以引入外生变量作为解释变量,也可以引入yt的延迟变量,这些都可以放到dt中去。如果ct或dt是未知参数的一个线性函数,这些未知参数也可以作为状态变量或者超参数的一部分元素。22系统矩阵Zt,Ht,Tt,Rt,Q

例1.3变参数模型

通常的回归模型可用下式表示,即:其中:yt是因变量,xt是m1的解释变量向量,是待估计的m1未知参数向量,ut是扰动项。这种回归方程式所估计的参数在样本期间内是固定的,可以采用普通最小二乘法(OLS)、工具变量法等计量经济模型的常用方法进行估计。

23例1.3变参数模型2

实际上近年来,我国由于经济改革、各种各样的外界冲击和政策变化等因素的影响,经济结构正在逐渐发生变化,而用固定参数模型表现不出来这种经济结构的变化,因此,需要考虑采用变参数模型(Time-varyingParameterModel)。下面利用状态空间模型来构造变参数模型。量测方程:状态方程:

~24实际上近年来,我国由于经济改革、各种各样的外

xt是具有随机系数t

的解释变量的集合,zt

是有固定系数

的解释变量集合,随机系数向量t

是对应于例1.3中的状态向量,称为可变参数。变参数t

是不可观测变量,必须利用可观测变量

yt

xt来估计。假定变参数t

的变动服从于AR(1)模型(也可以简单地扩展为AR(p)模型),扰动向量

ut,t

假定为相互独立的,且服从均值为0,方差为

2和协方差矩阵为

Q

的正态分布。25xt是具有随机系数t的解释变量的集

26

26

§1.2卡尔曼滤波(KalmanFiltering)

当一个模型被表示成状态空间形式就可以对其应用一些重要的算法求解。这些算法的核心是Kalman滤波。Kalman滤波是在时刻t基于所有可得到的信息计算状态向量的最理想的递推过程。在某些工程问题中,状态向量的当前值具有重要影响(例如,它可以表示火箭在空间的坐标)。Kalman滤波的主要作用是:当扰动项和初始状态向量服从正态分布时,能够通过预测误差分解计算似然函数,从而可以对模型中的所有未知参数进行估计,并且当新的观测值一旦得到,就可以利用Kalman滤波连续地修正状态向量的估计。27§1.2卡尔曼滤波(KalmanFilterin数据滤波是去除噪声还原真实数据的一种数据处理技术,Kalman滤波在测量方差已知的情况下能够从一系列存在测量噪声的数据中,估计动态系统的状态.由于,它便于计算机编程实现,并能够对现场采集的数据进行实时的更新和处理,Kalman滤波是目前应用最为广泛的滤波方法,在通信,导航,制导与控制等多领域得到了较好的应用。28数据滤波是去除噪声还原真实数据的一种数据处理技术,Kalm卡尔曼滤波的基本思想在海图作业中,航海长通常以前一时刻的船位为基准,根据航向、船速和还留等一系列因素推算下一个船位,但是他并不轻易认为船位就一定在推算船位上,还要选择适当的方法,通过仪器得到另一个推算船位。观测和推算这两个船位一般不重合,航海长需要通过分析和判断选择一个可靠的船位,作为船舰当前的位置。以K-1时刻的最优估计为准,预测K时刻的状态变量,同时又对该状态进行观测,得到观测变量,再在预测与观测之间进行分析,或者说是以观测量对预测量进行修正,从而得到K时刻的最优状态估计。

29卡尔曼滤波的基本思想在海图作业中,航海长通常以前一时刻的船位

以下设YT表示在t=T

时刻所有可利用的信息的信息集合,即YT={yT,yT-1

,…,y1}

。状态向量的估计问题根据信息的多少分为3种类型:

(1)当t>T

时,超出样本的观测区间,是对未来状态的估计问题,称为预测(prediction);

(2)当t=T时,估计观测区间的最终时点,即对现在状态的估计问题,称为滤波(filtering);

(3)当t<T时,是基于利用现在为止的观测值对过去状态的估计问题,称为平滑(smoothing)。30以下设YT表示在t=T时刻所有可

进一步,假定att-1和Ptt-1分别表示以利用到t-1为止的信息集合Yt-1为条件的状态向量t的条件均值和条件误差协方差矩阵,即

在这里假定系统矩阵Zt,Ht,Tt,Rt和Qt是已知的,设初始状态向量

0的均值和误差协方差矩阵的初值为a0和P0,并假定a0和P0也是已知的。31进一步,假定att-1和Ptt-2.1Kalman滤波的一般形式

1.滤波

考虑状态空间模型(1.1)和(1.3),设at-1为状态向量t-1的均值,也是基于信息集合Yt-1的t-1的估计量,Pt-1表示估计误差的mm协方差矩阵,即

(2.1)322.1Kalman滤波的一般形式考虑状态空Kalman滤波的初值可以按a0和P0或a10和P10指定。这样,每当得到一个观测值时,Kalman滤波提供了状态向量的最优估计。当所有的T个观测值都已处理,Kalman滤波基于信息集合YT

,产生当前状态向量和下一时间期间状态向量的最优估计。这个估计包含了产生未来状态向量和未来观测值的最优预测所需的所有信息。33Kalman滤波的初值可以按a0和P2.平滑平滑(smoothing)(t=T-1,T-2,…,1)(2.10)(2.11)其中:aT|T,PT|T是平滑的初值,由Kalman滤波最后的迭代得到。

还可以计算得到yt的平滑估计和协方差矩阵342.平滑34

一步向前预测误差向量

(2.14)

预测误差协方差矩阵由式(2.6)的Ft给定,即

(2.15)

由后面2.2节的论述可以知道条件均值是yt的最小均方误差意义的最优估计量(MMSE)。因此,可以利用式(2.13),以及Kalman滤波公式(2.2)~(2.6),对yt,t(t=T+1,T+2,…)进行预测。35一步向前预测误差向量352.2Kalman滤波的解释和性质

Kalman滤波的导出依赖于扰动项和初始状态向量服从正态分布的假设。有了正态分布的假设,就能够基于信息集合YT={yT,yT-1

,…,y1}

,利用Kalman滤波递推地计算t的分布。这些条件分布自身也都服从正态分布,因此也就由它们的均值和协方差矩阵完全确定,这就是Kalman滤波计算的估计量。为了说明t的条件均值是t在最小均方误差意义下的一个最优估计量,下面首先介绍均方误差和最小均方估计的概念。362.2Kalman滤波的解释和性质361.均方误差设z是随机向量,已知样本集合ZT={zT,zT-1

,…,z1}

,是基于ZT的z的任一估计量,则定义均方误差(meansquareerror,MSE)为

(2.16)2.最小均方估计

设是基于ZT的z的任一估计量,是其中使均方误差达到最小的z的估计量,即

(2.17)则称为z的最小均方估计(mininummeansquareestimator,MMSE)。371.均方误差37Kalman滤波以信息集Yt为条件,产生t的条件均值和方差

(2.18)(2.19)其中:数学期望算子下面的下标t表示是关于Yt的条件期望。38Kalman滤波以信息集Yt为条件,产

设是以信息集Yt为条件的t的任一估计量,估计误差可以被分为两个部分

(2.20)

对式(2.20)两端平方,并求期望值,经过计算,由于混合乘积项为零,得到

(2.21)

在式(2.21)等号右边的第一项是t的条件方差,由于var(tYt)0,且与估计量无关,因此要想使式(2.21)达到最小,只需在第二项取即可。也就是说,t的最小均方估计(MMSE)就是由Kalman滤波所得到的条件均值at=E(tYt),并且是惟一的。39设是以信息集Yt为条件的

当状态空间模型的扰动项的分布不能满足正态分布假定时,一般地,Kalman滤波所产生的估计量at不再是状态向量t的条件均值,换句话说,式(2.18)将不成立。但是如果限制估计量是观测值的线性组合,即在所有线性估计范围内,at是具有最小均方误差意义上的最优估计量。此时称at是基于信息集Yt的t的最小均方线性估计量(minimummeansquarelinearestimator,MMSLE),估计误差的协方差矩阵是由Kalman滤波给出的Pt矩阵。40当状态空间模型的扰动项的分布不能满足正态分布

进一步地,上述关于状态向量t的论述也可以类似地用来解释yt基于信息集Yt–1的条件均值,用表示,即

(2.22)

在正态假定下,是yt在最小均方误差意义下的最优估计量(MMSE),并且在不满足正态假定时,是yt的最小均方线性估计量(MMSLE)。41进一步地,上述关于状态向量t的论述也可

预测误差

(2.23)被称为新息(innovations),因为它代表在Yt-1的基础上新观测值yt所带来的信息。从更新方程(2.4)中可以看出,新息vt对修正状态向量的估计量起到了关键的作用。在正态假定下,根据是最小均方误差意义下的最优估计量,可以推断vt的均值是零向量。进一步地,从式(2.23)容易看出

(2.24)其中:Ft由式(2.6)给定。在不同的时间区间,新息vt是不相关的,即,(2.25)42预测误差422.3修正的Kalman滤波递推公式当量测方程和转移方程的扰动项是相关的时候,需要修改Kalman滤波。考虑具有量测方程和转移方程的状态空间形式

(2.26)(2.27)

假设(2.28)其中Gt是已知的g

k矩阵。量测方程和状态方程的扰动项的协方差矩阵用表示

432.3修正的Kalman滤波递推公式43

注意当量测方程和转移方程的干扰项在同时点相关,在不同时点不相关时,Kalman滤波中的预测公式(2.2),(2.3)不变,更新方程进行如下修改:在(2.4)和式(2.5)中矩阵Ptt–1Zt

变为Ptt–1Zt+RtGt

,式(2.6)变为

(2.29)44注意当量测方程和转移方程的干扰项在同时点相关,2.4非时变模型及Kalman滤波的收敛性

在许多实际应用问题中,状态空间模型的系统矩阵Zt,dt,Ht,Tt,ct,Rt和Qt都是不依赖于时间变化的,这样就可以写成不带时间下标的模型,称为非时变模型。一般允许ct和dt是依时间变化的,于是状态空间模型的量测方程(1.1)和转移方程(1.3)就可以写为

(2.32)(2.33),(2.34)452.4非时变模型及Kalman滤波的收敛性

如果系统是稳定的,则转移矩阵T的所有的特征根的模应当小于1,即

(2.35)且如果初始协方差矩阵P10是非负定的,则

(2.36)

独立于P10,Pt+1t

呈指数地迅速收敛到。46如果系统是稳定的,则转移矩阵T的所有的特2.5Kalman滤波的初始条件

(1)仅当状态转移矩阵T,方差矩阵P和Q是非时变的且满足某些稳定性条件,初始条件的求解才是可能的。如果初始条件的求解是可能的,可以利用关系式:

在更复杂的模型中给出求协方差矩阵初始条件P0的一种方法

(2.37)式中Vec()算子是把矩阵拉直,即表示矩阵的列是一列接着一列而形成一个向量,而运算符表示克罗内克积(kroneckerproduct),I为单位矩阵。472.5Kalman滤波的初始条件47(2)如果初始条件的求解是不可能的,状态将按扩散先验处理。当利用扩散先验时,采用Koopman,Shephard和Doornik(1998)提出的方法将设置0=0和P0=

I

,这里

为一个任意的大数。如设

=106,然后通过乘以残差协方差矩阵的最大的对角线元素调整P。48(2)如果初始条件的求解是不可能的,状态§1.3状态空间模型超参数的估计

在1.2节讨论利用Kalman滤波递推公式求状态向量的估计量时,假定状态空间模型的系统矩阵Zt,Ht,Tt,Rt和Qt是已知的。但实际上系统矩阵是依赖于一个未知参数的集合,这些未知参数用向量

表示,并被称为超参数。例如,在例1.1的一阶移动平均模型MA(1)中

=(,

2)′,在例1.2的二阶自回归模型AR(2)中

=(

1,

2,

2)′。本节对于状态空间模型的量测方程(1.1)和状态方程(1.3)中含有未知参数的情况,介绍超参数的估计方法。49§1.3状态空间模型超参数的估计在1.

在许多问题中,特别在关于正态分布的各种估计问题中,极大似然法是最常用的方法,这主要表现在极大似然估计量常具有某些优良的性质。这里采用极大似然法估计未知的超参数。极大似然法的原理通常用于观测值y1

,y2

,…,yT相互独立且具有同样分布的情形,此时它们的联合概率函数被给定为

(3.1)其中:P(yt)是第t个观测值的概率密度函数。L(y;

)是样本y1

,y2

,…,yT的联合概率密度函数。一旦得到样本观测值,L(y;

)就可以被解释为似然函数,并且可以通过关于

求偏导数,使函数L(y;

)达到最大来求出

的极大似然估计。50在许多问题中,特别在关于正态分布的各种估计问

然而,经济时间序列的一个重要特征是经济变量间是不独立的,因此不能用式(3.1),而是利用条件概率密度函数代替联合概率密度函数将似然函数表示为

(3.2)其中:P(ytYt-1)表示yt以直到时刻t-1的信息集合为条件的条件分布,即Yt-1={yt-1,yt-2,…,y1},P(

ytYt-1)=P(yty1,…,yt-1)。51然而,经济时间序列的一个重要特征是经济变量间

在总体正态的假定之下,可以将式(3.2)的对数似然函数直接写为

(3.3)其中

(3.4)

由前面2.2节的论述可以知道条件均值是yt的最小均方误差意义的最优估计量(MMSE),所以k1向量vt可以作为一个预测误差向量来解释。因此(3.3)式有时也称为似然函数形式的预测误差分解。52在总体正态的假定之下,可以将式(3.2)的对

极大似然估计量的计算方法有许多种,有解析方法,也有数值解法。设=(1,2,…,n)是待求的未知参数向量,首先求极大似然估计的迭代公式。为求极大似然估计,需要求解

设是超参数向量的精确值,采用Taylor展开式,取一次近似,并设表示参数空间上的任意一点,则可将lnL(y;)/表示成

53极大似然估计量的计算方法有许多种,有解析方法令其为0,可得

于是得到迭代公式其中:l=1,2,…,从某个初始设定的参数值(0)出发,进行迭代过程:(1),

(2),

(3),…

54令其为0,可得54

求(l)

(l=1,2,…),它的收敛值

为所求的极大似然估计。式中对数似然函数的二阶导数矩阵

2lnL/

被称为海塞(Hessian)矩阵,而对数似然函数的一阶导数lnL/

被称为得分向量或Jacobian向量。计算海塞(Hessian)矩阵的逆矩阵,计算量是很大的。计算方法有多种,近似的方法可节省时间但缺少严密性,而严密的方法又有计算时间长的缺点。55求(l)(l=1,2,…),双侧数值微分被定义为:

而单侧数值微分则由下式计算:

这里

logL是似然函数,s充分接近0,上述公式可达到任意精度。双侧导数更加精确,但它要对似然函数进行的计算量大概是单侧导数的两倍,运行时间上也是如此。

56双侧数值微分被定义为:而单侧数值微分则由下式计算:56§1.4EViews软件的相关操作

§1.4.1定义状态空间模型

EViews可以处理大量的单方程和多方程状态空间模型,提供了指定系统方程、协方差矩阵和初始条件控制的详细方法。在定义和估计一个状态空间模型时,第一步是创建一个状态空间对象。从主菜单中选择Objects/NewObject/Sspace,或在命令窗口键入命令sspace。EViews将创建一个状态空间对象,并打开一个空的状态空间说明窗口。57§1.4EViews软件的相关操作57

有两种方法定义一个状态空间模型,最简单的方法就是利用EViews中的“自动指定”功能引导状态空间模型的标准形式。这种方式只需在状态空间过程Procs中选择DefineStateSpace功能,就可以弹出定义对话框,指导创建一个状态空间的过程。描述状态空间模型的更一般方法是使用关键字和文本来描述量测方程、状态方程、误差结构、初始条件和待估参数的初值。下面来介绍描述状态空间对象的一般语法。58有两种方法定义一个状态空间模型,最简单的方法就是利

一、模型指定的语句

1.

量测方程

作为缺省,如果一个方程通过关键字“@SIGNAL”来明确定义,或没有用关键字,EViews将把其作为量测方程处理。要注意以下几点:(1)量测方程的因变量可以包含表达式。(2)量测方程右端中不能包含量测变量的当期和未来值,包括出现在右端表达式的所有变量。在量测方程中任何滞后量测变量都被看作多步向前预测的预测值看待。(3)量测方程必须是同期状态向量的线性方程。状态向量的非线性或存在超前或滞后状态变量将导致错误的信息。(4)量测方程中可以包含外生变量和未知参数,也可以是这些元素的非线性形式。量测方程可以包含误差或误差方差指定的选项,如果方程中不包含误差或误差方差,方程是确定性的。状态空间模型中误差指定的详细内容参看后面的“误差和方差”。59一、模型指定的语句59

例子:

下面是有效的量测方程的定义(注:下面量测方程中的sv1,sv2,sv3,sv4是状态向量)

@signaly=sv1+sv2*x1+sv3*x2+sv4*y(-1)+[var=exp(c(1))]log(p)=sv1+c(1)+c(3)*x+sv2*yz=c(1)+sv1+sv2*x1+sv3*x2+[var=exp(c(2))]

下面是不正确的方程的指定:

@signaly=sv1*sv2*x1+[var=exp(c(1))]log(p)=c(1)+c(3)*x+sv1(-1)z=sv1+sv2*x1+c(3)*z(+1)+c(1)+[var=exp(c(2))]

因为它们至少违背了上面描述条件中的一个条件(其顺序是:状态向量的非线性、状态向量的滞后、量测向量的超前)。60例子:60

2.状态方程

状态方程的定义必须包含关键字“@STATE”,后面跟随一个有效的状态方程。必须注意以下几点:

(1)每一个状态方程必须有一个唯一的因变量名,不允许使用表达式。因为EViews对状态方程不能自动建立工作文件序列。

(2)状态方程中不能包含量测方程的因变量,或因变量的超前和滞后变量。

(3)每一个状态方程必须是状态变量一期滞后的线性方程。如果在状态方程中存在状态变量的非线性关系、同期、超前或多期滞后将产生错误信息。需要强调的是,在状态方程中一期滞后约束条件不是限定的,因为更高阶的滞后被当作新的状态变量。

(4)状态方程中可以包含外生变量和未知参数,可以是它们的非线性形式。在状态方程中还包含误差或误差方差指定选项。如果在方程中不包含误差或误差方差,状态方程被假定为确定的。关于状态空间模型误差结构指定的详细介绍参看后面的“误差和方差”。612.状态方程61

例子:

下面两个状态方程定义了一个服从AR(2)过程的不可观测误差:

@statesv1=c(2)*sv1(-1)+c(3)*sv2(-1)+[var=exp(c(5))]@statesv2=sv1(-1)

第一个关于sv1的方程,根据AR(1)的系数c(2),和AR(2)的系数c(3),确定AR(2)模型的参数。误差方差的指定在方框中给出。sv2的状态方程定义为变量sv1的一步滞后,所以sv2(-1)表示sv1的两步滞后。下面是不正确的状态方程:

@stateexp(sv1)=sv1(-1)+[var=exp(c(3))]@statesv2=log(sv2(-1))+[var=exp(c(3))]@statesv3=c(1)+c(2)*sv3(-2)+[var=exp(c(3))]

因为它们至少违背了上面描述条件中的一个条件(其次序是:状态方程因变量是表示式,状态变量是非线性的,出现状态变量的多期滞后)。

62例子:62

3.误差与方差

在误差项的处理中,状态空间对象方程的指定在某种程度上是唯一的。EViews总是把一个隐含的误差项加到一个方程或系统对象的各个方程中去。但如不特殊指定,状态空间量测或状态方程中不能包含误差项。误差项必须被加到(在方括号中)指定方程的后面。把一个误差项加到状态空间方程中最简单的方法是指定误差项的方差。即加一个误差表达式到已存在的方程中去。误差表达式由关键字“var”和一个赋值语句组成(用方括号括起)。

@signaly=c(1)+sv1+sv2+[var=1]@statesv1=sv1(-1)+[var=exp(c(2))]@statesv2=c(3)+c(4)*sv2(-1)+[var=exp(c(2)*x)]

指定的方差可以是已知常数值,也可以是包含待估计未知参数的表达式。还可以在方差中使用序列表达式建立时变参数模型。633.误差与方差63

这种方差的直接指定方法不允许不同方程的误差之间存在相关关系。作为默认,EViews假定误差项之间的协方差为零。如果指定误差项间存在相关关系,需要使用“命名误差”方法指定它们间的关系。“命名误差”方法包括两部分:

(1)首先,必须通过加一个由关键字“ename”后接等号和变量名的误差表达式为方程中的残差序列命名。

y=c(1)+sv1*x1+[ename=e1]@statesv1=sv1(-1)+[ename=e2]

(2)其次,需要键入由关键字“@evar”后接一个误差的方差或两个误差之间的协方差的赋值语句。

@evarcov(e1,e2)=c(2)@evarvar(e1)=exp(c(3))@evarvar(e2)=exp(c(4))*x64这种方差的直接指定方法不允许不同方程的误差之间存在相

可以在单个状态空间方程中合并命名误差和直接方差表达式:

@statesv1=sv1(-1)+[ename=e1,var=exp(c(3))]@evarcov(e1,e2)=c(4)@evar方程的语句结构可以进行自我辨别。简单的辨别有:该项是方差还是协方差,指定误差,记入方差和协方差的指定。在每一个希望指定的命名误差方差或协方差之间要分行指定。如果误差项被命名,但没有相应的“var=”或@evar说明,分别地,缺少的方差或协方差的默认值为“NA”或“0”。用“ename=”语句定义的误差项只能存在于@evar赋值语句中,而不能直接进入状态或量测方程中。65可以在单个状态空间方程中合并命名误差和直接方差表达式

例zt1模型指定的例子—可变参数的边际消费倾向由于我国经济结构不断发生改变,经济变量影响关系也可能发生改变。例3.9中经过检验发现的确存在显著的结构改变。因此,本例构造消费方程的变参数模型,设cs=CS/CPI,inc=YD/CPI,CS代表名义居民消费,YD代表名义居民可支配收入,CPI代表1978年为1的居民消费价格指数,样本区间为1978~2006年。依据式(4.2)~式(4.4),采用量测方程和状态方程误差协方差g0的模型形式,状态空间模型为:66例zt1模型指定的例子—可变参数的边际消费倾向66

量测方程:

(11.29)

状态方程:

(11.30)

~(11.31)按前面的规则在空白的文本窗口上直接键入如下语句:

@signalcsp=c(1)+sg1*inc+[var=exp(c(2))]@statesg1=c(3)+c(4)*sg1(-1)+[var=exp(c(5))]

paramc(1)449.07c(2)10.02c(3)0.092c(4)0.877c(5)-11.02

其中量测方程中的是c(1),状态方程的一阶自回归的系数0,1是c(3)和c(4),模型的方差u2,2由参数ec(2),ec(5)确定,方差被限制为参数的非负函数,协方差g=0。67量测方程:67

也可以写成下面的形式,当协方差g

0时,要这样写:

@signalcsp=c(1)+sc1*inc+[ename=e1]@statesc1=c(3)+c(4)*sc1(-1)+[ename=e2]@evarvar(e1)=exp(c(2))@evarvar(e2)=exp(c(5))@evarcov(e1,e2)=c(6)

paramc(1)449.07c(2)10.02c(3)0.092c(4)0.877c(5)-11.02c(6)0.668也可以写成下面的形式,当协方差g0

4.指定未知参数(超参数)的初始值协方差

g=0的例子中c(1),c(2)

的初值可以通过建立回归方程:csp=449.07+0.51*inc确定为c(1)=449.07,求方程的残差平方和(RSS/T)作为方差的估计值,其对数为c(2)=log(653539.2/29)=10.02,根据经验,状态方程的初值c(3),c(4),c(5)可先给为0.1,0.9,-9。如果不指定EViews将用系数向量c的当前值初始化所有参数。可以通过指定中使用@PARAM语句来明确指定合适的参数值,例:

paramc(1)449.07c(2)10.02c(3)0.092c(4)0.877c(5)-11.02694.指定未知参数(超参数)的初始值69

5.指定状态向量和方差矩阵的初始条件

缺省时,EViews将自动处置初始条件。对一些平稳模型,其稳定状态条件使我们能够解出0和P0的值。当不能解出初始条件时,EViews将把初始值处理为扩散先验的,设置0=0,给P0一个任意大的正数乘单位矩阵代表其值的不确定性。可能有0和P0的先验信息,这样,可以使用关键字@mprior或@vprior创建一个包含适当值的向量或矩阵。向量对象的长度必须与状态空间的维数相匹配。其元素的顺序要与指定窗口中状态向量的顺序相一致。

@mpriorv1@vpriorm1705.指定状态向量和方差矩阵的初始条件70

例如,假设有一个2个方程的状态空间模型,要设置状态向量与状态向量方差矩阵的初值如下:,(1.32)

首先,创建一个向量对象,命名为a0,输入初始值。再创建一个矩阵对象,命名为P0,输入初始值。然后在编辑状态空间模型指定窗口,可以把下面两行加到状态空间对象中去:

@mpriora0@vpriorp071例如,假设有一个2个方程的状态空间模型,要设

二、自动指定状态空间模型

为了帮助创建一个状态空间模型,EViews提供了一个“自动指定”工具栏,可以在对话框中为模型创建一个文本表示。如果模型是具有固定参数、递归参数、及不同的随机系数,或者误差项有一般ARMA结构的标准回归模型,这个工具是非常有用的。在状态空间过程procs中,选择Procs/DefineStateSpace。EViews将打开一个三标签的对话框。第一个标签对话框BasicRegression被用来描述模型的基本回归部分。键入因变量和带有固定或递归系数的回归变量。在建立指定时EViews使用系数对象代表未知参数。在底部,可以指定误差项一个ARMA结构。在这里,我们为上面的例子指定一个说明。72二、自动指定状态空间模型72

7373

第二个标签对话框StochasticRegressors被用来加带有随机系数的回归变量。在四个编辑区域中键入合适的回归变量。EViews定义具有如下五项组合的回归变量:无系数、固定均值系数、AR(1)系数、随机游动系数、带有漂移的随机游动系数。例zt1是AR(1)系数的形式。74第二个标签对话框StochasticRegres

最后,EViews允许选择状态空间模型的基本方差结构。点击第三个标签对话框VarianceSpecification,为量测方程或状态方程选择方差矩阵类型:单位矩阵(Identity)、共同对角矩阵(CommonDiagonal,对角元素是共同的方差)、一般对角矩阵(Diagonal)、无限制矩阵(Unrestricted)。对话框还允许为量测方程和状态方程选择非零的误差协方差阵。

75最后,EViews允许选择状态空间模型的基

需要强调指出的是,状态空间模型可以不必被对话框提供的选择限制。如果发现自动指定对话框的限制了模型指定,可以简单地使用它建立一个基本的指定,然后利用更一般的文本工具描述模型。7676

三、估计状态空间模型

一旦已经指定了一个状态空间模型,并且验证模型定义是正确的,打开估计对话框估计模型,点击工具菜单的Estimate按钮或者选择Procs/Estimate…。

和其他估计对象一样,EViews允许选择估计样本区间,循环的最大次数,收敛值,估计算法,导数计算设置和是否显示初始值。对大部分问题,缺省设置提供一个好的初始设置。77三、估计状态空间模型77

在进行模型估计时要注意下面两点:

(1)尽管EViews中卡尔曼滤波程序可以自动处理样本中的缺省值,但EViews要求估计样本必须是连续的,连续的观测值之间不能有缺口。

(2)如果模型定义中有未知系数,为用卡尔曼滤波估计状态空间模型,需要指定初值。

78在进行模型估计时要注意下面两点:78

在选择各选项并点击OK以后,EViews在状态空间窗口显示协方差g=0时的估计结果(方程记为ss_g):79在选择各选项并点击OK以后,EViews在状态空间

协方差g

0时的估计结果(方程记为ss_c):80协方差g0时的估计结果(方程记为ss_c):8§4.2

状态空间模型的视窗和过程

EViews提供了一系列专门的工具用来指定和检验状态空间模型。与其他的估计对象相比较,状态空间对象提供了附加的视窗和过程来检验估计结果,处理推断和指定检验,并且提取结果到其他EViews对象中去。81§4.2状态空间模型的视窗和过程81一、视窗(View)

1.模型定义视窗(Specification)状态空间模型是比较复杂的。为了帮助检验模型定义,EViews提供了视窗功能,允许在交互方式下查看模型文本定义,系数和协方差定义。点击View菜单选择Specification…,不管状态空间模型是否被估计,下面的指定窗口都可以被使用。82一、视窗(View)82

(1)文本窗口

这是一个常见的模型指定的文本视窗。当创建或编辑状态空间模型指定时,可以使用这个窗口。文本窗口也可以通过点击状态空间工具栏的Spec按钮进入。

(2)系数描述

状态空间模型指定结构的文本描述。左边的变量yt

和t

被表示为状态向量和残差项的线性函数。矩阵的元素是相应的系数。例如,例1模型的系数描述视图如下:

(3)协方差描述

状态空间模型协方差矩阵的文本描述。例如,例11.3模型有下面的协方差描述视图。

83(1)文本窗口这是一个常见的模型指定

(4)系数值

用当前参数估计的量测方程和状态方程结构的数字描述。如果系统矩阵是时变的,EViews将提示对矩阵估计选择一个日期/观测值。

(5)协方差值

用当前参数估计的状态空间模型指定结构的数值描述。如果系数协方差矩阵是时变参数的,EViews将提示对矩阵估计选择日期/观测值。

2.估计结果(EstimationOutput)还可以点击系统工具条的“Stats”,显示估计结果。

3.梯度视窗(GradientsandDerivatives)

和其他的估计对象视窗相似,如状态空间包含待估参数,该视窗提供了被估计参数(已估计)的对数似然估计的梯度的简要可视信息或当期参数值。84(4)系数值用当前参数估计的量测方程

4.实际值、拟合值和残差(Actual,Predicted,ResidualGraph)用图表的方式显示量测方程因变量实际值yt

和一步向前拟合值,和一步向前标准残差。

5.估计系数协方差矩阵(CoefficientCovarianceMatrix)

6.Wald检验(WaldCoefficientTests)

允许做估计系数的假设检验。

7.Label视窗

允许为状态空间对象做注释。注意,除了Label和模型定义(Specificatio

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论