时间序列分析方法第05章最大似然估计.doc_第1页
时间序列分析方法第05章最大似然估计.doc_第2页
时间序列分析方法第05章最大似然估计.doc_第3页
时间序列分析方法第05章最大似然估计.doc_第4页
时间序列分析方法第05章最大似然估计.doc_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章 最大似然估计在本章中我们开始讨论时间序列模型的参数估计方法,其中极大似然估计是一种最为常用的参数估计方法。我们仅仅讨论极大似然估计的原理和似然函数的推导,而对获取极大似然估计的算法不加以详述。5.1 引 言5.1.1 ARMA模型的极大似然估计假设数据的真实生成过程是一个过程,则该过程的数据生成机制为:其中是白噪声序列,满足:我们将要讨论如何利用的观测值来估计母体参数:我们将要采用的方法是极大似然估计方法,因此需要获得似然函数的表达式。假设获得了个样本,如果能够计算出相应的联合概率密度函数:上述函数可以视为在给定参数下样本发生的概率,因此合理的参数取值是使得上述概率最大,如此参数便称为极大似然估计。这时我们需要极大化上述联合概率密度。为此,我们假设噪声序列是高斯白噪声序列,即虽然这个假设非常强,但是在这样假设下得到的参数估计,对于非Gauss过程来说也是很有意义的。具体求解极大似然估计的步骤是:一是先求出并计算似然函数,二是求似然函数的最大值。这里涉及到一些代表性的非线性数值优化问题。5.2 高斯过程的似然函数假设数据生成过程是一个具有高斯白噪声序列的过程:这时对应的参数向量为:。我们首先寻求联合概率分布函数,也就是这些参数对应的似然函数。(1) 求上述过程似然函数的代表性过程是利用条件概率密度进行传递,所以需要先求出的概率密度。它的均值和方差为:,由于它具有正态分析,因此对应的密度函数为:(2) 在给定的条件下,的条件概率分布可以得到:对应的概率密度函数为: (3) 类似地,在给定前两个观测值的条件,的条件概率密度函数为:注意到上述条件概率分布中只依赖一阶滞后的条件观测值。(4) 最后一个样本的条件概率分布为:注意到上述条件概率分布中也只依赖一阶滞后的条件观测值。(5) 根据无条件密度函数与条件密度函数之间的关系,可以得到:经常对上述函数取对数,得到对数似然函数:(6) 将具体的密度函数代入上式,可以得到过程的似然函数为:可以将上述似然函数表示为更为紧凑的向量和矩阵形式。令均值向量和自协方差为和,注意到过程之间具有的自协方差函数表达形式,则有:,这样一来,所观测到的样本可以当作多元正态母体的一个简单抽样,具有的联合概率密度函数为:理论上可以对上述极大似然函数求导数,然后获得参数估计。但是,一般情况下的导数方程是非线性方程,难以获得精确的最大值估计。一种近似的方法是假设第一个观测值是确定性的,然后求解给定时的条件似然函数值,这时的目标函数是:上式最大值相当于求下式的最小值:上式的最小值就是线性回归的最小二乘估计,满足方程:类似地,噪声的方差为:当样本容量足够大时,可以证明上述近似或者条件极大似然估计具有与精确极大似然估计一致的极限分布。5.3 高斯过程的似然函数对于一般的高阶自回归过程:,此时所要估计的总体参数向量是:。(1) 似然函数的估值 Evaluating the Likelihood Function假设我们获得了个来自过程的样本,假设前个样本表示为可以将这个向量当作维Gauss变量的一个样本。这个向量的均值表示为,它的每个分量都是:假设是的协方差矩阵,则有:对于一阶自回归过程而言(),上述矩阵是一个标量,;对于阶自回归而言:这里是过程的第个自协方差,可以按照以前的介绍公式计算。由于自回归过程的条件相依性具有截断性质,因此我们将样本分为p个一组,样本中前个观测值的联合概率分布为,密度为:对于样本中剩余的观测值,我们可以使用推断误差分解(prediction error decomposition),将前个观测值作为条件,则第个观测值的条件分布为Gauss分布,且均值和方差分别为:,只有个最近的观测值与这个分布有关,因此,对于,则有:因此,整个样本的似然函数为: 则对数似然函数形式为:为了获得上述似然函数值,我们需要获得逆矩阵,为此我们有下述命题:命题5.1 利用表示矩阵的第位置的元素,则对任意,有:这里。证明:略。 End因为是对角矩阵,因此也可以得到时的元素。例如,对过程而言,是一个标量,取,得到:因此有:因此命题5.1确实可以重新得到过程的方差表达式。对于的情形,利用命题5.1可以得到:可以计算行列式值为:并且有:因此,对于Gauss条件下的过程,确切的似然函数为:这里:(2) 条件极大似然估计 Conditional Maximum Likelihood Estimates由于目标函数形式比较复杂,因此对过程的确切极大化必须使用数值算法。与此对应,以前个样本为条件的对数似然函数具有下述简单形式:注意到,极大化上式的参数与极小化下式的参数选择是一致的:因此这些参数的条件极大似然估计是基于常数和自身滞后值的普通最小二乘回归估计,的条件极大似然估计是这个回归方程平方残差的平均值:显然上述条件似然函数与确切似然函数相比,缺少了初始样本的母体分布,这样就降低了样本发生的似然性,这就是条件似然函数与确切似然函数的差异。类似地,确切的极大似然估计和条件极大似然估计能够得到相同的大样本分布。(3) 非Gauss分布时间序列的极大似然估计 Maximum Likelihood Estimation for Non-Gaussian Time Series根据线性回归模型的性质,如果假设随机过程关于二阶矩是遍历的,则我们知道普通最小二乘估计也是下面线性投影系数的一致估计(consistent estimate):同时这个OLS估计也使得Gauss条件似然函数达到最大。因此,即使一个过程不是Gauss过程,但是我们错误地将它当作Gauss过程,并且极大化它的似然函数,则得到参数估计仍然是母体参数的一致估计。一个从错误指定的似然函数中获得的极大似然估计(例如,当真实过程不是Gauss过程,而从Gauss过程假设下获得的MLE)被称为“伪极大似然估计”(quasi-maximum likelihood estimate)。但是,有些时候,例如上述提到的情形,“伪极大似然估计”能够为人们感兴趣的参数提供一致估计。但是,如果真实数据不是服从Gauss过程的,在Gauss假设下获得参数估计的标准差则是不正确的,它不具有估计的一致性。另外,如果原始数据不是服从Gauss过程的,有时通过简单的变化,例如取对数等,可以获得Gauss分布过程。对于一个正的随机变量,Box and Cox (1964)提出了一类比较一般的函数变换:一种方法是,选取特殊的,在是高斯ARMA过程的假设下极大化的似然函数,这时能够使得似然函数取最大值的被认为是最合适的变换选择。但是,也有一些研究者对这种方法在实用中的效果提出了质疑。5.4 高斯过程的似然函数利用类似自回归过程似然函数的推导方法,我们开始类似地讨论移动平均过程的极大似然估计问题。5.4.1 条件似然函数 Conditional Likelihood Function如果基于Y的初始值,则自回归过程的条件似然函数计算是相当简单的。类似地,如果利用初始的作为条件,移动平均过程的似然函数计算也是比较简单的。考虑一个高斯过程:,利用参数向量表示母体参数,如果的数值是确定可知的,则:表示成为密度函数情形为:假设我们确定性地已知,并且获得观测值,则下一个阶段的误差也是确定性已知的,可以确定为:利用上述条件概率分布公式得到:由于是确定性可知的,可以按照下式计算:因此,已知初值,可以利用叠代方式从样本中获得误差序列:,则条件概率分布为:则联合概率分布可以通过单独的条件概率密度的乘积得到:则条件对数似然函数为:虽然上述函数比较简单,但由于是参数的非线性函数,无法直接利用解析方法获得参数的极大似然估计。因此,即使是1阶移动平均过程,条件极大似然估计也需要利用数值优化方法求解。从任意初始误差开始叠代,可以得到: 如果显著地比1小,则附加初始条件带来的影响将快速地消失,则当样本数量比较大的时候,条件似然函数是无条件似然函数比较好的近似。相反地,如果,则附加带来的结果将随着时间而累积,在这种情形下条件概率方式不是很好的近似方法。这时如果数值方法模拟的结果是,则需要放弃这样的估计结果。这是需要利用的倒数作为初值重新进行条件似然估计的数值计算。5.4.2 确切似然函数 Exact Likelihood Function对于高斯过程,有两种比较合适的算法来计算确切似然函数。一种是使用后面介绍的卡尔曼滤波方法,另一种是方差或协方差矩阵的三角因子分解。下面我们开始介绍矩阵的三角因子分解方法。假设样本观测值可以利用矩阵表示:,这个向量具有均值为和的方差协方差矩阵:从高斯过程中获取样本的方差协方差矩阵为:则联合分布表示的似然函数是:似然性的推断误差分解可以从下面矩阵的三角因子化中获得:这里的矩阵是下面形式的下三角矩阵:矩阵是下述形式的对角矩阵将一个对角矩阵表示成为下三角矩阵的对角化,称为一个矩阵的三角因子化。将这样的矩阵分解带入到似然函数中,得到:注意到矩阵是主对角线都是1的下三角矩阵,因此它的行列式为,这时有:进一步定义:则似然函数可以表示成为:注意到变换形式也可以表示为:这个系统的第一行表明,而第t行意味着:因此向量可以从开始,利用上式进行叠代得到,。变量可以解释为基于常数和的线性投影,而矩阵的第个对角元素是这个线性投影的MSE:由于矩阵是对角矩阵,其行列式是对角元素的乘积:而矩阵可以利用矩阵的主对角线元素取倒数得到。因此:这样一来,似然函数可以简化为:因此,高斯过程的确切对数似然函数为:如果给定参数的初始数值,可以利用叠代方法计算上述似然函数。这样的计算可以对尝试参数的优劣进行比较。与条件似然函数不同的是,上述似然函数的表达式对任何参数都是有效的,而不取决于是否该过程具有可逆表示。5.5 高斯过程的似然函数在讨论了一阶移动平均过程似然函数的基础上,我们继续讨论过程的极大似然估计问题。5.5.1 高斯过程的条件似然函数 Conditional Likelihood Function考虑一个高斯过程:,此时一个简单方法是考虑给定前个初值的条件似然函数,假设初值为:利用这些初值,我们对时刻,利用下式进行叠代:利用向量表示向量,则条件对数似然函数为:这里的参数向量为:。与1阶情形类似,这里要求下述特征方程的根落在单位圆外面:上述条件是要求移动平均过程是可逆的,这时条件似然函数的参数估计对误差初值的选取没有严重的依赖性。5.5.2 高斯过程的确切似然函数 Exact Likelihood Function由于高斯过程的联合分布是多元正态概率分布,因此高斯过程的确切似然函数可以表示为:这里的样本为,均值为,的方差协方差矩阵为:上述矩阵中的元素为:这里是过程的k阶自协方差函数:,与一阶情形是一样的,确切似然函数可以通过卡尔曼滤波或者矩阵的三角因子化获得。仍然考虑三角因子化,这时矩阵可以分解为:这里的矩阵是下三角矩阵,矩阵是对角矩阵,它们具有前面介绍预测时的表达式类似。进一步分析可以发现,由于矩阵具有的特殊谱结构,矩阵具有性质:对于,。对数给定的数值参数,计算机程序可以十分容易地获得这些矩阵的数值。将这样的矩阵分解带入到过程的似然函数中,得到:这里:,的元素可以叠代计算如下:,因此,高斯过程的确切对数似然函数为:给定参数数值,可以计算上述似然函数的函数值。但是,给定样本,计算上述函数的极大值的非线性优化过程却是比较复杂的。5.6 高斯过程的似然函数将自回归过程和移动平均过程的方法结合起来,就可以讨论移动平均过程的条件似然函数和确切似然函数问题。5.6.1 条件似然函数 Conditional Likelihood Function考虑一个高斯过程:,我们的目标是估计母体参数向量。此时,对自回归部分条件似然函数的近似依赖于初始的,对移动平均部分条件似然函数的近似依

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论