版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、贝叶斯向量自回归模型(BVAR)简介一、贝叶斯方法原理简介§1贝叶斯方法起源英国学者T.贝叶斯1763年在论有关机遇问题的求解中提出一种归纳推理的理论,后 被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法。采用这种方法作统计推断所得的全部结果,构成贝叶斯统计的内容。认为贝叶斯方法是唯一合理的统计推断方法的 统计学者,组成数理统计学中的贝叶斯学派,其形成可追溯到20世纪30年代。到5060年代,已发展为一个有影响的学派。时至今日,其影响日益扩大。§2贝叶斯定理及其特点记p(y, 8)为一个随机观察向量 y的联合概率密度函数,。为一个参数向量,它也看成是(1.2.1)
2、随机的。根据通常对概率密度的运算有:p(y, 0) p(y|8)p(。) p(8|y)p(y)因而(1.2.2)其中p(y) 0。将上式表达如下:p( 9|y)p(9)p(y| 9)先验概率密度似然函数(1.2.3)其中 表示成比例,p( 8|y)是在给定样本信息y后,参数向量。的后验概率密度,p(8)是参数向量。的先验概率密度,p(y| 8)看作。的函数,就是熟知的似然函数。式(1.2.3)将所有的先验的、样本的信息融入其中,先验信息通过先验密度进入后验密度,而所有的样本信息通过似然函数进入。贝叶斯推断的一般模式:先验信息样本信息后验信息(见图1)图1贝叶斯推断的基本模式贝叶斯学派认为,先验
3、分布反映了实验前对总体分布的认识,在获得样本信息后, 人们对这个认识有了改变,其结果就反映在后验分布中,即后验分布综合了参数先验分布和样本信 息。由此可以看出,频率学派统计推断是“从无到有”的过程:在实验前,关于未知参数的情况是一无所知,而试验后则有些了解,但对了解多少并无普遍的表述方法,在实践中有赖于所使用的统计量的针对性。贝叶斯推断则不然,它是一个“从有到有”的过程,且结果清 楚自然,符合人们的思维习惯。根据所获得的信息修正以前的看法,不一定从零开始。从本质上说,贝叶斯推断方法概括了一般人的学习过程。贝叶斯方法只能基于参数的后验分布来分析问题。也就是说,在获得后验分布后,如果把样本、原来的
4、统计模型(包括总体分布和先验分布)都丢掉,一点也不会影响将来的统计推断问题,凡是符合这个准则的推断就是贝叶斯推断。据此,频率学派中的矩估计、显著性统计检验和置信区间估计都不属于贝叶斯推断的范畴,但MLE估计则可视为均匀先验分布下的贝叶斯估计。因此,作为频率学派中一个很重要的极大似然估计,不过是在一种很特殊的先验分布下的贝叶斯估计而已。 陵先验分布理论式(1.2.3)中p( 8)表示的先验概率密度代表了我们对于一个模型中参数的先验信息,是一个事前的自觉的认识(分“基于数据”的先验和“非基于数据”的先验),即在贝叶斯方法中,关于模型参数的先验信息。 先验分布是贝叶斯推断理论的基础和出发点,它大体上
5、可以分为扩散先验分布和共轲先验分布两大类。§3.1 扩散先验分布3.1.1 位置参数的扩散先验分布如果随机变量Y的分布密度函数为 f(y ), ,则称为位置参数。假设没有信息可以被利用,现在要确定的先验分布。如果将随机变量Y做平移变换,Z Y a,同时对位置参数也做同样的平移变换a,则Z的分布密度函数为 f(z ), ,显然(Y,)与亿,)有相同的统计结构,从而 和 有相同的先验分布 p(g)和概率空间。由 Radom-Nikodym定理有p( ) p( a),(1.3.1)取 a ,可以得到p( ) const,从而位置参数的扩散先验分布为P( ) 1,(1.3.2)对于正态分布
6、N( , o) ,0已知,此时是位置参数,利用上述结论,参数的扩散先验分布为p( ) 1, R(1.3.3)3.1.2 尺度参数的扩散先验分布如果随机变量Y的密度函数的形式为 -f -y ,0 ,则称 为尺度参数。如果改变尺1 z度单位,令Z aY, a ,0,易知Z的分布密度函数为 1 f -;同样地,(Y,)与(Z,)有相同的统计结构,有相同的先验分布p(g),由Radom-Nikodym 定理,对于尺度参数 ,在无先验信息可利用时,尺度参数的先验密度函数,p()可取做,、1Cp( ) 一,0(1.3.4)对于正态分布 N( 0, 2) ,0已知, 0|未知,此时标准差|是尺度参数,利用上
7、述结论,参数| |的扩散先验分布为,、1Cp( ),0(1.3.5)§3.2共轲先验分布共轲分布是贝叶斯分析中常见的另一类参数先验分布,其思想基础是先验的规律和后验的规律具有一致性,这一要求的具体化就是先验分布和后验分布要属于同一类分布族。对于每个具体的分布来说,都有其共轲分布,下面利用似然函数的因子分解式和充分统计量等分析 方法来构造所需的共辗先验分布。定理3.2.1假设Y1,M,L ,Yn是来自分布密度函数为f(y| )的总体的一个样本,tn t(Y1,Y2,L ,Yn)是参数 的充分统计量,即似然函数可做下面分解:nL( ) f( |Y) gn(tn, )h(Y,L ,Yn)(
8、1.3.6)i 1其中h(Y,Y2,L ,Yn)与参数 无关。如果存在函数 p(),它满足如下两个条件:(1) p( ) 0,;(2) gn(tn, )P( )d 有限,则 r、4三龙(8)|虫。)=75-x1t必力)I g式。)L* ®j为参数的共轲分布族。这里只介绍共轲先验分布的具体定义,有关它的相关结论见参考文献2。§4贝叶斯方法的优点贝叶斯理论的哲理有很大的吸引力,并且方法简单,它在统计推断模式上与频率学派的不同之处在于:频率学派认为,似然函数概括了有关参数的全部信息,因此关于参数8的统计推断只要利用似然函数就够了;而贝叶斯方法既利用了似然函数,又利用了参数先验信息
9、。如果先验信息很少或者没有先验信息,这时贝叶斯推断方法所得到的结论与频率方法基本相同。与频率方法比较,贝叶斯方法有以下几方面优点:贝叶斯方法充分利用了样本信息和参数的先验信息,在进行参数估计时, 通常贝叶斯估计量具有更小的方差或平方误差,能得到更精确的预测结果;贝叶斯HPD置信区间(最高后验概率密度区间)比不考虑参数先验信息的频率置信区间短;能对假设检验或估计问题所做出的判断结果进行量化评价,而不是频率统计理论中的接受、拒绝的简单判断。二、贝叶斯向量自回归模型(BVAR)在变量较多,滞后阶数较高时,即所要估计的参数较多的情况下,Bayesian估计方法提供了一个较好的方法,拟合效果要比传统的极
10、大似然估计方法好。§1贝叶斯非限制性 VAR模型如果令yt A(yit,y2t,L , ymt)T表示|m个变量在t点处的取值,则向量序列y 的滞后阶数为p的非限制性VAR( p)模型可以表示为yt c Aiyt 1 A2yt 2 L A pyt p Ut,t 1,2L ,n(2.1.1)此处c是一个m维向量,Aj, j 1,2L ,m均为m m的系数矩阵,向量 Ut是一个m维白噪声向量,即ut i.i.d.Nm(0r),t 1,2L ,n而、是一个m m正定阵向量。易知非限制性 VAR( p)模型中的每个方程的解释变量是相同的。可以将(2.1.1)化成多方程模型系统形式yt BTZ
11、t Ut,t 1,2L ,n(2.1.2)其中AT1ATyt1zyt 2MAcytnp (mp 1) m1ytp(mp 1) 1进一步,若将向量yt,BTzt和Ut,t 1,2,L ,n的转置分别按行依次排列,各自形成一个n m矩阵,则上述n个方程可以简化为一个更为紧凑的矩阵表达形式Y ZB U,U-Nnm(0,、 In)(2.1.3)其中特别地,对于扩散先验分布,非限制性VAR( p)模型参数的后验分布有如下结论:定理1.1在扩散先3分布(B,方|耳(m1)/2下,非限制性VAR( p)模型参数的后验分布为(B|Y,Z)Mtkm(?,ZTZ,S,n k),( 2|Y,Z)IWm(S,n m)
12、,k mp 1(2.1.4)其中B (ZTZ) 1ZTY,S YTIm (ZTZ) 1ZTY立贝叶斯限制性VAR模型在VAR( P)模型中,模型系数B可能受到某些条件的限制,如各方程中解释变量并不完全相同,某些变量可能在部分方程中出现,但并不出现在其他方程中;或者,部分方程中有线性趋势项或季节变量,而其他方程不包含这些变量。根据Zeller的观点,在一般排斥性限制条件下,(2.1.1)式中的VAR( p)模型模型能够写成如下似不相关模型:Y 咎 i i,i 1,2,L ,m(2.2.1)此处Y是由第i个变量n个观测值构成的n维向量,Z%是第i个变量单方程模型的n ki设计矩阵,它由变量 y1,
13、y2,L ,ym的部分滞后项组成;i是第i个变量单方程模型的 ki维系数向量,i是门维正态随机误差向量。若将这个方程写成一个矩阵形式,则有Y 矛。,Nmn(0,、In)(2.2.2)其中Y1於0L01丫2Y,2 ,必0的L0,2MMMMMMYmm00LZmm由于这一情形不作为我们研究的重点,所以这一部分的相关结论暂时省去,详见参考文献3。迷共轲先验分布下VAR模型的贝叶斯分析对于一般共轲分布而言,由于超参数太多,VAR( p)模型的贝叶斯推断只具有理论上的意义,而不能应用于实际预测分析中,本节研究一类特殊的参数共轲先验分布:Minnesota共轲先验分布下VAR( p)模型的贝叶斯分析理论。M
14、innesota 先验分布是Litterman 于1986年提出来的,它主要用于解决共轲先验分布下 贝叶斯VAR( p)模型中超参数过多问题,提高模型的预测精度。迷.1 Minnesota先验分布如果(2.1.1)式的VAR( p)模型不含常数项,则模型中的具体方程如下:m pyit(2.3.1)ajryjt r Uit,i 1,2,L ,m;t 1,2,L ,n.显然ajr表示第i个方程中变量yj的r阶滞后项yj r的系数,如果随机参数aijr服从均值为ijr、方差为Sij;的正态分布,此时模型(2.3.1)中参数先验分布中需要确定的超参数至少有2m2p个:m2 p个先验均值ijr和m2 p
15、个先验方差S;。如果不考虑先验信息的可取性,在一般情况下要合理地给定这2m2p个超参数的取值是相当复杂和困难的,因此,必须想办法减少需要赋值的超参数的数量,确定超参数的合理取值,提高模型的预测能力。Minnesota先验分布就是解决这一问题的有效方法,它的基本假定包括以下几个方面:(1)正态性”(Ui,U2,L Um) Nm(0,力;(2)协方差阵、和系数ajr,i 1,2,L ,m,r 1,2,L , p相互独立;(3)协方差阵、的模型先验分布取为扩散先验分布,即(m 1)/23 |斗 ,2 0(2.3.2)(4) ajr相互独立服从正态分布N( ijr ,Sr ) ,ijr表示参数ajr的
16、最佳猜测值,而S2反 映了对这个猜测的信心,其取值越小表示对此猜测的信心越大;(5)均值ijr按照下述公式确定:(2.3.3)1,i j,r 1,ijr0,其他情况,即方程左边的变量只由其系数为1的滞后一阶变量表示;(6)标准差Sjr可以分解为4个因子的乘积,即SiSjrg(r) f (i, J) (2.3.4)Sj此处 是总体紧度,它的取值大小反映了分析人员对先验信息的信心大小程度,较小的 值代表了对先验信息的较大把握;g(r)是r阶滞后变量相对一阶变量的紧度,它表示过去信息比当前信息有用程度的减少;函数f (i, j)是第i个方程中第j个变量相对于第i个变量的紧度,s是变量v的单变量自回归
17、模型的标准差。洽.2滞后延迟函数在Minnesota先验分布中,滞后延迟函数g(r)的选择必须能反映这样一个基本信念:随着滞后长度的增加,滞后变量的系数趋向于零;据此这里使用Doan推荐的调和滞后延迟函数,形式如下:,、 d , 八g(r) r ,d 0(2.3.5)§3.3相对紧度函数.、 一 .一 .2,.2_2 .一、在确定r和g(r)后,先验分布中超参数数量已经从m p减少到m 2: m个相对紧度函数f (i, j),以及r和g(r);若进一步选择合适的f (i, j),则先验分布中参数个数可大为减少。显然,f(i,j)可以看做一个 m m矩阵F A(f(i,j)mm的(i,
18、 j)处的元素,如果f(i, j)取如下形式的函数:(2.3.6)1,i j f(i, j) . Wij ,ij其中Wj是一个介于0 1的常数,它的取值大小反映了第i个方程中其他变量(不包括 x及其滞后变量)的相对紧度。如果对所有的i j,均有wj,一2,w成立,则m个参数f (i, j)的选取问题转化为确定一个超参数 W的大小。迷.4标准差之比S / Sj的涵义在Minnesota先验分布的基本假设(6)中,Si / Sj是第i个序列 yit的自回归残差标准差与第j个序列yjt自回归残差标准差之比,Si由 yit对常数项和其p阶滞后项的 OLS回归的残差标准差得到。比例 s/q主要用于反应:
19、先验分布的设定必须考虑实际的样本数 据信息。以上是Minnesota先验分布的基本含义及其参数设定问题的研究,为使上述描述更直观,这里以一个滞后长度为2阶的双变量VAR( 2)模型加以说明,该模型系数的 Minnesota先验分布为% =+ "UJ /JT + 口心 y-2 + «1i的降¥3碧)Hr -/十力4 yij-2 + /NJ* 口工工2 >2j-2 + u2tfo f 与、I" JUM(2.3.7)括号内的第一项为先验分布的均值,第二项为先验分布的方差。§3.5模型参数的后验估计如果将限制性VAR(p)模型转化成如卜形式不相关
20、模型:匕=2坦+与.i = 1,2.用然后再写成(2.2.2)的形式Y Z% , Nmn(0, In)井将模型参数的Minnesota先验分布筒记为此处局的分量为。或L而协方差阵是由门块对的降构成的.其中的每一个时角阵的元素由S组成,非对角块元素均为零的矩阵.根据贝叶斯定理,在上述Minnesota先验分布下.参数(良£)的联合后脸分 布密度函数为河区工厅,办7r:卬卜夕。2#)t®,4均)丁川(。一川“0cGP卜会力-瓦 V 皿-瓦)一片节”瓦1其中南=yT2,E®-外 知显然,村干给定的协方差阵E.系数矩阵A的条件后鼎分布是均值为08,协方 差阵为吠的多元正态
21、分布,即(0£,.2人“优,V)在实际应用中,先求出工的ML估计£ = s/ntS-/Zm -右 2z2%揩其替代06中的怖方差阵E进行颈测分析.§3.6 模型预测结果及其精度预测在获得模型参数的估计用,叫以利用与叶斯VAR(p)模型对其进行预潮分 析,具体预薄步黑AR模型和VAR模型的演测蚱骤基本一致,可以是一步超前 (one step ahead)也测、两步超前fftSHlwo steps曲ead)或多步超前(却cral steps ahead)粮测,模型模溺的精度可以从多个方面进行评价,如绝对均方误差、平均绝对谟差 百分比.此处我们利用Theil的U统计带来
22、分析贝叶斯VAR刎模型的预测精攫. U货计量是基于所研究的预测模型的均方根谟车与热于随机游走(random walk)ffl 剿模型的均方根误差之比.即其中4表示时间序列在,处的实后值,尸风收示基于预测方法的的博测值,而 相好,是基f随机源走模型的预测值.如果U的取值等于1.0,则说明方法M的 澳测精度与随机游走模型的颊测精度基本相同;如果U的取值小于L0,则说明 方法”的预测精度比随机擀走模板的预测精度更高;如果U的取值大于I。则 说明方法M的超测精度比随机游走模型的葩利精度低.此时该方法不能提高时间 序列的璇测精度,从而也就不适合于预测用途.§3.7 具体数值算例作为上述方法的应
23、用,对美弧,英国、法国、德国,加拿大、意大利和日本 等西h七国集团的GDP增长率1词、通货膨胀格(%)和进出口总赧(b$J的数据分 别建O.AR模型、VAR模型和贝叶斯VAR模型,比较这三类模型的预测精觉首先,根据美国Estima公司提供的时间序列数据,利用 Sims似然比检验量确定模型的最优滞后阶数,模型 VAR( p1)对模型VAR( p2)的似然比检验统计量为=内)(加1耳,11口 14,1) , PV<P2此处0 耳1分别是模型VAR3)和VARSA的残差办方差阵,N是样本大小. 府是修正因子项,它等于VARS)模型中回妇因子的个数.表641列出了 VAR 模型滞后3阶对滞后5阶
24、的假设检验结果,检验结果有利于较短的滞后物数.而 在滞后3阶对滞后4阶的钗设检验,校验结果有利于3藉后阶数,因此瑞定VAR 模型的之后阶数为工表1.模型最优滞后阶数的 LR检验结果HjiH/ p,3+ Hj/“4LR率LA做事GDPif K0 2JIJQ570 002通境曲就9210-123M920 000进出口总膜11560M6D.470.019然后,选择贝叶斯 VAR模型中3个超参数,衰减参数(d)、总体紧度(r)和相对紧度(w), 此处考虑超参数的三种组合情况(表 2),并将相应的贝叶斯 VAR模型分另IJ记为 BVAR1、 BVAR2 和 BVAR3.表2.模型超参数的选择dr*HVA
25、Rr1.004Q3hvar:IjD03Cli4BVARJ1.0020.6利用RATS5.0软件和1963:1992:4的数据对AR模型.VAR模型和贝时斯 VAR*)摸型进行估计,并对1993:1-1998:4进行1步超前至8步超前便测,并计 算【步超前预测至4步超前预测,5步超前颤制至8步超前预测的平均泰尔U统统计值,有关结果列于表 3和表4.表3.14步超前预测的平均西尔U统计值(1993:11998:4)黄国修聃口率平均GTW增氏率AR0 711OS39口210.7400AU0 86607MO.TfiVAR0.83201740.6490.8J6O.72t0 8820345氏73hvari
26、O65fl0 62206130.6920,5010 7310.383HVAF2O.55flO.T6903诔0.6200433O.HU。例nrmBVARJ0.51507400.6010.7100.568o.m04360,624通货加器率aR06J705MOBIV0.652Q.7960.602aeoVARn MQ。网U86A0,7060-7760 5720 6fi«0.66$BVARI0 S260怫。制70.6390.732Ei 5T2OMVlBVAS20.4450D708O.6J8。句0.6290 6W0.5930 4490.5170.8T30.6370.6020 5950 6W拼册口
27、AR0S:90 B8O0W3O86Roe%0 7?00 7480.818VAROM?OMfl0.M70.627QM0.7470.791tlVAfl 10投f0.4730 6M070n,qi0 5270 718OjMBVAR2H 4X704?l0S7S0 62THVAH3Q81S0.4V906900.743u.M20518OJ85064)表4. 58步超前预测的平均西尔U统计彳1 ( 1993:11998:4)黄国地同意大利加掌大平均GDP增忙率AR。晓0.9510510.的flC.7IJ0.757D.*J5VAR0.815fl口多20C6270557RVARI04Inm0如0 &36Q.IUV。川】。制m0.747BVAR2DS42o. sotn.iu0 5S70 542口一抬*BVAR30.737O.K600 77506”0.452G4M。.枷0.644通货器率AA伍川269门O.S350.K540K2O0 84VAR0.7OT0一吟07g47930 75«BVAR1(15 Wa 4550
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论