整理ARMA算法整理_第1页
整理ARMA算法整理_第2页
整理ARMA算法整理_第3页
整理ARMA算法整理_第4页
整理ARMA算法整理_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精品文档信息通信网络时序指标动态阈值选取方法研究整篇文章分为三部分,第一部分是点预测,第二部分是阈值d的 选取,第三部分是结合两者进行区间预测。其中第一部分是重点,分 为两个小部分,分别为前期预处理检验和模型建立, 模型建立部分又 分别由6个小部分组成。一、建立模型进行中心点预测 思路:根据给出的数据序列,利用自相关系数,偏相关系数的性质,选择合适的模型进行模拟,如AR模型(AR(p) , MA模型(MA(q),ARMA模型(ARMA(p , q),并确定它们的阶数。然后估计模型中 未知参数的值,并利用 AIC准则来进行模型优化,从而可以对未来 数据进行预测。X =务+电%二十%Xt/ +十+

2、解注:AR(p)定义:F-02E(;t)=0,Var(;t)=;T,E(;)=0,s = tE(Xs;t)=0s t-l-xt =,;t - ?1 ;t一 - 2 ;tW -,q ;t vMA(q)定义:4=0一,、一,、2 -,、 一E(1)=0,Var(4)=o&E(驾 4) =0,s#tK =% +七2+%4+.一十与4邛+即一日1蜀一弟A R M(A,q)定义:Jp#0, #0E(;t) =0,Var(;t)=:E(;t ;s) = 0,s=tE(Xs;t)=0s t建模:.前提准备得到数据之后(比如移动公司一个月的通话时长记录),我们要 对数据进行一个预处理,判定给出的数据满足为平稳

3、非白噪声序列,精品文档精品文档才可以利用上述几种模型对该数据序列进行建模。(这是一个前提条件,所以,这就要求我们在选取数据时要有意识的控制)(1)平稳性检验这里我们利用时序图检验的方法进行平稳性检验。所谓时序图, 就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。 平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波 动,而且波动的范围有界的特点。如果观察序列的时序图显示出明显 的趋势性或周期性,那它通常不是平稳序列。这样,我们根据时序图 就可以判断是否是平稳的。12000.0010000.006000,00-A 6000.004000.002000 .ao-0QJA-1 22

4、1_LK.19J心.17 ,.2一15-1213 -1H11-1.2.9A 27-123 ,2_1KJ 3(2)纯随机性检验纯随机性序列:如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的序列,过去的行为对将来的发展没有丝毫影精品文档精品文档响,这种序列称之为纯随机序列。白噪声序列是典型的纯随机序列。这里我们要验证我们所要研究的数据序列不是纯随机序列,即过去的值对现在有影响,才能建立 ARMAI型,从而进行预测。方法:利用LB统计量LB=n(n+2) (-),式中n为序列观测期数,m为指定延迟期数,f?k kjn-k,为自相关系数(当前x与k期前x的相关系数)。且 m 92LB

5、=n(n+2) (J),工2(m)。一般只要计算出来延迟6期和延迟12期 k 4 n k的LB及所对应的P值就可以判断序列的随机性。如果计算结果 P值 很小,基本上以0.05为标准,只要小于0.05即可断定该序列不是纯 随机序列,属于非白噪声序列。其中P值计算方法:k自由度的*(k)函数的密度函数为1k-x2* 2, xFt一1 八 ,、,一,,f(x)422 r(k/),对f(x)进行积分,代入之前计算的LB计0,其他LB算值,付到 p =1 - 0 f (x)dx o.建模步骤假如我们的观察值序列通过序列预处理, 可以判定为平稳非白噪 声序列,那么我们就可以利用模型对该序列建模。建模的基本

6、步骤如 图所示:(1)求出该观察值序列的样本自相关系数 (ACF和样本偏自相关系 数(PACF的值。(2)根据样本自相关系数和偏自相关系数的性质,选择阶数适当的精品文档精品文档ARMA(p, q)模型进行拟合,即确定p,q的值。(3)估计模型中未知参数的值。(4)检验模型的有效性。如果拟合模型通不过检验,专享步骤(2), 重新选择模型再拟合。(5)模型优化。充分考虑各种可能,建立多个拟合模型,从所有通 过检验的拟合模型中选择最优模型。(6)利用拟合模型,预测序列的将来走势。平稳,非白噪声序列计算样本自相关系数(ACF3和偏自相关系数(PACFARMAI型识别估计模型中未知参数的值模型优化精品文

7、档精品文档预测序列将来的走势计算样本自相关系数和偏自相关系数因为我们是通过考察平稳序列样本自相关系数和偏自相关系数 的性质来选择合适的模型拟合观察值序列,所以模型拟合的第一步是要根据观察值序列的取值求出该序列的样本自相关系数以,0 y k v n和样本偏自相关系数%0vkvn的值。样本自相关系数可以根据以下公式求得:n _k工(Xt -X)(xt k -x) P1,-0 k nx (Xt -X)211样本偏自相关系数可以利用样本自相关系数的值,根据以下公式求得:?k。-。k n式中,?k412?k?11?k2其中,或是将由的第k列变为?1?2模型识别(计算p, q)计算出样本自相关系数和偏自相

8、关系数的值之后, 就要根据他们表现出来的性质,选择适当的 ARMA模型拟合观察值序列。这个过 程实际上就是要根据样本自相关系数和偏自相关系数的性质估计自精品文档精品文档相关阶数?和移动平均阶数?,因此,模型识别过程也称为模型定阶过程。理论依据:(ARMA模型定阶的基本原则)0k%模型定阶拖尾p阶截尾AR(p)模型q阶截尾拖尾MA(q)模型拖尾拖尾ARMA(p,q)模型方法:下面我们考虑,在实际操作中,怎样判定是截尾或拖尾。即当样本自相关系数或偏自相关系数在延迟若干阶之后衰减为小值波动时,什么情况下该看做相关系数截尾,什么情况下该看做相关系数在延迟若干阶之后正常衰减到零值附近做拖尾波动。由于当样

9、本容量n充分大时,样本自相关系数近似服从正态分布:-1?kN(0,一) n样本偏自相关系数也同样近似服从这个正态分布:%k N(0)n根据正态分布的性质,有Pr(- 2 % 2 )-0.95 n . n2 c 2Pr(-三%三)-0.95 n 一 n、2. 2?:汪:Pr(-?k -) =Pr(-Z-2)Jn1 2 二z2;Q4773=0.95精品文档精品文档所以可以利用2倍标准差范围(-2,反)辅助判断。 n . n如果样本自相关系数或偏自相关系数在最初的 d阶明显大于2倍标准 差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内, 而且由非零相关系数衰减为小值波动的过程非常突然,这

10、时通常视为相关系数截尾,且截尾阶数为do如果有超过5%的样本自相关系数落入2倍标准差范围之外,或者是 由显著非零的相关系数衰减为小值波动的过程比较缓慢或者非常连 续,这时通常视为相关系数不截尾,即拖尾。这样,我们就可以根据最初的理论依据和计算的比较结果来选择合适的模型进行模拟。(1)若观察序列的自相关系数拖尾,偏自相关系数截尾,且截尾阶 数为p ,则选AR (p)模型。(2)若观察序列的自相关系数截尾,且截尾阶数为 q,偏自相关系 数拖尾,则选MA (q)模型。(3)若观察序列的自相关系数和偏自相关系数均拖尾,则选ARMA( p,q)模型。2.3参数估计选择好拟合模型之后,下一步就是要利用序列

11、的观察值确定该模 型的口径,即估计模型中未知参数的值。比如:AR(2)模型X =如如匕+目中未知参数如*2的估计为精品文档精品文档- ,一_ 1 +MA模型 = 5 优备中未知参数仇的估计为=c .c2 -4-,c - -2ARMA(1,1)模型=飒十 %3中未知参数 电,仇的估计为陷=告, ?i2c - - c _ 4 ,c_2当然,这种低阶的ARMA模型可以根据公式直接带入求参数估计即 可,但当阶数比较大时,参数估计值会非常复杂,这时候我们采用最 大似然估计或最小二乘估计方法。极大似然估计:Xt = ;Xy, pX ,/;t- :q ;tq记 X =(x1,xn)最终,求解似然方程组 n

12、S()1 l(3;x)=y-)=0的2212%一()X2S(J) .0 /(;x) 一2: 二2 210式中,l(;x) =-nln(2二)-2n ln(仃2) -1ln C 22工92、QOGi2i -0odGiGn4i -0oO、G G n J i =0,Gi为Green系数.但是,由于S(力和lnG都不是的显式表达式,因而上述似然方程组精品文档精品文档实际上是由P+q+1个超越方程构成,通常需要经过复杂的迭代算法才 能求出未知参数的极大似然估计值。最小二乘估计:xt = 1xt 二 pxt pp ;t -11 ;t- - q ;t _q记R =(电,日1,),Ft ( ) - 1Xt J

13、., p Xt _p -、;t- -,q 1 _q残差项为:;t =为- Ft (1)n残差平方和为:Q()=v ;t=1n-、:(Xt 一 因一 一 pXtf , Uq ;t,A ;tT)211使残差平方和达到最小的那组参数即为 的最小二乘估计值。同极大似然估计一样,由于Q()不是的显性函数,未知参数的 最小二乘估计值通常也得借助迭代法求出。网上有极大似然法和最小二乘法的程序代码,有的是 matlab的,模型检验模型的检验主要是检验模型的有效性,一个好的拟合模型应该能够提取观察值序列中几乎所有的样本相关信息。换言之,拟合残差项精品文档精品文档(真实值与拟合值的差)中将不再蕴含任何相关信息,即

14、残差序列应 该为白噪声序列。这样,我们就通过检验残差序列是否为白噪声序列 来说明所建模型是否通过检验。方法与上面的序列随机性检验方法一样,利用LB统计量,m Q2LB=n(n+2应(匚)2 2(m),不过这里要验证是属于白噪声序列,所 k 4 n -k以最后计算结果P值要大于0.05才可断定残差序列是纯随机序列,进而说明该拟合模型通过了检验。模型优化对于给定的观察值序列,我们能够建立多个拟合模型,模型优化 就是从所有通过检验的拟合模型中选择最优模型。在这里,我们利用AIC准则(最小信息量准则)来选择最优模型。 AIC准则的思想是认为一个拟合模型的好坏可以从两方面去考察:一 方面是用来衡量拟合程

15、度的似然函数值;另一方面是模型中未知参数 的个数。一个好的拟合模型应该是一个拟合精度和未知参数个数的综 合最优配置,使得AIC最小的ARMAI型为最优模型。ARMA(p,q)模型的AIC函数为:nH)2AIC =nln(翅)+2(p+q+2),其中 H;=Var(气) 精品文档精品文档序列预测通过以上所有的步骤,我们得到了最优的拟合模型,然后可以对 未来的某一点进行预测。二、阈值的选取第一部分的模型得到的预测结果是一个点值, 然而在现实生活中, 由于环境的复杂性和因素的不可控制性,预测结果应该是一个以预测 值为中心点上下浮动的区间更为合适。 这里,我们利用聚类分析的思 想来确定区间的大小,即阈

16、值的选取。方法:先利用K-均值聚类方法将同一时间点的不同 y值分为合适的 k类,然后再根据阈值=最大的类均值-最小的类均值 来确定阈值的大小。 K-均值聚类步骤:(1)在n个样品中随机选择k个样品作为初始凝聚点,(或者将所有 样品分成k个初始类,然后将这k个类的均值作为初始凝聚点)。(2)对除凝聚点之外的所有样品样品逐个归类,将每个样品归入离 它最近的凝聚点所在的类(采用欧氏距离计算),然后将该类的凝聚 点更新为这一类目前的均值。(3)重复步骤(2),直到每个聚类不再发生变化或满足某个终止条 件为止。一般的迭代终止条件为误差平方和最小或限定聚类次数。n误差平方和为J=|x-%i)/,其中有n个数据,分为k类,/为为 i 1所在类的均值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论