(应用数学专业论文)时间序列的长记忆性研究及其实证分析.pdf_第1页
(应用数学专业论文)时间序列的长记忆性研究及其实证分析.pdf_第2页
(应用数学专业论文)时间序列的长记忆性研究及其实证分析.pdf_第3页
(应用数学专业论文)时间序列的长记忆性研究及其实证分析.pdf_第4页
(应用数学专业论文)时间序列的长记忆性研究及其实证分析.pdf_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 经典时间序列理论比较成熟,但理论体系都是建立在短记忆特性基础上。而 工程中大量的时间序列表现出了长记忆性,本文从这个角度出发,对长记忆性 时间序列进行比较详细的研究分析。 本文首先叙述了长记忆时间序列的研究现状和应用背景,然后在第二章大概 的介绍了经典时间序列模型,由经典时间序列理论在工程中应用局限性引出对 长记忆性时间序列的研究。 第三章中首先对时间序列的长记一 乙性进行定义,并详细的分析了怎么进行时 间序列的长记忆性检验。接着介绍能描述长记忆性的分数差分噪声模型和分整 自回归移动平均模型。 第四章介绍了自相似的概念,从自相似的定义可以看出自相似序列具有长记 忆特征,它是长记忆时间序列的一种特殊表现形式。并选用c e r n e t 上的一段 网络流量进行实证分析。采用了r s 分析法对流量数据进行检验,发现该段流 量具有自相似长记忆特征,但随着时间初始标度的不断改变,研究表明流量同 时也表现出了短记忆特征。同时分析出想要比较准确的研究时间序列的自相似 长记忆特性,需要有足够的数据支持,才能得到比较理想的结果。如果数据量 不够充分,实证分析结果有可能会出现拒绝长记忆时间序列中含有长记忆特性 的假设情况。 关键词:时间序列、长记忆、4 r 删模型、r s 分析法、自相似 电子科技大学硕士学位论文 a b s t r a c t r h e 昀d i t i o n a lt l m es e r i e st b e o r yh 鹪b e c o m em a t t l r e ,i tb 船e0 n 也es h o r t m e m o r yc h 盯a c t e r i s t i c b u t1 0 t so ft i m es e r i e sl l a v ep e r f o m e dl o n gm e m o r y c m c t e d s t i ci no u rl i f e f r o mt h i sp o i mo fv i e w t h i sp a p e rh a sr e s e a r c h e da i l d 删y z e dm el o n gm e m o r yt i m es e r j e si i ld e t a i l a tf - 螨t ,t l l i sp a p e r h 鼬i n 仃o d u c e dt h er c s e 砌s t a t l i si nq u o 觚di t s 印p l i c a t i o n b a c k g r o l l l l d i nc h 印t e r2 ,i ta l s oi n 的d u c e dt h e 订a d i t i o nt i m es e d e sm o d e l ,a 1 1 d 舶m 也ed i s a d v a n t a g ep o i n tt 1 1 a t 圩a d i t i o n a lt i m es e r i e sm o d e lc a nn o ts i m u l a 肥t l l el o n g m e m o r yt i m es e r i e sw e l l ,s ol o n gm c m o d rt i m es e r i e s 血e o r yi sp r o p o s e d i nc h a p t e r3 ,f 曲1 y ,t l l i sp a p e rh a sd e f i n e dl o n gm e m o r yc o n c 印t t h e ni t a n a l y z e sh o wt ov e r i 母t h el o n gm e m o r yc h a r a c t e r i s t i ci nat i m es e r i e s ,l 璐t l y t h e p a p e rp r e s e n t st h e 的c t i o n a ld i 脏r e n c e dn o i s em o d e l 眦dt h ea u t o r e g r e s s i v e 矗a c t i o n a li m e g r a t e di i l o v i n ga 、嘲em o d e l i nc 1 1 a p t e r4 ,m i sp a p c rd e f i n es e l f _ s i m i l a rc o n c e p t f m mt 1 1 ed e f i m t i o no f s e l s i 面l a rw ec 锄e a s i l yk n o wt h a ts e l f - s j i n j l a rs e r i e sp e d i o m l o n gm e m o r y c h 嘲c 硎s t i c ni sap a n i c l l l a rp e r f o m 姐c eo fm el o n gm e m o r yt i m es e r i e s t h e p a p e r h a su s e dan e t w o r kn 埘i cw h i c hc o n l e s f 如mc e i 斟e tt om a l ( ea d e m o n s t r a t i o n t h _ o u g hi n v e s t i g a t ei nt h en e t w o r kt r 概cb yr ,sa n 烈y t i c a l m e t l l o d ,if o u n dt l l a tt 1 1 en e t w o r kt r a 蕊ch a ss e l f _ s i m i l a ra i l dl o n 窟m e m o r y c h a r a c t e r i s t i c na l s op e r f o 蛳ss h o r tm e m o r yc l l a r a c t e r i s t i ct h r o u g hc h a n g em et i m e s e r i e so r i g m a ls c a l e ,l a s t l y ,m ep a p e ri n d i c a t e st h a ti no r d e rt oa i l a l y z et h ef e a t i e ro f s e l f - s i m j l a r 趾d1 0 n gm e m o r y 岫t h et i m es e r i e s e x a c t l y ,i tn e e d se n o u 曲d a t at o s u p p o n - a n di t 谢1 1r e 如em eh y p o t l l e s i st h a tn l e1 0 n gm e m o r yt i m es e r i e sh a v el o n g m e m o r yc h 盯a c t e r i s t i cw h i l en l e r ei s n te n o u 曲d a t at os u p p o n k e y w o r d :t i m es e r i e s ,1 0 n gm c m o 吼一五月抛4m o d e l ,r sa 1 1 a l y n c a lm e t h o d , s e l b s i m i l a r i i 独创性声明 本人声明所星交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:翅豇日期:矽扫年专月1 日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名: 导师签名:镎彦撬 日期:加6 年;月甲日 第一章引言 1 1 研究的背景及意义 第一章引言 经典的统计分析都假定数据序列具有独立性,而时间序列分析则着重研究 数据序列的相互依赖关系。从统计意义上来讲。所谓时间序列就是将某一指标 在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由 于受到各种偶然因素的影响,往往表现出某种随机性,彼此之间存在着在统计 上的依赖关系。 社会、科学、技术等领域中存在着大量的时间序列数据有待进一步的分析 和处理。人们希望通过这些时间序列的分析,从中发现和揭示某一现象的发展 变化规律。或从动态的角度描述某一现象和其他现象之间的内在数据关系及其 变化规律,从而尽可能多的从中提取所需要的准确信息,并将这些知识和信息 用于预测,以掌握和控制未来行为。 从b o x 、j e l l l 【i n s 开始,人们对时间序列的分析进行了大量的研究。到今天, 时问序列分析有了比较系统而完善的理论体系。时间序列分析是分析社会经济 资料的一种重要的方法。它对于信号处理、无线电工程、数据通信、工程控制 技术等许多领域都有深刻的影响。然而,经典时间序列理论体系大多是建立在 短记忆性的基础上,而实际中出现大量的时间序列都表象出不同程度的长记忆 性特征。 在2 0 个世纪5 0 年代,统计学家在物理学、水文学等领域的数据分析中发现 了时间序列的长记忆性。h u r s t ( 1 9 5 1 ) 在对水文数据的研究中发现了时间序列所 具有的长记忆特点,第一次提出了时间序列长记忆性的问题。在2 0 世纪8 0 年 代后,人们在经济时间序列中普遍注意到长记忆问题,引发了经济计量学界对 时间序列记忆性的研究。最近,人们有发现通信网络中的网络流量具有自相似 特征,它是时间序列的长记忆性特征的表现。近几年,人们对时间序列的长记 忆性研究越来越深入。 电子科技大学硕士学位论文 1 2 国内外研究现状 经济学和工程中常用的时间序列都是短记忆的。如4 砌纠序列,其自相关函 数相对于滞后阶数呈指数衰减。而长记忆序列的自相关衰减速度很慢,以至于 在很长的滞后阶数后,系统前后两个随机变量之间仍然存在显著的相关性,而 且这种相关性在一定的时间尺度范围内同样成立。这一类特殊的时间序列描述 的系统早期的历史对于系统当前和未来的状态影响是同等重要,而且系统当前 的状态也可能包含着系统演化的部分信息,并能够影响将来。 时间序列按平稳性可以分为平稳时间序列和非平稳时间序列。其中平稳时间 序列有三种重要的模型形式,即4 r 模型、此4 模型、爿砌制模型。非平稳序列 方面,可以用正r n 别模型来刻画。实际计算表明,许多常见的时间序列皆可用 a r 胁纠模型表示,从数学模型的角度,它们都可近似地归到a 删模型中去。 对于时间序列彳删模型中,关于其差分的阶数d 是整数,我们一般考虑差分 阶数矗取值为o 或1 的情况,d 一般不超过2 。当一个时间序列 f 置,f = o ,l ,控, 本身是个平稳序列,则差分阶数d 取值为o ,那么置具有 零阶单整性,记为,( o ) ,其自相关函数一c f 呈指数衰减。若d 取值为l 时,则 z 为,( 1 ) ,其4 c f 呈线形缓慢衰减。因此我们可以假设相隔长时间跨度的观察 值是独立的,或至少几乎是独立的。 自从h u r s t 通过对潮汐数据的研究发现了时间序列中的长记忆性,引起了人 们对长记忆性的广泛关注。并把时间序列划分为短记忆时间序列和长记忆时间 序列。在上面提到的几个模型中,它们都是短记忆时间序列模型。近年来,对 长记忆性的研究己经取得了很大的进展。特别对分整模型的研究成果较为显著。 a 盯h 列模型就是分整模型中使用较为广泛的。 然而,许多观察到的经验时间序列尽管表面上满足平稳性的假设( 也许在经 过差分转换后) ,但相隔较远的观察值却似乎呈现虽然较小、但绝对不能忽略不 计的相依性。这些序列尤其经常出现于水文学中,其中,河水流量的“持久性” 被称为赫斯特效应( h u r s te f f e c t ) ( 例如,见m a n d e l b r o t 和w a l l i s ,1 9 6 9 :以 及h o s k i n g ,1 9 8 4 ) 。还有在许多经济时间序列也呈现出其长久的类似持久性特 征,其具体特征为:高数值后面通常会出现正负号相同的高数值,从而序列似 乎经历一系列的“周期”,包括长度几乎与样本总容量相当的长周期。 n d e l b r o t ( 1 9 6 9 ,1 9 7 2 ) 在将其对经济学中,尤其是金融价格的非高斯 第一章引言 ( n o n g a u s s i a n ) ( 边际) 分布的研究,延伸到对经济时间序列的序列相关性结构 的探索时,有力的证明了这个观点。尽管m a n d e l b r o t 考虑了形式为离散时间“非 整数次布朗运动”的过程,更近的金融研究则将注意力集中于将爿删类模型 延伸至长期持久性的拟合。 另外,在对通信网络的研究中,网络业务中自相似性表现出的长记忆特性给 网络性能带来一些意想不到的影响。在自相似性业务下,交换机内缓冲区长度 的尾分布为次指数或幂函数分布而不是负指数分布。它直接影响网络的设计、 控制和管理。由于i n t e m e t 的多构性、异构性及网络行为的高突发连续性使传统 的马尔可夫模型、普阿松模型已不适用于m t e r n e t 的流量描述与预测。例如,按 传统p o i s s o n 模型设计的缓冲区常常会导致信元丢失过多,使系统服务质量降 低。具有自相似特性的网络流量可以用4 魁协丛进行建模,在现有的研究或科 学文献中,目前利用a 盯y 勉4 作为流量模型进行网络业务流分析尚属于初级阶 段。 一个长记忆过程总可以被一个正r 埘过程逼近的,如果要求逼近的程度相当 好,彳砌私过程的阶数p 和g 就会很大以至使参数的估计很困难。如今,在研 究长记忆时间序列模型方面,最主要的模型是a 珏: 削模型,它与一越弛4 模型 有所不同。关于前面提到的a 足z 列模型中的差分阶数d 中,我们只考虑了取整 数值情况,假如d 不是整数,我们就称置为“非整数次积分”( f r a c t i o n a l l y i n t e g r a t e d ) 过程,满足这类d 值的模型即为刚才提到的4 肼y 抛4 模型。 1 3 本论文主要研究内容和工作安排 由于经典时间序列理论不能较好的刻画工程实践中长记忆性类时间序列,本 文着重对时间序列的长记忆性进行比较系统的研究,建立刻画长记忆特性的时 间序列模型。并从c e r n e t 上选取了一段网络流量进行实证分析,得出相应的 结论。 本文章结构如下: 在第二章对经典时间序列进行了概要的介绍,由经典时间序列理论在工程中 应用局限性引出对长记忆性时间序列的研究。 第三章中首先介绍了时间序列长记忆性定义,并详细的分析了怎么进行时间 序列的长记忆性检验。接着介绍了能描述长记忆性的分数差分噪声模型和分整 自回归移动平均模型。同时对应用较广的分整自回归移动平均模型给出其建模 电子科技大学硕士学位论文 步骤。 第四章对选取的网络流量进行实证分析。由于最近大量的研究表明网络流量 具有自相似特性,所以先介绍了自相似性的定义。然后采用月,s 分析法对流量 数据进行检验。根据实证分析的结果得出相应的结论。 本文在广泛收集国内外文献的基础上,了解国内外研究现状和研究动态,按 照严谨的科学态度对待每一个问题,避免主观臆断。由于本文实证涉及到的网 络流量属于时间序列数据,研究中主要运用时间序列方法来建立模型,兼顾模 型的可操作性和模型与实际的统一性。充分利用了m 枷,a b 、s a s 等软件的强 大分析功能。 4 第二章经典时间序列模型介绍 第二章经典时间序列模型介绍 从b o x 、j c n k i n s 开始,人们对时间序列的分析进行了大量的研究。到今天, 短记忆时间序列分析有了比较系统而完善的理论体系。本章简要的介绍几种最 有代表性的短记忆时间序列模型1 一。 2 1 自回归模型 自回归模型描述为序列 五 在某一时刻f 和前p 个时刻序列值之间的线性 关系。设 鼻,r = o ,1 ,垃, 是零均值平稳序列,满足下列模型: z = 萌置一。+ 呜五一2 + + 砟一,+ ( 2 1 ) 其中q 是零均值、方差是的平稳自噪声。则称置是阶数为p 的自回归序 列,简记爿月( p ) 序列,而 中= ( 萌,珐,以) 1 称为自回归参数向量,其分量妒,= 1 ,2 ,p 称为自回归系数。 引进滞后算子对描述式( 2 1 ) 比较方便,滞后算子曰定义如下: b x t i x t _ b k x i x l k 记算子多项式 垂( b ) = 1 一畦b 一戎b 2 一。b 户 则式( 2 1 ) 可以改写为 西( 四) 置= t ( 2 2 ) 2 2 移动平均模型 另一类时间序列模型是移动平均模型,移动平均模型描述序列 五 中,置表 示为若干个白噪声的线性加权和a 设 置,r = o ,1 ,2 , 是零均值平稳序列,满 足下列模型: 电子科技大学硕士学位论文 e = 目一岛乞一- 一岛毛一2 - 一岛q 一。 ( 2 - 3 ) 其中q 是零均值、方差是蠢的平稳白噪声。则称置是阶数为g 的自回归序 列,简记 捌( g ) 序列t 而 = ( q ,b ,巳) 7 称为移动平均参数向量,其分量口,= 1 ,2 ,g 称为移动平均系数。 对于滞后算子丑有: 阮三日一l ,b 兰一i 再引进算子多项式 ( 口) = l 一最丑一岛b 2 一见b 9 则式( 2 3 ) 可以改写为 五= o ( b ) ( 2 - 4 ) 2 3 自回归移动平均模型 前面讨论了自回归模型和移动平均模型,两种模型的结合就构成自回归移动 平均模型。该模型兼顾前面两种模型的特点,以尽可能少的参数描述平稳时间 序列数据的变化过程。设 z ,r = o ,1 ,2 , 是零均值平稳序列,满足下列模型: 置一西置一,一屯工一:一一办置一,= q 一岛一,一岛一:一一,一岛一。 ( 2 5 ) 其中q 是零均值、方差是的平稳白噪声。则称置是阶数为p ,g 的自回 归移动平均序列,简记彳r 列( p ,g ) 序列。当g = o 时,它为4 耳( p ) :当p = o 时, 它为删( g ) 序列。 应用算子多项式中( b ) ,o ( b ) ,式( 2 - 5 ) 可以写为: m ( b ) 置= o ( b ) ( 2 - 6 ) 2 4 自回归积分移动平均模型 前面三种模型都是平稳时间序列模型,可是在实际问题中,时间序列并不平 稳,往往具有三个特征:趋势性、季节性与非平稳性。最常用的是采用b o x l j e n k i n s 方法,即差分方法,有时还要用时间序列的变换方法,消除其趋势性、季节性, 6 第二章经典时间序列模型介绍 使得变换后的序列是平稳序列,并假设为彳黝私序列,然后用上面的平稳时间 序列模型进行建模。 引进差分算子v ,定义如下: 一阶差分: v 葺= 置一置一。= ( 1 一b ) 置 二阶差分: v 2 墨= v ( 以,) ;v ( 墨一z 。- 1 ) = ( z 一一。) 一( z 一- 一鼍一:) = z 一2 置一l + 一2 一般地,引喻差分: v 4 五= ( 1 一b ) 4 工 其中 v 4 ;( 1 8 ) d = ,一( ; b + ( : b 2 + + c 一,4 - 1 ( d :。) 曰4 - l + c 一- ,4 b 。 v 4 称为d 盼差分算子。 设 五,r = o ,l ,2 , 是非平稳序列,若存在正整数d ,满足下列模型 v 4 五= 彬 丽 彤,f = o ,l ,2 , 是a r 魏( 弘口) 序列,则墨是自回归积分移动平均序歹l j , 简记彳越 纠( p ,d ,g ) 序列,这是,五满足: 中( b ) v 4 z = o ( b ) ( 2 7 ) 若v 4 置为平稳序列,但均值芦o ,则v 。z 一为平稳零均值序列,满足 中( b ) ( 9 。z 一) = ( 占) t ,r d ( 2 - 8 ) 此时,称墨为一般爿皿懈( n d ,q ) 序列。若未知,可以用v 。墨的平均值i 估 计。 若置的观测样本是五,五,五,经过一阶差分后,数据减少为行一1 个; 二阶差分后,数据为”一2 个;般地;引阶差分后,数据为h d 个,由d 阶差 分v 。墨复原数据,需要给定初定值墨,五,髟。 电子科技大学硕士学位论文 以上几个模型都是针对短记忆时间序列模型而言,在确定模型时,往往采 用下面方法。先对置的样本五,五,以,计算样本自相关函数与样本偏相关 函数,如果是截尾的或者是拖尾的( 即被负指数函数控制的) ,说明已服从 足 纠 模型,若自相关函数与偏相关函数至少有一个不是截尾的或拖尾的,说明置不 是平稳的,可以作一阶差分v x ,= 2 ,竹,并求其样本自相关函数与样本偏相 关函数,再用上述方法讨论。这样,直至判断v 4 置是平稳序列为止。在实际计 算中,若遇到样本自相关函数或样本偏相关函数的图形虽然下降,但下降得很 慢,应认为是非平稳序列,需作差分运算。 第三章时间序列长记忆性分析 第三章时间序列长记忆性分析 前面介绍的几种时间序列模型都是短记忆时间序列模型,在实际工程背景 中,很多序列具有长记忆性的特征,比如在经济、通信网络、天文地理等领域 里的相关数据序列中,都具有不可忽视的长记忆性。本章将重点对时间序列的 长记忆性进行分析,然后给出常用的参数估计方法和建立长记忆模型的方法步 骧。 3 1 时间序列的记忆性 关于时间序列的记忆性,r o s b l 毗旱在1 9 5 6 年就进行了探溥,提出了短 范围相依过程的概念吼 定义3 1 假设离散时间序列 五 ,r = l ,2 ,其部分和为 r s = 置 r = i 如果憋e 丁。1 s ; 存在且非零,并且有 吉去j 酽( r ) ,e 这里的 r r 表示,r 的整数部分,矿p ) 嗍为标准维纳过程,称 置 为短范围相 依( s h o r tr a n g ed e p e n d e n c e ) 过程。 短范围相依过程反映了时间序列的强混合性( s 仃d n gm i x i n g ) 和短记忆性的特 点。强棍合是短记忆中的一个概念,如果时间序列任意两点之间的相依性随着 时间间隔的增加而变得很小,就称时间序列是强混合的。一般将短记忆( s h o r c m e m o r y ) 称为强混合过程( m o n gm i ) 【i n gp r o c e s s ) ,而将长记忆( 1 0 n gm e m o 劝称为 非强混合过程( n o n s 订o n gm 政i n gp r o c e s s ) 。经典的时间序列模型,如a 胁纠等都 是以短记忆时间序列为研究对象的。时间序列的长记忆性是同短记忆性相对应 的。 下面介绍三种长记忆的定义。首先,从时域角度给出两种定义,然后从频域 角度给出最后一种定义。 角度给出最后一种定义。 电子科技大学硕士学位论文 定义3 2 假设时间序列 五 具有自相关函数b ( f 为浠后阶数) ,如果j 岛1 满足条件: ! 恐l 岛i _ o o 则称 z 为长记忆时间序列o “c l 啪d 和h i p e l 5 1 ) 。 定义3 3 如果平稳时间序列 置 的自相关函数岛依负幂指数率( 双曲率) 随滞后阶数f 的增大而缓慢下降,即 店c f 2 “,f - ( 3 - 1 ) 其中c 为常数,表示收敛速度相同,则称 置) 为长记忆时间序列( b r o c k w e l l 6 1 ) 。 对比定义3 - 2 和定义3 3 ,当式中d 的取值范围不同时,两者对长记忆的定 义不同。定义3 3 的形式具体,有利于分析工作,因而得到较广泛应用。一般 当o d o 5 时,炮i b l * ,称时间序列 墨 为长记忆过程,而当d o 时, 熄陂i 有界,称时间序列 置 为中等记忆过程。 以上定义是从时域角度给出的,下面从频域角度给出长记忆的定义。 定义3 4 称时间序列 工 为长记忆过程( g r 吼g e r 【刀) ,如果它的谱密度 厂( ) 具有以下性质: ( 1 ) 厂( ) 随频率斗。而趋于无穷; ( 2 ) ( 缈) 在除去至多有限个国值外的所有其他的值有上界。 这个定义是根据长记忆序列的谱密度厂( 1 在低频处的特性而给出的,可以 反映时间序列的周期变化规德,具有较广泛的意义。 3 2 长记忆存在性检验 对单变量时间序列长记忆性检验方法很多,下面是两种有代表性的方法。 3 2 1r s 分析法与修正r ,s 分析法 r s ( r e s c a l e dr a n g ea n a l y s i s ) 变标度极差分析法【8 l 最早由英国水利学家 h u r s t ( 1 9 5 1 ) 提出。他研究的问题是基于已观测到的水库流量时间序列,计算尼 罗河水库的最佳蓄水量。h u r s t 发现通常假定为随机的流入量序列其实并非随 1 0 第三章时间序列长记忆性分析 机,榴反在长达凡年的时间尺度上存在某种稳定的相关行为。他发现流入量倾 向于“聚类”,即接连数年流入量都低于平均水平,而接下来几年流入量却可能 持续地高于平均水平。这一聚类现象明显地证明系统内存在着长程相关,后来 在自然科学,如气象学和地理学研究的大自由度系统中被广泛地发现。 m 卸d e l b r o t 和w 融l i s 借用圣经中七年连早七年洪水的故事,形象地把它称为“赫 斯特效应”。 r s 分析的主要思想是分析重标度的累积均值离差的标度行为( s c a l i r i g b e h a v i o r ) 。假定一个质点在一维时间轴上游走,那么累积均值离差就是质点随 时间偏离起始点的距离。这是一个“经典”方法,是使用“距离除以标准差” 或“按比例调整的全距”统计量。 设时间序列 五 ,f = 1 ,2 ,r - 取n 个序列观测值的均值为 z = 去喜墨 取月s 统计量,记 q = 船 ( 3 - 2 ) 其中极差: r ( ”) = 懋喜( 一一z ) 一嬲套( 巧一i 一) 标准差: ,三 跏) 5 陶一别 2 在极差r ( ) 的表达式中,第一项是z ,的前后个样本均值之离差的部分和( 在时 间r 内) 的最大值。由于盖,与均值的r 个离差之和为零,因此这个最大值永远是 非负的。第二项是同一部分和系列的最小值,因此这个永远是非正数。因此两 个数量之间的差异( 出于明显的原因,它被称为“全距”) 永远是非负的:从而 q2 0 。可以证明【9 】, p 1 1 翼( 疗“q ) :c ( 3 3 ) 、, 其中c 为常数,圩为h u r s t 指数。根据式( 3 3 ) ,可得 k 【e ( q ) 】m l n c + 日h 托 电子科技大学硕士学位论文 h 的近似估计式就为 日= l l l q l i l 玎 人们发现,r s 统计量存在一些不足,虽然它能够发现时间序列的长记忆 性,但它对其短记忆性也十分敏感,因此如果序列与胄s 统计量在无长记忆性 假设下的预期行为不一致,这不一定来自长记忆性,而可能只是短记忆性的征 状,所以r s 统计量不具有稳健性。l 0 ( 1 9 9 1 ) 对r s 统计量进行了改进,使得 可以不必顾忌到短记忆的形式,这就是修正的r s 统计量【1 0 】,修正的震s 统计 量q 口为 蜴= 器 ( 3 - 4 ) 蜴2 端 3 4 ) 其中 西( n ) = 吉言( _ 一元) 2 + 詈喜一( g ) 喜。( 五一元) ( 墨一,一只) = + 2 一( g ) 乃 w ,( 譬) = l 一i ,g 歼 g 十l 且豸和乃是 置) ,f = l ,2 ,丁的样本方差和样本协方差。 在计算修正r s 统计量的过程中涉及一个重要的问题就是:如何确定口值? 在不同的g 值下所计算的统计量是会不一样的,得出的检验结论也可能会不同。 为了解决该问题,l o 提出确定最优4 值的数据依赖法则: g = i n t ( 3 r ,2 ) 3 2 p ,( 一p 2 ) 2 门 其中,i n t 【】表示取整数,p 为序列 置 ,f = 1 ,2 ,r 的一阶自相关函数。 虽然修正的r s 分析方法剔除了序列的短记忆性性,能更加有效的检测出 序列的长记忆性,但是也存在一些不足。t e v e r l o s k y 等近期的研究表明,修正r s 分析方法所做的显著性检验倾向于拒绝没有长记忆性的零假设,事实上序列往 往可能是具有长记忆性的。从这一点上说,修正r s 分析方法可能会低估序列 的长记忆性。 序列的4 r 模型残差被用来消除或至少最小化线性依赖,对残差进行经典的 第三章时间序列长记忆性分析 r ,s 分析将消除序列的相关性或短记忆性。因此。为了降低短记忆性对r ,s 分 析的影响,可以通过对序列建立辅助的一只模型来滤除短记忆因素,突出长记忆 因素。 关于修正r s 统计量q 的极限分布,文献【1 1 】给出了定理: 定理3 1 对于时间序列 墨 ,= + 日,一为常数,岛为随机变量,q 在 短记忆零假设下满足如下条件: 1 ) 对所有,e k 】= o ; 2 ) 对p 2 ,s u p e 时4 。: s ) 。 办熙e f 去( 套耵l a o ; 4 ) q ) 是强混合的。 5 ) 随着一无限增大,g 也无限增加,一般留d ( 玎“4 ) 。则随着n 增大,有 骶瓦若而善( _ 一元) 等嘴矽。( f ) = m 。 璁i 看丽蔷( 一一只) 毒卿矽。( f ) 2 m 。 g j m o m o = v ( 3 5 ) 其中o ( f ) 是布朗桥1 6 】,随机变量v 是单位区间上布朗桥的值域。 由此,表明 x ,) 的偏差部分的极大值和极小值分别弱收敛与布朗桥矿o ( f ) 在单位区间上的极大值和极小值。通过布朗桥值域v 的分布函数,可进行大样本 下的统计推断。文献【1 2 】给出该分布函数为 f ( v ) = 1 + 2 ( 卜4 七2 v 2 ) p 。w ( 3 6 ) j = 1 式中v 为分位数。通过式( 3 6 ) 获得的任意显著水平下检验的临界值。 关于h u r s t 指数有三个不同的类型:丑= o 5 、o 抒 o 5 与0 5 日 1 ( 1 ) 当日= o 5 时,这类时间序列是随机的、事件是随机的和前后不相关的, 现在不会影响未来。 ( 2 ) 当o h 0 5 时,这类时间序列是是短记忆性的,存在“均值复归”现 电子科技大学硬士学位论文 象,如果一个系统在前一个时期存在一个向上的趋势,则它在后一个时期很可 能有一个下降的趋势。反过来,如果它过去是向下的,则它未来很可能向上, 是负相关的。这种时间序列具有比随机序列更强的突变性或易变性,因为它是 由频繁出现的逆转构成的。 ( 3 ) 当o 5 s l 时,这类时间序列是长记忆性的或趋势增强的,如果序列 在前一个时期是向上( 下) 走的,那么它在后一个时期很可能继续该趋势。是正相 关的。趋势增强的强度或持久性随日接近于l 而增加。日越接近o 5 ,其噪声 也越大,趋势也就越不确定。长记忆序列是分数布朗运动或有偏随机游走,偏 倚的强度看日比o 5 大多少。 长记忆性时间序列,即o 5 1 的序列,是更有意思的一类,它们可以用 分数布朗运动来描述。在分数布朗运动中,跨时间尺度的事件之间有着相关性, h l l r s t 指数描述了两个相邻事件发生的可能性。如果日= 0 8 ,那么基本上可以 说,要是上一个移动是正的,下一个移动也是正的概率更高。这不是一种真正 的概率,它仅仅是“偏倚”的一个度量。关于o 5 日 1 的序列的模型将在后面 进行详细的介绍。 3 2 2 麟检验 k 谢a 出o w s 姑,p k l l i p s ,s c h m i d t 和s h m ( 1 9 9 2 ) 提出了咒p 嚣检验,该检验是用 来区分,( o ) 和,( 1 ) 序列的。l e e 和s c h i i l i d t 在文献1 3 1 中推广了k p s 譬检验,用于 区分短记忆与长记忆时间序列。 五p 船将平稳性检验描述成一种趋势平稳性的假设,即 置= + 口f + 弓,f = 1 ,2 ,r 其中 z 是观测序列, 五 是 ) 与确定趋势的偏差,且 五= + e 其中,是随机游走序列,满足 = 一i + q ,= o ,q f f d ( o ,口詈) 其中蠢( o 。,且 是满足单整序列的短记忆过程。 j 船检验的平稳性假设为凰:盯:= o ,这意味着4 是短记忆的。 令e | = x t 一又取 1 4 苎三童堕婴堡型丝望竖丝坌堑 s = 勺,r = l ,2 ,r ( r ) = 吾妻( _ 一只) 2 十詈粪k ( ,) ,毫( 置一只) ( z 一,一只) 其中,k ( ,) = l 一赤, 一,而置= 吾喜置。 j 四嚣检验的统计量为 p 砉希 p , f o lv d i , k 诹a 畦的w s k i ,蹦l l i p s ,s c h 瓶d t 和s 妇i 在文献【1 4 l 中证明 仉等f 呸( ,) 2 卉 ( 3 8 ) 其中k ( r ) 是二阶布朗桥1 4 】。 l e e 和s c h i i l i d t 推广了嬲检验的应用范围,用于区别长、短记忆性。假 设检验取: 凰:4 为短记忆序列,日:是分整序列。 当五是分整的,具有如下表达式: ( 1 一日) 。毛= 坼 其中 虬 是短记忆序列,且有= ( 1 一b ) q 。假设 ( 1 ) 是分整序列,刁= ( 1 一b 广q ,且d ( 一o 5 ,o 5 1 。 ( 2 ) q f ( o ,爵) 。 记互= 乏,z f 为部分和过程,司= 哳( 乙) j ;l s o w e l l 在文献【1 l j 中证明 弓= 爵阿而器篱丽 并且,随着r o 。,有 电子科技大学硕士学位论文 7一12dcr;+cr:ijij:ji:ij;=,p:; ( 3 1 9 ) 其中r ( ) 为r 函数。进一步,对,【o ,l 】有 昕1z 【。】j ( r )( 3 - l o ) 其中( ,) 为分数维布朗运动,有下面的随机积分定义: 吼( r ) 皇& 一s r 押( s ) ,r p + 1 ) 根据式( 3 - 9 ) 和式( 3 - 1 0 ) 可得 r - ( “。5 z 刑j ( ,) ( 3 1 1 ) 由此,如果刁是分整的,其部分和z f 是q ( 丁“。5 ) :如果4 是短记忆的,其部分 和是q ( r o5 ) 。 文献通过m 拥耙c 口r d 方法对j :p 船检验的功效进行了讨论,说明瓦p 豁 检验的功效与前面讨论的修正r s 检验很相近。 3 3 长记忆时间序列模型 目前长记忆时间序列模型常用的有分数差分噪声模型和分整自回归移动平 均模型两类。 3 3 1 分数差分噪声模型 g r a n g e r ( 1 9 8 0 ) 针对长记忆时间序列的特点提出分数差分噪声( f h c t i o n a l d i 腼r e n c e dn o i s e ,乃i ) 模型【1 5 】。这一模型是最早的长记忆模型,它源于分数布 朗运动的研究。而分数布朗运动( 抽c t i o n a lb m 、n i a i lm o t i o n ,删) 是长记忆时 间序列研究的基础。 定义3 5 令日满足o 日 o ,( f ) 为 龇m ( o ) + 若j 悱叫哇- ( - 矿 + ) 呜刮 1 6 第三章时间序列长记忆性分析 【3 1 2 ) ( o ) = 6 0 其中r ( ) 为r 函数,b ( j ) 为布朗运动( 维纳过程) 。 式( 3 1 2 ) 的随机积分为加积分。当6 。= o 且日= 去时,琶。( f ) :b ( f ) ,分数 布朗运动退化为一般的布朗运动。岛( ,) 的谱密度与。2 “1 成正比例,其自协方 差为 e i 如( f ) 一( s ) 1 2 = 盯2 p s 1 2 “,盯为常数 日 以= c 2 “2 ,c 为常数 即“与后2 “2 成正比例,说明其自协方差函数里双曲率缓慢下降,这与布朗运动 的自协方差函数呈指数率下降形成对比。布朗运动的记忆性是短记忆,而分数 布朗运动的记忆性为长记忆。 形式上维纳过程的导数是连续时间白噪声,而分数布朗运动如“) 的导数是 连续时间上的分数噪声过程,连续时间分数噪声在离散时间上便是g r 锄g e r 提 出的分数差分噪声。 定义3 8 如果随机时间序列 葺 满足差分方程 ( 1 一b ) ”z = ( 3 - 1 3 ) 其中矧 一l ,有 ( 1 一曰) 4 = 乃b 其中 乃;揣= 思半小叫名 关于分数差分噪声序列的性质,有以下定理: 1 ) 当一寻 d 昙时, 置) 足平稳、可逆的。且其有w j l d 分解式 2 妒) q = 苫q 一女,和自回归奏达式q = 芝以置一。,其中 q 为白 = o磊 。 电子科技大学硕士学位论文 噪声序列,系数讥和死都呈双曲率下降, 置 为长记忆过程。 2 ) 五) 的自协方差函数为 纠眦一= 踹 其自相关函数为 a = ;= ;黼,七= 。,士, 3 ) 置l 的偏自相关函数为 = 丢,七= 1 ,2 , 2 西七2 1 ,2 , 另外,比船i 序列更为广泛的是引喻分整序列。 定义3 7 如果序列 五) 满足差分方程 ( 卜b ) 4 置= q( 3 - 1 4 ) 这里例 o 5 , q ) 是平稳序列,且在各频率上具有有界且大于零的谱密度,称 z 为d 阶分整序列。 3 3 2 丘珏i 捌模型 肋模型只考虑了时间序列的长记忆性,忽略了时间序列的短记忆性,为 了弥补冗) 模型的不足,g r a l l g e r f 赳和h o s k j n f 2 q 分别提出了分整自回归移动平 均( a u t o r c g r e s s i v ef r a c t i o n a li n t e 擎a t e dm o “n ga v e m g e ) 模型,简称a 肿:口幽模型。 定义3 7 若平稳时间序列 置 ,满足差分方程 o ( 口) ( 1 一丑) 4 ( x 。一) = o ( b ) q( 3 1 5 ) 其中曰为滞后算子,川 o 5 , q 为白噪声序列,为f z 的均值。巾( 口) 和 ( 曰) 分别为p 阶和g 阶平稳的自回归算子和可逆的移动平均算子,其所有的特 征根均在单位圆外,则称 墨 满足分整自回归移动平均模型,记为 爿剧珊纠( p ,d ,g ) 。进一步推广时,d 可为任意实数。 。 由式( 3 _ 1 5 ) ,若 墨 服从d ( 一o 5 ,o 5 ) 的彳r 用勉4 ( 仍d ,g ) 过程,当且仅当 ( 1 一b ) 4 ( z 一) 是一个一删( p ,g ) 过程,另外,模型( 3 1 5 ) 可以演化为 m ( b ) ( 置一) = d ( 占) ( 1 一曰) = ( b ) 研 1 r 第三章时间序列长记忆性分析 其中臻= ( 1 一b ,t 为分数差分噪声。因此, 置 可以堪称是由分数差分噪声叩c 导出的彳砌剃( p ,g ) 过程。 爿r f 髓剃( p ,d ,g ) 模型用p + g 个参数描述过程短记忆特性,以参数j 反映 过程的长记忆特征。因此一只删模型综合考虑到过程的长、短记忆特征,它 既优于单独描述短记忆的爿砌刎模型,又优于单独描述长短记忆此) 模型。另 外,当p = g = o 且= o 时,4 r 舢( p ,d ,g ) 模型退化为f j d 模型。 关于爿脚m 扰( b d ,g ) 模型的性质,有定理【”如下。 定理3 2设 置 是d ( - o 5 ,o 5 ) 且符台模型( 3 1 5 ) 的一脚i n 搿( p ,d ,口) 过 程,其模型中的多项式m ( b ) 与o ( 丑) 无公共根,则 1 ) 如果m ( b ) o ,例= 1 ,则式( 3 - 1 5 ) 有惟一的平稳解: 置= p + 缈,( 1 一口) 一一, 其中叭由下式给出 ( 曰) 旷1 ( b ) = 竹丑 j = _ 忡 2 ) 置) 平稳的充分必要条件是m ( 曰) o ,h 1 : 3 ) z 可逆的充分必要条件是e ( 君) o ,例1 ; 4 ) 如果 z 平稳且可逆,则对d o ,其自相关函数满足 n c f 2 “,r 斗 其中c 为常数。 将爿r 删模型与爿r 朋纠模型的特点进行对比,结果如表3 1 : 表3 一l 爿月凡 捌模型与4 月舭4 模型对比 项目 4 r f :e ,翻( p ,d ,9 14 r 口c “( p ,d ,q ) 适用范围长记忆过程短记忆过程 d 值取值范围实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论