




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要:分形理论是非线性科学研究中十分活跃的一个分支,现在已被广泛应用于 各个学科领域本文主要研究时间序列的分形性质首先,我们研究了线性和非 线性多项式滤波对时间序列信号的多重分形性质的影响其结果是线性滤波不 改变信号的多重分形性,而非线性滤波改变信号的多重分形性,并且其影响取决 于非线性滤波的阶数其次,我们应用重现区间理论研究了极端事件的相关性,对 三类不同时间序列的多重分形性进行分析比较研究表明:不同时间序列重现区间 有类似的分形性质最后,我们研究了h 6 1 d e r 指数在交通时间序列上的应用我们 将h 6 1 d e r 指数的算法从一维推广到高维,并研究了交通流数据的奇异性( h 6 1 d e r 指 数) 的变化规律,为交通堵塞预警奠定了一定的理论基础。 本文图2 3 幅,表2 0 个,参考文献3 8 篇 关键词:分形;多重分形;时间序列;极端事件;重现区间;h 6 1 d e r 指数 分类号:0 2 1 2 a b s t r a c t a b s t r a c t :f r a c t a lt h e o r yi sa l la c t i v er e s e a r c h i n gb r a n c ho fn o n l i n e a rs c i e n c et h a t h a sb e e nu s e di nm a n yf i e l d so fs c i e n c e f r a c t a lp r o p e r t i e so ft i m es e r i e sa r eo u r m a i n l y s t u d i e di nt h i sp a p e r f i r s t ,w ed i s c u s sh o wv a r i o u sl i n e a ra n dn o n l i n e a rf i l t e r sa f f e c tt h e m u l t i f r a c t a lp r o p e r t i e so ft i m es e r i e s i ti ss h o w nt h a tl i n e a rf i l t e r sd on o tc h a n g et h e m u l t i f r a c t a lp r o p e r t i e s ,b u tn o n l i n e a rf i l t e r sd oa n dt h ee f f e c t sd e p e n do nt h eo r d e ro ft h e p o l y n o m i a lf i l t e r a f t e rt h a t , w es t u d yt h ec o r r e l a t i o n sb e t w e e ne x t r e m ee v e n t su s i n g r b e t l l l ni n t e r v a l ,a n dc o m p a r et h em u l t i f r a c t a lp r o p e r t i e so ft h et h r e et y p e so ft i m es e r i e s w bf o u n dt h a tm u l t i f r a c t a lp r o p e r t i e so fr e t u r ni n t e r v a lo fd i f f e r e n tt i m es e r i e sa r e s i m i l a r a tl a s t ,w er e s e a r c ht h ea p p l i c a t i o no fh 6 1 d e re x p o n e n ti nt r a f f i ct i m es e r i e s f u r t h e r m o r e , w es t u d yt h ec h a n g i n gl a wo fs i n g u l a r i t y ( h s l d e re x p o n e n t ) i nt r a f f i ct i m e s e r i e sb ye x t e n d i n go n ed i m e n s i o nh 6 1 d e re x p o n e n ta l g o r i t h mt oh i g hd i m e n s i o nt h a t e s t a b l i s hs o m et h e o r yb a s i sf o rp r e d i c t i o no fu r b a nt r a f f i cc o n g e s t i o n t h e r ea r et w e n t y - t h r e ep i c t u r e s ,t w e n t yt a b l e s ,a n dt h i r t y - e i g h tr e f e r e n c e s k e y w o r d s :f i a c a l ;m u l t i f r a c t a l ;t i m es e r i e s ;e x t r e m ee v e n t ;r e t u r ni n t e r v a l ;h 6 1 d e r e x p o n e n t c i 。a s s n o :0 2 12 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研 究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他入已经发表或撰 写过的研究成果,也不包含为获得北京交通大学或其他教育机构的学位或证书而使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示了谢意。 学位论文作者签名:签字日期: 渺7 年7 月2 日 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提 供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同 意学校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:翱1 ) 鸯 签字日期:御7 年1 月z 日 导师签名:i 翁礴 签字日期:砷毋年7 月歹日 致谢 本论文的工作是在我的导师商朋见教授的悉心指导下完成的,商朋见教授严谨 的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来商 朋见老师对我的关心和指导。 商朋见教授悉心指导我们完成了实验室的科研工作,在学习上和生活上都给予 了我很大的关心和帮助,在此向商朋见老师表示衷心的谢意。 商朋见教授对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心 的感谢。 在实验室工作及撰写论文期间,林艾静师姐和许娜师姐对我论文中的研究工作 给予了热情帮助,在此向他们表达我的感激之情。 另外也感谢我的家人,他们的理解和支持使我能够在学校专心完成我的学业。 1 引言 非线性科学是- i 1 研究非线性现象共性的基础学科它是2 0 世纪6 0 年代以来, 在以非线性为特征的分支学科基础上逐步发展起来的综合学科,被誉为2 0 世纪自 然科学的“第三次革命”科学界认为:非线性科学的研究不仅具有重大的科学意义, 而且具有广泛的应用前景,它几乎涉及到自然科学和社会科学的各个领域,并正在 改变着人们对现实世界的传统看法一般认为非线性科学的主体包括:混沌( c h a o s ) 、 分形( f r a c t a l ) 、孤立子( s o l i t o n ) 在非线性科学中,分形和混沌有着不同的起源,但是它们又是非线性方程所描 述的非平衡过程和结果,它们有着共同的数学祖先一动力系统分形的迭代函数系 统可以定义移位动力系统,而移位动力系统正是一个混沌系统如果把混沌广义地 看作是具有自相似的随机过程和结构,则分形也可以看作是一种混沌空间反之,由 于混沌运动具有在时间标度上的自相似性,它也可以看作是时间上的分形简单地 说,分形是空间上的混沌,而混沌是时间上的分形 混沌【l 】既是一种确定现象,又是一种非线性动态,是相对于一些“不动点”和“周 期解”特定形势的一种未定形的交融于特定空间的非周期的无序状态d a v a n e y 在 1 9 8 9 年给出了混沌的定义为: 设( x ,力是一致度量空间,f :x 寸x 是连续映射,称厂在x 上是混沌的若 1 厂具有对初值敏感依赖性; 2 厂在x 上拓扑传递; 3 厂的周期点在x 中稠密 该定义把混沌归结为三个特征:不可预测性;不可分解性;具有规律性行为 分形【2 。4 】这一概念是由美籍法国数学家m a n d e l b r o t 在1 9 7 5 年正式提出来的目 前,对分形还没有严格的数学定义,只有描述性定义:分形就是指局部和整体以某种 方式相似的形体m a n d e l b r o t 在美国科学杂志上的论文英国的海岸线有多长 统计自相似性与分数维数及专著分形:形状、机遇和维数中,阐明了他 的分形( f r a c t a l ) 思想后来他进一步将分形定义为其组成部分和整体以某种方式相 似的客体这类客体不能用传统的欧几里德几何来描述,但这些客体却都是具有自 相似或自仿射性的体系,如弯弯曲曲的海岸线,起伏不平的山脉,粗糙不堪的断面,变 幻无常的浮云,九曲回肠的河流等等这类客体不具备特征尺度,用不同倍数的放大 镜去观察它们,其相貌是相似的,并且这个性质不随观察位置的变化而变化分形理 论就是专门研究分形的几何特征、数量表征及其规律和应用的科学 尽管关于“分形”目前还没有一个统一的、严格的定义,但其作为一种新的分析 方法已受到了诸多学科的广泛重视,在经济科学领域也获得了广泛的应用众多国 内外学者运用分形理论的自相似性与维数原理来研究经济领域的时间序列、随机 过程等非线性动力过程,说明和解释复杂多变的经济现象相关实证研究也取得了 许多有价值的成果用分形理论研究复杂系统的性质,已经成为近来最受人关注的 领域另外,这些研究使得确定分形的方法也随之发展和完善若是分形,还要确定其 是单分形还是多重分形彳艮多研究表明单分形方法利用一个标度指数来描述高度复 杂系统是不充分的,因此,在很多情况下,需要用多个标度指数来描述复杂系统特征, 即多重分形分析 时间序列的分形性质研究始于2 0 世纪9 0 年代初,该方法己成功地应用于物理 学、社会学、医学、生物学、经济学、地质学、计算机科学等众多领域,掀起了其 在很多学科的研究热潮越来越多对时间序列的研究表明:很多自然现象的形成、发 生、发展的过程并不都是严格随机的,而是具有相关性和可预测性典型的例子有: 水文数据、气象数据、地震数据、心跳记录、d n a 结构以及经济数据通过研究已 有数据的特征及规律性,建立科学、合理的预测、预报模型,可以帮助我们对其将来 的发展做出预测 极值理论是研究时间序列较新的一种方法极值统计中的一个重要问题是超过 某一上限的极端事件的重复出现率,极端事件经常是现实生活中遇到的一些有重大 影响的特殊事件例如,降雨量的极值代表洪水,在电信和交通网中它代表超载研究 此问题的目的在于预测灾难性事件,如洪水,干旱和股市危机重现区间( r e t u r n i n t e r v a l ) 是极值理论中一个重要的概念,其定义为低于一个固定上限的时刻与高于 这个固定上限的时刻之间的间隔通过研究重现区间的统计特征,我们可以更好的 理解极端事件发生的规律,并且进一步量化它们,使其成为预测的有效工具 函数h 6 1 d e r 指数是一个局部特征,由在每一点的函数计算出来h 6 1 d e r 指数捕 捉了局部重分形信息通过研究h 6 1 d e r 指数的分布,可以判断系统的状态,如交通流 数据在拥堵和非拥堵两种不同状态下,h 6 1 d e r 指数的分布情况存在明显不同,这样 就为预报交通状况提供了一种方法 我们研究了线性和非线性多项式滤波对时间序列信号的多重分形性质的影响 其结果是,线性滤波不改变信号的多重分形性,而非线性滤波改变信号的多重分形 性,并且其影响取决于非线性滤波的阶数其次,我们应用重现区间理论研究极端 事件的相关性,对三类不同时间序列的多重分形性进行分析比较研究表明:不同 时间序列重现区间有类似的分形性质最后,我们研究了h 6 1 d e r 指数在交通时间 序列上的应用我们将h 6 1 d e r 指数的算法从一维推广到高维,并研究了交通流数据 的奇异性( h 6 1 d e r 指数) 的变化规律,为交通堵塞预警奠定了一定的理论基础。 2 2 线性和非线性滤波对多重分形分析的影响 用分形理论研究复杂的物理学系统和生物学系统的性质,已经成为近来最受人 关注的领域【5 - 1 0 随着研究的深入,这些确定分形种类和性质的各种方法也随之发 展和完善一方面,若是分形,应确定其是单分形还是多重分形另外一方面,很多研究 表明单分形方法利用一个标度指数来描述高度复杂系统是不充分的因此,在很多 情况下,需要用多个标度指数来描述系统特征,即多重分形分析 多重分形是分形的一般化,很多复杂系统都具有多重分形性【6 1 7 】一般多重分形 性体现在多重分形谱中由于序列的波动性,不均匀性和非平稳性,多重分形性一般 很难量化这个问题在特定的情况下变得更为复杂: ( 1 ) 测量设备对系统的输出信号产生了一个线性或是非线性的滤波 ( 2 ) 当我们感兴趣的不是输出信号,而是它的一个组成成分时,这能通过非线性变换 得到 ( 3 ) 通过对输出信号进行非线性变换得到不同的系统,我们对比它们的动力系统 ( 4 ) 在进行实际分析之前运用线性或是非线性滤波对序列进行预处理 因此,要理解系统的内在动力行为,在上述情况下正确分析和理解系统输出信号的 动力系统模式非常重要 本部分应用多重分形分析方法,研究各种线性和非线性变换对信号多重分形性 特征的影响此方法能准确的度量不同时间序列波动函数或概率密度函数的长相关 性特别的,常用到的三种类型的变换是:线性,非线性多项式,对数滤波我们对比序 列变换前后的多重分形标度性质结果表明线性滤波不改变多重分形性质,非线性 多项式的影响取决于多项式的幂律另外,我们的研究表明,多重分形谱的最大值在 对数滤波之后几乎不发生变化然而,我们发现即使对于很小的偏移变量,多重分形 谱宽度却会发生很明显的变化 2 1 多重分形理论 在这一部分,我们讨论多重分形和多重分形谱的概念,很多作者进一步发展了 多重分形理论及其公式,并应用到科学研究的各个领域【7 1 3 1 首先,我们定义配分函数z ( q ,万) 1 6 - 1 8 】 z ( g ,万) :川熏剐阢,p 汗 ( 2 1 ) i = 1 这里,万是用于覆盖样本的盒子的大小或标度,p ) 是一个依赖于8 的测度盒 子用f 表示,m 脑( 万) 表示用于覆盖样本的大小为万的盒子的个数,指数g 是用来表 3 示测量矩的阶的实参数,p ) 的函数形式的选择是任意的,只要满足肛p ) 0 就可 以这里我们把测量函数按如下定义: 肛( 万) = 吉吼 ( 2 2 ) 这里i 州,是在第f 个盒子内的x 的第j 个信号的绝对值 n m = i x l 七是所有绝对值的和,它是一个正规化常量,因此,p ) :1 在这个正规化下,p ) 可以理解为概率 我们可以把参数g 可以看做功能强大的显微镜,能够区分两个非常相似的地图 的最细微的不同另外g 是一个选择参数,q 的较大值可加强肛p ) 的相对较大值的 盒子,而q 的较小值可加强,p ) 的相对较小值的盒子盒子的大小万可以看做一个 滤波,这时大的标度值就相当于在地图中应用较大标度的滤波改变万的大小就可 以讨论在不同标度下的样本因此,配分函数z ( g ,艿) 提供了不同标度和矩的信息 广义维数由以下方程定义: d ( q ) = l :占i m 士警 ( 2 3 ) 7 - - 0q l 1 1 1 万 p 7 d ( 0 ) 是容量维数,d ( 1 ) 是信息维数,d ( 2 ) 是相关维数【8 1 如果对于所有的g 值 d ( q ) 都是常数,称为单分形,否则就称为多重分形 在很多的实际应用中,方程( 2 3 ) 的极限是不能计算的,因为在很小的标度内我们 得不到任何信息或者根本就不存在小于最小物理长度的标度【1 0 1 一般来讲,我们能 够找到一个标度区域,在这个标度范围内,配分函数可以拟合为一个幂律形式: z ( q ,万) 口们 ( 2 4 ) 斜率f ( g ) 与广义维数有如下关系: 丁【g ) = ( g 一1 ) d ( g )( 2 5 ) 确定多重分形的方法一般由l e g e n d r e 变换,得到奇异普f ( a ) f ( c r ) 的定义如下如果对于某一个盒子z 测量标度为: ,( 万) 口万吁 ( 2 6 ) 这里,指数口,称为h 6 1 d e r 指数,它依赖于盒子j ,如果所有的盒子都是指数为口 的标度,研究对象就称为单分形若测量的长度不同,不同的盒子标度有不同的指数 口,则研究对象就称为多重分形,由口值相同的盒子组成的子集记为色,玩的基数 记为虬( 万) ,对于一个多重分形以下关系成立: 虬( 万) 口万吖( 2 7 ) 通过l e g e n d r e 变换,口与f ( a ) ,口与f ( g ) 之间有如下关系: 4 口( g ) :d r _ ( q 一) a q ( 2 8 ) 厂( 口) = q a ( q ) 一r ( g )( 2 9 ) 如果能得到函数r ( q ) ,就能确定h 6 1 d e r 指数口和多重分形谱函数厂心) 对于一 个多重分形,曲线f ( c t ) 是以一个单峰函数,对于单分形f ( a ) 变成一个点因此,多 重分形谱可以精确地量化信号的长相关性质,并可以得到信号中的不同分形指数的 信息 用两个参数来描述信号的复杂性一个是f ( a ) 的最大值l ,另一个参数是谱 宽度形,当厂 ) 0 时估计口的范围,谱宽度的定义为: 当f ( a 晌) = f ( a , m ) = 0 时 w = 口一一口m i n ( 2 1 0 ) 最大值厶。与h u r s t 指数相对应,表明时间序列中的长相关性h u r s t 指数日测 量长相关信号中的“粗糙度”,当日接近于0 信号看起来是极不规则和不连续的,当 日接近于l 信号看起来是光滑的大的h u r s t 指数表示系统中的低波动性,较小的 h u r s t 值表示突发性和频繁的变化 宽度形能将单分形与多重分形辨别出来,矿可以用来测量信号中分形指数 的范围,范围越大,信号的结构越复杂 2 2 线性和非线性滤波对多重分形分析的影响 2 2 1 数据描述 我们这里用到的数据是二项式多重分形模型【1 9 之o 】定义= 2 ”( 净1 , 2 ,) 个 值的序y u : 薯= a n ( 1 - 1 ) ( 1 一以) m - n ( h ( 2 11 ) 这罩参数o 5 a l ,拧( f ) 是用二进制表示i 时数字1 的个数,例如:n ( 1 3 ) = 3 ,因为 1 3 对应二进制1 1 0 1 图2 1 和2 2 分别表示序y i j ( 2 1 1 ) 中参数a = o 7 5 和0 6 0 时的时 间序列因为序列扛, 中的标度指数f ( q ) 可以直接计算,下面我们将比较变换前后信 号的多重分形标度性质 5 拙摩窑煎厶芏鲤芏位垃塞线性独北线性涟遮丑垒重盐歪盐蚯艘碰宴 削2l 当参数口= 0 7 5 时由( 21 i ) 生成的序列 : i 1 。o 圈2 2 当参教口= 0 6 0 时由( 2 1 1 ) 生成的序列 222 线性和非线性多项式滤波 本部分研究线性和非线性多项式滤波对于信号 x 多重分形性质的影响尤其, 考虑两类非线性变换一二次和二次变换一作为偶数和奇数的多项式滤波的例子先 由两个参数为口= o7 5 和o6 0 分别生成多重分形序列k 【见方程( 21 i ) 】,然后比较 变换之后多重分形谱如何变化 首先研究这些变换是否影响信号的多重分形性质下面我们的研究表明,线性 滤波不改变信号的多重分形的最大值,珂。,和谱宽度w 而且在二次和二次多项式滤 波后多重分形谱的最大值几乎不变【见图2 3 2 4 ;袁21 ,2 2 考虑由a = 0 7 5 和 0 6 0 这两个不同参数的多重分形数据,结果表明二次和三次滤波均改变信号的多 韭基至皿厶堂班芏焦监塞缝世塑韭绔性罐搪盟童重垃瑷垃盘曲毖咱 重分形谱宽度矿,但二次滤波的影响比三次滤波要弱 见图2 3 ,2 4 :表2 1 ,2 2 研究表明信号k 和他们的变换p ( ) 为信号中的持续长相关性提供了相同 的信息:另一方面,j e 线性多项式滤波改变信号中分形标度的范围例如可以从图2 3 , 24 :及表21 2 2 看出:三次滤波对分形的影响比二次滤波要大 幽2 3 当4 = 0 7 5 时线性、二移( 和二次滤波对信号的多重分形的影响 恻2 a 当d = 0 6 0 时线性、一次和二次滤波对信号多重分形的影响 表2i 当口= 07 5 时线性、_ _ = 次和二次滤波对多重分形谱参数的影响 信号 f x j 2 x ,1 耐j 最大值09 9 9 909 9 9 9 09 9 9 2 宽度50 3 3 2 表22 当a = 06 0 时线性、二次和三次滤波对多重分形谱参数的影响 l信号 x i ) 2 x 产1 x i 2 )耐 l最大值 l宽度 0 4 5 2 30 4 5 2 31 1 2 8 2l8 5 5 2 2 23 对数滤波 除了非线性多项式变换,在比较从不同系统得到的输出信号的多重分形性质之 前,当需要重正则化输出信号时,对数变换也常常用于预处理过程本部分讨论对数 滤波i x , j l o g ( x , + s ) 对信号的多重分形性质的影响 对于由方程( 21 1 ) 产生的序列k j ,我们发现重分形谱的最大值o 在对数滤波 变换后几乎没有变化 见圈2 5 ,26 :表2 3 ,24 但是,我们发现即使在很小的5 值, 谱宽度矿也会产生很明显的变化尤其是当减少偏移参数# 时对数滤波变换后的 谱宽度值与原始序列相比较变小了这表明对数滤波不改变信号的长相关性这就 是在分析从不同数据前先用对数滤波对其重正则化的原因例如,为了比较不同公 司股票的价格波动x ( o 的性质。在做相关分析前,首先求出其相对价格收益率, r ( i ) = l o g k l + 1 ) x ( f ) 】1 0 , 1 1 图2 5 当口= 07 5 时对数滤波对于信号的多重分蟛性的影响 目 孓f 幕i 】 二嚣勰【 嚣= = :器 。+ u j | j 1 0 808 50 9n 11 1 11 1s1 图2 6 当4 = o6 0 时对数滤波对于信号的多重分形性的影响 表2 3 当a :0 7 5 时对数滤波对信号的多重分形谱参数的影响 l 信号 ) l o g 旺一1 ) l o g ( x , + l o ) l o g + l ) l o g ( x :1 0j ) l o g ( x :1 0 4 ) l 最人值0 9 9 9 909 9 9 909 9 9 9 l 宽度 表2 4 当a = 0 6 0 时对数滤波对信号的多重分形谱参数的影响 l 信号 扛i )( 1 0 武x 寸1 ) l o g ( x :l o1 ) l o g ( x , + l o ) l o g ( x i f f ) o g ( x :1 0 4 ) i 最值 l 宽度 0 4 5 2 3 0 :4 5 2 3 0 4 5 1 9 0 4 4 8 50 4 2 0 602 9 7 9 但是,必须注意到对数变换可以明显改变信号多重分形潜宽度的范围,而且很 大程度上依赖丁参数g - 的值 见图25 ,2 6 ;表2 3 ,2 4 因此,当我们关注过程中存在 的多种不同分形指数时,一般不建泌使用对数滤波因为应用对数滤波可能掩盖原 始信号巾的复杂程度 2 3 结论 复杂系统的多重分形性通常和多重标度性和自相似性联系在一起本文研究结 果表明线性变换不改变信号的多重分形性质然而非线性多项式滤波改变信号的 多重分形性质,并且此改变取决于多项式滤波的阶数多重分形谱的最大值在对数 滤波之后变小通过研究表明,具有很小偏移变量的对数变换就能使分形标度性发 生很大变化在数值计算及实际应用中,必须用误差分析对信号的多重分形谱进行 估计因此,无论从试验角度还是从理论角度,都需要认真估计线性和非线性滤波 对信号的多重分形性质的影响 1 0 3 三类时间序列重现区间的分形性分析 极值理论是研究时间序列较新的一种方法极值统计中的一个重要问题是超过 某一上限的极端事件的重复出现率,极端事件经常是现实生活中遇到的一些有重大 影响的特殊事件例如,降雨量的极值代表大洪水,在电信和交通网中它代表超载对 极端事件的研究可以帮助我们预测地震、洪水、干旱以及股票暴跌等大灾难的发 生 重现区间【2 2 。2 6 】是极值理论中一个重要的概念,其定义为低于一个固定上限的时 刻与高于这个固定上限的时刻之间的间隔,很多被用于股票等经济数据的研究 2 7 - 3 0 1 本部分将研究美国的道琼斯指数、香港的恒生指数、北京观测站监测到的风速时 间序列以及北京西二环的交通流量时间序列,对其重现区间的概率分布,自相关性 以及波动性等性质进行分析研究表明不同数据的重现区间的概率分布都近似的服 从幂律,即满足( ,) 足,一一( ) ,;不同上限p 的重现区间的自相关函数也都满足 c ( s ) 8 - p ( 0 1 ) ;用除趋势波动分析方法( d f a ) 得到的不同上限p 的重现区间 的波动函数也近似的服从幂律,即满足,酽( o p 且当f f + ,; p ( p 即为所取上限值) 则称为一个重现区间r ,如图所示: 2 5 1 。5 】1 0 5 - 0 。5 - 1 5 。,。一。一。j一。吃一! _r 1 。i 气-_b,。r _ 。o ,一r 2 吃。 ,f 4 一i i 1,、,_,7 l, , iiiili ii 1l l l i i 。i i 1 l 1 _ i i 神 i 1 5 01 6 0 l 1 7 01 8 0 图3 4 重现区间 1 3 i e 豇垡煎厶生亟主堂焦监窑三差吐回庄到重强匡四鳇盘瑾性盐蚯 从图34 我们可以看出,对上限值且= 1 ,我们得到重现区间,r 2 ,;对于上 限值n = 1 _ 5 ,我们可以得到重现区间,r 2 ,;对于上限值a = 2 值,可以得到重 现区间,;即对于不同的上限值p 值,有不同的重现区间 本部分主要研究对数收益率序列、风速时数序列和交通流量序列通过m a t l a b 软件得到如下结果( 横线表示我们所取的不同的上限值p ) ,见图35 一罔3 8 : 圈37 风速时间序列取不同的上限值p 得到的重现区间( p = 5 仉6 0 ,7 0 ,8 叫单位0 1 米,移) ) ,1 r 图3 8 变通流量时间序列取不同的上限值p 得到的重现区问( p = 1 2 0 ,1 3 0 ,1 4 0 ,1 5 0 ) 通过上图可以看到无论是对数收益率、风速以及交通流量的时间序列对于一 个给定的上限值,值,虽然重现区间的长度和重现区间的个数。是不同的,但是 重现区间的长度总和是一样的,即: 2 ( 这里是时间序列的总长度) ( 32 ) p i 我们还可以得到平均重现区间: 1 口 , b 2 击善仁薏 ( 3 3 ) p 的变化引起重现区间r r 的大小和重现区间的个数_ 。的变化,时间序列的总 长度是不变的,故而平均重现区间r 。的变化仅由p 的变化引起因此,和也之 间存在一个一一对应的关系,而且我们在数值上得到验证如表3l 一表3 4 所示: 表3 1 道琼斯指数收益率序列对于不同p 值求得的疋 表3 2 恒牛指数收益率序列对丁不同p 值求得的r 表3 3 风速时间序列对于不同p 值求得的胄。 表34 交通流鬣时间序列对于不同p 值求得的r p 对不同类型数据的重现区间的概率分稚情况,利用s p s s 软件分别求出其概率 值,我们得到如图3 , 9 所示: r 气划h 4 7 - 、 卜:魄j 图39 时间序列取不同的上螽值p 得到的概率分布图( 吣道琼斯指蠡的对数收益率序列嘞恒生 指数的对数收益率序,4 ( c ) 风速时间序,u ( d ) 交通流量时间序列 从图中我们可以看到概率函数的图像都近似的拟合到一条曲线,近似的服从幂 律,即: o ( ) 。,一压。) 7 ( 34 ) 并且它不直接依赖于p ,而是依赖于它的重现区白jr 和均值r 。的比值我们也可以 看到对于不同类型的数据它们的概率分靠是相似的通过我们拟合可以求得指数, 如表35 一表38 所示: p l1 522 53 , 1 7 2 4 61 0 8 7 8o 7 3 1 6 8 0 5 5 6 1 l 0 4 4 8 6 l p 11 2 51 51 7 52 , 1 4 8 4 11 1 1 8 80 8 5 7 6 80 7 4 8 7 80 5 7 1 2 1 p 5 06 07 08 0 , 1 7 9 8 21 51 1 0 6 80 8 4 8 7 9 p 1 2 01 3 01 4 01 5 0 , o 8 6 1 40 8 3 8 50 8 2 2 90 8 1 9 5 3 2 2 自相关分析 客观现象之间的数量关系有两种基本类型,一种是函数关系,即客观现象之间 存在的严格的确定性数量关系:另一种是相关关系,即存在于现象中的一种非确定 性的依存关系,这种关系不能精确地用函数表示,但却是变量之间的相互依赖的关 系自相关是同一个现象中之间的相互关系 自相关函数( a u t o c o r r e l a t i o nf u n c t i o n ,缩写a c e ) t 2 3 1 的应用非常广泛,在不同的 应用领域中它具有不同的物理意义自相关函数是指时间序列观测值之间的相互依 存关系,通过它可以确定数据的相互关系,也是描述时间序列数据相关性的重要工 具它描述时间序列誓f 1 在任意两个不同时刻t ,t ,的数值之间的相关程度平稳时 间序列的自相关函数为: 1 丝= c 。( j ) = ( ( 一i ) ( 誓+ ,一i ) ) = i ( 一孑) ( 薯+ ,一i ) ( 3 5 ) v j i = l ( ) 是求i _ 1 n s 的均值,s 为时间间隔 为了确定对于一个给定上限p 时重现区间,:的自相关性,我们可以求i 的自相 关函数,即将上式中的五变为,即得到: 1 n - s c r ( j ) = ( ( ,;一墨) ( ,;竹一墨) ) = 面( ,;一b ) ( ,;+ ,一墨) ( 3 6 ) 1 7 3 1 0 对于不同的数据,分别求出其自相关函数,通过m a t l a b 软件得到如下结果:见图 图3 1 0 时间序列的自相关函数值( a ) 道琼斯指数的对数收益率序列( b ) 恒生指数的对数收益 率序列( c ) 风速时间序列( d ) 交通流量时间序列 数值分析表明:对于以上三类不同的时间序列,其重现区间序列也是相关的, 其自相关函数都近似地接近于某一条直线,并且重现区间序列的自相关函数与原 始数据有相同的指数值,都满足c ( s ) 一s - # 如表3 归表3 1 2 所示: 表3 9 道琼斯指数收益率序列对于不同p 值求得的指数 p 收益率 11 522 53 8 0 6 9 7 50 5 6 5 90 4 6 7 90 4 3 0 70 5 0 7 40 2 9 6 5 表3 1 0 恒生指数收益率序列对于不同p 值求得的指数 p 收益率 l1 2 51 51 7 52 0 7 7 0 70 6 3 9 50 7 8 7 00 3 3 2 20 0 6 3 80 0 3 2 8 1 8 p 风速 5 06 07 08 0 o 4 4 4 00 6 0 7 10 5 5 7 30 6 0 0 60 6 2 0 4 表3 1 2 交通流量时间序列对于不同p 值求得的指数 p 流量 1 2 0 1 3 01 4 0 1 5 0 b 0 9 9 8 90 6 7 3 40 3 7 9 50 2 4 6 70 3 1 0 1 3 2 3 除趋势波动分析方法( d f a ) 除趋势波动分析方法( d e t r e n d e df l u c t u a t i o na n a l y s i s ,缩写为d f a ) 2 6 , 2 刀是由 p e n g 等1 9 9 4 年在研究d n a 序列时提出来的一种计算非平稳时间序列长相关性的有 效方法它优于其它分析方法之处不仅在于它能检验非平稳时间序列的长相关性, 它还能避免将时间序列的非平稳性误判断为长相关性因此,d f a 方法一经提出就迅 速被应用于诸多领域,如生理学、股票市场、云结构、经济时间序列、物理学等【3 1 , 3 2 】 我们考虑时间序列 葺 ( i = 1 ,2 ,n ) d f a 方法有四个步骤: 第一步:求序列对于均值的累积离差 】, : r ( i ) - ( 五一( x ) )( 3 7 ) k = l 1 其中i x ) = 寺五 v l = 1 此处,首先去除了时间序列的平均值由于一个时间序列可能有趋势、季节、循 环这三个成分中的某些或全部再加上随机成分因此,如果要对一个时间序列本身 进行较为深入研究,把序列的这些成分分解出来、或者将其去除会有很大帮助 第二步:序列重构,把y ( i ) 等分成m 个不相重叠的等时间长度s 的区间,其 中,n 三【n s 】( 即取整数部分) 由于序列长度并不总是时间增量s 的整数倍,因此, 序列尾端有时会出现小部分的数据信息未能被利用为了充分利用数据,对该序列 的逆序进行同样操作,这样,则共有2 f 个等长度的区间 ; 第三步:对于每个区间,用最小二乘法拟合数据,得到局部趋势去除该趋势后 的时间序列记为k ( f ) ,表示原序列与拟合值之差,即: 乓( f ) = y ( f ) 一p v ( i ) ( 3 8 ) 式中,p v ( i ) 为第1 ,区间的拟合多项式如果拟合多项式采用的是线性的、二次 的、三次的,甚至是更高次的多项式,则分别记为d f a l ,d f a 2 ,d f a 3 ,d f a n 那么n 阶 1 9 的d f a 则去除了累积离差中的n 阶趋势成分以及原始序列中的一一i 阶趋势成分 第四步计算每个区间去除趋势后的方差( 此处将顺序和逆序分别公式进行计 算1 : f s 2 ( v ) = ( r 2 ( o ) = 2 一一i + d ( r = 1 ,a ,虬) ( 3 9 ) 和 口( p ) = 2 【一p n s ) s + 订( y = 虬+ l ,虬+ 2 ,2 虬) ( 3 1 0 ) 对所有等长度区间求均值并开方计算得到标准d f a 波动豳数: 一k 霉f , 2 r ( 3 1 1 ) 如果波动函数f ( s ) 和时间尺度s 之间存在幂率,即:f ( s ) s 。则表示存在标 度性质口为标度指数或称为波动指数,它代表了数据的相关性质对于相关指数口, 有一个关于波动函数的近似估计:,( s ) s tp , 2 由上面两个式子可以得到标度指数 和相关指数的关系:a = 1 一口2 对于不同的数据分别求出他们的波动函数的图像,得到图3 1 1 縻 匕! 竺蔓 j 蔺 ;_ = :! ! j r 一 ; 二。 3” 。 1 j 1 州 。 图31 1 时间序列的波动函数( a ) 道琼斯指数的对数收益率序列( b ) 恒生指数的对数收益率序列 ( c ) 风速时间序列( 由交通流量时问序列 2 0 我们可以看到对于以上三种数据,波动函数f ( s ) 与s 的双对数都近似的满足 幂律关系: f ( s ) s 口 ( 3 1 2 ) 我们可以求得上限值p 对应的波动指数口的值见表3 1 3 一表3 1 6 表3 1 3 道琼斯指数收益率序列对于不同p 值求得的指数口 p 收益率 l1 522 53 口 0 6 3 7 4 0 7 0 2 40 7 4 1 1o 6 1 9 20 6 2 9 00 6 3 7 0 表3 1 4 恒生指数收益率序列对于不同p 值求得的指数o f p 收益率 l1 2 51 51 7 52 口0 6 6 6 4 0 7 7 9 00 5 7 3 7 0 7 3 2 90 8 0 1 90 7 9 9 0 表3 1 5 风速时间序列对于不同p 值求得的指数口 p 风速 5 06 07 08 0 口0 6 9 4 20 6 9 3 10 6 5 4 70 5 5 9 60 4 9 6 2 表3 1 6 交通流量时间序列对于不同p 值求得的指数口 p 流量 1 2 01 3 01 4 01 5 0 o f0 6 3 3 70 5 6 3 2o 6 1 5 60 5 8 3 0o 5 6 4 l 另外,令人感兴趣的是,通过表3 9 与表3 1 3 ,表3 1 0 与表3 1 4 ,表3 1 1 与表3 1 5 , 表3 1 2 与表3 1 6 的相应数值的比较,我们看到波动函数的指数口与自相关函数的指 数,近似的满足如下关系: 口= 1 一2( 3 1 3 ) 3 3 结论和意义 通过对金融数据中的道琼斯指数收益率序列和恒生指数收益率序列、气象中 的风速时间序列以及交通流量时间序列的讨论,我们看到对于这三类不同的时间 序列数据,重现区间的概率分布性质、相关性、波动性等分形性质都是类似的,而 且对于取不同上限值p 得到的重现区间与原始数据有相同的分形性质 进一步比较这三组类不同类型的数据,我们还发现,对于规律性很强的数据( 如 2 1 风速数据随季节呈现规律性、交通数据呈现每天的规律性) 受数据周期波动性的影 响,其相关性和波动性函数效果没有经济数据效果好 我们可以借助重现区间这个工具,将其应用到科学中的各个领域和自然界,它 能帮助我们更好的了解和认识极端事件,了解其性质和发展规律,甚至帮助我们预 测灾难性事件( 例如地震,洪水,干旱或是股票的暴跌等) 的发生,以做出合理的决策 4h 6 1 d e r 指数的推广及其应用 本部分用多重分形分析方法分析交通数据研究表明交通数据中存在明显的 多重分形特征;当交通呈现拥堵时,交通数据的分形程度增加,测量局部h 6 1 d e r 指 数能够判断交通状况 我们知道,城市交通问题涉及人、车、路、环境四者之间的关系,又与政策、 法规、管理和控制等密切相关,使得城市交通运行规律( 特别是交通拥堵现象的产 生和演变过程) 极其复杂它是一个复杂、开放、随机、动态、自适应和具有突变 特征的非线性复杂系统进行道路交通流的特征研究,是交通科学最重要的基础研 究之一近年来,国内外许多学者对其进行了城市道路交通流的非线性动力学特 征研究,特别是低速、平面、混合并具有不同类型瓶颈的道路交通流的形成和演化 的非线性动力学特性研究自从1 9 8 9 年j e d i s b r o 和m f r a m e 把混沌引入交通领 域以来,关于交通中混沌现象的研究文献迅速增加交通混沌的研究主要集中在 交通流行为的混沌研究上比如,交通流的复杂行为是否存在混沌,以及如何计算 关联维数、李雅普诺夫指数和柯氏熵等动力学不变量但是,这类研究是有局限性 的,因为仅用单一分形维数来刻画交通时间序列是不够的,必须用多重分形来描述 交通时间序列在不同尺度上的奇异性 多重分形就能为交通流这个混沌时间序列在局部和整体两方面提供一个数学 上的形式体系它可用来表示仅用单一的分形维数不能完全描述的具有奇异性的 几率分布形式,或者说通过分形谱来描述分形过程的多重标度特性。用多重分形的 方法来刻画交通流的非线性动力学特性,可以向人们提供比单一分形维数更为丰 富的交通流的信息多重分形是七十年代早期由m a n d e l b r o t 在论述湍流问题时引 进的它是分形理论的进一步发展,是为研究自然界中非均匀和各相异性现象而提 出的它与简单分形的区别在于其标度性质,这类奇异集的维数构成一个连续的谱 多重分形分析的目的在于量化测度的奇异结构,以及在尺度发生变化时,为伴随有 不同范围幂定律的现象提供模型多重分形分析方法是一个非常有用的工具,在物 理、地质、材料科学,模式识别、自然图像的模拟和信息信号的处理等方面都得到 了广泛地应用i 复杂的交通系统也是一个复杂的非线性动力系程,因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高数知识点总结
- 玉溪螺旋换热器施工方案
- 建筑楼顶拆除方案范本
- 廊坊职业技术学院《口腔颌面外科学1》2023-2024学年第二学期期末试卷
- 南京大学《西方翻译流派》2023-2024学年第二学期期末试卷
- 天津财经大学《版面设计与软件应用》2023-2024学年第二学期期末试卷
- 《教学内容和数据流程》课件
- 山东城市建设职业学院《中国建筑史B》2023-2024学年第一学期期末试卷
- 厦门大学嘉庚学院《基础食品化学》2023-2024学年第二学期期末试卷
- 《精粹课件资源库》课件
- 糖尿病足科普
- 妊娠合并结缔组织病
- 2015-2024年十年高考物理真题分类汇编专题04 曲线运动(解析版)
- 幼儿园食堂原材料采购 投标方案(技术方案)
- 电化学储能电站巡视检查、故障处理表格汇编
- GB/T 25085.1-2024道路车辆汽车电缆第1部分:术语和设计指南
- 2024新版《药品管理法》培训课件
- 2024-2030年版中国物流包装行业市场竞争格局及投资运作模式分析报告
- 国际机场交通标志导向方案
- 2024年大学生电子版三方协议书模板
- 制冷与空调设备运行操作作业安全技术实际操作考试标准
评论
0/150
提交评论