(计算机应用技术专业论文)基于自相似特性的网络业务流的研究.pdf_第1页
(计算机应用技术专业论文)基于自相似特性的网络业务流的研究.pdf_第2页
(计算机应用技术专业论文)基于自相似特性的网络业务流的研究.pdf_第3页
(计算机应用技术专业论文)基于自相似特性的网络业务流的研究.pdf_第4页
(计算机应用技术专业论文)基于自相似特性的网络业务流的研究.pdf_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 题目:鉴t - 自州似特r f 的h 络q k 务流的 f 究 专业:计算机应j j 技术 研究生:毛监 导师:刘渊 自从l e l a n d 等人往9 0 年代初第一次明确的提f 1 5 了网络流蕈中存在着臼相似现象以来,研究人员 发现不论网络的拓扑和业务如何,网络流颦t p 都能检测刨白相似特性。 其中h u r s t 参数是评估白相似性的重要参数本文提出一个新方法米评估网络门相似过拌中的 l t u r s t 参数,fh 使圳人l + 合成数据和实际数据米测试,与基丁小波的i l u r s t 参数估计法做比较, 实验表明该方法比小波法更快,f 儿产生j 很小的h u r s t 参数估计的置信r 问。接着什埘传统检测方 法存 :的问题,将这一新n 0t u r s t 参数评估疗法庸川剑d o s 攻击榆测f 1 ,由,参数变化爿乏榆删i ) o s 攻击。通过分忻d a r p a1 9 9 8 入佳榆测数掘表明,鹾j :该法的t t u r s t 参数评什能够检测纠d o s 攻,h 此法比传统的甚r 特征旺配的网络流划异常榆测法n 一柃洲精度j 二有较人提高。 由r h 络的n 相似性,传统的垦丁泊桧过拌午马尔科大模7 弘筲已不能反映准备反映网络流草。 佣此本文研究j 基1 :白相似性的网络流鼙预测,件jq p s o ( q u a n t t i m b e h a v e dp a r t i c l cs w a r m o p t i m i z a t i o n ) 对预测臼相似性网络流草的最小均值峰度l m k ( l e a s t 、l e a nk u r t o s i s ) 方法进 i 优 化,能够获得较小的s w7 ( s i g n a lt on o i s er a t i o ) 。通过对真实网络流罐的仿真实验,表明该 法比l m k ( 最小均值峰度) 算法更能够对网络流蛙进行精确的,测。 关键字:自相似性,h u r s t 参数,拒绝服务攻击,流量预测,最小均值峰度,q p s 0 算法 江南人学倾i 学位论史 a b s t r a c t t i t l e :r e s e a r c ho nt h es e l f - s i m i l a r i t yo fn e t w o r kt r a f i l e s u b j e c t :c o m p u t e ra p p l i c a t i o n s g r a d u a t es t u d e n t :m a ol a n t u f o r :l i uy u a n s i n c et h es e m i n a ls t u d yo fl e l a n d ,t a q q u ,w i l l i n g e r ,a n dw i l s o nw h op o i n t e do u tt h ee x i s t e n c eo f s c a l i n gb e h a v i o ri nt h en e t w o r kt r a f f i c ,t h es o - c a l l e ds e l f - s i m i l a r i t y ,t h e r ei sn o wa m p l ee v i d e n c et h a t s c a l e i n v a f i a n tb u r s t i n e s si sa nu b i q u i t o u sp h e n o m e n o ni naw i d er a n g eo fg e n e r a l i z e dd a t at y p e s ,f r o m l o c a l a r e aa n dw i d e a r e an e t w o r k st oi pa n da t m p r o t o c o ls t a c k st oc o p p e ra n df i b e ro p t i ct r a n s m i s s i o n m e d i a h u r s tp a r a m e t e ri sav e r yi m p o r t a n tp a r a m e t e rt oe v a l u a t en e t w o r ks e l f - s i m i l a r i t y i nt h i sp a p e r ,an e w m e t h o dt oe s t i m a t et h eh u r s tp a r a m e t e ro ft h ei n c r e m e n tp r o c e s si nn e t w o r kt r a f f i c - ap r o c e s st h a ti s a s s u m e di ob es e l f - s i m i l a ri sp r e s e n t e d t h ec o n f i d e n c ei n t e r v a l sa r eo b t a i n e df o rt h ee s t i m a t e su s i n gt h e n e wm e t h o d 1 、i sn e wm e t h o di st h e na p p l i e d t op s e u d o r a n d o md a t aa n dt or e a lt r a f f i cd a t a w ec o m p a r e t h ep e r f o r m a n c eo ft h en e wm e t h o dt ot h a to ft h ew i d e l y u s e dw a v e l e tm e t h o d ,a n dd e m o n s t r a t et h a tt h e f o r m e rj sm u c hf a s t e ra n dp r o d n o e sm u c hs m a l l e rc o n f i d e n c ej n t e r v a l so ft h eh u r s tp a r a m e t e re s t i m a t e a n d t h e nt h ee s t i m a t i o nb a s e do nh u r s tp a r a m e t e ri su s e dt od e t e c td o sa t t a c k ,r e s e a r c h e do nt h ea f f e c to fh u r s t p a r a m e t e rc h a n g eb r o u g h tb yd o sa t t a c k b ya n a l y z i n gt h e1 9 9 8d a r p ai n t r u s i o nd e t e c t i o ne v a l u a t i o n d a t a s e t i ti sv e r i f yt h a tt h i sm e t h o dc a nd e t e c td o sa t t a c k a n di sm o r er e l i a b l eo nt h er e c o g n i t i o no fa l l k i n d so fd o sa t t a c k t h a na n yo t h e rm e t h o db a s e do nm e a s u r ep r e c i s i o n t h ee x i s t e n c eo fs e l f - s i m i l a r i t ys h o w st h a tp o i s s o no rm a r k o vp r o c e s sc a n n o ta c c u r a t e l yd e s c r i b et h e r e a ln e t w o r kt r a f f i c i nt h i sp a p e r ,t h et r a f f i cp r e d i c t i o no ns e l f - s i m i l a r i t yi sr e s e a r c h e d l e a s tm e a n k u r t o s i s ( l m k ) b a s e do nq p s o ,w h i c hc a no b t a i ns i g n a le r r o rr a t i ol e s st h a nl m k ,i sp r o p o s e dt op r e d i c t t h es e l fs i m i l a ri r a f f i c t h es i m u l a t i o nr e s u l t sw i t ht h er e a lt r a f i l et r a c e ss h o wt h ea c c u r a c ye f f i c i e n c yo ft h e m o d e l k e y w o r d s :s e l f - s i m i l a r i t y ,h u r s tp a r a m e t e r ,d e n i a lo fs e r v i c ea t t a c k ,t r a f f i cp r e d i c t i o n , l e a s tm e a n k a r t o s i s , q u a n t u m - b e h a v e dp a r t i c l es w a r mo p t i m i z a t i o n i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 本人为获得江南大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名:白妊日期:司年3 月7 2 日 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规 定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 日期:a 坩7 年弓月、1 ,日 第一幸绪论 1 1 课题研究背景和意义 第一章绪论 很k 时间以来,网络流量的业务源都是川泊松过程来进行描述的。根据许多已有的马尔科丈分 折的结论羽i 摊队分析的一些基本方法,人1 f j 能够对以泊松流作为业务源的排队系统进行深入的性能 分析,并且得到等待时间,队列长度等性能参数的精确结论。同时,泊松过程有着十分简单的相关 结构,这使得泊松到达的排队系统具有很好的性能。 然而,k e l a n d t a q q u ,w i l l i n g e r t f w i ls o n 在9 0 年代初发表的具有开创性意义的论文“o nt h e s e l f s i m i l a rn a t u r eo fe t h e r n e tt r a f f i c ” 1 ,2 及其修订版 3 中第一次明确的提出了网络流 鼙中存在着臼丰目似现象。在这两篇论文中,l e l a n dj tr w i l s o n 1 ,2 ,:3 对自己在g e l l c o r em o r r is t o w n 的研究年i 群中心的儿个以太网网段上所采集的人量的高分辨率( 2 0us 的时问精度) 的网络流量 数据进行统训分析,证实了真实的网络流量具有统计+ 上的臼相似性( s e l f s i m i l a r i t y ) 。这两篇论 文打破了使j _ j 泊松流量假改进行直接的排队分析就已足以描述所仃网络流鼙的幺j 想,发起了对数据 流餐性能的重新研究,是近十年来互珲茭网领域展重要的论文之一。 与此同时研究还表明业务量的白相似性对网络性能彳深刻的影响,它直接影响到网络的没计、 控制、分析羽l 管理。例如:在文献 4 ,作者指出在泊松假没基础上所做的排队分析导致a t m 交换 机厂商生产了带有小缓存( 1 0 - i 0 0 信元) 的第j 干交换机。这些交换机在实地安装并经受实际通信 苗时,信元的实际丢失率远人丁预期的结果,这导致不得不重新设计这些交换机。冈此,国内外同 绕这一课题展开了人量的研究r 作,取得了一些成果,但仍存在人量的问题有待解决,例如目前还 没有一套完整的技术能解决白相似网络流量f 队列性能的分析问题。 随着网络异质性的加剧,更多类型的业务荆i 更多的协议的出现将使网络流量的白相似性更加普 遍。对白相似业务的检测、参数估计、数学建模和排队分析已成为高速网络流餐控制和业务鼙管理 中不可缺少的要素。在网络流控上考虑自相似性特征,并指定相应的控制算法会取得较好的效果, 将会对网络性能的优化和稳定有重要意义。 i 2 研究现状 1 2 1 自相似特性的研究 7 0 年代人们主要借鉴公共交换电话网络p s t n 的流量模型,用p o is s o n 模型来描述数据网络的 流量模型 5 ,随着研究的深入逐渐引入了各种推广的p o i s s o n 模型平u 其它较为复杂的随机模型,但 这些模型的共同特点是所描述的业务序列具有短时相关性( s h o r tr a n g ed e p e n d e n c e ) 。由于网络测 量技术的限制,在很跃一段时间内,网络研究人员不能得到大量实际的网络业务数据进行分析研究。 从1 9 6 6 年到1 9 8 7 年间,围绕实际网络业务测量的论文仅有5 0 篇左右。曲于【网络业务测量= i :作的滞 后,使得研究人员很少从统计意义上考查这些传统模型与网络实际业务的拟台程度,导致在网络研究 过程中,不断有研究人员对传统模型的有效性提出置疑。近二十年里,i n t e r n e t 的迅速发展和新的 网络业务不断出现,使网络业务的复杂性和突发性已更加显著,揭示现代网络业务的真实特性成为研 究现代网络技术的关键。近年来,网络测量技术的发展使得网络研究人员测量和分析大量的业务数据 成为可能。l e l a n d 3 等人首先研究了网络中数据流的分布特征,他们收集了数百万个实际传输的数 据包。这些所测量的业务数据是来自不同主机的聚集业务,不考虑业务源的具体类型。而传统的业务 模型是建立在对独立业务源精确建模的基础上。通过对大量实际业务数据的分析发现实际网络中传 输的数据包,其到达时间在时间尺度上有某种程度的自相似特性。这个发现首次以大量高分辨率的实 际业务数据为分析对象,揭示了现代网络业务的真实特性,标志着网络业务建模和性能分析领域进入 江南人学坝1 学位论文 一个全新的阶段。该d , n 的研究论文“o nt h es e l f s i m i l a rn a t u r eo fe t h e r n e tt r a f f i c ”破认 为是网络业务建模和l 性能分析领域最重要的研究成果之一。w w i l l i n g e r 聚焦1 :源端,研究了单个源 目的对的流鼙过拌分布所节现山的分形特性:j h b d e a n e 筲研究者试图将流苗分形的产生旷 冈 丁源端和目的端间的相互作_ l j ,认为协议的这种动态特性可以导致分形的产生:a f e l d m a n 等研究者 在充分探讨,t c p 流的多重分形特性之后,发现多重分形特性可能和i p 网络的运行机制有关。 r a a t i k a i n e n 对以太网文什服务器上的信包土u 达过再进行了研究。v p a x s o n 和s f l o y d 曾研究了 一个t c p 连接的流链特性与且联网t c p i p 体系结构层次即网络运行和控制机制相关:a e r r a m i l l i 的j :作证实了这一点。洛桑e d p l 实验室测昔了以太网上的业务流。k 1 i v a n s k t y 等人对分布丁全美 的多个n s f n e t 中的核心交换机进行了采样升在p a c k e t 级上分析了n s f 广域网的业务特性。c i n o t t i 等对舣队列烈总线d q d b 的城市网m a n 进行了观测分析。h e y m a n 等人测鼙亓分析了a t m 网络中传输视 频会议业务表现山的一些特性。 研究结果证明:实际网络业务酱遍存在统计上的臼相似性,该特性与业务发生的时间地点或信元 编码方式无关。不论嘲络的拓扑结构、h j 户数茸、服务利利川类掣如何变化这种白相似性是始终存 在的。网络业务的 】干 i 似忭对队列系统雨l 网络性能部产中j ,一! ! 意想不剑的影响,由1 j 传统模删不能 准确描述m 络业务的自相似性,他i ,r 多以传统模,弘为j i l 础的网络研究成果需要叵新修订。随着高速网 络的推j ,其网络结构和协议也在f i 断改进,对刚络白相似特性的研究对1 :分析与改善网络性能、政 进网络技术变得极其重要。 1 2 2h u r s t 参数评估 南 :网络甲现j l l 自相似性,冈此州h u r s t 参数米表征业务流突发特性,如果不考虑h u r s t 参数 的影响,对丁网络传输过稃中出现的拥搴概率的什计会过丁- 乐观 6 通常突发业务流的b u r s t 参数住 0 5 剑1 之问,表示业务只有止的相,乏绵构,b u r s t 参数越人说明业务的突发群度越剧烈。冈此,对 h u r s t 参数的估计亢接影响剑业务苗建模的准确稃度。现有文献给出的估计方法- t 要为时域法和频 域法,其中时域法包括r ,一s 分忻、方筹一时间分析,i d c 分析 3 ,频域法包括w h i t t l e 的最人斯然 估计 3 和基丁周期图的t 参数估计 7 等。时域法直接对样本序列进行处理,作出分析曲线,h j 最 小_ 二乘拟合估计h u r s t 参数;频域法则利川f f t 对样本序列的谱密度在频域进行估计。但是它们都 要求获得矗i 攀个观察时间段内以最小时隔采样的全部业务计数过拌样本序列,当分析较 := 时间范用 的业务量数据时,需要人量样本平k 时间的高采样率,而且难以捕捉b u r s t 参数的时变特性。 1 2 3 网络流量预测 网络流量行为的刻画对于实现数据可靠传输,合理分配网络资源具有重要的指导意义。随着计算 机网络规模的扩展和业务种类的不断增长,网络流簧时问序列已经成为一个1 # 线性、多时间尺度变化 的动力系统。在真实环境中的网络流量呈现出相当明显的多尺度特性,如分形、长程相关、白相似性、 突发性等,因此传统的网络流晕模型,如m a r k o v 模犁、p o i s s o n 模犁、自同归( a r ) 模型、自闸门滑动 平均( a r m a ) 模型等,已经不能有效地刻画流量的这些特性,寻求新的模型方法成为当前网络流餐行为 研究的个热点 3 ,8 ,9 。 1 3 本文主要工作 本论文综合分析的自相似网络业务流的情况,其中重点研究了自相似模型的重要参数h u r s t 参 数和网络流量的预测两方面的内容,并由此提出了优化h u r s t 参数的方法,并运州到d o s 检测中, 随后还提出了新的流鼍预测模型。论文主要完成的工作内容具体包括: 1 分析的网络流域的臼相似特性和自相似模型,给出了自相似特性的数学描述,对自相似模型进行 了综合归类和分析。 2 第一章绪论 2 在了解了t t l 相似的一些特性及模鼎之后,重点研究了1 3 相似模鼎的主要参数t t u r s t 参数给山r 7 种经典的h u r s t 参数评估算法,并且将这7 种做了比较。而后深入研究了现在新的h u r s t 参数评 估算法。 3 提山了一种优化的h u r s t 参数算法,并且使州人工合成数据平i i 实际数据来测试,与小波做比较, 实验证明该方法比小波法更快更准确。 4 将该方法用丁d o s 攻击检测中,实验表明该方法具有低误报率,能够有效地检测d o s 攻击。 5 网络流量预测是对网络流鬣特征的刻画,网络流量预测是业务管理的关键问题,网络流量预测的 精确性,实时性,广谱性直接关系剑业务管理的效率和性能。传统的模型通常假定网络流颦满足线 性关系。本文提山了一种基tq p s o l m k 的算法对i 3 相似网络流耸进行预测,实验表明具有较小的预 测误著。 1 4 论文的组织结构 笄章仃的内容分布如f : 第章是课题的相关背景总的概述,引i l lr 本文将要研究的问题,闸颂了网络白相似发现之后对网 络业务的影响 第二章分析的网络流量的i 3 相似特性和门相似模型,给了自相似特性的数学描述,对1 3 相似模艰 进行了综合门类和分忻。 第三章给出了儿种典型的h u r s t 参数评估算法,并且比较了这儿种算法的算法复杂度以及对估计序 列需要的长度。 第四章提出了一种优化的h u r s t 参数算法,并且使州人t :合成数据利实际数据来测试,与小波做比 较,实验证明该方法比小波法更快更准确。 第五章将该方法川于d o s 攻击检测中,实验表明该方法具有低误报率,能够有效地检测d o s 攻击。 第 章总结了典型的网络预测方法,提出了一种基t - q p s o l m k 的算法对1 3 相似网络流鲑进行预测, 实验表明具有较小的预测误差。 江南人学坝i 。学位论文 第二章自相似特性及模型 2 1 网络业务的自相似性 2 1 1 自相似性 白相似性( s e l f s i m i l a r i t y ) 是指一个随机过样在各个时间规模上具有相同的统计特性。网 络通信中的力相似性表现在较k 一段时间内。单位时间内分铜数的统计特性不随时间规模的变化而 变化。白相似性的另一个重要特性是k 张相天性,主要表现在随机过样的_ 二阶统计特性上。 卜面给山其统计描述 1 0 。 没x 一忸,j = 1 ,2 , 为一协方若平稳的随机序列,即x 足有恒定均值;阻,】,和有 限方著d 二;l ( x ,一) :j ,其白相父函数r ( 七) :e 陋,一肛x x 。一肛彤盯二以一0 , 1 2 ) 仅与埔 关。假设x 的白相天函数f t f 如f 形式: ,仅) 、k - l 。似y ,k o 。 其帆脚 舭蜘。删姆锱= , 令x m ) ;生生。m l 生二三墨j :l 2 ,3 ,) 为x 的。阶平滑过程,并记时间序列 置( ) = 伍f ,x 少,) 的白相关函数为,抽) ,m 。1 , 2 ,3 ,。 定义1 过程x 被称为严格- 二阶自相似的且具有自相似系数h ;1 一要,如果其鼢平滑过群石( m ) 具有与原过程x 同样的相关函数,即r b 啦) 一,任) 对所有m - 1 ,2 ,七一1 ,2 ,) 成立。 定义2 过程x 被称为是渐近二阶白相似性的,且具有自相似系数日。1 一要,如果 r b ( 1 ) 一2 ,一1 ,删一m 及r 协忙) 一1 _ 6z kz 一,m m 任。2 ,3 ,) 式中62 ( 厂) 表示作朋在,上的- 二次差分算子? e p 62 ( ,任) ) = ,啦+ 1 ) 一2 厂仅) + ,伍一1 ) 严格( 或渐近) 自相似过程最显著的特点是它的口阶平滑过程x ( 卅) 在m q o 时相关函数结构上 是非退化的,这一点与传统的p o i s s o n ,m a r k o v 等短时相关过程自相关函数的指数衰减,即当 小一时,钿瞎) 一0 ( 即工b ) 趋于白噪) 完全不同 1 2 。 尽管存在大量旱观自相似特性的随机模型,但目前通过和真实业务流量数据比较认为适于作为 突发业务建模的随机模型只有分形布朗运动和分形a r i m a 过程 1 1 ,而且它们都基于分形高斯噪 声。其中分形布朗运动的独立增量过程即为分形高斯噪声,而分形a r i m a 过程可视为, y 形高斯噪卢 经一以a r i m a 参数为滤波器系数进行滤波的结果,分形高斯噪声的自相关函数满足 4 第一章 自相似特性及模型 ,忙) :霎妊+ q ”一2 盯“+ 卜_ 2 “) ,t _ 1 ,2 ,3 , 上 当0 5 hs1 时,分形高斯噪卢为具有h u r s t 参数为h 的严格二阶白相似过程,冈其参数 简单而成为臼相似业务建模的主要t 具。有关对突发业务源进行自相似建模的详细论述弛丁 1 3 1 4 。 2 i 2 网络业务的自相似性 白相似( s e l f s i m i l a r i t y ) 模型是日前所知流耸模型中,最能描述网络中数据流k 科相关性的流 量模型。所谓数据流的白相似性也就是说,网络上的数据流没有一个本质的突发长度,在每个时间 规模上,从微秒到分钟,从分钟n 4 , 时突发期由一些突发子周期构成,这些突发子周期义由一些 更小的突发子周期构成。 网络业务中的白相似性主要表现为突发性存在丁多个时间规模上而且具有相同的统计特征。这 与习惯的思维方式一突发性可以经统计平均而加以平滑是相矛盾的。 9 0 年代咀米,人量的网络测鼙! j 分析证明,真实的网络业务具有统计上的 白相似性。其中较为著名的i 作见表2 1 1 5 。 a 相似性的存在给网络性能带来一些意想不剑的影响,它商接影响网络的发计、控制和管理。 表2 - 1 著名的真实网络业务自相似性研究工作 1 9 8 9 1 9 9 2 e t h e r n e ti r a f f i c b e l l c o r e1 a b 的l e l a n dw ,t a q q um ,w i l l i n g e r w l i w i l s o nd 说明通常以太网数据业务具 1 9 9 4 有白相似性f 2 】3 1 。 w i d ea r e an e t w o r k st r a i f f i cl a w r e n c e b e r k e l e yl a b 的p a x s o nv 和 u n i v e r s i t yo fc a l i f o r n i a ,b e r k e l e y 的f l o y ds 说 明通常广域网数据业务具有自相似性1 2 1 1 9 9 4 1 9 9 5v a r i a b l eb i tr a t ev i d e og a r e t tm 雨i w i l l i n g e rw 在s 1 g c o m m 9 4 发 t r a f f i c表论文说明通常v b r 视频业务具有自相似性 4 】。 b e r a nj ,s h e r m a nr ,t a q q um ; l l w i l l i n g e rw 在i e e et r a n s a c t i o n so nc o m m u n i c a t i o n s 发表 论文说明v b r 视频业务具有长相关性 1 7 】。 1 9 9 5 1 9 9 6w o r l d w i d e w e bt r a f f i c b o s t o nu n i v e r s i t y 的c r o v e l l am ,a b e s t a v r o s 等发表论文说明通常w w w 业务具有自相似 1 9 9 4 性【1 8 】。 s i g n a l i n gs y s t e mn u m b e r7 d u f f vd e 等在i e e ej o u r n a l o ns e l e c t e d 仃a f f i ca r e a si nc o m m u n i c a t i o n s 发表论文说明通常7 号信令系统业务具有自相似性1 2 5 1 。 2 2 自相似性模型 常见的自相似数据业务模型分为单源和聚合源两种 1 5 。其中单源模型有:p a r e t o 分布、对数 正态分布;聚合源模型有:o n 一0 f f 模型、分形布朗运动模型、分形高斯噪声模型、分形a r i m a 过 5 江南人学坝j 学位论文 程模喇、分形l d v y 过程模删、基j :混沌映射的确定性模删 2 1 。 2 2 1 单源模型 1 p a r e t o 分布模型 p a r e t o 分布是带2 个参数的幂函数,即形状参数a 和f 端裁i r 参数口( 如 随机变颦x 的最小值) 。p a r e t o 的累计分布函数( c u m u l a t i v ed i s t r i b u t i o nf u n c t i o n ) 为: 刖小a 概率密度函数为: ,b ) ;芳( 譬) ”+ 1 x ,口”d a ,。 ( x ) = f g ) = 0js 卢 均值为: e 口】:芒 口一l ,a 矿2 瓦哥百习2( a 一1 ) 二( a 一) 当a 2 ,芦一1 时方著如f : 口s 1 时分布具有无限均值 1 量as2 时分布具有有艰均值和无限方差 口2 时分布具有无限方差 另外,形状参数a 与h u r s t 参数的关系为 h 。尘旦 p a r e t o 分布在物理学和社会学等领域有着广泛的麻_ h j 。 2 对数止态分布模型 如果随机变量y l o g x 具有正态分布,那么x 就具有对数正态分布。该分布有2 个参数,即l n ( x ) 的均值 o ) 和l n 0 ) 的标准差口p ,0 ) 。当o t 工c m ,对数正态分布的累计分布函数和概率 密度函数为: 刖。壮矿( 等) 】 ,g ) 。而1 e 了 6 第二章白相似特性发模型 误差函数e 玎( y ) 定义为 e 删。- - 。护e - d t 对数l l 态分布的均值和方著为 d 2 e x 】= e ”了 v a r 瞳 m e 2 “+ g 2 妒一1 ) 对数正态分布应h j 于人昔领域如衰退建模分析的试验设计、多网子模型中的误著分忻等。 2 2 2 聚合源模型 1 0 n r o f f 模璎 1 9 8 6 年,m i t 的j a i n _ r o u t h ie t 在对令牌环网的观察基础上,提出利川o n o f f 模璎( 通常也 称为p a c k e tt r a i n 模7 性) 米描述实际观测刮网络流量的突发性。但是,传统| ! t j o n o f f 模,弘无一倒 外的假设0 n 区间 i i o f fr 间的分布的方著是有限的。在无穷多个o f f 澌! 替加之后汇聚而成的 随机过程类似丁高斯白噪声,除了在很短的时问范同内,其他区域的相关性儿乎为零。另外, m a n d e l b r o t 曾经在 2 2 提出,人耸的具有n o a h 效应的源叠加可能产生白相似的通信姑。新的o n , o f f 模型的提出止是基丁这两个观点。 0 n 0 f f 模型的具体说明如p 2 :3 : 对丁一个独立的随机源,假设它是一个平稳的二进制随机序列,记作( w o ) ,t 0 ) 。r = l 表 示在时刻r 产生了一个分组r = 0 表示在时刻 没有分组产生。丁是,在0 n 区间里,旷n ,= l , 在o f f 区间里,旷俐= 0 。 假设每个0 n 区间的长度是独立同分布的;每个o f f 区间的k 度也是独立同分布的:o n 区间和 o f f 区间之间是严格交替的,而且故度相互间也是独立的;值得注意的是,o n 区间5 f i i o f f 区闭并不 一定具有相同的分布。 假设有个这样的独立同分布的随机源,则在时刻f 汇聚产生的随机过程的分组数可以表示为: o ) = w ( m ( f ) 考虑个尺度园子五在 0 ,z n n n n 内累积到达的分组数为 嘭陆,偿w 仁归 下面我们只考虑和t 很大时候的情形。可以证明,对于足够火的胴足够大的如上定义汇 聚而成的随机过程慨l fzo 从统计上满足: l l i m ll i r a t mo ( 竺! :! 羞d t h 瓣 = d 。古。o ) 其中,l 和芦2 分别表示o nn n n o f f 区间的平均值,l 倒是一个与o n 1 司o f f 区间的分布 有关的渐进函数,。口血和口口抽是一个与0 n 区间o f f 区间分布有关的常数,并且l dm i n 2 。 7 江南入学坝i j 学位论史 b t t r f ,是一个分形布朗运动,其h u r s t 指数满足胆( 3 一口r a i n ) 2 。 直觉上,上面这个定理说明,无穷多个具有n o a h 效麻的、独立同分布的o n o f f 源汇聚产生的 随机过样,可以如f 描述: 峨伍) ;t m 上f + 吼。b 。( f 矿”厕 肛l + p 2 即,聚合流的平均流晕可以川t m i t l r i b , 1 + p 2 ) 米描述,而流鼙的波动水平可以片j 一个分形布朗运 动来描述。 同时注意剑,由丁1 dr a i n ( 2 ,所以0 5 1 。这说明聚合生成的网络流苗具有k = 相关的 特性。 对网络中的实际流草进行分析,可以证实0 n 区间与o f f 区间的k 度分布均符合p a r e t o 分布, 并且o n 隧间,d = 1 7 ,对j i o f f 区间,a = 1 2 。 可前面的分析可以石出,o no f f 模,弘是一个加性结构的模,p 。这个模7 科描述了人韬与户行为 相天的h 络连拨蒋加时的特性。o no f f 模j 弘不仅简单,而h 十分直观地揭示j ,h 络流射的n 相似特 性产:生的原。这个棋q u 列j i 拔刨丛的过稃进行了简单的假设,同时似设连接的持续时i u j 服从重拖 尾分布。住这两个简单假发的魑础上进i r 严格推导,可以让明聚合网络流牮具有白相似或渐进臼相 似粕性。 o no f f 的模掣的局限性土要在丁,由丁没有考虑剑端剑端的控制对单个连接中实际分组达剑产 生的影响,这个模刑不能表现jl 体| 办议对网络流姑的影响,冈此它小能精确描述扛较小的时问尺度 上,网络流餐所表现出来的局部的小规则特性( 多重分形特性) 。 2 分形布刚运动模删 布朗远动 1 8 2 7 年,英国植物学家r b r o w n 发现,悬浮在液体或者气体中的微粒由丁i 连续的受剑周隔分 子的碰撞而不停坝的作不规则的运动,人们把这种现象称为布朗运动。1 9 0 5 年,a e i n s t e i n 指山, 不管运动住表面上如何不规则,这些粒子的移动是可以瑚概率规律米分析的。剑了1 9 2 3 年,美国数 学家n w i e n e r 开始把布朗运动作为随机过程米研究,而且很快m l e v y 等数学家将之作了很人的发 展。 w i e n e r 乖l l e v y 如下定义布朗运动: 布朗运动口( f ) 是这样一种运动,它的初始位置口( o ) = 0 ,其后的位移b ( f ) 一b ( o ) 服从( o ,q t ) 分布( 口是一个反映布朗运动强度的参数) ,而且在两段不相交叠的时段( f 2 一t i ) ,( f 。一t 3 ) 间其运 动距离【8 0 :) 一曰o 。) 】,陋o 。) 一口( f ,) 】不相关,即【( 占o :) 一b “) o 。) 一b o ,) ) 】= 0 。 可以证明,布朗运动的增龟,陋o :) 一口o 。) 是零均值,方差为口2 k 。一t ,l 的平稳随机过程。 分形布朗运动 分形布朗运动最初是为了刻画实际中存在的v ,过程而提出的。由于】,过程的功率谱在 h o 时具有厂j d ) c ,i v l ”的形式,所以获得这种1 ,过程的最直观的方法是,用一个高斯白噪 声通过一个合适的线性时不变系统即可。这个线性时不变系统的冲击响应应为 v ( 0 - 碉1 r “( f ) 8 第一帝 自相似特性及模型 嘲为上式的j 义l a p l a c e 变化为 y 0 ) ;s - ( “5 ) 其中,“( f ) 是阶跃函数,r ( ) :睦g a m m a 函数。这样,1 f 过程可以表示为 z ( r ) = v o ) + w 。) = 亍= i 高,。一r ) h - 0 5 w ( r p r cz 一, 其中,w o ) 是高斯白噪卢。 实际上,这样定义1 ,过科是不合适的,冈为除了胆o 5 以外,取其它任何值时( 2 - 1 ) 定义的过 科都是不稳定的。为了避免这个问题,b a r n e s l l a l l a n 对( 2 - 1 ) 的定义进行了修改。他刷在时域定 义的1 ,过群形式为 x o ) = 亍1 j i j 网,| r r l ”一。5 w - r cz z ) ( 2 - 2 ) 定义的过稃仍然有着不足,这个过程是不平稳的。为此,m a n d e l b r o t 提出采瑚( 2 - 3 ) 米 定义l ,过科: x ( o ) b 。 舯x ( 。) = 而眇吖r 5 w 。0 5 阢) + 肛r r 5 b t ) 】( 2 - 。, 其中,日( f ) 是布朗运动,t 0 。,是t l u r s t 指数,且满足o ( h 1 。对t t 0 ,可以类似定义。 从( 2 3 ) 可以看出,这样定义的过程通过引入h u r s t 指数( 取值在0 到1 之间) 对布朗运动 进行了推“。由于这个过程具有分形维的特点,所以这个过程通常被称为分形布朗运动。从公式( 2 - 3 ) 可知,当b 。= 0r h ;0 5 的时候,分形布朗运动x o ) 退化成了布朗运动( 此时r ( 1 ) = 1 , 日一o 5 = 0 ) 。 分形布朗运动具有许多有趣的特性。其中最重要的一条是,它的增量是平稳统计自相似的, 即: z o + f ) 一工o ) :口一一晰+ 盯) 一x 0 ) 】( 2 - 4 ) 如果x ( o ) = 0 ,且公式( 2 4 ) 中f 一0 ,则公式( 2 4 ) 可以写作: x 扛) 三。一”x ( 口r ) ( 2 - 5 ) 从公式( 2 5 ) 可以知道,分形布朗运动是自相似过程。但这个过程却不是平稳的,可以证明分形布 朗运动的协方差函数为: 如o ,。) ;防。培b ) 】:宰6 。”+ 旷一i t - sj 2 ”) ( z - 6 ) 9 江南人学帧i :学位论义 其中, 咿2 v a r 刺钟捌) ! 掣 在公式( 3 - 6 ) 中,令s t ,则有 v a r x ( t ) = 盯川2 ” 由丁- v a 出o ) 与f 有关,r x ( t ,s ) 7 6 仅l j t 一5 有关,而且与起点r 有关,所以分形布朗运动工( f ) 是 分形高斯运动的定义过拌与从布朗返动定义赢斯向噪声的过拌类似。分形布朗运动x ( t ) 的门一 缸b ) ;生兰生型 一枇* 竿眇州门州”】 当h ,时,上面的式子可以化简为: 尺。( r ,s ) = 盯;h ( 2 h 一1 】r l 2 ”- 2 令一o ,h h 一1 ,则可以定义分形布朗运动的广义微分: 工( f ) 。石d 工鳃血2 耐。i h - i 2 f o - 如 称分形布朗运动的广义微分工t ) 为分形高斯噪声。 当】2 h 1 时,从x 鼍) 的白相关函数可以看出,相关函数与同号, 且一1 2 h 一2 ( 0 ,所以此时分形高斯噪声呈现长相关特性( 1 0 n gr a n g ed e p e n d e n c e ) 。相关函 数可以用表示为: r x ( r ) 。k ( f h 扛一f ) 。口三+ 1 x 2 h 。+ 1 r 1 2 ”。( 2 7 ) 由3 7 可知分形高斯运动的功率谱为: s ( 山) 一仁t 仁k “d f ,o - t o u r - l 叫一2 “”i 叫t c l 4 分形a r i m a 过程 除了分形布朗运动、分形高斯噪声以及a 分布的自相似过程以外,另一个常用的自相似过 1 0 第一:章自相似特性及模型 分形a r i m a ( p ,g ) 过程j 的最一般形式为: 中c 日留,= e ( b ) v 一。( 2 8 ) 其中( s 。:七= 0 , 1 ,2 ,) 为白高斯过程:中佃) ;1 一中。协) 一中。佃p 为h j q x 页( a r ) , e 佃) = 1 - 0 ,陋) 一o q 陋户,为滑动平均项( m a ) ;曰是后向算子,b x 。:x 。;v 1 一b , 表示幕分算子。 值得注意的是, v 。= ( 1 - 占y = c :( 一b r 是一个分形差分算子。其中 a ( 一1 r = r ( 一d + ) r ( 一d ) r 睡+ 1 ) 】,厂( ) 表示厂分布。 通常住研究白相似现象时,采刖的分形a r m a 过利是公式( 2 - 8 ) 在p = 口= 0 时的。个特例。 这个时候, x t2 v d = ;c 扎 其中,c ,= r ( j + d 肝0 ) r ( ,+ 1 ) ) ,j 芑1 由丁,_ + 。时,c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论