(应用数学专业论文)超高频金融时间序列建模及分析.pdf_第1页
(应用数学专业论文)超高频金融时间序列建模及分析.pdf_第2页
(应用数学专业论文)超高频金融时间序列建模及分析.pdf_第3页
(应用数学专业论文)超高频金融时间序列建模及分析.pdf_第4页
(应用数学专业论文)超高频金融时间序列建模及分析.pdf_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 超高频时间序列的分析与建模是金融计量学中一个全新的研究领域。高频时 间序列通常是指以每小时、每分钟甚至每秒为频率所采集的金融类数据;而超高 频时间序列是市场上每笔交易的实时数据,其中包含了丰富的市场信息。传统的 计量经济学建模是基于固定时间间隔的数据建模,而金融市场上大多数的信息是 连续不等间隔的变化过程。e n g l e 和r u s s e l l ( 1 9 9 8 ) 首次提出了运用于不等时间间隔 的a c d 模型。 本论文首先研究了金融超高频时间序列的特性,对各类a c d 模型的模型形式 进行具体的介绍,并利用我国股市的实时分笔交易数据对各种a c d 模型进行了比 较分析,论证了a c d 模型与中国证券市场交易持续期的吻合情况。 金融超高频时间序列一般包括两类变量:一类是交易到达的时间,另一类变 量通常被称为标值,包括价格,销售量等。为了反映两类变量传递着的重要信 息,g h y s e l s 和j a s i a k 把a c d 模型与a r c h 模型结合起来,提出a c d g a r c h 模型。 除此以外,交易额的变化也传递着有关交易的重要信息,对它进行探讨研究,有利于 人们对金融市场微观结构的掌握。于是本文在前人基础上,加入了交易额的变化 等因数建立了a c d g a r c h s 的模型,通过实证分析考察了超高频交易额的变化 率及交易持续期对股票的收益率和波动性的影响。 最后总结全文,并展望了该领域今后的研究态势。 关键词:超高频时间序列;波动率;自回归条件持续期间模型( a c d ) ; 极大似然函数 a b s t r a c t a b s t r a c t i nr e c e n ty e a r s ,t h ea n a l y s i so ff i n a n c i a lu l t r ah i g hf r e q u e n c yt i m es e r i e sh a sb e e n o n eo ft h ek e ya n dd i f f i c u l ti s s u e si nt h ef i n a n c i a lc o m m u n i t ya n dr e s e a r c hc i r c l e h i g h f r e q u e n c yt i m es e r i e si sr e f e r r e dt of i n a n c i a ld a t aw h i c hi ss a m p l e d 、析廿li n t e r v a lo fo n e h o u r , o n em i n u t ee v e no n es e c o n d a n du l t r ah i 曲f r e q u e n c yt i m es e r i e si st i c k - b y - t i c k d a t a , w h i c hc o n t a i np l e n t yo fm a r k e ti n f o r m a t i o n t r a d i t i o n a le c o n o m e t r i c a lm o d e l i n gi s b a s e do nf i x e di n t e r v a ld a t a i np l e n t yi n s t a n c e s ,t h ee c o n o m e t r i c a lm a r k e ti n f o r m a t i o n i ss u c c e s s i o n a la n dd i f f e r e n ti n t e r v a ld a t a e n g l ea n dr u s s e l lf i r s t l yi n t r o d u c e dv a r i o u s a c dm o d e l sf o rd i f f e r e n ti n t e r v a ld a t ai n1 9 9 8 t h ep a p e rf i r s ti n t r o d u c e sf e a t u r e so fu l t r ah i g hf r e q u e n c yd a t aa n dt h e ns t u d i e s c o n t r e t e l yv a r i o u sa c dm o d e l s f o r e c a s t i n ga b i l i t yo fs e v e r a lp a r a m e t e r i z a t i o n so f a c dm o d e l sa r ec o m p a r e d w eu s ea c dm o d e lt os t u d yt r a n s a c t i o n - b y - t r a n s a c t i o nd a t a o fc h i n as t o c km a r k e t u l t r ah i g hf r e q u e n c yt i m es e r i e sc o n t a i n st w ov a r i a b l e si ng e n e r a l l y :o n ei st h et i m e o ft h eb u s i n e s sa d v e n t ,a n o t h e ri st h em a r k si n c l u d i n gp r i c eo fe x c h a n g e ,s a l ev o l u m e e t c g h y s e l sa n dj a s i a kc o m b i n e da c da n da r c hm o d e l sw h i c he o m e di n t o a c d g a r c hm o d e lf o rr e f l e c t i n gi m p o r t a n ti n f o r m a t i o no ft w ov a r i a b l e s v a r i e t yo f t h ee x c h a n g eg r o s sr e f l e c t si m p o r t a n ti n f o r m a t i o no fa b o u tm a r k e te x c h a n g e s o i n t e n s i v es t u d yh a sg r e a te f f e c to nb a r g a i n e r sb e h a v i o ra n dt h em i c r o c o s m i cs t r u c t u r e m a r k e to ft h es t o c ke x c h a n g e s oo nt h eb a s eo ft h es t u d yr e s u l t so ff o r m e ri nt h i sf i e l d , t h i s p a p e re o n s t r u c t e st h ea c d - g a r c h - sm o d e lt h r o u g hj o i n i n ge x c h a n g eg r o s s v a r i e t yi nt h ef o r m e rm o d e l t h e nw eu s et h em o d e lt oa n a l y s i st h er e l a t i o n s h i pa m o n g t h et r a n s a c t i o n sd u r a t i o n ,u l t r a - h i g h f r e q u e n c ye x c h a n g eg r o s sv a r i e t ya n dt h er e t u r n s , v a r i a n c e sf o rt h ei n d e xo fs h a n g h a is t o c km a r k e t a tl a s t ,t h ep a p e rr e v i e w st h er e s e a r c ho ft h i sp a p e ra n dp o i n t so u ti t s r e s e a r c h t r e n d k e y w o r d s :u l t r ah i g hf r e q u e n c yt i m es e r i e s ,v o l a t i l i t y , a u t o r e g r e s s i v ec o n d i t i o n a l d u r a t i o n ( a c d ) m o d e l s ,m a x i m u ml i k e l i h o o df u n c t i o n i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。 躲拦一赢1 年多月日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:! 虱丝导师签名:盘金堡垒 日期:2 c r oc 年6 月f e l 第一章引言 1 1 选题背景及意义 1 1 1 选题背景 第一章引言 按时间的先后顺序排列而成的研究对象观测值的集合通常称为时间序列。这 些序列大都具有随机性和偶然性,而且具有动态性( 记忆性) ,相邻的观测值具有 很强的依赖性。 现在在各个行业和领域中都存在着大量这样的时序数据,人们希望通过对数 据科学地分析研究从中发现某些现象的规律,从而由表及里的掌握客观现象的本 质达到进一步认识事物,预测未来和自动控制的目的。 时间序列分析最早起源于二十世纪三十年代,从二十世纪七十年代以后,时间 序列分析得到飞速发展。现在,时间序列分析方法不仅有了比较完善的理论体系, 尤其在参数估计和建模方面得到许多改进。近些年来,时间序列分析进一步迈向实 用化,在工程学和经济学中,越来越多的实际工作者开始把它用于生产和生活进行 识别和模拟。 时序分析分为时域分析和频域分析两种,前者是对动态数据在时间域上的各 种平均值进行分析,后者是对序列作傅氏变换,在频率域上进行谱分析。本文中 的时间序列分析都是用的时域分析。 金融时间序列主要是指在金融市场上( 股票、期货、外汇等) 金融及其衍生品 的价格或其他变量按时间先后顺序排列而得到的一列数据。从这些数据中获得特 征信息的方法般是以统计学理论的时间序列分析方法为基础,并在数理统计模 型的基础上,通过对模型假设、参数估计、检验等一系列方法和技术来获得描述其 规律的数学模型。 现在,许多学科领域都已经以越来越精细的时间刻度来收集数据,频率也越 来越高,一天,一小时,一分钟乃至每秒钟交易的数据都能够被计算机完整的记录 下来,这样的数据常称之为高频数据。在金融学的研究领域,逐笔交易的数据 ( t r a n s a c t i o nb yt r a n s a c t i o nd a t a ) 和逐秒记录的数据( t i c kb yt i c kd a t a ) 就是金融高 频数据。逐笔交易的数据由于含有的交易信息丰富而被称为超高频数据,由于这种 电子科技大学硕士学位论文 数据能更好的反映市场的微观特征,目前已被越来越多的应用于计量经济学的研 究。 但是超高频数据并不等于是低频数据的在时间上的细分,超高频数据与低频 数据相比常呈现出以下特殊的性质: ( 1 ) 价格的离散取值 现实情况很难满足对交易变量连续性的假定,例如中国沪深股市价格的最小 变动幅度是0 0 1 元,所以股价的最小变动不可能比o 0 l 更低。这便会造成股价的 不连续取值,这就意味着以前的所有依赖连续变量建立的模型都不在适合描述这 一现象。现在这方面的研究还没有什么发展,因为到目前为止仅仅对离散取值的 价格序列还没有很好的计量学模型可以刻画。 ( 2 ) 日内效应 “日内效应是指( 波动率、成交量、买卖的价差等) 金融时序变量在一定 时间内表现出来的稳定性和周期性的特征。对于国内外的许多股票市场,金融数 据都存在很强的日内效应或者是周期效应,价格的波动率、交易的频率、成交量 和买卖价差在日内都存在着显著的“u 型日内效应【1 1 。正确的估量( 超) 高频数 据的“日历效应对研究日内波动的影响至关重要。 ( 3 ) 时间的不等间隔 与传统的低频等间隔数据( 如年数据、周数据) 相比,金融市场中交易到达 的时刻是随机的,等待下一次交易的时间也是随机的,这些数据之间的时间间隔 是不等间距的。显然这是由于市场交易不是在相等时间间隔内发生造成的。 ( 4 ) 自相关性 超高频时序数据一个很重要的特点就是强自相关性,数据的离散取值和日历 效应等是导致自相关性的重要原因。当然还有一些人为因素导致的价格同方向变 动也能引起序列的自相关性。此外,还有著多其他的因素也可以导致序列的强自 相关性。 正是由于超高频金融数据的这些不同于低频数据的特征,所以利用传统模型 对这些数据建模是不可行的,必须根据这些特点寻找新的方法。 1 1 2 选题的意义 近年来,超高频金融数据本身的独特特征越来越成为研究者的关注对象。交 易价格、与交易相关的报价、交易的数量等等都是息息相关的,因此,对于超高频 2 第一章引言 金融数据的研究,实质上是一个“在不同的时间间隔上得到的、不规则的、既有连 续变量又有离散变量的复杂的多变量”问题。那么金融领域的研究者们所面临的 问题就是如何很好的处理这些拥有独特性质的复杂的多变量。 对超高频数据的分析和研究对于理解市场微观结构状态、指导投资者实际操 作都具有非常重要的意义。以往一般是用一些频率较低并且等时采集的数据对市 场微观结构进行的研究,信息量比较少,因此不能充分揭示市场的微观特征。超 高频数据则包含有更丰富的交易信息,有用信息基本都包含在这些数据中,因此 在刻画市场微观结构上具有更多的优势。 1 2 国内外文献综述 1 2 1 国外研究现状 目前高频数据主要分为两类:一种是以比低频数据更高频率采集的数据,这 和低频数据没有本质上的区别,只是时间刻度上的细分,因此可以继续用a r c h 类 模型和s v 类模型进行分析和建模。而另一种则是基于不等时间间隔的超高频数据 ( 如股市实时数据) ,针对这种高频数据的模型计量方法已经取得了一定的成果。 常用的研究方法是基于低频数据领域中常用到的g a r c h 类模型而得到的。 这其中主要有两类:一是异质a r c h 模型( h a r c h ) ,另一类是弱g a r c h 模型。 弱g a r c h 模型是由d r o s t 和n i j m a n 2 】第一次提出的,他们定义了三种g a r c h 模 型。h a r c h 模型是由g a r c h 模型扩展出的一类模型。k o m u n j e r 3 】等针对高频数 据的波动的非对称性和长记忆性的基本特征提出了h a r c h 模型。h a r c h 模型中, 条件方差表示成过去不同期间长度的收益率平方的和,模型如下: r t 2 o t 8 t ,以j厂7 2g , 以 1,广g e z 2 c o + f 三l 后乏1 if 邑一f 卜圣1 一f n 1 由上可知,h a r c h 模型中包含了g a r c h 模型,而g a r c h 模型是h a r c h 模型 在c j k = 0 ( k ,) 时的特殊形式。为刻画波动的长记忆性,m u l l e r t 4 】等在h a r c h 模型 的基础上推出了另一类e m a h a r c h 模型。 由于金融市场上的分笔交易大都是在不等间隔的时点上发生的,e n g l e 和 r u s e l l t 5 】指出,运用相同时间间隔来处理这类数据存在较大的缺陷。随着交易频率 电子科技大学硕士学位论文 的提高,信息量也越大,利用相同时间间隔处理可能使得所观测的信息量时而很 大时而为零。为了改进这个问题,可以实时记录每笔交易的时间和标值变量。 针对超高频数据的时间间隔是随机的这一问题,e n g l e 和r u s e l l i 】对交易到达 的持续期间建立了最初的a c d 模型。后来e n g l e 和r u s e l l t 6 】又正式提出a c d 模型, a c d 模型的中心思想就是用随机标值点过程去刻画交易过程。不同的a c d 模型 是由不同的标值点过程得到的。 a c d 模型是针对交易持续期( d u r a t i o n ) 的聚类性建模的。设沙表示交易时间 间隔的条件期望,即f = e ( x i f , - 1 ) 。“,) 表示占f 的概率密度函数。 x = s z 。 ll y f2 缈+ ,莲1 口- ,一+ ,墨1 f l j 垆 i - ,( 1 - 2 ) 占;一f ( s ,万) ,f i 为i i d 序列。且满足如下条件: ( 口,乃 o 删且鼍翟,+ 垆1 印时口- 0 j q 时乃圳 ( 口,乃o ,缈 o 且 ,差】( 口,+ 乃) 1 印时口2 o , 时乃2 o ) 在上式中根据占服从的不同的分布如指数分布,w e i b u l l 分布,g a m m a 分布和 广义g a m m a 分布,就可以得到的e a c d ,w a c d ,g a c d 以及g g a c d 模型。 根据持续期间的期望的不同形式,研究者把a c d 扩展为各类模型。类似于 前人对a r c h 类模型的扩展,a c d 模型可以扩展为对数a c d ( l o g a c d ) 模型、 门限a c d ( t a c d ) 模型、长记忆a c d ( f i a c d ) 模型、a c d g a r c h 模型等。 近些年来,很多统计学家逐渐接受了e n g l e 的a c d 建模思想,因为e n g l e 把 a c d 模型引入( 超) 高频数据比以往任何模型的效果都好。e n g l e 【7 1 ,g h y s e l s 和 j a s i a k ( 1 9 9 8 ) 【8 】,g r a m m i g 和w e l l n e r ( 2 0 0 2 ) 将g a r c h 模型与a c d 模型有机结合起 来,提出了a c d g a r c h 模型。b a u w e n s 和v e r e d a s ( 1 9 9 9 ) 对于市场中的隐蔽的 信息用一个随机因子衡量,从而提出了s v d 模型【9 】。f e m a d e s 和g r a m m i n g ( 2 0 0 6 ) 提出了一族增广a c d 模型,即a a c d 模型,它是在a c d 模型的条件持续期过程 中对条件持续期进行b o x c o x 1 0 】转换。接着h a u t s c h ( 2 0 0 6 ) 又得出一个新的增广 a c d 模型,即a g a c g 1 。 4 第一章引言 1 2 2 国内研究现状 国内关于超高频数据及其模型的研究和应用主要是集中在对模型的引进和对 沪深股市的实证分析上。比如郭兴义、杜本峰、何龙灿( 2 0 0 2 ) 1 2 】主要是总结了 国内外的超高频数据的分析与建模的思想。由于对g a r c h 模型的认同,也使得 利用这些特点进行建模的思想也得到认同。尽管e n g l e 认为a r c h 模型的许多结 论可以平移到a c d 模型上来,但由于模型中不同点过程的刻画和一阶矩的非线形 形式,使得这方面的工作并不象想象的简单。他们推测利用e m m 估计方法【1 3 】估 计模型可能比较适用。 根据现有的文献资料,国内对a c d 模型的研究主要停留在利用外国模型的基 础上。但是对a c d 模型在中国股市的适用性,及模型本身的特征性质等问题却没 有进行深入探讨。陈敏,王国明等( 2 0 0 3 ) 将a c d 模型引入到中国股票市场,得 出了沪深股市收益率的相关性质 t 4 1 。在e n g l e 和l a n g e ( 2 0 0 1 ) 得出的流动性模 型的基础上,蒋学雷,陈敏,等人( 2 0 0 4 ) 用一个中国股市的市场深度模型来分 析市场流动性,得出了一个很好的衡量短期流动性的v e n t 指标旧。由于国外的证 券市场和我国的证券市场存在着明显的不同,我国股市的投机性和波动性很强, 必须根据中国股市的具体特征,选择合适的a c d 模型。 1 3 本文主要研究内容及其方法 本文的研究内容是超高频金融时间序列数据中交易持续期和交易的波动率等 相关性质,a c d g a r c h 模型的变结构等。并实证分析了a c d 模型与中国证券市 场的适应情况。论文的内容将分为下面几个部分: 第一章是引言。首先介绍了选题的背景及意义,其次介绍了国内外的研究现 状和当今金融市场( 超) 高频时间序列发展的态势。 第二章,主要对超高频时间序列的建模原理和模型形式进行了分析和介绍, 并利用我国股市的分笔交易数据对各种a c d 模型进行了比较分析。利用a c d 模 型拟合中国证券市场交易持续期,得到了合适的模型。 第三章,本文在已有的a c d 模型和g a r c h 模型的基础上,建立了 a c d g a r c h s 模型,并用实证分析,考察了超高频交易额的变化和交易持续期对 金融产品收益率及其波动率的影响。 第四章,对全文工作进行了总结并对超高频金融时间序列的研究进行了展望。 5 电子科技大学硕士学位论文 第二章自回归条件持续期间( a c d ) 模型 2 1a c d 模型的产生背景 金融市场的超高频交易数据本来是在不相等时间间隔的基础上采集的,但是经 典的计量经济学建模却是在固定时间间隔的基础上划分的交易数据。计量经济学家 通常的做法就是把交易数据集合到固定的时间间隔上。但在金融市场上,频繁的股 票交易可能每几秒钟都会发生,因此计量经济学家建模时经常选择较短的时间间隔。 如果选择较短的时间间隔,又会使很多间隔里不包含任何新的有用的信息,而且会 产生异方差现象;若选择较长的时间间隔,那么数据中包含的很多微观结构特征又 体现不出来。所以要选择最佳的时间间隔就变得非常困难。 特别对于股市而言,在开市和闭市的附近交易频率高而接近中午休息时间的交 易频率是最低的。对于货币市场来说交易也分活跃期与低迷期,更令人不解的是选 择固定的时间间隔建模通常在交易不活跃的时期却突然变得活跃了。这种现象可以 归于一些可观测到的和不可观测到的事件,通常用一个随机过程来描述。特别是在 这种情形下选择固定的时间间隔建模将是非常危险的,它隐藏了很多本质的信息甚 至会给投资者很多错误的结论n 羽。 上面提到了固定时间间隔的替代方法,交易发生的时间被当作服从某点过程 的时间随机变量。标记量( m a r k s ) 是指与每次交易发生时间相关的随机变量,这样 就可以得到一个相联系的点过程模型。有时候研究人员对交易时间间隔并不关心, 而是重在研究与交易时间相关联的标记量。 条件密度函数最主要是用来测度交易的密度( 瞬时交易量) ,它是根据过去的 事件建立的。一个模型的条件密度函数主要以过去的事件的时间间隔,以往交易 的特征,过去外部因数的影响为根据建立的。由于该模型依赖于过去的持续期间 所以又被称为自回归条件持续期间模型( a c d ) 。条件密度与下一个交易发生时等待 时间的条件期望是密切相关的,a c d 模型是建立在交易时间的基础上,但却能够 表达出交易时间间隔以及交易频率的分布。a c d 模型仅仅是一个刻画时间序列的 模型,该模型常应用于分析金融市场的( 超) 高频交易数据。 近年来k y l e ( 1 9 8 3 ) ,a d m a t ia n d p f l e i d e e r ( 1 9 8 8 ) ,e a s l e ya n do h a r a ( 1 9 9 2 ) 1 拘研 究表明市场的信息很多都包含在交易的频率中,特别是这些模型表明交易有聚集 6 第二章自回归条件持续期间( a c d ) 模型 性,而交易的聚集性表现在股票市场的交易数据之中。e n g i e 和r u s s l e 在1 9 9 8 年 提出了基本的a c d 模型,后来b a u w e n s 和g i o t 于2 0 0 0 年扩展了一个更为广义的 l o g - - a c d 模型【1 7 1 ,m i c h a e ly u a n j i ez h a n g , j e r r e yr r u s s e l l 1 8 】提出了t a c d 模型, s i l v i ag o l i a 又提出了f i a c d 模型。 2 2 自回归条件持续期间a c d 模型 2 2 1 条件密度过程 为了得到适合金融高频数据特征的计量模型,考虑一个随机过程是时间序列 t a o , ,“) 且t o t 1 q 时乃2 0 。 a c d ( p ,q ) 也可以写成a r m a ( m a x ( p ,q ) ,q ) 模型: f 1 一口( 三) 一觑三) k = 缈+ 一觑) 圯 一 其中= 工f 叫i 是鞅差分序列,此模型表明一个期望持续时间的短期依赖性。 2 2 3a c d 模型的类别 占i 的分布有多种选择,如果服从标准的指数分布、w e i b u l l 分布和伽玛分布,得 到的模犁分别称为e a c d 、w a c d 以及g a c d 模型。当然对分布的不同选择会关 9 电子科技大学硕士学位论文 系到模型估计的难易程度o 2 2 3 1e a c d 模型 当占f 的密度函数厂( 占,万) 为指数分布时,就称为e a c d 模型。这里考虑 e a c d ( 1 ,1 ) 模型: x i 2 舻 il ll 吩= t o + ( t r i l 十y f 一1 ( 2 6 ) 为了保证时间间隔的条件期望为正值,必须有口,0 ,缈 0 。 其中指数分布的密度函数为: 石= r - 。删2 x ( x 。) ( 2 7 ) a c d 中模型,持续期间的条件期望值为吩,且= e ( f i 一1 ) ,对公式( 2 6 ) 两边求期望: e 缈f ) = c o + t x e ( x i 一1 ) + 应缈f 一1 ) ( 2 8 ) 在弱平稳的条件下,有e 缈f ) = e ( 一1 ) ,因此持续期间的非条件期望值为: = e ( ) = e ( 吩) = i 与( 2 - 9 ) 因为在标准指数分布中e ( 岛) = 1 ,i r a ,( q ) = l ,e ( 岛2 ) = 玩,( ) + ( e ( q ) ) 2 = 2 故e ( 玉2 ) = e e ( 2 q 2j 曩,) = 2 e ( 2 ) ,于是: e ( 2 ) = 2 函1 万- ( a 万+ l ? ) 面2 ( 2 _ 1 0 ) 砌,( 西) = 2 e ( 2 - , u 2 = , u 2 函1 忑- p 2 两- - 2 c r , 8 ( 2 1 1 ) 上式( 2 - 1 1 ) 为持续期间的非条件方差。所以a c d 模型需要满足下列条件: 口+ l ,2 a 2 + 2 + 2 筇 1 ( 2 1 2 ) 在a c d 模型中当延迟的阶数增加时,仍然可以通过变换得到a c d 模型的各 阶矩,只是情况比较复杂。 可以运用极大似然法来进行参数估计。由于假设占f 满足的指数分布,的条 件期望是f ,由上可知的概率密度为 m ) 2 去唧【一老) 1 3 ) 故 i o 第二章自回归条件持续期间( a c d ) 模型 ( 秒) 一1 0 9 ( g i ) 一云( 2 - 1 4 ) 所以对数似然函数为 三( 口) = 一兰( 1 0 9 ( g z ,) + 音)(215)i-i1 三( 口) 一l+ 鲁l ( 2 一 y , 其中n 表示观测到的样本的总个数。 与g a r c h 模型的性质相似,g a r c h 中的q m l e ( 局域拟最大似然估计) 也 可以应用于a c d 模型的参数估计。 于是对a c d 模型的q m l e 估计有如下推论: 推论:若模型满足下面的条件: 1 名一1 ( g i ) 暑吩2 彩+ t z z i 一1 + 吩一1 ; 2 s i = z l l ,i 满是 ( i ) 严格平稳且遍历, ( i i ) 非退化, ( i i i ) 条件二阶矩是有界的, ( i v ) s u p fe i l 【邯+ 船f ) i f 一1 】 i 则模型表示为递增函数,那么出现长持续期的可能性递增。若t o ( 2 2 0 ) 其中e ( x ) = 玎( 旯+ 1 7 ) r ( 力) ,将其用于a c d 模型时,可以进行变换 k = 少,r ( 五) r ( 兄+ 1 y ) , ( x iix h x i - 2 x l ,= 南 帮h 一 帮m 。 公式中九和丫y 9 i z i 个待定的参数,f 为g a m m a 函数。 1 2 、一 ,一厂一 + 一 , 1 一 ,i 9 r 一 掣 第二章自回归条件持续期间( a c d ) 模型 上式中当f 牾1 时,g a m m a 分布变为指数分布。当扣1 时,g a m m a 分布便 成为w e i b u l l 分布。l u n d e ( 2 0 0 0 ) 【1 7 】提出了,表述持续期间的分布特征,仅仅危 机函数是不能完全描述的,可以把g a m m a 分布引入到a c d 模型中,特别在一些 复杂的点过程中可以遇到。 同样可以由极大似然估计方法得到模型的参数。g a c d 模型的对数似然函数 表示如下: 印,= 羔i = lh ( 南卜 帮 - 帮 , 阻2 1 , 对上式求导得: 善等= o ,0 = ( 名,厂,缈,口,) , x ,r ( 1 + 三) 将( 2 - 2 1 ) 分别对9 ( 五,厂,缈,口,) 中参数求导,令七2 前,则 茜= 抟峨1 砂a k _ k , l n k 砂a k ( 2 _ 2 2 , 盖= 针( 五) ( _ 啊2 ) _ 等a 2 ) + r l n k + y ao k l 札后瓦o k ) 2 3 ) 丝:争丝堕一七l i l 尼堡| ( 2 2 4 ) a 彩 智【ka 缈d 彩j 丝:争 型堕一七1 n 七堕| ( 2 2 5 ) o a智ika 口c 3 aj 丝:争j 丝堕一七l n 后堕 ( 2 2 6 ) 式中k 如下: 等:志型o r 丝c 一寺 a , 少,( 旯) 、, 一o k 一生f ( 2 ) o f ( a + 1 r ! ) 坚垒_ f ( a + 1 r ) c t ( a ) o a 觑沙, r ( 五) 】2 历o k :1 x y ( 2 矿+ 1 ) ( 一等 一= 一i 一一- 一 a 国 r ( 兄) 、,a 缈 1 3 电子科技大学硕士学位论文 盟:坐兰:丝f 一土1 盟 a 口 r ( 五) 、,2 7 a 口 丝:坐兰塑f ,一上1 盟 一= :- - - - - - - - :- 一一一 筇r ( 无) 、,27 筇 由于g a m m a 分布的形式比指数分布及布尔分布的形式更复杂,而且它的危机 函数也很烦琐,所以在实践应用中适合更复杂的点过程。 2 2 4a c d 模型的进一步扩展 在e n g l e 和r u s s e l la c d 模型建模思想的基础上,后来又形成了众多的衍生 a c d 模型【2 0 1 。在基本的a c d 模型中一方面假定占满足不同的分布可以得到上面 i 各种不同a c d 模型,另一方面根据持续期间的期望的不同形式,又可以把a c d 扩展为其它的模型。与a r c h 类模型族的扩展类似,a c d 模型可以扩展为 l o g a c d 模型、b o x c o xa c d 模型、t a c d 模型、长记忆a c d ( f 认c d ) 模型 等等。 2 2 4 1 对数a c d ( l o g - a c d ) 模型 e n g l e 和r u s s e l 的a c d 线性模型的缺点就是它对模型系数的要求严格,而且 交易持续期间对条件均值的影响也不一定是线性的。所以,b a u w e n s 和g i o t ( 2 0 0 0 ) 在e n g l e 和r u s s e l 的基础上提出了通过对条件持续时间进行动态变换,从而得到 a c d 模型的一些简单的非线性的形式。他们将持续期间对条件均值的影响用对数 的形式加以转换,推出了对数a c d 模型【2 1 1 。此模型在应用中比传统的a c d 模型 更加有优势,是因为在l o g a c d 模型中不象传统的a c d 模型那样对变量参数有 非负限制。 l o g a c d 模型将交易的时间间隔石定义如下: z i = 矿i s e ( 岛) = ,v a r ( e , ) = 盯2 有e ( 石l 巧) = 比e x p ( c z i ) ,巧表示在时刻t i m l 收集到的信息集,它包含有过去的信息。 同a c d 模型一样,l o g a c d 模型中一个重要的假定就是条件期望e ( 石l 正) 中也 包含了交易间隔过程中的相关性。于是得出石e ( z ii 互) i i d 。 因为交易间隔的聚类现象。缈,可表示成如下一个自回归方程: = 0 ) - i - 2 9 t ,g ( 以 8 i _ ,) + 色一, ( 2 2 7 ) 1 4 第二章自回归条件持续期间( a c d ) 模型 由函数g ( 石吖岛) 的两种形式1 n 和毛。,可以得到l o g - a c d 的两种形式。 ( 1 ) 当g ( 石吖,岛吖) = l i l 石时: = 缈+ 嘶l l l 石。+ 历。 ( 2 2 8 ) ( 2 ) 当g ( 石一 q 一,) = 岛时: 喜哆 嘉局叫州e 坤x i , 而- s + 圭j = l 历吖( 2 - 2 9 ) 岛分布有很多种选择,比如指数分布、g a m m a 分布、w e i b u l l 分布、b u l l 分布、 广义g a m m a 分布等。当然模型估计的简易程度跟分布的选择密切相关,例如指数 分布和w e i b u l l 分布中和盯2 只和一个参数变量有关。如果q 服从w e i b u l l 分布, 石的密度函数如下: 比) = 飘掣p 掣) , 3 。, 应用上w e i b u l l 分布的密度函数,石的极大似然函数( - - i ,2 可以写 姜h 乩( 咖7 h 娜州明一m - ( 驾掣 ,( 2 3 t ) 是通过函数g ( 石,q ) 的形式来影响极大似然函数的。的形式不同得到 的似然函数也不同。 2 2 4 2t a c d 模型 r u s e l l 与e n g l e ( 1 9 9 6 ) 通过实验改进了a c d 模型,将类似门限的思想引入 a c d 模型。在他们的基础上后来z h a n g e t a l ( 2 0 0 1 ) 又进一步拓展了模型,推出了 一种非线形的门限a c d 模型( t a c d ) 【1 8 】。门限a c d 模型是依靠引入门槛变量 来描述复杂随机过程的简单非线性模型。这和描述非对称阶段行为和跳跃现象时 的t a r ( t h r e s h o l da u t o r e g r e s s i v e ) 模型很相似。t a c d 模型是一种很强健的广义 a c d 模型,不同阶段的模型形式可以选择不同的条件均值和残差分布。下面来介 绍门限a c d 模型。 誓 是一个随机过程。奶是= e i 西l 互_ i 够l 是而的条件均值。定义 r = 0 _ i ,:) ,= 1 ,2 ,其中j 为正整数。棚= 0 , j = l ,2 ,n 。( i i ) 口i ( 力+ 层,) o ,( 2 ) 船访【( 口l 刀q 7 + 屈,) b 0 ,我们就认为在t i 时刻交 易发生。定义x ,为一个事件在时刻f f - ,发生到t i 时刻发生的持续时间,x i = 一一。 由于石一般都具有很强的“同历效应( 同内周期特征) ,而这种周期性的特征又 是时间的函数,所以采用线性样条函数( f ) 来刻画。剔除“日历效应 后的交易持 续期为: 薯= 置矽( f ) 第三章超高频金融时间序列的动态a c d 模型及实证分析 而2 吵f = 缈+ 口一i + 忻一i ( 3 一1 ) 口,0 ,缈 0 口+ l 令珐表示第i 次交易发生时的交易价格,定义从第f - l 期到第i 期的收益率为 足= l o g ( p i ) - l o g ( p i 一) ;同样,收益率也存在这种特征,因此可以象上面那样采用样 条插值函数来剔除这种目内周期特征。调整后的超高频收益率记为以。 收益率的条件方差记为: k 一。( ii 五) = 嚏 ( 3 - 2 ) 条件方差的条件包括现在时刻的持续时间尬,过去时刻的持续时间和收益率。h r 表 示一段持续期间收益率的条件方差。那么每个时刻点的条件方差就可定义为: ( 巧而i 毛) = q 2 ( 3 3 ) 则有:鬼= 誓呸2 。 所以可以对超高频收益率r f 先除以i ,把调整后的收益率引入g a r c h 类模 型的框架中。这样便可以建立超高频的收益率和波动率方程。 前面已经知道,超高频交易额的变化对金融市场微观结构的影响是不可忽略 的,所以在建立产品的收益率和波动率方程时也应考虑到它。即在收益率和波动率 方程中加入交易额的变化率两这个变量。考虑到持续时间和交易金额对收益率的 影响,可以在收益率方程中加入时问间隔x i 和交易额变化率观。为了考察交易的频 率以及收益率的变化和交易额的变化对波动率的影响,需要在波动率方程中加入 项1 x i ,西奶,1 。 交易额的变化率定义式为: s t , = ( 岛一邑一1 ) 墨一i ( 3 - 4 ) 那么考虑了以上因数的收益率和波动率方程可表示如下: ,:玉= p ,;一l , is , - , + q + 钐q i + 峨+ 斯 ( 3 5 ) e ( 弓2l 互一。) = q 2 呸2 = + 口e l 1 2 + 吒一1 2 + a 五+ 如+ 以玉+ 栉观 ( 3 6 ) 上式中弘为持续期的条件期望,可以由a c d 模型预测给出。1 x i 表示交易的频率, l 彬表示交易频率的期望值,薯表示持续期间的真值对其期望值的偏离程度。 上式( 3 - 1 ) 和( 3 - 5 ) ,( 3 - 6 ) 被称为a c d g a r c h s 模型,通过对交易额变化率 前参数的显著性检验,就可以探讨交易额变化率对此交易的收益率和波动率的影 响。 电子科技大学硕士学位论文 3 2 实证分析 3 2 1 数据的获取与预处理 选择上海股市中有代表性的浦发银行( 6 0 0 0 0 0 ) 为样本。截取其中2 0 0 6 年1 0 月1 0 日到1 4 日,一周的1 5 3 2 8 笔实时( 分笔) 交易的数据( 交易时间,交易价格 和成交金额) 。只要前后两次的交易价格差大于0 0 5 ,我们就认为一次交易事件发 生了。经过截断后,得到1 2 2 8 0 个交易数据。为消除“日内效应 的影响首先对 原始观测到的数据进行调整。数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论