(应用数学专业论文)高频金融时间序列的研究与建模.pdf_第1页
(应用数学专业论文)高频金融时间序列的研究与建模.pdf_第2页
(应用数学专业论文)高频金融时间序列的研究与建模.pdf_第3页
(应用数学专业论文)高频金融时间序列的研究与建模.pdf_第4页
(应用数学专业论文)高频金融时间序列的研究与建模.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(应用数学专业论文)高频金融时间序列的研究与建模.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 高频时间序列的分析与建模是金融计量学的一个全新研究领域。金融市场中 高频时间序列分为两类:一类是采样间隔相等的数据,比如一小时、十分钟、五分 钟、甚至是以秒为单位采集的按时间先后排列的等时间间隔的数据;另一类是指 对交易过程实时采集的数据,也就是每笔交易的数据( 显然是不等间隔的数据) 。 本文对两种类型的高频金融时间序列分别进行了研究,主要工作如下: 1 、以上证综合指数不同频率的数据为样本,研究了等间隔高频金融时间序列 的统计特征并讨论了不同采样频率下数据集统计性质的不同。 2 、实证分析发现等间隔的高频金融数据存在着显著的周期性以及长记忆性, 于是本文用一种改进弹性傅立叶方法( f f f ) 度量出周期。用对数周期图法( g p h ) 检验和估计序列长记忆行为。最后对去周期的收益序列建立了g 蒯k h 和 e g a r c h 模型,较理想的拟合了价格的波动。 3 、综述了国际文献出现的各种描述不等间隔的高频金融时间序列的a c d 模 型及其扩展模型并将其分类。并对各种模型进行了分析比较,利用我国股市的分笔 交易数据进行了实证分析。 4 、研究了a c d 的一种重要扩展模型:s c d 模型的统计特征,如高阶矩的存 在条件以及自相关函数的性质,并将其与a c d 模型进行了比较。 5 、在a c d 模型的基础上引入a r m a 模型,来描述交易的时间间隔和交易期 间的收益两个时间序列之间的相互关系,建立了a c d a r m a 模型,给出了两个变 量之间的联合分布密度函数以及估计方法。 关键词:高频金融时间序列,周期,自回归条件持续模型( a c d 模型) ,随机条件 持续模型( s c d 模型) ,a c d - a m 模型 电子科技大学硕士学位论文 a b s t r a c t i nr e c e n ty e a r s ,t h ea n a i y s i so ff i n a t l c i a lh i g h 疗e q u e n c yd m es e r i e sh a sb e e no n eo f t l l ek e ya n dd i f 行c u l ti s s u e si nm ef _ m a l l c i a lc o m m u 芏1 i t ya n dr e s e a r c hc i r c l e w bp r e s e mt 、v od i 丘b r e n tf h m e w o r k st oa n a l y z i n gt 1 1 e1 1 i g h 丘e q u e n c yt i m es e r i e s : f i r s t ,r e g u l a f l ys p a c e ds 锄p l e do b s e a t i o n s ,w h i c hi ss 锄p l e dw i 也i m e r v a lo f o n eh o 峨 o n em i n u t ee v e no n es e c o n d ;s e c o n d l y ,t h ei 玎e g u l a r l y 叩a c e dd a t a ,s u c h 鹪t r a n s a c t i o n b y 岫n s a c t i o nd a t a 。 t h em a i nw o r ka n di 衄o v a t i o n so ft 1 1 ed i s s e r t a t i o ni 1 1 c l u d e : 1 m o u 曲e m p i r i c a lr e s e a r c ho fh i 咖f r e q u e n c yt i m e8 e r i e so fs l l a n 班a ic o m p o s i t e i n d e x ,t h ep a p e rr e s e a r c h e st h ed i f f e r e n ts 惦t i s t i c a lp r o p e r t i e so nd i 任邑r e n t 矗e q u e n c y 2 t h ep 印e rs 删i e sc “c n d a re 船c t so ft 1 1 es a m p i e ,s u c ha sp e f i o d i c i 哆a 1 1 di o n g m e m o r y 。s ow eu s et l l en e x i b l ef 0 1 l r i e rf o h nr e g r c s s i o np r 0 v e sa n df i l t e r st l l ep e r i o d i c c o m p o n c i n s 。a n d l l s eg h pm e 血o dt oe s t i l n a 七et h ef m t i o n a 王i n t e 耐i o nd 3 血廿o d u c ev a r i o u sa c dm o d e l s 。f o r e c a s t i n ga b i l i t yo f s e v e r a lp a r a m e t e r i z a t i o n so f a c dm o d e l sa r ec o m p a r e d 。w 色u s ea c dm o d e lt o 咖d yt r a n s a c t i o n b y - 恤吣a c t i o nd a t a o f c h i n as t o c km a r i k e t 4 w er e s e a r c hs c dm o d e l ,州c hi sa ni m p o r t 姐te x t e n do f a c dm o d e l ,c o m p a r et h e s t a t i s t i c a lp r o p e r t i e sw i t l la c dm o d e ld e 印l y 5 t h ep a p e rb u i l d san e we c o n o m e t r i cm o d e lf o re s t i m a t i n gb o t l lt l l er e t 啪sa n d d u r a t i o n s ,a sw e l la s 西v e st h ej o i n td e n s i t yo ft h em a r k e dp o i n tp r o c e s so fd u r a t i o n 蛆d t r 鲫s a c t i o n _ b y 仃a n s a c t i o nr c t u m sw i ma na c d - a i 洲a 抒a m e w o r k k q 唧o r d :h i 曲舶q u e n c yt i m es e r i e s ,a u t o r e g 把s s i v ec o n d i t i o n a ld u r a t i o n ( a c d ) m o d e l b ,s t o c h a s t i cc o n 拙i o n a ld u r a t i o n ( s c d ) ,弼i o d i c i a c d a 蹦a m o d e l i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 的说明并表示谢意 签名: 笑蜴 日期:幽以年,月7 ,日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅本人授权电子科技大学可以将学位论文的全部 或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等 复制手段保存、汇编学位论文 ( 保密的学位论文在解密后应遵守此规定) 签名:艇导师签名: 日期:加5 镶哆 年月 第一章引言 1 1 选题背景及意义 1 1 1 选题背景 第一章引言 从统计意义上来讲,所谓时间序列就是将某一指标在不同时间上的不同数值, 按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响,往 往表现出某种随机性,彼此之间存在着在统计上的依赖关系。 社会、科学、技术等领域中存在着大量的时间序列数据有待进一步的分析和 处理。人们希望通过这些时间序列的分析,从中发现和揭示某一现象的发展变化规 律,或从动态的角度描述某一现象和其他现象之间的内在数据关系及其变化规律, 从而尽可能多的从中提取所需要的准确信息,并将这些知识和信息用于预测,以 掌握和控制未来行为。 从b o x 、j e n l c i n s 开始,人们对时间序列的分析进行了大量的研究。到今天。时 间序列分析有了比较系统而完善的理论体系【l 】。 近年来,时间序列分析方法的研究和应用飞速发展,特别在经济领域,越来越 多的实际工作者开始了解并运用时间序列方法。 金融时间序列是指在金融市场上( 股市、汇市、期市等) 金融产品的价格按时间 顺序而得到的一列价格数据( 或收益数据) ,它是金融市场分析的基础。 从金融时间序列中获取特征信息的一般方法是基于统计理论的金融时间序列 分析方法。它是现代金融计量经济学理论中的重要内容,主要以数理统计模型为基 础,通过模型假设、参数估计、模型检验等手段和技术来获得描述金融时间序列规 律的数学模型。如美国经济学家e n g l e 就因其在1 9 8 2 年对金融时间序列所提出的 a r c h 模型而荣获2 0 0 3 年度诺贝尔经济学奖【2 】o 随着计算机技术的发展和数据存储技术成本的降低,使得对大规模的数据库 的分析成为可能。所以许多科学领域的数据都开始以越来越精细的时间刻度来收 集,这样的数据称为高频数据。人们可获取的数据的频率越来越高,一小时,半小 时,五分钟,一分钟乃至每笔交易的数据都能够被完整的记录下来。这对金融市场 研究产生了巨大的推动作用。这些数据对于金融市场研究的重要领域一金融市场微 电子科技大学硕士学位论文 观结构理论和实证金融经济计量学的研究产生了巨大的推动作用。 高频时间序列的分析与建模是金融计量学的一个全新研究领域。高频金融交 易数据分析模型从9 0 年代开始迅速发展,目前已经广泛地用于金融市场微观结构 理论应用和实证检验。 1 1 2 选题的意义 在传统经济学家的观点里,短期的价格波动是不相关的白噪声不值得收集;但 是金融领域的近期研究改变了这样的观点,他们认为高频数据中包含有大量信息 并且能表现长期趋势。 在金融市场中信息是连续地影响证券市场价格运动过程的,数据的离散采集 必然会造成信息不同程度的缺失,无疑,信息采集频率越高,信息丢失越少;反之, 信息丢失越多。所以,高频时间序列比低频时间序列包含更多的信息,如市场微观 结构的信息及重要的长期日间现象的信息等。 近年高频金融时间序列的分析与建模受到越来越多研究者的关注,这可以归 结为两个原因: 一个是由于对金融高频数据本身所具有的特征值的关注。通常所指的交易数 据,除了交易价格外,还包括与交易相连的询价和报价、交易数量、交易之间的时 间间隔、相似资产的现价等等,因此,对于金融高频数据的分析,实质上是一个关 于“以不同时间间隔观察到的、具有不规则强度、既有离散变量又有连续变量的” 复杂多变量问题。这样如何从总体上来分析金融高频数据、又如何处理具体金融 交易中高频时间序列的特殊性,便成为众多金融领域的从业者和研究者所面临的 一个有趣而又富有挑战性的课题。 另一个是因为金融高频数据对理解市场的微观结构来说相当重要。对金融高 频数据的逐步积累和了解,不仅转变了一些陈旧的研究理念,如以前认为短期的 价格波动是不相关的噪音并且不值得去搜集,但现在我们知道高频数据中的这种 波动恰恰包含着理解市场微观结构的重要信息;而且随着对金融高频数据统计特 征认识的深化,也使先前一些关于如金融市场同质性( h o m o g e n e o u 8 ) 、短期价格波 动服从高斯随机游程( g a u s s i a l lr a n d o mw a l k ) 的古典经济假定受到了质疑。不难看 出,在探寻金融市场微观结构的过程中,需要对基础经济理论、研究方法和计量模 型等进行不断地创新和完善,而金融高频数据及其分析的出现则正好为这些转变 的实践提供了条件。 第一章引言 高频金融时间序列的研究不管是对于金融理论工作者,还是金融领域的实际 从业人员,都具有十分重要的意义: 1 、高频数据包含市场微观结构的信息以及重要的长期日间现象的信息,对高 频数据的研究有助于结实波动率及波动持续性产生的根本原因。 2 、微观结构理论的研究大多是定性的描述,这些理论在多大程度上符合实际, 需要利用高频时间序列的实证研究来对其进行检验。 在低频时间序列领域测量波动性的两类非常成功的方法址配h 类模型s v 类 模型并不能直接用于高频金融时间序列的建模。高频金融时间序列的分析与建模 是另一个广阔的研究领域。 1 2 国内外文献综述 尽管人们对于高频金融时间序列分析研究的历史并不长,但是目前的发展状 况却着实令人鼓舞,众多学科的研究者对此都表现出了极大的兴趣,分别从不同 角度对高频金融时间序列进行了探索和研究。 其一为主要针对日历性的模型。d a c o r 0 印ae t a l ( 1 9 9 3 ,1 9 9 4 ) 认为时间纬度是产 生日历性的主要原副到,在此基础上提出了一种时间变换模型( t i m ed e f o r i n a t i o n m o d e l s ) ,把原先的物理时间纬度变成一种他们称之为v 时间刻度下,再进行动率 估计。b e l t r a l 土ia 1 1 d m o r 锄( 1 9 9 8 ) 提出了一种怪异的随机波动率模型( s v 模型) 【4 】,这 种模型具有类似弱g a r c h 模型具有的时间聚集性的性质。 m s ta 1 1 dn i j m a n ( 1 9 9 3 , 1 9 9 6 ) ) 同时对市场的信息分布也作了种灵活的处理例。m o 瑚a 姐db e l t r a t t i ( 2 0 0 0 ) 进一步推广了这种模型【6 j 。在日历性模型中影响最大的要属a n d e r s o n 和b 0 1 l e r s l e v 最近几年所作的工作。a n d e r s o na n db o l l e r s l e v ( 1 9 9 4 ,1 9 9 5 ) 提出了用一种f f f 回归 建模框架( f o u r i e rf l e x i b l ef o mr e g r e s s i 衄n e w o r k ) | 7 8 j ,在这种框架下估计量假设 没有方差,从而可以在二步法分析中得到真实的波动率值。但正如p a g a l la n d u 1 l a l l ( 1 9 8 8 1 【9 分析那样,= 步分析法对估计量的方差非常敏感。a n d e r s o na n d b o l l e r s l e 吖1 9 9 8 b ,1 9 9 9 ) 1 1 0 ,1 1 】进一步修正和拓展了他们的估计方法。a 珈e t a 1 ( 2 0 0 1 ) 【1 2 1 利用他们的结果实证分析了香港证券市场情况,效果相当不错。b a ie t a l f 2 0 0 0 ) 1 1 3 】拓展了他们的结果去研究在高频数据波动率估计的依存性和非正态性 问题。 其二是针对随机时间效应的模型。对于超高频数据中随机时间效应实证分主 要集中从两个角度:非同步性交易( n o n s y n c l l r o n o u st r a d e ) 和随机交易间隔 电子科技大学硕士学位论文 ( s t o c h a s d cd u r a t i o n ) ,其实这只是一个问题不同的角度看而已。c 锄p b e l l 咖1 对非 同步性交易的实证分析作了较为详细的描述和总结,一般可认为非同步性交易可 以导致较低频数据中:( 1 ) 一阶滞后横截面相关;( 2 ) 一阶资产组合收益率序列相关, 文献可参见c a m p b e l le ta 1 ( 1 9 9 7 ) 【1 4 】。随机交易间隔效应是目前比较活跃的领域, d i a m o n da l l dv 打e a l l i a ( 1 9 8 7 ) 【j 5 j 、e a s l e ya n d0 h 眦( 1 9 9 2 ) 【1 6 j 是较早涉足这个领域 的代表性文献。d i a i l l o n da n dv c n e a l l 鲥1 9 8 7 ) 将交易随机间隔与市场信息传递联系 起来,实证表明较长的交易间隔总会与一个坏信息的发布有关,同时交易频率也和 知情交易者的数量有关。e n 西ea n dd u f o u 啦o o o ) 【1 7 】过 一步讨论了随机交易间隔在 整个价格形成过程中的效应以及在价格对交易进行影响过程中的作用。 目前对于不等间隔的高频数据建模主要就是从对随机交易间隔刻画入手,进 而提出a c d 模型( a u t o r e g r e s s i v ec o n d i t i n a ld u r a 廿0 nm o d e l ) 。e n g l e 在a c d 模型的 研究中所起作用等同于他对a r c h 模型发展的贡献。更确切地说,e n 9 1 e ( 2 0 0 0 ) u 副 可以看作是对超高频数据计量分析的宣言书,o h y s e l ( 2 0 0 1 ) n 9 】给予了积极的回应。 a c d 模型的雏形形成于e n 9 1 ea i l dr l l s e l l ( 1 9 9 4 ) 【2 0 】的工作底稿,后来完善于在 e c o n 咄e t r i c a 上发表的文章。他们直接的思想是在原有的a r c h 模型的框架下,用 一个标记点过程( r n a r k e dp o i mp r o c e s s ) 去刻画随机交易间隔,不同的点过程假设自 然就得到了不同的a c d 模型。e n g l e 髓dr u s e l l ( 1 9 9 6 ) 口“,e n 9 1 ea n dr u s e l l ( 1 9 9 8 ) 睇副 用a c d 模型比较漂亮地完成对交易频率等实时交易变量的预测。e n g l ea 1 1 d 1 a r g e ( 1 9 9 7 ) 【2 3 】贝0 在测量和预测市场流动性方面采用a c d 模型的思想和技术。在最 近两年里对a c d 模型的研究正在不断深入。e n 9 1 ea n dl t l l l d e ( 1 9 9 6 ) 提出了引入价 格和交易量的二元a c d 模型【2 4 】。r u s e l la i l de n g l e ( 1 9 9 6 ) 【2 5 】将类似门限的思想引入 后,提出了一种非线形的a c d 模型。 随机交易间隔效应是日前比较活跃的领域,d i 踟o n d 和v e e a h i a 早在1 9 8 7 年就将交易随机间隔与市场信息传递联系起来,实证表明较长的交易间隔总会与 一个坏信息的发布有关。e a s l c y 和0 h a r a ( 1 9 9 2 ) 2 6 】进一步认为长的交易间隔还会 与无信息发布有关,同时交易的频率也直接与知情交易者的数量有关。e a s l e y 等人 后来还继续论述了随机交易间隔的经济学意义,特别是从市场信息和监管者的政 策制定角度出发,探讨了如何利用制造市场上的随机交易间隔特征来引导和控制 市场的交易情况,在此基础上,e n g l e 和d u f o u r ( 2 0 0 0 ) 瞄7 】进一步论述了随机交易间 隔在整个价格形成过程中的效应以及在价格对交易进行影响过程中的作用。 其实这些a c d 模型的发展极似于当年a r c h 模型的发展。当然没有 a r c h 模型当年在计量经济学界反应那么强烈,但已有一些知名的计量经济学家 4 第一章引言 接受了e n 西e 的从a c d 建模思想,g h y s e l s 【2 8 】等人提出了一种s vd 1 1 r a l i o n 模 型,并在后来的文献中对这种模型的经济学意义做了进一步的阐述。 到目前为止,对于a c d 模型的统计性质( 如估计检验、平稳遍历性、大样本性 质等) 研究还基本是空白、尽管e n 9 1 e 认为a r c h 模型的结果可以平行移植,但由 于不同点过程的刻画和对一阶矩的非线形表示,显然这方面的工作远远不是那么 简单。本论文将会对这个内容有所涉及。 近年来随着高频数据的研究的不断深入,关于a c d 模型的各种扩展和推广模 型不断出现。2 0 0 4 年b a u w e l l s 和v e r e d 船提出了一种随机条件持续模型( s t o c h a s t i c c o n d i t i o n a ld u r a 畦o n ) 【2 9 l 简称s c d 模型。s c d 模型假设持续期间的条件均值是一 个隐含的随机过程,而a c d 模型的持续期间的条件均值是过去信息决定的一个确 定的函数。这两个模型之间的区别类似与刻画低频金融时间序列的波动率两类经 典模型g 触屺h 与s v 模型的区别。 1 3 本文主要研究内容及其方法 金融市场中高频时间序列分为两类:一类是采样间隔相等的高频时间序列,比 如一小时、十分钟、五分钟、甚至是以秒为单位采集的按时间先后排列的数据; 另一类是指对交易过程实时采集的数据( 显然是不等间隔的数据) 。本文对这两种 类型的高频金融时间序列都进行了研究,因为它们之间在模型分析而言存在着质 的区别。 文章结构安排如下: 第二章、对等间隔的高频金融时间序列进行了研究,以上证综合指数不同频率 的数据为样本,研究了等间隔高频金融时间序列的统计特征并讨论了不同采样频 率下数据集统计性质的不同。用一种改进弹性傅立叶方法( f f f ) 度量出周期。用 对数周期图法( g p h ) 检验和估计序列长记忆行为。最后对去周期的收益序列建 立了g a r c h 和e g a r c h 模型。 第三章、综述了国际文献中各种a c d 模型并将其分类,研究了各种模型的统 计特征,对各种扩展模型进行了比较分析,并利用我国股市的分笔交易数据进行 了实证分析。 第四章、s c d 模型是最近被提出的另外一类刻画交易时间间隔的模型,s c d 模 型假设持续期间的条件均值是一个隐含的随机过程,所以比a c d 模型更加灵活可 以更好的拟合高频金融时序特有的统计特征。本章讨论了了s c d 模型的一些基本 电子科技大学硕士学位论文 统计特征,研究了8 c d 模型的高阶矩存在的条件以及自相关函数的性质,并与 a c d 模型进行了比较。 第五章、由于目前对超高频金融时间序列的建模比较活跃的是对随机交易间 隔的分析与建模,而本章将考虑随机交易间隔与收益序列的关系,在a c d 模型的 基础上提出了a c d a r m a 模型,并给出了两个变量的联合密度函数以及估计方法。 第六章、对全文工作进行了总结,并对高频金融时间序列的研究进行了展望。 本文在广泛收集国内外文献的基础上,了解国内外研究现状和研究动态,按 照严谨的科学态度对待每一个问题,避免主观臆断。由于涉及到的主要是时间序列 数据,研究中主要运用时间序列方法来建立模型,兼顾模型的可操作性和模型与 实际的统一性。充分利用了m a t l a b 、e v i e w 和s p s s 等软件的强大分析功能。 第二章等间隔高频金融时间序列的研究 第二章等间隔高频金融时间序列的研究 2 1 等间隔高频金融时间序列的特点 等间隔高频金融时间序列是指日与日内的金融数据,主要是以小时、分钟或秒 为单位采集的数据,有国外学者对一些成熟市场如美国市场的实证分析已经得到 一些经典的日内数据特征,主要有: 1 、日历效应 日历效应( c a l e n d a re 妊b t s ) 是高频金融时间序列的研究中最重要的发现。日 历效应是指波动率、交易量、买卖差价、交易频率等金融指标在日内、周内、月 内现出的稳定的、周期性的运动模式。a n d e r s o na n db o l l e r s l e v ( 1 9 9 4 ) 【3 0 】研究了 日历性与波动率的持续性之间的关系,他们证明了如果将数据中的日历性剔除, 则大大降低较低频率数据中的持续性。a n d e r s o na i l d b o l l e r s l e v ( 1 9 9 5 ,1 9 9 8 ) 【3 l ,3 2 】 进一步研究了日历性的主要影响因素,除了时间刻度,假日、午间休市等影响因素 外,规律性的宏观经济信息发布也是重要的日历性的产生原因。 2 、波动率日内“u ”型走势 波动率日内“u ”型走势是指波动率变化具有很强的“季节性”运动,也就是 说一般每日内的波动率都是开盘与收盘时高,中间交易时间低。w j o de ta l ( 1 9 8 5 ) 利用分钟数据发现这一点,h a r r i s ( 1 9 8 6 ) 【3 4 1 也证实的确存在这种现象,a d m a t ia n d p n e i d e r e r ( 1 9 8 8 ) 【3 5 】从理论模型出发证明了这一现象的合理性。j a i l l 距dj o l l i l ( 1 9 8 8 ) 3 6 1 、m c i n i s ha n dw j o d ( 1 9 9 0 、1 9 9 1 a 、1 9 9 2 ) 【3 7 3 8 3 9 1 有分别实证了其他交易变量如 交易频率、交易量、买卖价差等都具有这种“u ”型走势。 3 、价格序列具有极高的蜂度 在较低频率的数据中,g a r c h 模型是可以刻画一些峰度较大的数据特征的, 但如果峰度达到了1 0 0 以上,那g a r c h 模型就远远不能刻画了。a n d e r s o na n d b 0 1 1 e r s l e v ( 1 9 9 8 ) 4 川实证表明随着日内数据频率的增加,其数据的峰度也是随之 增加的,到分钟数据,峰度就已经得到了1 0 0 以上了。 4 、价格序列一阶负相关性 g o o d h a na n df i 9 1 i u 0 1 i ( 1 9 9 1 ) 【4 ”、m c i n i s ha n dw j o d ( 1 9 9 l b ) 【4 2 】实证了日内 价格序列是具有负的一阶相关性的,特别在出现一些跳点的情况下。b o l l e r s l e va n d 电子科技大学硕士学位论文 d o m o w 池( 1 9 9 3 ) 1 4 3 】再次从买卖寻价的数据中找到了这一特征。l o wa n d m u t h u s u 锄y ( 1 9 9 6 ) h 4 悃5 分钟的频率数据验证序列的负相关性,并进一步证明 了这种相关性具有非线形的特征。 5 、缺少正态性( 1 a c ko f n o 衄a l i t y ) 根据中心极限定理所推出的“金融市场的收益数据服从正态分布”的结论是 有争议的。对于对数形式的收益来说,每个月的对数收益值等于这个月中每分钟收 益值的总和。因而每月收益数据趋于正态分布。但是当交易间隔变得比较短时,正 态分布的论点就失去了效力。有实证研究表明,随着交易间隔越来越短,收益的分 布也会越来越偏离正态。非正态性之所以重要,不仅因为它会令很多标准统计检验 失效,而且它也是建立一些模型如b 1 8 c ks c h o l e s 期权定价模型和进行风险价值分 析的重要基础。 除了以上5 个主要的特征外,高频数据自然还具有一般的a r c h 特征( 如尖 峰厚尾、聚集性、长记忆性等) 在国内由于种种原因,关于高频数据的存储刚刚起步,可利用的数据并不多, 因而运用高频数据所进行的研究还鲜有发表。在这样的情况下,以往基于日数据, 周数据的分析结果在高频数据的基础上是否依然成立呢? 在高频数据集下,中国 股市是否会表现出一些新的特征呢? 因此,下节本文将利用收集到的上证指数不 同频率的数据集对中国股市的波动特征进行分析,试图发现基于高频数据的中国 股市的波动特征。 2 2 我国股市基本统计特征和日内波动效应 由于研究的对象是日内股票高频交易数据,因此我们特别关注交易的时间刻 度,交易的信息与选用的数据的时间间隔密切相关的,例如,每分钟的数据与每5 分钟,每6 0 分钟的数据所包含的信息就有很大的差别,数据频率越低,信息的综 合性就越强,而丢失的个体信息就越多。 2 2 1 基本统计量 首先给出几个统计量的定义: 1 、收益r :离散时间的收益由下式给出: = i o g 只一l o g p p 这里只是股票价格, 第二章等间隔高频金融时间序列的研究 2 、平均收益e ( ) :描述的是收益状况和人们的预期 e ( i ) 。寺善 3 、极差d :描述的是收益的最大波动程度,极差越大表明风险也就越大。 d = m a x ( ) 一i i l i n ( ) 4 、标准差s ( ) :它反映的是收益率分布的离散程度,用以衡量收益风险的大 小,标准差大,收益变动的幅度就大,风险就越大。 讯) = 隐秘 2 1 2 5 、偏度6 :6 由收益的三阶矩计算,度量的是收益率序列分布概率密度对称 性。若偏度大于零,称其分布为正偏或右偏;反之,偏度小于零称其分布为负偏或 左偏。当分布密度曲线为右偏时,密度曲线的最大值位于均值左侧,曲线的尾巴拖 向右方;当分布密度为左偏时,情况正好相反。6 的量值表示偏斜的程度。偏度的 计算公式是: 6 :圭延型: 6 、峰度j :峰度用来测定收益分布的形状,一般以正态分布的风度为基准( 正 态分布的峰度是3 ,当峰度系数大于3 时,表示该分布比正态分布厚尾,若小于3 时,则表示比正态薄尾。一个分布的峰度值较大,是由于大幅度偏离均值的异常值 存在造成的。峰度是由收益的四阶矩度量,其计算公式为: 后:掣 乃:逛矬掣 f 一童( ) l 自相关系数的取值都在一l 到1 之间,它反映了滞后j 期的收益之间的密切程度。该 电子科技大学硕士学位论文 值的绝对值越接近1 ,说明两者之间的线性关系越密切。 2 2 2 上证综合指数不同频率数据的基本统计分析 中国证券市场高频数据是近几年才开始有比较规范的纪录。为了数据的完整与 规范,数据的采样时间为从2 0 0 4 年3 月5 日至2 0 0 5 年的5 月1 7 日上证综合指数5 分钟间隔数据进行分析。上证交易所的交易时间为:上午9 :3 0 一1 1 :3 0 下午1 3 :0 0 1 5 :0 0 ,总共4 个小时,也就是2 4 0 分钟。剔除节假日和不完整交易记录日后共有3 0 0 天,即共计1 4 4 0 0 个上证综合指数5 分钟数据。样本数据来源于成都大学数据仓库 示范实验室。虽然a n d c r s c n 和b o l l e r s l e v ( 2 0 0 0 ) 1 4 5 】认为每日第一个交易数据包含 隔日信息,应该从日内交易数据中剔除。但是我们认为第一个交易数据本身是时点 数据而不是时期数据。它反映了开市时交易者的行为特征,并为后面交易奠定了基 础,只有包括首个交易数据才能完整反映当日个股走势。因此,我们的采样时段为每 曰9 :3 5 开市起至1 5 :0 0 收市,分别以5 分钟、1 5 分钟、3 0 分钟、6 0 分钟间隔进行采 样。收益率用对数差分方法计算:,。= 1 np f ,一hp f - 1 。,其中,i ,。是第n 个时交易日 期的第t 个5 分钟( 或1 5 分钟等等) 交易时点,b 。是该时点价格。 本文采用不同的时间频率来研究收益率序列的基本统计特征。发现了很多有趣 的现象。表2 1 给出上证指数不同频率数据的基本统计描述: 表2 1 日内收益数据的统计信息 表2 1 可以看出:平均收益的绝对值和标准差都是随着时间频率的由高到低而增大, 这是由于绝对收益和收益的离散程度都是随时间间隔的增大而累计增加。偏度系数随 着时间频率的由高到低呈现下降的趋势,其中时间间隔为5 分钟的偏度值最大。这表 明在该频率下,小于平均收益的交易次数明显偏多。峰度系数随着时间频率的由高到 低不断降低,说明在高频数据中偏离均值的异常值更为突出。 由计算结果看到,高频和低频数据的统计特性有着极大差别,随着时间频率的增 第二章等间隔高频金融时间序列的研究 高,股票收益的非正态特性也愈加显著,且随频率的不同,非正态特征也不同。 2 2 3 日内股票收益的实证分析 根据时间序列的理论,自相关函数具有一种“指示器”的功能,能够表征时间序 列某些特征。 做出上证指数5 分钟指数收益和5 分钟绝对值指数收益的4 8 0 阶滞后( 1 0 天) 自相 关函数波形图如图2 1 、图2 2 。 对比图2 1 和图2 2 可以发现,图2 1 中指数收益序列的自相关函数几乎为白噪声 序列而图2 2 绝对值收益序列的自相关函数表现出明显的下降特征,这与a n d e r s e n 和 b o l l e r s l e v 的研究结果相似【4 5 】。并且绝对值收益的日内波动性表现出强烈的周期性特 征,且恰好以4 8 期为一个周期也就是一天( 2 4 0 分钟) 为一个周期。自相关函数每天 都呈现出一种明显的“u ”形曲线。 同时从图2 2 还可以看出自相关函数波形随着滞后阶数的增加而呈现出不断下降 的趋势,这说明上证综指有长记忆性特征,但由于周期循环相当突出,长记忆特征相 对不是十分明显。 周期循环的存在说明上证综指的价格变化在时点上有较强关联,而这种时点上价 格行为的规律性正好印证了非对称信息假说。长记忆性则印证了分形之父一一 m a i l d e l b r o t 对有效市场假设的质疑。周期的循环和长期持续现象同时存在是高频数据 与低频数据的最重要区别之一。许多文献表明日度等低频数据存在非周期的长记忆行 为,而高频数据则存在周期性的长记忆性。这说明在交易间隔十分短的情况下,投资 者无法获得充分的市场信息,行为的调整很大程度上受到交易时点的影响,如开市和 收市时往往比较活跃而中间时刻趋于平稳。随着交易间隔的增加,投资者有比较充分 的时间来考虑投资策略,未来投资行为更多的是受到预期等其他因素的影响,其行为 规律性降低。 因此,5 分钟绝对收益序列既有周期性又具有长记忆性。当时间序列具有这种强烈 的周期性时,经典的a r c h ( g a r c h ) 模型和s v 模型变不再适用。所以若要对日内 数据进行建模,就必须考虑这种周期性,并在原始时间序列中剔除。下面本文将考虑 如何度量出周期 电子科技大学硕士学位论文 譬 五分钟收益自相关系数 uoo l _ 口n u n - h r 图2 1 五分钟绝对收益自相关系数 图2 2 1 2 口c o e b b n 哪p p e r co n 埘呲el t l o - e r co n f h e 。1 h t 第二章等间隔高频金融时间序列的研究 2 2 4 日内效应的度量 从以上的分析中,我们认为上证综合指数5 分钟收益序列存在周期性和长记忆 性。由于日内效应的存在,如果直接利用a r c h 类模型对日内收益进行建模,必然会 导致严重的错误。有些学者,如l 锄o u r e l 和l a s t r a p e s ( 1 9 9 0 ) 认为长记忆性是一系 列微弱的结构变化导致的。但是a n d e r s e n 和b o i l e r s l e v ( 1 9 9 7 a ,1 9 9 8 ) 、a n d e r s e n , b 0 1 l c r s l e v 和c a i ( 1 9 9 9 ) 证明了长记忆特征是日内波动固有的现象而非结构性变化导 致。他们认为高频数据中周期性的存在可能加深长记忆程度,要分析长记忆特征必须 过先滤出周期因子。下面本文首先用f f f 方法度量出周期,而后上分析样本数据的长 记忆 2 2 4 1 周期的度量一f f f 方法 1 9 9 7 年加1 d e r s e n 和b 0 1 l e r s l e v 【4 刀在分析高频收益的时间序列时,根据1 9 7 3 年c l a d k 首先提出的混合分布假设( m d h ) 将股市收益分为三部分。即假定日内收益率是由市 场共同因子、个体因子和随机因子构成,公式表述为: l ,。= 一”2 q s 。z f ,。+ e ( i ,) ( 2 1 ) 其中e ( ,。) 表示无条件均值,为每天收益区间的总数,s ,。是第r 个交易日第n 个 收益区间上确定的周期因子,q 是第t 目的波动率,z f 。是独立同分布且均值为零单位 方差的随机变量,并且假定它与口,相互独立。( 2 - 1 ) 变形为: 1 0 9 一e ( ,i ) 2 1 0 9 砰+ l o g = l o g :+ l o g z 0 ( 2 - 2 ) 此时上式的左边都是已知的数值或容易估计量,右边是周期因子加上一个误差项。令: _ ,。= 2 l 0 9 4 i ,。一e ( ,。) i 】一l o g c r ? + l o g = l o g s 0 + l o g 笤,( 2 3 ) 这样。就是一个可以计算的数值,同时它还是一个关于周期因子的变量。 有许多方法可以估计s 。,其中g a l l a n t 提出的弹性傅立叶回归( n e x i b l ef o w i e r f o n t ir e g r e s s i o n ) ( f f f ) 方法是最为方便的。f f f 模型建立的主要方法是基于曰内的时 间区间n 和正的傅立叶形式逼近: ,。= ,( 口;q ,聆) + 日。 坤;哪声执意轰嘻辑。+ 砉 c o s 警+ 驷等 刚, 电子科技大学硕士学位论文 其中l = - 1 j _ ( + 1 ) 2 ,2 = 。1 j 2 = ( + 1 ) ( + 2 ) 6 为正态化常数,l :日是哑 l = 1,;l 元变量,在绝对收益率出现非规则周期波动时取1 ,否则取o 。 在实际的参数估计中是采用一种比较方便的两阶段方法来进行的。首先,用足。 的样本均值来代替e ( 足。) ,再用某种日收益波动率模型得到的q 来代替q ,从而 ( 2 3 ) 式的左边是已知变量,得到薯。序列。然后把薯。看成是一个新的因变量,对( 2 4 ) 式应用最小二乘法来确定参数,估计出相应的参数届,令z 。= ,( 臼;q ,”) 表示等式( 2 4 ) 右边的估计值,就可以根据z 。得到s 。的估计值。进一步做正态化,得到: s 。= ( 2 - 5 ) 并且有丁“s ,。z 1 虽然两阶段法并不是完全有效,但如果模型设立形式是正确的,则参数估计具有 一致性。 2 2 4 2 长记忆性分析g p h 方法 长记忆性是指过去的冲击持续到将来,对预期的将来具有很大的影响。在大多 数情况下,自相关函数的曲线图用来描述时间序列的长记忆特征。长记忆性可以从 不同角度定义,我们采用的定义如下:假设薯是一个平稳过程( s t a t j o n a r yp r o c e s s ) , _ ,阶滞后的自相关函数为p ( ,) ,如果存在一个实常数口e ( o ,1 ) 及c o 使得 憋p ( _ ,) ( 1 ) = 1 ,则序列而便被称为长记忆序列,或者说序列薯具有长记忆性特 征。 如果序列弘的自相关函数是几何性有限的,例如平稳的、可逆的a r m a 序列, 有i p ( 列茎删,o m 1 这类序列便被称为短记忆序列。 g p h 法又称为对数周期图法,是g e w e k e 锄dp o r t e r - h u d a k ( 1 9 8 3 ) 在分数维协 整过程之上提出的一种检验和估计序列长记忆行为的方法。设( 丑) 为样本周谱, ,( ) = 刍l 喜e ( 打以) 1 2 当频率接近于零时,分形求积时间序列是渐进对数线性的, 即有: 1 4 第二章等间隔高频金融时间序列的研究 h 啪h 吲旷扎卜2 ( 讣h 器 弘 其中,) 是序列的谱密度,正仅) 是谱密度函数, 表示第f 个傅立叶频 率。d 是分形维,如d ( o ,1 2 ) ,时间序具有长记忆性,d ( 1 ,2 ,) 则序列是非平稳 过程,如d ( 1 2 ,0 ) 则为反久性序列。从( 2 - 6 ) 式可以得到d 的一个简便估计: h ,( 以) = 乩一d h as ;n 2 ( 鲁 + b c z 一, 如果序列是分数维协整即长记忆的,那么经过分形滤波之后的新序列( 1 一三) 4 薯应 该是服从a r m a 过程的平稳序列。 2 3 日内收益的实证研究 2 3 1 周期分析 以据上证综合指数5 分钟数据为样本,采样时间为从2 0 0 4 年3 月5 日至2 0 0 5 年的5 月1 7 日。考虑到长记忆特征的存在,我们利用a r ( 1 ) 一f i g a r c h ( 1 ,d ,1 ) 估 计正。由于已有文献表明上海证券市场存在周末效应,对( 2 - 4 ) 进行改进,增加 了衡量周末效应的哑变量:吐,f _ 1 ,2 5 e ( r 。1 用样本均值替代。通过b i c ,s i c 准则,我们最终确定滞后阶数 p = 5 ,d = 1 ,f = 5 估计结果如表2 2 在估计时我们发现,如果去掉哑变量则直到滞后8 阶参数估计都是显著的。但 是加大滞后阶数并不能使拟合优度等检验统计量得到改进,而且哑变量有明显的 经济含意同时考虑到建模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论