基于高频数据的中国股市收益和交易机制研究_第1页
基于高频数据的中国股市收益和交易机制研究_第2页
基于高频数据的中国股市收益和交易机制研究_第3页
基于高频数据的中国股市收益和交易机制研究_第4页
基于高频数据的中国股市收益和交易机制研究_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于高频数据的中国股市收益和交易机制研究

1高频市场数据建模、市场运行特征与市场风险的关系高频数据通常是从每天、小时、分钟甚至秒中收集的金融数据。高频数据是指每个交易的数据。高频金融交易数据分析模型于20世纪90年代开始发展。它被广泛应用于金融市场微观结构理论的应用和验证中。一般来说,金融数据的信息将继续影响价格的变化过程。数据频率越低,信息的损失越多。低频数据不能代表金融资产价格的实时动态变化特征,而高频数据包括丰富的日内变化特征的信息。它是各种经济信息在市场中的忠实和快速响应。在研究高频数据时,需要对整个过程的统计规则和性能进行描述。“日常效应”是高频数据研究中最重要的发现之一。金融市场微观结构理论中的“异象”之一就是收益率等表征市场特征的变量具有日期效应,如月内效应、周内效应、日内效应.对一些成熟市场,如美国市场、香港市场的高频数据实证分析已经得到一些典型的日内数据特征.文献和文献各自发现“日历效应”,并给出了日内“U”型模式的理论解释.文献对它们进行了比较.文献对股票市场的研究表明,波动率和交易量均呈现出“U”型的日内季节性,即波动率在开盘后最大,随后下降,而在收盘前又逐渐上升,波动率与反映交易活跃性的交易量之间存在强烈的正相关,交易在日内时间上的不均匀分布可能导致了波动率的日内季节性.文献利用个股交易数据对日内“U”型模式进行了实证,并发现交易量、买卖价差、交易频率也存在这种模式.文献利用弹性傅立叶形式回归(FFFR)对日本股票市场进行了分析,发现由于日本市场实行午间休市的交易制度,这是不同于美国市场的,从而日本股票市场波动呈现出不一样的日内双“U”型走势.文献利用分钟数据发现波动率日内“U”型,也就是说一般每日内的波动率都是开盘与收盘时高,中间交易时间低.文献也证实的确存在这种现象.文献从理论模型出发证明了这一现象的合理性.文献也对价格波动率的日内模式进行了探索,实证分析了波动率在早上开盘和下午收盘时往往较大,其他交易变量,如交易频率、交易量以及买卖价差也呈现出同样的“U”型变化模式.文献对交易持续时间(Duration),即久期的日内模式进行了研究,也得出了类似的结论,变化模式从图形上来看类似于倒“U”型.文献研究了日历性与波动率的持续性之间的关系,他们证明了如果将数据中的日历性剔除,则大大降低较低频率数据中的持续性.文献进一步研究了日历性的主要影响因素,除了时间刻度,假日、午间休市等影响因素外,规律性的宏观经济信息发布也是重要的日历性的产生原因.以上绝大多数学者的研究重点主要集中在对证券市场的交易变量、波动性和流动性情况.国内学者对此的研究也是集中于对股票市场波动性与流动性进行估计.文献采用5分钟交易数据对中国沪深股市A股日内价格及交易量变动模式进行了实证分析.文献给出高频数据建模的综述.文献对上海股市“U”型特征进行了分析,并且建立了估计日内回报特征的FFF模型.文献对成交量的日内模型进行了研究,得出了与国外类似的结论,即成交量在日内呈现倒“U”,但中国股票市场的买卖价差呈现出“L”型的日内变动模式,不同于国外成熟市场如纽约股市交易所的“U”型日内变动模式.文献对上海期铜的研究表明5分钟绝对收益率波动性的“L”型变化模式以及交易量和交易笔数的“U”型变化模式.其他一些文献对交易时间间隔的研究主要集中于对交易间隔的建模,但对其日内特征的详细分析很少.上述研究主要是针对股票市场,部分是针对外汇市场,而对于我国期货市场内部结构、运行特征的研究非常缺乏.中国期货市场作为新兴的市场,近年来在国际上起到越来越大的作用,其市场微观结构也受到众多关注,其结构跟发达市场相比,跟有做市商的市场相比,必然有所不同.本文以国内期货市场较活跃的期货品种为代表,运用高频数据对中国期货商品收益率、交易量的日内变化模式进行实证研究,同时从市场微观结构理论出发分析这种模式的形成原因.并在此基础上,分析价量关系,建立向量自回归模型,实证研究收益率波动变化的影响因素,交易量波动变化的影响因素,从而揭示我国期货市场的内在特征,强化期货市场风险管理,填补了国内外这方面研究的空白.通过对高频数据的分析,洞察金融市场收益及波动的日内变化模式,分析其日内周期性,为进一步剔除周期性,对收益波动特征的进一步研究奠定基础,为研究市场风险奠定基础,为中国市场交易机制的完善提供一定实证依据.本文结构安排如下:第二部分介绍数据的选取及收益率序列的基本统计特征;第三部分分析收益率、交易量的日内特征;第四部分分析在高频数据下收益率与交易量、持仓量的动态关联性;第五部分给出总结性评论.2不同品种3个频率特征本文采用中国三个期货市场的、交易比较活跃的有代表性的六个商品期货品种的1分钟的高频数据来刻画中国期货市场的日内变化模式.数据来源于世华财讯和文华财经的一分钟价格数据.对每一个期货品种,在同一时间,有不同的合约在进行交易,我们按照交易最活跃的合约来构造连续期货合约.数据包括交易发生时刻、价格、交易量以及该合约该时刻的持仓数量.从2007年4月27日到9月28日,其中棉花因数据原因,只到8月15日,剔除交易记录中不合理的情况,如交易时间外的数据和一些有明显错误的数据,剔除连续竞价时间之外的交易数据,共得数据铜21414个,天然橡胶21405个,大豆23043个,玉米22493个,棉花14937个,强麦23108个.主要计算结果由Matlab7.1.0编程实现.我们将价格收益率Rt定义为价格的自然对数的一阶差分的100倍,即:Rt=100×D(ln(Pt))=100×(ln(Pt)−ln(Pt−1))(1)Rt=100×D(ln(Ρt))=100×(ln(Ρt)-ln(Ρt-1))(1)并剔除掉隔夜的收益率,即剔除掉由当天第一笔交易数据和前一天最后一笔交易数据得出的收益率,共得收益率序列铜21312个,天然橡胶21303个,大豆22938个,玉米22390个,棉花14864个,强麦23003个.其统计描述如表1.可以看出,六个品种的1分钟收益率均值基本都在0附近,峰度都显著大于3,收益率序列有明显的尖峰厚尾性.JB统计量也说明收益率序列都显著地不服从正态分布.各品种收益率序列图见图1~6.3市场表现的风险首先产生ONEDAY序列,即把每天同一个时间点的数据取其平均值,得到每个交易时间点的平均收益率、平均绝对收益率、交易量、持仓量.由于每个时点处取值的偏差程度差别不太大,所以对每个时点处数据取平均值,有其代表性和合理性.分析其日内趋势,并从金融市场微观结构来分析其原因,包括交易制度、投资者心理等.3.1价格波动的“u”型特征由于收益率均值无明显变化趋势,平均收益在0附近,可以看作均值为0的随机波动序列,无明显的周期模式,为考察价格波动变化特征,应考虑绝对收益率序列.由图7~12中可以看出,中国商品期货1分钟绝对收益率不是一个平稳过程,整体来看,从开盘到收盘,日内呈明显的略为扁平的“L”型特征,这与我国股票市场的“U”型特征有显著的区别.中国上海和深圳股市5分钟绝对收益率日内特征是典型的“U”型特征,开盘时价格波动剧烈而且逐渐波动幅度降低,在临近收盘又开始大幅上升,即开盘和收盘波动都显著增大.而期货市场尾市收盘的波动并未显著增加,故呈“L”型.开盘价格波动大约是日平均收益率波动的3倍左右.国内外对股票市场的很多研究均表明日内波动性呈现“U”型特征.产生这种原因与金融市场的微观结构和隔夜信息的消化、吸收和释放有直接的关系.文献认为是集合竞价导致了纽约股票市场开盘的高波动性.同时,从图中还可以看出,中午停盘,下午开盘之后,价格波动也有小幅提高.因为早开盘前是有集合竞价的,而中午停盘后,下午开盘前是没有集合竞价的,但价格波动仍有显著提高,所以我们认为高波动性是由于在这段无交易时间内积蓄的信息积累、释放的结果,而不是由集合竞价导致的开盘的高波动性.期货市场日内收益率呈现“L”型特征,主要原因可能在于:隔夜外盘价格带来的套利压力、机构投资者利用私人信息和集合竞价制度来影响价格的短期变化.由于信息不对称,隔夜信息的消化、吸收和释放使得开盘时价格波动剧烈.随后知情交易者对普通交易者起某种引导示范作用,在开盘20~30分钟后,信息得到完全释放,不知情交易者也从开始的交易中了解到更多的信息,逐步调整自己的价格和仓位,整个市场价格进入正常的缓和的波动.3.2期货市场市场的风险分配从图13~18可以看出,从日内整体来看,不同于国外市场和股票市场的“U”型特征,中国期货1分钟交易量呈现日内“L”型走势,开盘较高而且逐渐降低,并在早开盘30分钟后,趋于平稳.只有棉花接近“U”型.而且对上海市场来说,每小节休息(10:15~10:30以及14:10~14:20)和中午停盘(11:30~13:30)之后交易量都有明显的小幅上升.类似于是一个小的新开盘.而对于大连市场和郑州市场来说,每小节休息(10:15~10:30)和中午停盘(11:30~13:30)之后交易量略有增加,幅度不很明显.期货交易量这种变化与期货品种的交易机制密切相关.我国期货市场采用盯市制度和保证金交易制度,整个期货市场的投机气氛比较浓,投资者的风险承受能力较弱,早市收益率巨幅波动的情况下,无论上涨下跌都会对交易的一方形成压力,许多大的投资者和机构投资者能够较早得到信息,或者止损离场或者获利了解,早市的交易量伴随放大,交易活跃.交易量越大,不知情者根据从交易中获得的信息,调整自己价格的幅度也增大,导致价格波动剧烈.在开盘约30~40分钟后,信息得到完全释放,整个市场价格进入正常波动,交易量也平稳波动.早开盘时交易量的增加是由隔夜信息事件引起的,这符合文献提出的无论是利好还是利空消息,都会导致交易强度增大.对于无交易时间(小节休息和中午停盘)之后,此阶段虽然没有集合竞价但仍有价格波动及交易量的增加,尤其是中午停盘下午开盘后的交易量显著放大,我们认为是由于无交易时间中积累的信息的释放和积蓄的交易需求集中释放的结果.由于无交易时间不是很长,所以虽然交易量也有显著增大,但不像早开盘时那么巨大.由于非对称信息程度大,造成了开盘时,交易量大,价格波动也大.这一点与股市是一致的.期货市场日内收益率和交易量的“L”型特征不同于股市的“U”型特征,主要原因可能在于:1)隔夜信息的来源不同.在中国的股票市场上,由于中国市场相对国际市场的封闭性,隔夜信息主要来自国内的相关变化,而少数交易者利用这种隔夜信息及开盘前的重大内幕信息,可以在集合竞价过程中操纵交易价格.而对于中国期货而言,在我们休市时,外盘仍在交易,所以隔夜信息不仅仅来自国内相关新信息,更主要来自于伦敦、芝加哥等期货市场的隔夜交易情况.由于伦敦、芝加哥期货价格变化带来的套利压力使得中国期货在开盘即调整价格.2)对下一个交易日的预期不同.股市对下一个交易日的预期主要来自于本土市场,而期货市场对下一个交易日的预期,更多的受国际市场的影响,由于交易中断带来的不确定因素更多,所以为规避风险,会等到第二天有了国际市场的信息,再根据自己对收益的预期,调整自己的资产组合.3)交易制度不同.股市实行“T+1”的交易制度,使得交易者以及一些大机构投资者往往会在收盘前2~3分钟挂单交易,主动调整资产头寸,以规避隔夜风险,使收盘前交易量增大.期货市场实行“T+0”的交易制度,当天开仓,当天即可平仓,交易者可在一天当中多次买卖,调整头寸,而不必在收盘前调整.4最优模型的建立交易量和收益率之间的关系历来是金融市场微观结构理论研究的重点.在金融市场上,价格的变动反映了市场对新信息的反应,波动性反映了价格波动的剧烈程度,而交易量则反映了投资者对新信息认同的差异程度.持仓量则反映了投资者对该合约的认同程度.研究价格波动与交易量、持仓量之间的动态关系有助于了解期货市场的微观结构、市场信息传播的方式和速度,以及市场价格如何对信息做出反映.同时也有助于了解交易量和持仓量在期货价格波动中所起作用的大小.强化对期货市场非风险管理.首先剔除收益率、交易量和持仓量的日内趋势,然后建立VAR模型,对VAR模型应用Granger因果关系检验,初步定性分析波动性、交易量、持仓量三者之间的相互影响.然后通过对VAR模型,应用方差分解和脉冲响应分析,进一步量化分析各变量之间的交互影响程度,以及持续时间.向量自回归(VAR:VectorAutoregression)用于相关时间序列系统的预测和随机扰动对变量系统的动态影响,它不带有任何事先约束条件,不需对模型的变量是外生还是内生进行假定,将每个变量均视为内生变量.建立VAR模型一般应满足稳定性条件.稳定性是指当把一个脉动冲击施加在VAR模型中某一个方程的新信息(innovation)过程上时,随着时间的推移,分析这个冲击是否会逐渐地消失.本文应用OLS法进行ADF回归,ADF检验表明结果表明绝对价格波动、交易量均满足平稳性要求,但持仓量不满足,其一阶差分形式满足平稳性要求.故以下考虑绝对价格波动序列、交易量序列、持仓量差分序列之间的Granger因果关系,及对他们建立VAR模型.建立VAR模型中滞后阶数k按AIC,SC准则选取.对铜取k=8,天然橡胶取k=9,大豆取k=8,玉米取k=7,棉花取k=4,强麦取k=6.4.1绝对价格波动与东南角供给和供给之间的关系关于价量关系,一种是文献提出的连续信息到达假设(TheSequentialInformationArrivalHypothesis),该假说认为市场信息是分步逐渐向外扩散的,在市场信息不断传递的过程中,引起价格波动和交易量的变化,并随着新信息的不断增多,价格波动和交易量同步增大.根据连续信息到达假设,信息是分步向外扩散的,在价格达到最后的均衡前存在许多中间平衡点,交易者分步得到信息,当所有交易者得到有关信息后,市场才能达到有关均衡,绝对价格收益与交易量之间应存在双向引导关系.因此绝对价格波动的过去信息有助于对未来交易量的预测,同样交易量的过去信息也有助于预测未来绝对价格波动.另一种假说是文献最早提出的混合分布假说(TheMixtureDistributionHypothesis,缩写MDH).混合分布假设认为:金融资产的收益和交易量是由一个潜在的不可观察的信息流共同决定,当信息流到达市场时,将同时产生收益和交易量的变动.在信息流的作用下,市场的需求状况发生变化,原有的平衡被打破,引起价格的上下波动,在价格波动过程中,交易同步进行,价格和交易量对新信息的反映是瞬时的.不论价格波动的方向如何,交易量都会随着价格波动的增加而增加,因而绝对收益与交易量之间呈现正相关关系.根据混合分布假设,绝对价格收益与交易量之间在任一方向上均不应存在引导关系.由Granger因果检验,可以看出,对于期货市场,绝对价格波动和交易量互为对方的Granger原因.Granger因果检验结果是双向的.绝对价格波动和持仓量也互为对方的Granger原因.这是因为持仓量是不平稳的序列,我们用的是持仓量差分序列,而持仓量差分是与交易量高度相关的.这一点和股市的单向Granger原因是不一样的,由于股市缺乏做空机制,交易者的“追涨”心理,造成价格下降很多时,绝对价格波动很大,但交易量无大幅增加,所以往往得出结论:交易量是绝对价格波动的Granger原因,但绝对价格波动不是交易量的Granger原因.这再次说明了,由于期货市场的做空机制存在,使得期货市场表现出与证券市场不一样的特征.这些同时也说明,我国期货市场的信息传播方式更符合连续信息到达假设.交易量和持仓量互为对方的Granger原因,但相比较而言,就统计量的值来看,交易量对持仓量的影响大于持仓量对交易量的影响.这也符合基本常识,持仓量的变动是由交易量引起的.文献认为,价格波动与交易量是由潜在的不可预测的信息流共同决定的,信息流的冲击将同时影响到交易量和价格的波动,价格和交易量对信息流冲击的反应是瞬时的,交易量随价格波动的增加而增加.文献提出证券市场上的价格收益与交易量之间存在正相关关系.而文献对期货市场的研究发现:期货价格收益和交易量之间不存在相关关系.他们认为造成这一原因的结果是证券市场缺乏做空机制,或者证券市场做多和做空的成本不一样,因此价格上升时通常伴随着较大的交易量,价格下降时,交易量相对较小,从而造成了证券市场上的价格收益与交易量之间的正相关关系.而期货市场是双向交易,作多与做空的成本是一样的,因而在价格上升和下降过程总交易量是对称的,故期货价格收益与交易量之间不存在相关关系.文献对期货价格收益的波动与交易量的关系,用日度数据做过的实证研究也表明,期货价格收益与交易量不相关,而期货价格的绝对收益与交易量正相关.我们用1分钟高频数据也可得出绝对收益与交易量之间互为Granger原因.这种因果关系只是定性的关系,为了定量分析其关系,度量这种因果关系的大小和此关系是正向影响关系还是负向影响关系,我们建立VAR模型,并进行方差分解和脉冲响应分析.4.2变量解释力方差分解方法提供了一种描述系统动态变化的方法,其主要思想是,把系统中每个内生变量(共m个)的波动按其成因分解为与各方程新信息相关联的m个组成部分,比较各部分的贡献度,从而了解各新信息对模型内生变量的相对重要性.随着滞后期的延长,新信息对各个变量的影响逐渐趋向平稳.方差分解方法可以定量地把握变量间的影响关系.对各品种的VAR模型的方差分解结果如以下各表.当以绝对价格波动作为被解释变量时,其自身的滞后阶数解释了大部分的残差扰动,约占90%~97%,交易量解释了3%~6%的残差扰动,持仓量对绝对价格波动解释力很小,一般解释程度不到1%,说明交易量对绝对价格波动还是有一定解释力的,持仓量变化对价格的影响很微弱.变量解释基本稳定在第30期.当以交易量作为被解释变量时,我们发现,交易量自身的滞后阶数解释了70%~85%的残差扰动,价格波动对交易量有比较强烈的影响,绝对价格波动解释了15%~30%的残差扰动,持仓量对交易量的影响比较微弱,解释程度不到1%.变量解释基本稳定在第30期.当以持仓量作为被解释变量时,我们发现,基本上持仓量自身的滞后阶数解释了45%~70%的残差扰动,交易量解释了25%~45%的残差扰动.绝对价格波动可以解释持仓量的5%~10%的残差扰动.变量解释基本稳定在第30期.方差分解图如下.可以更直观形象看出各变量的解释力.综上,可以看出,尽管同时对外界新信息作出反应,但考虑其相互间关系时,三种情况下,变量解释都基本稳定在第30期左右.说明对于新信息的反应,基本上30分钟后会逐渐消失.这也与前文收益率、交易量在开盘时比较大,30分钟后基本变为平稳的波动相吻合.同时,价格波动对交易量的影响大于交易量对价格波动的影响.持仓量对交易量的影响很小,但交易量对持仓量的影响很大,约占40%.4.3从脉冲响应的角度,市场信息传播和市场信息传播共同影响,所有市场信息的传播都将没有形成.脉冲响应函数表示系统对每个变量的单位冲击所产生的反应.它具体刻画了在扰动项上增加一个数值等于标准差的冲击对于各变量当前值和未来值的影响.对一模型中某一个变量增加一个冲击,将直接影响这个变量,并且通过VAR模型的动态结构传导给其他变量.总体上看,本文中六个品种的脉冲响应函数结果还是比较类似的,只是幅度略有不同:绝对价格波动对于其自身一个标准差新息的到达,即期立刻有了较强烈的反应,波动性大幅增加,之后迅速减弱,第2期就衰减到1/8左右,然后开始缓慢衰减,到15期左右衰减为0.该序列对来自其它方程的新息在第一期都没有反应,其中,来自交易量一个标准差新息的影响在第2期比较明显,且达到最大,是正向的反应,然后缓慢衰减,到第15期后趋于0.来自持仓量一个标准差新息的影响一直很微小,基本都在0附近,表明持仓量对价格波动影响微弱.交易量对于其自身一个标准差新息的到达,即期立刻有了较强烈的正向的反应,交易量大幅增加,之后迅速减弱,第2期就衰减到1/2左右,然后开始缓慢衰减,持续时间较长,超过20期.该序列对来自绝对价格波动的一个标准差新息的影响在即期也有正向的反应,且达到最大,之后迅速减弱,第6期后开始缓慢衰减,到第20期后影响基本消失.该序列对来自持仓量一个标准差新息的反应一直很微小,且即期没有反应,随后,基本都在0附近,这表明持仓量对交易量的影响微小.持仓量对于其自身一个标准差新息的到达,即期立刻有非常强烈的正向的反应,持仓量差大幅增加,之后迅速减弱,第2期就衰减到1/10左右,然后再缓慢衰减,第10期后基本趋于0.该序列对来自绝对价格波动的一个标准差新息的影响在即期就有正向的反应,且达到最大,然后开始迅速减弱,第4期后开始缓慢衰减,到第16期后影响基本消失.该序列对来自交易量一个标准差新息的反应即期也有正向的反应,之后迅速衰减,第5期后开始缓慢下降,但仍大于持仓量对自身的反应,到第20期影响基本消失.这与前文Granger因果检验的结果中交易量对持仓量的影响显著相吻合.从脉冲响应图也可以看出,我国期货市场信息传播基本是符合文献提出的连续信息到达假设的.市场信息是分步向外传播的,不对称信息对交易量和波动性有较持续的影响,绝对价格波动和交易量可以作为新信息到达的不同表现形式,存在着共同变化的趋势,同时二者相互作用,给他反映了市场的新信息.大的交易量伴随大的绝对价格波动.成交量的信息有助于对价格波动的预测.5期货市场信息不稳定因素的作用本文运用1分钟高频数据对我

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论