论文参考模板_第1页
论文参考模板_第2页
论文参考模板_第3页
论文参考模板_第4页
论文参考模板_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第九届广东大中专学生科技学术节-首届广东大学生金融建模大赛基于极值过滤思想的择时交易策略杨程炜2015.6.26摘要首先,结合核回归、指数滑动平均模型,对价格序列进行去噪、光滑化。然后,通过对极值建立过滤规则,筛选出一系列具有“代表性”的极值,极值序列有两方面的信息具有重要意义:第一,能够很好地反映价格序列过去的走势;第二,最后一个极值有可能成为趋势扭转的信号。因此,适当添加限制条件,使得尽可能在趋势扭转时进行开仓。本文基于第二点,通过构造标准差区间确定买卖信号,在三年多的股指期货的分钟数据回测中,收益达到133万,收益风险比接近2.3。最后,本文最大的成功之处在于提出了一种创新的方法描述过去

2、的价格走势,能够将过去的价格走势极大程度地提取到一个低维的向量中,因此能够有效地为机器学习模型提供“前处理”工作,模型发展潜力较大。承诺书我们已阅读2015广东高校金融建模邀请赛竞赛章程。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我

3、们大赛网站公布论文,以供网友之间学习交流,大赛网站以非商业目的的论文交流不需要提前取得我们的同意。我们的参赛队名为:水滴的梦想参赛队员 (签名) :杨程炜参赛选题组别:【普通组】 【高频组】 基于极值过滤思想的择时交易策略一 建模目的与问题分析本文希望从历史价格走势中提取有用信息,预测价格未来走势,建立能够获得超额收益的择时交易策略,即“趋势模型”。首先面临的第一个问题:如何描述历史的价格走势信息。如果直接采用过去的价格信息,不仅面临噪声数据的干扰,而且维度过高,每个变量的信息量过少。因此第一步需要对价格序列进行去噪和光滑化;第二步需要提取数据,用一些特征信息反映过去一段时间价格走势的反映。即

4、用低维的数据反映高维数据的大部分信息。针对问题一,有如下的想法:如果在价格序列中选定一系列具有“代表性”的极值,按照它们的时间间隔与先后顺序排列,连接起来,就可以反映价格序列大致的走势,因此可认为这一系列具有“代表性”极值序列蕴含了价格走势的大量信息。面临的第二个问题:如何利用提取后的信息假设我们已经筛选得到一系列具有“代表性”的极值,那么如何利用这些信息呢?如果这些极值的相对大小、出现间隔具有一定的模式,可以采用机器学习模型进行挖掘;另一方面 ,极值是趋势扭转的必要条件,当前产生的极值具有代表性意义,因此也可以只利用当前的少数极值,建立交易模型。二 模型思路首先,通过核回归、指数滑动平均等模

5、型,对价格序列进行去噪、光滑化。再者,价格序列总是在“波动中上升”、“波动中下降”,因此,在一个大趋势中可能有多个极值,因此,即使这些极值并不是由噪声交易产生,但仍不是本轮趋势的终点,是“不具有代表性”的,因此,需要对这些极值进行过滤。最后,利用过滤后的极值的信息,建立择时交易策略。三 模型建立3.1 价格序列的去噪与光滑由于交易噪声、市场扰动等原因,会产生噪声,导致价格序列频繁产生极值,不利于对极值的分析,因此对股价序列进行去噪是重要且必要的。我们采用核回归与指数平滑结合的方法去噪。核回归由于使用到数据中心点两侧的信息,因此其效果往往较好,但在做回测的过程中,近期数据不能使用右侧的数据进行核

6、回归,否则就会使用未来信息。因此,对核回归进行了改良:当核回归中心点的右侧尚未使用到未来信息时,使用核回归对股价进行去噪,随着核回归的中心点的移动,当中心点右侧已经超过当前时刻,以最后一次核回归的预测结果作为基准,使用指数平滑。3.1.1 核回归 (Kernel Regression)核函数使用高斯核:为回归中心点为以中心时间窗口内的数据点为时间窗口为核宽度核回归结果:3.1.2 指数平滑为t时刻指数平滑的结果为指数平滑的时间参数3.2 极值过滤极值过滤的目的是在不使用未来信息的前提下,选取一系列具有“代表性”的极值,通过这些极值点,反映价格的走势。但是,即使是光滑化后的序列,除了仍存在一些噪

7、声产生的极值,而且还存在“震荡期”,在“震荡期”会产生许多极值点,但价格的总体趋势并不向下或向下,因此,并不是“所有光滑化序列中的极值点都具有代表性”。因此,需要对产生的极值进行过滤。3.2.1 极值的过滤规则:过滤的规则则有两条:(1) 如果当前的极值点与前两个极值点反映的趋势不一致,则它们相差的价格应大于一定的“阈值”才能真正说明当前价格趋势已扭转。(2) 如果当前的极值点与前两个极值点反映的趋势一致,则保留而且并且替换掉上一个极值点。原因是认为当前趋势仍在延续,而上一个极值点不是本次趋势的终点,从而被替换掉。3.2.2 极值过滤的阈值关于极值的阈值,有如下的想法:“当近期价格总体波动较大

8、,则最近一次极值点需要偏离上次极值点较大才能说明价格趋势已扭转,而当近期价格总体波动较小,则最近一次极值点需要偏离上次极值点相对较少即可说明价格趋势已扭转。”采取以下做法:选定标准差的时间窗口,计算这段时间的标准差过滤阈值为标准差的一定倍数,即可通过“过滤”。 3.2.3 极值过滤规则的完整表达将上述讨论总结,得到最后的过滤规则 假设在t时刻,此时已通过“过滤”的极值有个,若当前出现极值点,则通过“过滤”有四种途径: ,则用替换 ,则用替换 ,,并且,则成为 ,,并且,则成为3.2.4 过滤极值的稳定性假设在t时刻,此时已通过“过滤”的极值有个,其中不会因为当前的价格走势而改变,是稳定的,可用

9、作反映过去趋势。但可能会被不断替换,与当前价格走势有关,是不稳定的,而且它通过过滤与有关,而通过过滤与有关,如此类推,通过过滤与都有一定程度相关,因此是中信息量最大的变量。理解这一点对于交易策略制定有重要的作用。如图一,其中分段横向的直线(蓝色)正是任意时刻对应的“最后一个极值”.图1 过滤极值示意图四 交易策略 本文制定的交易策略并没有使用反映的过去价格走势信息,仅仅是使用了“是趋势扭转的必要条件”这一性质。通过添加一定的条件限制,增加在扭转趋势的极值开仓的准确率。 交易策略的制定,实质是确定开多、开空、平多、平空四种信号。 首先,对于任意时刻,以当前最后一次极值作为中心值,计算标准差(见2

10、.2.2节),设定一定比例,形成一个标准差区间4.1 基本的交易策略4.1.1 策略设计想法(一)开仓策略有以下的想法: (1)当出现一个极小值后,而价格上穿标准差区间上限,则这个极值很可能是扭转趋势的极值; (2)当出现一个极大值后,而价格上穿标准差区间上限,则可认为上涨趋势仍在继续,而前一个极大值的产生只是调整,正是“波动中上涨”的体现; (3)当出现一个极小值后,而价格下穿标准区间下限,则可认为下跌趋势仍在继续,而前一个极小值的产生只是调整,正是“波动中下跌”的体现; (4)当出现一个极大值后,而价格下穿标准差区间下限,则可认为上涨趋势仍在继续,而前一个极大值的产生只是调整,正是“波动中

11、上涨”的体现;(二)平仓策略的制定基于以下的想法: 采用一直持仓的策略。这样的平仓策略对模型一般适用于以“要求”:对于做趋势的模型,对于趋势的判断不存在“灰色地带”,总能判断当前时刻所处的趋势。对模型的准确率有较高的要求,否则趋势判断错误后由于没有平仓策略而导致风险过大。4.1.2 策略制定开多:平滑化后价格上穿上一时刻的标准差区间上限,即开空:平滑化后价格下穿上一时刻的标准差区间下限平多:平滑化后价格下穿上一时刻的标准差区间下限,同开空。平空:平滑化后价格上穿上一时刻的标准差区间上限,同开多。交易的示意图如图二,其中分段横向的直线(红色)是任意时刻对应的“最后一个极值”.图2 交易策略示意图

12、4.2 改进策略的设计由于上述模型并不能判断趋势何时结束,不能很好地止赢,而且当趋势判断错误时并没有相应的方法控制止损,不能很好地止损。因此我们可以引进一些策略实现止赢、止损,从而对风险进行控制。4.2.1 基于模型的平仓策略开多时,记录当时标准差区间下限,当价格低于这个数值,采取平多。开空时,记录当时标准差区间上限,当价格低于这个数值,采取平空。注:由于“最后极值”的不断更新,因此标准差区间在不断移动,4.1.2的平仓策略是上穿或下穿当前的极值,与开仓策略一致,而这里的平仓策略是记录开仓时的那个标准差区间的上下限,两个时刻对应的标准差区间是不同的。4.2.2 基于止损率的平仓策略若当次交易亏

13、损超过一定阈值,强行平仓。4.2.3 基于资金回撤的平仓策略设定一个回撤阈值,但是由于资金变动是按原始价格序列计算的,而我们买卖策略是基于光滑化的价格序列,因此,我们按光滑化后的价格序列计算一人“仿回撤率”,当回撤超过一定的阈值,则平仓。4.3 一个交易策略的细节假设平滑后的价格:,则是极小值,但却在时刻才被发现。因此,极值的发现是滞后了1个时刻的(低频数据即滞后了1分钟)。若不考虑1分钟滞后:(开多)若考虑1分钟滞后:(开多)两者之间最重要的区别在于:当前时刻的价格是否纳入标准差的计算范围。举一个例子分析两者不同带来的影响:由于标准差对偏大、偏小的数据都比较敏感,当价格快速变化时(例如快速上

14、涨),如果把当前时刻的价格纳入计算,标准差跟随价格快速变化,一定程度延缓开仓动作。如果标准差区间是不变的,这种延缓影响当然不大,但是,一般当价格快速上升都会很快伴随一定的调整而产生极大值,在延缓的两三分钟,很可能产生了新的极值,使得当初的“最后的极值点”就变成了新产生的极大值,使得标准差区间中心点向上移动了,价格线一直在标准差区间中上涨,无法突破,从而减少盈利。而且,当我们决定时刻的“行为”,更习惯的做法是由过去信息确定的买卖信号,考虑t时刻的指标是否这个信号,而不会将当前t时刻纳入用于确定信号的信息集中。五 模型参数量化投资的模型参数是重要的内容。关于参数之间的关联与搭配、参数合理范围、参数

15、的优化与过优化问题都是重要的探讨内容。因此,这里单独列作一章说明。5.1 模型参数汇总 为核回归的时间窗口 为核宽度 为指数平滑的时间参数 计算标准差的时间窗口 极值过滤的标准差倍数 开仓的标准差倍数5.2 模型参数的性质与互相关联性参数越大,价格回归时考虑更多附近的价格,使得价格更平滑,倾向于反映更长期的价格,有利于抓住较长期的趋势。另外,参数越大,光滑化序列的滞后现象越明显,原因是近期的数据回归时右侧使用指数滑动平均,而滑动平均容易产生较严重的趋势滞后。参数的设定,可以参考参数,两者共同构成光滑化的模型。参数的设定要有一定的实际意义,可取30分钟、60分钟、135分钟、270分钟(除交割日

16、外,一天交易时长270分钟)等。几分钟的调整不太合适,容易产生过优化。参数的设定,可以借鉴一些具有意义的数值,在数据挖掘领域,一般认为超出3倍标准差的数据为“离群点”,在标准正态分布中,超出3倍标准差的数据仅占10%,也就是说,3倍标准差是一个具有概念性的值,当超出3倍标准差外,我们总认为“当前事物已经显著不同于参考物的群体”,借鉴于此,“若极值已经偏离上一次极值3倍标准差,则可认为当前的极值所处的趋势已经有所不同了”。当然,可在3倍标准差附近调整。参数越小,越容易抓住每一次更小的波动,参数越大,会忽视更小的波动,更倾向于抓住大的趋势。因此当想抓住小波动时,选择较小参数,同时搭配较小的参数,减

17、少光滑数据的滞后,降低极值过滤的门槛;当想抓住大趋势时,选择较大的参数,同时搭配较大的参数,增加数据的光滑性,提高极值过滤的门槛。参数越小,开仓更迅速,在可能增大收益的同时增大了趋势判断错误的风险;参数越大,开仓缓慢一些,在可能减少收益的同时减少了趋势判断错误的风险。根据使用者的收益与风险收益偏好制定。5.3 模型参数的确定本文测试的是分钟数据,参数最后确定的值如下: ; ; ; ; 五 模型实现与测试回测数据取自组委会给定的4年1分钟股指期货交易数据,确定模型参数损失掉前面的少量数据。回测的模型指标:最终盈利 : 1.3317e+06交易次数: 2200最大回撤: 1.3644e+05收益风

18、险比: 2.2879(与提交的模型参数相比略有提高,主要是考虑了3.3节的标准滞后细节)图3 回测资金曲线六 模型改进方向上述模型存在较多可改进的空间,提出两种改进方向:(1) 分析模型的适用性 从图3资金曲线发现,2010年2012年资金曲线增长较快,一年多时间达到90万的收益,年收益50多万;而在20122013年模型表现较差,20132014年表现一般。因此,可以对不同时期市场进行分析,找出模型适用的市场状况,则能够有效提高收益。(2) 连接机器学习模型假设给定了,以及对应的时刻,那么,连接上述极值点,就已经大致反映过去一段时间的价格走势。说明、两个向量已经蕴含了过去价格走势的大部分信息,但上述策略没有使用这部分信息。也就是说,我们的模型成功地将过去一段时间的价格趋势反映在两个向量。更像是一个“前处理的模型”,可以后续连接相应的机器学习模型。通过学习、很可能会发现价格的隐藏模式。下面提供一些初步的思路:思路一: 选定训练样本,确定极值向量维数,以作为自变量,预测下一个极值的位置或只预测,从而判断即将到来的趋势是上涨还是下跌,进一步考虑收益与风险制定交易策略。但由于时刻一直在递增,不具有重复性和可比性,因此时间变量可化作极值实现的时间间隔,而极值的相对大小比绝对大小更能反映趋势,可用比值反映趋势:自变量:(即默认第1个时间间隔为0,第1个极值为1,常数变异度为0,不包含信息,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论