




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、西蒙斯的赚钱秘籍:隐马尔科夫模型(HMM的择时应用之前做过相关方面的研究,针对的是国外的期货市场。也有朋友建议说拿A股来试试看。 所以有了下面的这篇东西。扯上西蒙斯前辈, 是因为确实不少猜测认为文艺复兴用的就 是HMI模型。一、从大奖章讲起Renaissance & Medallion (文艺复兴科技和大奖章)量化圈都非常熟悉了。Simons 一群物理学家和数学家碰撞在一起, 1989 年到 2008 年的 yearly return 达到%。文艺复兴 大概一百多个员工, AUM:50 亿美金,在全球金融危机的 08 年,大部分对冲基金都亏损, 而大奖章的 return 高达 80%。神秘的文
2、艺复兴科技和神秘的大奖章基金, 到底一群数学家和物理学家聚在一起搞出了 什么赚钱利器?外界猜测众说纷纭。而隐马尔科夫模型也由于一些原因被推举出来。成立初期的创始人中,有一位科学家发明了广泛应用在语音识别等领域的鲍姆 - 威尔士 算法,用来确定不可确知的变量可能出现的概率。今天要介绍的 HMM模型,也是在语音 识别中运用非常成功的模型,最早是由鲍姆等人提出的。之前拜读人大的一位教授 14 年写的一本书, 解密复兴科技:基于隐蔽马尔科夫模型的 时序分析方法,书中介绍了为什么觉得 HMM! Renaissanee使用的模型,并且含有详细 的公式推导和运算, 以及附上了一些些实证结果 (个人认为还有很
3、多有待补充和粗糙的 地方)。感兴趣推荐研读。二、认识模型HMM模型,又叫隐马尔科夫模型。要正确的理解和搞懂模型,教材里有很多经典的例子。 我从自己理解后的角度尽量浅显的给大家做一个解释, 方便大家快速理清概念投入应用。我们能观测到的序列 (Y1,.,Yn )称为可观测序列, 如股价, 成交量, 资金净额等等。而每一个可观测值的产生对应着市场状态序列( Z1,.,Zn ),每个状态通过不同的分 布函数来产生观测值。通过HMM模型,可以用简单的输入,来得出对目前市场状态的判断,从而帮助我们进行 择时选择。因为市场状态不是显性可观测的,属于隐藏状态,我们通过对可观测变量的 处理来进行推测。这里对HM
4、M模型进行了扩展得到 HMS-GM模型,因为收益率序列尖峰厚尾的特性导致的 非正态分布,引入了混合高斯分布作为状态到观测值之间产生关系的分布函数。将HMM模型看作一个黑箱子,这个黑箱子可以利用极其方便、 简洁的数据,处理后得出:1. 每个时刻对应的状态序列;2. 混合分布的均值和方差矩阵;3. 混合分布的权重矩阵;4. 状态间转移概率矩阵。而黑箱子需要事先给定两个参数:状态数目、混合高斯分布的成分数目 。当然,输入这里是拿单一的价格序列举例。 输入也可以是并行的数据矩阵, 比如从价格、 成交量、资金净额等多个角度来看。总结一下,使用模型需要在初期设定:1. 隐藏状态数目2. 输入的观测变量3.
5、 混合高斯分布成分数目三、A股市场实证下面拿 A 股市场来做检验。模型的设定如下:1. 隐藏状态数目: 62. 输入变量:当日对数收益率,五日对数收益率,当日对数高低价差(其他备选因素 成交量、成交额等大家可以自行尝试)3. 混合高斯分布成分数目:1 (为了简便,假定对数收益率服从单一高斯分布)In 1:from import Gaussia nHMM import datetime import nu mpy as np import pan das as pd import seabor n as sns from matplotlib import cm from matplotlib
6、import pyplot startdate = 2012-06-01 en ddate = 2016-04-07 df = get_price(”, start_date=startdate, en d_date=e nddate, freque ncy=daily, fields=close,volume,high,low) close = dfclose high = dfhigh 5: low = dflow5: volume = dfvolume5: money = dfvolume5: datelist = 5:) logreturn = (close1:)(close:-1)4
7、: logretur n5 = (close5:)(close:-5) diffreturn = (high)(low) closeidx = close5:X = (logreturn,diffreturn,logreturn5) len(X)Out1:931In 2:hmm= Gaussia nHM M(n_comp onents =5000).fit(X)late nt_states_seque nee = (X)len( late nt_states_seque nee)=6, covariance_type=diag,n_iterOut2:931In 3:(white)(figsiz
8、e = (15, 8)for i in ran ge:state = (late nt_states_seque nee = i)(dateliststate,closeidxstate,.,label = late ntstate %d%i,lw = 1)()(1)Out 3:以上。我们看到了六个状态的 HMM模型输出的市场状态序列。需要注意的是:HMM模型只是能分离出不同的状态, 具体对每个状态赋予现实的市场意义,是需要人为来辨别和 观察的。F面我们来用简单的timming策略来识别6种latent_state所带来的效果In 4:data =(datelist:datelist,logr
9、eturn:logreturn,state:late nt_sta tes_seque nce).set_i ndex(datelist)(figsize=(15,8)for i in ran ge:state = (late nt_states_seque nee = i)idx = (0,state:-1)datastate %d_return%i = = 0)(datastate %d_return %i.cumsum(),label = late nt_state %d%i)()(1)Out 4:上图可以看出:1.状态0监色-震荡下跌2.状态1 绿色一-小幅的上涨3.状态2红色牛市上涨
10、4.状态3紫色一-牛市下跌5.状态4黄色震汤卜跌6.状态5浅监色-牛市下跌以上的意义归结是存在一定主观性的。因为HMM模型对输入的多维度观测变量进行处理后,只负责分出几个类别,而并不会定义出每种类别的实际含义。所以我们从图形中做 出上述的判断。四、择时策略我们根据模拟出来的隐藏状态,来进行择时。(1)理论版:股指期货可卖空。策略是这样设计的:1. 当天处在状态0,3时,买入指数基金;2. 当天处在状态1,2,4,5时,卖空股指期货;我们来看一下收益效果:4年7倍。In 5:buy = (late nt_states_seque nee = 1) + (late nt_states_seque
11、nee =2)buy = (0,buy:-1)sell = (late nt_states_seque nee = 0) + (late nt_states_seque nee3) +(late nt_states_seque nee= 4) + (late nt_states_seque nee=5)sell = (0,sell:-1)databacktest_return = = 0) -=0)(figsize = (15,8) (datelist,(databacktest_return.cumsum(),-,label=backte st result)()(1)Out?5:(2) A股版鉴于卖空指数对散户来说没什么可操作性,我们单看能做多的A股市场。选择嘉实沪深300基金来复制沪深300指数。策略是这样设计的:1. 当天处在状态0,3时,买入指数基金;2. 当天处在状态1, 2,4,5时,空仓;看一下回测效果回撤和收益都看起来很漂亮。虽然我也没太懂为什么跟可卖空的结果差不多=,可能是单纯算收益率的伪回测不太准吧。第二是状态5 (浅蓝色)有涨有跌,卖空它也有亏钱的时候。五、最后的结论搞量化的小伙伴们每每总是以为发现了天上掉钱的秘籍法宝,但仔细想想每一个模 型都不是那么简单的。而且相信一部分人已
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030年中国铁路机车车辆配件制造行业十三五规划及发展前景分析报告
- 2025-2030年中国金属铋行业运行现状及发展前景分析报告
- 2025-2030年中国过氧化氢行业市场运行动态与营销策略研究报告
- 2025-2030年中国调压器市场运行现状及发展前景预测报告
- 2025-2030年中国空气清新机行业运行现状及发展趋势预测报告
- 贵州工程应用技术学院《运动医务监督与康复治疗》2023-2024学年第二学期期末试卷
- 2025年海南省安全员《B证》考试题库
- 2025年建筑安全员B证考试题库
- 山东现代学院《建筑设备CAD》2023-2024学年第二学期期末试卷
- 朔州师范高等专科学校《电工测试技术(上)》2023-2024学年第二学期期末试卷
- 2024初中数学课程标准测试题(含答案)精华版
- 2024年陕西延长石油集团矿业公司招聘笔试参考题库含答案解析
- 人教版新教材高一上学期期末考试数学试卷及答案(共五套)
- 人文关怀与优质护理课件
- 知识图谱可视化-Neo4j(windows)
- 光伏电站作业危险点分析及预控措施手册
- 2021年深圳实验学校初中部七年级入学分班考试数学试卷及答案解析
- 水文流量测验
- 合作共赢商务合作PPT模板(基础教育)
- 铝的阳极氧化和着色
- 信用社(银行)清产核资实施方案
评论
0/150
提交评论