第二讲工具与技术_第1页
第二讲工具与技术_第2页
第二讲工具与技术_第3页
第二讲工具与技术_第4页
第二讲工具与技术_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

量化投资-工具与技术王林峰国元证券(香港)资产管理部投资经理自我介绍国元证券(香港)资产管理部投资经理,公司资产管理总规模(AUM)为115.5亿港元香港《东方财经》杂志专栏作家(月刊,海内外同步发行)曾任国元证券(香港)有限公司研究部首席策略分析师拥有中山大学理学硕士学位,会计学双学位1、量化逐渐融入日常交易•1.1大类资产配置(如何在股票、债券、商品及现金中配置资产)•1.2量化扮演的角色及意义(交易,策略,风险控制)•1.3前沿量化技术简介•1.4因子来源扩展案例1:构建一个跑赢大市的回报策略并优化

2、形成自己的策略工具包:交易+分析2.1常见金融工具对比:数据源很重要(Wind,Bloomberg,Factset)2.2几种常见程序语言对比:执行效率Vs开发效率2.3处理大数据时数据库的选择:执行效率Vs开发效率2.4数据结构的应用:交易信号到交易流水到持仓案例2:利用Python语言封装C++接口,交易恒指期货3、策略评价3.1主动及套利策略评价3.2量化系统评价高频交易炫目,但不是量化全部VirtuFinancial在IPO招股书中称,2014年,该公司的全球所有资产类别平均每日交易530万次,盈利达到累计持仓的49%。根据彭博社数据,在2014年的252个交易日里,Virtu

Financial又一次创下“零亏损日”的纪录。1、量化逐渐融入日常交易价值投资,经验历久而弥新2000年至今,巴菲特的股票BRKVSSP500指数270%vs148%1、量化逐渐融入日常交易在股票、债券、商品及现金中配置资产从收益角度来看大类资产配置>行业选择>股票选择>择时择时甚至常常具有负收益特征。1.1大类资产配置1.1大类资产配置2004年11月10日,美林证券研究报告中总结投资时钟给

出了一个简单的大类资产配置指引。在经济周期的不同

阶段下,配置不同的资产类型,有非常显著的超额收益。对于股票型基金,经济周期的不同阶段配置不同板块的

股票也非常重要。由于大部分人讨论股票居多,因此我们在整个讨论过程中,将股票行业配置和资产大类配置一同讨论。根据OECD产出缺口估计以及CPI数据划分不同经济阶段详细比较了不同经济周期下各大类资产的表现以及各大类资产的细分资产类别的表现。1.1大类资产配置1.1大类资产配置因子集继续组合即可以成为“策略集”,策略集具备更好的稳定性,下图为不同策略集在不同市场下不同周期下的表现。风格轮动模型,多因子模型,全球优势模型,价值模型,动量模型,非周期成长策略,派息策略,盈利预测策略,牛熊市策略,阿尔法策略,流动性策略1.1大类资产配置2000-2007年是静态投资策略的丰收年2007年之前,数量投

资人忽略了风格转换

主要专注于单一模型

单一市场下的投资,

并取得了巨大成功。

价值投资、动量策略

等方法都获得了成功。2008年价值投资,动量投资等都是负收益。2009年仅价值投资得到回归,其他策略失效1.1大类资产配置2008年开始市场趋势开始变短,原有投资策略收到挑战。2010年是一个典型的牛市年,多种策略都奏效2011年各种投资策略的收益按月变动,没有一个显著的策略胜出1.1大类资产配置2011年以后,市场节奏变得更快,对策略要求更高1.1大类资产配置为什么2007年之后市场风格轮动的趋势加强了?数量化投资人的数目过去几年的显著增加。市场变得更加有效,价值投资以及动能策略更快失效,从而不得不启用其他策略。未来可能演进出如下趋势:1.用轮换的视角综合统筹不同的单一策略。2.不同风格的策略组合将获得更大成功,但是找到相关性低的策略组合比较困难。除了策略这一角色

外,量化还扮演了

交易及风控的角色。不同策略的冲击成本不同,对交易执行的影响也不同程序化交易有效避免了人工交易的时效性不足,交易差错等问题。TWAP,VWAP,冰山算法等有效隐藏订单,控制冲击成本。跨市场及多品种交易策略中,凡是同步性要求较高的策略,均需要程序化下单配合。1.2量化扮演的角色及意义除了策略这一角色

外,量化还扮演了

交易及风控的角色。风控包括实时监控,风险头寸测算,仓

位管理,流动性管

理,止损设置以及

个股持仓限制等等。可量化的指标有效

帮助规避风险,保

护资产。1.2量化扮演的角色及意义事件驱动分析CEO,CFO变更,业绩公布,

派息,股东大会召开,拆股,回购,发债,期权到期,限

售股解禁,可转债发行,税

收优惠,法律诉讼,重大业

务变更。非常多的事件为传统因子分

析提供了低相关度投资组合

的机会,研究成本过高(特殊数据库,相关研究框架)阻碍了此前此类事件的研究。机器学习机器学习是从纯数据的角度看待价格和收益,所涉及领域包括模式识别、信号检测、预测、系统控制等。一个普遍应用的方法是利用多个若分类器构造强分类器。ART,

randomforest,

neuralnetworks,andSVM也均在应用。1.3前沿量化技术简介根据不同的交易类型选择不同的算法订单通常交易算法与策略会分开,但是研究发现,利用匹配的交易算法和策略可以获得超额阿尔法。根据Alpha因子衰减速度不同,利用不同订单类型,平衡冲击成本和订单执行风险1.3前沿量化技术简介稀有的阿尔法来源研究期权数据行业专属数据高频数据新闻标题数据(文本数据)债券数据Web数据研究Web数据既有类似“流言”的信息,也包含了各种非结构化的正面负面信息有待提取。结合web源的信息,可以对诸如动量策略,反转策略等进行优化,效果显著1.3前沿量化技术简介动态匹配策略可以用来继承现有的大部分技术形态分析为了构建更有效的模型而做出的努力宏观信息虽然滞后,依然能带来可观的收益事件是非常好的低相关度因子来源基于文本信息的事件研究Adaboost类模型具备跨市场有效性均值-方差模型假设条件的修正对因子的衰减进行度量衡量一个因子的稳健度ModelIR

=

Average(ModelIC)/StdDev(ModelIC)1.3前沿量化技术简介Wolfram

Alpha全球顶级知识搜索引擎对知识的量化方法有很多启发KenshoWarren金融界的siri助手,利用NASDAQ

OMX的数据服务,达到匹敌大型对冲基金的层次1.3前沿量化技术简介1.4、扩展阿尔法来源1.4.1阿尔法来源及扩展:基本面、分析师预期,交易舆情信息,期权、债券信息等1.4.2如何在因子之间有效组合1.4.3资产组合优化:夏普比率,IC值,VaR,CVaR等1.4.1阿尔法来源绝对价值、相对价值、规模派息、PEG、市值、营收PE、PB、P/S成长能力、财务状况ROE、ROA、毛利率、税负ROIC、EBIT营收比、资产周转率分析师盈利能力、

预测EPS、营收、自由现金流、动态市盈率未来三年增速、目标价更新价格动量年度、月度、季度表现26,52周Alpha,beta其他递延税收报表利润及调节利润研发占比机构持股传统多因子模型超过2000个因子追踪组合表现,“时点数据库”消除未来函数因子之间的组合构成更加稳定的“因子集合”1.4.1阿尔法来源股票多因子模型Factor

Name

Direction

#

of

Stocks

Last

M

12M

Avg

3Y

Avg

Avg

Std

Dev

StdDevMax

Min

p-value

Months

Stocks

Rate

(%)

Corr

(%)Deutsche

Bank,

FactorPerformance1

Value2

Growth3Price

Momentum

and

Reversal4

Sentiment5

Quality6

Technical组合管理:低贝塔有正阿尔法价值投资:P/B,P/C,……1.4.1阿尔法来源-36.0%3.2%18.0%-19.3%2.0%-28.8%-50.00%-60.00%-40.00%-30.00%0.00%-10.00%-11.0%-20.00%10.00%30.00%20.00%沪深300指数下策略表现波动率策略现金流策略股息收益率策略P/B估值策略P/E估值策略基准86.7%-59.1%58.6%78.4%-43.7%81.9%30.3%-100.00%0.00%-50.00%50.00%250.00%200.00%150.00%100.00%恒生指数下策略表现波动率策略现金流策略股息收益率策略P/B估值策略P/E估值策略基准1.4.2扩展阿尔法来优化模型的一些尝试路径:时点数据库来自传统的一些投资直觉存在偏差,会高估策略的有效性。Russell3000指数26年的测试表明,这种偏差年均约高估7%特别是财务数据以及分析师预测数据,时点对策略结果影响非常显著,往往决定策略收益的正负。1.4.2扩展阿尔法来优化模型的一些尝试路径:更多的Alpha来源,期权,债券,OTC市场交易信息等通常认为债券市场流动性差,规模大。期权市场风险大,杠杆高。这两类市场的资金被视为

“聪明的资金”,实践证明跟随聪明的资金可以获得正收益。例如:同一个公司的债券价格变动及期权价格及成交量变动往往有前瞻性。1.4.2扩展阿尔法来优化模型的一些尝试路径:非线性建模方法的使用,例如Adaboost等AdaBoost通过弱分类器的叠加构成强分类器证明外延性较好。最大熵模型及SVM模型对因子评价的效率也较高神经网络等模型也有人应用1.4.2扩展阿尔法来优化模型的一些尝试路径:自上而下的行业轮动,国家轮动,配合自下而上的择股在具体行业中寻求更有效的因子:航空、博彩、半导体、游戏、油气开发、保险、地产事件数据库的积累(百度指数,google趋势)评价分析师预测的有效性因子组合的第一步是因子分类,主要根据频率及属性进行交叉分类。低频因子主要是财务及经济数据,主要在事前筛选,应用为了简化运算,通常只应用同一频率的因子。1.4.3如何在因子之间有效组合因子组合的第二步是根

据传统的价值投资规律,总结出基本的组合进行

测试并优化,在此基础

上,再寻求新的组合。1.4.3如何在因子之间有效组合1.4.3如何在因子之间有效组合算法或者功能可以优化:大规模的因子检验,充分利用频繁集(frequentitemset),加快有效因子的搜寻效率.频繁集下获得的因子具备更强的稳定性。频繁集:啤酒和尿布与知识发现结合频繁集利用Adaboost算法发现更加稳定的组合。组合管理实例SPXindexshape最大优化同期指数涨幅14.8%,跑赢指数5.3%1.4.4资产组合优化组合管理Mean-varianceCVaR信息比夏普比波动率权重限制换手率多空仓位限制现金比率案例1:构建一个跑赢大市的回报策略并优

化依据:分析师预期数据对股票回报有显著影响设计因子为:分析师预计涨幅距离现价之间的距离。距离大者为佳。组合总体为沪深300指数成分股每季度再平衡股票组合白色为指数基准2年回报为38.7%。亮绿色2年回报为72.49%分位差夏普1.25在这个组合基础上进行优化最小化Active

Risk.案例1:构建一个跑赢大市的回报策略并优化最小化Active

Total

Risk案例1:构建一个跑赢大市的回报策略并优化优化后投资收益上升为

82.2%原来组合是等权重,优化后权重做了调整。还有的优化方向包括:策略频率(天,周,月,季,年)更多因子及因子组合仓位控制及权重设置更多约束条件及优化目标2、形成自己的策略工具包:交易+分析2.1常见金融工具对比:数据源很重要(Wind,

Bloomberg,

Factset)2.2几种常见程序语言对比:执行效率Vs开发效率(C,

C++,

Java,

C#,

R,

Python,

Matlab)

2.3处理大数据时数据库的选择:执行效率Vs开发效率

(内存数据库,行式数据库,列式数据库)2.4数据结构的应用:交易信号到交易流水到持仓案例2:利用Python语言封装C++接口,交易恒指期货(Ctypes封装C++接口,直接对接海外期货交易系统)2.1常见金融工具对比:数据源很重要Wind,Bloomberg,Factset.金融数据和工具都非常重要,脱离了数据源的工具,意义要小很多。Bloomberg在海外数据上拥有非常大的优势,同时集成了交易,资金管理,组合分析等功能以及成熟的API接口。时点数据库

及预测数据,有很大优势。缺点在于界面不够友好。需要熟记部分命令。Wind模仿的bloomberg,在国内数据上有优势,API借口较成熟。缺点是数据提取有数量限制,预测数据及时点数据库均没有,海外数据少,组合管理优化功能几乎没有。Factset是一个策略研发平台,非常强大的策略生成优化工具。用户交互做的非常好。缺点,授权数据少于彭博,费用不菲,

API需要额外付费。2.2几种常见程序语言对比:执行效率Vs开发效率选择语言主要考虑两个事情:执行效率和开发效率。无疑C语言的执行效率最高,因此高频算法大部分用

C语言来写。更复杂的策略用C开发效率较低,C++,C#,Java是比较多的生产语言。在策略原型的开发上,R,Python,matlab由于拥有众多的工具包,开发效率得到进一步提升。对于一些执行效率要求不高的策略,甚至可以直接部署交易。在一些简单的场景下,VBA和excel宏等也受亲睐。2.3处理大数据时数据库的选择:执行效率Vs开发效率面对海量数据,查询和处理的难度都在增加,特别是对于非IT出身的策略开发人员,有一个学习门槛低的数据库语言非常重要。最简单的方法更换为SSD固态硬盘,提高I/O速度.MySQLCluster允许在无共享的系统中部署“内存中”数据库。列式数据库提高了时间序列的查询效率。而时间序列是最常用的处理序列。另一个内存数据库RedisQ语言跟它的数据库kdb+NoSQL数据库MongoDB2.4数据结构的应用:交易信号到交易流水到持仓常用的持仓或者交易流水合成收益曲线:实质可以转化为数据库操作的连接查询。善用数据库索引:返回1000行查询的时间对比234sec(索引前)/2.200sec(索引后)案例2:利用Python语言封装C++接口,交易恒指期货目标:利用SharpPoint软件商提供的期货交易接口DLL进行恒指期货的自动化交易。语言:python,开发平台Anaconda测试账号:国元期货(香港)提供,可交易全球大部分期货品种。案例2:利用Python语言封装C++接口,交易恒指期货原始文件仅有:spapidll.h和apapidll32.dll其中classdef0829.py包含了所有必需代码classdef0829.pyc是为了加快加载速度,系统生成的文件APItest0829是为了测试封装好的接口而编写的测试文件案例2:利用Python语言封装C++接口,交易恒指期货对于一个交易接口来讲,最主要的功能就是订阅行情和下单。代码实现了如下策略:在恒指10月和11约合约之间进行跨期套利,价差在30的时候正向开仓,价差在-60的时候反向开仓。每个合约持仓不超过1手。案例2:利用Python语言封装C++接口,交易恒指期货要点1:ctypes.c_byte和ctypes.c_char要严格区分,特别在类型转换之际。要点2:call_back函数的重写要点3:回调函数的注册要点4:区分price_update和tick_update的结构要点5:把握业务流程是写好程序的关键,特别是下单的必填字段等。3、策略评价3.1主动及套利策略评价3.2量化系统评价3.1主动及套利策略评价“金融里最大的溢价是信任”主动业绩评价更像一个股票分析,特别在只有周频率数据的前提下,不透明性增加,对于数据可靠性给予一票否决制。具体到投资组合分如下几个方面去关注:组合特征:现金流,流动性风险,环境利率风险指标:VaR,换手率,夏普比率,最大回撤,信息比情景分析(市场暴涨,市场暴跌,波动市场等)业绩归因:比较基准,行业,股票套利策略主要关注三个指标:交易频率,夏普比,最大回撤。推荐一个电影的流程:不断趋势强化推荐一组股票的流程:不断改变收益率最高的一组股票特征统计按此特征寻找股票并排序计算新得到组合的收益情况5.2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论