金融数据分析-以Python为工具 课件 11、量化投资多因子模型分析_第1页
金融数据分析-以Python为工具 课件 11、量化投资多因子模型分析_第2页
金融数据分析-以Python为工具 课件 11、量化投资多因子模型分析_第3页
金融数据分析-以Python为工具 课件 11、量化投资多因子模型分析_第4页
金融数据分析-以Python为工具 课件 11、量化投资多因子模型分析_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融系胡文彬Python金融数据分析量化投资多因子模型分析Chapter1111.1量化投资简介量化投资是一种以数据为基础、以策略模型为核心、以程序化交易为手段的投资方法。量化投资摒弃了传统的完全依赖投资者的经验和直觉的投资方式,而是将投资者的投资思想、投资经验、投资直觉融入模型。利用数学、统计学、计算机等技术,通过对宏观、基本面、市场行为、交易等各类金融数据的分析建立模型,基于历史数据对模型进行验证和改进,通过模型给出交易信号并自动下单交易。11.1量化投资简介量化投资有许多自身的特点,具体表现在:1) 纪律性以定量化和不可临时更改为特点的纪律性能够克服人性贪婪、恐惧、侥幸等弱点,量化投资的决策具有可重复性和可回溯性。2) 系统性量化投资的数据处理是通过计算机完成的,计算机的海量数据处理能力使得量化投资能对市场进行全面、深入的分析。11.1量化投资简介3) 及时性通过计算机实时捕捉信息,量化投资策略能对市场做出迅速及时的反应,准确客观评价交易机会。在高频交易中量化投资的及时性体现得更加明显。4) 分散化量化投资是非常注重风险控制的,其中一个维度是利用其系统性的优势,通过构建分散化的投资组合降低风险。另一个维度是通过积累多笔交易以概率取胜。11.1量化投资简介5) 捕捉套利机会量化投资通过全面、系统性的扫描捕捉短暂的市场失效或者定价偏差带来的机会,构建套利组合获取低风险收益。投资手段的不同并不意味着投资理念和投资策略的好坏,也不意味着投资结果的好坏。量化投资不是万能的,其投资策略本身也是人为制定的,仍然需要结合投资者的经验和市场逻辑进行分析,才能更好地抓住获利的机会。11.1.3量化投资策略简介按照不同的分类方式,存在各种不同的量化策略。(1)根据交易品种分类,量化投资策略可以分为股票策略、CTA(commoditytradingadvisor)策略、期权策略等。(2)根据盈利模式分类,量化投资策略可以分为单边多空策略、对冲策略和套利策略等。(3)根据策略功能分类,量化投资策略可以分为选股策略、择时策略、仓位管理策略和风险控制策略等。策略和非高频策略。11.1.3量化投资策略简介量化投资首先要解决投资组合构建问题,在股票投资上就是指买什么股票,以及资金如何分配。常见的选股模型有多因子选股、风格轮动选股、行业轮动选股、趋势追踪选股、一致预期选股和动量反转选股。其次是择时问题,指的是对趋势的判断和买卖时机的把握,也就是何时买卖的问题。常见的择时模型有趋势量化择时、市场情绪量化择时、有效资金量化择时和机器学习方法择时等。再次是仓位管理,也就是每次买多少,卖多少,留多少资金。常见的仓位管理方法有漏斗型仓位管理法、矩形仓位管理法、金字塔形仓位管理法、凯利公式仓位管理等。最后是止盈止损,决定在盈利或亏损达到什么程度时该提前离场和及时增减仓位。止盈止损又可分为静态和动态两类,具体有限价止损、阶梯止损、回撤止损、吊灯止损、ATR(averagetruerange)止损等。11.1.3量化投资策略简介(4)根据策略本身的逻辑分类,量化投资策略可以分为指数增强、多因子选股、风格轮动、行业轮动、趋势追踪、一致预期、动量反转、均线策略、通道策略、海龟策略等。(5)根据交易频率分类,量化投资策略可以分为高频策略和非高频策略。高频策略在日内短时持仓,依赖高端的计算机系统和算法,以毫秒级的速度执行交易。其中算法交易是高频策略的代表,专注于订单的执行过程,通过交易订单的拆细,降低交易的冲击成本、隐藏交易行为并以最优的方式高效完成交易。量化投资策略的开发量化策略的开发是一个循环的过程,以下我们具体介绍各个环节的内容:策略建模模型是量化策略的核心,构建一个策略的重要目标就是构建模型。基本做法为从市场逻辑出发,提出策略的基本构想,找到一个模型对策略构想进行刻画和实现。策略实现量化策略以程序化交易为手段,最终需要把建好的模型通过具体的程序代码进行实现。主流的用于实现量化投资策略的计算机语言有Python、C++、Matlab等。策略实现通常需要在量化投资平台上进行,量化投资平台通常会提供完善的数据接口、下单通道、策略回测和评价等功能。策略回测实现好策略后,很重要的环节是策略回溯测试,简称回测。策略回测指用历史数据拟合策略模型并进行模拟交易,目的是寻找最合适的模型超参数以及评估策略的效果。量化投资策略的开发为了保证策略回测的客观性,需要注意以下几点:回测时需考虑交易税费、交易滑点、股票价格复权等实际交易环境因素,尽量使回测接近实盘情形。一般的量化回测平台都支持这些参数的设置。严格区分样本内和样本外数据。从抽象的角度叙述就是用于训练模型的数据不能用于模型测试。例如,不可以在某段时间区间内挑选出最好的股票,又在相同的时间区间进行回测。当然,实际中的这类错误不会这么明显,往往存在于一些难以发现的细节中。避免前视偏差。前视偏差指策略中用到了未来的信息,也称为未来函数。避免幸存者偏差。幸存者偏差指经过优胜劣汰之后,人们只能观察到幸存者,未幸存者已无法发声。因而人们只看到经过某种筛选而产生的结果,忽略了被筛选掉的关键信息。最后需要注意,量化策略回测只是验证投资逻辑或动机的一种工具,而不是寻找投资逻辑的捷径。即不能本末倒置地单纯从数据出发倒推出投资逻辑,甚至完全忽略掉金融逻辑。量化投资策略的开发策略再平衡任何策略都不是万能的,随着市场行情的变化以及其他投资者的投资策略的调整,原先有效的量化投资策略很可能会失效。因此需要对投资策略进行监控,一旦发现策略效果持续变差,则应该考虑对策略进行调整。11.2多因子选股模型多因子选股模型以资本资产定价模型(CAPM)、套利定价理论(APT)、Fama-French三因素模型等现代金融投资理论为基础,是量化投资领域应用最广泛也是最成熟的选股模型之一。多因子模型用一系列因子,主要包括公司基本面指标、股票技术面指标、市场情绪因子等,作为解释股票超额收益的因素,通过因子选出未来收益高的股票。总体而言,该模型的核心之一在于如何选因子,其次是如何基于因子选股票。具体的步骤可分为预选因子池、因子有效性检验、冗余因子剔除和多因子选股票。11.2.2预选因子池基于金融逻辑,从全方位各角度寻找影响股票收益率的因子,形成一个因子池。这一步一般通过人工以定性的方式来完成,依赖于市场逻辑和股票投资经验。影响股票价格的重要因素是公司的基本面和股票技术面信息,其中基本面因素主要通过分析财务报表得到,技术面因素通过分析股票量价指标得到。因子并不是对所有行业的公司都适用,不同的因子对股票收益的影响方向不一样。11.2.3因子有效性检验在构建好预选因子池后,一个重要的步骤就是通过定量计算筛选出真正有效的因子。实际中衡量因子有效的重要标准之一就是看其能否产生超过基准的超额收益率,即股票收益率减去基准收益率的差。因子有效性检验通常是逐因子进行,最常用方法为排序法。选定一个因子后,排序法的具体步骤如下:选取股票池2)设定检验时间段和周期11.2.3因子有效性检验

11.2.3因子有效性检验另一种方法:分组检验月初根据因子值将股票排序,排序后以等频或者等距的方式分为若干组(通常为5组),观察月末各组股票的平均收益差距情况。赢家组合与输家组合的平均月收益率之差称为因子收益差。基于这个框架,可以定义一些衡量因子有效性的指标,这些指标包括:因子胜率,指形成期内因子收益为正的月份数占总月份数的比例。因子信息比率,因子收益差平均值比因子收益差的标准差。这个指标的计算方式与前文的IR类似,区别在于这里用的是因子收益差而不是IC值序列。t检验,检验原假设为因子收益差平均值小于等于0。11.2.3因子有效性检验4) 实际操作及注意事项因子有效性检验涉及到数据的分析和处理,因此需要经过我们之前介绍过的数据获取、探索性数据分析、特征工程等数据分析步骤。在数据清洗过程中需要注意结合数据的实际背景。首先剔除停牌和ST股票。其次,用最近一次的财报数据作为本月的因子数据。第三,对因子进行行业和市值中性化处理,剔除掉这两个因素的影响。常见的方法是将因子值对行业和市值进行线性回归,取残差值作为新的因子值。11.2.4冗余因子剔除

11.2.5根据因子选股票

11.2.5根据因子选股票机器学习法回归法本质上是建立了股票收益率和因子之间的关系,可以将回归法用各种不同的机器学习回归模型进行扩展。例如可以用更高级的回归方法如岭回归、核岭回归、支持向量回归等机器学习方法进行建模。除了回归法,还可以将选股问题转化为分类问题来处理。将股票收益率分为高和低两类,建立分类模型。此时就可以用机器学习中的Logistic回归、支持向量机、决策树等分类方法,以及随机森林、GBDT、XGBoost、LightGBM等集成学习方法。Alphalens的用法Alphalens主要提供了因子收益分析、IC分析、换手率分析以及事件收益分析这四大模块。因子收益分析模块的总体思路与11.2.3节中根据因子值排序后分组的有效性检验类似,提供了因子收益分析表、因子分组累计收益曲线等结果。因子IC分析模块提供了因子IC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论