人工智能和机器学习系列研究(1):多模型、多数据、多跨度融合的深度学习GRU因子_第1页
人工智能和机器学习系列研究(1):多模型、多数据、多跨度融合的深度学习GRU因子_第2页
人工智能和机器学习系列研究(1):多模型、多数据、多跨度融合的深度学习GRU因子_第3页
人工智能和机器学习系列研究(1):多模型、多数据、多跨度融合的深度学习GRU因子_第4页
人工智能和机器学习系列研究(1):多模型、多数据、多跨度融合的深度学习GRU因子_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金工量化专题报告金工量化专题报告证券研究报告1356491768813564917688fengjiaruiangzhishun@多模型融合提升预测准确性。GRU模型具备很强的处系的能力,故被广泛应用于时间序列的预测。进一步引入双层GRU、用了卷积神经网络的局部特征提取能力,Attention或可捕捉短、中、长期的市场规律,增强模型对不同市场周期的适应能力。风险提示:模型失效风险,市场风格变化风险,数据测算误差风险。金工量化专题报告金工量化专题报告 4二、深度学习模型简介 4三、GRU因子的构建与融合 53.1资金流GRU因子 63.1.1资金流类因子 63.1.2资金流GRU因子及其集成 73.2分钟频GRU因子 93.3衍生高频GRU因子 3.3.1衍生高频因子 3.3.2衍生高频GRU因子及其集成 3.4多模型与多数据的融合 四、指数增强组合 4.1沪深300指数增强 4.2中证500指数增强 4.3中证1000指数增强 20五、2024年融合因子表现回顾 21六、总结与讨论 23七、风险提示 24 5图2:资金流GRU因子各期及累计RankIC 8图3:资金流GRU因子与Barra因子相关性1 8图4:资金流GRU因子与Barra因子相关性2 8图5:分钟频GRU因子各期及累计RankIC 图6:分钟频GRU因子与Barra因子相关性1 图7:分钟频GRU因子与Barra因子相关性2 图8:衍生高频GRU因子各期及累计RankIC 图9:衍生高频GRU因子与Barra因子相关性1 图10:衍生高频GRU因子与Barra因子相关性2 图11:融合因子各期及累计RankIC 图12:融合因子与Barra因子相关性1 图13:融合因子与Barra因子相关性2 金工量化专题报告金工量化专题报告图14:10分组年化超额收益(Wind全A) 图15:10分组年化超额收益(沪深300) 图16:10分组年化超额收益(中证500) 图17:10分组年化超额收益(中证1000) 图18:沪深300增强组合累计超额收益 图19:中证500增强组合累计超额收益 20图20:中证1000增强组合累计超额收益 21图21:中证500增强组合4个场景下的累计超额收益 23图22:中证1000增强组合4个场景下的累计超额收益 23表1:资金流因子RankIC 6表2:资金流GRU模型参数 7表3:资金流GRU因子RankIC 7表4:资金流GRU因子相关性 9表5:分钟频GRU模型参数 9表6:分钟频GRU因子RankIC 表7:分钟频GRU因子相关性 表8:衍生高频因子RankIC 表9:衍生高频GRU模型参数 表10:衍生高频GRU因子RankIC 表11:衍生高频GRU因子相关性 表12:集成因子RankIC 表13:集成因子相关性 表14:沪深300指数增强组合收益风险特征 表15:中证500指数增强组合收益风险特征 20表16:中证1000指数增强组合收益风险特征 21表17:2024年融合因子收益特征 22表18:2024年增强组合4个场景下的收益风险特征(2024.01.02-2024.06.24) 23金工量化专题报告金工量化专题报告海内外诸多研究和实践表明,通过量化方法挖掘因子和信号,制定合适的投为应对这一挑战,我们探索了多种模型、多种数据和多种输入时间跨度结合的方法,虽然GRU已经被广泛应用,但我们通过引入多层GRU、结合自注意力机制(Self-Attention)和卷积神经网络(CNN希望挖掘更深层次的时序信息和空间特征,特征因子和单一输入跨度因子,展现出更加稳定和准确的预测能力。二、深度学习模型简介深度学习中的GRU模型可以很好地提取输入特征的时序信息。叠加自注意力机制(Self-Attention)和卷积神经网络(CNN理论上可以分别增强模型的局部注意能力和1)GRU:GRU是一种经典的深度神经网络,擅长处理时序信息。与传统的RNN相比,GRU通过特殊设计,有效解决了梯度消2)Double-GRU:在基准GRU模型的基础上,我们引入了双层GRU模型,通过4)CNN-GRU:卷积神经网络(CNN)能够有效提取时序数据中的局部特征。将依赖关系,从而可以在处理时序数据时更全面地捕捉数据特征。金工量化专题报告金工量化专题报告三、GRU因子的构建与融合分钟频量价行情数据和Wind资金流向数据。前者既可直接作3种不同的数据类型——资金流数据、分钟频数据和资金流向信息、更高频次的价格和交易量信息,以及日内成交的一些统计学意义的信息。提高模型对不同市场周期的适应能力。金工量化专题报告金工量化专题报告特征的优点。下文的实证结果表明,多模型与多数据融合的因子在稳定性和准确性方面,资金流数据来源于Wind,每日更新机构、大户、中户金工量化专题报告金工量化专题报告收益率为预测目标。为使模型能够具备在短、中、长期内的泛化能力4种,GRU、Double-GRU、AttentionGRU、CN24/48/72个双周作为输入,3:AdamAttention-GRU金工量化专题报告金工量化专题报告050资料来源:Wind,西部证券研发中心GRU因子与残差波动率和流动性保持着较为稳定的负相关性。这表明,该因子的多头组特征。与市值因子的相关性较不稳定,但2022年以来,负相关性显著,多0.30.20.120162017201820192020202120222023202402016201720182019202020212022202320242015-0.1-0.2-0.3-0.4-0.5-0.62015非线性市值动量对数市值非线性市值动量残差波动率0.40.30.20.10201620172018201920202021202220232024-0.2201620172018201920202021202220232024-0.3-0.4-0.5-0.6账面市值比流动性盈利成长杠杆金工量化专题报告金工量化专题报告Attention-GRUAttention-GRU处理时间较长,我们仅对单只股票进行时序标准化,而未对全部股票进行横截面标准化。与最后一分钟收盘价计算收益率,再整体做时序标准化;4种,GRU、Double-GRU、AttentionGRU、CN24/48/72个双周作为输入,3:Adam金工量化专题报告金工量化专题报告Attention-GRU0各期RankIC2017201850资料来源:Wind,西部证券研发中心高盈利的股票。与市值因子的相关性波动较大,但2022年金工量化专题报告金工量化专题报告0.20.12016201720182019202020212016201720182019202020212022202320242015-0.1-0.2-0.3-0.4非线性市值动量对数市值非线性市值动量残差波动率2016201720182019202020212022202320240.40.30.20.12016201720182019202020212022202320240-0.20-0.3-0.4-0.5-0.6账面市值比流动性盈利成长杠杆我们认为,扩展特征的类型或是计算的时间跨度,或比堆叠模型更能提高因子的稳定性。Attention-GRUAttention-GRU金工量化专题报告金工量化专题报告37.7%尾盘成交量比例金工量化专题报告金工量化专题报告额标准差、上行已实现波动率等。4种,GRU、Double-GRU、AttentionGRU、CN24/48/72个双周作为输入,3:AdamGRUDouble-GRUAttention-GRU金工量化专题报告金工量化专题报告Attention-GRU050资料来源:Wind,西部证券研发中心2016201720182019202020212022202320240.40.30.20.120162017201820192020202120222023202402015-0.1-0.2-0.3-0.42015非线性市值动量对数市值非线性市值动量残差波动率0.40.30.20.10201620172018201920202021202220232024-0.2201620172018201920202021202220232024-0.3-0.4-0.5账面市值比流动性盈利成长杠杆金工量化专题报告金工量化专题报告Attention-GRUAttention-GRU也是一种方案。下表展示了上述4种集成方案Attention-金工量化专题报告金工量化专题报告0.036,显著不及其余两个因子,这也在一定程度上说明了多数据特征融合的重要下图展示了融合因子的各期及累计RankIC,较为0-0.2-0.3资料来源:Wind,西部证券研发中心0.30.20.12016201720182019202020212022202320240201620172018201920202021202220232024-0.2-0.3-0.4-0.5-0.6非线性市值动量对数市值非线性市值动量残差波动率0.40.30.20.12016201720182019202020212022202320240201620172018201920202021202220232024-0.2-0.3-0.4-0.5-0.6——账面市值比流动性盈利成长杠杆金工量化专题报告金工量化专题报告Attention-Attention-GRU9s在其余三个指数的成分股中,分组单调性都得到了良好的保持。. .Double-GRU9s.Attention-GRU. .Double-GRU9s.Attention-GRU9s金工量化专题报告金工量化专题报告00 CNN-GRU9s2YInput12s3YIn.Double-GRU9s.Attenti. .Double-GRU9s.Attention-GRU9s四、指数增强组合增强组合。优化目标为最大化组合的预期收益,约束偏离为[-0.5,0.5]1;3)双周频调仓(每双周的第一个交易日单边换手率不高于25%;超额,跟踪误差5.0%。2023年超额收4.4%,发生在2024.01.03-202金工量化专题报告金工量化专题报告4213210资料来源:Wind,西部证券研发中心超额,跟踪误差5.5%。2023年超额收益12.8%;20245.2%,发生在2024.01.03-202金工量化专题报告金工量化专题报告 043210资料来源:Wind,西部证券研发中心超额,跟踪误差6.4%。2023年超额收益16.8%;2024年YTD超额4.2金工量化专题报告金工量化专题报告7654321076543210资料来源:Wind,西部证券研发中心五、2024年融合因子表现回顾2024年上半年,市场波动较大,小市值风格的回撤尤为明显,融合因子表现平平。金工量化专题报告金工量化专题报告并持续至今。受小盘风格强势的驱动,22、23两年,融合因子及以此为金工量化专题报告金工量化专题报告12023-12-292024-01-292024-03-052024-04-02场景1场景2——场景3——场景412023-12-292024-01-292024-03-052024-04-02202场景1场景2——场景3——场景4意义上保持正向alpha,但波动难免会加剧。更加严格的风险管理方式,或许是利用风险中性等相关话题。六、总结与讨论GRU模型具备很强的处理数据中长期依赖关系的能力,故被广泛应用于时间序列的则利用了卷积神经网络的局部特征提取能力,Attention-GRU通过自注意力机制缓金工量化专题报告金工量化专题报告进一步将数据类型、模型形式和时间跨度下的因子等权集成,得到最终的融合因子。调性均优于按单一模型、单一数据和单一跨度的集2024年上半年,市场波动较大,小市值风格的回撤尤为明显,融合因子表现平平。七、风险提示模型失效风险:模型可能无法准确预测市场行为,导致因子失效。数据测算误差风险:数据和模型搭建过程中可能存在偏差,影响分析结果的准确性。金工量化专题报告

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论