深度学习如何利用公募持仓网络优化选股效果_第1页
深度学习如何利用公募持仓网络优化选股效果_第2页
深度学习如何利用公募持仓网络优化选股效果_第3页
深度学习如何利用公募持仓网络优化选股效果_第4页
深度学习如何利用公募持仓网络优化选股效果_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录日频深度学习模型初探 3从CNN到LSTM 3神经网络股票周频收益率模型表现 5股票静态内在属性及应用 7股票内在属性的探究 7基于基金选股网络的嵌入层计算 9股票静态内在属性的应用 10股票内在属性动态化应用 13动态市场状态 13股票内在属性动态特征的应用 14总结与思考 17风险提示 18插图目录 19日频深度学习模型初探从CNNLSTM深度神经网络是一种基于多层神经元的无监督算法,它被广泛应用于计算机视觉、自然语言处理等领域。深度学习的主要神经网络模型包括:卷积神经网络(CooonalNeralNeworksNNtNeualNeworkNNgrmmryNework,(GdtUnits,GRUNCNN图1:CNN结构示意图 资料来源:Alometal.[1],CNNCNNRNNRNNA图2:RNN结构示意图资料来源:Alometal.[1],RNNLSTM可以解决训练过程中的梯度消失和梯度爆炸问题,简单来说就是在更长序列中有更好的表现。LSTM可以被简单理解为是一种神经元更加复杂的常比RNN效果好。相较于构造简单的RNN每个神经元(Cell(Forgetht-101ct-11(Input:对应下图中t和𝑡用于决定将哪些信息存储在这个时刻的元胞状态t中,以及输出门(OuttGe图3:LSTM结构示意图资料来源:Alometal.[1],神经网络股票周频收益率模型表现Nelsonetal[2]尝试了利用LSTM模型和一系列量价特征预测股票收益并取得了不错的效果。传统LSTM模型的最后一层是一个全连接神经网络,来将隐藏层的输出转为最后的预LSTM(MLP)来作为股票收益预测的模型框架。并且我们尝试调整LSTM模型为双向来提升模型表现。预测股票周度收益率的模型细节如下:数据输入:2013年至今中证1000成分股个股行情6个量价指标:开盘(A7个指13数据窗口及预测对象:用过去80个交易日的量价及资金流数据预测五个交易日后的个股超额收益(开盘至开盘。模型结构及细节:LSTM(128128MLP(25664641),每半年对过去825个交易日数据进行滚动训练,训练集与验证集8.5:1.5(打乱E。5020R210次,则训练早停,并取验证集表现最佳的一次训练作为最终模型。益率预测模型结构示意图 资料来源:绘制最近一次模型采用了截至2023年4月1日的中证1000个股行情数据,模loss和RR图5:LSTM+MLP模型训练loss变化 图6:LSTM+MLP模型训练R2变化资料来源:wind, 资料来源:wind,DL7年的因子IC0.038,ICIR0.5124.2%IR为2.25。仅用个股日度行情和资金流等指标,已经可以初步训练出具有一定选股能力的因子。图7:DL因子IC表现 图8:DL因子多空收益及净值 资料来源:wind, 资料来源:wind,股票静态内在属性及应用股票内在属性的探究𝑡传统的多因子模型认为同一种因子的因子暴露对于所有的股票的影响是一样LSTM+MLP𝑡图9:股票A收盘价(元)与某一技术因子值 图10:股票B收盘价(元)与某一技术因子值 资料来源:wind, 资料来源:wind,如何把股票分成不同种类,并发现影响因子表现的内在属性呢?其实只要给每只股票生成一个嵌入(mbedig,包含足够的信息即可。什么是嵌入?其本质上是利用目标所处的环境对其进行定义的一种方式,类似找到目标的各种应Lietal[3]就曾尝试利用skip-gram算法计算股票的嵌入特征并应用到深度神经网络中。在目前的股票市场上,基金的选股网络Factorization)方法,矩阵分解是协同过滤算法的改进,分解的示意 资料来源:Corenetal.[4],𝑗矩阵分解在基金选股网络中也可以发挥相同的作用。矩阵分解算法本质上通(真实值(预测值𝛤,矩阵中的元素𝛾𝑖,𝑗代表基金𝑖对股票𝑗的投资行为,即𝑀和𝑁票j的表示𝑄𝑗,这个𝑄𝑗包括𝑞𝑗和𝜇𝑠,即股票𝑗的隐向量和bias。分解的目标函数为:𝑗min∑

−(𝜇+𝜇𝑠+𝜇𝑓+𝑝𝑇𝑞))2+𝜆‖𝜃‖𝜃 𝑖,𝑗

𝑗

𝑖𝑗其中,𝑝,𝜇𝑓是基金𝑖的隐向量和bias,𝜇表示模型中的其他偏差,‖𝜃‖是为了𝑖 𝑗防止过拟合而引入的模型正则项。下图示意了当我们取embedding特征数为5时的矩阵分解算法:网络的矩阵分解 资料来源:绘制[4]Y.Koren,R.BellandC.Volinsky,"MatrixFactorizationTechniquesforRecommenderSystems,"inComputer,vol.42,no.8,pp.30-37,Aug.2009,doi:10.1109/MC.2009.263.基于基金选股网络的嵌入层计算32embeddingbiasMSE,训640.12022loss64轴)随训练轮数(横轴)变化 资料来源:wind,从矩阵分解的结果来看,基于基金选股网络的嵌入层可能代表了某种未知的市场风格。我们用k-means算法用训练得到股票的内在属性进行聚类并分为20类,选择数量最少的一类,列出其中涵盖的所有股票及截至2023年4月1日的所属行业及流通市值。图14:k-means聚类后某类涵盖的所有股票 股票代码 股票简称中信一级行业流通市值 股票代码 股票简称 中信一级行业 (亿元) 000001.SZ平安银行银行2458.7600036.SH招商银行银行7068.2000002.SZ万科A房地产1497.3600309.SH万华化学基础化工3008.5000423.SZ东阿阿胶医药345.1600438.SH通威股份电力设备及新能源1771.1000895.SZ双汇发展食品饮料900.0600563.SH法拉电子电子326.8002100.SZ天康生物农林牧渔131.4600570.SH恒生电子计算机1093.8002142.SZ宁波银行银行1775.7600862.SH中航高科国防军工311.8002179.SZ中航光电国防军工850.9600886.SH国投电力能源750.2002291.SZ遥望科技传媒131.4600887.SH伊利股份传媒1828.7002352.SZ顺丰控股交通运输2620.6601166.SH兴业银行银行3508.8002410.SZ广联达计算机766.2603882.SH金域医学医药392.3002475.SZ立讯精密电子2176.8603987.SH康德莱医药68.4002572.SZ索菲亚轻工制造131.3688188.SH柏楚电子计算机279.0002594.SZ比亚迪汽车2980.9688598.SH金博股份基础化工146.8002841.SZ视源股份消费者服务363.4688596.SH正帆科技机械84.7300054.SZ鼎龙股份基础化工189.0688408.SH中信博机械59.9300203.SZ聚光科技能源117.2605111.SH新洁能电子132.7688235.SH百济神州-U医药145.2600905.SH三峡能源能源747.9资料来源:wind,我们计算这类中个股的平均风格暴露。风格因子取值在-330.48,且大多数因子取值都0风格暴露与行业分布 风格因子 因子暴露中信一级行业个股数量 中信一级行业 个股数量贝塔-0.07医药4汽车1盈利-0.26银行3电力设备及新能源1成长0.23基础化工3消费者服务1杠杆-0.21计算机3轻工制造1流动性0.23电子3房地产1动量-0.34能源3交通运输1非线性市值0.06国防军工2其他行业0市值0.17食品饮料2价值-0.48机械2波动率0.24农林牧渔1资料来源:wind,股票静态内在属性的应用我们在LSTM模型生成多个因子后,与基金选股网络嵌入层拼接后并输入MLP,以将股票内在属性加入到深度学习中。这样就能在计算因子权重时,考虑到股票的内在属性信息。即𝑟̂𝑗=𝑀𝐿𝑃([𝑍𝑗,𝑄𝑗])。𝑡+5 𝑡我们从2016年开始,在每年的4月1日与9月1日进行训练,分别取过去825180内在属性的应用 资料来源:绘制202341lossR2R2上升较为单调,在50次训练后仍未见顶,R2接近0.5,且训练集与验证集趋势一致,效果好于第一节提到的LSTM+MLP图17:静态内在属性神经网络模型训练loss随训练轮数变化图18:静态内在属性神经网络模型训练R2随训练轮数变化资料来源:wind, 资料来源:wind,2016-04-08至2023-05-05,采用每周最后一个交易日的因子IC图19:DL_EM因子IC表现 图20:DL_EM因子分10组净值 资料来源:wind, 资料来源:wind,DL_EM1000年平均年化72.9%益主要来源于空头端。图21:DL_EM因子分年度表现 资料来源:wind,股票内在属性动态化应用动态市场状态但市场是所以我们需要将股票静态的内在属性转为动态内在属性。𝑡时刻市场的偏好状态𝑆𝑡,之后利用获得的市场偏好对股票𝑗内在属性动态特征𝐷𝑗,即:𝑡1𝑆=

𝑖=𝐾𝑟∑𝑄(𝑟𝑄1>𝑟𝑄2>⋯>𝑟𝑄𝐾𝑟>⋯)𝑡

𝑖=1

𝑖

𝑡 𝑡𝐷𝑗=𝑆𝑄𝑗𝑡 𝑡这一操作的本质目标是刻画各股票与当下市场偏好股票的相似性。态市场状态的捕捉 资料来源:绘制𝒕𝑡若将股票的动态内在属性动态特征𝑫𝒋本身作为一个因子,并没有显著的选股Kr=20𝐷𝑗因子表现,后续的研究中,我们继续取𝒕𝑡Kr=20。图23:𝑫𝒋因子IC表现 图24:𝑫𝒋因子多空收益𝒕 𝒕资料来源:wind, 资料来源:wind,股票内在属性动态特征的应用𝒕同样的,我们将上一节中计算的股票内在属性动态特征𝑫𝒋应用到深度学习模型中̂𝒋 =𝑷𝒋,𝒋,𝒋]将𝐷𝑗计算5日后拼接原型中其模𝒕𝒕+𝟓 𝒕 𝒕 𝑡型细节与2.3中相同,模型结构如图:内在属性的应用 资料来源:绘制将上述训练过程训练得到的因子命名为DL_EM_Dynamic,进行周度回测,1000,2016-04-042023-06-09Ran12.3%,ICIR1.55,分十组净值的单调性较强。图26:DL_EM_Dynamic因子IC表现 图27:DL_EM_Dynamic因子分10组净值 资料来源:wind, 资料来源:wind,DL_EM_Dynamic100083.7203.4%,34%3.58。图28:DL_EM_Dynamic因子分年表现 年份 扣费后多 多头组合多头组合 多空收益 扣费后纯因子纯因子组合纯因子组合周度胜率头收益 超额收益信息比率 组合收益 单边换手率 信息比率2016年4月起19.1%15.4%2.8287.5%14.9%16.46.0886.8%2017-2.9%19.2%3.17120.0%17.2%21.45.8275.0%2018-36.5%5.7%0.7596.0%8.1%20.62.3260.8%201946.0%18.8%3.42175.9%25.9%21.68.9092.2%202082.3%50.5%6.49253.8%32.7%21.510.2092.2%202190.3%59.5%6.87347.3%41.3%20.511.9586.3%202237.3%74.5%6.34419.3%41.0%18.910.2294.1%2023/6/520.6%11.7%1.5651.3%8.5%9.12.1378.3%平均年化29.0%34.0%3.58203.4%26.2%20.87.4183.7%资料来源:wind,DL_EM_Dynamic1000指数增强组合5%,行业主动暴露±0.1,风格暴露±0.5,个股约束3%,单边换手约束50%,得4.3,超5.5%,表现稳定。图29:DL_EM_Dynamic因子主动增强组合表现 资料来源:wind,7392支股票10%作10.1亿左右。图30:主动增强组合持仓个数 策略容量估算(亿) 资料来源:wind, 资料来源:wind,总结与思考LSTM+MLP1000衡量因子在不同时期对于股价影响的变化。将这些内在属性与LSTM生成的因子MLP深度学习策略可解释性相对较弱,今年来策略已经出现过一次明显波动,若风险提示量化模型基于历史数据,市场未来可能发生变化,策略模型有失效可能。插图目录图1:CNN结构示意图 3图2:RNN结构示意图 4图3:LS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论