金融工程深度报告:如何从ETF的提纯Alpha中学习信息_第1页
金融工程深度报告:如何从ETF的提纯Alpha中学习信息_第2页
金融工程深度报告:如何从ETF的提纯Alpha中学习信息_第3页
金融工程深度报告:如何从ETF的提纯Alpha中学习信息_第4页
金融工程深度报告:如何从ETF的提纯Alpha中学习信息_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

有关分析师承诺,见本报告最后部分。并请阅读报告最后一页的免责声明。深度报告——金融工程金融工深度报告——金融工程金融工程Email:dongli.wang@orientfuturesEmail:fan.xu@orientfutur如何从ETF的提纯Alpha中学习信息随着近年来市场波动加剧,主动管理的难度不断加大,在近三上,我们分别从标的指数和成分股两个维度提取66个特征,以我们构造ETF组合的方式为五日调仓,以等权不同周期预测值和行业指数ETF标的池滚动测试效果,结果显示除了行业指数指标计算和策略收益基于历史数据得出,不排除失效的可能21.被动指数化投资是未来的趋势 51.1.ETF产品逐渐丰富,其交易热度和关注度逐渐增加 51.2.主动管理产品的超额收益逐渐减少,被动产品的优势逐渐显现 61.3.以自下而上的视角,构建截面打分的ETF轮动策略 62.截面打分模型:变量选取、目标构造和深度学习模型 72.1.变量选取:成分股特征和指数行情特征 72.2.目标构建:回归后的Alpha是更稳健的目标 92.3.深度学习模型的构造及训练机制 3.回测结果:等权集成模型和短周期调仓是组合关键 3.2.股票型ETF产品池的组合结果 3.3.主题指数ETF产品池的组合结果 3.4.行业指数ETF产品池的组合结果 4.总结与展望 5.风险提示 ;期货研究报告 5 5 5 5 6 6 7 9 图表17:LeakyReLU的表达式(“=0.05) 的比值表征发行量随时间变化,三种主要被动产品均在2010年后呈现增长态势,从图表1:产品类型以股票型ETF和主题指数ETF为主图表2:ETF相较主动权益基金个数占比逐年增加图表3:三大主要类型的ETF成交热度逐步提升近年来主动管理的基金绝对业绩表现不佳,相对被动指数的超额衰减显著。同时因ETF交易费率低,能实现相较于主动管理基金更高频的策略(明显。我们选取偏股混合型、普通股票型和灵活配置型基金为主动权益基金样本,以聚源对各个主动基金的行业划分统计(近三年、近两年和近一年)区间收益,求各板块内所有产品收益的平均值,与该板块指数同期收益比较(主动基金收益-板块指数收基础化工板块和汽车板块外,其余板块的主动基金超额呈现明显的下降趋势,表明主动管理的难度不断加大,其相较被动指数化投资的优势逐渐缩小。同样地,我们测算了公募量化指增的(近三年、近两年和近一年)区间收益,结果中显示整体基金超额图表5:主动权益基金的超额(相较指数)逐年递减1、第一个问题是如何在不断丰富的标的池中系统化筛选出有意义的目标对象。从ETF发行的产品类型来看,包括了股票型ETF、主题指数型ETF、规模指数型略逻辑上来说,这会涉及到不同资产的周期性问题(时序策略)和不同资产收益逐渐成型,该类策略的投资标的均为主题指数ETF、行业指数ETF和风格指数3、第三个问题是如何在跟踪同一指数的不同被动产品间进行抉择。由于ETF均为被动基金产品,不同基金管理人间均有着或大或小的跟踪误差且部分ETF产品的存续时间相对较短,所以更好地方法是以自下而上的视角对跟踪标的指数再向上映射至(过去一段时间交易量最大或过去一段时间跟踪误差最小)ETF产后者的优势在于持仓数据透明,因此我们选取变量时可从两个维度出发,一个是从个股经权重加权至指数层面,另一个是指数自身行情表征。在构建变量池时,我们从个股层面和指数层面出发尽可能地整理并计算了较多的因子值,下表中我们展示后续模因子类型因子名称计算方式因子类型因子名称计算方式个股特征估值指标pe_ttmep_ttmpcf_ttmpc_total_ttmpb_ttnbp_ttmpeg_ttmcfp_ttmdvd_ttmps_ttm总市值/归母利润(TTM)连续四个季度报表归母利润/总市值总市值/经营活动的现金流量(TTM)总市值/总现金流(TTM)总市值/归母股东权益(TTM)归母股东权益/总市值(TTM)市盈率/归母利润增长率平均值*100(TTM)现金收益率/总市值(TTM)连续四个季度股利和/总市值(TTM)总市值/盈利收入(TTM)现金流指标cfps_ttmocfps_ttmfcfps_ttmfcfeps_ttmocf2d_ttm fcfe_ttm现金流量净额/总股本(TTM)经营活动的现金流量/总股本(TTM)企业自由现金流量/总股本(TTM)股东自由现金流量/总股本(TTM)经营活动的现金流量/净利润(TTM)股权自由现金流量(TTM)财务指标crps_ttmerps_ttmupps_ttmem_ttmd2m_ttmefar_ttm资本公积金/总股本(TTM)盈余公积金/总股本(TTM)企业档期未分配利润总额/总股本(TTM)总资产/股东权益(TTM)负债总计/总资产(TTM)归母股东权益/固定资产(TTM)经营衍生指标deps_ttmaeps_ttmotrps_ttmebit_ps_ttmroe_ttmnpm_ttmebit_rev_ttmp2r_ttmato_ttmeto_ttm归母净利润/普通股总股本(TTM)扣除非经常损失的净利润/普通股加权股本(TTM)营业总收入/总股本(TTM)息税前利润/总股本(TTM)归母净利润/股东权益总计(TTM)净利润/营业总收入(TTM)息税前利润/营业总收入(TTM)营业利润/营业总收入(TTM)营业收入/当期报表总资产(TTM)营业收入/归母股东权益(TTM)增长衍生指标increv_ttmincroe_ttmopgr_ttmnpg_ttmincbp_ttmncfg_ttmtag_ttmnag_ttm营业总收入同比增长率(TTM)净资产收益率增长率(TTM)营业利润同比增长率(TTM)净利润同比增长率(TTM)每股净资产同比增长率(TTM)净现金流增长率(TTM)总资产同比增长率(TTM)净资产同比增长率(TTM)技术指标macd_upmacd_downmacd_diffdpototo_div长端指数平滑均线,时间参数为26日短端指数平滑均线,时间参数为12日长端均线与短端均线的差值收盘价-平滑后价格的20日均值日均换手率日换手率与120日换手率均值的比值技术指标rsiwratrmfivol_perc相对强弱指标,时间参数为6日威廉超买超卖指标,时间参数为6日真实波段,时间参数为9日商品通道指标,时间参数为14日资金流量指标,时间参数为14日长短端的成交量比值,分别为20、5日标的特征技术指标accbiaspctvoltboll_upboll_downboll涨幅速率,12日收盘均价与当前收盘价的斜率乖离度指标,21日收盘价与当前收盘的差值涨跌幅度21日波动率26日、2倍标准差的布林带上轨26日、2倍标准差的布林带下轨布林带上轨和布林带下轨的差值技术指标rsiatrwrma_lowma_highcorr_vol相对强弱指标,时间参数为6日商品通道指标,时间参数为14日真实波段,时间参数为9日威廉超买超卖指标,时间参数为6日最低价的21日移动均线最高价的21日移动均线成交量与收盘价的21日相关系数就个股层面特征,我们从指数层面下沉至其持仓,以个股的持仓权重加权因子,映射为该指数的单因子,其中因子选择大类以基本面因子为主。就标的指数层面特征,我们仅依据指数行情数据计算技术指标,若无成交量数据,则以截面均值填充。所有因图表9:因子间的相关系数(色调为-1至1)体呈现低相关,平均的相关系数在0.07,细分至二级因子分类,个股估值、个股经营、个股现金、个股财务、个股增长、个股技术被动产品与主动基金均持有一揽子股票,无论其发行类型,均暴露于某种特定的投资风格下。简单来说,市面上有着将基金按照市值和成长价值风格分类的,其背后逻辑在于假设某一类别中的所有基金产品都通过一种(多种)Beta来产生其对应的Alpha收益,此方法亦可用于拆解被动产品或标的指数的Alpha。过往的文献均将回归后的Alpha(未被解释的残差)作为自变量(X对基金的原始收力指标,该类方法已成熟,但择优基金的效果并不出色,其原因在于原始收益较难预测,一是原始收益受到了市场的水平效应,二是不同板块或行业的驱动因素(风险暴标,自变量选择上我们使用常见的贝塔因子、价值因子、成长因子、盈利因子和动量因子,各个风格因子的日度走势图如下所示,五个风格因子在统计区间内的平均相关图表11:五个风格因子的日度走势图(2007/01/01-滚动回归的窗口期的选择很重要,若回归窗口期过长则会抹平标的短期波动,若回归(000036.XSHG)、上证医药(000037.XSHG)和上证央企(000042.X的平均时序标准差和平均截面标准差。平均时序标准差表征的是单标的自身的噪声程时序标准差过大,则表明标的的随机游走频繁,模型拟合噪声的概率大。平均截面标图表12:平均时序标准差随窗口期的变化预期收益率间的模糊函数关系。前文在第一个方面尽可能地收集整理了有代表性的因子集,并在第二个方面降低了预期收益率中的噪音。现假设两者的函数表达式如下所示,其中zi,t是标的指数的特征,zk,t是由成分股聚合而成的特征,Ti+1是未被解释的Alpha收益,g(.)是两者间的函数表达,Ti+1=g(zi,t,zk,t)+εi,t+1传统的计量经济模型中g(.)是一个线性表达式,好处在于后期归因能力强,能回溯至各个特征对目标的贡献程度,但缺点在于一是不能刻画因子之间的联动关系,二是不既然信息与预期收益率间的关系是模糊的,我们认为不应该指定某一种特定的形式来刻画,而是尽可能地构造一个具备能力去学习信息的模型,因此本文选用基础的深度一个前馈网络(Feed-ForwardNetwork)是一个灵活的非参数估计器,能够通过足够的数据学习输入变量x和输出变量y之间的任何函数关系y=f(x),该模型通过将一个隐藏层的输出作为下一个隐藏层的输入来组合多个层级,并使用非线性的激活函数转换每一个隐藏层的输出。本文选用的模型架构如下图所示,除输入层和输出层外模型包括两个全连接的隐藏层,在输入层前我们构建了一个因子筛选机制,选取训练集内与LeakyReLU能解决ReLU造成神经元死亡的问题,不牺牲训练效率的同时提高预测精在反向传播时,负取值同样可以计算梯度,解决了神经元死亡的问题,在不牺牲训练相比传统的MSE和IC,本文将一致性相关系数(ConcordanceCor作为损失函数,同时考虑了绝对数值差异和趋势性。在金融预测任务中,目标任务和衡量的是预测值和真实值的绝对数值差异,惩罚预测偏差大的数值,好处是计算效率量的是预测值和真实值的相关系数,好处是与目标任务(截面多因子)优化方向一致、不受数据量纲影响,缺点是(非凸性)不保证收敛。我们在下图中随机生成了两组数2px,yσσ+σ+(μx−μy)2从上式中可以看出,分子中px,y表示两者之间的相关系数即IC值,若相关系总样本第1次训练第2次训练第3次训练第4次训练..第k次训练本文的训练流程使用的是时序交叉验证的滚动训练方式,第一次训练为三年数据,后续以季度为样本外预测,近一年的数据为验证集,每一期训练使用验证集前所有数据,剔除相对应T期的样本以防止数据泄露。深度学习模型的交叉验证用于选择模型的超参数,多数领域的做法是单次验证,即以固定的比例(80:20)切分训练集和验证集,但该方法无法适应时变的金融数据。因此,本文我们将数据集以半年为跨度切分为k我们在此汇总模型构建细节、训练流程、学习涉及的参数参数说明数据集构建标的指数样本池共296个标的指数(剔除常见宽基指数)特征T日与目标相关系数绝对值最大的42个特征T+1日与T+n日的回归后Alpha,n为6、11、21数据预处理特征5倍MAD缩尾、截面均值填充缺失值、截面排序标准化截面排序标准化训练流程测试集(样本外)2011/08/01~2023/12/31第一期训练集为2007/07/31~2010/07/31,验证集为2010/07/31~2011/07/31训练集、验证集划分训练集以(去除验证集)当前可得的所有样本,验证集周期为252个交易日(近一年),测试集周期为63个交易日。每过63个交易日周期,重新训练一次模型特殊处理剔除训练集、验证集的最后n个样本n根据当前任务的目标窗口而定,分别为6、11、21训练细节隐藏层数两层全连接的隐藏层神经元个数损失函数一致相关系数(CCCLoss)batchsize学习率0.0005优化方式SGD停止训练条件验证集的第T期epoch损失高于T-6至T-1期的损失均值早停机制20个epoch组合构建截面分组数十组调仓周期调仓周期为n-1个交易日(对应目标的n日参数)若测试的是T+1至T+6期的回归Alpha目标,组合的调仓周期为5个交易日成交价格收盘价成交若T期出信号,则以T+1期的收盘价买卖交易手续费万五组内权重等权配置上述三种调仓周期的预测结果,以二十日的调仓周期来构建策略,以下为各个策略的十组的组别间平均年化收益差值为0.49%,最优组的业绩统计表现如下化收益为平均年化收益差值为0.35%,最优组的业绩统计表现如下,年化收益为11.59%、年化,(外)第一组至第二十组的组别间平均年化收益差值为0.46%我们分别测算了各个最优组(相对标的池平均收益)的超额收益以及预测值与目标收更优,长周期的波动回撤较小。四个组合中长周期(二十日调仓)的超额更稳定,但上节标的指数的回测结果中,有两个主要结论:1)短周期的收益端更优2)模型结果(等权)集成预测能力更强。通常来说,金融标的收益率间的自相关性低,一个有效的市场会快速的挤兑简单赚取超额收益的方法,因此本文以经线性转换后的目标为下游任务,降噪原始收益率,使目标的序列自相关性提高,供模型学习,但是此方法的资料来源:Ricequant,东证衍生品研究院对于整体组合的波动率控制,可以提升整体组合的风险表现。如果一个组合根据一个固定的波动目标定期调仓,往往能够获得更高的风险汇报。当标的的波动率上升,高波动的状态可能会持续(波动率聚集同时下跌带来的潜在风险也较大(杠杆效应波动率倒数策略会在此时降低该标的的头寸。当标的的波动率下降,低波动的状态可能会持续(波动率聚集同时上涨的概率也较大(杠杆效应波动率倒数策略会在2.等权合成深度学习模型的不同周期(五日、十日和二十日)预测结果以选择截面最优的前10%标的指数,并计算该标的(过去一个月)的波动率以调整组合权重。指数ETF和主题指数ETF等。在全8.51%,年化夏普比为0.38和0.34,相较标的池平均收益超额收益分别为12.19%和ETF,构造等权和波动率倒数组合。等权组合和波动率倒数组合的年化收益率分别为构造等权和波动率倒数组合。等权组合和波动率倒数组合的年化收益率分别为9.03随着近年来市场波动加剧,主动管理产品相较于基准的超额收益有衰减趋势,因此投走势评级短期(1-3个月)中期(3-6个月)长期(6-12个强烈看涨上涨15%以上上涨15%以上上涨15%以上看涨上涨5-15%上涨5-15%上涨5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论