文本因子超额走阔看好量价因子_第1页
文本因子超额走阔看好量价因子_第2页
文本因子超额走阔看好量价因子_第3页
文本因子超额走阔看好量价因子_第4页
文本因子超额走阔看好量价因子_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、8 月因子观点:量价因子或持续占优从常规角度看,内生变量视角短期看好估值、波动率、换手率因子,不看好财务质量因子。外生变量视角短期看好反转、波动率、换手率因子,不看好小市值、Beta、技术因子。因子周期视角中长期看好大市值、估值、盈利、财务质量、波动率、换手率因子,但随着实体经济库兹涅茨周期见顶,经济长期增长趋势放缓的背景下因子风格或有切换。此外本文对前期研究人工智能 57:文本 FADT 选股(20220701)中构建的研报文本得分因子 forecast_adj_txt 进行了补充讨论。讨论内容 1:我们比较了盈利预测调整场景下和全部 A 股研报场景下构建出的研报文本得分因子,发现场景对因子

2、效果具有重要影响,纳入弱逻辑研报进行训练会增加模型噪音,场景选择或更重要;讨论内容 2:直接将研报发布前后的 AR(模型标签)作为因子值与 forecast_adj_txt 因子进行比较,发现前者几乎没有选股效果,增量或来源于文本得分引入了“赔率”信息。图表1: 内生变量和外生变量对风格因子 8 月表现的预测1.20.8内生变量得分外生变量预测(右轴)7.94%0.644.73%5.63%0.69 6.42%0.70.435.25%0.490.540.36 3.47%0.390.54.99%0.220.86%-0.45%289.26%10%6%0.42%0.0(0.4)-2%(0.8)-6%(

3、1.2)估值成 盈 财长 利 务质量小反波换市转动手值率率-10%Beta技术:预测内生变量视角基于因子动量、因子离散度、因子拥挤度三类指标,预测风格因子未来表现,因子动量反映因子过去一段时间内表现;因子离散度相当于因子估值;因子拥挤度反映因子是否处于拥挤状态。内生变量对大类风格因子 8 月表现预测结果如下:看好估值、波动率、换手率因子,不看好财务质量因子。其中,换手率因子在离散度指标上占优,处于过度忽视状态;波动率、换手率因子在拥挤度指标上占优;财务质量因子在动量上劣势明显。外生变量视角假设风格因子表现受市场变量、宏观变量等外生变量驱动,对每个大类风格因子筛选出具备预测能力的外生变量,使用线

4、性回归预测未来一个月的 Rank IC 值。外生变量对大类风格因子 8 月 Rank IC 预测结果如下:反转、波动率及换手率因子 Rank IC 预测值超过 6%,可能较为有效,建议短期看多上述因子表现;不看好小市值、Beta、技术因子未来一个月表现,上述因子表现可能受宏观环境制约。因子周期视角将华泰金工经济周期研究成果应用于风格配置,自上而下构建经济系统周期运行状态与因子表现对应关系的“因子投资时钟”,根据当前周期状态预测因子未来表现的整体趋势。预计未来一年处于库兹涅茨周期见顶回落,经济长期增长趋缓的环境,同时朱格拉周期向下,流动性趋于宽松。建议配置大市值、估值、盈利、财务质量因子,但随着

5、实体经济库兹涅茨周期见顶,经济长期增长趋势放缓的背景下因子风格或有切换。另外,波动率、换手率因子在不同的宏观环境下表现都较好,这两个因子建议长期配置。日历效应统计各风格因子在各自然月份胜率,根据历史经验,8 月反转、换手率、小市值因子整体 Rank IC 胜率较高。图表2: 各风格因子在各自然月份因子胜率(2006 年 1 月2022 年 7 月)风格因子1 月2 月3 月4 月5 月6 月7 月8 月9 月10 月11 月12 月Rank IC 为正概率76.47%55.56%72.22%77.78%44.44%61.11%77.78%64.71%70.59%76.47%82.35% 82.

6、35%82.35%55.56%66.67%44.44%77.78%88.89%83.33%64.71%41.18%88.24%41.18%82.35%70.59%44.44%55.56%55.56%77.78%88.89%61.11%41.18%35.29%94.12%47.06%76.47%58.82%33.33%61.11%72.22%77.78%77.78%44.44% 47.06%29.41%88.24%47.06%70.59%52.94%88.89%77.78%33.33%77.78%44.44%55.56%82.35%64.71%52.94%70.59%52.94%82.35%88

7、.89%83.33%72.22% 72.22%83.33% 83.33%82.35%100.00%88.24% 88.24%94.12%82.35%44.44%72.22%88.89%61.11%72.22% 72.22%64.71%100.00%70.59%76.47% 76.47%88.24%50.00%72.22%94.44%83.33%66.67%83.33%88.24%94.12%82.35%82.35%82.35%64.71%44.44%61.11%83.33%55.56% 55.56%55.56%64.71%70.59%52.94%41.18%64.71%64.71%88.89%

8、66.67%66.67%72.22% 66.67%77.78%70.59%70.59%76.47%82.35%94.12%估值成长盈利财务质量小市值 反转波动率换手率 Beta 技术估值70.59%50.00%50.00%66.67%38.89%55.56%77.78%41.18%70.59%64.71% 64.71%82.35%成长88.24%55.56%77.78%55.56%83.33%88.89% 88.89%47.06%52.94%70.59%35.29%82.35%盈利70.59%50.00%50.00%61.11%72.22%100.00%72.22%41.18%47.06% 4

9、7.06%52.94%82.35%财务质量58.82%33.33%50.00%77.78%66.67%88.89%44.44%41.18%29.41%58.82%47.06%70.59%小市值47.06%88.89%77.78%27.78%66.67%27.78%55.56%64.71%35.29%47.06%58.82%52.94%反转82.35%72.22%50.00%72.22%61.11%55.56%72.22%64.71%82.35%64.71%82.35%64.71%波动率76.47%38.89%66.67% 66.67%55.56%50.00%66.67%70.59%76.47%

10、58.82%76.47%58.82%换手率76.47%38.89%72.22%72.22% 72.22%61.11%77.78%82.35% 82.35%70.59%88.24%64.71%Beta52.94%50.00%61.11% 61.11%44.44%50.00%44.44%64.71% 58.82%52.94%41.18%58.82%技术47.06%77.78%50.00%44.44%61.11%66.67%77.78%52.94%47.06%70.59%70.59%70.59%因子收益率为正概率关于 forecast_adj_txt 的更多讨论在华泰金工前期研究人工智能 57:文本

11、 FADT 选股(20220701)中我们在卖方分析师盈利预测调整的场景下对研报情感进行判别,以分析师研报文本标题和摘要转换成的词频矩阵为输入特征,以研报发布前后个股的超额收益为预测标签,使用机器学习模型进行训练,在样本外构建了 forecast_adj_txt 因子。该因子回测期内(20090123-20220729)分层表现较为优秀,分十层回测多头第一层年化收益 24.36%,相对中证 500 年化超额收益 15.17%。我们进一步以 forecast_adj_txt 因子的多头第一层为基础股票池,使用基本面+技术面共 9个因子进行增强,每月末根据这9 个因子的合成打分精选靠前的25 只股

12、票构建等权的FADT组合,该组合回测期内(20090123-20220729)年化收益 44.04%,相对中证 500 超额年化收益 33.63%。图表3: Forecast_adj_txt 因子分层回测净值图表4: Forecast_adj_txt 因子分层回测超额净值(基准中证 500)分层1分层2分层3分层4分层5分层6分层7分层8分层9分层10 分层1分层2分层3分层4分层5分层6分层7分层8分层9分层10615541032512009-01-232009-11-202010-09-132011-07-142012-05-152013-03-112014-01-072014-11-04

13、2015-08-252016-06-232017-04-202018-02-072018-12-062019-10-082020-07-312021-05-312022-03-252009-01-232009-11-202010-09-132011-07-142012-05-152013-03-112014-01-072014-11-042015-08-252016-06-232017-04-202018-02-072018-12-062019-10-082020-07-312021-05-312022-03-2500:,朝阳永续,回测期:20090123-20220729:,朝阳永续,回测期

14、:20090123- 20220729图表5: Forecast_adj_txt 因子分层 1 分年度业绩(基准中证 500)时间区间收益率区间超额收益年化波动率最大回撤夏普比率卡玛比率200999.85%-4.92%32.48%21.99%3.074.54201030.01%18.10%27.90%22.11%1.081.362011-29.77%9.31%24.20%32.32%-1.23-0.92201211.15%9.89%25.04%22.42%0.450.50201349.81%26.63%25.94%13.85%1.923.60201456.64%11.98%22.41%14.0

15、6%2.534.03201588.26%30.05%44.56%50.83%1.981.742016-6.70%4.79%29.69%25.43%-0.23-0.2620170.15%1.34%15.43%14.49%0.010.012018-29.72%8.78%25.74%31.05%-1.15-0.96201961.38%27.01%25.12%18.10%2.443.39202067.62%42.19%30.62%18.59%2.213.64202136.79%20.71%21.85%15.02%1.682.452022-1.81%15.69%成立以来24.36%15.17%27.90

16、%54.50%0.87 0.45,朝阳永续,回测期:20090123-20220729因子覆盖度图表6: Forecast_adj_txt 因子覆盖度图表7: Forecast_adj_txt 因子多空对冲净值2,0001,6001,2008004002009-01-230分层1相对分层10净值14121086422009-01-232009-11-202010-09-132011-07-142012-05-152013-03-112014-01-072014-11-042015-08-252016-06-232017-04-202018-02-072018-12-062019-10-0820

17、20-07-312021-05-312022-03-2502010-01-232011-01-232012-01-232013-01-232014-01-232015-01-232016-01-232017-01-232018-01-232019-01-232020-01-232021-01-232022-01-23:,朝阳永续,:,朝阳永续,回测期:20090123- 20220729图表8: FADT 增强组合回测净值140120100806040200最大回撤(右轴)增强组合回测净值中证500净值2009 2010 2011 2012 2013 2014 2015 2016 2017 2

18、018 2019 2020 2021 20220%-20%-40%-60%-80%-100%:,朝阳永续,回测期:20090123-20220729图表9: FADT 增强组合回测超额净值(基准中证 500)超额最大回撤(右轴)相对中证500净值504540353025201510502009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 20220%-10%-20%-30%-40%-50%:,朝阳永续,回测期:20090123-20220729图表10: 文本 FADT 选股组合 2022 年 8 月持仓:,朝阳永续,

19、前期报告发布以后,在与读者的交流过程中,发现部分读者所关心的问题我们在报告中并未进行讨论,在此我们进行一些补充。研报文本挖掘:场景选择或是更重要的影响因素从应用场景的角度来说,我们关于研报文本挖掘的两篇报告文本PEAD 选股(20220107)和文本 FADT 选股(20220701)与市场以往的研究有所不同,我们在限定的场景下进行研报情感分析,上篇我们仅针对业绩发布的场景,下篇我们则扩展到卖方盈利预测调整的场景,两篇研究都并非对所有的卖方研报进行讨论。我们如何理解这两种做法的区别?从逻辑上来说,限定场景实际上是预设了先验信息,即认为“业绩发布”或者“盈利预测调整”这两组场景对股价的影响是具有

20、强逻辑的,与传统事件驱动研究类似。如果不限制场景,相当于不给定先验信息,认为所有的研报相关事件都可能对股价造成影响,让模型学习区分逻辑强弱。图表11: 强逻辑研报与弱逻辑研报示意图:,朝阳永续,第一种做法的优势在于如果先验信息是正确的,那么我们给模型学习的样本信噪比将更高,但可能会导致股票覆盖度较低;第二种做法的优势在于股票覆盖度高,但众多场景的规律一起学习可能会造成信噪比降低。实际上这也引申出读者比较关心的一个问题:上述两篇报告的方法论在全部卖方分析师研报上是否有效?下面我们进行数据层面的补充讨论,下文我们将基于全部研报样本构建的文本因子称为 research_txt 因子。图表12: 全研

21、报样本-research_txt 分层回测净值图表13: 全研报样本-research_txt 分层回测超额净值(基准中证 500 分层1分层2 分层3分层4分层5分层6分层7分层8分层9分层10 分层1分层2分层3分层4分层5分层6分层7分层8分层9分层1018541232612009-01-232009-11-202010-09-132011-07-142012-05-152013-03-112014-01-072014-11-042015-08-252016-06-232017-04-202018-02-072018-12-062019-10-082020-07-312021-05-31

22、2022-03-252009-01-232009-11-202010-09-132011-07-142012-05-152013-03-112014-01-072014-11-042015-08-252016-06-232017-04-202018-02-072018-12-062019-10-082020-07-312021-05-312022-03-2500:,朝阳永续,回测期:20090123-20220729:,朝阳永续,回测期:20090123- 20220729图表14: 全研报样本-research_txt 因子覆盖度图表15: 全研报样本-research_txt 因子多空对冲

23、净值2,4002,000因子覆盖度分层1相对分层109871,600 651,20048003400212009-01-232009-11-302010-09-302011-07-292012-05-312013-03-292014-01-302014-11-282015-09-302016-07-292017-05-312018-03-302019-01-312019-11-292020-09-302021-07-302022-05-312009-01-232009-11-202010-09-132011-07-142012-05-152013-03-112014-01-072014-11-

24、042015-08-252016-06-232017-04-202018-02-072018-12-062019-10-082020-07-312021-05-312022-03-2500:,朝阳永续,:,朝阳永续,回测期:20090123- 20220729图表16: 全研报样本-research_txt 分层 1 分年度业绩(基准中证 500)时间区间收益率区间超额收益年化波动率最大回撤夏普比率卡玛比率200990.34%-2.77%31.26%18.95%3.305.44201030.28%18.76%28.09%23.49%1.131.352011-33.62%1.98%24.59%3

25、5.20%-1.40-0.9820129.58%8.69%25.75%22.96%0.390.43201358.12%34.32%26.17%14.51%2.394.30201432.87%-3.98%23.47%16.40%1.452.072015107.83%45.06%46.93%54.44%2.412.072016-8.73%3.00%31.59%26.81%-0.28-0.342017-10.81%-10.00%14.38%14.41%-0.77-0.772018-31.75%3.90%25.34%33.73%-1.29-0.97201957.94%24.76%24.12%17.41

26、%2.503.47202044.06%22.57%31.37%18.94%1.472.43202138.22%22.47%23.58%13.71%1.692.912022-6.99%10.32%成立以来20.96%12.23%28.53%63.81%0.73 0.33,朝阳永续,回测期:20090123-20220729从全研报样本计算得出的 research_txt 因子无论是多头收益、超额收益稳健性还是多空对冲的稳健性都不如 forecast_adj_txt 因子,在其他模型参数都完全相同的情况下,多头端年化收益降低约 3.5 个百分点。但是因子覆盖度相比于后者有所提升,平均因子覆盖度 1

27、574只,相比于后者的 1107 只覆盖度提升约 40%。同时我们可以看到,research_txt 因子的分层效果仍然比较明显,虽然多头端年化收益削减4%,但是也达到 20.96%,单独来看 research_txt 因子仍然是一个较为有效的因子,说明文本 PEAD 选股与文本 FADT 选股两篇报告中提出的对研报进行情感分析的方法论是较为有效的方法,稳健性较强。在我们与读者交流的过程中,部分观点认为实际上盈利预测调整或许已经包含绝大部分卖方研报的点评场景,卖方分析师对于个股每年或多或少都会进行若干次数的盈利预测调整。我们从数据实证的角度对上述观点进行论证,令 research_txt 因子

28、对 forecast_adj_txt 因子进行中性化处理,考察残差因子的表现。图表17: research_txt 对 forecast_adj_txt 中性化以后的残差因子分层回测图表18: research_txt 与 forecast_adj_txt 因子相关性 分层1分层2分层3分层4分层5分层6分层7分层8分层9分层1010100%880%660%440%220%2009-01-232009-11-202010-09-132011-07-142012-05-152013-03-112014-01-072014-11-042015-08-252016-06-232017-04-2020

29、18-02-072018-12-062019-10-082020-07-312021-05-312022-03-250200920102011201220132014201520162017201820192020202120220%:,朝阳永续,回测期:20090123-20220729:,朝阳永续,回测期:20090123- 20220729从结果来看,残差因子虽然还有一定的分层效果,但是多头端收益发生了严重的衰减。主要是由于两个因子的相关性过高,大部分时间相关性超过 0.6,在 0.7 上下波动。这组数据实证结果印证了上述观点:即盈利预测调整包含了大部分的卖方研报的点评场景,剔除盈利预测

30、场景的 alpha 以后 research_txt 因子几乎不再具有超额收益。这也侧面说明我们对场景进行选择确实是有效的做法,可以提升信噪比。直接将标签作为因子是否有效?有不少读者好奇直接将我们用于模型训练的标签 2 日 AR 作为因子是否有效,在前期报告人工智能 57:文本 FADT 选股(20220701)中我们没有对此进行展示,本小节我们补充这部分内容。如果要将研报发布前后 2 日个股相对于中证 500 的超额收益作为因子, 为保证与 forecast_adj_txt 因子的可比性,在每个月月末对于每只股票,我们也选取过去三个月的所有盈利预测调整研报,将每条研报发布前后 2 日的 AR

31、作为单次得分,最后对所有盈利预测调整研报得分求均值作为个股的因子值,称其为 AR 因子。AR 因子的分层效果如下图所示。从结果来看,AR 因子几乎完全没有分层效果,与 forecast_adj_txt 因子相去甚远。图表19: AR 因子分层回测净值图表20: AR 因子分层回测绝对收益 分层1分层2分层3分层4分层5分层6分层7分层8分层9分层10绝对收益超额收益820%615%10%45%20%2009-01-232009-11-202010-09-132011-07-142012-05-152013-03-112014-01-072014-11-042015-08-252016-06-2

32、32017-04-202018-02-072018-12-062019-10-082020-07-312021-05-312022-03-250分层1分层2分层3分层4分层5分层6分层7分层8分层9分层10-5%:,朝阳永续,回测期:20090123-20220729:,朝阳永续,回测期:20090123- 20220729那么增量体现在何处?结合与读者的交流,我们尝试再给出一些解释。如果我们直接用标签 AR 作为因子,我们能观测到的只有标签本身,没有其他信息。而通过分析师研报的引入,我们最后给出了样本划分为三个类别(上涨、震荡、下跌)的概率,因此除了标签本身的取值,我们还引入了“赔率”信息。

33、试想有两只股票 A 和 B,若研报发布前后超额收益完全相同,那么我们如何将这两只股票进一步区分开?从 AR 的角度我们很难做到,但是从 forecast_adj_txt 因子的角度,进一步的区分成为可能。如下公式所示,假若股票 A 和股票 B 的研报预测出来三类概率分别为() = (0.5,0.4,0.1)() = (0.5,0.2,0.3)_ = _ = 0.51 0.50.51 0.5 0.11 0.10.31 0.3= 0 (. ) = 2.20= 0 (. ) = 0.85上涨类别概率均为 0.5,如果仅以上涨类别概率来构成因子(类似于直接将 AR 作为因子),那么我们实际上认为两只股

34、票没有区别。但是我们在计算 forecast_adj_txt 因子时,还会将下跌类别概率纳入考虑,股票 A 下跌类别概率为 0.1,相比于股票 B 的 0.3 赔率很低,因此模型认为股票 A 的上涨 0.5 分是优于股票 B 的上涨 0.5 分的,由此带来增量信息。因子表现回顾7 月大类风格因子表现大类风格因子 7 月在全 A 股票池的 Rank IC 值和因子收益率如下图所示。小市值因子表现一骑绝尘,Rank IC 值达到 28.68%,因子收益为 3.55%,与历史上小市值因子在 7 月的低胜率有所背离。此外反转、换手率、Beta 及技术因子也表现较好,Rank IC 分别为 6.93%、

35、 7.49%、6.06%及 6.45%。估值、成长、波动率因子表现居中,盈利及财务质量因子 7 月发生回撤。图表21: 1 月大类风格因子表现25%因子Rank IC因子收益率(右轴)4%28.68%3.55%3%15%5.57%6.93%1.22%7.49%6.06%6.45%2%0.62%1%5% 3.42%0.20%-0.32%0.32%3.91%0.63%0%-5%-0.03%-0.22%-1.85%-0.80%-0.02%-1%-15%估成值长盈财小利务市质值量反波换转动手率率-2%Beta技术:近 1 年大类风格因子表现对大类风格因子近 12 个月的 Rank IC 值做累加,得到

36、各月累计 Rank IC 值,如下图所示。整体来看最近一年表现最好的因子为反转、波动率及换手率等量价类因子,其次为估值及小市值因子。小市值因子整个 22Q2 持续震荡,在 5-6 月的反弹行情中表现不佳,但 7 月表现强势。技术因子表现次之,基本面类因子最近一年表现十分平淡,累计 Rank IC 持续在零轴附近波动。图表22: 近 1 年大类风格因子累计 Rank IC 值估值成长盈利财务质量小市值反转波动率换手率Beta技术140%100%60%20%-20%2021-07-302021-08-312021-09-302021-10-292021-11-302021-12-312022-01

37、-282022-02-282022-03-312022-04-292022-05-312022-06-302022-07-29-60%:近期细分因子表现计算 34 个细分因子 1 月 Rank IC 值,以及近 12 个月的月频 Rank IC 值。将近 12 个月 Rank IC 的均值除以标准差,得到近 1 年 IC_IR。近期细分因子表现如下图所示。图表23: 近 1 年细分因子表现30%20%10%0%-10%上月Rank IC近1年IC_IR(右轴)1.21.00.80.60.40.20.0(0.2)EP BP SP DPSales_G_q Profit_G_q ROE_G_qROE

38、 ROAgrossprofitmargin netprofitmargin assetturnover debttoassetscurrent ocftoassets ln_capital return_1m return_3m exp_wgt_return_3m exp_wgt_return_6mstd_1m std_3m IVR_FF3factor_1m IVR_FF3factor_3mturn_1m turn_3m bias_turn_1mBeta macd dea difrsi psy bias(0.4):因子表现计算方法因子 T 月表现的计算方法可以简要描述为:以 T-1 月最后一个

39、交易日为截面期,以全 A 股为股票池,计算附录一中 10 大类共 34个细分因子值。对每一大类风格因子内部各细分因子做去极值、标准化预处理及因子方向调整,再等权合成,得到截面期大类风格因子值。计算 T 月股票池内个股区间收益。对大类风格因子或细分因子做去极值、标准化和行业市值中性化预处理,计算 T-1 月预处理后因子与 T 月个股区间收益的 Spearman 秩相关系数,即 T 月因子 Rank IC 值。对大类风格因子值、个股总市值做去极值和标准化预处理,以 T-1 月预处理后大类风格因子值、预处理后个股总市值、中信一级行业哑变量为自变量,以 T 月个股区间收益为因变量,以流通市值平方根为权

40、重,做加权线性回归,大类风格因子值对应的回归系数即为 T 月大类风格因子收益率。详细计算方法请参见附录二。内生变量视角内生变量视角基于因子动量、因子离散度、因子拥挤度三类指标,预测风格因子未来表现。因子动量反映因子过去一段时间内表现;因子离散度相当于因子估值,高因子离散度反映因子被过度忽视,低因子离散度反映因子被过度投资;因子拥挤度反映因子是否处于拥挤状态。一般看好高因子动量、高因子离散度、低因子拥挤度因子短期表现,三项指标在截面和时序上均有预测效果。内生变量综合预测结果基于因子动量、因子离散度、因子拥挤度三类指标,分别从截面和时序角度,对大类风格因子 8 月表现进行打分预测,综合预测结果如下

41、表所示。看好估值、波动率、换手率因子,不看好财务质量因子。其中,换手率因子在离散度指标上占优,处于过度忽视状态;波动率、换手率因子在拥挤度指标上占优;财务质量因子在动量上劣势明显。图表24: 内生变量预测大类风格因子 3 月表现综合预测得分0.780.690.640.540.540.490.430.360.390.220.90.80.70.60.50.40.30.20.10.0估成值长盈财小利务市质值量反波换技Beta转动手术率率:预测综合预测得分是以下 6 项细分指标的均值:归一化截面因子动量;因子动量历史分位数;归一化截面因子离散度;因子离散度历史分位数;1归一化截面因子拥挤度;1因子拥挤

42、度历史分位数。其中,归一化采用 min-max 归一化,根据截面上各类因子相应指标最小值和最大值,将其缩放至0, 1范围内;历史分位数取每个因子最新月末截面期相应指标,在其历史上(自 2007年 1 月末截面期开始)所处分位数,本身在0, 1范围内;因子拥挤度为反向指标,故用 1减去相应指标。因子动量定义因子动量为因子在过去 12 个月末截面期的 21 日 Rank IC 均值。从截面角度看,小市值、反转、波动率及换手率因子动量较强,成长、盈利及财务质量因子动量最弱。从时序角度看,估值、波动率及换手率因子动量处于历史高位,均超过 2007 年以来的 90%分位数;Beta 及小市值因子动量次之

43、,超过历史 70%分位数;成长及盈利因子动量处于历史低位,均低于历史后 20%分位数。图表25: 大类风格因子动量历史序列估值成长盈利财务质量小市值反转波动率换手率Beta技术0.200.150.100.050.00(0.05)(0.10)2007-01-312008-01-312009-01-312010-01-312011-01-312012-01-312013-01-312014-01-312015-01-312016-01-312017-01-312018-01-312019-01-312020-01-312021-01-312022-01-31(0.15):图表26: 大类风格因子

44、7 月底截面动量和 2007 年以来历史分位数94.12%截面动量时序动量分位数(右轴)91.44%90.37%81.82%90%12%73.26%10.13%59.36%70%7%5.79%2%15.51%12.30%22.99%7.52%9.32%7.37%3.29%2.89%40.64% 50%30%10%-3%-8%-1.31%估成值长-4.75%盈利-2.34%财小务市质值量反波换转动手率率-10%-30%Beta-50%技术:因子离散度因子离散度计算方式为:在月末截面期,取每个中信一级行业因子值排名前 20%个股的因子值中位数,以及因子值排名后 20%个股的因子值中位数,两者求差值

45、;30 个行业的差值求平均值,得到当前截面期该因子离散度原始值;对当前截面期因子离散度原始值做标准化,计算其在过去 72 个月末截面期的 Z 分数。从截面角度看,成长、盈利、换手率及技术因子离散度相对较高,盈利因子离散度最高,财务质量、小市值及 Beta 因子离散度较低。从时序角度看,成长、盈利、小市值、换手率及技术因子离散度处于历史高位,均超过 2007 以来的 50%分位数,可能处于过度忽视的状态;财务质量因子离散度处于历史低位,低于 2007 年以来的 5%分位数水平,可能处于过度投资状态。图表27: 大类风格因子离散度历史序列估值成长盈利财务质量小市值反转波动率换手率Beta技术5.0

46、04.003.002.001.000.00(1.00)(2.00)(3.00)2007-01-312008-01-312009-01-312010-01-312011-01-312012-01-312013-01-312014-01-312015-01-312016-01-312017-01-312018-01-312019-01-312020-01-312021-01-312022-01-31(4.00):图表28: 大类风格因子 7 月底截面离散度和 2007 年以来历史分位数截面离散度时序离散度分位数(右轴)1.931.63 62.57%60.96%1.5858.29%1.4653.48

47、%1.1753.48%47.31%0.801.0125.67%0.640.6420.32%0.6113.90%3.74%2.52.01.51.00.50.0估成盈值长利财 小 反 波 换务 市 转 动 手质 值率 率量100%90%80%70%60%50%40%30%20%10%Beta0%技术:因子拥挤度因子拥挤度计算方式为:在每个月末截面期,分别计算个股 a)过去 63 个交易日的日度涨跌幅标准差作为波动率指标,b)过去 63 个交易日的日均换手率作为换手率指标,c)过去 63 个交易日个股收益与万得全 A 收益线性回归的回归系数作为 Beta 指标;取各个中信一级行业因子值排名前 20%

48、个股的波动率/换手率/Beta 均值,以及因子值排名后 20%个股的波动率/换手率/Beta 均值,两者求比值;对波动率、换手率、Beta 的三个比值求均值,得到当前截面期该因子拥挤度。从截面角度看,小市值、成长、盈利、财务质量因子拥挤度相对较高,波动率、换手率因子拥挤度相对较低。从时序角度看,Beta 因子拥挤度超过 2007 年以来的 80%历史分位数水平,可能处于交易拥挤状态;估值、反转、波动率、技术因子拥挤度低于 2007 年以来的 25%历史分位数水平,交易相对不拥挤。图表29: 大类风格因子拥挤度历史序列估值成长盈利财务质量小市值反转波动率换手率Beta技术2.001.801.60

49、1.401.201.000.800.600.400.202007-01-312008-01-312009-01-312010-01-312011-01-312012-01-312013-01-312014-01-312015-01-312016-01-312017-01-312018-01-312019-01-312020-01-312021-01-312022-01-310.00:图表30: 大类风格因子 7 月底截面拥挤度和 2007 年以来历史分位数截面拥挤度时序拥挤度分位数(右轴)1.1783.87%1.0972.73%1.031.050.90.940.710.7336.90%0.53

50、29.41%32.62%0.5532.62%23.53%21.93%22.46%13.37%31.4100%1.21.00.80.60.40.280%60%40%20%0.0估成值长0%Beta盈财小反波换技利务市转动手术质值率率量:外生变量视角外生变量视角假设风格因子表现受市场变量、宏观变量等外生变量驱动,对每个大类风格因子筛选出具备预测能力的外生变量,使用线性回归预测未来一个月的 Rank IC 值。以下分别展示最新一期预测方法及预测结果。外生变量选取选取 6 项市场指标和 13 项宏观指标作为外生变量。选择沪深 300 和中证 500 月涨跌幅、月波动率及月均换手率,用于表征市场行情的变

51、化。从国民经济核算、工业、价格指数、银行与货币、利率与汇率 5 个方面,选择较常用的 13 项宏观指标。时间序列回归模型的一个重要前提是自变量为平稳时间序列,而大部分宏观指标和市场指标在时间序列上的分布非平稳,不符合预测模型对自变量的假设,因此我们针对不同的外生变量,进行一定差分处理或计算变化率,使得外生变量在单位根检验下均为平稳时间序列。另外,部分宏观变量数据发布具有滞后性,我们在建模时将这部分宏观数据按其实际发布时间滞后使用。例如,T-1 月的 M1 同比数据通常在 T 月中旬公布,因此我们在 T 月末建模时用到的是 T-1 月的 M1 同比数据。下表展示具体 19 项外生变量及其所属类别

52、和变量处理方法。为了更清楚地展示部分宏观变量的滞后期,我们以 T 月末为截面期,最右列为外生变量能取到的最新数据时间。变量类别变量细分类别变量名称变量处理方法最新数据时间市场变量市场变量市场变量市场变量市场变量市场变量宏观变量国民经济核算沪深 300 月涨跌幅中证 500 月涨跌幅沪深 300 月波动率中证 500 月波动率沪深 300 月均换手率中证 500 月均换手率PMI不处理 不处理 变化率 变化率 一阶差分一阶差分二阶差分第 T 月第 T 月第 T 月第 T 月第 T 月第 T 月第 T 月宏观变量国民经济核算宏观经济景气指数先行指数变化率第 T-3 月宏观变量工业工业增加值当月同比

53、二阶差分第 T-1 月宏观变量价格指数CPI 当月同比二阶差分第 T-1 月宏观变量价格指数PPI 全部工业品当月同比一阶差分第 T-1 月宏观变量价格指数企业商品价格指数 CGPI 当月同比二阶差分第 T-1 月宏观变量银行与货币M1 同比一阶差分第 T-1 月宏观变量银行与货币M2 同比一阶差分第 T-1 月宏观变量银行与货币大型存款机构存款准备金率二阶差分第 T 月宏观变量利率与汇率中债国债到期收益率 3 个月变化率第 T 月宏观变量利率与汇率国债收益率差 10 年期-3 月期变化率第 T 月宏观变量利率与汇率美元兑人民币汇率变化率第 T 月宏观变量利率与汇率SHIBOR1W变化率第 T

54、 月,图表31: 外生变量列表外生变量预测方法参考 Hua,Kantsyrev 和 Qian 于 2012 年发表论文 Factor-Timing Model,使用外生变量预测大类风格因子 Rank IC 值。首先使用条件期望模型和 AIC 准则,在 T-1 月最后一个交易日,对每个大类风格因子筛选出可能影响因子 Rank IC 值的条件变量;其次将大类风格因子与筛选出的条件变量做线性回归,预测 T 月的因子 Rank IC 值。条件期望模型假设单个风格因子 Rank IC 时序向量 Y 与外生变量时序向量 X 的联合分布服从多元正态分布,即: () () , () ,则在给定 Xx 的情况下

55、,Y 的条件分布仍为正态分布,条件数学期望和条件方差分别为:|= (| = ) = + 1( )|= 1 其中 E(Y|X=x)称为 Y 关于 X 的回归,它是 x 的线性函数。AIC 和 AICc 准则使用 AIC 赤池信息量准则衡量统计模型拟合优良性。相比其它模型评价指标,AIC 的优势在于兼顾模型简洁性和准确性。在进行多个模型比较和选择时,通常选择 AIC 最小的模型。基于条件期望模型的 AIC 计算公式如下: = (|) + 2 其中 T 为样本窗口长度,N 为风格因子数量(这里固定为 1),K 为外生变量数量。当样本数量较小时,基于 AIC 的方法可能会产生模型过拟合问题。为避免此问

56、题,研究者提出 AICc 指标,在 AIC 上添加小样本误差修正量。基于条件期望模型的 AICc 计算公式如下: = (|) + 2 +2 ( + 1) 1外生变量筛选流程样本区间内筛选外生变量流程如下图所示,具体步骤为:最优外生变量集合 S0 初始为空集,AICc 初始值 AICc0Tlog(|XX|);遍历不在 Si 中的每个外生变量 k,计算将 k 加入到集合 Si 后模型 AICc 值,取最小值AICcmin;若 AICcmin 小于 AICci,则转向第 4 步;否则筛选结束,集合 Si 为最优外生变量集合;将 AICcmin 对应的外生变量 k 加入 Si,即 Si+1Sik,AI

57、Cci+1 为基于外生变量集合 Si+1 计算得到的 AICc,并转至第 2 步。图表32: 外生变量筛选流程图:回归预测模型构建对于每个大类风格因子,取样本区间为过去 72 个月,分三步预测未来一个月 Rank IC 值:使用 AICc 在样本区间内筛选出对因子 Rank IC 值具有解释能力的外生变量;将筛选出来的全部外生变量纳入回归模型,在样本区间内构造因子 Rank IC 值序列关于外生变量的多元线性回归模型;将最新一期的外生变量代入回归模型,得到未来一个月的因子 Rank IC 预测值。外生变量预测结果外生变量对大类风格因子 8 月 Rank IC 预测结果如下图所示。反转、波动率及

58、换手率因子 Rank IC 预测值超过 6%,可能较为有效,建议短期看多上述因子表现;不看好小市值、 Beta、技术因子未来一个月表现,上述因子表现可能受宏观环境制约。图表33: 外生变量对大类风格因子 8 月 Rank IC 预测值9.3%7.9%6.4%5.6%5.2%4.7%3.5%3.0%0.9%-0.4%10%8%6%4%2%0%-2%估成盈值长利财小反波换技Beta务市转动手术质值率率量:,预测因子预测结果解读下面展示各个大类风格因子 Rank IC 预测值,以及进入回归模型的外生变量对预测结果的贡献情况,贡献度定义为自变量与回归系数的乘积。图表34: 估值因子 Rank IC 预

59、测值及外生变量贡献情况图表35: 成长因子 Rank IC 预测值及外生变量贡献情况4.7%5.1%估值-0.4% 0.0%成长3.5%3.1%0.4%6%4%4%3%2%0%-2%IC预测值2%1%回沪国300归深债0%PPI模收预回同型益测归IC比截月率模10距波期 差值型项动截率年距-3期项月:,预测:,预测图表36: 盈利因子 Rank IC 预测值及外生变量贡献情况图表37: 财务质量因子 Rank IC 预测值及外生变量贡献情况盈利2.8%2.4%6%5.6%4%2%0%预回沪300IC测归深模值型截月距均项换手率6%5%4%3%2%1%0%-1%-2%-3%-4%IC预测值财务质

60、量5.2%1.2%-2.8%回中500归证模型截月距均项换手率:,预测:,预测图表38: 小市值因子 Rank IC 预测值及外生变量贡献情况图表39: 反转因子 Rank IC 预测值及外生变量贡献情况1.0%反转7.9%7.0%0.9%10%小市值0.9%0.9%8%6%0.5%4%2%0.0%IC预测值0%CPI回预回IC归测归模模当型值型月截截同距距比项项:,预测:,预测图表40: 波动率因子 Rank IC 预测值及外生变量贡献情况图表41: 换手率因子 Rank IC 预测值及外生变量贡献情况8.1%波动率6.4%1.4%-1.0%0.0% -1.5%-0.6%换手率9.3%8.6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论