2023年中期投资策略报告:基本面量化与AI智能的融合之道_第1页
2023年中期投资策略报告:基本面量化与AI智能的融合之道_第2页
2023年中期投资策略报告:基本面量化与AI智能的融合之道_第3页
2023年中期投资策略报告:基本面量化与AI智能的融合之道_第4页
2023年中期投资策略报告:基本面量化与AI智能的融合之道_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

——2023年中期投资策略报告核心观点根据宏观因子跟踪体系,经济乐观预期需适度降温,但自上而下A股仍值得超配,主板(价值风格)有望在更长时间延续强势。六维度综合行业配置模型2022年2月对外跟踪以来,累计收益率17.30%,相对行业等权超额19.06%,仍是稳健的行业比较体系,但2023年中美经济显著分化后,将对行业表现特征产生历史性干扰,务必提前思考与调整。基于多维度定量增强及人工智能算法的选股策略成为机构化时代下的新方向。以面向实盘策略而开发的多维度量化模型整合,今年以来主动权益FOF策略相对基准超额13.31%,ETF组合相对基准超表现强劲。市场研判:经济乐观预期需适度降温,但自上而下A股仍值得超配宏观因子中,跨市场全球宏观因子体系表现回顾:近期增长类因子的美国增长、欧洲增长以下行为主,中国增长短期折返,总体来看欧美库存周期中期下行、中国内生经济中期向上不变;金融条件类因子短期略有收紧;原油供给因子近期震荡为主。预计5-6月国内处于普林格六周期的阶段二,建议配置股票。中债久期择时组合最新建议为维持短久期防御配置。根据我们的A股上市公司业绩跟踪体系,一季报情况显示当前基本面尚不支持全面牛市的到来,建议精选受益于中国经济内生增长的超预期个股。行业比较方法论:量化视角下的多体系行业跟踪宏观因子方面,我们选择了多维度的宏观指标,对每个行业采用逐步回归法构建模型进行预测,按照预测值选前3行业的组合,2018。行业基本面方面,通过梳理行业逻辑,筛选重要指标,选择其中和行业ROE、超额收益都具有高相关的指标构造单行业量化基本面择时策略,各行业的多空年化收益率均高于12%。财务指标方面,基于正式财报信息构建行业财务指标,测试表明盈利和成长能力相关指标及其边际变化对行业的选择有参考意义。我们构造的复合财务因子,第一分组年化超额收益7.16%,夏普比率0.33。业成分股预期ROE上调比例、行业ROE变化值因子,超额收益率超过5%,夏普比率接近0.3。基金资金流方面,基于有约束的半衰加权Lasso约束回归对股票型基金进行仓位估算,并基于此构造动量策略,使用过去半年至过去一个月板块变动最大的板块构造持有一个月的多头。策略从2011年至今年化超额收益率7.84%。行业比较新思考:中美经济持续分化对行业配置影响深远从中信一级各行业指数月度表现分析,2020年9月以来,以家电,地产为主的地产链以及以食品饮料为主的消费板块继续维持了与中国本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请参阅最后一页的重要声明。丁鲁明丁鲁明dinglumingAC编号:S1440515020001段潇儒ucsccomc808SAC编号:S1440520070005王超dcqcsccomc808SAC编号:S1440522120002相关研究报告金融工程研究报告页的重要声明PMI的正相关关系,但以煤炭,有色为代表的上游周期行业则呈现与美国PMI的正相关。需正确面对本轮中国经济复苏的行业受益特征与历史的显著变化。业绩报回顾:主板中小市值板块分化,非银地产等行业业绩增速环比增长超20%采用超预期因子作衡量当期宽基指数表现,指标显示主板超预期而中小市值板块低于预期。在2023Q1中业绩增速环比正增长的风格板块包括周期二、金融和成长,前二者的业绩增速环比增长在10%以上。2023Q1业绩增速环比增长前五的行业为非银行金融,房地产,电力及公用事业,电力设备及新能源,传媒,其业绩增速环比增长均在20%以上。量化选股:沪深300内量化精选组合年化超额收益20.79%我们通过有效性检验精选有效因子,并结合六维度行业轮动ETF组合结果,实现对好行业+好个股的优中选优,构建了沪深300内量化精选组合从2016年2月至今,年化收益25.88%,相对沪深300年化超额收益20.79%,最大回撤32.19%,信息比1.85%。今年以来(截止4月30日),策略绝对收益7.55%,相对超额3.34%。人工智能:AlphaZero:基于AutoML-Zero的高频数据低频化因子挖掘框架基于Google的AutoML-Zero算法,将其应用到因子挖掘领域构建了AlphaZero框架,通过构建基础算子以及因子,结合进化算法进行高频低频化因子挖掘。构建AlphaZero时,我们限制了搜索空间以及优化了算子结构,提高了进化效率,但是另一方面也限制了所生成程序的可能性。从最终的结果我们也可以看出,挖掘出的因子也是在经典量价因子的基础上进行了一定的变异。人工智能:基于openFE的基本面因子挖掘框架基于openFE的基本面因子挖掘方法,将三大报表的数据以及基础算子之间按照一定结构进行排列组合,构建出70万个不同风格类型的因子,再利用openFE的两步筛选法,选出不同风格类型下表现最好的合成因子。对比因子的表现,动量,市值,行业最为重要,其次为估值及成长因子,质量因子表现较为一般。利用构造的合成因子以及基础因子训练月频的选股模型,回测区间内,全市场内选股的年化超额为21%,夏普比率为.19。人工智能:如何部署本地版大语言模型提高研究效率对于金融工程研究而言,除了日常的网页版交互,通过ChatGPT的API接口能够使研究工作效率极大提高。随着各类技术的应用,本地化部署开源大语言模型框架也得以实现。我们介绍了如何本地部署开源大语言模型Vicuna,能够在程序中调用各类模型,提高研究工作效率。面向实盘应用:六维度行业轮动模型对外跟踪以来超额收益率19.06%,今年以来超额6.78%根据自上而下,结合宏观、量化基本面、财务因子、分析师预期、机构偏好、量价技术和资金流等维度,我们构建了六维度综合行业配置模型。自2022年2月开始对外跟踪以来,模型累计收益率17.30%,相对行业等权超额收益19.06%,今年以来模型收益率12.3%,相对行业等权超额6.78%。面向实盘应用:今年以来行业轮动主动权益FOF策略超额13.31%,ETF-FOF超额6.68%我们建立了基于规划求解的方案,将效果优秀的六维度行业轮动模型应用至基金选择上。今年以来主动权益FOF策略相对主动权益基金累计超额收益13.31%,ETF组合绝对收益相对股票指数基金超额收益6.68%。风险提示:模型为历史数据,存在失效可能。金融工程研究报告页的重要声明 金融工程研究报告 2023.4.30) 27 图表45:组合各年收益(截至报告期末) 29 图表47:组合净值走势(截至报告期末) 30图表48:组合各年收益(截至报告期末) 30 金融工程研究报告页的重要声明图表50:组合净值走势(截至报告期末) 31图表51:组合各年收益(截至报告期末) 31 金融工程研究报告页的重要声明1300.624-20520505美国增长因子同比20020R²=6-426300.624-20520505美国增长因子同比20020R²=6-426一、宏观因子体系下的资产配置框架与观点更新我们构建了自上而下从宏观大类资产到细分板块的研究跟踪体系。包括跨市场的全球宏观因子体系,基于风险平价策略的战略配置组合,基于普林格周期理论的策略的战术配置组合。对债券类资产构造了中债久期择时策略;对股票类资产构建了A股上市公司业绩跟踪体系。不变经济增长类因子中,美国增长最新值为-0.86,近四周小幅上行0.14,分项驱动信号主要来自汇率、权益市场,短期震荡下行;欧洲增长最新值为-0.56、近四周小幅上行0.27,驱动信号来自汇率、权益市场;结合制造业PMI来看,欧美增长中期回落趋势不变,体现的是库存周期下行的力量。中国增长反弹收敛,最新值为-1.28,近四周下行-0.51,分项信号来自汇率、商品等市场,结合PMI来看,短期经济修复有所折返,中期仍是内生上行趋势。美国增长ISM制造业PMI(右)5.00704.003.002.00.000.00-2.006560555045-3.0040数据来源:wind、中信建投ISM制造业PMI同比0数据来源:wind、中信建投3.002.00.000.00-2.00-3.00欧洲增长欧元区制造业PMI3.002.00.000.00-2.00-3.004.00数据来源:wind、中信建投656055504540欧元区制造业PMI同比40RR²=06-46-42244欧洲增长欧洲增长因子同比2-2-数据来源:wind、中信建投金融工程研究报告页的重要声明2505中国增长因子同比505中国增长因子同比501.000.500.00-0.50-2.00-2.50-3.00中国增长官方制造业PMI501.000.500.00-0.50-2.00-2.50-3.002.00数据来源:wind、中信建投535251504948474645官方制造业PMI同比20RR²=0.60-644-244-20数据来源:wind、中信建投金融条件类因子中,美国、欧洲、中国的金融条件指数最新值分别为1.2、2.2和0.6,近四周分别上升0.11、0.16、0.33,总体来看,在海外加息预期小幅上升,国内资金利率短期上行的背景下,金融条件略有收6543210数据来源:wind、中信建投选取对涵盖股票、债券、商品三大类的7种国内资产,构建基于资产和基于主成分宏观因子的月频调仓风险平价策略,其中后者是宏观因子在资产配置中,仅基于风险进行配置的应用。选取的具体标的为:权益资产中的沪深300全收益、中证1000全收益指数,债券资产中的中债国债总财富1-3年指数、中债国债总财富3-5年指数、中债国债总财富7-10年指数及中债信用债总财富指数,商品期货中的金指数。金融工程研究报告页的重要声明3每月末求解各资产的权重,使得各资产对组合的风险贡献相等,具体参见《理论与应用指南:风险平价详解》一文。从策略的表现来看,自2010年3月以来,风险平价策略取得了3.88%的年化收益率,年化波动率1.78%,最大回撤-2.37%,夏普比率2.18,月度胜率74%,双边年化换手率38.6%。策略最近12个月收益率3.3%,最大回撤-0.31%。90%80%70%60%50%40%30%20%10%0%沪深300中证1000中债国债总财富1-3年中债国债总财富3-5年中债国债总财富7-10年中债信用债总财富策略净值(右)1.9数据来源:wind、中信建投化率73%数据来源:wind、中信建投2023年5月,策略在沪深300、中证1000上的权重分别为1.95%和1.21%,在债券资产中选择中债国债总财富1-3年、3-5年、7-10年指数和中债信用债总财富指数上的权重分别为31.61%、16.88%、12.58%和32.79%,在沪金上的配置比例为2.98%。普林格周期脱胎于美林时钟模型,在美林时钟模型增长/通胀的基础上加入信贷指标来更好的适应货币主义时代。在普林格周期中,使用先行指标(M1、M2同比),同步指标(GDP同比、工业增加值同比),滞后指标(PPI同比)三个指标来衡量经济周期,将经济周期划分为六个阶段,并计算了在上述各个阶段中各类资产的回报率和股票不同风格回报率,结果表明,在经济周期各个阶段的轮换中,不论是大类资产还是股票风格,其收益率均有所分化,优势品种有超越大市的表现,具体周期划分以及表现如下图。金融工程研究报告页的重要声明4数据来源:wind、中信建投在经济周期第一阶段,央行仍实行宽松的货币政策,继续增加货币供应量,推行各种财政政策刺激经济。从资产配置的角度看,此时一般短期利率会上行,同时债市经历熊市之后也将迎来拐点,因此债券与现金成为这一时刻的优质资产。但是在这一阶段,生产与通胀仍处于下降区间,高波动资产依然有相当高的风险,不建在经济周期第二阶段,通货膨胀继续回落,GDP增长率开始上升,虽然闲置的生产力还没有完全的利用起来,但企业的利润率已企稳开始回升,同时央行为了使经济全面恢复会持续增加货币供给。从资产配置的角度看,这时权益市场筑底完成,是配置的最佳时期,建议高配。在经济周期第三阶段,三指标同步上行,经济全面恢复,企业利润率高速上行。从资产配置角度看,此时各行各业生产力火力全开,对原材料需求较高,商品迎来行情,此使股票受益于企业基本面快速抬升以及经济上行的预期会获得普涨,此阶段建议高配股票和商品。在经济周期第四阶段,生产增长开始减缓,通货膨胀上升。GDP增长虽然在上升,但增速已明显放缓,为抑制过热的投资,央行开始加息减少货币供应量。从资产配置角度看,由于股票投资收益依赖企业的利润率和利率水平,商品是最佳的资产配置选择,同时股票也有一定的配置价值,但是需要重点关注盈利支撑。在经济周期第五阶段,GDP增长降低到长期增长趋势以下,但是通货膨胀依然继续上升,经济进入滞胀阶段。从资产配置角度看,权益市场已经疲态初现,不建议配置,而商品处于最后的疯狂,可以配置但是有一定的风险,此时黄金成为最优资产。在经济周期第六阶段,三指标同步下行,经济增长严重乏力,从而导致了通货膨胀开始下降,企业利润率也遭遇滑铁卢。从资产配置角度看,此时建议配置避险属性明显的黄金与债券,其中债券以现金更优。改进版普林格周期配置建议跟踪根据我们的改进版普林格周期,普林格六周期信号更新:阶段2,预计持续到6月前后。当前市场流动性有所改善,先行指标预计上行。2022年12月以来,疫情快速过峰,全国各行各业开始复苏,春节期间第三产业相关行业迎来报复性反弹,预计同步指标触底回升,正式进入上升区间。当前物价开始回落,滞后指标下行。建议配置股票。金融工程研究报告页的重要声明5根据我们改进的普林格周期理论构建的策略,过去7年年化收益21.33%,夏普比率1.66,最大回撤-6.38%,分年来看,过去7年策略均获得正收益。.50.005000002016-012017-012018-012019-012020-012021-012022-012023-01数据来源:wind、中信建投1%4%%7%5.71%54%%67%%6%3.438%数据来源:wind、中信建投中债久期择时策略为季度调仓,每季度末选择未来一年预期收益率最高的期限品种进行集中持仓,当策略一段时间表现不佳时选择将持仓信号改为动量信号,即选择过去一段时间表现较好的品种进行集种持仓。金融工程研究报告页的重要声明62014/3/12014/8/12015/1/12015/6/12015/11/12016/4/12016/9/12017/2/12017/7/12017/12/12018/5/12018/10/12019/3/12019/8/12020/1/12020/6/12020/11/12021/4/12021/9/12022/2/12022/7/12014/3/12014/8/12015/1/12015/6/12015/11/12016/4/12016/9/12017/2/12017/7/12017/12/12018/5/12018/10/12019/3/12019/8/12020/1/12020/6/12020/11/12021/4/12021/9/12022/2/12022/7/12022/12/12023/5/1中债久期择时中债中债久期择时1数据来源:wind、中信建投2022年11月30日开始样本外跟踪,截至2023年4月底,中债久期择时策略累计绝对收益1.03%。我们基于2023年3月底模型信号对2023年二季度持仓进行决策,中债久期择时策略选择货币型市场基金(银华日利)进行持仓。数据来源:wind、中信建投根据A股上市公司业绩跟踪体系,沪深300,创业板指超预期值低于同期均值,中证500超预期值高于同期均值,但正向超预期来自少数个股的集中贡献,指数整体超预期情况并不稳定。从一季报来看,三大指数的超预期程度并不乐观,尤其主板一季报低于预期说明中美经济分化下海外经济对主板影响也比我们此前预期更高,不过考虑到四月份中国GDP等指标迎来利好,上市公司业绩有望在二季度持续回升。一季报情况显示当前基本面尚不支持全面牛市的到来,建议精选受益于中国经济内生增长的超预期个股。通过回测,最近5年(2018年-2022年)我们的A股指数择时模型沪深300择时准确度为75%,中证500择时准确度为60%,创业板指择时准确度为45%。金融工程研究报告页的重要声明7数据来源:wind、中信建投二、量化视角下的行业比较与展望我们根据自上而下的宏观、财务指标、行业量化基本面、分析师预期、机构持仓、量价等多维信息,构建了六维度综合行业配置体系。2.1、宏观因子跟踪体系我们的宏观因子跟踪体系综合选择了多维度的宏观因子,包括:反映房地产开发进度的房地产开发投资累计同比,反映工业企业利润的PPI和工业增加值,反映国内物价情况的CPI和生猪均价,反映美国物价指数的CRB指数,反映国内经济增长情况的名义GDP和实际GDP,反映国内货币发行情况的M1,M2和社融增速,反映国内债券市场流动性的10年期国债收益率,信用利差,期限利差,反映美国债券市场流动性的10年期美债收益率,反映A股市场估值水平的EP(除金融市盈率倒数),DP(上证红利指数股息率),反映A股市场活跃度的上证指数波动率。我们模型构建的方法采用逐步回归法,对每个中信一级行业(除综合金融)构建对应模型,按照预测值选前3行业组合,2018年1月到2023年4月相对行业等权累计超额190.5%,年化超额22.13%。金融工程研究报告页的重要声明8资料来源:Wind,中信建投2.2、行业基本面跟踪体系行业的一个基本面信息来自中观的量化基本面。我们通过构造量化基本面指标,对单个行业进行择时,具体方法为:通过阅读行业研究深度报告,厘清行业逻辑和重要指标,构建待选指标池,测试其中的指标和ROE的相关性,选取和ROE相关性高的指标计算和行业相对万得全A指数超额收益的相关性;最后选择和ROE、行业超额收益都高相关的指标构造单行业择时策略。此前已经完成了包括煤炭、钢铁、有色金属、农林牧渔、建材、化工、家电等行业的中观择时研究,其对应的择时指标概览如下表,各行业的多空年化收益率均高于12%。。/逻辑-----号2.3、财务指标跟踪体系财务因子对应行业基本面信息的实际值。金融工程研究报告页的重要声明9根据最新可得的实际财务数据,我们梳理了涵盖偿债能力、成长能力、收益质量、现金流量、盈利能力、营运能力、资本结构等七个维度,总计49个财务指标。由于多数财务指标的逻辑对金融地产相关行业适用性较低,针对中信一级行业构建财务因子(包括下文的分析师预期指标)时,不包含银行、非银行金融、房地产、综合金融四个行业。考虑到权益市场边际定价的特征,并且财务指标都是比率值或增长率类数值,其一阶差分和二阶差分计算方便且可以横向比较。因此对每个财务指标,在使用指标原始数值作为因子的基础上,我们进一步计算其环比增量因子、二阶差分因子。总体来看,对财务指标因子的测试表明,就行业之间的横向比较和优选而言,较为有效的财务指标类别包括盈利能力和成长能力类的环比增量因子,以及成长能力类的原始因子;即盈利和成长能力相关指标及其边际变化对行业的选择有重要参考意义。额空年化空夏性34958%量因子10866%金融工程研究报告页的重要声明上述财务单因子中,对同一指标类型、同一构建方式下的不同因子,存在相关系数较高的情况下,保留其中夏普比率较高的多头组合,及夏普比率、胜率综合较高的第1或5组组合。根据表中的组合构建符合因子的方式为:对符号多头组合,各组合的持仓行业赋予权重1,非持仓行业赋值0,对分组组合,各组合的持仓行业赋予权重0.5,非持仓行业赋值0,从而得到单期各行业的复合财务因子。根据复合财务因子对行业从高到低分5组测试,当出现单期排名相同的情况时,向前追溯往期得分,直至可以完全区分各因行业的排序为止,将最终的排名作为分组依据。从下图来看,复合财务因子整体呈较好的单调性,2007年8月以来,第一组组合年化超额收益率最高,为7.16%,夏普比率达0.326,最大回撤相对更小;第五组表现最差,严格的单调性在第三四组之间被打破,二者的表现在历史大部分时间中非常接近。(%)(%))(%)%)第1组9.9230.420.326-64.7459.097.162组3组77.454组5.455组43770我们分别计算单季度ROE数值、单季度ROE环比增量、ROE-TTM数值、ROE-TTM环比增值四种类型的实际行业ROE因子,并使用不同的报告期作为数据计算节点:历史_报告期0(与实际财务数据完全可得的最新报告期)、未来_报告期1(历史报告期0的下一报告期)、未来_自然季0/1/2(计算时点所属季度对应的报告期或以此向后顺延1-2个报告期)。其中,历史_报告期0为实际类因子,其余四种报告期的计算均使用了未来信息。我们对未来的ROE,计算行业预期ROE的上调比例/环比变化因子,选择取值前4的行业构造多头策略,各因子的多头组合表现如下表。预期调整类的ROE因子的表现明显好于行业预期ROE数值因子,其中各有一个因子的年化超额收益率超过5%,夏普比率接近0.3。金融工程研究报告页的重要声明率520372969349在行业轮动的探索上,我们认为公募股票型基金的基金经理对板块仓位的看法体现着市场关注的焦点,如果能够构造指标反应基金经理对板块轮动的方向把握并跟踪,就可以跟随市场上最优秀的基金经理进行行业轮动从而获取超额收益。而公募基金的全持仓披露存在两个问题:一是存在滞后性,公募基金半年报及年报披露期相较于披露时点有两个月以上的延迟,二是频率过低仅有6月和12月披露,这导致很难使用现有数据构造因此我们基于基金仓位估算结果构造行业轮动模型,在基金仓位估算部分,基金池选择并入二级分类18个月以上的普通股票型基金和偏股混合型基金。由于中信一级行业分类共有30个,短期内会出现同涨同跌情况,使用回归时共线性问题会导致对行业仓位的估算出现较大误差,所以我们将30个中信一级行业分类人为降维至10个板块进行分析。成长金融稳定消费I消费II新能源车制造周期I周期II综合传媒房地产电力及公用事业纺织服装家电电力设备及新能源国防军工钢铁建材综合非银行金融交通运输商贸零售农林牧渔汽车机械基础化工建筑综合金融计算机银行食品饮料煤炭轻工制造通信消费者服务石油石化有色金属数据来源:Wind、中信建投我们使用估算板块仓位构造动量策略,使用过去半年至过去一个月板块变动最大的板块构造持有一个月的多头,为了防止通道效应,策略分为4通道。策略相对十个板块平均持有,从2011年至今年化超额收益率7.84%,多空收益年化14.55%。今年以来多头相对板块基准超额收益1.5%,多空收益5.23%。金融工程研究报告页的重要声明数据来源:wind、中信建投三、中美分化情景的量化基本面分解本节内主要容是我们各体系之外,是康波视角下中美独立经济分化下的大胆推演和模型补充。2020年9月中国房地产“三条红线政策”拉开了中美PMI彻底分化的序幕,2023年中国官方制造业PMI正在刷新10年新高,美国PMI则持续下行至2008年次贷危机以来最低水平(除2020年4月新冠事件),两者正呈现A股33年历史上最大分化,经济分化仍将继续拉大。金融工程研究报告页的重要声明数据来源:wind、中信建投我们选取各中信一级行业较大市值的1/2个股作为行业大市值代表并计算2018年3月中美贸易战以来行业机械,汽车,电子,计算机,轻工,通信,非银金融,食品饮料与中国PMI正相关。基础化工,汽车,石油石化,钢铁与美国PMI正相关,通信与美国PMI负相关。其中2018年3月中美贸易战以来,通信是唯一行业表现与中国PMI正相关,与美国PMI负相关。这一现象也一定程度解释了今年以来三大运营商较为优异的表现。数据来源:wind、中信建投金融工程研究报告页的重要声明我们选取中信一级行业绝对收益作为各行业代表计算2020年9月以来与中美PMI相关性,结果表明:钢石油石化,煤炭,有色,电力,钢铁,基础化工,电力设备及新能源,电子与美国PMI正相关。从中信一级各行业指数月度表现分析,2020年9月以来,以家电,地产为主的地产链以及以食品饮料为主的消费板块继续维持了与中国PMI的正相关关系,但以煤炭,有色为代表的上游周期行业则呈现与美国PMI的正相关。需正确面对本轮中国经济复苏的行业受益特征与历史的显著变化。数据来源:wind、中信建投在4月12日外发的报告《A股重大变局,中美PMI大分化后的行业配置浅思》中,我们采用超预期因子作为衡量当期宽基指数表现的指标,以是否超过超预期因子季节性阈值为目标来确定宽基指数整体表现是否超10日2023年一季报预告及公告信息,沪深300,中证500,创业板指和创业板综的业绩披露及各自阈值对比结果显示主板超预期而中小市值板块低于预期。具体表现为:沪深300板块超预期,中证500、创业板均低于预期。主板的业绩情况较为乐观,值得重点推荐,中小市值板块一季报业绩初现不及预期的趋势需重点跟踪关注。而后4月21日的超预期结果,主板最终低于预期出乎我们预料,中证500超预期值高于同期均值,但正向超预期来自少数个股的大幅超预期,指数整体超预期情况并不稳定,创业板综和创业板指依然处于低于预期状金融工程研究报告页的重要声明数据来源:wind、中信建投,创业板综当月绝对收益-2.60%,4月份随着一季报发布期的密集到来,之前表现低迷的主板相对表现优异,之前表现亮眼的中小市值板块受业绩压力表现有所回调。数据来源:wind、中信建投金融工程研究报告页的重要声明Q4Q1绩增速变化18%59%03%.62%.15%53%车8.15%6.99%72%34%.78%.30%资料来源:Wind,中信建投我们将A股市场个股按照内在相关性划分为10个风格板块,在业绩增速计算上采用剔除亏损样本后的整体法进行评估,在2023Q1中业绩增速环比正增长的风格板块包括周期二、金融和成长,其中周期二和金融板块业绩增速环比增长在10%以上。周期二板块包括建筑,建材,轻工制造三个行业。金融板块包括地产,非银金融,地产三个行业。成长板块包括传媒,电子,计算机,通信四个行业数据来源:Wind、中信建投金融工程研究报告页的重要声明在中信一级行业中,在业绩增速计算上继续采用剔除亏损样本后的整体法进行评估,2023Q1业绩增速环比正增长的前五行业为非银行金融,房地产,电力及公用事业,电力设备及新能源,传媒,以上行业业绩增速环比增长均在20%以上。其中还应注意部分风格子版块的独立崛起现象,比如传媒在今年行情表现突出的TMT板块中业绩增速环比表现尤其领先,电力及公用事业在交通运输板块业绩增速环比表现突出,建筑在周期二板块中业绩增速环比表现具备优势。四、选股策略一一机构博弈下的技术破局在市场alpha难度大幅提升的背景下下,我们仍根据机构博弈市场的潜在规律挖掘到了继续高度有效的选股策略,并大胆尝试新AI技术的投资应用。中信建投的多因子组合基于常见的大类因子以及分析师因子构建,通过有效性检验精选有效因子,并结合中信建投的六维度行业轮动ETF组合结果,从实现对好行业+好个股的优中选优。沪深300内量化精选组合从2016年2月至今,年化收益25.88%,相对沪深300年化超额收益20.79%,最%。今年以来(截止4月30日),策略绝对收益7.55%,相对超额3.34%。数据来源:Wind、中信建投金融工程研究报告页的重要声明摩根持仓策略基于北向机构托管持仓因子的检验,筛选出具有显著alpha收益的机构,定期追踪其持仓以及增持股票,构建的复合策略。数据来源:Wind、中信建投光伏增强策略在光伏行业中,对10大类300多个因子进行检验,筛选出表现较好的风格中最突出的因子,构建光伏行业多因子组合,策略具有显著的收益。数据来源:Wind、中信建投金融工程研究报告页的重要声明基本面OPENFE策略基于openFE基本面因子挖掘,将三大报表的数据以及基础算子之间按照一定的结构进行排列组合,构建出70万个不同风格类型的因子,再利用openFE的两步筛选法,筛选出不同风格类型下表现最好的合成因子。利用构造的合成因子以及基础因子,训练月频的选股模型,策略收益较为显著。数据来源:Wind、中信建投近一周收益率近一月收益率今年以来收益率近一年收益率近一周相对收益率近一月相对收益率今年以来相对收益率近一年相对收益率摩根持仓0.67%-0.18%8.99%23.75%0.82%0.13%2.41%11.59%光伏增强-1.45%-12.85%-4.68%11.17%-0.07%-5.98%4.30%10.24%基本面OPENFE2.27%-2.30%6.89%38.15%2.45%-1.51%1.88%26.08%数据来源:Wind、中信建投在量化研究中,因子构建是模型的基石,因子的好坏直接决定了策略的收益率,因此因子挖掘历来是量化研究的重点。传统的经验为主的因子挖掘方式经历几十年的发展,早已进入了瓶颈期,因子拥挤度不断增加,在经历市场风格切换时非常容易发生踩踏,导致大幅回撤。金融工程研究报告页的重要声明对于人工智能在因子挖掘中的应用,目前主要还是停留在遗传规模的方法基础上。近几年机器学习发展迅速,以AutoML为代表的特征工程以及模型搭建也早以在工业界实现了广泛应用。本文我们尝试将GoogleBrain团队提出的AutoML-Zero模型应用与因子挖掘领域,结合实际情况对模型做了相应的修改,构建了AlphaZero框架。AlphaZero主要是对因子的可解释性,因子挖掘的效率,以及因子的多样性上做了相应的优化,最终的框架不仅能够应用于批量因子的生成,也能够应用于现有因子的改进。haZero传统的因子挖掘以人工构建和以遗传规划为代表的机器挖掘为主,我们在之前的报告中也曾尝试过将遗传规划与分析师因子结合进行因子挖掘。AutoML-Zero为因子挖掘提供了新的思路,本文我们在AutoML-Zero的基础上,构建了AlphaZero的因子挖掘框架。与所有进化算法面临的问题一样,AlphaZero同样面临适应度,进化效率以及物种多样性三者之间的不可能三角问题,即不能够同时满足种群适应度较高,进化效率快,以及种群具有较好的多样性的条件。在实际问题中,需要做相应的取舍。在AlphaZero中,对于三者我们分别采取了一定的优化,从而能够在较高的效率下实现因子的挖掘。与传统的遗传规划以及AutoML-Zero相比,AlphaZero在挖掘的效率以及因子的可解释性上做了更多的优化,首先,我们对所有数据采用了量纲化处理,避免了在因子挖掘中经常出现的不同量纲之间的因子运算,并且我们要求最终生成的因子为无量纲因子,这样使得因子可解释性问题有所缓解。其次,对于合成因子的长度我们也进行了限制,避免了因子计算过于复杂,容易导致的过拟合问题。与AutoML-Zero不同的是,由于计算效率的差距,以及金融数据的实际问题,我们并没有简单的四则运算作为基础算子,而是在此基础上,加入了更多因子构建时常用的算子。在搜索空间上,不同于AutoML-Zero的无关联搜索,我们限制了所有的变异均需要与原有的代码有关联,即所有在图结构上的改动均与原有的边或者节点相关联。通过这两项改动,能够极大的提高进化的效率。与AutoML-Zero类似,我们将基础数据分为三类;向量v:中证全指日频涨跌幅,振幅,换手率,上涨股票占比价,成交量为了使得合成的因子具有一定的可解释性,每类数据都标有相应的量纲(高开低收量纲为元,成交量量纲为手,其他无量纲),在后续计算中,只有特定的量纲之间能够进行合法运算。所有算子分为三类,分别是元素运算符,时间序列运算符以及横截面运算符。在算子的构建上,尽量选择基础算子,通过个体在搜索空间内的不断进化,构建出最终适应度较高的种群。金融工程研究报告页的重要声明资料来源:中信建投在矩阵数据中,存在不同频率的数据,需要首先通过时间序列算子将分钟频率的数据降频的日频,然后进一步进行运算。对于种群而言,我们更关注整个种群的统计值,下图展示了进化轮数与种群个体的平均IC以及最大个体IC的关系,可以看出,随着轮数增大,种群的平均IC会不断增加,而IC最大的个体变异导致的IC增加存在一定的几率发生,因此会出现几轮不变的情况。种群的平均IC会出现定期下滑的情况,正式由于我们的灾难算法删除了部分相似个体导致的结果,但是很快种群的IC会得到恢复。金融工程研究报告页的重要声明数据来源:中信建投从整体种群的表现来看,AlphaZero能够有效的批量生成因子,对于个体而言,样本内适应度最高的个体IC达到了0.08。因子在样本外的表现同样突出,以以下因子为例:Alpha1因子一的定义为:ts_norm(cs_norm(HIGH),20)因子一的定义较为简单,为改进后的反转因子,代表了股票最高价的横截面排序的20日时间序列标准化,排序相对于过去20天的排名越低,未来收益越高。因子的IC均值为-0.0366,IR为4.38。因子胜率为61.22%(小于0占比)。从IC的时间序列来看,因子在大部分时间均处于负向IC区间,在4月份有过明显的反转。从因子的分组收益率可以看出,多头组自19年起,累计收益118%,空头组的累计收益为-16%,多空年化收益26.17%,多头组的年化收益为23.77%。Alpha2因子二的定义为:ts_max((ts_min(interval(volume,sum,9:30,10:00)/VOLUME,2)+ts_corr(high,volume,240)),5)因子二是开盘后半小时成交量占比的两日最小值与日内的最高价与成交量的相关性求和之后取五日最大值得到的因子,很明显,此因子是由原始开盘后半小时成交量占比因子与最高价成交量相关性两个因子的基因进化得到的合成因子。因子二的IC均值为-0.0367,IR为7.33,因子胜率为68.21%,因子二的稳定性和胜率显著高于因子一。从因子的分组收益率可以看出,多头组自19年起,累计收益103%,空头组的累计收益为-7%,多空年化收益22.51%,多头组的年化收益为21.39%。金融工程研究报告页的重要声明深度学习,启发式算法以及枚举法分别代表了三种因子挖掘中的方法,深度学习法的优点在于效率较好且样本内效果最好,缺点是生成的因子无法解释且要求算子可导。启发式算法效率介于枚举法和深度学习之间,能够生成批量因子,因子解释性一般,无法保证找到全局最优。枚举法是一种暴力算法,一般生成的因子形式都较为简单,可解释性较好,生成因子数量较多,导致逐一检验时效率较低,因此需要对因子检验的效率进行openFE是一种基于枚举法的Expand-And-Reduce框架,能够高效的检验大量因子(>106)。习算法Alpha60,openFE子数量景>10阶<10阶<5阶效果严格(可导)无无资料来源:中信建投证券不同于AlphaZero用于量价因子挖掘,openFE生成的因子结构较为简单,可解释性较好,因此非常适合用于基本面因子挖掘。本文采用三大报表中的数据作为基础特征,在此基础上构建合成因子,通过openFE进一步筛选,保留表现较好的因子作为新的合成因子。OpenFE是一个基于枚举法的Expand-And-Reduce框架,首先通过基础特征以及算子的排列组合构建具有一定结构的风格因子。而后通过两步的筛选步骤,对因子进行筛选,保留最终特征重要性最高的因子。基础特征采用三大报表中的数据(资产负债表,损益表,现金流量表),其中资产负债表为时点数据,损益表和现金流量表为时期数据,我们将损益表和现金流量表中的数据均转为季频数据。三大报表中的字段共计有100多,大部分字段缺失值较多,对于缺失值大于10%的字段,予以剔除。利用剩下的所有字段训练一个LGBM模型,保留每张报表内重要性排名前15的因子。在这些因子的基础上,再加入市值,行业,动量(过去一个月收益率)三个对股票收益解释度非常高的因子。共计45个基础特征以及3个额外添加的特征。金融工程研究报告页的重要声明为使得因子具有较好的可解释性,采用一些较为简单的算子,包括四则运算(+,-,*,/)、同比算子(YOY)、环比算子(QOQ)、以及横截面排序算子(CSRank)。如果采用暴力方式进行排列组合,即使是简单的二阶因子,以上因子以及算子能够组合出~109个因子,难以进行处理。不同类型的风格因子往往具有一定的结构特征,例如常见的PE,PB,PS等估值因子均为简单的一阶因子,分子端净利润/净资产/主营业务收入来自三大报表,分母端为总市值。在构造估值类合成因子时,我们将其扩展为二阶因子,具体做法为分子端的单因子改为a±b的形式,其中a,b∈损益表/现金流量表/资产负债表,分abPE同理,借鉴资产负债率,ROE,净利润现金比率,PE,净利润同比增长率等因子结构,本文构建了杠杆因子,收益因子,质量因子,估值因子,成长因子共5类风格因子,因子结构如下表所示。因子均为二阶因子 (不考虑CSRank),总因子数量~70万左右。因子CSRANKab/(c±d))abcd产负债表CSRANKab/(c±d))子CSRANKab/(c±d))子arketvalueCSRANKxfayfb))资料来源:中信建投证券原始的70万因子逐一检验效率较低,openFE采用两步的筛选方法,极大的提高了筛选效率。在第一步筛选中,采用了successivehalving(连续二分法)进行单因子检验。具体做法是首先采用部分小样本,对每一类风格的所有因子进行单因子模型LGBM的训练,计算特征的模型表现。下一轮增加样本数量,保留第一次训练中表现较好的部分因子,再此进行训练,以此类推,不断增加样本数量,减少因子数量,直至用全样本训练,得到最终筛选的因子列表。012…n1…n-2…1资料来源:中信建投证券经过第一轮的单因子筛选后,保留约1/16的因子,此时因子数量依旧较多(>103),为了进一步筛选因子,且剔除因子间的相关性问题,第二轮用所有保留的合成因子以及原始的48个基础特征进行多因子模型LGBM的训练,最终利用LGBM输出所有因子的重要性排序。金融工程研究报告页的重要声明/31/30/31/30/31/1/31/2/28/3/31/4/30/5/31/6/30LGBM在计算特征重要性时有两种方式,分别为gain和split,其中gain是通过计算总的gini增益来得到特征重要性,split是计算模型中特征出现的次数来计算得到特征重要性,本文采用gain来计算特征重要性。在利用LGBM进行训练时,openFE采用featureboosing的方法计算因子的边际贡献,即首先利用基础特征计算模型的预测值y1以及效果metric1,将y1作为新的训练的初始值,用新因子训练得到y2和metric2,新因子的边际贡献为metric2-metric1。31日至2022年12月31日,每月滚动训练LGBM模型,模型的输入为过去10年的月频因子,预测目标为未来一个月收益率。训练集长度为9年,测试集为1年,按照时间先后进行切分。股票池为全A股票,剔除其中的次新股,ST股,涨跌停股票以及流动性过低的股票(日成交金额<500万或者换手率<0.02%)。每次调仓等权买票。最终策略的表现如下图所示:20/1/310/1/30.20/2/20/2/290/3/30/3/310/4/30/4/300/5/30/5/310/6/30/6/300/7/30/7/310/8/310/9/300/8/310/9/30/10/31/11/30/12/312/72/7/312/82/8/312/92/9/30/10//10/31/11//11/3010.80.6 0.4/1/31/2/28/3/31/4/30/5/31/6/30/7/31/8/31/9/302-2-0.422222222222222020202020202021/2021/2022202220222021/202220222021/2021/2022202220222021/2022202220222222222222220222022202220220.20总回报WIND全A最大回撤alpha(右轴)数据来源:WIND,中信建投证券策略的表现较为稳定,过去不到3表现如下表所示:年的时间累计收益达到91.2%,,累计超额收益达到79.4%。策略的具体金融工程研究报告页的重要声明资料来源:WIND,中信建投证券基于网页交互模式的ChatGPT对于人类的生活以及工作方式带来的极大的便利,然而这只是ChatGPT的冰山一角。API以及插件系统的开放,使得ChatGPT能够结合各种程序以及软件,让ChatGPT的应用空间充满无尽的可能性,这是真正意义上AI的iphone时刻。对于金融工程研究而言,除了日常的网页版交互完成一定的指令之外,通过API接口能够使研究工作效率极大提高。同时,随着各类技术的应用,本地化部署开源大语言模型框架也得以实现。OPENAI虽然提供了强大的API支持,能够极大的拓展ChatGPT以及其他模型的应用领域,但是大部分模型均未开源,而且在使用时存在诸多限制。除了OPENAI的ChatGPT之外,各大互联网企业也纷纷推出了自己的大预言模型,例如百度的文心一言,阿里的通义千问,商汤的商量等,与OPENAI的战略一致,这些模型也均未开源。除此之外,meta开源了LLaMA模型,清华开源了GLM模型,使得一般企业和个人能够部署和训练自己的但是大语言模型对于硬件要求极高,限制了个人用户部署自己的“ChatGPT”,随着一系列优化技术的提出,例如ZeRO、Gemini、LoRA、AutoChunk等,使得训练和部署模型的成本极大下降。各个优化模型也纷纷提出,包括Colossal-AI,Alpaca,Vicuna等,能够以较低的成本训练或者部署对话模型。使得在个人电脑上部署成为可能。本文以Vicuna模型为例,介绍如何在个人电脑上部署模型。Vicuna模型是基于LLaMA的微调模型,是由加州大学伯克利分校、CMU、斯坦福大学和加州大学圣地亚哥分校的成员共同提出的。他们从ShareGPT收集了大约7万个对话,借鉴Alpaca的微调方式,将LLaMA模型进行微调。最终实现了ChatGPT大约90%的质量,但是训练成本仅300美元左右。在本地运行以下命令加载模型:单GPU模式:python3-mfastchat.serve.cli--model-path/path/to/vicuna/weights单CPU模式:python3-mfastchat.serve.cli--model-path/path/to/vicuna/weights--devicecpu金融工程研究报告页的重要声明多GPU模式:python3-mfastchat.serve.cli--model-path/path/to/vicuna/weights--num-gpus28bit模式:python3-mfastchat.serve.cli--model-path/path/to/vicuna/weights--load-8bit五、量化策略应用场景实战化案例根据前文的思路和独立的模型,我们的最终目的是实现多策略的有效融合,以及适合机构规模的实盘化测试,本章列举了相关的实战化案例。根据自上而下,结合宏观、量化基本面、财务因子、分析师预期、机构偏好、量价技术和资金流等维度,我们构建了六维度综合行业配置模型,并自2022年2月开始对外跟踪。自2008年至初2022年4月30日,模型年化收益率为15.21%,相对行业等权组合的年化超额收益率为11.69%,除2008年以外,其余年度均获得正超额收益。2023年以来(截至4月30日),六维度行业轮动模型累计收益率为12.30%,相对行业等权超额收益率为6.78%。自2022年2月对外跟踪以来,模型累计收益率17.30%,相对行业等权超额收益19.06%。六维度综合行业轮动累计净值行业等权累计净值超额收益9876543210数据来源:Wind,中信建投金融工程研究报告页的重要声明度综合行业轮动策略.67%.77%2%5%08091011121314.0%2%15160%171819.9%3%207%7%21.6%9%222023(截至4月30日)数据来源:Wind,中信建投在如何将效果优秀的六维度行业轮动模型应用至基金选择上,我们进行了一定的探索,建立了基于规划求解的六维度行业轮动FOF组合。具体应用上,主要思想是将基金组合在各个推荐行业的暴露尽量控制相等,同时使得期望Alpha最大,同样地,为了避免部分行业主动权益基金暴露不够,基金池选择主动权益基金和指数型股票基金对组合权重规划基金池选择成立18个月以上的主动权益基金和被动指数型基金,计算可得全持仓每只基金在每个中信一级行业的持仓权重,按照每个信号行业选取相应行业占基金持仓超过60%的对应基金,每个中信行业信号之间等权重配比;若无60%以上行业,则以该行业占比最大的基金选入。其中弱约束为组合在各行业beta暴露均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论