挖掘基本面有效因子探索行业视角量化投资_第1页
挖掘基本面有效因子探索行业视角量化投资_第2页
挖掘基本面有效因子探索行业视角量化投资_第3页
挖掘基本面有效因子探索行业视角量化投资_第4页
挖掘基本面有效因子探索行业视角量化投资_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、CONTENTS目录2数据爆发+技术升级,因子挖掘为基本面量化投资新趋势基本面量化有效因子挖掘和应用(政策力度指标+行业景气指标+ESG评分指标)探索“政策力度+景气程度+ESG质量”投资新思路3金融IT投入逐年增长,券商信息技术能力或将持续提升。证券行业对信息科技重视程度不断增强,行业信息技术投入逐 年增长。2021年全行业信息技术投入金额338.20 亿元,同比增长28.7%,占2020年度营业收入的7.7%。2017年至今 证券行业在信息技术领域累计投入近1200亿元,行业持续加大信息技术领域的投入为行业数字化转型和高质量发展奠定 坚实基础。1 另类数据爆发叠加量化技术升级,数据科技驱动

2、投资值得期待资料来源:中国证券业协会,中信证券研究部资料来源:中国证券业协会,中信证券研究部2017年至2021年证券公司信息技术投入2021年信息技术投入前十证券公司0%5%10%15%20%25%30%35%05010015020025030035040020172018201920202021金额(单位:亿元)同比增长0%20%40%60%80%100%050,000100,000150,000200,000250,000信息技术投入(单位:万元)同比增长4另类数据作为新数据源,升级了过往研究方式中的信息来源。机器学习方法弥补传统模型不足,在量化领域中发挥着越来越重要的作用。1 另类数据

3、爆发叠加量化技术升级,数据科技驱动投资迎来新场景概念简介典型算法金融应用场景有监督学习算法无监督学习算法强化学习算法是从有标签的训练数据中学习模型,以便对未知或未来的处理的是无标签或结构未知的数据通过与环境的交互来提高其预测性能 数据做出预测KNN、回归模型、决策树、随机森林、逻辑回归、SVM等关联规则、K-means、主成分分析等马尔科夫决策过程、Q-learning等 股票走势预测、邮件过滤、欺诈检测用户画像、文本聚类、文章推荐量化交易有效指标挖掘应用匹配,如用于行业有效指标检验,用于行业预期收益率的 预测比较匹配,如行业影响因子聚类,将因暂未形成匹配和应用方案 子分为上涨因子和下跌因子类

4、型来源样例传统数据上市公司、交易所、指数提供商等标准化、结构化价格、成交量、财务报表等另类数据结构化或者非结构化(例如:文本、图像、视频和HTML)个人产生、网络平台、传感器、商业过 程等消费者行为、电子收据、新闻、用户点 评、天气等机器学习算法的三大类型以及相关应用场景传统数据与另类数据对比资料来源:中信证券研究部资料来源:中信证券研究部5基本面量化研究困境:财务指标被广泛应用于基本面量化策略,但存在重要信息忽视和失真现象。海量数据“因子化”不足,原始数据难以直接适用于基本面量化策略。有效因子挖掘目标:从经济活动、个人生产、投研过程产生的数据出发,基于nlp技术并结合量化分析挖掘面向投资应用

5、 因子。资料来源:麦肯锡,中信证券研究部基本面量化研究有效因子上下游1 基本面量化策略寻求破局:从财务+运营指标到核心因子挖掘CONTENTS目录6数据爆发+技术升级,因子挖掘为基本面量化投资新趋势基本面量化有效因子挖掘和应用(政策力度指标+行业景气指标+ESG评分指标)探索“政策力度+景气程度+ESG质量”投资新思路72 基本面量化研究有效因子挖掘架构资料来源:中信证券研究部基本面量化研究有效因子挖掘架构核心因子挖掘 和构建原始数据源投研应用通用基本面量化行业专精基本面量化ESG通用+行业专精基于机器学习模 型的因子分析三方数据特色另类数据集群国家统计局社媒数据万德数据彭博数据巨潮资讯网标准

6、财务数据集群投研流程数据集群分析师财务模型电话会议基于时差回归模 型的因子分析研报专家视角下的因 子挖掘8构建三大数据集群,保证投研资产数字化完整、有效、稀缺。设计代理指标程序化处理流程:季节性调整、数据标准化、缺失值处理以及口径统一处理。设计初代理指标评价筛选流程:有效时间序列长度评价、最优滞后期数评价、缺失情况评价。资料来源:中信证券研究部资料来源:中信证券研究部三大数据集群构建行业因子底层数据库行业因子程序化处理、评价筛选和入库流程2 底层三大数据集群构建:围绕投研逻辑和实际应标准财务数据集群标准财务数据、巨潮资讯网等季度特色另类数据集群经济数据国家统计局、工信部、财政 部、商务部等月度

7、政策文本数据中央、国务院、15个国家部委、17个地方省市政府周度数据源分类数据库名称数据来源更新频率公司、行业扩产指标各公司扩产能公告月度社媒数据B站、抖音、小红书等月度地产、线下门店数据贝壳、大众点评、百度地图 等月度专业数据集群行业投融资数据清科私募通月度产品价格、产销量等指标百川盈孚、卓创资讯、高工 锂电等月度ESG+专利数据轶鼎科技、专利局等月度季节性处理数据标准化+极值处理指标口径统一:月频处理、同比处理等选取有效序列大于10年的指标确定指标的最优滞后期数指标缺失值状况评价原始行业代理指标+分析师财务模型指标最终代理指标入库处理92 政策文本数据聚焦中央办公厅+国务院+各部委,向产业

8、与行业对齐资料来源:中国政府网,其他政府机构官网,wind,中信证券研究部;数据截止2022.05.31部分中信一级行业政策情绪力度年度扫描8.007.006.005.004.003.002.001.000.00-1.007.006.005.004.003.002.001.000.00部分中信一级行业政策情绪力度边际变化值20222022同比变化量(右轴/无单位)-4.00-3.00-2.00-1.000.001.002.003.002.001.000.00-1.00-2.00-3.00-4.00-5.00-6.00资料来源:中国政府网,其他政府官网,wind,中信研究;数据截止2022.05

9、.31部分中信一级行业政策情绪力度边际变化值20222022同比变化量(右轴/无单位)中信一级行业20182019202020212022房地产-0.120.77-0.13-1.405.98汽车2.481.021.871.585.35纺织服装1.001.001.970.203.61综合金融0.001.001.861.303.25交通运输0.400.111.641.192.00国防军工0.85-0.431.291.331.90基础化工0.110.573.171.471.88农林牧渔0.681.271.401.491.84机械0.910.171.470.041.81消费者服务0.821.001.7

10、71.241.68电力设备及新能源1.021.011.461.021.42电力及公用事业0.81-0.791.301.741.17家电0.881.081.221.001.14食品饮料1.020.961.550.501.14计算机0.801.000.980.961.11传媒0.621.011.800.961.09有色金属1.041.882.091.821.00商贸零售0.320.351.241.460.92石油石化-0.331.290.880.670.80建筑0.800.962.530.910.77通信0.661.061.430.910.62银行-2.60-2.14-1.06-1.900.36轻

11、工制造0.471.391.971.160.30非银行金融-0.85-0.331.020.32-0.10建材1.001.691.500.85-0.20煤炭0.30-1.201.07-0.41-1.44电子0.941.051.230.10-1.61综合0.740.640.87-0.17-1.79钢铁-1.23-1.58-1.64-1.98-5.0910历史周报推荐主题(对每次周报推荐主题的对应指数持有一周)收益率2 政策周报推荐主题对应指数回测,历史推荐主题超额收益30.38%过去10次外发周报推荐主题统计分主题周度涨跌幅累加(%)从2021年6月至上周的回测结果显示,历史周报的主题 推荐相对沪深

12、300超额收益率为30.38%。通过对过去10次外发周报回测结果进行统计可以看到, 收益率排名前五的主题分别为:多晶硅、光伏、储能、 锂电负极、光伏屋顶。注:回测使用标的均为主题指数,每周对推荐的所有主题指数等权买入,指数购买方式是按照主题指数权重股及其对应权重买入;交易时间为每周一开盘对上周的推荐结果买入并在本周五 收盘时卖出;为方便计算目前没有计入交易成本。14.1411.4710.688.33 7.44 7.29 7.07 6.17 5.905.59 5.17 5.16 4.893.45 3.15 3.05 3.02 2.97 2.41 2.26 2.05 2.00 1.111.01 1

13、.00 0.94 0.87 0.72 0.02-0.05 -0.10 -0.40 -0.51 -0.65 -1.06 -1.38 -1.80 -1.89-2.73-4.16-8.89-15.00-10.00-5.000.005.0010.0015.0020.0035%30%25%20%15%10%5%0%70%80%90%100%130%120%110%2021-06-132021-06-202021-07-042021-07-112021-07-182021-07-252021-08-082021-08-292021-09-052021-09-192021-09-262021-10-0320

14、21-10-242021-10-312021-11-072021-11-142021-11-212021-12-052021-12-122021-12-192021-12-262022-01-092022-01-162022-01-232022-01-302022-02-202022-02-272022-03-062022-03-132022-03-202022-03-272022-04-032022-04-172022-04-242022-05-082022-05-152022-05-222022-05-292022-06-052022-06-122022-06-192022-06-2620

15、22-07-032022-07-102022-07-17超额收益综合主题收益率主题收益率_政策主题收益率_研报沪深300收益率数据源分类数据库名来源获取途径更新频率行业标准财务数据基于并结合nlp提取季行业经济数据国家统计局、工信部、财政部、商务部等nlp提取月行业政策文本数据中央、国务院、15个国家部委、17个地方省市政府nlp提取周行业特色数据源行业相关扩产公告基于Wind并结合nlp提取月行业社媒数据B站、抖音、小红书等数据商、nlp提取日房地产、线下门店数据贝壳、大众点评、百度地图等数据商、nlp提取日行业投融资数据清科私募通数据商月行业专业数据源主营产品价格、产销量等数据百川盈孚、卓

16、创资讯、高工锂电等数据商月研发专利数据轶鼎科技、专利局等数据商月资料来源:中信证券研究部112 构建多维行业经济数据矩阵,打造中观景气底层支持体系底层数据库及其获取途径和更新频率中观景气度跟踪的数据支持体系结合国家统计局、行业专业数据商等多个数据源,为28个中信证券一级行业构建代理指 标库,纳入了超过300个行业高频指标。12,中信证券研究部2 方向预判:准确率高达79.8,回测期间多次全行业命中由于行业营收同比是季频指标,而模型预测的景气指数仅含当月信息。为了使两者口径近似可比,以景气指数3个月均值 的同比,作为模型对景气度方向的预测结果。所以景气度方向变化定义为: = + 1 + 212

17、+ 13 + 14回测区间为2020-01至2022-03,将景气度变化方向与真实营收同比方向进行逐期对比,并计算命中率。结果显示,景气 方向平均命中率高达79.8%。其中,相比于2020年,2021年模型命中率提升15.2%,表明随着数据不断积累模型预测能 力有望逐步增强。景气指数变化方向定义2020年起各季度景气度方向命中率情况中信证券研究部0%100%80%60%40%20%2020Q12020Q22020Q32020Q42021Q12021Q22021Q32021Q420022Q1中信证券行业分类区间命中率方向准确率中信证券行业分类区间命中率方向准确率石油石化89%100%建筑56%8

18、9%保险89%89%汽车56%89%煤炭89%78%交通运输67%78%钢铁89%78%传媒78%67%电力及公用事业67%100%纺织服装56%78%基础化工78%89%房地产67%67%轻工制造78%89%国防军工44%78%消费者服务67%100%商贸零售56%67%家电78%89%电子44%78%机械56%100%计算机56%67%建材67%89%证券67%44%食品饮料67%89%电力设备及新能源56%56%农林牧渔67%89%医药44%67%,中信证券研究部132 泛周期高适用,新成长可优化从单个行业的预测效果来看,景气度模型对周期类行业(如:石油石化、基础化工等)预测较好,而对成

19、长性行业(通信、计算机、电力设备及新能源)仍有可优化的空间。中信证券一级行业景气指数评价(2020年起)14投资导向下,结合国际标准与中国智慧。在中信证券 ESG指标体系构建的整体流程中,我们全面落实国际视 野与中国智慧的结合,切实探索如何在与国际ESG评价 体系接轨的同时又能结合我国的发展阶段,从而推动 ESG理念从评价研究走向实战落地。2 评分体系指标设计:投资导向下,结合国际标准与中国智慧一级议题二级议题三级议题指标名称环境污染排放企业污染排放水平单位收入颗粒物排放环境污染排放企业污染排放水平单位收入Nox排放环境污染排放企业污染排放水平单位收入SO2排放环境污染排放企业污染排放水平单位

20、收入氨氮排放环境污染排放企业污染排放水平单位收入COD排放环境污染排放企业环境信息披露合规性排污许可执行报告披露比例环境污染排放企业污染排放风险重污染天气限工限产风险环境污染排放企业污染排放风险环境行政处罚环境企业环境管理企业环境管理体系评价环境管理体制认证环境企业环境管理企业绿色生产水平工信部绿色生产认证环境气候与能源企业能源管理水平能源管理体制认证环境气候与能源企业对气候问题重视度是否披露碳排放社会责任员工企业安全管理体系评价安全生产认证社会责任员工企业安全管理体系评价安全生产处罚社会责任员工职工薪酬与福利职工人均薪酬社会责任员工职工薪酬与福利职工人均社会保险费社会责任社会企业业务的政策环

21、境企业的政策量化得分社会责任消费者企业产品、服务质量质量管理体系认证社会责任消费者企业产品、服务质量市场监管机构处罚社会责任消费者客户隐私保护信息安全管理体系社会责任供应链企业供应链稳定性评价企业供应链CR5集中度社会责任供应链企业供应链关系评价企业应付账期水平社会责任供应链企业供应链关系评价企业应收账期水平公司治理商业道德企业涉及诉讼刑事诉讼公司治理商业道德反腐败纪委监委调查公司治理ESG治理ESG信息披露单独披露CSR报告公司治理ESG治理ESG信息披露CSR报告进行第三方审计公司治理内部治理合规性上市监管负面事件交易所、证监会监管与处罚公司治理内部治理合规性信息披露水平交易所企业信息披露

22、等级评价公司治理内部治理合规性审计结果财报审计意见结果公司治理内部治理合规性审计结果内控审计意见结果公司治理管理层评价管理层激励制度股权激励方案公司治理管理层评价管理层收入评价管理层总薪酬公司治理管理层评价管理层收入评价管理层薪酬/平均薪酬公司治理管理层评价管理层收入评价管理层薪酬/营业收入公司治理管理层评价管理层稳定性管理层平均任期公司治理管理层评价管理层稳定性管理层平均年龄公司治理管理层评价管理层稳定性管理层增减持比例公司治理管理层评价管理层稳定性管理层增减持数值环境结合监管体系,重点关注环境风险。重点关注企业在生产经 营过程中对外部环境所的影响,包括污染排放、能源消耗和 碳排放等。社会责

23、任引入中国智慧,关注国家和社会的全面发展。我们内立足中 国发展阶段,对该理念进行了一定的拓展和延伸,着重突出了上市公司对国家和社会全面发展的责任,引入了企业所属行业的政策环境变量。公司治理关注治理合规性,增强指标确定性。在公司治理中,我们一 方面重点关注其治理的合规性,尤其是是否符合上市公司治 理规范。另一方面,我们尝试基于投资逻辑和理解对其治理 架构的有效性进行评价中信证券研究部2 评分体系指标权重:以实质性为核心,结合量化回测与基本面逻辑行业公司治理环境社会责任传媒48%14%38%电力及公用事业50%17%33%电力设备及新能源53%15%32%电子45%19%35%房地产55%19%2

24、6%纺织服装51%16%33%非银行金融52%24%24%钢铁49%19%31%国防军工51%16%33%机械50%16%34%基础化工49%22%29%计算机48%16%36%家电48%19%34%建材44%20%36%建筑48%21%31%交通运输52%15%33%煤炭42%30%27%农林牧渔53%13%34%汽车42%25%34%轻工制造45%18%37%商贸零售55%12%33%石油石化49%23%29%食品饮料46%23%31%通信47%18%35%消费者服务46%13%41%医药47%17%35%银行62%14%24%有色金属48%27%26%综合46%20%34%综合金融63%

25、2%36%平均值49%18%32%指标权重设计思路:以实质性为核心,结合量化回测与基本面逻辑核心假设:我们将指标权重视为该指标的实质性体现,因此权重差 异性的本质是不同行业中ESG指标的实质性不同,在此前版本中, 我们完全依据主观逻辑判断为指标赋权,为更科学量化地设计指标 权重,我们假设指标在历史时期对股票收益的分层效果能一定程度 反映该指标在特定行业内的实质性量化回测:采用了ESG指标在行业中多空组合的累计收益率作为其 实质性判断的基础。依据该行业累计多空组合收益排名将指标分为 04共计5挡,其中0指在该行业中无数据或无区分度,最终将各个 指标分档得分加权,即为该行业中企业的指标权重。逻辑判

26、断:同时我们认为指标历史收益表现并不能完全表征该指标 的实质性,且评分体系中也应当突出企业ESG表现,例如部分事件 型指标对某个行业不敏感可能是由于其发生频率较低或行业内区分 度较低,例如银行业的社会责任报告披露率已达100%,我们结合 主观认知对其部分指标的分档结果进行调整。最终,我们会结合指标覆盖率,将行业内覆盖率低于20%的指标权重 设置为0。整体来看,各行业中公司治理、环境和社会责任权重平均 为49%、18%、32%,行业间差距较大,综合金融的环境平均权重仅 为2%。中信证券研究部测算15CONTENTS目录16数据爆发+技术升级,因子挖掘为基本面量化投资新趋势基本面量化有效因子挖掘和

27、应用(政策力度指标+行业景气指标+ESG评分指标)探索“政策力度+景气程度+ESG质量”投资新思路172018-01至2022-06景气度+政策+ESG组合:累计收益率146.5%,年化收益率29.4%,最大回撤率25.0%,年化波动率26.9% o 沪深300:累计收益率4.9%,年化收益率1.4%,最大回撤率22.2%,年化波动率18.1% , 组合超额收益率为141.6%,超额 胜率58.0%。3 政策力度+景气程度+ESG质量投资策略结果2018年1月-2022年6月 中信证券数据科技“政策+景气+ESG”基本面量化策略模拟,中信证券研究部0.511.522.53景气度组合累计收益率等

28、全组合累计收益率沪深300累计收益率政策累计收益率 景气度+esg累计收益率 景气度+政策累计收益率esg累计收益率景气度+政策+esg累计收益率18政策配置算法说明:行业力度计算方式:行业政策力度=当月政策热度*0.5+前一个月政策热度*0.3+前两个月政策热度*0.2;行业配置方式:月度调仓,进行行业间比较,每次将政策力度前三名行业进行等权买入。中观景气算法说明:行业景气程度方式:行业景气程度=当月景气度绝对位置*0.5+当月景气变化*0.5。其中,景气度绝对位置为近八年行业景气度分位数,景气变化为景气度的同比、环比等权求和值;行业配置方式:月度调仓,进行行业间比较,每次将景气程度前三名行

29、业进行等权买入。ESG配置算法说明:ESG评分方式:自建ESG评级体系,从环境、社会责任以及公司治理三大维度进行企业精准评价;行业配置方式:月度调仓,对于选中的行业,选出ESG评分前20%的个股进行等权买入。模拟调整时间说明:回测区间为2018-01至2022-06,每月最后一个日历日发出调仓信号,次月第一个交易日调仓。暂不考虑手续费。3 政策力度+景气程度+ESG质量具体应用说明193 未来应用升级与探索通用因子指向更精准,行业因子挖掘更前瞻科技关键主题相关文件分布消费关键主题相关文件分布制造关键主题相关文件分布基地关键主题相关文件分布周期关键主题相关文件分布医药关键主题相关文件分布资料来源

30、:中国政府网,其他政府部门官网,中信证券研究部 注:数据统计截至2022年07月15日0%10%20%30%40%50%60%70%80%90%100%2022-4 2022-5 2022-6 2022-7物流航空环保生态环境保护快递 机场房地产开发 冷链物流轨道交通 排水污水处理 新型城镇化0%10%20%30%40%50%60%70%80%90%100%2022-4 2022-5 2022-6 2022-7信息化低碳大数据人工智能碳中和物联网5G新能源汽车区块链微博工业互联网 网络安全0%10%20%30%40%50%60%70%80%90%100%2022-4 2022-5 2022-6 2022-7旅游互联网体育快递外贸口罩 职业教育 疫苗养老 新媒体 纺织 互联网+0%10%20%30%40%50%60%70%80%90%100%2022-4 2022-5 2022-6 2022-7船舶新能源集装箱先进制造国家安全 水电 新能源汽车 核电 地 铁 储 能风 电 光 伏0%10%20%30%40%50%60%70%80%90%100%2022-4 2022-5 2022-6 2022-7肺炎医保医疗服务医疗器械 流感抗生素 老龄化生物医药 糖尿病 禽流感仿制药高端医疗0%10%20%30%40%50%60%70%80%90%100

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论