量化多因子选股框架分析报告_第1页
量化多因子选股框架分析报告_第2页
量化多因子选股框架分析报告_第3页
量化多因子选股框架分析报告_第4页
量化多因子选股框架分析报告_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

量化多因子选股框架——金融工程专题报告2024年9月4日核心观点•

【核心结论】本报告详细介绍了量化多因子选股的流程与框架,涵盖因子预处理、评价及收益预测模型等关键步骤。•

【报告亮点】系统性整理了从因子测试、因子筛选到组合构建的全过程,为高效构建量化投资组合提供了清晰路径。•

【主要逻辑】➢

单因子测试✓

介绍单因子预处理的基本方法,主要包括去极值、标准化、中心化。✓

因子检验的评价维度和评价方式,其中评价方式主要有ICIR法、分组测试法、双变量排序法和回归法。➢

收益预测模型✓

对因子进行筛选,判断其是否能够纳入多因子组合。✓

用一系列筛选得到的因子预测个股收益,这一步本质可理解为多因子的聚合。常见方法可分为线性和非线性,其中线性法主要有加权和回归两种方式,非线性主要包括神经网络、树模型等。➢

组合构建✓

基于得到的个股收益预测,计算组合的净值曲线和收益风险特征。✓

组合构建的主要步骤包括设定选股池与调仓周期、以及确定选股逻辑和权重。其中,选股逻辑和权重一般基于人工逻辑直接构建得到,或者利用优化算法在更复杂的选股约束下进行求解。✓

我们基于上述框架,结合多因子复合打分构建了一个中证500指数增强策略,业绩表现优于基准。•

风险提示:数据第三方,或有遗漏、滞后、误差;选股研究框架及筛选指标为西部证券自建,或有考虑不周之处;股票历史业绩不代表未来表现,研究框架也会随时间变化。2量化多因子选股基本框架➢

收益预测模型:通过历史估计给出股票未来的预期收益率。➢

风险管理模型:控制组合与业绩基准之间的跟踪误差。➢

组合权重优化:在给定的风险约束下,最大化组合的预期收益率。图:多因子组合构建基本流程收益预测风险管理组合优化•

因子筛选•

预测股票收益•

预期跟踪误差•

组合风格偏离•

组合风险贡献•

给定风险约束•

最大化预期收益资料:西部证券研发中心3010203单因子测试目

录收益预测模型组合构建CONTENTS1

单因子测试➢

1.1备选因子:基于原始指标或开发;挑选时需要注意因子是否直接、直观且有意义。•

直接(incisive):通过因子能够明确对股票进行分类。•

直观(intuitive):对股票的分类标准具有可以解释的逻辑性。•

有意义(interesting):分类后的股票风险收益特征具有明显差异。表:确定备选因子的3个IIncisive■IntuitiveInteresting备选因子首字母□■■□□■公司地点股票盈利■■参考文献:ActivePortfolioManagement,byGrinoldandKahn.资料:西部证券研发中心51

单因子测试➢

1.2因子预处理•

01-

去极值•

02-

标准化•

03-

中性化资料:西部证券研发中心61

单因子测试➢

1.2因子预处理•

01-

去极值:因子数据中的极端值会影响分析结果,离群值会扭曲因子与收益率之间的相关性估计。✓

去极值的基本逻辑:确定上下限,将超出范围的因子值修改为上下限。✓

常见的去极值方法有:①

MAD法:上下限为

푥푀

±

퐷푀퐴ꢀ,

:序列푥

的中位数,퐷

:序列|푥

-푥

|的中位数푀푖푀퐴ꢀ푖푀②

3휎法:上下限为

±

휎,

:序列푥

的均值,휎:序列푥

的标准差푀푀푖푖③

百分位法:上限分位数和下限分位数(一般为97.5%和2.5%)。资料:西部证券研发中心71

单因子测试➢

1.2因子预处理•

02-

标准化:不同的因子数据往往具有不同的单位和数值范围,这种差异会导致数值较大的因子在分析中占据过大的比重,而数值较小的因子则会被相对削弱。因此,通常需要对这些因子数据进行标准化处理,以消除量纲的影响。✓

常见标准化方法有:①

Z-score②

Max-Min③

取对数④

排序标准化资料:西部证券研发中心81

单因子测试➢

1.2因子预处理•

03-

中性化:剔除因子数据中显著的风险暴露,因为若使用具有明显风险暴露的因子值作为选股条件,会导致筛选出的股票集中在特定的风险暴露上。✓

中性化的基本逻辑:因子值作为y,风险因子作为x,进行线性回归,回归残差即为风险中性后的因子值。✓

常见中性化方法有:①

行业中性②

市值中性③

其他风险因子中性资料:西部证券研发中心91

单因子测试➢

1.3

因子检验•

因子的评价维度:✓

因子单调性:因子单调性越好,收益区分能力越强。✓

因子有效性:因子对未来收益的解释能力。✓

因子稳定性:因子的有效性是否稳定、可持续✓

因子时效性:在过去有效的因子,现在或将来不一定有效。资料:西部证券研发中心101

单因子测试➢

1.3因子检验•

因子评价方式:✓

01-

IC、IR:常用于评价因子有效性和稳定性。✓

02-

分组测试:将股票按照因子值大小分组,统计每组在下一周期的收益。✓

03-

双变量排序:计算控制因子1下的因子2分组收益,以防止排序受其他因子的干扰。✓

04-

回归法:将T期的因子暴露与T+1期股票收益率进行线性回归。资料:西部证券研发中心111

单因子测试➢

1.3因子检验✓

01-

IC、IR:常用于评价因子有效性和稳定性。◆

Pearson相关系数(IC):当期因子值与下期股票收益之间的线性相关性。◆

Spearman相关系数(RankIC):当期因子与下期股票收益之间的序数相关性。◆

ICIR信息比率(ICInformationRatio):IC的均值与IC标准差之比,代表因子获取稳定Alpha的能力。资料:西部证券研发中心121

单因子测试➢

1.3因子检验✓

02-

分组测试:将股票按照因子值大小分组,统计每组在下一周期的收益。◆

每组间的收益差异越大、单调性越明显,因子有效性越好。图:PB因子分组月均收益(2018.01-2024.07)0.8%0.6%0.4%0.2%0.0%-0.2%-0.4%-0.6%-0.8%G1G2G3G4G5G6G7G8G9G10注:横轴为t月按照股票的PB从小到大等分成10组,纵轴代表每个PB组合t+1月收益的均值资料:Wind,西部证券研发中心131

单因子测试➢

1.3因子检验✓

03-

双变量排序:计算控制因子1下的因子2分组收益,以防止排序受其他因子的干扰。◆

(有条件)双变量排序流程:1)按因子值1将股票分为10组。2)在各因子值1分组中按因子值2分为10组。3)将不同因子值1分组内相同因子值2排序分组的收益加总,得到控制因子值1下的因子值2的分组收益。资料:西部证券研发中心141

单因子测试➢

1.3因子检验✓

04-

回归法:将因子T期的因子暴露与T+1期股票收益率进行截面线性回归。r푡+1

=

푋푡푓푡

휀푡◆

回归系数푓푡

:因子当期的收益率(因子溢价)。◆

因子收益率显著度水平(t-test):对于每一期的截面回归,都可以得到一个因子收益率

푓푡

,对于푓푡序列进行푡检验,以观察因子收益率序列的方向一致性。资料:西部证券研发中心15010203单因子测试目

录收益预测模型组合构建CONTENTS2

收益预测模型➢

2.1

单因子筛选:判断因子是否纳入多因子组合•

单因子筛选方式:◆

单因子有效性◆

因子间相关性表:常见选股因子列表及其计算方式因子市值因子计算方式log(总市值)风格非线性市值预期EP反转log(总市值)Z-score的平方一致预期净利润/总市值前1个月累计收益率行为财务换手率波动率ROE前1个月日均换手率Fama-French时间序列回归残差波动率单季度ROESUE(净利润(t)-净利润(t-4))/过去4期净利润变化的波动率资料:西部证券研发中心172

收益预测模型➢

2.2收益预测:用一系列个股因子预测个股收益,本质可理解为多因子的聚合•

푭풊:个股的一系列因子흁ෝ

=

풇(푭

)푵

ퟏ푵

푻풊풊图:收益预测模型预期收益风格行为财务预期行业•

规模•

价值•

收益率•

换手率•

波动率•

盈利能力•

盈利增长•

目标收益•

分析师覆盖度•

行业轮动•…•…•…资料:西部证券研发中心182

收益预测模型➢

2.2

收益预测:用一系列个股因子预测个股收益,本质可理解为多因子的聚合•

因子聚合方式:◆

线性:✓

加权法:等权法、IC加权法、IC-IR加权法、IC半衰加权法。✓

回归法:通过因子收益率估计个股收益。◆

非线性:神经网络、树模型。资料:西部证券研发中心192

收益预测模型➢

2.2

收益预测◆

回归法:通过因子收益率估计个股收益흁ෝ

。✓

T期股票收益率对因子T-1期的因子暴露进回归,得到因子收益率퐹푡−1:푡푡−1

푡−1ꢀ

휀푡−1r

=

퐹෡푡✓

因子预期收益率휷

一般采用过去12个月因子收益率

均值作为估计。풕+ퟏ✓

计算个股预期收益흁ෝ,即,个股最新因子暴露与因子预期收益率的乘积:풕

෡흁ෝ

=

휷풕+ퟏ资料:Active

PortfolioManagement,

by

Grinoldand

Kahn,西部证券研发中心202

收益预测模型➢

2.2收益预测◆

神经网络:通过深度学习估计个股收益흁ෝ

。✓

模型框架:循环神经网络(RNN)+全连接神经网络(NN)✓

金融数据的特征和RNN模型较为适配。✓

RNN提取金融时间序列中的信息,NN将RNN处理后的信息转化为收益预测。图:深度学习预测个股收益流程图个股因子时间序列RNNNN收益预测资料:西部证券研发中心212

收益预测模型➢

2.3收益预测模型评价•

模型预测选股收益的IC、RankIC,绝对/相对胜率。•

预期收益多头组合(Top10%)相对市场等权组合的表现。表:收益预测模型的选股收益表现示例(复合因子,2018.01-2024.07)ICRankIC3.5%多头收益0.8%空头收益-0.3%多空收益1.0%月均值月胜率信息比2.4%54.9%0.2156.9%0.2652.9%0.1349.0%57.8%0.22-0.04注:复合因子为对市值、PB、SUE、ROE、动量因子等权打分。资料:Wind,

西部证券研发中心22010203单因子测试目

录收益预测模型组合构建CONTENTS3

组合构建➢

计算组合的净值曲线和收益风险特征1.

确定选股池•

基本池:沪深A股中,剔除ST股、上市不足3个月的股票以及停牌股。•

其他要求:如流动性要求(剔除选股池中过去1年日均总市值和成交额排名靠后20%的股票)。2.

确定调仓周期•

季频、月频、双周频、周频。3.

确定选股逻辑及权重,计算净值曲线资料:西部证券研发中心243

组合构建3.确定选股逻辑及权重•

人工逻辑✓

选股个数:基于收益预测选择top100、top10%的股票。✓

加权方式:等权、股息率加权、市值加权。•

组合优化✓

基于收益预测构建优化目标,如,最大化组合收益。✓

添加更复杂的选股约束。✓

选股个数及加权方式由优化器求解得到。资料:西部证券研发中心253

组合构建3.确定选股逻辑及权重•

组合优化——常用于指数增强◆

目标函数퐦퐚퐱

풘′흁ෝ풘✓

最大化组合预期收益◆

约束条件s.t.풘ꢀ풆

=

ퟏ,

풖ꢀ풘

풙푩✓

个股权重偏离、组合风格暴露풘

풘푩

′핀{풊∈푫}

=

ퟎ✓

行业、市值等风险约束✓

换手率约束푵෍

풘풊,풕

풘풊,풕ꢂퟏ

풚◆

求解最优化问题,得到股票权重。풊ꢁퟏ资料:Quantitative

Finance

withPython,

by

ChrisKelliher,西部证券研发中心263

组合构建4.组合分析✓

风险收益指标•

累积收益、年化收益、超额收益、

最大回撤、换手率、胜率•

信息比率

IR、夏普比率、卡尔玛比率、索提诺比率✓

归因分析•

收益归因•

风险归因资料:西部证券研发中心273

组合构建➢

基于复合因子构建中证500指数增强策略•

复合因子:对市值、PB、SUE、ROE、动量因子等权打分。•

选股

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论