【多因子选股模型应用实证探究4300字(论文)】_第1页
【多因子选股模型应用实证探究4300字(论文)】_第2页
【多因子选股模型应用实证探究4300字(论文)】_第3页
【多因子选股模型应用实证探究4300字(论文)】_第4页
【多因子选股模型应用实证探究4300字(论文)】_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多因子选股模型应用实证研究—以上证180指数为例目录一、问题背景阐述 一、问题背景阐述1.1量化投资简介近年来量化投资越来越受到各大投资机构的青睐和应用,这主要得益于其技术稳定,在金融投资市场上的投资效果较好,以及市场规模不断扩大。量化投资主要的应用思路是投资机构通过个股的分析(如:风险因子,价值因子等),建立合理有效的投资组合,而此类投资组合可以跑赢市场大盘,并产生超额收益。因此不同于定性投资,量化投资更注重对定性分析的数据化应用,强调数据在投资组合中的重要地位。1.2多因子模型多因子模型在实际应用中十分普遍,其基本思路是选取若干个合理的因子作为选股依据,该模型建立股票收益率与多因子的线性回归方程,分析其存在的统计规律,以此来建立投资组合。其优点是可以根据股票的综合信息得出一个最优化的投资组合。现实中,多因子模型主要有两种:打分法和回归法。打分法是根据选取因子的重要性对其进行赋权;而回归法是建立一个回归方程,其优点是系数值可以及时调整,系数大小衡量了该指标对股票收益率的重要程度。鉴于此,本文将采用回归法。图1是多因子模型在实际应用中的分析步骤。图1:多因子选股模型分析步骤图二、多因子选股模型的理论基础2.1CAPM模型CAPM的核心思想是资产价格取决于其获得的风险价格补偿,其反映了市场上任意资产组合的收益与某个共同因素之间的线性关系。其模型表示为:上述公式表明,在市场均衡状态下,任意资产的预期收益率都是由无风险收益率和合理的系统风险溢价两部分构成,而解释了资产预期回报率对整个市场波动的敏感程度,越大说明证券的系统性风险越高,得到的风险补偿也就越高,从而投资者将持有较高的预期资产回报率。但由于CAPM的假设过于苛刻,此后的研究不断放宽其假设条件,以此来更加贴近市场实际情况。2.2套利定价理论(APT)相比于CAPM模型,APT的优点是其假设比较宽松,不需要依赖市场组合,并且没有无税收和无风险利率借贷等假设。APT可以被认为是CAPM模型的一种推广。其数学模型表示为:而且APT相比于CAPM考虑了更多的因素,能对某些CAPM不能解释的现象作出解释,且不需要考虑市场组合。2.3多因子模型多因素模型认为股票证券的收益率受到一些共同因素的影响。例如三因子模型认为,市场风险溢价、规模与账面市值比三大因素来解释个股收益率的变化是具有一定的说服力的。其数学形式为:此外,后续的研究中对三因子模型进行了改进。如:四因子模型(加入了动量因子),五因子模型(加入了质量投资),以及六因子模型(加入波动率因子)。三、多因子选股模型的实证分析3.1数据的预处理本文选取上证180指数的股票池作为研究样本,上证180指数由沪市A股中规模大、流动性好的180只股票组成,反映上海证券市场一批蓝筹公司的股票价格表现,具有一定的代表性。图2:上证180指数近3个月的市场表现图2是上证180指数的指标表现,可以看到其波动性较大,数据来自中证指数官网。图3:上证180成份行业权重分布表1:上证180指数十大权重股截止日期:2021-05-19代码简称行业权重600519贵州茅台主要消费8.79601318中国平安金融地产6.47600036招商银行金融地产5.79601888中国中免可选消费2.72600276恒瑞医药医药卫生2.71601166兴业银行金融地产2.68601012隆基股份工业2.27600887伊利股份主要消费2.02600030中信证券金融地产1.80603259药明康德医药卫生1.74图3和表1是上证180指数的十大权重股的行业分布,可以看到主要消费、金融地产占据主要地位。本文选取的样本时间跨度是从2015年到2020年,频率为季度。其中2015年到2017年的样本用于筛选指标因子并进行回归建模,2018年到2020年的样本用于验证模型的准确性。本文数据来源于Wind金融终端。此外,为了实证分析的稳健性,需要对数据做前期处理,包括剔除极端值、统一数据量纲单位、缺失值处理。=1\*GB2⑴由于回归法易受极端值的影响,因此本文对数据中的极端值进行处理,具体操作为超过上下限的数据用上下限来替代。=2\*GB2⑵为了避免各个指标的取值范围与量纲差异对分析的影响,本文对数据进行标准化处理,即采用Z-Score标准化方法:。=3\*GB2⑶对于缺失值,本文采用直接删除处理。3.2影响因子的选取在应用多因子模型时,一个重要的问题就是如何选取合适有效的因子。候选因子越多,对股票的收益分析就会越全面,构建的模型效果也就会更好。考虑到指标数据的可获得性,并且基于以往对多因子选股模型的市场经验和研究,本文选取以下七大类候选因子,见表2。表2:候选影响因子列表估值指标技术指标波动指标盈利指标市盈率MA简单移动平均换手率净资产收益市净率BIAS乖离率波动率每股股利市销率OBV能量指标总资产利润率RSI相对强弱指标销售利润率MACD平滑异动平均线MTM动力指标续表营运能力指标偿债指标成长指标总资产周转率流动比率净利润增长率应收账款周转率资产负债率净资产增长率现金流量比率总资产增长率经营现金净流量对负债比率主营利润比重资本化比率非主营比重股东权益比率3.3因子有效性检验在进行多因子筛选之前,为了选取有效的因子,需要对因子做统计上的相关性与显著性检验,本文采取Fama-Macbeth检验方法。检验结果如下表所示:表3:Fama-Macbeth检验结果因子类别因子名称值检验结果估值因子市盈率2.8326通过市净率3.2032通过市销率-0.7496未通过技术因子MA简单移动平均0.5698未通过BIAS乖离率2.2301通过OBV能量指标0.9621未通过RSI相对强弱指标0.2397未通过MACD平滑异动平均线-1.6934未通过MTM动力指标0.3287未通过波动因子换手率-2.0451通过波动率-0.9628未通过盈利因子净资产收益2.3697通过每股股利0.2398未通过总资产利润率2.1583通过销售利润率0.3971未通过营运能力因子总资产周转率3.2389通过应收账款周转率-0.2397未通过偿债因子流动比率1.2578未通过资产负债率-3.6978通过现金流量比率0.3268未通过经营现金净流量对负债比率1.2378未通过资本化比率2.3697通过股东权益比率-3.3698通过成长因子净利润增长率0.6987未通过净资产增长率-2.9687通过总资产增长率0.7689未通过主营利润比重2.3697通过非主营比重1.0397未通过由上述因子检验结果可以看出,通过检验的因子有:市盈率、市净率、BIAS乖离率、换手率、净资产收益、总资产利润率、总资产周转率、资产负债率、资本化比率、股东权益比率、净资产增长率、主营利润比重。注意,同种类别下的因子可能由于背后的驱动机制相似,导致其相似性较高,即因子之间存在较高的相关性,这可能会对后续的实证分析带来不良的影响。因此,为剔除冗余因子,本文选取以下因子:市净率,BIAS乖离率,换手率,总资产利润率,资产负债率,总资产增长率。3.4多因子选股实证分析基于以上的分析,本文建立如下基本的多因子模型:回归结果如下:表4:回归结果表StatisticalmodelsModel1Model2Model3Intercept-1.18-1.10-1.15(0.43)(0.50)(0.51)市净率0.024**0.023***0.023*(0.05)(0.04)(0.05)BIAS乖离率0.0580.061***0.061***(0.14)(0.14)(0.14)换手率0.024**0.024**(0.30)(0.30)总资产利润率0.086*0.087*(0.21)(0.21)资产负债率-0.068**-0.071**(0.18)(0.19)总资产增长率-0.104*(0.20)0.340.580.620.330.560.61注:***p<0.001;**p<0.01;*p<0.05由表4的回归结果可知,所选取的几个影响因子均能对被解释变量产生显著影响。可以得到如下的多元回归方程:接下来为了验证回归模型的有效性和选股能力,可以利用选取的数据进行检验。本文把2018年1月至2020年12月三年共计12个季度的上证180成分股数据作为回测期,PBR、BIAS、TR、TAPR、DAR、TAGR的因子值为解释变量。具体做法为:在数据验证回测时期建仓方式使用滚动调仓的方式,以季度为周期构建相应的股票投资组合,即2018年1月至2020年12月三年的季度区间数据作为回测区间,首先在2017年第四季度末期建仓,最后一期在2020年第四季度末期结算,对比分析股票组合的收益与上证180指数的差异,以此来验证模型的有效性。将估计的影响因子值代入回归模型中,得到被解释变量的估计值,对结果进行排序并选择排名前30支股票,以此建立投资组合。以2017年第四季度末期买入估值前30支股票,在2018年第一节度卖出,重新根据新的季度数据构建下一季度的股票组合,依次滚动到2020年第三季度末期,在2020第四季度进行结算。2018第一季度的股票组合结果如下表所示:表5:首期建仓的30只股票收益率对比股票代码股票简称市场类型收益率-估计值收益率-实际值601088.SH中国神华上证1800.24310.0126600000.SH浦发银行上证1800.20390.1392600031.SH三一重工上证1800.10290.0653600030.SH中信证券上证1800.20340.0569600104.SH上汽集团上证1800.32180.2369600887.SH伊利股份上证1800.29780.2896601601.SH中国太保上证1800.15930.0591600048.SH保利地产上证1800.12890.2697601818.SH光大银行上证1800.0596-0.0396601816.SH京沪高铁上证1800.01630.0026601628.SH中国人寿上证1800.2158-0.3698601988.SH中国银行上证1800.21080.1069600606.SH绿地控股上证1800.1986-0.1539600600.SH青岛啤酒上证1800.21310.0369603369.SH今世缘上证1800.10290.1576600886.SH国投电力上证1800.1698-0.1569600061.SH国投资本上证1800.1439-0.0246601377.SH兴业证券上证1800.09860.1236603659.SH璞泰来上证1800.20690.3652601618.SH中国中冶上证1800.19760.2012600115.SH东方航空上证1800.1129-0.0026600029.SH南方航空上证1800.15090.015600779.SH水井坊上证1800.1069-0.1026601878.SH浙商证券上证1800.0697-0.0026600011.SH华能国际上证1800.06970.0059600089.SH特变电工上证1800.10390.0071600332.SH白云山上证1800.1869-0.0156600584.SH长电科技上证1800.23690.1269601607.SH上海医药上证1800.1128-0.1397601808.SH中海油服上证1800.12530.0489由上表可以看出,整体而言股票真实值与预测值之间误差不算太大,但仍有部分股票的收益率实际值与预测值差异较大,说明在短期内,股票真实的收益率是不可能被准确真实地预测,很多因素都会直接或间接地影响股票的短期收益率。最后,计算投资组合的收益,并与上证180指数收益对比,见图4。图4:基于回归法的投资组合收益分析可以看出,整体而言投资组合收益是高于上证180指数的,表明本文建立的模型可以一定程度上解释影响股票收益率的影响因素,但同时注意到,随着时间的推移,两者之间的误差在逐渐增大,这表明长期内股票的收益率是受到多种因素的影响。没有一个永恒的模型可以解释所有的影响因素,随机干扰项的存在必然会影响收益的变动。最后,为衡量选股模型的能力,采用Pope与Yadav(1994)定义的跟踪误差公式将跟踪误差定义为指数化投资组合与基准指数的收益率差额序列的标准差将跟踪误差定义为指数化投资组合与基准指数的收益率差额序列的标准差计算投资组合与基准上证180指数的跟踪误差,结果为1.064%,表明此模型组合一定程度上可以有效地解释股票市场的变动,说明多因子选股模型作为应用最广泛的一种选股模型是具有一定的市场认可度的。四、研究结论本文介绍了在投资组合中应用较为广泛的多因子选股模型,阐述了其基本理论,并以上证180指数作为投资标的,选取若干个影响指标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论