版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目 录1、开源金工特色遗传算法框架 4、算子的赋予:创造性引入切割算子 4、变量的遴选:大小单资金流、日内分钟特征、日间特征 5、遗传算法流程:针对性的改写 52、遗传算法的因子挖掘成果举例 6、遗传算法优选综合因子表现优异 6、沙里淘金:遵循可解释”理念 73、因子3的精细化讨论 8、主动超大单强度效果不佳 8、“小单强度切割主动超大单强度敏感性分析 8、“小单强度切割全部超大单强度敏感性分析 94、因子4的精细化讨论 、切割算子部分的讨论 、时序极差算子 145、因子8的精细化讨论 156、风险提示 16图表目录图1:开源金工特色遗传算法整体流程 6图2:遗传算法优选综合因子回测曲线较为优异 7图3:主动超大单强度5分组年化收益不单调 8图4:不同𝜆值下𝐸𝑋𝐿𝐴𝐶𝑇_ℎ𝑖𝑔ℎ(𝜆)和𝐸𝑋𝐿𝐴𝐶𝑇_𝑙𝑜𝑤(𝜆)的RankICIR绩效 9图5:主动超大单关注度因子多空收益波动比为2.08 9图6:主动超大单关注度因子5分组年化收益单调 9图7:不同𝜆值下𝐸𝑋𝐿_ℎ𝑖𝑔ℎ(𝜆)和𝐸𝑋𝐿_𝑙𝑜𝑤(𝜆)的RankICIR绩效 10图8:超大单关注度因子多空收益波动比为2.63 10图9:超大单关注度因子5分组年化收益单调 10图10:因子4原始公式的拆分 图日内分钟收益波动5分组年化收益不单调 12图12:不同𝜆值下𝑉𝑀_ℎ𝑖𝑔ℎ(𝜆)和𝑉𝑀_𝑙𝑜𝑤(𝜆)的RankICIR绩效 12图13:𝑉𝑀_𝑑𝑖𝑓𝑓因子多空收益波动比为2.83 13图14:𝑉𝑀_𝑑𝑖𝑓𝑓因子5分组年化收益单调 13图15:在多空IR值上𝑉𝑀_𝑑𝑖𝑓𝑓略胜于理想振幅 13图16:交易情绪不稳定因子多空收益波动比为3.35 14图17:交易情绪不稳定因子5分组年化收益单调 14图18:主力控盘能力因子多空收益波动比为2.46 16图19:主力控盘能力因子5分组年化收益单调 16表1:四大类算子列示(部分) 5表2:3大类变量列示(部分) 5表3:遗传算法优选综合因子在不同股票域的测试结果皆较为优秀 7表4:遗传算法精筛因子明细 7表5:超大单关注度因子在其他样本空间依然具有一定选股能力 10表6:超大单关注度因子与传统Barra因子相关性不高 表7:超大单关注度因子与已有资金流因子相关性也不高 表8:因子4的公式定义 表9:相较于理想反转,标准化的分钟成交量波动也可改进传统反转因子 13表10:时序极差ts_max_to_min的应用 14表交易情绪不稳定性因子在其他样本空间依然具有一定选股能力 15表12:交易情绪不稳定性因子与传统Barra因子相关性不高 15表13:时序相关性算子ts_corr的应用 15表14:主力控盘能力因子在其他样本空间依然具有一定选股能力 16表15:主力控盘能力因子与传统Barra因子相关性不高 16相较于传统人工挖掘因子而言,遗传算法和神经网络是当下较为流行的挖掘因子的机器学习模型。其中遗传算法的优点在于公式的可视化,每个因子均可用算子树的形式展现,供我们在有一定变量和算子储备的前提下,最大程度的找到蕴含在背后的有效因子。本篇报告以遗传算法为基础,结合我们已有的特色变量和算子,尝试了量价因子的挖掘,具体从如下3大部分展开。在第一部分,我们介绍了遗传算法框架。其中在算子部分,我们创新性地引入了切割算子,其是我们的招牌因子理想反转、理想振幅等的来源;在变量部分,我们引入了日内量价、日间量价以及资金流相关指标;在遗传算法的具体流程上,我们从个体初始化到初始种群的生成,再到选择、交叉、变异,每一步都做了对应的针对性改写,使其更加高效的进行因子挖掘。200RankICIR3.5RankICIR为5.528超大单关注度因子,是对我们以往资金流研究的重要补充;第二,针对于理想反转和理想振幅而言,我们发现了替代的形式,丰富了收益率和振幅改进的手段;第三,我们利用日内分钟特征如分钟收益波动、分钟量价相关性,并结合算子“日间时序极差”定义了交易情绪不稳定性因子进一步发现了时序相关性的更多可能。1、开源金工特色遗传算法框架、算子的赋予:创造性引入切割算子4alpha方法。第三大类是横截面和时序算子的结合,这一类组合算子的加入有两点好处:1、减少公式长度的同时涵盖更多信息;2、丰富算子多样性。signdiff_signsign大类 例子 说明表1:四大类算子列示(部分)大类 例子 说明时序
切割算子
基本运算符 add、sub、mul、div等ols(x,y) yx取残差基本运算符 ts_sum、ts_mean、ts_median、ts_corr、delay等rolling_selmean_btm(x,d,n) 在过去d日上,根据y的值对x进行排序,取最小n个x的平均rolling_selmean_top(x,d,n) 在过去d日上,根据y的值对x进行排序,取最大n个x的平均值在过去d日上,根据y的值对x进行排序,rolling_selmean_diff(x,d,n)
取最大n个x的平均值与最小n个x的平均值的差值横截面和时序结合逻辑判断资料来源:研究所
ts_max_to_min(x,d) dx时序求最大值和最小值,并做差ts_meanrank(x,d) xd日上取均值sign(x) x>0,返回1;x<0,返回-1;x=0时,返回0diff_sign(x,d) 先计算x与过去d日均值的差,再使用sign函、变量的遴选:大小单资金流、日内分钟特征、日间特征3此之外我们也加入了一些衍生特色指标,比如分钟极端收益、分钟聪明度等;第三大类 例子 说明表2:3大类变量列示(部分)大类 例子 说明大小单资金流日内分钟特征日间特征资料来源:研究所
时序标准化的全部资金流 含有超大单、大单、中单、小单时序标准化的主动资金流 含有超大单、大单、中单、小单基本统计指标 分钟收益波动、分钟标准化成交量波动、分钟量价相关性衍生统计指标 分钟极端收益、分钟聪明度等基本统计指标 高、开、低、收等衍生统计指标 隔夜及日内收益、单笔成交金额等、遗传算法流程:针对性的改写对于遗传算法而言,除了变量和算子需要进行精细化处理,整体的流程也需要针对性的改写,大致的流程主要分为如下5步:20601~10RankICIR,若个体长群RankR>2且互相关系数不超过40。40%,331图1:开源金工特色遗传算法整体流程资料来源:研究所2、遗传算法的因子挖掘成果举例、遗传算法优选综合因子表现优异200RankICIR3.552(20131231-20211231)RankICIR5.81RankICIR4.13RankICIR5.52。53.8328.33%85.09%图2:遗传算法优选综合因子回测曲线较为优异数据来源:、研究所表3:遗传算法优选综合因子在不同股票域的测试结果皆较为优秀多空对冲多头全市场沪深300中证500中证1000全市场沪深300中证500中证1000年化收益率28.33%9.55%12.50%23.34%20.73%8.81%10.09%17.65%年化波动率7.40%6.29%7.29%7.94%26.89%21.07%24.42%28.94%收益波动比3.831.521.712.940.770.420.410.61最大回撤4.23%6.04%8.18%10.16%34.82%39.93%44.15%39.25%月度胜率85.09%67.54%72.81%82.46%57.89%54.39%56.14%57.02%数据来源:、研究所、沙里淘金:遵循“可解释”理念在上述的测算中,虽然整体的效果很好,但是遵循着“可解释”的理念,我们把目光聚集在了对我们以往研究有所补充的一些因子,争取从逻辑对其进行了一定程度的解释。表4:遗传算法精筛因子明细因子序号具体定义公式样本内样本外全区间因子1ts_correlation(asharemoneyflow_s_diff_value,delay(stockquote_ret,1),10)-4.20-2.23-3.80因子2ts_meanrank(ols(stockquote_ret,asharemoneyflow_l_diff_value),10)3.891.463.44因子3rolling_selmean_diff(asharemoneyflow_exl_diff_value_act,asharemoneyflow_s_diff_value,20,4)2.162.702.19rank_add(rolling_selmean_diff(stockminute_std,stockquote_close,20,4),因子4-4.53-5.87-4.68ts_max_to_min(stockminute_std,10))因子5rolling_selmean_top(stockquote_ret,stockminute_volume_distribution,10,1)-3.02-3.26-3.01因子6ts_max_to_min(ts_mean_standard(stockminute_volume_distribution,3),5)-3.66-5.02-3.77因子7ts_max_to_min(stockminute_rv_corr,6)-3.55-2.29-3.32因子8ts_covariance(stockminute_volume_distribution,stockquote_zf,10)-3.77-2.79-3.64数据来源:、研究所3、因子3的精细化讨论412123是新增的亮点而且和切割算子有关,所以我们把目光主要集中在因子3的讨论上。、主动超大单强度效果不佳535IC图3:主动超大单强度5分组年化收益不单调数据来源:、研究所、“小单强度”切割“主动超大单强度”敏感性分析3(1)选择小单强度较高的𝜆交易日,计算主动超大单强度均值𝐸𝑋𝐿𝐴𝐶𝑇_ℎ𝑖𝑔ℎ(𝜆);(2)𝜆交易日,计算主动超大单强度均值𝐸𝑋𝐿𝐴𝐶𝑇_𝑙𝑜𝑤(𝜆);从图4𝜆值的因子RnkCR1𝐸𝑋𝑇_𝑖ℎ(𝜆𝜆90%10%RankICIR(2)𝐸𝑋𝐿𝐴𝐶𝑇_𝑙𝑜𝑤(𝜆)𝜆90%10%RankICIR绝通过回测我们发现,主动超大单强度在不同小单强度域下,其蕴含的信息存在结构性差异。在小单强度比较高的部分,主动大单强度呈现正向选股效果,而在小单强度比较低的部分,主动大单强度却呈现负向选股效果。针对这一现象,我们尝试从行为金融学的角度对其进行解释:由于拆单现象的存在,小单中充斥着超大单的拆单产物,当机构看好某只股票时,其往往会以小单进货,再用具备足够市场关注度的超大单来抬升市场情绪,从而达到抬升股价收获利润的目的,所以在小单强度较高处的超大单强度有正向选股效果;相反,若机构不看好某只股票时,其往往会以小单出货,为了防止市场恐慌,机构往往会用超大单来稳住情绪来完成平稳出货,所以在小单强度较低处的超大单强度有负向选股效果。本篇报告将这种现象称之为:超大单的关注度效应。图4:不同𝝀值下𝑬𝑿𝑳𝑨𝑪𝑻_𝒉𝒊𝒈𝒉(𝝀)和𝑬𝑿𝑳𝑨𝑪𝑻_𝒍𝒐𝒘(𝝀)的RankICIR绩效数据来源:、研究所𝜆为20%𝐸𝑋𝐿𝐴𝐶𝑇_ℎ𝑖𝑔ℎ(20%)与𝐸𝑋𝐿𝐴𝐶𝑇_𝑙𝑜𝑤(20%)5574.4%。图主动超大单关注度子空收益波动比为2.08 图主动超大单关注度子5分组年化收益单调数据来源:、研究所 数据来源:、研究所、“小单强度”切割“全部超大单强度”敏感性分析3.2𝜆值下𝐸𝑋𝐿_ℎ𝑖𝑔ℎ(𝜆)和𝐸𝑋𝐿_𝑙𝑜𝑤(𝜆)RankICIR7(𝐸𝑋𝐿_ℎ𝑖ℎ(𝜆)𝜆从9010RankCR逐渐增大,且幅度近似于𝐸𝑋𝐴𝑇ℎ𝑖ℎ(𝜆)(2)𝐸𝑋𝐴𝑇𝑙𝑤(𝜆):随着切割比例𝜆从90%减小至10%的过程中,其RankICIR绝对值逐渐增大,且幅度要大于𝐸𝑋𝐿𝐴𝐶𝑇_𝑙𝑜𝑤(𝜆)。图7:不同𝝀值下𝑬𝑿𝑳_𝒉𝒊𝒈𝒉(𝝀)和𝑬𝑿𝑳_𝒍𝒐𝒘(𝝀)的RankICIR绩效数据来源:、研究所𝜆20%𝐸𝑋𝐿_ℎ𝑖𝑔ℎ(20%)与58RankICIR2.88,52.6382.4%,相图超大单关注度因子空益波动比为2.63 图超大单关注度因子5分年化收益单调数据来源:、研究所 数据来源:、研究所53000.650.175001.070.3710001.72和0.48。表5:超大单关注度因子在其他样本空间依然具有一定选股能力多空对冲多头全市场沪深300中证500中证1000全市场沪深300中证500中证1000年化收益率16.20%4.65%7.03%12.88%14.95%3.80%8.99%14.33%年化波动率6.16%7.18%6.57%7.47%27.37%21.79%24.58%29.68%收益波动比2.630.651.071.720.550.170.370.48最大回撤6.24%10.84%6.69%14.36%47.31%48.16%54.02%56.02%月度胜率82.40%61.60%62.40%72.00%53.60%52.80%52.00%53.60%数据来源:、研究所Barra6620%720%表6:超大单关注度因子与传统Barra因子相关性不高Beta价值杠杆盈利成长流动性动量非线性规模波动规模-8.66%-1.05%-6.43%1.34%0.52%-22.28%2.53%-4.10%-10.03%-13.98%数据来源:、研究所表7:超大单关注度因子与已有资金流因子相关性也不高主动买卖大单残差小单残差散户羊群大单残差2.0小单残差2.0散户羊群2.019.15%12.22%3.39%-10.4%8.64%2.20%-10.27%数据来源:、研究所4、因子4的精细化讨论对于因子4而言,其全区间RankICIR可以达到-4.68,公式定义如下:因子序号 具体定义公式 样本内样本外全区间表因子序号 具体定义公式 样本内样本外全区间4
rank_add(rolling_selmean_diff(stockminute_std,stockquote_close,20,4),ts_max_to_min(stockminute_std,10))
-4.53 -5.87 -4.68数据来源:、研究所但是具体观察其结构可以发现其为复合型因子,可以拆解成如下两部分:1、时序极差算子2、切割算子,这里我们将分别讨论这两部分。图10:因子4原始公式的拆分资料来源:研究所、切割算子部分的讨论42044首先计算了日内分钟收益波动过去20天均值,发现选股效果一般,5分组年化收益率为图11所示,并不单调。图11:日内分钟收益波动5分组年化收益不单调数据来源:、研究所进一步地,我们测算了不同股价下的日内分钟收益波动指标信息差异,方案如下所示:𝜆𝑉𝑀_ℎ𝑖𝑔ℎ(𝜆);𝜆𝑉𝑀_𝑙𝑜𝑤(𝜆);从图2𝜆值的因子ankCR(1𝑀_ℎ𝑖ℎ(𝜆)𝜆90%10%RankICIR(𝐸𝑋𝐴𝑇𝑙𝑜𝑤(𝜆𝜆从9010RankCR𝜆20%图12:不同𝝀值下𝑽𝑴_𝒉𝒊𝒈𝒉(𝝀)和𝑽𝑴_𝒍𝒐𝒘(𝝀)的RankICIR绩效数据来源:、研究所𝜆20%𝑉𝑀_ℎ𝑖𝑔ℎ(20%)与为𝑉𝑀_𝑑𝑖𝑓𝑓因子,其5分组绩效测算如图13所示。该因子整体绩效较为优异,RankICIR为-4.08,52.8379.82%。图13:𝑽𝑴_𝒅𝒊𝒇𝒇因子多空收益波动为2.83 图14:𝑽𝑴_𝒅𝒊𝒇𝒇因子5分组年化收益单调数据来源:、研究所 数据来源:、研究所相较于理想振幅因子,𝑉𝑀_𝑑𝑖𝑓𝑓因子只是将振幅换成了分钟收益波动率而已,80%。以此我们对比了新因子𝑉𝑀_𝑑𝑖𝑓𝑓和理想振幅的选股效果,5分组多空对冲结果如图15IR𝑉𝑀_𝑑𝑖𝑓𝑓图15:在多空IR值上𝑽𝑴_𝒅𝒊𝒇𝒇略胜于理想振幅数据来源:、研究所5表9:相较于理想反转,标准化的分钟成交量波动也可改进传统反转因子RANKICIR5分组多空IR多头IR多头年化收益多空年化收益单笔成交金额-2.892.460.5715.76%17.15%标准化的分钟成交量波动-3.112.440.4913.32%13.17%数据来源:、研究所、时序极差算子4ts_max_to_min6710表10:时序极差ts_max_to_min的应用变量RankICIR5分组多空IR多头IR多头年化收益多空年化收益分钟收益波动-2.722.640.5715.91%15.23%标准化的分钟成交量波动-3.382.700.5214.36%13.30%分钟量价相关性-2.382.560.5715.64%12.35%数据来源:、研究所103A5IR10IR2.5最后我们将这3个因子进行rank,16为3.3584.2%。图16:交易情绪不稳定因多收益波动比为3.35 图17:交易情绪不稳定因子5组年化收益单调数据来源:、研究所 数据来源:、研究所所3001.480.395002.010.4310002.82和0.49。接着,我们探讨了其与Barra风格因子的相关性,如表12所示。从表12可以看多空对冲多头全市场沪深300中证500多空对冲多头全市场沪深300中证500中证1000全市场沪深300中证500中证1000年化收益率18.89%8.14%11.33%17.66%17.68%8.64%10.80%14.54%年化波动率5.64%5.49%5.63%6.27%27.73%22.08%24.94%29.53%收益波动比3.351.482.012.820.640.390.430.49最大回撤3.67%7.92%3.34%6.25%40.75%43.29%46.61%49.29%月度胜率84.21%68.42%72.81%81.58%57.02%53.51%55.26%57.02%数据来源:、研究所表12:交易情绪不稳定性因子与传统Barra因子相关性不高Beta价值杠杆盈利成长流动性动量非线性规模波动规模6.03%-13.44%-4.09%-11.79%-2.37%18.09%-2.22%-4.77%22.98%-11.61%数据来源:、研究所5、因子8的精细化讨论8一般来说,随着日内成交量波动的放大,日度振幅往往也会加大,不同股票的差别存在于幅度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版房建木工劳务合同合同解除与终止流程范本3篇
- 2025年度农产品电商销售合同履约保障与风险控制
- 2025年度留学贷款协议书模板
- 二零二五年度环保产业租赁空地开发合同
- 二零二五年度信息技术行业软件开发派遣合同书
- 2025版土方外运合同范本:安全施工风险防控协议6篇
- 2025年度银行开户后合规审查与风险预警服务合同
- 2025年度游乐场电路安全检测与改造综合服务协议
- 二零二五年度解除劳动合同及员工安置方案告知书
- 2025年度解除债权转让担保合同标准文本
- 《色彩基础》课程标准
- 人力资源 -人效评估指导手册
- 大疆80分钟在线测评题
- 2023年成都市青白江区村(社区)“两委”后备人才考试真题
- 2024中考复习必背初中英语单词词汇表(苏教译林版)
- 《现代根管治疗术》课件
- 肩袖损伤的护理查房课件
- 2023届北京市顺义区高三二模数学试卷
- 公司差旅费报销单
- 2021年上海市杨浦区初三一模语文试卷及参考答案(精校word打印版)
- 八年级上册英语完形填空、阅读理解100题含参考答案
评论
0/150
提交评论