建筑-金融工程研究报告:基于随机森林算法的信用风险识别模型_第1页
建筑-金融工程研究报告:基于随机森林算法的信用风险识别模型_第2页
建筑-金融工程研究报告:基于随机森林算法的信用风险识别模型_第3页
建筑-金融工程研究报告:基于随机森林算法的信用风险识别模型_第4页
建筑-金融工程研究报告:基于随机森林算法的信用风险识别模型_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于随机森林算法的信用风险识别模型三个阶段。2015-2017年,逐步出现违约事件家发行主体违约,涉及债券数量47只,违约金额年化超额5.64%年化波动3.83%传统的债券违约模型包括被广泛应用的AltmanZ-score,通过计算财务年化超额5.64%年化波动3.83%相关报告《红利指数的投资价值分析》《上月波动率、规模、价值因子表现较优》《主动权益基金规模变化拆解和市场判断》相关报告《红利指数的投资价值分析》《上月波动率、规模、价值因子表现较优》《主动权益基金规模变化拆解和市场判断angqi_5636iangyh1@n可一定程度上增强组合表现,规避信用暴雷的影响。以可转angqi_5636iangyh1@n请务必阅读正文后的声明及说明2/ 4 4 6 82.1.逻辑回归(LogisticRegression) 8 92.3.极端梯度提升(XGBoost) 103.1.模型搭建准备 3.4.模型效果对比 23 23 24 26 27 27 28请务必阅读正文后的声明及说明3/30 4 5 5 5 5 6 6 7 7 7 8 9 9 请务必阅读正文后的声明及说明4/2018-2021年,信用债违约风险的集中暴露引起了广泛的关注,近几年违约局势逐业周期背景下,今年违约金额出现小幅提升,曾被认作1576.50亿元。2022年后形势转好,违违约家数违约只数违约金额(亿,右轴)2502000 85323257 47 2828 211,8001,6001,4001,2001,00060020002015201620172018201920202021202220232024请务必阅读正文后的声明及说明提前到期未兑付u提前到期未兑付u未按时兑付回售款和利息本金违约展期资金未兑付-利息违约触发交叉违约未获得豁免u技术性违约3.19%3.19%11.02%52.41%25.95%9.96%40.79%16.12%23.70%9.96%40.79%16.12%23.70%提前到期未兑付未按时兑付回售款和利息本金违约展期资金未兑付触发交叉违约未获得豁免技术性违约u未按时兑付回售款uu公司债短期融资券定向工具企业债-资产支持证券可交换债可转债u其他债券50.59%.7.51%50.59%.7.51%24.21%u公司债资产支持证券短期融资券定向工具企业债可交换债可转债u其他债券47.67%6.26%8.55%8.72%23.26%约金额的22.38%。交运、商贸零售、建筑装饰请务必阅读正文后的声明及说明aa违约债券数量——违约金额占比(右轴)300250200500电子社会服务纺织服饰电力设备非银金融电子社会服务纺织服饰电力设备非银金融通信机械设备钢铁食品饮料公用事业计算机医药生物有色金属汽车煤炭基础化工建筑装饰商贸零售交通运输房地产25494957463 40384128242830332522 35%30%25%20%15%10%5%0%值得注意的是,具有AA及以上评级主体的违约债券数量与金额同样不容忽视,包aa违约债券数量——违约金额占比(右轴)600500400300200056767679292824448444860%50%40%30%20%10%CBBBAAAAAAA+CCAA-BBBACCCA+A-主体信用评级下调常被视作风险预警信号,在发请务必阅读正文后的声明及说明发行主体数量债券数量(右轴)250200500 224 63 12000100008000600002015201620172018201920202021202220232024发行主体数量806040200汽车钢铁汽车钢铁机械设备有色金属商贸零售交通运输非银金融银行基础化工房地产煤炭建筑装饰6359545348404039363426u短期融资券u短期融资券u公司债定向工具企业债金融债可转债u可交换债42.64%42.64%21.35%请务必阅读正文后的声明及说明010290757360323227242323137674传统的债券违约模型大致有线性和非线性两种类型。线性模型包括被广泛应用的财务指标的选取较少,存在不够全面的可能性。非线性模型中最具有代于期权定价理论的Merton模型,将企业违约定义为企业资产价值小于债务账面价值,使用Black-Scholes公式对企业股票和负债进近年来,由于机器学习算法对变量形式限制较少且具有一模型假设,兼顾样本内拟合优度和样本外预测能力,适用于进行二分类的逻监督学习算法被逐渐应用于债券市场。Logistic回归是一种广泛应用于统计学和机器学习领域的算法,特别是在二分类问题中,可用于进行分类或概率预测,通过使用逻辑函数(logisti的图像,即任何实数x代入所得的输出均在估计(MLE)进行拟合寻找最优参数β:请务必阅读正文后的声明及说明树在训练时使用不同的数据子集和特征子集,数据子集通过带放回的抽样从原练数据中获得,特征子集从原始特征集中随机抽取,最终使用取均值或投票的综合每棵树的结果作为最终的预测或分类。重要性,有助于进行特征筛选和数据分析。一深度、特征选择数量等参数来优化模型,提请务必阅读正文后的声明及说明10/XGBoost(eXtremeGradientBoosting)属于梯度提展,通过迭代地添加新的决策树去拟合前一颗树余下的残差,来最小化损失函数,同时在损失函数中加入了正则化项,包括L1和L2,并在训练结束调事件作为样本,选取财务及量价数据作为特征,以每年三个在寻找特征时,首先是能够直观体现企业资本结构及运营情况的各鉴国内多家信用评级公司的评级逻辑,分别选取反映企业偿债能力长能力的多项财务比率,同时叠加使用东北金工因子库中的基本面其次,考虑到信用债自身的特性,选取和债券性质相请务必阅读正文后的声明及说明分类指标名称计算方式字段名称偿债能力财务指标流动比率流动资产/流动负债现金比率经营活动产生的现金流量净额/流动负债流动负债比率流动负债/总负债资产负债率总负债/总资产DEBT_TO_ASSET已获利息倍数EBIT/利息费用EBIT_TO_INT_EXP_TTM有形资产负债比有形资产/带息债务TAN_ASSET_TO_INT_DEBT营运能力财务指标存货周转率营业成本/平均存货应收账款周转率营业收入/平均应收账款流动资产周转率营业收入/平均流动资产ACUR_ASSET_TURNOVER_TTM盈利能力财务指标ROE净利润/股东权益EARNING_TTMROA净利润/总资产销售净利率净利润/营业收入成长能力财务指标总资产同比增长相对去年同期总资产增长率EUQITY_ASSET_YOY股东权益同比增长相对去年同期股东权益增长率营收同比增长单季度营业收入同比增长REV_PROFIT_QFA_YOY净利润同比增长单季度净利润同比增长股票量价指标平均收盘价过去20个交易日平均收盘价AVE_CLOSE_20D过去120个交易日累计成交量平均换手率过去120个交易日平均换手率过去120个交易日累计收益市值流通市值自然对数股票基本面因子异常现金流因子来源东北金工因子库,详见往期报告AB_CF_FAC净经营负债因子NOL_FAC短贷长投因子债券性质类指标余额债券余额剩余期限债券剩余期限利率债券票面利率INTEREST_RATE最新主体评级发行主体最新国内评级机构评级,从C到AAA分别以1-18代替LATEST_ISSUER_RAITING_SC在有关信用风险的研究中,数据不平衡性一直是需重点处理的问题例相对于非违约案例来说数量极少,这种不平衡会导致模型偏向于预测过采样(Oversampling)和欠采样(Undersampling)是处理不平衡数据集的两种常用技术。过采样通过复制少数类的样本或者生成合成样过拟合的风险。欠采样通过随机选择或基于某种策略选择多数类的样本进行删除,直到多数类和少数类的样本数量相等或接近,但存在丢失信请务必阅读正文后的声明及说明12/下调事件,剔除数据缺失较多的债券,且对于在同一报告期发生信用训练集测试集信用风险样本LABEL=12022/10/31前发生信用事件的债券,样本数295只2022/10/31-2024/08/15发生信用事件的债券,样本数95只正常样本LABEL=02022/10/31截面上存续的未发生信用事件的债券2024/08/15截面上存续的未发生信用事件的债券所有违约/信评下调债券,从正常样本中随机抽取相同数量的子集共同组成训练集。的形式展示了模型预测的结果与实际标签之间的关系,同时可用于计算多种指标,请务必阅读正文后的声明及说明13/同召回率)与假阳率(FalsePositiveRate,FPR)之间的关系,直观TPR与FPR计算公式如下:TPFP鉴于信用模型的目的为进行风险预警,当召回样本中识别出的概率越高,因此同样选取召回率作为评估标准之一。问题,但是同样可能会对最终输出的事件发生偏高,可使用贝叶斯公式对条件概率进行还原。使用欠采样的训练集训练所得模型预测的概率为条件概率P(D|B,x),但实际的概率应为P(D|x)。为解释分析两个概率之间的关系,使用贝叶斯公式对P(D|B,x)进行拆解:请务必阅读正文后的声明及说明14/在欠采样中,所有信用事件样本均被选入训练集,所以P(B|D,X)=1。P(B|,X在搭建训练模型时通常涉及到多个参数的调整优化,例如在随机森它通过将数据集分成几个部分,然后使用其中的一部分进验证模型的性能,从而减少模型对特定样本的依赖,提高模型的泛试集,其余4个子集联合作为训练集;这个过基于所有5次迭代的平均结果,选择出得请务必阅读正文后的声明及说明15/按照前文所述方式将2017/01/01-2024/08/15数据划分为训练集和测试集,采用欠采请务必阅读正文后的声明及说明16/指标名称字段名称选择比例营收/净利润同比增长应收账款周转率ROE/ROA/销售净利率票面利率最新主体评级已获利息倍数短贷长投因子99.70%有形资产负债比97.80%异常现金流因子AB_CF_FAC96.10%平均换手率95.40%93.80%平均收盘价AVE_CLOSE_20D89.70%剩余期限87.50%流动负债比率84.90%流动资产周转率67.80%存货周转率59.30%现金比率55.00%净经营负债因子52.50%流动比率35.60%31.50%股东权益/总资产同比增长28.80%资产负债率26.70%股票市值、股票收益、短贷长投基本面因子以及利率。偿债能力、能力、公司股票表现相关的指标,与信用风险的关联易于理解,对而高票面利率常意味着需承担更高的信用风险,因此利率项的系数为正。短贷长投,是指公司将短期信贷资金投放于长期投资项目的非正常财务现象请务必阅读正文后的声明及说明17/请务必阅读正文后的声明及说明18/债券名称债券代码发行人名称发行人代码债券类型信用风险事件预测概率调整概率景峰医药000908.SZ公司债98.53%96.78%21迪马01迪马股份600565.SH公司债91.70%300853.SZ评级下调91.64%盟升转债盟升电子688311.SH评级下调90.65%20中化岩土MTN001002542.SZ评级下调79.74%002717.SZ评级下调与违约78.41%688680.SH评级下调79.10%63.00%688030.SH评级下调78.96%62.81%002822.SZ评级下调77.86%61.28%科达转债603660.SH评级下调66.43%47.11%300486.SZ评级下调62.64%43.00%宏图转债航天宏图688066.SH评级下调59.88%40.18%泉峰转债泉峰汽车603982.SH评级下调59.02%39.32%300511.SZ评级下调58.94%39.25%芳源转债芳源股份688148.SH评级下调58.85%39.16%002092.SZ公司债评级下调53.55%34.15%002370.SZ评级下调52.22%32.97%603377.SH评级下调46.89%28.43%龙大转债龙大美食002726.SZ评级下调46.32%27.97%翔鹭转债翔鹭钨业002842.SZ评级下调45.80%27.55%300967.SZ评级下调44.09%26.19%002798.SZ评级下调43.45%25.69%科蓝转债科蓝软件300663.SZ评级下调41.15%23.94%603978.SH评级下调37.54%21.29%塞力转债塞力医疗603716.SH评级下调37.43%21.21%宏辉转债宏辉果蔬603336.SH评级下调35.37%002806.SZ评级下调32.17%首华转债首华燃气300483.SZ评级下调31.13%联创转债联创电子002036.SZ评级下调27.96%嘉元转债嘉元科技688388.SH评级下调26.49%300016.SZ评级下调24.98%联泰转债联泰环保603797.SH评级下调21.90%300190.SZ评级下调21.64%三房转债三房巷600370.SH评级下调20.88%002645.SZ评级下调9.28%灵康转债灵康药业603669.SH评级下调9.16%600745.SH评级下调002174.SZ评级下调7.45%603608.SH评级下调飞凯转债飞凯材料300398.SZ评级下调603081.SH评级下调002455.SZ评级下调4.94%600567.SH评级下调4.93%上海沪工603131.SH评级下调3.80%广汇转债广汇汽车600297.SH评级下调7.70%3.62%000688.SZ评级下调0.79%请务必阅读正文后的声明及说明19/按照同样方式划分训练集和测试集,采用欠采样技术平衡训练集随机森林的参数,包括单颗决策树的最大深度以及抽取特6050406050402006单颗决策树抽取特征数量分布25205014656722897321请务必阅读正文后的声明及说明20/30计算特征的平均重要性,其中排名前10的特征分别ROE/ROA/销售净利率、120个交易日累计成交量、营收/利润同比增长、总资产/股东权益同比增长、流动负债比率、存货周转率、120个交易日累计收益、应收模型所得特征解释力度与通常的主观理解保持一致。对于信用风险较高的债代表盈利能力的ROE/ROA/销售净利率、代表营运能力的应收账款/存货周转率、代表成长能力的营收/净利润/总资产/股东权益同比增长,均为评估企业营业情况的重市公司股票的流动性与收益表现,可用于规避退市风险,同时代表着上市公司的预期。请务必阅读正文后的声明及说明21/30指标名称字段名称Importance票面利率INTEREST_RATE21.65%已获利息倍数EBIT_TO_INT_EXP_TTM19.70%ROE/ROA/销售净利率EARNING_TTM11.68%累计成交量CUM_VOLUMN_120D7.79%营收/净利润同比增长REV_PROFIT_QFA_YOY4.75%股东权益/总资产同比增长EQUITY_ASSET_YOY4.67%流动负债比率CUR_TO_DEBT4.46%存货周转率INV_TURNOVER_TTM3.30%累计收益RET_120D2.96%应收账款周转率ACC_REV_TURNOVER_TTM2.60%平均收盘价AVE_CLOSE_20D1.63%剩余期限REMAINING_TIME1.63%流动资产周转率CUR_ASSET_TURNOVER_TTM1.62%市值LOG_MV1.56%平均换手率TURNOVER_RATE_120D1.24%短贷长投因子SFLI_FAC1.16%异常现金流因子AB_CF_FAC1.08%现金比率OPER_CF_TO_CUR_LIB1.06%余额REMAINING_AMOUNT1.04%资产负债率DEBT_TO_ASSET1.03%有形资产负债比TAN_ASSET_TO_INT_DEBT0.92%净经营负债因子NOL_FAC0.91%流动比率CURRENT_RATIO0.89%最新主体评级LATEST_ISSUER_RAITING_SCORE0.68%请务必阅读正文后的声明及说明22/30债券名称债券代码发行人名称发行人代码债券类型信用风险事件预测概率调整概率21迪马01178578.SH迪马股份600565.SH公司债违约94.45%88.44%科达转债113569.SH苏州科达603660.SH可转债评级下调87.30%75.56%联泰转债113526.SH联泰环保603797.SH可转债评级下调87.07%75.20%东时转债113575.SH东方时尚603377.SH可转债评级下调86.88%74.87%联创转债128101.SZ联创电子002036.SZ可转债评级下调86.49%74.24%芳源转债118020.SH芳源股份688148.SH可转债评级下调86.38%74.06%127033.SZ中装建设002822.SZ可转债评级下调85.94%73.34%16景峰01112468.SZ景峰医药000908.SZ公司债违约83.75%69.88%岭南转债128044.SZ岭南股份002717.SZ可转债评级下调与违约82.59%68.09%首华转债123128.SZ首华燃气300483.SZ可转债评级下调82.11%67.38%20中化岩土MTN001102001749.IB中化岩土002542.SZ中期票据评级下调82.02%67.24%东杰转债123162.SZ东杰智能300486.SZ可转债评级下调81.39%66.31%天创转债113589.SH天创时尚603608.SH可转债评级下调80.09%64.41%雪榕转债123056.SZ雪榕生物300511.SZ可转债评级下调80.00%64.28%晓鸣转债123189.SZ晓鸣股份300967.SZ可转债评级下调79.61%63.72%亚药转债128062.SZ亚太药业002370.SZ可转债评级下调79.06%62.95%游族转债128074.SZ游族网络002174.SZ可转债评级下调79.02%62.89%科蓝转债123157.SZ科蓝软件300663.SZ可转债评级下调78.84%62.65%申昊转债123142.SZ申昊科技300853.SZ可转债评级下调78.28%61.85%灵康转债113610.SH灵康药业603669.SH可转债评级下调77.68%61.03%19新化01114543.SZ中泰化学002092.SZ公司债评级下调76.22%59.06%帝欧转债127047.SZ帝欧家居002798.SZ可转债评级下调76.15%58.97%山石转债118007.SH山石网科688030.SH可转债评级下调74.71%57.07%北陆转债123082.SZ北陆药业300016.SZ可转债评级下调74.22%56.43%泉峰转债113629.SH泉峰汽车603982.SH可转债评级下调72.83%54.67%广汇转债110072.SH广汇汽车600297.SH可转债评级下调72.13%53.80%嘉元转债118000.SH嘉元科技688388.SH可转债评级下调71.89%53.51%华宏转债127077.SZ华宏科技002645.SZ可转债评级下调70.66%52.01%海优转债118008.SH海优新材688680.SH可转债评级下调68.52%49.48%维尔转债123049.SZ维尔利300190.SZ可转债评级下调67.95%48.82%宏图转债118027.SH航天宏图688066.SH可转债评级下调67.01%47.76%百川转2127075.SZ百川股份002455.SZ可转债评级下调65.59%46.17%翔鹭转债128072.SZ翔鹭钨业002842.SZ可转债评级下调64.41%44.89%山鹰转债110047.SH山鹰国际600567.SH可转债评级下调63.49%43.90%龙大转债128119.SZ龙大美食002726.SZ可转债评级下调63.07%43.46%塞力转债113601.SH塞力医疗603716.SH可转债评级下调62.84%43.21%盟升转债118045.SH盟升电子688311.SH可转债评级下调62.81%43.18%华锋转债128082.SZ华锋股份002806.SZ可转债评级下调58.11%38.43%三房转债110092.SH三房巷600370.SH可转债评级下调56.20%36.60%新星转债113600.SH深圳新星603978.SH可转债评级下调47.80%29.18%沪工转债113593.SH上海沪工603131.SH可转债评级下调40.07%23.13%宏辉转债113565.SH宏辉果蔬603336.SH可转债评级下调31.24%16.97%国城转债127019.SZ国城矿业000688.SZ可转债评级下调26.01%13.66%闻泰转债110081.SH闻泰科技600745.SH可转债评级下调22.01%11.27%飞凯转债123078.SZ飞凯材料300398.SZ可转债评级下调16.88%8.37%大丰转债113530.SH大丰实业603081.SH可转债评级下调9.63%4.58%请务必阅读正文后的声明及说明23/30秉持着“宁可信其有不可信其无”的原则,召回率更高的随机森林模型Logistic回归随机森林平均AUC0.840.75平均召回率0.550.86重要特征票面利率票面利率ROE/ROA/销售净利率ROE/ROA/销售净利率营收/净利润同比增长营收/净利润同比增长已获利息倍数已获利息倍数股票累计收益股票累计收益应收账款周转率应收账款周转率市值股票累计成交量短贷长投因子股东权益/资产同比增长有形资产负债比流动负债比率最新主体评级存货周转率上增强组合表现,规避信用暴雷的影响。本节以可转债为例,以来,信用事件发生后1个月内,可转债区间博弈而产生的超过50%的涨幅最低-34.74%,区间振幅中位数10.42%,最高请务必阅读正文后的声明及说明24/30o1M区间收益(%)300-10-20-3000807050403020o1M区间振幅(%)在2022半年报后的每个业绩期(04/30,08/31,件的转债进行排除处理,观察信用增强前后可转债因子的回测表现。区间设置为权,基准设置为所有满足条件转债的市值加权组合。vari,t为转债i自身在t时刻的波动,covi,j,t为转债i和j在t时刻的协方差,wi,t,wj,t一化,求得每支转债在市场组合中的波动贡献占比作信用增强后,今年以来因子多头表现显著改请务必阅读正文后的声明及说明25/30信用增强前信用增强后收益波动夏普比率最大回撤收益波动夏普比率最大回撤2022/12/310.09%9.15%0.019.30%0.00%9.23%0.009.30%2023/12/316.62%5.54%1.194.73%7.83%5.53%1.424.86%2024/8/19-7.19%7.93%-0.918.63%-5.68%7.53%-0.757.86%年化-0.38%7.69%-0.059.30%0.63%7.62%0.089.30%信用增强前信用增强后收益波动信息比率最大回撤收益波动信息比率最大回撤2022/12/319.56%4.90%1.953.05%9.47%4.94%1.913.05%2023/12/317.42%2.94%2.523.12%8.64%3.08%2.812.86%2024/8/19-1.80%2.93%-0.624.60%-0.21%2.99%-0.073.88%年化5.64%3.83%1.474.60%6.71%3.89%1.723.88%请务必阅读正文后的声明及说明26/30信用增强后,今年以来多头超额提升至2.60%,超额最大信用增强前信用增强后收益波动夏普比率最大回撤收益波动夏普比率最大回撤2022/12/31-5.01%9.65%-0.529.84%-4.34%9.76%-0.449.42%2023/12/312.02%5.20%0.394.66%1.57%5.29%0.304.55%2024/8/19-3.67%8.39%-0.449.73%-2.80%8.28%-0.349.94%年化-2.59%7.93%-0.3311.06%-2.16%7.97%-0.2710.25%请务必阅读正文后的声明及说明27/30信用增强前信用增强后收益波动信息比率最大回撤收益波动信息比率最大回撤2022/12/313.54%3.62%0.983.43%4.27%3.80%1.123.43%2023/12/312.75%2.51%1.101.69%2.29%3.08%0.742.94%2024/8/191.69%3.31%0.512.14%2.60%3.76%0.691.98%年化3.03%3.17%0.963.43%3.48%3.54%0.983.43%1576.50亿元。2022年后形势转好,违约主体数和为样本,选取能够直观反映企业资本结构及运营情况的各相关的股票量价信息、以及债券性质相关的指标作为特征

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论