基于非线性组合模型的P2P网贷平台危机预警研究_第1页
基于非线性组合模型的P2P网贷平台危机预警研究_第2页
基于非线性组合模型的P2P网贷平台危机预警研究_第3页
基于非线性组合模型的P2P网贷平台危机预警研究_第4页
基于非线性组合模型的P2P网贷平台危机预警研究_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、财经理论与实践2017,06(38),23-28基于非线性组合模型的p2p网贷平台危 机预警研究张颖黄洁婷贺正楚中南大学商学院导出/参考文献关注分享收藏打印摘要:针对p2p网贷平台现金流较大、利润率较低和财务数据获取困难的特点,构建基 于平台交易真实数据的危机预警评价指标体系和组合预测模型。将传统的财务评 价指标转换成网贷平台交易数据指标,运用邻域粗糙集属性约简的方法对采集 的数据指标进行降噪和约减处理,再基于机器学习理论引入神经网络、支持向量 机和logit回归等模型对数据进行训练。通过分组进行单模型和组合模拟预测, 提高了新的破产指标下各模型预测的准确率。关键词:p2p网贷;危机预警;组合

2、模型;神经网络;支持向量机;作者简介:张颖(1968),男,湖南长沙人,博士,中南大学商学院教授,研 究方向:产权经济学,技术进步与创新。收稿日期:2016-12-03基金:基金项冃湖南省金融工程与金融管理研究中心(16jdzd01)crisis prediction for p2p platformbased on nonlinear combination modelzhang ying huang jieting he zhengchubusiness school, central south university;abstract:based on the character is

3、tics of asse t-ligh t, large cash flow, low profit and difficulty in financial data acquisition, evaluation index system and the comb in ati on prediction model for crisis predicti on based on the real data of platform trcinsciction were constructed. the traditional bankruptcy financial cvaluation i

4、ndex was transformed into the net loan transaction data index and the collected data was reduced by the method of neighborhood rough set. on this basis, the data was trained with the machine learning theory which introduced neural network and support vector, logit regression machine model and so on.

5、 finally, the data was divided into single group and combination group for predictive simulation and the accuracy of each model under the new bankruptcy index was obtained.keyword:p2p; crisis prediction; combination prediction model; neural network;svm;received: 2016-12-03一、导论p2p网贷平台作为一个新兴的个人对个人的投资借

6、贷平台正处在一个快速成长 阶段,现有监管大多为事后监管,对于事前预测特别是基于网贷平台外部数据 的科学预测理论和应用准备不足4。网贷平台具有挤兑风险,贷款逾期发生时, p2p网贷平台会岀现暂时的流动性不足,一旦放款人之间协调失败就会导致平 台出现挤兑风险2, 3。p2p网贷平台陷入经营困境的整个过程是动态发牛的, 若能在p2p平台陷入经营困境早期就发现征兆,并能预测生存状况恶化的一系 列动态过程,这对于平台的经营者、投资者和行业监管者,都将有着非凡的意 义。现有文献当中,潘庄晨等梳理债权产品和产权产品的信用风险评价模型,认为 互联网金融企业更加适合偏重定价功能的产权产品风险评价模型凹;周少甫对

7、 2 193家网贷平台使用logit模型进行研究,认为网贷平台能够提供良好的资金 保障、具备健全的资金托管制度和流动性较高的债权转让方式,可有效降低平台 出现重大经营问题固。常用的风险预警模型主要有多元判别分析、logistic回 归模型、神经网络、fr模型、stv截面回归模型和klr信号分析模型等。由于 logistic回归模型对变量的分布、变量之间的协方差没有过多的假设要求,因 此被广泛用在信用风险预警,且国外的许多研究都表明logistic冋归模型比较 有效6,7。庞素林等利用logistic回归模型构建风险预警模型,并以实证研究 证明模型的高效性8-10。现有文献对p2p平台经营困境的

8、预警研究较少,具有一定的研究价值。本文主要 研究通过使用最新的前沿信息技术,构建科学的评价体系和危机预警模型,识 别问题网贷平台,预测p2p网贷平台的危机风险。二. p2p网贷平台危机预警指标选择与约简本文针对p2p网贷平台的特点,提出基于真实交易数据的评价思路,以交易数 据代替财务数据保证数据真实性。一方面,从理论基础、国内外文献及国内主管 部门监管指导意见选择能反映p2p网贷平台运营和风险的相关指标;另一方面, 根据p2p网贷平台所具有的互联网大数据特性,通过业内门户网站、网贷之家、 网贷天眼收集。同时,将数据指标进行科学处理,并对结果进行检验,从而尽可 能的保证风险评价指标的科学性、可信

9、性。力求用最少的可观测指标,尽量多的 反映平台运营风险信息。(-)危机预警原始评价指标选择本文将能够观测到的p2p网贷平台微观指标纳入评价范围,尽量确保评价指标 的完整性。使用的各项指标数据來源于p2p网贷平台第三方统计网站,所有数据 都能够做到逐月更新,其中大多数数据能够做到逐日更新,保证了经过建模处 理过的风险值能够每月(毎h)连续输出。在数据采集过程中,抓取的信息包括: 平台每日成交量、平均利率、投资人数、平均贷款期限、借款人数、累计待还金 额等指标作为破产预测的客观抓取指标,如表1所示。选择指标指标解释成交量/万元平台当月的成交金额,成交量盘 金额,可能与最终实际放款额; 町以反映当日

10、成交情况。成交 平台当月没有满标成功情况卫平均利率/%平均利率为平台发标全部利率 台会根据门己融资水平发放一 个标的总结相差不多9因此每彳 基本可以反映该平台总体的收投资人数投次人数为注册用户投标人数平均贷款期限/月为每一标的平均借款的时间必 还清存量贷款的平均时间。借款人数借款人数表示的是当时在平台累计待还金额累计待还金额是平台到目前 总额同样运用企业破产理论思想和平台信用理论,在直接抓取指标的基础上通过计 算可以得到更多的特性,通过更多的相关维度反映平台破产风险。主观构造数据 如表2所示。(-)基于邻域粗糙集(nrs)的指标约简属性约简就是对知识的依赖度和相关度进行重新筛选,删除不相关或者

11、不重要 的知识。本文利用邻域粗糙集的约简方法对指标进行约简。定义1对于信息系统t=<u, a, v, f>,其中u=xb x2, : x表示非空有限集 合,i称为论域。a是属性集合,v是值域。f:uxa-v是一个信息函数,表示样 本与其属性取值的对应映射关系。如果a二bud,其中b是条件属性,d是决策属 性,贝ij<u, a, v, f>称为一个决策表。对xi的邻域5定义为:5 g) =x|xeu, (x, xj w 6 ,其中,5 20。表2主观构造数据特征表下载原表选择指标累计待还款金额消化天数/月累计待还款金彳累计月均待还款金额/万元累计待还款金彳累计待还金额月均

12、还款利息/ 万元(累计待还金盘化利率/12)理财人活跃度投资人数/借款人均理财金额/万元成交金额/理财月均还款金额占投资金额比(累计待还金客! 月交易量)定义2给定一邻域决策系统mds二(u, aud),决策属性d将论域u划分为n个等价类(xb x2, : xn) ,则决策屈性d关于子集b的上、下近似分别为:n = u nbx,(1)r- ind = u(2)具中,nbx = |nbx =几(”)匚 x 八2决策系统的边界为:bn(d) = nid 一 mq(3)三、网贷平台的破产组合预测模型构建口前,应用在网贷平台风险评估领域的单一模型都能够做出很好的分类结果, 但是仍然存在着很多问题,比如

13、精度述不够好,稳健性不够强,精度和稳健性 不能兼备等。因此,本文依靠组合模型来解决这些问题。组合预测中,将所有单 一模型中所包含的数据信息内容,都进行集结,提高精准性和稳健性。在单一模 型的选择上,本文从数理统计方法和人工智能方法中选取国内外p2p网贷风险 评估领域使用较多的且国际上目前较为流行的方法來作为单一模型,它们分别 是logistic回归、神经网络和支持向量机。(-)单一危机预警模型1. logit回归预测。logit可以针对数据量匮乏、质量低的情况进行判别,不要求变量满足多元正态 分布等假设条件,可以直接预测出事件发生的概率11。定义1某一事件发生与否分别用1和0表示,“1”表示事

14、件发生,而“0”表示 事件未发生,某一事件发生与否为被解释变量,用£表示,用x,表示某一事件 的自变量,若存在误差项时,则百的冋归模型为:yi = f (a + xq) + r由如上可知,yi的分布函数为:pi二p (£二l|xj ,即yi为1的概率。p (yklxj =1-p (yi=l|xj ,表示yi为0的概率。其中pie0, lo定义2 logistic分布函数表达式为:p(£ = 1) = a = i+e【,s(5)式(4)可得:叫七通过式(6)可以看出,xi每变化一个单位,某事件发牛的概率比就会变化b个 单位。(式6)不仅是&的线性函数,也是b

15、的线性函数,(式6)称为logit 模型。2. bp神经网络预测。定义3 xi (j=l, 2, : n)为神经元j的输入信号,为连接权重,g是输入 信号线性组合后的输出,也是神经元i的净输入。弗为神经元的阈值,百为经 阈值调整后的值,f ()为神经元的激活函数12-14°函数f ()表达了神经元的输入输出特性,在m-p模型屮,f定义为跳阶函数:(1 9 ui0o,*o其中,f ()是bp神经元的激励函数,最常用的形式是sigmoid函数,数学表 达式为:f (x)二(1+e) , a为常数。3. 支持向量机(svr)预测。对于给定的训练集t= (xb yj ,,(xb y1) e

16、(xx y),其中 xiex=r, yey=r, i二1,,1,使用非线性映射函数 (x)把输入向量x映射到特征空间,然后 在高维特征空间进行线性冋归匸世1。令f (x) =w (x) +b,其中w表示权向量, b表示偏差,f (x)为回归函数。在不敏感损失函数下,引进松弛变量§二 (j,,j, j)和惩罚参数c (控制对超岀误差£的样本的惩罚程度),构建二次规划原始问题:t11mint (zv 拓(咲)阮吧,” *)cr"rc +士(£+&)7=1/(x) w £ + g i = 19 异subject to yi 一 /q) 

17、63; £ + g*i = lz > 0i = 1,2 9 ,z利用lagrange函数可得svr的决策函数:/()=工(n: 西)k(乙,=)+"(8)(二)基于贝叶斯算法的投票式组合预测模型在上述三种单一模型的基础上,引进贝叶斯算法來对三种模型的预测结果进行 投票,将三种单一模型的输出结果作为贝叶斯算法的输入项计算出基于贝叶斯 算法的投票式组合预测结果15 o定义4假设有xi个样本,i=l, : n。n为测试样本数量,1寿代表样本的分类结 果,j二0或1,分别代表属于正常平台和属于破产平台,则样本xi抽取到的情况 下样木x.ep.发牛的概率p (x.ep, x.)

18、被定义为基于贝叶斯算法的投票式组合 预测后验概率。p(x e pjxe p»p(x §p(xji =n ; j = 0 91由式(9)可知贝叶斯后验概率取决于样本x出现在类别pj中的概率p (x.xgpj) 以及类别pj在样本中出现的概率p (x(pj) o样本x是由n个样本所构成,其取值取决于上述三种模型的预测结果。x1oorl oorl oorlx2oorl oorl oorl / a= y:jxioorl oorl oorlxoorl oorl oorlp(xq =抽取到每一个样本的概率相同,即p(x2)=p(xq =丄,pcx,x e p»u和p (xiw

19、p)在本文屮则要根据破产平台和正常平台出现的概率来确定。根据贝叶斯算法得出组合预测的结果,比较类别p°和类别pl对应的贝叶斯后验 概率值,选择对应概率较大的分类值做为组合模型的输出结果,即:(po即屈于正滋平台if p(x, c p<. i x,)> p(x, c p. |x,)样本x,属于丿i即属于破产平台if ix, g zjo|x,)< ixi e p. |xf)丨待定 根据实际情况判别if p(x. 6仇|x,) = p(x. e pl |x,)得出预测结果后与实际结果进行对比,得出基于贝叶斯算法的投票式组合预测 模型的准确率。(-)基于邻域粗糙集的指标约简

20、根据指标选取的原则,本文选取的是2016年4月上规模的各大p2p网贷平台数 据,其中包括“正常”和“问题”两类,在剔除了信息不全、无效信息的p2p 平台中按照1:1配对方法选取“正常” p2p网贷平台和“问题” p2p网贷平台同 一月份、规模相近的平台进行研究,将83家“正常”平台和83家“问题”平台 组成研究对象,并在“网贷之家”网站上抓取数据,数据部分内容如表3所示。18396039434919751412812188061183464135512060835403163723235881584555141401076411910586635805119760444213852161699

21、464361062200113140778222113706795732790875665269671118347119750791646919204941107051521432192285011587772033920232811125179517681287351680134710496471913192911144108589271105119811540531134646627282116378685504711680017358895098123011814002575470191320547420111120121011513971hlh2h3313-5&622:针对p2

22、p问题平台中评价指标比较多的情况,木文运用邻域粗糙集属性约简的 方法对评价指标体系进行约简。因数据量较大,在约简的过程中应用 mat-lab2014a进行编程计算,得出结果如表4所示。根据约简后的指标属性,并在原始数据的166家p2p网贷平台屮选取80家p2p 网贷平台组成模拟样本进行模拟,再用剩余的86家p2p网贷平台组成测试样本 对logti回归分析的结果进行预测的正确性测试。模拟样本的80家平台同样按 照1 : 1原则选取,即选取40家问题平台和40家正常运行的平台。表4约简后指标属性权重值下载原表a?6h9310312心3权重0.0530. 1450. 1300. 2370. 1300

23、.0310. 107(-)单个预测及组合模型预测1. logit回归预测。根据上文的模型介绍,应用ibm spss statistics v21. 0中的二元logistic冋 归预测进行分析,将80个选定的模拟样本录入spss工作表格屮,10个指标属 性值为协变量,问题情况(即前文提及的决策属性,问题取值为1,正常取值 为0)作为因变量。用excel编辑函数来计算概率p,并最终计算得出logit模 型预测结果的准确率,如表5所示。表5 logit模型预测结果表下载原表实际也测值预测结果楚否为何題平台1 0正聽率/%見仲为问题平什102419182555.815&14总体侦测准确率/%

24、56.98由表5可以看出,经过测试样本的检验,所建立的logit回归模型总体预测准确 率仅为56. 98%,这个水平属于偏低的预测正确率,这个正确率述有很大的水平 可以提高,因此,此logit模型不是一个理想的预测模型。2. 神经网络预测。运用spss软件中的bp神经网络的多层感知器预测方法来实现p2p平台问题与否 的预测工作。选用样木的原则与上文一致,即选择80个样木为模拟样木,86个 样本为测试样本,共166个样本。模型训练完成后,生成的神经网络模型对测试 样本数据测试后与实际比较的结果正确率如表6所示。表6神经网络预测结果表下载原表预实际观测值是否为问题1是否为问题平台1011111:1

25、_3;o 211111111111总体预测准确率/%75.58从h表中可以看出对于p2p实际出现问题的正确率为73. 2%,而p2p实际运行止 常的正确率为64.4%,综合正确率为68.6%,预测结果较logit回归预测准确率 咼,但仍然有很大的提咼空间。3. 支持向量机预测。已有研究表明,高斯核函数支持向量机模型的预测准确率最高,而核函数的选 择是构建支持向量机模型的关键14,因此高斯核函数被本文采用。通过对数据 结果的比较,当高斯核函数的阈值5=0.7时,支持向量机程序的准确率最高。 利用libsvm工具箱在matlab2014a中运行得出检测样木的实际预测结果如表7 所示。表7支持向量机

26、预测结果下载原表实际也測侦消结果是否为冋題平台正确率/%10址弁为问題yf?1321171.410162762.79总体横测准确书/%68.6由表7可以看出,经过测试样本的检验,支持向量机总体预测准确率为68. 6%, 介于logit回归分析预测的准确率和bp神经网络预测的准确率之间,同样不是 很理想。(三)基于贝叶斯算法的投票式组合预测通过上面的分析,根据上述三种模型的预测结果,结合上文中的方法,应用聖cel得到基于贝叶斯算法的投票式组合预测模型的预测概率和结果,如表8所 zj o表8基于贝叶斯算法的投票式组合预测准确率下载原表预2实际观测值是否为问题1是否为问题平台10388总体预测准确率

27、/%84.885由表8可知,基于贝叶斯算法的投票式组合预测中只有13个预测错误,其中 p2p问题平台只有5个预测错误,而且问题平台与正常平台的预测之间并没有显 示岀明显的差异。上文所述的三种预测模型各有其优缺点,其预测结果准确率也有较大差异, logit模型预测为传统统计模型,而神经网络和支持向量机应用人工智能和机 器学习等新兴的学习方法进行预测分析,对比各模型准确率,如表9所示。预测结果实际观测值问题平台正常平flogit回归预测问题平台2419正常平台1825bp神经网络预测问题平台 正常平台32101133支持向量机预测问题平台 正常平台32161127投票式组合预测问题平台 正常平台3

28、8836由表9可以看出,传统统计模型logit模型的预测准确率最低,其次为支持向量 机预测方法,而预测准确率最高的为bp神经网络,从这一结果可以看出人工智 能领域预测方法的优势z处,传统的统计模型因其多个弊端无法准确预测数据 的正确率。而结合三种预测方法的投票式组合预测方法在本文的应用过程中发挥 其优势,综合了三种预测模型的利弊,得出相对较好的准确率,且稳定性良好。五、结论本文针对当前p2p网贷平台内部财务信息不透明的现状及政府、投资者对网贷平 台风险评估预测的现实需要z间的孑盾,创新性地提出基于网贷平台公开交易 数据的危机预警新方法,通过运用数据采集、去噪技术,结合支持向量机、神经 网络等机

29、器学习方法进行数据训练,得到了较好的预测结果。通过研究,得到以 下结论:1. 构建了基于网贷平台公开交易数据的危机预警指标体系。论文在直接抓取的数 据屮选取平台每口成交量、平均利率、投资人数、平均贷款期限、借款人数、累 计待还金额等指标作为危机预警的指标,通过领域粗糙集进行指标约简后得到 相应指标体系;2. 结合机器学习技术,对选择的p2p网贷平台变量和数据进行约简、建模、预测。 本文选取了三个准确率较高的模型:logit冋归,神经网络和支持向量机模型。 采用分别建立相应的模型,并将采集的数据在预处理后分别代入各单一个模型, 以检测各模型的效果,最后将三个模型的实际输岀结果作为输入,结合贝叶斯

30、 算法构建投票式组合预测模型,使各模型之间可以相互补充,提高预测的精度 和稳定性。3. 对166家主流p2p网贷平台进行实证研究。通过跟踪采集“网贷z家”等p2p 监测网站交易数据组成模拟样本进行模拟和测试,验证本文提出的p2p网贷平 台危机预警新方法的准确性。从预测结果来看,采用本文提出的p2p网贷平台危 机预警新指标体系,结合组合式预测模型,能得到较好的预测效果。参考文献1 肖萍互联网金融与中小企业融资困境的化解途径j河南师范大学学报 (哲学社会科学版),2015 (4) : 77-80.2 蒋玉互联网金融的特殊风险和法律规制j广西财经学院学报,2015(4) :41-46.3 朱宝普惠金融体系下互联网金融风险溢出效应研究j.广西财经学院学报, 2017 (1) :78-85.4 潘庄晨,邢博,范小云信用风险评价模型综述及对我国p2p网络借贷平台 的借鉴j 现代管理科学,2015 (1) : 33-36.5 周少甫,李

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论