P2P网络借贷行为中借款成功率及借款利率的实证分析 (最终交稿)[精选]_第1页
P2P网络借贷行为中借款成功率及借款利率的实证分析 (最终交稿)[精选]_第2页
P2P网络借贷行为中借款成功率及借款利率的实证分析 (最终交稿)[精选]_第3页
P2P网络借贷行为中借款成功率及借款利率的实证分析 (最终交稿)[精选]_第4页
P2P网络借贷行为中借款成功率及借款利率的实证分析 (最终交稿)[精选]_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、p2p网络借贷行为中借款成功率及借款利率的实证分析摘要现在民间出了一种新的借贷方式那就是p2p网络,它使金融市场的融资效率得到了巨大的提升,从而受到了世界各地的广泛关注。伴随着p2p这个借贷网络平台的快速发展,目前的p2p网络被越来越多的人所重视,而这个平台中弊端也有很多,存在着诸多问题本文结合前人在相关领域的探索,依据p2p网络借贷的概念和相关理论,在p2p网络研究模型的基础上,以拍拍贷为例,对这个平台进行了具体的研究。借用二元logistic回归模型和多元线性回归模型,对p2p借贷平台提出相关假设,进行回归结果分析,最后进行假设验证,本文中为p2p网络借贷提出了一些科学的建议。关键词:p2

2、p网络;网络借贷;借款成功率;实网络证研究目 录摘要i1.引言1研究背景1研究主要内容11.3 文献综述22 p2p网络借贷行为的理论基础3网络借贷概述3信任理论4信息不对称理论43 理论模型的建立与模型数据准备53.1理论模型的建立与理论假设535363.2数据准备73739993.3样本数据的初步分析94 p2p网络借贷行为的实证研究124.1出借人投标意愿的影响因素实证分析124二元logistic回归模型简介134回归结果分析134假设验证结果204.2 p2p网络出借人要求收益的影响因素实证分析204多元线性回归模型简介214回归结果分析224假设验证结果275结语28参考文献30a

3、bstract31key words31致 谢32p2p网络借贷作为一种新的民间借贷,但它的存在是短暂的,但无论从速度还是规模而言p2p贷款出现了令人惊讶的快速发展。 p2p网络借贷平台的发展,形成的网络信用正在被越来越多的人所接受。 p2p网络借贷能满足融资难以照顾到的小微企业占小额信贷的融资需求和对扶贫的公众有着很重要的意义。但是,有借贷成功的款的成功率非常低,面临的三大困难是借贷的成本和借贷的违约率比较高,这对于当前的p2p网络发现来说。特别是,中国的发展环境,p2p贷款模式的网络可以在它的投资功能和融资发挥作用过多,以及扶贫的作用:1,在生产领域,是世界存款率最高的,这些存款在中国p2

4、p网络借贷市场具有不容忽视的潜力。虽然p2p行业仍然是初生牛犊,但在小微企业融资和个人财务状况已经显示出罕见的潜力。这是由于p2p平台,通过信用评级来收集信息,并根据这些优势联系借款人和贷款人分配信贷的能力,能够满足不一样社会环境中的需求的模式就是p2p网络模式;2,财政分配的网络,p2p可以解决筹集资金的关键社会问题,致力于提高整体社会福利。一些平台的福利已经开始运行,致力于p2p网络,例如宜信企业下的宜农贷平台。中国的农村人口数量是非常庞大的,而他们的生活水平都低于社会的平均水平,对于大多数的人而言,所以为他们提供些资金也是很必要的,将在提高农民生活水平有很大帮助。然而,他们的银行服务有限

5、,对于大多数的农村居民来说,而当地虽然有很多并不是政府所组织的小型的信贷组织来解决这个问题,因为捐赠的资金很少,他们还远远不够以发展。 p2p网络借贷能够帮助他们改善生活到一定程度的标准。本文的内容主要分为两大部分:第一部分先是理论模式的建立以及理论模型数据的准备。以拍拍贷为例的是第二部分,其进行了实证的研究对p2p的网络信贷,它的出发点就是从出借人投标意愿的影响因素和出借人的要求收益因素,所以就借用了两个回归模型,就是二元logistic回归模型和多元线性回归模型,进行相关的假设,并进行回归结果分析,最后进行假设验证结果,从而对于p2p网络借贷的运营提出相应的建议。1.3 文献综述在国外,发

6、源于网络的是p2p的网络借贷模式,在2005年时。这种新型贷款模式的出现吸引了众多研究者的关注,开始了一系列的完整的p2p网络借贷的研究。参照国内国外的p2p模型,开发了包括拍拍贷、人人贷等,国内学术界和工业界的专家进行了大量的研究和调查。本文总结了p2p借贷网络的研究现状和梳理国内外研究成果,以奠定的p2p网络信用风险研究的理论基础。prabhala 以及lin 以prosper为例,信用评级体系和操作模式是本文所研究的内容。在这个的基础上,阐述操作流程和p2p网络平台借钱的运行机制。michael 则以zopa为例,zopa平台面临的不平等信息的问题,但透明的制度降低了其平台的风险,并保持

7、坏账的比例较低。此外,emma选择进一步的欧洲国家不同类型的p2p网络借贷平台的研究,对比分析也指出,该平台zopa的成功运作是其良好的风险控制体系,平台zopa 3/4贷款申请将被拒绝。这个网络应该有充分的隐私权,知情权,健全的金融监督制度等,这就是吴晓光所说的,使权利和合法客户的利益得到必要的保护。王丹和其定位模型分析出发,p2p平台运作模式分为传统p2p贷款模式和债务转移的传统模式;毕沛然为信息不对称的发展,创造了风险控制体系,为p2p网络平台监管等问题进行了系统研究。王云飞进一步强调的是用户体验,规范信用卡/贷款过程,是下一步加强p2p平台的竞争力的关键。郭卫东建议从法律法规等建议,以

8、改进和加强行业看监管,提高财政透明度的p2p平台。在2011年的时候,美国的一份报告说中写到,网络平台的p2p借贷起到在同一时间的中介作用,也起到了券商的作用。风险管理与p2p网络借贷平台的控制已被广泛研究。张天骄分析了潜在的风险和网络运营的p2p借贷平台的原因。冯海悦认为,p2p行业的风险控制应根据博弈论和scp分析。李瑶在国内外的比较分析等措施,以信用风险,提出了信息披露在p2p行业,风险控制中的重要作用。屈媛在分析p2p借贷平台的各种风险的基础上,提出了监督的方式和p2p平台的原则。周小娟梳理面临的p2p行业的风险,并总结了相关建议。赵海荣则从整个的互联网监管层面对此进行了剖析,王泽华对

9、互联网机制提出了具体的监管措施和建议。白如冰研究发现,数据库和互联网技术的发展是p2p网络平台的生存,发展和突破的重要因素。崔琳p2p因为他的普惠而受到广大欢迎,但我国的监督制度并不包括p2p平台,政府监督也不可知,出现主体地位不明,信用机制不完善,控制弱风等问题。基于p2p的风险分析,刘绘提出了监管建议,以信用信息系统“孤岛”整合,解释作出的给予信息的请求,促进信用评级和培养自律的行业标准。董妍指出,利润的来源应该是中介的信息服务费,p2p平台最好不要参与到投资过程中,规范其建设和创造良好的投资秩序1.4 p2p网络借贷概述p2p借贷是从国外引进的一个概念,是理财网站的一种重要形式,这意味着

10、通过网络的平台,有投资愿望的人可将多余资金信贷给有资金需求的人。借用p2p网络从p2p小额信贷起源,但随着互联网的飞速发展,从“线下”模式,展开“线上”的模式,属于民间借贷网络的扩展。p2p的网络信贷共有三个部分组成,就是这个网络借贷贷款人、p2p的网络借贷平台和其的网络借贷借款人。借款人通过这个平台提出自己所需要的资金数量,向贷款人借资金,用自身的信用做抵押担保。贷款人在借贷的交易中扮演提供资金的角色,它是p2p网络在信贷实践中借款信息的获取方。只是作为一个交易的中介,并建立一个信贷的关系,这就是p2p的网络借贷平台。提供配套的信息匹配服务,因此收取的成本的佣金。借款人通过在网络借贷的平台上

11、发出借款的信息,以此来表达自己对资金的需求,而贷款人可以查看借款人对资金需求的信息通过一些平台,针对指定的借款人的需要的资金通过担保承诺的方法借出资金,这就是网络借贷的操作过程。这个平台从贷款的机构建立了借贷关系,获取资金借给借款人,然后再通过这个平台来还回款,平台也在整个的借贷的过程中收入相当比例的费用。 2 理论模型的建立与模型数据准备决定贷款人贷款意愿的因素,利率和违约情况是主要的两个方面。违约的情况越小则说明借出的利率越高,贷款很想要借出的可能性也越高。针对这种现象,有些人说出了自己的想法:1. 不管有没有人进行担保,借款人当然喜欢利息高,出借人的收益也会很好高,增强出借人的借出意愿,

12、就可以很容易的得到出借人的借款,以此类推的假设。如果出借人愿意借的话,是因为利率比较高。2. 2.如果没有什么特殊的情况,当借款人每个月所还的钱越少也能够说明借款人借出的相对较少,对于出借人来说也很容易还上,但同时违约也会面临着被网络曝光的风险,所以出借人一般的违约情况也不是很常见的。但是,也有一些相关的证据证明,如果借款的时间较长,那么违约状况的发生则相对来说更容易些。让我们来想象一下:h2:如果出借人更愿意出借,则说明,借款的期限相对来说较短,借款的金额也相对来说没有那么多3.无论是借款人,还是出借人,他们之间的关系都是很玄妙的。每个地区的人都有不同的性格差异,所以信任的程度也都各不相同,

13、针对每个人的经济收入水平都有明显的不同,所以他们相对应的还款能力也是不尽相同的。在一般的情况下,年龄比较大的男性借款人同时他是生活在经济相对发达的地区的,还款能力可能相对较强,所以一般的出借人更愿意把钱借给这一类人,再做一个猜测:h3a:年龄相对来说较大的男性同时生活在经济相对发达的地区的借款人更容易被出借人所青睐;4.应该制定相关的规定,或者通过某种方法在借款人违约的情况下,出借人依然能够通过某种方式获得一定的收益,找一个中间人对于出借人来说是十分有必要的,这样可以规避一定的风险,所以我们猜测:h3b:如果想要增强出借人的出借意愿,可以通过抵押或者是担保类的形式去进行贷款5.无论是借款人还是

14、出借人,双方一定要了解对方的基本情况,不能粗心大意。双方互相了解的更透彻,被曝光的信息比较多,借款人要付出很高额代价,这是因为借款人的违约。所以一般来说发生违约事件的利率相对较低;借款人可以被进行信用评比,而且这个评比是被官方授予的,相对来说更值得信赖,借款人如果还款的能力比较高的话,他的违约行为也会很低,说明借款人的信用也很高。另外,借款多次的借款人在多次借款中都能成功也能说明他的还款能力高,被出借人所认可,针对这种现象我们可以进行猜测:h3c:得到信用分越高的借款人能够被出借人所认可,成功借款多次的借款人也会被认可,这种人是有能力及时还款的。2.1.2收益分析对于出借人所做出的部分猜测:从

15、最后一个时期的借款人去进行分析,这种方法是逆推归纳法。在这个时候,出借人会不会进行借款主要可以分成两种情况去进行讨论,那就是:第一点就是无论最后借款人会不会按时还款,如果在出借人和还贷人之间有担保人,那么出借人都会得到一些相应的收益;第二点则是如果在出借人和借款人之间没有担保,出借人在借款前应该仔细考虑,自己应不应该借钱给借款人,借款人又会不会不还钱给自己。实际上在做了担保的情况下,认为借款人的违约可能是没有,而如果是在没有担保的状况下,借款人违约的概率则需要出借人做出准确无误的预测:如果借款人借的钱少,时间也很短,那借给借款人的收益也会相对比较低。h5a:如果是抵押形式的贷款,那么出借人的收

16、益也没有太多;h5b:年龄较大的生活在发达城市的男性借款人的还款能力高,出借人所得到的利息也较低;h5c:信用得分较高同时能够成功多次贷款的借款人更容易被出借人所认可,对他们的收益要求相对来说较低。拍拍贷是国内第一家不用任何保障抵押模式的网络借款工具,目前它在国内的网络平台上相当的活跃,所以我们把它当做是本文的主要研究对象。下面是一些对拍拍贷运行操控模式的相关介绍,在进行大部分的研究后,我们的实验就冷开始进行了。根据大量国内和国外与此相关书籍的部分研究,下面我们列举了一些相关的信息:(1)借款数量的大小在拍拍贷这个网络平台上,借款人首先提出自己想要得到贷款的数量,到这个数量是有着一定范围的,以

17、后可以得到一连串的相关数据,根据这些获得相关数据来看,借款成功的记录有很多。(2)年利率的数额可以支付比较高的成本,让接待者得到他们所需求的资金,喝酒时借款年利率。如果没有什么特殊的情况,借款的利率越高,则说明,获得借款的可能性相对来说就越高。(3)借款的时间限制拍拍贷上所规定的最长借款时间不能大于一年,期限必须在1-12月中。(4)可不可以提现只本人才有资格将网络账户中的金额提现出去,所以相对来说,风险不是很高,所以拍拍贷上的这种模式十分收到广大借款人的青睐并且越来越收到欢迎。(5)有无担保担当担保的可以是人,也就是我们常说的担保人,担保人为借贷人提供担保,如果借贷人在规定的时间内无法偿还债

18、务,那么担保人要对此承担相应的职责,这样就会大大降低出借人的风险性。(6)是不是安全标在拍拍贷上或者出借给别人的钱等着回收的就是安全指标。这个变量也就是名义上的变量,所以要转化为哑变量,将这个名义上的变量,赋值是0的“不是安全标”,而赋值为1的就将“是安全标”。在拍拍贷上借款人的地区分布,从单笔的借款列表来看的话,浙江,上海,广东,山东,福建这些地方对网络信贷的需求是很大的,甚至达到了全部总需求的一半以上。从这些数据可以看出,对网络借贷支持率比较高的是沿海地区和华东地区,并且对于借贷的需求量也很旺盛。在列表中对借款的数量进行描述,结合这个地区的部分借款人,从中可以看出大多数的借款人是因为自己的

19、比较小型的企业,比如一些来像拍拍贷这样的平台上,出现了资金紧缺的现象。这种小微型的企业大多数的时候对资金的需求量不是很高的,都是几万到几十万不等,对这样的需求不重视,对于银行等一些传统的渠道,所以这些小的企业很难从他们那里获取所需要的资金。为这类的小微型企业提供了融资平台的就是p2p网络,它在帮助这些微小型企业的融资起到了很大的作用。表3-3拍拍贷用户性别统计性别frequencypercentvalid percentcumulative percentvalid13075485. 685. 685. 60516214. 414. 4total35916100. 0100. 0下面的3-3表

20、就显示了拍拍贷上的借款人性别,占到绝对比重的是男性。表3-4拍拍贷用户年龄段统计年龄frequencypercentvalid percentcumulative percentvalid26-31岁1566143. 620-25岁961770. 432-38岁773591. 9大于39岁2903100. 0total35916下表3-4所表示的是拍拍贷上的借款人年龄的分布,其中借款人占比重为43.6的是26-31岁的人,借款人比重占26.8的是20-25岁的人,占借款人比重21.5的是32-38岁的借款人,而占借款人比重达到8.1的是39岁以上的借款人。从中可以看出来对贷款需求量比较高的是3

21、0岁以下的年轻人,同时接受的程度也比较高,对于网络借贷这种新兴的产物。表3-5拍拍贷借款申请信息统计statistics借款金额借款年利率借款期限valid359163591635916missmg000mcan6065 .15mimimum300051maximum50000012percentiles203000183403000206603500226804971 .62210本文获取的拍拍贷上的借款申请数据为35916条,借款申请的金额从最低的3000元到最高50万元,平均借款金额仅为6065元,且其中80%以上都在5000元以下;借款年利率最低5%,最高为26.24(基准年利率的4倍

22、),平均值为19.85,且60%借款的年利率在20%以上;借款期限最低为1个月,最高为12个月,平均借款期限为6.28个月,且60%以上借款期限在6个月以下。表3-6拍拍贷成交借款信息统计statistics借款金额借款年利率借款期限valid133601336013360missmg000mcanmimimum300051maximum50000012percentiles2030001834020660206808900219本节中获取到的实际成功的借款数据总共有13360条,考虑到了一些借款的数据,评论成功的借款金额有很多,并且借款金额在8900元以下的就有80,评价的年利率达到17.3

23、2,有60以上整年的年利率达到了18以上,规定每个的借款时间限制为6.3个月,小于6个月的的借款期限在60以上。上面的这些数据让我们对拍拍贷有了一个简单的了解,就是说拍拍贷是面向全国性的,大多数的客户都分布在华东地区和沿海地区的一家主要经营小额短期贷款的p2p网络借贷平台。4. p2p网络借贷行为的实证研究此章节以拍拍贷为实例进行实证研究,分别通过对出借人投标意愿的影响因素和出借人要求收益因素这两方面的分析和假设,可以用二元logistic回归模型和多元线性回归模型的方法得出假设验证的结果,用两个回归方程进行分析。实证分析影响因素即出借人的投标意愿由于各种各样的原因,借款的成功率一直不太高,在

24、p2p的网路借贷中。prosper是最早的借贷网络,它的成功率都不到百分之十,拍拍贷的借贷成功率都不超过20,在2008年的时候。本节中的数据2011年7月22日-2012年的8月2日拍拍贷的近一年数据来看,它的借款成功率也都没有超过40%。提供这些数据例子就是为了研究在p2p网络的借贷平台中影响借贷成功率的重要的原因,可以根据模型的结果,猜测一下借款成功的可能性,对客户提出一些实质性的交易,就是关于怎样提高贷款成功率,进而提升网络的运行效率,即p2p网络借贷平台。看投标能否完成表现形式,在拍拍贷的借款流程中,因此本文中中代替出借人的出借意愿当成变量,用能不能投标成功来替代。本章研究需要的变量

25、如下:表4-1 研究网络借贷成功率需要的变量因变量自变量借款信息变量抵押担保变量人口特征变量信用变量历史表现变量投标是否完成(y1)借款金额(l1)是否非提现标(g1)年龄段(d1)认证总分(c1)借款成功次数(r1)借款年利率(l1)是否担保(g2)性别(d2)借入信用分(c2)流标次数(r2)借款期限(l3)是否安全标(g3)所在地(d3)借出信用分(c3)在二元变量中如果出现问题,大多数情况下是可以用二元logistic回归模型来处理的。这样的一个二元因变量就是表示投标有没有完成,本文中将oo作为投标没有完成的编码,将1作为投标已经完成的编码。除此之外,在名义变量的时候有优势,因此在处理

26、名义变量时也有一定的优势的对于logistic回归方程,可以自动的将名义变量转化为哑变量,而所在地都是名义变量的是年龄段和借款人,所以logistic的这种方法能够很方便的对此进行编码,这就是这种方法最大的优点。本节中的logistic的回归方法如下所示: (4-1)其中: (4-2)作为因变量的是投标能不能完成的标准,其他的部分都当成自变量,结果如下所表示:表4-2回归模型的omnibus检验结果omnihns tests of model coefficientsstep 1chi一squaredfsig.step16816. 87246.000block16816. 87246.000m

27、odel16816. 87246.000从表4-2中可以看出来,回归方程的omnibus检验中似然比卡方检验的观测值为16816.872,自由度为46, p值为0.000。在显著性水平为0.05的情况下,由于p值小于0.05,应该拒绝零假设,认为所有不同时为0的是回归系数,关系比较明显的是解释变量全体与ln(p/1-p)之间的线性关系,所以这个模型的整体是有效的。表4-3二元logistic回归模型解释度model summarystep-2 log likelihoodcox&snell r squarenagelkerke r square128363. 196.374.522a.

28、 estimation terminated at iteration number 8 because parameter estimates changed by less than .001.特别是像似然,就是让自由变量观测值预测因为变量观测值的概率。似然的取值范围也是在0和1之间,和其他的任何概率一样。它的自然对数形式就是对数似然值((log likelihood ll),它的对数似然值取值范围是在0到一co之间,是因为对数值负数的取值范围在0,1之间。最大似然值估计的迭代计算法计算得到的是通过对数似然值实现的。在数学上更为方便的是-2 log likelihood近似服从卡方分布的,

29、所以可用于检测logistic回归的方法检测性的是-2 log likelihood。表示了在模型中也包括了自变量的误差的也是-2 log likelihood,它解决了变动的明显的问题对于处理变量无法解释的问题时,这也称为拟合劣度卡方统计量(badness-of-fit chi-square)。当-2 log likelihood的实际显著性水平大于给定的显著性水平a时,不能解释的部分是不显著的在因变量的变动中,这也就是说回归方程的拟合程度也就越高。下面是-2 log likelihood的计算公式:-2 log likelihood= (4-3)-2 log likelihood来说,na

30、gelkerke r square值是0.522,能够被回归方程的自变量解释的是代表因变量(投标成功率)的变差的52.2%。它的解释度并不是很高,大概是因为对于借款人的收集信息的内容不够完善,也缺少了一些影响出借人出借意愿的变量。比如说,是不是上传了清楚得本人的照片在借款人的借款列表中,借款人对借款数量的讲述,是不是有别的认证项目比如淘宝认证户口认证借款人自己申请的财务信息等,这就是对借贷能不能成功的影响较大的影响因素。这已经获得了自变量对于借款人投标能不能完成一定的猜测作用,尽管文章中并没有得到比较完整的影响因素。表4-4二元logistic回归的判别分类结果从表4-4中可以看出,通过二元l

31、ogistic的回归模型预测的方法可以解决对于投标没有完成的11594笔的借款中,而这些其中有8113笔的借款成功预测没有完成预测指标,错误判断率为30,有22023笔的借款成功的预测投标已经完成,错误判断率为9.5,在没有投标完成的24322笔的借款数量中,整体的错误判断率是16.1。所以,可以通过以上的自变量建立一个logistic的回归方程依然可以对能否借款成功做出一个很好的预测与判断,即便是在数据不完整的情况下。表4-5 借款人所在地部分的回归结果variables in the equationbwalddfsig.exp(b)step1a所在地87. 98731.000所在地(1)

32、.071.148.1521.697.944所在地(2)一008.143.1551.694.945所在地(3).131.126.3241.5691 .074所在地(4).054.203.0021.968.992所在地(5)-078.1181. 2291.2681. 140所在地(6).160.134.1611.6881. 055所在地(7)-.064.173.2061.650.925所在地(8)-.009.195.6751.4111. 174所在地(9)-.242.140.2101.647.938所在地(10).009.141.0041.952.991所在地(11)-.008.1632. 208

33、1.137.785所在地(12).067.138.0041.9471 .009所在地(13).125.138.0031.956.992所在地(14).022.174.1501.6981. 070所在地(15).094.126.9741.3241. 133所在地(16).152.148.0221.8831. 022所在地(17).632.150.3921.5311. 098所在地(18)-.317.199.5821.4461. 164所在地(19)-.048.3044. 3291.0371. 881所在地(20)-.077.485.4271.513.729所在地(21).209.129.1361

34、.712.954所在地(22).215.159.2321.630.926所在地(23)-.069.1561. 8021.1791. 233所在地(24)-.078.1332. 5951.1071. 240所在地(25)-1. 164.131.2781.598.933所在地(26)-.296.182.1861.667所在地(27).061.9871. 3911.238所在地(28)-.841.2291. 6631.197所在地(29).110.149.1691.681所在地(30).071.1791.000所在地(31)-.008.124.7961.372表4-5所表示的是,在显著性水平a为0.

35、05的情况下,由于大多数的所在地的变量的p值都大于0.05,所以本篇文章中投标能不能完成和借款人的所在地的判断没有明显的关系。也就是说,出借人对不存在的地域歧视的现象,出现在p2p的网络借贷平台中。表4-6影响借款成功率的自变量variables in the equationbwalddfsig.exp(b)step1a借款金额.000.00052. 4271.0001. 000借款年利率.041.00921. 9421.0001. 042借款期限-.091.005342. 5181.000.913是否非提现标1. 778.075559. 5081.0005. 921是否担保3. 836.4

36、7166.2751.00046. 329是否安全标1 .286.1551.0003. 618年龄段91 .6633.000年龄段(1)-.505.06757.5301.000.603年龄段(2)-.242.0641.000.785年龄段(3)-.179.0681.000.836性别-.516.044137. 1541.000.597认证总分.140.0024080. 8271.0001. 151借入信用分.050.0021.0001. 052借出信用分.000.0001.0001. 000借款成功次数.043.00649一501.0001. 044流标次数-.045.006210. 7421.

37、000.956constant.251137. 1541.000.026所有的变量p值都小于0.01,从表4-6中能够看出来,上面的这些因素对于投标能不能完成的影响是很大的。投标完成的可能性为: (4-4)第一列的系数b和表4-6结合,依据它的正负性,能够将自变量对因变量的影响进行一个总结,比如表4-7所示:表4-7 自变量对因变量的影响类别汇总因变量自变量借款信息变量抵押担保变量人口特征变量信用变量历史表现变量投标是否完成(y1)借款金额(l1)(*)是否非提现标(g1)(+)年龄段(d1) (须分类说明)认证总分(c1)(+)借款成功次数(r1)(+)借款年利率(l1)(+)是否担保(g2

38、)(+)性别(d2) (须分类说明)借入信用分(c2) +)流标次数(r2)(-)借款期限(l3)(-)是否安全标(g3) (+)借出信用分(c3) (*)注:其中(十)表示对因变量有正的影响,(一)表现不好的影响,对因变量影响的高低,性别变量和年龄段变量请看下方的要求。(1)借款的变量信息(loan)借款金额与实际认知有很大的出入,借款金额对投标的影响微弱。在借贷正常不改变的情况下,借款人的借款金额越高,借款成功的可能性就越低的。而在拍拍贷上,借款金额对借款获取成功率的影响微弱,与实际预知有很大出入,可能产生的原因是:拍拍贷上借款额度是根据借款人自身的信用等级的上升增加的,因此导致了借款金额

39、对借款成功率的影响微弱。因为出借人投标的目的都是为了投资收益,所以在于借款年利率对投标是否完成的影响为正,借款利率的不断增长无须怀疑投标完成的概率。我们还可以从中看出的是,利率每上升1,投标完成的情况增加的可能性仅仅只有2,所以就可以看出利率的增长对投资完成效率的有限借款期限对投标是否完成的影响为负,这就更加容易理解,借款的期限越长,对应的风险就会越大,投标完成的可能性会下降大约8.7,在借款期限每增长一个月的基础上。(2)抵押保证变量(guatantee)能否提现标对投标是否能完成的意义非常大,非提现标将证明着成功借款金额仅能留在网站账户以内,因此基本上就确保了本金的安全性,所以投标完成的可

40、能性就会很高。据数据统计,非提现标的投资完成情况高达92.84。能否保证标对投标是否完成的意义很大,第三方的保证,由第三方来确保借款的安全性,因而有第三方保证的标投标完成的可能性就会非常高。据数据显示,担保标的投标完成情况高达99.16。能否安全标对投标是否安全标对是否完成的意义也有影响。安全标标志着借款人自身的实际账款可以覆盖本次的借款金额,因而几乎没有多大风险。所以安全标的投标率也非常高。据数据显示,安全标的投标完成情况高达94.9。值得一提的是相似的抵押担保在国外p2p网络借贷中并没有出现,这一类可以算作是p2p网络借贷的不断创新。 人口特性变量(demographic)年龄阶段编码方式

41、为39岁以上作为参考数,相当于20-25岁年龄阶段的系数为b为-0.505,26-31岁年龄阶段的系数为b为-0.242,32-38岁年龄阶段的系数b为-0.179,39岁以上年龄阶段的系数b为0.000。因此,借款人的年龄阶段的大小依据上是与投标完成的可能性呈正相关的。同39岁以上年龄阶段的借款人相比,32-38岁年龄阶段投标投标完成的可能性是其中的83.6,31岁年龄阶段投标完成的情况是其中的78.5,20-20岁年龄阶段的投标完成情况是其中的60.3。从上面的这一结论与pope&sydnor(2008)关于年龄阶段有所不同,最主要的原因可能在于两者对年龄阶段的划分标准不同。在po

42、pe&sydnor(2008)的研究中,他们证实了以下的人借款成功的概率最高,35-60岁的群体借款成功的概率居次,而60岁以及35岁以上人的借款成功概率最低。从中得出这一结论与pope&sydenor性别的编码方式为男性赋值为1,女性赋值为0,男性投标完成的概率仅为女性的59 7,可以看出贷上出借人更愿意将钱借给女性借款人。(4)信用变量(credit)认知总分对投标能否完成的作用较大,其中exp(b)=1.151,每增加一个10分的认识,投标完成的概率将会是原来的1.15110=4.08倍。借入信用得分对投标能否完成概率的影响较大,其中exp(b)=1.052,每增加10分

43、的借入信用分数,投标完成的概率将会是原来的1.05210=1.66倍。借出信用对投标能否完成率的影响微弱。(5)历史表现变量(record)借款成功次数每增加一次,投标完成的可能性就会增加4.4,因此借款成功的次数对投标能否完成借款成功的影响为正。流标次数对投标能否完成的影响为负,流标次数每次增加的次数,投递低微4.4。这种历史变量现象可以被叫做p2p网络借贷的马太效应,借款成功次数人越多就越有可能成功,流标次数越多的人就越不可能成功。猜想验证结果根据前面的假设和猜想回归方程结果,本文对h1h的猜想验证结果如下:假设假设内容是否支持h1借款人愿意接受的利率越高,出借人的以39岁作为参见的类出进

44、出意愿越强。支持h2借款人借款金额越低,期限就会越短,出借人的意愿就会越强部分支持h3a出借人往往更会倾向于出借经济发达的地区,年龄较大的男性借款人部分支持h3b抵押担保的形式贷款会增强出借人的出借意愿支持h3c出借人往往更偏向于出借给认证较多,信用得分较高,已经有过成功借款记录信用的借款人支持h2中,借款金额对出借人出借没有什么很大的影响,不支持借款金额越低,出借意向越高的结果。借款金额对出借人出借的意向几乎无多大的影响,h3a中:出借人往往会出借给年龄比较大的借款人,但是借款人来自哪个地区对出借人的出借意向没有什么影响,除此之外,出借人往往更会倾向于借给女性而不是男性。p网络出借人要求收益

45、的影响因素证明分析 本小节通过建立以实际年利率为因变量的数学模型,而影响研究实际年利率的主要因素是,出借人要求收益的影响因素。拍拍贷的借款程序,借款成功的前提是投标必须完成,而投标完成后拍拍贷的融和,借贷会变成一个撮合年利率,本节叫做为实际年利率。本节选取的借款信息列表为24322年投标完成的贷款,部分变量经过变换,变换过程如下: 借款金额:借款金额由于存在一个变量取值范围过大,必定会导致回归系数过小,不方便去解读,除此之外,人们对借款金额的认识不会以元为单位。因此本节将借款金额小于5000的,赋值为1,500-10000的赋值为2, 10000-50000的,赋值为3,50000以上的,赋值

46、为4:年龄阶段为:根据初步的分析统计显示,对于那些投标完成的标,平均实际借贷的年利率是20.24的是20-25岁的年龄段,平均实际借贷的年利率是18.92的是26-31岁的年龄段,平均实际的借贷年利率是17.78的是32-38岁的年龄段,平均实际借贷年利率是17.38的是39岁以上的年龄段。从这些可以看出,实际借贷的年利率和年龄增长的关系是呈负比率的,所以本章中将39岁以上,32-38岁的,26-31岁的,20-25岁的这些年龄段的赋值分别是4,3,2,1;性别:女性的赋值是0,男性的赋值是1;等级认证:如果对已经进行的认证数量,在依据的4项认证当中,可以分成5个等级,赋值是0的是没有进行认证

47、的,赋值是1-4的是完成了1-4项认证的;借入等级信用:分成6个等级的是信用的是拍拍贷的信用等级制度,赋值是1-6,这是按照从级别低到高的顺序排列的。借出等级信用:借出信用的分数,依据拍拍贷的平台,50以下的赋值是0,赋值是1的就是51-999的,赋值是2的就是1000分以上的;有没我成功的借贷经历:赋值是0的借款成功的次数是0;赋值是1的是借款成功的次数不是0;有没有逾期:依据超过期限的还款次数,赋值是0的是没有超过期限的还款,赋值是1的是有超过的还款。本节研究所需要的变量如表4-9所示:表4-9研究借贷成本需要的变量因变量自变量借款信息变量抵押担保变量人口特征变量信用变量历史表现变量实际年

48、利率(y2)借款金额(l1) 是否非提现标(g1) 年龄段(d1) 认证等级(c1) 有无成功借款经历(r1)借款年利率(l2) 是否担保(g2) 性别(d2)借入信用等级(c2) 有无逾期(r2)是否安全标(g3) 借出信用等级(c3) 利用数理统计中的回归方程来分析的是线性回归,它的运用非常的广泛,是一种分析统计方法在定量关系的分析上,能够确定两种或两种以上的变量间的互相依存的关系。下面是线性回归方程的模式: 当中,借款信息变量 ,人口特征变量、信用变量、历史表现变量的相应变量矩阵分别表示的就是l,g,d,c,r,而代表相应的系数矩阵就是b1,b2,b3,b4,bs,b0是常数项,为误残差

49、项,代表除了自变量以外其它因素对y:的影响和实验数据差别。在生活的实际问题中的逐步回归的方法,在因变量有影响的大多数变量中选出来一些变量当自变量,这是人们所希望的,建立一个最优化的回归方程可以对变量进行更好的预测或操控,这可以应用多元的回归分析方程。指希望在回归方程中包括对全部的因变量影响明显的自变量而不包括对影响不明显的自变量的回归分析办法的就是“最优”的回归方程方案。依据这种原则所提出的回归分析方法就是逐步的回归分析。考虑所有自变量中对它作用的大小是它的核心思路,贡献程度的大小的明显程度,从大到小的顺序逐步的带入到回归方程中,对于那些作用不明显的变量最后也不会起到作用。除此之外,这也可能会

50、失去重要性,被带到回归方程的变量在带到新的变量后,就要被从回归方程中清理出去。逐步回归的一步就是带到一个变量中或者从回归方程中清理出去,每一个程序都要经过严格的检查,变化不明显的被剔除,必须保证带到的新变量前回归方程中的变量有明显影响。每一步对已经带入的回归方程的变量计算它的贡献的就是逐步回归分析方法的实施步骤,然后就选一个最小的变量和偏回归方程,进行有效的检验,在事先给定水平的基础上,这个变量不需要从回归方程中清除就是效果比较明显的,此时方程中的其余变量也不应被清除,因为其他变量的偏回归方程都大于最小的那个,所以就不需要被清除。如果情况相反的话,效果不明显,这个变量就要被清除,接着按照从小到

51、大的顺序按照回归平方对方程的变量进行检测。删除所有变化不明显的变量,明显的变量全部保留下来。然后对没有带入回归方程的变量逐个的计算回归平方和,并要选出一个最大的变量在偏回归平方和中,同样明显的检测,在给的水平下,如果效果明显就将这个变量带到回归方程中,一直重复这个过程一直重复下去,逐步回归的过程结束的时候,就是回归方程中的变量不能清除且又没有新的变量带进去为止。因变量作为实际年利率,剩下的都是自变量,实施逐步回归的办法,能够得到的结果如下所示,其中24322年投标完成的借款统计信息如表4-10所示:表4-10 24322笔借款描述统计信息describtive statisticsmeanst

52、d. deviationn成交年利率18. 76174. 2161324322l11. 42.73724322l26. 173. 09324322g1.17.37524322g2.02.15324322g3.07.25824322d1.87924322d285.35924322c1.79224322c2.77324322c3.48.70224322r1.49.50024322r2.12.33024322表4-10所表示的是,在24322年时完成投标的借款中,7000元左右是平均借款的金额,18.76是平均成交的年利率,6.71个月是平均借款的期限。约占2的是担保比,这是17的的的非体现标,男性

53、的借款人的安全占比是7或者85,26-31岁时他们的平均年龄。3是平均的认证数量,e和d是借款人的平均借入等级。当中借款人占借款列表的12。表4-11多元回归模型汇总dw统计量: (4-6)表4-11表示的是,1.975是dw统计,和2很接近,这是在经过12步的逐步回归之后,从而得出的系数r和0很接近,所以没有自相关性,对于多元回归的相差值。r方值的最后调整值是0.714,可以被回归方程中的自变量解释,也就是71.4的因变量的变差。表4-12 方差分析anovammodelsum of squaresdfmean squarefsig.12regression1225731. 0705062. 638.0001residual243095. 083total24321表4-12所表示的是,p的值是0.000,f的值是5062.638,在经过12步的逐步回归后,所以这说明这个回归的效果是非常明显的。表4-13 共线性诊断表4-13表示的是,依据一般的经验认为在30以内的是条件指数,条件指数(condition index)均在30以内,所以自变量之间是不存在明显的共线性的。表4-14 进入方程的自变量方差膨

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论