版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、决策树技术在物流金融信用风险中的应用邵梅;蒋礼仁【摘要】物流金融是一种新型的融资模式,不仅可以增加物漉企业的利润来源,解决 中小企业融资难问题,还可以提升银行的市场竞争力.但是,这种新兴的业务在给银行 提供诸多利益的同时,也带来了一定的信用风险通过决策树技术在物流金融信用风 险分类中的应用,可以将客户归入不同的类别,对银行等金融机构进行信贷决策有所 帮助.【期刊名称】物流科技【年(卷),期】2015(038)004【总页数】4页(P90-93) 【关键词】物流金融;信用风险;决策树 【作者】邵梅;蒋礼仁【作者单位】西南交通大学交通运输与物流学院,四川成都610031;东莞市城建规划设计院,广东
2、东莞523129【正文语种】中文【中图分类】F275.60引言中小企业的蓬勃发展已经成为推动中国经济向前的重要力量。但是,由于国家政策 的倾斜、中小企业自身规模等原因,资金瓶颈问题已经成为其发展道路的主要障碍。 中小企业具有信用等级较低、固定资产所有权不明确、融资抵押物和担保匮乏等特 点。银行等金融机构为控制贷款风险仅以固定资产抵押担保方式为中小企业提供贷 款服务,几乎不对其做信用贷款。那么,如何解决中小企业融资困境呢?解决中小 企业融资问题的核心在于金融创新。物流金融通过引入物流企业,优化了银行和企 业间的信息不对称所带来的逆向选择和道德风险问题,使得银行对中小企业授信的 收益成本得到明显改
3、善。物流金融是金融服务和物流服务相互集成的创新综合服务。浙江大学经济学院的唐 元琦和邹小苴(2004)首次提出了物流金融的概念,他们认为物流金融就是面向 物流业的运营过程,通过开发、提供和应用各种金融服务和金融产品,有效地组织 和调剂物流领域中的信用和资金的运动,达到物流、信息流和资金流的有机统一。 物流金融不仅能提高第三方物流企业的竞争力、创造新的利润增长点,还能够拓宽 金融机构的业务范围、提升利润空间,更能解决中小企业长期面临的融资难问题。 物流金融作为一项较新的金融业务模式,在实现银行、物流企业和中小企业三方共 赢的同时也给银行带来了各种各样的风险,比如信用风险、市场风险、操作风险以 及
4、流动性风险等。信用风险是指交易一方不能履约或不能完全履约而给另一方带来 的风险,是最主要的风险,主要来源于委托人和代理人之间的信息不对称。从信用 风险产生的主体来看,融资企业是最主要的风险来源。因此,如何识别融资企业的 信用好坏,对银行等金融机构来说就显得尤其重要。随着信息技术在物流企业的普 及,大量的数据被存储,这些数据中隐藏了众多信息和关键业务模式,决策树等数 据挖掘技术可以从这些数据中提取出潜在的有用信息和知识。把决策树等数据挖掘 技术应用到物流金融领域,对海量物流数据信息进行处理、分析和优化,可以充分 挖掘出这些信息潜在价值,从而有利于银行等金融机构对需要融资的中小企业的信 用进行分类
5、,识别出具有良好信用融资企业的特征属性,为信用风险的防范提供参 考依据。1物流金融研究现状物流金融起源于物资融资业务。国外物流和金融的结合可以追溯到公元前2400年 美索不达米亚的谷物仓单”。国内关于物流金融的研究起步相对较晚,1987年 陈淮提出了关于构建物资银行的设想,但由于种种原因,这一设想没有被充分发现 和认识。随后又出现了物流银行、仓单质押、融通仓、金融物流等概念。储雪俭等提出目前我国金融物流信贷风险防范中的四个主要难点,并给予了相关的 对策建议。孙颖对物流金融的业务风险、宏观环境风险和法律风险进行了分析,提 出了相关的风险管理建议。王元元认为物流金融业务中进行融资的中小企业是银行
6、最主要的信用风险来源,其次,物流企业也是银行面临的信用风险来源。随着定性研究的逐步深入,定量研究开始出现。潘永明从物流金融运营状况、第三 方物流企业综合实力、中小企业综合实力和行业状况四个方面对物流金融信用风险 的影响因素进行分析,建立了物流金融信用风险评价指标体系。刘哲等利用模糊层 次综合法从企业基本特征、财务能力、货物风险、履约能力、发展潜力等五个方面 构建物流金融信用评价指标体系,并对这些指标因素进行细分,建立了三级四层的 指标评价体系。何明珂运用BP神经网络评估模型以及Matlab软件将某一项具体 的物流金融业区分为高、中、低三种风险。综上所述,国内对物流金融的研究多集中在物流金融基本
7、知识、风险种类及防范和 信用评价指标体系建立等方面。2决策树技术数据挖掘(Data Mining,DM)就是从大量的、不完全的、有噪声的、模糊的、 随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和 知识的过程。数据挖掘又称数据库知识发现。决策树是数据挖掘诸多技术和方法中 常见的一种,它的优势在于通过对已知类别训练集的分析,可以提取出有价值的分 类规则,从而对新数据的类别进行预测,给决策者提供一定的参考。ID3算法是基于决策树的挖掘算法,以信息增益作为属性测试,并选取具有最高增 益的属性值作为分裂属性,自顶向下地构建决策树,直到不能再划分为止。ID3算 法的核心问题是如何
8、选取决策树的每个节点要测试的属性。设S是s个样本数据的集合,将样本划分为m个不同类Ci(i = 1,.,m)的信息熵 按式(1)计算(其中pi是任意样本属于Ci的概率):假设属性A作为决策树的根节点,属性A具有v个不同取值,把数据集S划分成 v个子集S1,S2,.,Sv ,根据属性A划分成的子集熵按式(2)计算:信息增益为原来的信息需求(基于类比例)与新的信息需求(对A划分之后得到 的)之间的差,即式(3):3算例研究决策树技术应用于物流金融信用风险中的基本思路是:根据已知样本和原始信用评 价状态,发现贷款企业信用状态与其某些特征属性之间的关系,进而通过对这些企 业属性的具体观察值,对其信用状
9、况进行预测。本文利用ID3算法给出某物流企 业的具有高还款风险客户的特征属性,为银行等金融机构进行风险控制提供参考依 据。3.1数据选择和预处理。假设从某物流企业的数据库中收集到的客户信息有注册方 式、信用等级、企业规模、企业性质等。需要注意的是进行相关分析的数据不是只 存储在一个数据库中,还可能存在于其它数据集中,要根据实际需要进行相关的收 集整理。收集后的数据往往不能直接挖掘,需要进行一定的选择、清理、转换和归 纳等预处理工作,数据预处理工作准备是否充分,对于挖掘算法的效率乃至正确性 都有关键性的影响。ID3算法比较适合处理离散数值的属性,表1中的注册资本和销售业绩是连续属 性,可以通过分
10、箱、直方图分析、直观划分等离散方法将属性的值划分为几个区间, 然后就可采用和离散值处理相同的方法。由于考虑的是一组具有高还款风险物流企 业的客户的特征属性,选取企业规模、企业性质、企业地点、银行资信等级和还款 风险属性来进行分类预测。3.2信息增益的计算。决策属性为高还款风险和低还款风险,S1 (高还款风险) =8,S2 (低还款风险)=12,则信息熵I( S1 ,S2)公司规模分为大型企业、中型企业、小型企业三组,在大型企业中具有高还款风险 属性的企业有0个,具有低还款风险属性的企业有6个,在中型企业中具有高还款风险属性的企业有4个,还款风险低的企业有5个,则 信息熵=0.9911。在小型企
11、业中还款风险高的企业有4个,具有低还款风险属性的企业有1个,则 信息熵为=0.7219。表1企业信息表企业规模企业性质注册资本/万元企业地点销售业绩/万元银行 资信等级还款风险大型国有600上海100 A低中型国有150北京60 B高小型 夕卜资200成都50 C高小型合资550成都200 A低大型国有230上海30 B低 中型合资100北京45 A低小型合资600北京180 C高中型外资200上海60 C低大型合资700成都230 B低中型国有500成都130 A高中型国有630上 海65 C高中型外卜资200上海80 B低大型外卜资700成都220 B低中型合资 300成都310 C高中型
12、合资180上海55 A低中型合资250成都210 A低小型 国有750北京290 C高大型国有500北京70 C低中型外卜资340北京90 B高 大型合资650北京100 B低同样,企业性质分为国有企业、外卜资企业和合资企业:企业地点分为上海、成都、北京三个地方:银行资信等级分为A,B,C三组:各属性的信息增益:G(企业规模)=0.9710-0.6265=0.3445G(企业性质)=0.9710-0.9121=0.0589G(企业地点)=0.9710-0.8846=0.0864G(银行资信等级)=0.9710-0.7992=0.1718我们知道,信息增益越大,选择测试属性对分类提供的信息越多。
13、从上面计算出的 值可以看出具有高信息增益的属性是企业规模,所以选择企业规模为根节点。当企 业规模都为大企业时,企业的还款风险低,当企业规模为中型企业或者小型企业时, 企业的还款风险或者低或者高,没有具体的特征属性,所以可以继续对属性进行分 类。对中型企业进行分类:S1 (还款风险高)=4,S2 (还款风险低)=5G(企业性质)=0.991-0.660=0.3311G(企业地点)=0.991-0.612=0.3791G(银行资信等级)=0.991-0.988=0.0311对于中型企业来说,选择属性企业地点为节点进行分类。类似,可以给小型企业选 择信息增益最大的属性作为节点进行分类。经过进一步的分
14、类,得到如图1所示 的决策树。在这里,采用预剪枝的方法进行剪枝,停止树的增长,防治过度拟合。 3.3结果分析。由图1可以得到如下规则:(1)如果公司规模是大型企业,则还 款风险低;(2)如果是中型公司且公司地点在上海,则还款风险低;(3)如果 公司是小型企业,则具有高还款风险。根据上述结论,具有高风险还款能力的是小型企业或地点在北京或者成都的中型企 业,还款风险低的是大型企业或在上海的中型企业。针对这种分类,银行在对物流 公司进行还款风险预测时,可以将主要精力集中在具有低还款风险特征属性的物流 企业上。图1决策树4结束语随着信息化水平的提高,银行和物流企业都积累了各种各样的数据,如何从大量的
15、数据中挖掘出潜在的应用价值,有效地降低物流金融的信用风险是个值得探讨的问 题。本文利用决策树ID3算法对某物流企业客户的高还款风险特征属性进行了挖 掘,能够给银行进行信用风险分类预测时提供一些参考,克服人为经验因素带来的 不确定性,降低信用风险。需要指出的是,在实际应用时,可以根据实际情况选择 相应的属性进行分类,以期找到更加符合现实情况的分类,为物流金融信用风险的 防范提供一定的科学依据。【相关文献】Jiawei Han Micheline Kamber.数据挖掘概念与技术M.范明,孟小峰,等译.北京:机械工业 出版社,2006:128-137.陈祥锋,石代伦,朱道立.金融供应链与融通仓服务J.物流技术与应用,2006(3):93-9
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东科技学院《环境材料》2023-2024学年第一学期期末试卷
- 广东金融学院《设计色彩》2023-2024学年第一学期期末试卷
- 广东建设职业技术学院《压焊方法与设备》2023-2024学年第一学期期末试卷
- 广东机电职业技术学院《测井数据处理与解释》2023-2024学年第一学期期末试卷
- 广东工业大学《教育与心理统计》2023-2024学年第一学期期末试卷
- 广东工贸职业技术学院《国际商务函电》2023-2024学年第一学期期末试卷
- 广东东软学院《新闻理论》2023-2024学年第一学期期末试卷
- 广东创新科技职业学院《水土保持原理与技术》2023-2024学年第一学期期末试卷
- 《光合作用原初反应》课件
- 广东白云学院《数字信号处理及实践》2023-2024学年第一学期期末试卷
- 数学-2025年高考综合改革适应性演练(八省联考)
- 景区旅游安全风险评估报告
- 建筑消防设施检测诚信承诺书
- ojt问答题未升版ojt204
- 五年级语文渗透法制教育渗透点教案呈现
- 贝雷片-潮白新河钢栈桥及钢平台计算说明书
- VF程序设计知识要点
- 凯普21种基因型HPV分型与其它比较
- 小学数学小专题讲座《数学教学生活化 》(课堂PPT)
- 鸡场养殖情况记录登记表
- 高压配电柜系列产品出厂检验规范
评论
0/150
提交评论