下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于遗传优化样本的信用评分指标体系研究
1将公司的风险转化为经济效应,主要有以下几种在评估公司信用时,公司的信用功能主要基于财务比率的信用特征来确定,然后根据不同的信用风险来评估不同类别的信用水平。公司的财务指标与信用风险之间往往存在非线性特征。比如某公司的财务指标(净利润/总资产)可能从-0.1增加到0.1,也可能从0.6增加到0.8,在线性的方法中,这两种情况体现出了相同的结果,因为该指标的值都增加了0.2。但对于一个公司来说,净利润/总资产从-0.1增加到0.1意味着该公司扭亏为盈,获得了生存和发展的机会;而从0.6增加到0.8意味着公司获利能力进一步增加,这两种情况具有不同的意义。神经网络适于描述这种指标间的非线性特征,1990年Odom首次将神经网络的方法引入信用风险评测中;Coats、Fant采用了神经网络分析法对美国公司和银行信用危机进行了预测,取得了一定的效果;Tam等研究银行信用,比较了判别分析、Logit、K近邻、分类树、神经网络等方法的优劣;Altman等在大样本下研究意大利企业信用,比较神经网络、判别分析;Kerling等研究法国企业信用,比较神经网络、判别分析,采用了交叉验证;Piramuthu等研究比利时企业信用,在神经网络中使用了特征提取技术。文献使用大样本建立模型,对不同国情、不同行业的信用状况进行分析,取得了较好的效果。但是在国内,由于市场经济体制不完善,上市公司的财务数据虚假成分很大,难以获得足够的建模样本。本文在认真设计初始小样本后,利用遗传算法策略繁衍样本,获取合理的建模样本,然后采用BP神经网络对企业的信用状况进行研究。2信用评价筛选方法企业信用水平是经济空间中不同层次、不同种类因素共振耦合的结果。通过充分研究当前信用评价领域的现状,我们提出了一套甄选方法准则。限于篇幅,详细理由另文给出。2.1信贷评估指标体系的建立本文参照我国已有企业信用评价指标体系把评价指标分为盈利能力指标、经营能力指标、偿债能力指标和发展能力指标四类,见表1。2.2抽样误差的行业差异在数据收集过程中,样本选取需要考虑的最主要问题是代表性、可靠性和抽样误差。所谓代表性就是保证样本能够充分地反映总体的真实情况;所谓可靠性就是样本中的每一个观察单位确属于预先确定的同质总体;所谓抽样误差就是因抽样而产生的样本与样本、样本与总体相应统计指标之间的差异。不同行业企业的财务特性是存在差异的,由于其生产经营流程、经营周期、经营性质等均有所不同,反映其财务状况和生产经营状况的财务指标必然不同。样本中企业所属行业及其资产规模影响和制约着样本的代表性,同时影响抽样误差。基于上述考虑,本文选择同一行业内的不同企业进行信用评价。由于非上市公司的资料难以收集,本研究中的样本来自1996年沪市26家商业股上市公司的财务数据和专家打分,样本公司见表2。3遗传算法的应用遗传算法(GeneticAlgorithm,GA)是一种基于自然选择和群体遗传机理的搜索算法,它模拟了自然选择和自然遗传过程中发生的繁殖、杂交和突变现象。在利用遗传算法求解问题时,问题的每个可能的解都被编码成一个“染色体”,即个体,若干个个体构成了群体(所有可能解)。在遗传算法开始时,总是随机地产生一些个体(即初始解),根据预定的目标函数对每个个体进行评价,给出了一个适应度值。基于此适应度值,选择个体用来复制下一代。选择操作体现了“适者生存”原理,“好”的个体被选择用来复制,而“坏”的个体则被淘汰。然后选择出来的个体经过交叉和变异算子进行再组合生成新的一代。这一群新个体由于继承了上一代的一些优良性状,因而在性能上要优于上一代,这样逐步朝着更优解的方向进化。因此,遗传算法可以看作是一个由可行解组成的群体逐代进化的过程。本文中,每个样本对应于算法中的一个个体,遗传算法开始时,在实际样本的上下界区间内随机产生若干个体,目标函数被定义为繁衍样本与原始实际样本的误差平方和。随着群体的不断进化,目标函数值不断减小,新的群体(即新的样本)就在最大程度继承实际样本特性的基础上进化出一些新的优良性质。当进化达到精度要求时,就可以得到要求的一系列的样本。在神经网络中,在分类判别方面应用最广泛的是反向传播(BP)网络,它是一种非线性映射人工神经网络。RobertHechtNielson证明了对于任意闭合区间连续函数都可以用含有一个或者多个隐层的BP网络来逼近。在应用BP算法时应当注意以下问题:①初始权值的选择应当是随机产生的小数,如果神经元的输入数值为R,则初始权值区间可估计为[-2/R,2/R];②学习率的选择不当会导致很大的网络误差。学习率选得过小,则收敛速度将很慢;学习率选得过大,则很可能回馈调整过头而产生振荡,甚至无法收敛;③学习过程中容易陷入局部极小值。针对以上缺陷,我们在构建网络时采取如下措施。(1)单元的激活函数为sigmoid函数时,进行归一化处理以避免工作在函数的平坦区域。归一化处理公式Y=X-ˉXD(X)Y=X−X¯¯¯D(X)其中,X、Y分别为网络的输入、输出矩阵,D(X)为输入矩阵X的方差。(2)网络权值利用随机数初始化。(3)采用变学习率的方法。(4)BP网络目前有近12种训练网络的算法,经过比较试验,我们采用快速的Levenberg-Marquardt(简记为L-M)训练算法,L-M算法实际是一种修正过的牛顿算法。对于中小规模的网络,如果计算机内存足够,L-M算法因其不可比拟的优越性能而被经常使用。4基于遗传计算方法和bp网络信用评估体系的bp4.1生成染色体群结合样本进化问题,作者给出以下算法步骤:①估计实际样本区间,按照一定精度要求缩放成新区间,在新区间内随机产生二进制编码,即得到染色体群;②利用解码器将染色体群转化为样本群体,求解该群体的目标函数值及适应度;③依据适应度和设定的交叉率、变异率等参数对染色体群进行选择、交叉、变异等遗传操作;④若进化达到设定的代数或者精度要求则算法停止,否则转步骤③;⑤选取一定的优化染色体群进行解码,即得到新的大样本。4.2信贷评估体系的建立基于BP神经网络的企业信用评价系统框架如图1。5模型的构建5.1复配器基因回复突变模型的建立遗传算法中,目标函数采用改进的DeJong函数,即求minf(Δx)f(Δx)=Νvar∑j=1Νind∑i=1(x样本i,j-x染色体i,j)2minx样本i,j±Δ≤x染色体i,j≤maxx样本i,j±Δf(Δx)=∑j=1Nvar∑i=1Nind(x样本i,j−x染色体i,j)2minx样本i,j±Δ≤x染色体i,j≤maxx样本i,j±Δ其中,Δ为设定区分值。Δ控制着遗传优化样本与初试样本的相似程度。理论上DeJong函数在0处有全局最优解为0,全局最优解0处表示遗传优化样本与初试样本误差平方和为0,即最相似;随着f(Δx)的增大相似性变差。适应度评价函数采用线性分级方法(linear-ranking),遗传算子选择继承、交叉、选择三个常用的算子,其算法分别由文献、、给出,具体参数值见表3。可见,本次建模中,群体大小为20×11,染色体矩阵大小为20×220。每一代将有20×各代间隔=20个新的个体被制造出来。新的优化样本大小定为100×11,包括实际20个样本公司和80个优化样本。BP网络输入层每个样本设计10个节点,分别对应评价系统中的10个指标变量;输出层定义一个节点,数值为每个样本的专家评分值。采用10个输入节点、1个输出节点的网络结构可能增加评价结果的误差和不确定性,但是本文仍然采用这种结构。这是由于:①评价结果的准确率与数据样本有很大关系,一种存在着缺陷的神经网络如果能得到较好的结果,就更能说明本文遗传繁衍样本策略的优越性能。②本文的信用评价结果是以信用分值的形式出现的,属于非线性连续评分行为(如果样本企业趋于无穷多,那么信用分值必将趋于覆盖特定区域的实数集合,可以认为在信用分值有意义的范围内是逼近于连续型的)。如果按照经典的增加节点的方法,利用正交矩阵来增加节点数目,那么正交矩阵维数会趋于无穷,神经网络将难以“工作”;如果将正交矩阵控制在低维,那么所做的工作最多属于信用分类评级工作,会因为难以与专家分进行比较分析而与本文的内容相悖。③评价结果的误差和不确定性可以通过数据后处理工作来加以控制,如本文的回归分析。BP网络第一、二层分别采用tansig和purelin函数,表4给出BP网络的参数设置结果。5.2各代适应度值分布采用Matlab语言与c混合编程实现,在pentium4上运算。遗传算法求解得到1000代进化的结果,限于篇幅,仅在表5给出10代的最小目标函数值。其中前5列是各代最小目标函数值中最小的5个,第800代产生的样本与原样本误差最小,是1000代中的最优样本;第1代随机产生的样本与原样本的误差最大,是1000代中的最差样本。我们取前4个对应的样本,然后合并实际样本就构成了本文BP网络的优化建模样本。图2是各代的适应度值分布图,该图见证了遗传进化的全过程。限于篇幅,我们在此省略了优化建模样本的具体值,仅在表6中给出其中的一组进化样本(20家)。该组样本信用分值合理分布在区间[0.4,1]上,可见新的繁衍样本具有比较好的特性,代表了不同等级信用水平的公司。W11=[-0.83520.451830.0234770.363880.77471-0.458711.23280.233160.95846-0.086038-0.687820.0405060.591890.30985-0.87147-0.21623-0.40541-0.20359-0.97570.33136-0.68310.0361990.395940.59112-2.38920.343370.49820.22514-1.36051.1880.330371.03560.0309680.087219-0.683571.1019-0.25128-0.15119-0.20785-0.60280.41790.608820.95536-0.109040.1534-1.8447-0.373710.370511.5022-0.00631]W12=(-0.46995-0.260130.054556-0.25790.24609)B0T1=(0.162922.1529-0.307690.63944-0.40466)5.3网络训练过程为了比较初始实际样本与遗传样本,分别用BP算法进行二次建模。其中采用100个样本在33个时间单位(epochs)后达到既定精度0.0005完成建模,得到网络各层权值W1、W2及偏差B0T。各层权值W1、W2及偏差B0T的确定标志着网络训练过程的完成。采用20个样本在9个epochs后达到既定精度0.0005完成建模,建模后得到网络各层权值W11、W12及偏差B0T1。6评估能力的测试6.1遗传优化样本与商业股上市公司网络分值比较用以上建立的两种BP模型分别对6家新的公司(不包括在建模样本中)评分以检验两种BP模型的评分能力。表7给出了采用两种样本建模的信用评分检验结果,观察绝对分值,发现采用遗传优化样本建模的网络输出分比较合理,除“天桥百货”、“南京新百”两家公司的网络分值与专家评分相差比较大外,其余4家公司的网络分值与专家评分都比较接近。这说明遗传优化样本在更大的范围内捕捉了商业股上市公司的信用性质,从而便于BP网络在更合理的范围内进行外插和内推的泛化,建立更贴近实际的模型。相反,由于原始小样本仅包括20家公司,BP网络进行训练的时候很难捕捉到贴近实际状况的商业股上市公司的信用性质,这就导致了其网络分值与专家评分相差甚远,除“第一食品”这一家公司的网络分值与专家评分比较接近以外,其余5家公司都相差甚远。企业信用评价除了要考察企业的绝对信用评分之外,也要分析各信用企业的相对水平。表7中给出了检验样本公司的相对排序状况,以考察其信用相对排序状况。很明显,采用遗传优化样本建模其比较优势更强。如果我们按照[0.6,0.8]、[0.8,1]两个区间来划分两个信用等级,也就是阈值点为0.8,则采用遗传优化样本建模只有1家公司(天桥百货)被误判,判别准确率达83.3%;而采用小样本建模有4家公司被误判,判别准确率仅为33.3%。6.2线性回归斜度及回归截距、回归可决系数为进一步检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年度人工草皮旅游度假村建设购销合同
- 二零二四年度五级抗震设防建筑工程设计合同2篇
- 二零二四年度石子行业专利许可使用合同
- 全新购销合同模板(2024版)2篇
- 二零二四年度技术研发合作合同标的及保密条款5篇
- 2024年度建筑工程合同的标的和工程时间表
- 2024年度艺人经纪合同(含肖像权与演出安排)2篇
- 二零二四年度建筑工程设计合同(含概念设计、施工图设计)2篇
- 二零二四年度艺人经纪合同艺人经纪公司管理与艺人权益3篇
- 二零二四年度广告发布合同标的为媒体广告2篇
- 2024中国中信金融资产管理股份有限公司北京市分公司招聘笔试核心备考题库及答案解析
- 医药代表培训完整教程
- GB/T 44713-2024节地生态安葬服务指南
- 《可持续发展新理念》课件
- 一年级家长会课件2024-2025学年
- 2024年教资考试时政高频考点141条
- 《扣件式钢管脚手架安全技术规范》JGJ130-2023
- 装修设计需求模版
- 欠薪清零台账
- 大学学生社团管理办法
- 植物蛋白肽生产建设项目可行性研究报告
评论
0/150
提交评论