版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE24PAGEPAGE1零售贷款业务客户群体特征分析——基于T银行客户样本摘要当前我国第三方支付平台、P2P、互联网理财等公司如雨后春笋冒出,国内各家银行特别是商业银行均面临存贷款客户流失的问题。根据互联网金融之后,Fintech的崛起,这次金融科技元素的突起,给金融业带来巨大震荡的情况。在这样一个现实背景下,本文从零售贷款客户细分的视角来探讨零售贷款业务的创新,得出零售贷款客户的三维度特征与贷款业务之间的关系,这对于深入理解客户贷款行为和贷款风险及其市场需求,对银行服务和选择市场客户具有重要的实践指导价值。本文运用描述性分析、Pearson相关性分析、聚类分析等多种统计分析方法,围绕主题内容,通过T银行零售贷款客户进行原始数据的收集整理,选取借款人的年龄、性别、学历、婚姻、收入、资产状况、贷款金额、利率、还款情况、逾期率等10个背景特征,提出相关假设,并对模型进行构建。最后,本文通过理论探讨和实证分析,得到了以下结论:资产和婚姻之间负相关关系,且较显著;还款是否正常与年龄负相关关系;还款是否正常与逾期次数负相关关系;还款是否正常与学历之间正相关关系,且较显著;逾期次数与年龄正相关关系,但不特别显著;逾期次数与学历负相关关系,且较显著。本文从零售贷款客户细分的视角来研究零售贷款的客户特征与风险评价,为T银行零售贷款业务进行客户群体的分析和准确评价,并按照风险等级的大小了解客户的基本属性,进行相应的客户关系管理,尝试为银行零售贷款业务客户群体特征提供科学的依据和正确的方向。提供现实的参考与指导意义,有一定的启示意义。关键词:商业银行,客户细分,客群特征,聚类分析
目录零售贷款业务客户群体特征分析——基于T银行客户样本 1摘要 1第一章绪论 3第二章研究设计 4第一节研究假设 4一、借款人自然特征对贷款业务的影响 4二、借款人的经济特征对贷款业务的影响 5三、借款人的贷款特征对贷款业务的影响 6第二节研究方法 6一、变量选取 6二、模型构建 9第三章实证研究与分析 14第一节数据来源与处理 14一、数据来源 14二、数据处理 15第二节描述性分析 16第三节相关性分析 19第四节配对样本分析 21第四章结论与建议 22第一节研究结论 23第二节研究建议 25一、基于客户细分的营销策略 25二、基于客户细分的具体业务创新 27参考文献 28第一章绪论现阶段,随着中国经济发展速度趋于缓慢,所面临的风险问题也随之加大。早期所积累的一些金融资金由于通货膨胀问题也受到了一定的限制,银行业也开始发生了翻天覆地的变化,突出表现在盈利水平低下、资金紧张等方面的问题,自身的经营发展模式也面临着一系列的阻碍。自从2013年以来,随着互联网技术水平的提升,一些新型支付手段的衍生给传统的银行发展带来了一系列的挑战。首先,商业银行零售贷款业务面临着严重的客户资源流失。其次,客户有更多选择平台的能力,尤其是一批长尾客户,在新的三方金融平台中找到了适合自己的产品,且银行的产品已经不再是很多年轻客户的首选。最后,除了来自互联网的挑战外,另一大挑战是来自大数据。传统的银行业通过各种技术手段已采集和储存了大量的客户信息,如何从这些已有的大量信息中找出有价值的信息,从而为银行的金融产品设计,实现小微贷款精准营销,风险管控等方面提供强有力地支持呢?这就预示着商业银行需要顺应当前的经济结构转变发展方式的趋势,积极推进经营战略转型,从而适应新的市场经济规律。从普惠金融的层面出发,分析自身产品优劣势,以及贷款客群的特征,通过对客群的细分,并进行聚类分析,根据分析出的特定属性挖掘适合新产品的客户群体。第二章研究设计第一节研究假设本文的主要目的是研究客户特征对零售贷款业务的影响,通过研究分析两者的相关性,进而对T银行的风险管理提出建议。因此,根据文献研究的结果,将零售贷款信用风险考虑的影响因素划分为三个维度——反映贷款人自然特征的维度(包括年龄、性别、婚姻状况、教育水平、是否有子女、供养人数、从业时间)和经济特征的维度(包括薪水、月其他收入、住房类型、房产情况、房产数量、车产情况、信用卡额度)以及信贷客户的贷款特征(贷款数额、还款期限、保障方式,逾期次数)。本文从中抽取10个T银行最为关注的维度进行相关性分析,通过查看各个特征之间是否存在相关性,且是否为信用风险的主要影响因素,并对各影响因素进行聚类分析,预测客户是否会出现逾期行为,尝试为T银行信用风险控制提供科学的依据和正确的方向。T银行在实际操作中对于借款人的审核数据包括但不限于如下特征:年龄、性别、学历、婚姻、收入、资产状况、申请金额、对应贷款品种利率、征信还款情况、借款用途、贷款期限、每月应还金额等多个指标,另还需通过全国法院被执行人网及侧面查询客户单位真实性等。本章将通过三个方面来研究探讨借款人的各类特征对零售贷款业务的关系:一是借款人年龄、性别、学历、婚姻等个人自然特征,这几个指标目前普遍被用在进入银行门槛的各类贷款需求者的相关条件。二是借款人个人收入、资产状况的经济特征,这两个指标用于分析借款人的个人还款能力及第二还款来源。三是借款人贷款金额、利率、还款情况、逾期率这四个指标,其中贷款金额及相应的利率对于不同的贷款客户是否影响贷款的业务发展,提高银行的收益对于零售贷款业务是否有影响。一、借款人自然特征对贷款业务的影响借款人的自然特征包括:年龄、性别、学历、婚姻等,作为借款人的一个重要的人口背景特征,是影响银行借款申请的一个门槛。从年龄来讲,如果借款人年龄不符合要求,系统将无法提交,是非常硬性的申请前提。因为借款人年龄上的不同,所以每一位借款人自身的还款能力、工资水平、信用等级等方面的内容都会存在区别,所以也会表现在工作之中出现各种各样的问题。因为一般经验来说到了中年以后家庭经济更加稳定,应该更具备还款能力,当然,每家银行的客户群体不同,得到的数据结果也有可能是相反的。性别来讲,总体来说女性的逾期率普遍低于男性。即女性的按期还款可能性要高于男性的按期还款率。对于女性而言,她们的心理状况和相关生活习性使得她们更倾向于在有一定资金的时候及早还清贷款,这样一方面可以提升自己的信用等级,另一方面也可以在后期购置其他的金融服务。所以女性的信用风险较低。但是这种性别信用差异是否显著还需要进一步验证。教育水平来讲,本文借款人教育水平划分为了本科及以上、专科、高中及以下等三种借款人。根据传统观念,受教育水平越高,其违约成本越高,故信用记录越好。后续我们将通过数据进一步验资。婚姻状况来讲,本文将所有已婚客户归一类,未婚包括丧偶归同一类,离异单独归一类,之所以将丧偶归到未婚中,是由于丧偶非主动行为,故不应该归到离异中去。且丧偶借款人在少数,对总体影响较小。另一般银行将已婚人士设置为较稳定还款客户,但通过数据分析,可看出,许多已婚人士依然逾期率较高,而单身客户由于还未成家甚至能获得父母更多的经济支持并且努力偿还我行贷款,故这点也将在本文中进行验证。由此假设:H1:借款人年龄与贷款业务呈正相关关系H2:借款人性别男性与贷款业务呈负相关关系、女性与贷款业务呈正相关关系H3:借款人学历与贷款业务呈正相关关系H4:借款人婚姻与贷款业务呈正相关关系二、借款人的经济特征对贷款业务的影响借款人的经济特征包括个人月收入、资产状况。其中个人月收入指标只要符合本次贷款月还款额2倍以上即可,且能申请到T银行贷款的客户均已经满足,本文希望通过分析得出,是否收入越高的借款人其信用记录保持越好。另一经济特征指标,资产状况可以提升零售小额贷款客户的系统评级,如果评级过低将影响贷款金额,故客户有资产的情况下,均可以提升相应的系统评分。且有资产对于客户来讲,虽然资产未抵押,但是却增加客户的违约成本,故本文希望通过分析,看这个传统银行最在乎的资产对于贷款实际风险有无直接的相关性。由此假设:H5:借款人收入与贷款业务呈正相关关系H6:借款人资产状况与贷款业务呈正相关关系三、借款人的贷款特征对贷款业务的影响借款人的贷款特征包括贷款金额、利率、还款情况、逾期率这四个指标。其中,贷款金额的多寡及对贷款利率的敏感性可以反映借款人的贷款需求的迫切与否,贷款需求大,不代表客户就有相应的还款意愿;当然,贷款需求小,也不代表该客户就顺利还款。愿意接受相对较高利率的客户不一定就有还款风险,另一方面,贷款利率较低的客户其也有逾期的可能性。故本文通过样本分析,希望能得到借款人贷款金额及利率对零售贷款有着什么样的影响。由此假设:H7:借款人贷款金额与贷款业务呈正相关关系H8:借款人贷款利率与贷款业务呈负相关关系H9:借款人还款情况与贷款业务呈正相关关系H10:借款人逾期次数与贷款业务呈负相关关系研究方法根据本文的前期假设,现需要对T银行客户数据进行整理与相关数据处理,并选取对本案影响较大的变量,进行相关模型构建。一、变量选取(一)变量选取的原则变量的选取做到了以下几个原则:1、变量选取要有一定的目的性研究。结合T银行信贷客户信用风险的相关影响要素来看,为了对于可能存在的相关信用风险及时进行规避,对于相关变量的选择就必须以某一特定的目的为核心,对于变量和目的之间的关系进行科学化的把握,这样最后所得到的结果才是合理的。2、变量选取要理论联系实际,变量的选取要采用科学的方法又要符合实际情况,做到理论联系实际。3、变量选取要注意整体性和系统性,T银行贷款客户信用风险的影响因素的研究是一项系统的工程,为了比较全面的反映T银行贷款客户信用风险的整体情况,变量选取时T银行相关业务的指标也要考虑在内。系统内,在保证变量合理完整的基础上要尽量做到简洁。4、变量的选取要注意可行性和可操作性原则,整个变量选取要以真实数据为基础,选取过程做到标准化、正规化,以期在后续推广运用。5、选取的变量能够量化,能够可测量性。量化风险才能为零售贷款客户的信用风险控制提供参考依据,只有变量可以被测量时,零售小额贷款客户信用影响因素的研究才具有实际操作的意义。(二)变量的分类各国衡量客户的信用风险普遍以客户出现逾期行为或者违约行为为标准;朱欣乐指出,信用风险又叫违约风险,是指“交易对手没有按照预先的约定,履行契约中的义务而导致经济损失的风险,也就是受信人未能按时履行还本付息的责任而导致授信人的实际收益与预期收益产生偏离的可能性,金融行业最主要的风险是交易对手违反约定的风险”。根据实际的可操作性,本文将各指标属性分为以下三个维度:第一,借款人基本情况,表明借款人的基本属性,反应借款人在社会生活中的特征。第二,借款人的经济特征,表明借款人的收入是否稳定,将会对还款连续性有影响;借款人是否有资产,关系到客户违约成本。第三,客户的贷款特征,贷款的金额、利率、还款情况、逾期次数等情况,会影响到借款人的还款能力。借款人的正常还款次数越多,说明其本人还款意愿越强,贷款稳定性也会越高。二、模型构建(一)客户细分的概念客户细分是CRM理论的一个关键分支,对于企业实现盈利和客户满意的双赢局面具有重要意义。首先在市场竞争日趋激烈的今天,产品和服务同质化的现象十分普遍,企业间的价格战越演越烈,导致客户忠诚度大大降低;其次企业资源有限,把有限的资源无策略地盲目投入到市场中,造成高投入低回报的局面。客户细分的原则包括:1、明确细分目的如果说企业想要摸清市场结构,尤其是客户的分布情况,那么应该采用基于人口统计的细分方法;如果说企业想要了解客户的购买行为偏好以提高销量,那么应该采用基于客户行为特征的细分方法。因此,在进行客户细分之前应该了解企业的需求,明确细分的目的。2、细分指标的有效性用于进行客户细分的指标体系可能非常庞大且复杂,因此在进行客户细分时,应该选择哪些具体指标就显得尤为重要,细分指标要有一定的代表性和有效性才能对生产销售起积极作用。3、细分结果的可识别性假如在进行客户细分之后的群体的特征并不是非常明显,那么企业就无法针对这一人群制定特定的营销方针,这样的细分是没有任何价值的。因此能够有效的识别细分后的客户群体也是十分必要的。4、细分群体的市场容量合理性企业的生产、服务以及客户关系的维护都需要投入大量的人力、物力、财力,如果某个细分后的客户群体的市场容量很低,其运营成本远大于利润回报,以至于客户价值达不到预期,这就失去了客户细分的意义。因此,要保证客户细分群体拥有合理的市场容量。(二)客户细分的模型客户细分的有效性决定了企业实施客户关系管理的效果,而客户细分是否有效取决于采用何种方法进行客户细分。回顾以往学者对客户细分方法的研究,可以发现客户细分的方法主要有两大类:一是根据客户的自然属性进行客户细分,二是根据客户的行为属性进行客户细分。相比于传统的RFM模型,聚类分析具有以下优点:第一,更全面的、更深层次的洞察客户。利用聚类算法进行客户细分时,往往选择多个指标变量,综合考虑客户的多个消费习惯特征,而不仅仅是考虑某几个指标的影响,这样就能对客户有更全面的认识,得到的细分结果也更客观、更有说服力。第二,细分结果更具价值性。由于聚类算法是基于客户多个指标变量进行的分析,我们可以很容易的得到每个客户细分群体的人员名单,并且解读不同群体的行为特征,从而可以制定更有针对性的营销策略。此外,我们还可以根据企业的具体需求对客户进行二次甚至多次细分。第三,便于实行动态话跟踪,经济市场瞬息万变,对于客户的实时动态的把控则更加重要。基于聚类分析的客户细分可以随时进行,以应对市场的变化,随时做出调整。(三)聚类分析的相关研究系统聚类算法分析又称集群分析算法,是一种重要的客户细分方法,其基本思路是利用一个独立变量的矩阵,把性质相近的个体归为一类,性质差异较大的个体归于不同的类,最终达到类内个体具有较高的同质性,类间个体具有较高的异质性。该方法是对给定的数据进行层次的分解。有两种类型:一种是凝聚的方法,其思想是一开始将每个对象作为单独的一组,然后根据同类相近,异类相异的原则,合并对象,直到所有的组合并成一个或达到一个终止条件为止。另一种是分裂的方法,其思想是一开始将所有的对象置于一类,在迭代的每一步中,一个类不断地分为更小的类,直到每个对象在单独的一个类中或达到一个终止条件。系统聚类的特点是,类的个数不需事先定好,但是运算量大,适用于处理小样本数据。并且其一旦一个步骤完成,就不能被撤销或修正。作为统计学科一个重要分支,聚类分析应用涉及面较广,迄今为止已被国内外众多学者研究许多年,目前很多系统或者统计分析软件包如SPSS、SAS等都已包含了基于K-means、K-mednids(K为中心点)的聚类分析工具。基于其他方法的一些聚类工具也逐步被研发出来并投入使用。聚类分析涉及行业范围广,国外专家或科研机构对聚类算法的研究也比较全面,总体来说,较早的聚类分析的方法有以下几类:(1)层次法,如CURE、ROCK、BIRCH、CHAMELEON等。(2)划分法,如K-means算法、CLARA、PAM、CLARANS等。(3)基于模型的方法,如COBWEB等。(4)基于密度的方法,如OPTICS、DBSCAN、DENCLUE等。(5)基于网格的方法,如WaveCluster、STING等。k-means作为解决聚类问题的一种经典算法,它的主要优点是算法理论与实现都很简洁、快速。在对象相对密集的情况下能取得不错的聚类效果。并且对处理大的数据集,该算法是相对可伸缩的和高效率的。K-means法采用一种启发式的迭代过程,进行重新划分数据对象和重新更新簇中心。设有m维数据集为X,将其聚类分为k个簇w1、w2、…、wk它们的聚类中心分别为c1、c2、…ck。且簇wi中的数据点个数记为i,数据集X中的对象个数记为n。其中(3-1)其算法的基本思路是:假设一个具有N个元素对象的集合以及所要生成的簇的数量值k,第一轮中随机选取k个样本元素当作初始聚类中心,并算出其他样本元素距离这k个聚类中心点的长度,依据距离的远近,分别划分为k个簇,在接下来的每一轮中,不断进行以上步骤的迭代运算,即将此次获得的元素对象的平均值当作下一轮进行聚类的中心点,直到满足迭代过程中聚类中心点不再改变的条件,则代表聚类成功。K-means聚类算法的基本流程如下:(1)给定聚类数目k和初始聚类中心已知一个数据集N,包含n个数据对象,从中任意选取或指定k个数据点作为初始聚类中心Zj(I),j=1,2,…,k。(2)由距离最近原则确定聚类结果依次计算每个数据点到这k个聚类中心的距离D(xi,Zj(I)),i=1,2,…,n;j=1,2,…,k并基于距离的长短,重新分配各个簇的对象。若满足(3-2)则把与聚类中心最短距离的数据点归纳进相应的簇中。(3)k个聚类中心的重新确定重新计算每个聚类的均值并确定新的聚类中心点,为进一步迭代做准备。计算误差平方和准则函数J。(3-3)(4)聚类终止条件的判断如果(3-4)则算法结束,否则I=I+1,计算k个新的聚类中心,(3-5)返回第二步。(5)输出k个聚类集合K-means聚类算法的基本流程图及其过程示例图,见图3-1所示。图3-1K-means聚类算法的基本流程图数据集数据集随机选择K个聚类中心随机选择K个聚类中心重新计算聚类中心K-means算法重新计算聚类中心K-means算法准则函数是否收敛准则函数是否收敛NY结束评价聚类结果结束评价聚类结果相关性分析皮尔逊相关是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。由于研究对象不同,相关系数有多种定义方式,本文主要采取皮尔逊相关。一般用字母r表示,用公式表示如下:(3-6)其中Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。r的绝对值越大表明相关性越强,要注意的是这里并不存在因果关系。若r=0,表明两个变量间不是线性相关,但有可能是其他方式的相关(比如曲线方式)。(五)配对样本分析配对样本分析包括对样本的t检验与卡方检验。样本t检验可分为单总体检验和双总体检验,以及配对样本检验双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况,一是独立样本t检验(各实验处理组之间毫无相关存在,即为独立样本),该检验用于检验两组非相关样本被试所获得的数据的差异性;一是配对样本t检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。皮尔森卡方检验(英语:Pearson'schi-squaredtest)是最有名卡方检验之一。“皮尔森卡方检验”最早由卡尔·皮尔森在1900年发表,用于类别变数的检验。科学文献中,当提及卡方检验而没有特别指明类型时,通常即指皮尔森卡方检验。第三章实证研究与分析为保证模型的合理性,在利用原始样本数据估计出研究模型后,在实证研究部分主要利用数理统计中的描述性分析与相关性分析,对估计结果的可靠性进行检验。第一节数据来源与处理一、数据来源本文将在前一章文献综述和理论的基础上,结合本研究的需要,获取的研究数据均来源于T银行。数据的范围包括了分行各类贷款品种的客群,也包含了较大规模的个体工商户及上班族中融资需求旺盛的个人群体。由于本文希望能够得出普遍使用的T银行信用风险评估结论,所以,通过对这种全范围的贷款品种进行更全面的研究,也避免了信贷客体特征的局限性。本文选取T银行2016年1月到2018年1月之间运营的部分数据,每一笔零售贷款都是由主办客户经理、协办客户经理以及分行审批人员多重把关放出的,经历了贷款的进件申请到复核审批的标准化操作流程,这也就保证了样本的各项数据的各项指标变量的客观性和准确性。具体来说,对于单个数据的观测值的观测区间是以从贷款审批时开始,到最终贷款合同终结为一个完整的时间区间,若贷款合同的预计的终结时间是在2018年1月30日之后,那么该样本就不包含在所研究的样本之中。二、数据处理(一)数据清理确定了数据选取的时间区间之后,则需要对整合的数据进行清理。从确定的数据区间之中,剔除数据缺失的样本后,从中随机抽取499笔的小微零售贷款客户样本进行深入研究。这些样本包含了没有发生过逾期(包括成功还清和提前还清)和发生了逾期(包括计提坏账)的所有客户。这499组客户样本数据(119个样本逾期,380个样本没有逾期)中,每组都包括10种贷款客户的信息,可以分为三个维度:个人自然特征信息、经济特征信息和贷款信息。另对照样本是在同一个贷款时间区间选择了1000个普通贷款客户进行配对分析。(二)数据录入所有这些被随机选取的样本,通过汇总整理,都需要手工通过客户号进入个贷系统,进行三个维度的详细查询,客户经理手工进行编制EXCEL表格并录入指标信息,并最终形成可以用数字或简单符号标记的形式,为接下来的实证分析做基础准备。现将研究组的零售小额贷款客户,须同时具备的条件罗列如下,见表4-1所示:表4-1零售小额贷款进件要求表申请年龄21——59周岁且具有完全民事行为能力的自然人借款金额1万(含)——30万(含)借款利率最低基准上浮40%(含)以上担保方式购买“平安财险”、“阳光保险”“人保财险”个人贷款保证保险,贷款金额不超过保险公司的保障金额。还款方式仅允许按月“等额还本付息”征信情况征信如发生近2年内有连续逾期90天以上不良记录,或累计逾期记录超过6次不予申请;信用卡有恶意〔信用卡账户为非正常状态,且欠款金额在3000元人民币以上(含)〕透支的也不予处理。逾期后处理保险公司将在6各月内偿还T银行逾期本息金额。另本文研究的小额贷款客户担保方式是信用+保单担保,T行贷后管理岗每日查看贷款相关报表,对于逾期未超过60日的客户,客户经理进行催收;对于逾期达60日以上贷款提醒经办行客户经理准备索赔申请。保险公司在受理后,将在6个月内偿还T银行逾期本息金额。(三)数据预处理由于指标中既有性别、学历、婚姻情况、还款情况等定性指标,又有年龄、薪资、贷款金额、利率、逾期次数等定量指标,所以应对指标进行预处理。为了方便后续的操作,本文将定性指标按程度的不同转变为有序响应的变量,见表4-2所示。表4-2借款人指标预处理指标序号指标原始属性值1性别男1;女22年龄实际值3婚姻状况已婚1;未婚2;离异34教育水平高中及以下1;专科2;本科及以上35收入(月)实际值6资产状况有1;无07借款金额实际值8借款利率默认为年利率9还款情况正常还款1;逾期未还010逾期次数实际值第二节描述性分析所谓的描述性统计分析,指运用数学语言表达一组样本的特征,如总数、均值、标准差等数据情况。本章以小额贷款客户为实验组,运用spss软件进行了描述性统计,统计结果见表4-3所示。表4-3实验组样本的变量描述性统计变量样本数最小值最大值均值标准差月收入4993031.2482508.030524.68934433.2557高中1大学2本科以上3499131.33.499还款正常1不正常049901.76.430逾期次数4990202.413.539金额元4991200030000056434.8724520.569利率4996.656.656.6500.00000性别男1女2499121.25.436资产有房1无房049901.47.504结婚1未婚2离异3499131.33.604年龄499225840.698.245有效的N499根据导入的小额贷款客户全样本的变量描述性统计,归纳出以下几个特点:从逾期次数来看,最大为20,最小为0,说明逾期次数差异大,均值2.41同时表明这批小额信贷客户的征信意识整体较不理想,还款意愿较正常客户低。从还款是否正常来看,平均值为0.76,说明还款大部分还算正常。从学历来看,学历平均值为1.33,其中高中学历占67.9%,说明这批借款人受教育水平普遍较低。从性别来看,最终放款的客户中有75.4%是男性,24.5%是女性,通过查询该T银行数据库的申贷记录发现:女性的申贷记录比男性的少,融资需求比相对较低。从年龄来看,最大的贷款者为57岁,最小的23岁,平均年龄是40.6岁,样本数据主要集中在31岁到49岁之间,这说明贷款的人主要处于中年阶段,这也符合我们常规的判断,中年人相对于事业处于上升阶段,对资金的需求相对更高。从婚姻状况来看,80.9%的贷款客户己婚或离异,这很大程度上是与平均年龄相关的。通常借款人的年龄都在35岁左右,这个年龄状态下的人家庭状态已经成熟,所以,大部分借款人婚姻状态是已婚或者离异。从样本数据中看出46.4%的客户是有房产的(包括集体性质房产与商品房),且大部分有房贷记录,说明贷款客户的整体经济水平不高,且从贷款情况可以认为,这些客户的贷款信用水平也相对较低,这也符合我们的分析,来到T银行申请小额贷款的客户群通常都是其他金融机构拒审的,信用质量相对较差的一批客群。从贷款利率及还款方式得出,客户的还款方式为按月等额还本付息,利率6.65%,普遍高于T银行其他贷款利率,这也符合T银行的盈利特征,T银行的主要盈利收入就是贷款客户缴纳的利息,而其他优质客户信贷利率较低,无法与之对比,其其他信贷产品没有保额担保说法,即会大大增加T银行的业务风险,从T银行角度,更愿意发放较高利息贷款给小额贷款客户。在这499份贷款数据中,贷款金额的最大值是300000元,贷款额的最小值是12000元,对原始数据进行描述中可以看出整体贷款客户的信用额度的平均值为5.6万元,说明T银行的贷款额度都集中在10万元以下。而严重逾期客户的平均信用额度为5.14万元,由此可以推测,信用额度低的客户,发生逾期行为的概率更高。另用spss软件对实验组客户进行10个变量的频率统计分析,后得出的样本基本特征,结果见表4-4所示。表4-4统计变量频率统计表性别男37274.5女12725.5合计499100.0年龄21-30岁5410.830-40岁19839.740-50岁1753550岁以上7214.5合计499100.0婚姻结婚37074.2未婚9418.8离异合计354997.0100.0学历高中34068.1大学15330.7本科以上合计64991.2100.0收入1万以下11222.41-5万31563.25万以上合计7249914.4100.0资产有23353.5无26646.5合计499100.0贷款金额1-10万22054410-20万26853.720-30万合计114992.3100.0还款情况正常38076.2不正常11923.8合计499100.0逾期次数1-3次36172.44-10次11523.010次以上合计234994.6100.0从统计分析结果来看,受访者中男性略多于女性;年龄分布主要集中在30-40岁之间的青壮年;文化程度以高中为主;从还款是否正常来看,平均值为0.76,说明大部分还款还算正常。此表可与表4-3相互参考,其数据更加直观。第三节相关性分析根据研究整理,本研究各变量的Pearson相关系数,见表4-5所示。表4-5pearson相关性分析检验月收入性别资产婚姻年龄学历还款是否正常逾期次数金额元月收入1性别0.011资产0.058-0.0231婚姻-0.040.05-.142**1年龄0.083-0.047.188**0.0381学历0.0010.0670.041-0.024-.365**1还款是否正常-0.0070.0430.04-0.004-.091*.260**1逾期次数0.0690.0070.0220.017.133**-.217**-.681**1金额元.092*0.025.124**-0.081.093*0.075.111*-0.0711注:*在0.05水平(双侧)上显著相关。**在.01水平(双侧)上显著相关。从表4-5pearson相关性分析检验来看:其中两个变量:资产和婚姻之间负相关关系,且较显著,通过所有数据可以看出,无房的借款人有占66%的客户是已婚人士。说明无房的客户群中,以已婚人士占多数。表4-5显示了还款是否正常与年龄在5%水平上负相关,与逾期次数在1%水平上负相关,与学历在1%水平上正相关。从表中可以看出,借款人的还款是否正常与年龄和逾期次数成负相关,与学历成正相关,其中与年龄在5%水平上显著负相关,说明借款人年龄越大,其还款正常率难以保证,这与我们传统意义上认为借款人年龄越大,收入越稳定,还款情况越正常有着比较大的出入;还款是否正常与逾期次数在1%水平上显著负相关,这与本产品的特征有很大关系,由于小额贷款客户情况均资质一般,很多客户对信用记录较不敏感,在不断催收下才能缴纳按揭款。而真正有逾期可能性的客户属于还3期就直接进行断缴,因此存在逾期次数与还款成显著相关的现象;还款是否正常与学历在1%水平上正相关,而且特别显著,这个与我们刚开始的设想是一致的。借款人的平均教育程度越高,还款也越正常,与本文假设一致。(3)逾期次数与借款人的年龄、学历变量之间相关关系中,逾期次数与年龄在1%水平上正相关,但是不特别显著。与学历在1%水平上负相关,且较显著。说明借款人年龄较越大,对征信的重视程度没有年轻人高,而年轻人有自己的将来要筹谋,故对征信较看重,能做到尽早还款。这与上段分析结果相符。同样,逾期次数与学历存在较明显的负相关,也与上段落分析结果相符。证明学历越高的借款人对征信越重视,越不会让自己的信用记录存在污点,也同样说明学历高的借款人工作收入稳定,风险系数较小。对上述变量之间的关系,本文在下节回归分析中进行更详细的检验说明。第四节配对样本分析在分析配对样本时,本文运用总体t检验法,该法主要检验两个样本平均数与其各自所代表的总体的差异是否显著,以及卡方检验法,用来检验本文两个变量之间是否存在关系,或者说是否独立,其零假设为两个变量之间没有关系。在实际工作中,经常用交叉表来分析比例是否相等。我们对499户研究组及1000户普通客户组进行样本的配对分析:对月收入、逾期次数、年龄、利率、金额进行样本T检验对学历、还款是否正常、性别、资产有无、婚姻进行卡方检验根据研究整理,T检验统计结果,见表4-6所示。表4-6T检验统计结果项目组别N均值标准差tSig双侧)月收入实验组49930524.68934433.2557-3.8810对照组99940321.94763198.4189逾期次数实验组4992.413.5398.8510对照组10000.842.567年龄实验组49940.698.245-0.5680.57对照组99940.959.167金额元实验组4995643.8724520.569-26.6570对照组10001386119.91577022.495利率实验组4996.65024.1760对照组10005.74321.18616从表4-6的多样本T检验统计结果来看:除年龄以外,月收入,逾期次数,金额元以及利率的显著性水平P<0.05。因此认为研究客户与普通客户间这些变量差异显著,而年龄无显著差异。其中通过均值可以看出普通客户的月收入比小额客户月收入高出1万每月。由研究客户的平均逾期次数为2.41,普通客户仅为0.84次,相较于研究组客户,其对个人还款较重视,且反应其还款意愿较强。由贷款金额看出,小额客户贷款日均较低,仅为56434.87元,而普通客户由于很多为房屋抵押类消费贷、经营贷、以及个人公积金贷等产品,笔均为1386119.9元,说明客户资信较好,故审批额度较高。根据研究整理,卡方检验统计结果,见表4-7所示。表4-7卡方检验统计结果项目分组对照组实验组卡方值渐进Sig(双侧)性别7.4330.006男6773721049女323127450资产651.0310无房0266266有房10002321232婚姻2.7650.598结婚7373691106未婚19794291离异65351000学历79.6520高中446339785大学501153654本科以上53659还款是否正常188.2820不正常21119140正常9793791358抵押1信用2保证31499.0000抵押8930893信用1070107保证0499499从表4-7的多样本卡方检验统计结果来看:除婚姻以外,性别,资产,学历,还款正常,抵押等的卡方检验的显著水平P<0.05,因此研究客户与普通客户间差异显著,而婚姻差异不显著。由男女性别可以看出,实验组的男性与女性比为2.9:1,而普通组客户的男性与女性比为2:1,说明实验组中男性比女性更易接受较高利率的贷款产品。由学历可以看出,实验组的高中学历与大学及以上学历比为2.1:1,而普通组的高中学历与大学及以上学历比为1:1.24,对比可以看出,实验组的客户中,大部分为低学历人群,而普通组的客户学历明显高于实验组,说明借款人教育程度较好。而另一处明显特征是无论普通组的贷款品种为抵押还是信用,借款人均有房产;而研究组中无房占比接近总体一半以上。第四章结论与建议实证结果表明:本文的10个假设,有3个得到支持,2个与假设矛盾,2个从数据上看,没通过检验,所以无法证明,实验结果见表5-1表5-1实证检验结果假设检验结果H1:借款人年龄与贷款业务呈正相关关系不显著H2:借款人性别男性与贷款业务呈负相关关系、女性与贷款业务呈正相关关系支持H3:借款人学历与贷款业务呈正相关关系支持H4:借款人婚姻与贷款业务呈正相关关系不支持H5:借款人收入与贷款业务呈正相关关系不显著H6:借款人资产状况与贷款业务呈正相关关系支持H7:借款人贷款金额与贷款业务呈正相关关系支持H8:借款人贷款利率与贷款业务呈负相关关系不支持H9:借款人还款情况与贷款业务呈正相关关系支持H10:借款人逾期次数与贷款业务呈负相关关系支持第一节研究结论本人通过统计分析,虽然从模型效果和对小额贷款客户的预测效果可以看出,模型能够很好的判别出信用水平高的贷款客户和信用水平底的贷款客户,但是由于贷款客户所填写的大部分信息的真实性无从考证,且存在申贷时客户信息真实存在,但放款后,其资产已经转手的情况普遍有发生。另由于本次分析数据的样本较小,模型本身存在一定的误差性,所以所有的细分结果及聚类分析模型都不能取代T银行的信用审核和风险控制人员在贷款决策中的作用。根据T银行申请贷款的客户进件信息,从客户的自然特征、经济特征、贷款特征三个维度选取指标共15个,但是最终取得分析的只有10个指标。性别(gender)、年龄(age)、婚姻状况(marriage)、教育水平(education)、收入范围(月(Income_Range_Monthly)、资产(Homeowner)、借款金额(Total_Amount)、借款利率(LendingRate)、还款情况(Repayment)、逾期次数(Number_Arrears),其他指标都被筛选出去,但是这并不代表其他指标对客户的信用风险没有影响。由于T银行的小额贷款客户质量整体较低,高信用质量的客户已经被大型的金融机构垄断,或选择了T行其他利息较低的贷款品种。从原始数据中可以看到,来自T银行的小额贷款客户教育水平普遍都在高中学历,教育水平低的客户相对来说工资水平、固定资产、信用卡额度等指标就会相对较低,同时,贷款客户信息填写的真实性也无从验证,比如房产、车产、存款、收入证明是否真实都无从考证。这些都会导致研究中所使用的样本数据比较片面,指标范围不够全面,因此很多指标无法考察其真实性。从模型结果中看出,在499份研究样本中,从预测结果可以认为模型有较好的分类能力,可以用来对新贷款客户的识别和分类,这样更有利于T银行的信用经理及审核人员发现潜在不良信用客户,降低T银行的风险损失。但是文章虽然是以T银行的客户信用风险为研究视角展开的,但是,由于获取数据的局限性,模型采用的数据只是T银行的数据,由于受到零售贷款的经营范围和区域经济发展水平的限制,模型数据并不能代表全国T银行客户的特征。所以,要想进行更加全面的研究,应该从全国范围的T银行获得小额贷款客户数据,以区域差异等因素作为变量,获得更加全面、普适的研究结果得。第二节研究建议一、基于客户细分的营销策略从理论分析角度,我们认为T银行贷款客户的个人特征、经济特征以及贷款特征等因素与贷款客户的还款行为和信用风险存在着一定的相关关系。通过对T银行贷款客户数据进行分析研究发现,良好的信用评估模型能够有效的帮助银行风险控制人员识别潜在信用不良客户,降低贷款客户的逾期风险,保障银行的经济利益。并根据研究结论针对当前T银行的客户细分情况提出以下四点营销建议:(1)建立详细的客户信息档案,不同客户适用不同的营销建议建立大量真实、有效的数据做基础,目的是从大量的贷款客户数据中汲取关键信息,并对客户的还款行为进行预测和分类,而客户数据的获取方法主要是通过客户提供的资料和个人信息,从客户的基本信息中会反映出客户的自然特征、经济特征等多方面的信息,客户信息越详细就越有利于银行了解客户的还款能力和违约可能性,也可以以客户的信息维度设计更科学、准确的客户信用评估模型。有效利用客户提供的信息,对客户的资金收入和现金流进行备案,为我们分析客户的偿还能力和负债情况分析提供数据支持。(2)建立健全的征信系统数据库,将营销范围扩大一个全面、丰富的征信系统数据库可以作为客户信用识别的有力依据,很多客户会重复的发生贷款行为,如果拥有健全的征信系统数据库更有利于准确识别欺诈客户和拥有不良信用记录的客户。当前很多银行还仅仅依靠经办客户经理及风控人员的个人经验对贷款单子进行审核、审批,这不仅浪费大量的时间和精力,同时也会由于风控人员的主管偏差造成业务风险。如果能够对银行个贷系统建立完善征信半自动系统,客户记录在案的征信及客户的动态信息能进行及时更新,这样有两个益处:1、对于续贷客户,系统根据以往客户存款、还款记录,征信及其他个人最新信息,直接审核初始额度,这样不仅会提高放贷速度,也会为银行节省很过人力成本和经营成本,更重要的是还会降低贷款客户逾期风险。2、通过内部统一的个贷系统相关数据,使得贷款客户的征信等数据信息共享,对于符合小额贷款条件的普通客户直接系统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 盘锦新立外商投资园基础设施建设项目
- 2024年度煤矿企业社会责任履行合同3篇
- 《上亿实业资本家》课件
- 2024年度租赁合同:某企业租赁办公场地给某科技公司2篇
- 文书模板-《健身房年终总结工作预案》
- 《青皮核桃采收与贮藏技术规范》征求意见稿编制说明
- 中考道德与法治复习题型专项图表式课件
- 《客户关系管理实务》电子教案 6客户关系管理产生的原因
- 甲状旁腺疾病病因介绍
- 班会课件学弟子规讲文明懂礼貌
- 2023年人教版五年级上册语文期末试卷
- 燃气公司入户安检管理规定
- 小学三年级一位数乘两位数的乘法练习题(500道)
- 医院物业年度总结与计划书
- 浙江省杭州市萧山区2023-2024学年五年级上学期期末英语试卷
- 科技兴国创新有我-科技创新主题班会
- 手术后的疼痛管理策略
- 生物教学问题研究报告
- 波音公司案例分析课件
- 《化解冲突收获友谊》心理健康课件
- 针式打印机研究报告-中国针式打印机市场深度调查研究报告(2024年)
评论
0/150
提交评论