信用卡数据分析课件_第1页
信用卡数据分析课件_第2页
信用卡数据分析课件_第3页
信用卡数据分析课件_第4页
信用卡数据分析课件_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、信用卡数据分析背景信用卡发展迅速客户量大、地域广、时期长 数据海量化 数据海量,信息缺乏背景对信用卡申请人了解不全面对客户行为缺乏科学监控与评价风险测度不精确风险控制成本过高科学有效的风控管理工具呼唤数据挖掘数据挖掘简介数据挖掘 从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合业务需求数据准备建立模型模型评估数据挖掘简介数据挖掘技术分类:按照分析对象的属性、特征,建立不同的组类来描述事物。 例如:根据这些来区分新申请贷款的客户,以采取相应的贷款 方案。 聚类:识别出分析对内在的规则,按照这些规则把对象分成若干类。 例如:将申请人分为高度风险申请者,中度风险申请者,低度 风

2、险申请者。 预测:把握分析对象发展的规律,对未来的趋势做出预见。 例如:预测下个时期销售额。异常检测:对分析对象少数的、极端的特例的描述,揭示内在的原因。 例如:银行交易欺诈行为,减小以后经营的风险。 关联规则:某种事物发生时其他事物会发生的这样一种联系。 例如:今天银行调整利率,明天股市的变化。 数据挖掘简介分析的商业问题及算法1.客户信用评估逻辑回归 2.客户分群K-means, Kohonen神经网络3.客户流失预测逻辑回归,决策树4.欺诈识别粗糙集,决策树5.其他分析数据处理:交叉表,因子分析其他分析客户保留信用欺诈分析用卡行为分析信用卡申请评分数据挖掘在信用卡业务中的应用信用卡申请评

3、分用于对新申请客户的信用评估,利用数据挖掘技术对发卡行积累的大量客户历史数据进行分析,寻找出有关客户信用风险的特征值和规律,建立相应的数学模型。通过申请人填写的有关身份资料,即可以有效、快速地辨别和划分好/坏客户,为信用卡业务提供事前信用风险控制。主要数据挖掘算法为决策树,判别分析,BP神经网络等等信用卡申请评分应用案例根据客户的各种属性特征来分析判断是否应该批准客户的信用卡申请。输入变量:性别,职业,婚姻状况,孩子数量,月花销,月收入,支票帐户,储蓄帐户目标变量:客户状态(好,坏)决策树重要属性首先将全部10个属性特征做输入变量,进行决策树分析,由于分枝过多,影响效果。对输入变量依据重要性进

4、行筛选,选取最重要的6个变量重新运行决策树算法。信用卡申请评分应用案例决策树如果职业为行政人员,拥有2个孩子,婚姻状态为已婚,则86.49的概率为好客户如果职业为行政人员,拥有2个孩子,婚姻状态为离婚,则100的概率为坏客户其他分析客户保留信用欺诈分析用卡行为分析信用卡申请评分数据挖掘在信用卡业务中的应用用卡行为分析客户行为分析是银行根据客户对所持有信用卡的消费行为、还款行为进行分析,识别客户行为规则。实施有针对性的营销制定合理的信用额度及时发现风险群体常用的挖掘方法包括决策树、单维和多维关联规则等等。用卡行为分析应用案例信用卡消费类交易占交易总额的70%以上 卡日均存款余额保持2万元左右 该

5、客户总是习惯于在消费后很快把钱存入卡中 银行重点营销区 重点营销“贷记卡”产品 辅助营销“周期转账”金融产品 根据其贷记卡内透支余额,转入现金实现还款 满足客户消费和资产增值的组合需求 客户行为分析营销对策用卡行为分析应用案例变量:月平均贷记次数、月平均贷记金额、月平均借记次数、月平均借记金额、是否逾期超过30天、是否有呆帐记录、是否有拒往记录、是否有强制停卡记录。因子分析用卡行为分析应用案例因子分析因子1:在是否逾期超过30天、是否有呆帐记录、是否有拒往记录、是否有强制停卡记录四个变量上载荷较大,出现这些情况对银行可能产生损失,因此可命名因子1为风险因子;因子2:在月平均贷记次数、月平均贷记

6、金额、月平均借记次数、月平均借记金额四个变量上载荷较大,这几个变量反映了客户对银行利润的贡献情况,因此可命名因子2为贡献因子。用卡行为分析应用案例Hopfield神经网络策略第一类(高利润 + 经济能力较好)刺激顾客增加刷卡次数。有针对性的提供商场、饭店等打折促销信息,促使其消费便利 增加消费次数。第二类(高利润 + 经济能力偏低)留住目前的客户,提高顾客忠诚度。预留一段时间作为审查,合格者施予同第一类一样营销手法。不合格 者,加强其风险的把守,同时降低其信用卡额度。第三类(风险较高)降低信用额度。加强控管其消费行为。并随时追踪,同时长期观察, 确认其安全性。其他分析客户保留信用欺诈分析用卡行

7、为分析信用卡申请评分数据挖掘在信用卡业务中的应用信用欺诈分析信用卡的欺诈会对其他的客户和银行带来很大的经济损失,同时也影响发卡机构的安全信用。信用卡的欺诈主要包含盗用信用卡或盗用信用卡信息两个方面。如何发现欺诈模式?能否将其尽可能模型化?能否预测可能的正在进行的欺诈交易?常用的数据挖掘方法有孤立点分析、聚类分析、判别分析、关联分析、决策树分析、神经网络等 输入变量:交易时间,金额范围,交易地点,商店代码目标变量:欺诈(0代表无欺诈行为,1代表有欺诈交易)变量类型取值意义交易时间整数00:00-7:0017:00-12:00212:00-18:00318:00-24:00金额范围整数1超出以往交

8、易均值的两倍方差范围0未超出交易地点整数0本省外市1本市2外省3国外信用欺诈分析应用案例商店代码整数0百货超市1酒店餐饮2家电3服装鞋帽4娱乐5珠宝钟表6电子数码7旅行产品8办公用品9其他变量类型取值意义信用欺诈分析应用案例当金额超过平日均值的2倍方差范围,且交易时间为07点,购买的商品为珠宝手表,有98.25的可能性为欺诈行为决策树信用欺诈分析应用案例其他分析客户保留信用欺诈分析用卡行为分析信用卡申请评分数据挖掘在信用卡业务中的应用客户保留客户是一个可能根据年费、服务、优惠条件等因素而不断流动的团体,而找到一个新客户的成本远远高出挽留一个老客户。留住已有的客户是银行业的一大挑战。哪些客户最有

9、可能结束使用信用卡?哪些因素导致这些客户流失?常用的数据挖掘方法包括交叉频率表分析、对应分析、神经网络、决策树、逻辑回归、关联分析等等。客户保留应用案例某商业银行为研究对象 ,从其中心数据库获取12 个月的的客户数据:时间跨度研究用户用户数属性2019.10 .1-2019. 9.30使用银行信用卡的账户2843(其中保持开户2696,撤消帐户147户)58个属性(包括这家银行客户的人口学特征和行为特征)通过交叉表和LOGISTIC分析得到具体模型是:LN-1.8602+X1*0.0991+X2*0.1722+X3* 6.8525+ X4*3.8944X5*5.3435 -LN为所估计的客户留在银行与 流失的比数比-X 1为持卡月数-X 2 为三个月内借记次数-X 3 为三个月内有帐户关闭 -X 4三个月内平均贷记金额 -X 5三个月内平均借记金额 预测真实01Total013513148128119147Total163132295正确识别:80.95%的流失客户 91. 22%的保留客户逻辑回归客户保留应用案例其他分析客户保留信用欺诈分析用卡行为分析信用卡申请评分数据挖掘在信用卡业务中的应用其他分析消费金额预测根据客户每月刷卡消费金额数据,同时参考客户其它基本特征,预测其未来数月的消费趋势,及时给

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论