建构信用卡评分模型之 商业智慧流程_第1页
建构信用卡评分模型之 商业智慧流程_第2页
建构信用卡评分模型之 商业智慧流程_第3页
建构信用卡评分模型之 商业智慧流程_第4页
建构信用卡评分模型之 商业智慧流程_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

金融数据挖掘和商业数据挖掘

建构信用卡评分模型之商业智能流程郑宇庭谢邦昌程兆庆

台湾政治大学资料采矿中心7/2/20231报告大纲研究目的分析工具

建模流程结论与建议Q&A7/2/20232研究目的有效地筛选出偿债能力不佳的个人信用卡客户,依此开发出一套信用风险系统,以帮助银行做出正确的核卡决策。这个系统的开发、维护、与更新的成本预期将比银行现有系统的成本低。7/2/20233分析工具MicrosoftSQLSever2005价格自动化以及开发延伸程度目前SPSS跟微软之间是采取合作的态度7/2/20234建模流程:CRISP-DMDATAMINING执行阶段商业理解资料理解资料准备建模评估发布资料源DATAMINING处理流程7/2/20235图表来源:杨自强企业如何应用商业智慧来提升执行力与竞争力微软商业智慧解决方案SSIS

分析服务报表服务分析服务(DataMining)资料来源检视表(DataSourceView)整合性服务(SSIS)商业理解资料理解资料准备建模评估发布资料源资料源7/2/20236图表来源:杨自强企业如何应用商业智慧来提升执行力与竞争力资料采矿无处不在商业问题Microsoft算法预测类别变量,例如营销响应、顾客流失、违约预测(巴塞尔资本协定IRB)…决策树贝氏机率分类群集类神经网络罗吉斯回归预测连续变量,例如预测销售量、预测客户价值变动、预测金融商品价格波动...回归树时间序列类神经网络预测序列,例如找出网站使用者的点选路径模式、客户缴款行为模式、商品购物顺序时序群集找出产品交叉销售关联性,又称为购物篮分析关联规则决策树找出潜在相似性,例如市场区隔、侦测晶圆瑕疵分配、文件分类、保险浮滥理赔侦测、伪卡侦测群集时序群集7/2/20237商业理解(BusinessUnderstanding)厘清商业问题目前呆帐率是多少?信用卡审核流程?信用卡评分模型=分类模型7/2/20238资料理解(DataUnderstanding)资料来源某银行的信用卡资料数据内容申请数据文件缴款纪录文件总共有1220个变数,502,333笔原始资料违约户定义缴款期间曾经有逾期60天以上未缴之卡户

7/2/20239建模绕流程怜图选择墨20储01削.4较~2阁00侄1.侍6原始最资料清除眠遗漏俊值、门异常盯值数据筹转换误差禽抽样训练毁组测试论组建模评估评估6/徐27扫/2肺02烘310资料成准备讨(D睁at膨a国Pr闲ep缝ar眼at徐io弓n)选择僚合理突的建狐模变壮量基本例数据性别复、教凶育程搬度、盼职业仆别……联合松征信中心芽(J霉CI小C)刮的资叠料被查惜询总狭家数摧、延炼迟月约数比坦率……与银沈行往帖来的秒资料申请健卡别茄类型净、有搜没有棋使用湾扣款杜服务……6/董27如/2销02旱311资料宇准备肤(D围at开a回Pr笔ep逝ar纷at校io锹n)选择粘合理宿的建院模时祖间时间泪间隔铅取为12个月哥至18个月清除该遗漏禽值、判异常蚀值数据免转换连续御型转豆成离禾散型践:被弄查询限总家众数…合并捆变项磁太多背之变前量:稠职业个别…衍生柿新的序变数6/威27爆/2蹲02草312类型变量名称数据类型个人资料教育别类别型(2类)性别旗标型行业别类别型(3类)职称别类别型(3类)工作年资类别型(5类)紧急联络人与正卡关系类别型(4类)与银行往来纪录是否申请结余代偿旗标型扣款账号旗标型金融联合征信中心<过去六个月>延迟月数比率连续型<过去六个月>循还月数比率连续型近一年M2次数整数型<最近一个月>近期是否逾期旗标型负债所得比连续型有效卡张数类别型(3类)被查询总家数类别型(4类)6/千27顽/2发02病313建模购(M悄od提el静in候g)误差颂抽样踩(O梨ve柿r-尝Sa拦mp麻li锹ng剂)将稀月有事糊件透锯过抽痕样的沿方式难将其炎比重摇提高多的洲少抽贿(R啊ed悄uc浇e)汉:正付常户寄抽取菊率0培.1违约许户抽滋取率1将资殖料分股成训辉练组虫与测烂试组避免榜过度遥学习借(O叛ve叮r-务fi狮tt鹅in牢g)建模临方法揉选择罗吉王斯回酸归、毙决策虫树、希类神娇经网还络6/跟27像/2即02都314Da助ta计M哑in稳in捆g捡Mo雕de辞l敏Ev秃al毅ua糖ti害on6/挂27数/2走02艘315Da询ta府M怒in渐in恩g均Mo阶de绕l孔Ev箭al态ua瞒ti比on分类撞矩阵横轴挥为预借测结丑果,拴纵轴如为实巴际结闭果增益泻图横轴挠为名索单百臂分比挂,纵裁轴为宗累积小占全他体之会百分仓比收益胜图根据朱成本日以及拍销售丈成功斗利润捉,并赔计算需出累江积利填润图散布底图针对悬连续编变量螺,可板以利栗用此备功能剧了解堡实际糖值与喇预测沾值间答之差肿异性乌以及终预测拖之趋在势变宵动情迁形6/虹27象/2关02赤316选择“vTargetMail(dbo)”勾选需要比较之模型Da梅ta凶M闻in纽奉in窃g跑Mo逐de稠l蜓Ev震al肆ua峰ti蒜on说明板:在进闪行模韵型效聋益评尺估前逝必须概先选然入数刃据表漠,并齿在模感型中字勾选符要进找行评敢估比歉较之处模型6/罗27览/2悔02缺317Da氧ta糕M知in泳in站g你Mo抵de磨l篮Ev耕al醒ua戴ti气on分类脉矩阵藉由分类矩阵进一步比较,判别两模型的预测能力,由决策树模型发现,预测正确的资料有7103+5857=12960;而群集分析模型的正确预测数据为5395+5308=10703,也可看出决策树分类结果较群集分析分类结果好6/首27遵/2邻02塞318Da挥ta白M价in熊in丸g污Mo摆de组l百Ev杰al鸦ua罩ti肚on增益甲图增益宾图:主要临展现炭在整帜体的煎百分很上所贱累积帖的效撕益状者况6/撇27然/2寒02矿319Da形ta载M煎in松in依g降Mo陡de煎l草Ev寺al虽ua单ti澡on收益赢图收益猛图:可根朽据所逮设定闪之固术定成侍本、凤单位漫成本缘瑞以及桨单位失营收集加以讯计算北,找识出最锦佳获白利点6/虚27控/2叮02摧320Da征ta患M乡丰in裳in闹g贞Mo迅de节l专Ev绳al茄ua胶ti曾on散布脖图散布图:了解各模型之预测值、预测趋势以及实际值6/救27示/2位02象321评估肤(E衬va刃lu致at哥io翻n)增益顽图(症li喉ft战c挠ha宿rt巨)6/乎27钉/2勺02嗓322评估被(E亩va虏lu母at俊io邮n)分类璃矩阵尊(c狱la捕ss奖if齐ic票at加io钞n松ma膝tr洗ix加)衡量挣指标Pr碌ec句is抬e萝=贪a/衬a+信bRe由ca所ll呼=借a株/a步+cAc首cu分ra垄cy遵=丸a值+d狗/a户+b城+c饰+d实际预测违约户正常户违约户ab正常户cd6/烘27捆/2健02丝式323发布咽(D唱ep厅lo会ym卸en萌t)产生冷预测形的违询约机态率值单一酸查询整批糕查询6/葡27帆/2行02号324结论泽与建棍议本研做究以高罗吉焦斯回羊归模没型预逮测能仪力最涝好本研简究目碗的在另于帮购助作比核卡蛙的决萍策,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论