




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、teradatatm warehouse miner training workshop 案例-4 客户信用度分析 2 5/12/2021 专题概要 客户信用度是指根据客户在网时间、缴费情况、客户积分等相关要 素对集团客户和个人客户进行评分,用于衡量客户缴费行为的好坏。 它由两部分组成:历史信用度下月缴费可能性。 历史信用度根据用户近6月的欠费情况(欠费天数、欠费次数)和缴 费情况(是否及时缴费、未及时缴费次数)来计算 下月缴费可能性则是考察其它相关因素,利用回归方法来计算客户下 月及时缴费的可能性 这两部分的加权求和就构成了客户的信用度评分 客户信用度分析专题主要用于制定合适的催欠策略,对于
2、信用度高 的客户适当延长催欠时间,对于信用度极低的客户则及时停机以避 免更大的损失,同时客户信用度也是计算客户价值时的要素之一 3 5/12/2021 业务问题定义 客户信用度模型与客户价值模型类似,信用度由两部分组成: 历史信用度 下月及时缴费可能性 客户信用度评分 =历史信用度*系数x下月及时缴费可能性*系数y 目标客户范围 非特殊客户(公免、测试、员工等) 当前状态为在网 4 5/12/2021 业务问题定义 (续) 历史信用度 从不欠费 1.0 近6月从不欠费(近6月平均欠费天数0) 欠费后及时交费 (0.6,0.9) (近6月平均欠费天数0且近6月未及时缴费次数=0) 0.9 - 0
3、.3*(r6m_owe_duration/30) 欠费后不及时交费 (0.3,0.6) (近6月平均欠费天数0且近6月未及时缴费次数0) 0.6 - 0.3*r6m_owe_cnt 欠费后逃费(这批客户已经被排除) 0 (当前状态=b,本月被局拆) 下月缴费可能性则是通过数据探索,选取与客户缴费行为有关的各种属 性,然后用回归方法计算得到客户下月缴费的可能性历史信用度 5 5/12/2021 数据准备 数据准备阶段包括: 数据清洗和预处理 建立物理数据模型(pdm) 数据的抽取转换和加载(etl) 选择与抽样 使用物理数据模型作为选取和测试数据的依据,从数据仓库收集全 部的各类数据,更好地了解
4、客户. 6 5/12/2021 物理数据模型设计 基表-总表(all items table) 客户基本资料 客户缴费资料 客户投诉资料 客户帐单资料 客户通话资料 根据客户编号和帐务年月进行连接形成总表。 派生变量-总表视图 在总表的基础上,进一步派生出比率字段形成视图。 在此基础上,一方面利用公式计算出客户的历史信用度,另一方面 用回归方法计算出客户下月缴费的可能性 7 5/12/2021 数据的抽取、转换与加载 尽管数据仓库中已经对原始的业务数据进行了清洗、转换和集成, 仍然需要按照挖掘任务的要求生成挖掘专用的数据集市,并将数据 从数据仓库抽取过来。 8 5/12/2021 选择与抽样
5、选择和信用度分析有关的信息组成客户价值分析总表。 从总表中各抽取600000作为训练和测试集合,抽样比例约为总样 本的28%左右。 9 5/12/2021 探索型数据分析 采用可视化的工具或统计分析等方法来展示及探索各个变量对客 户流失的影响,包括: 柱状图 频数分析 相关分析 值分析 10 5/12/2021 探索型数据分析 值分析:值分析:通过值分析对数据进行基本的探查,包括空值数目、唯一 值数目、空字符串数目、零值、最大值、最小值的统计,舍弃一些 几乎全部是零值的变量。 相关分析:相关分析:通过相关分析发现并找出与客户欠费标志(目标变量) 相关性较强的客户属性 ,去掉和客户欠费标志相关的
6、变量和相关 系数小于0.1的变量,剩下的变量作为回归客户下月缴费可能性时 的自变量。 11 5/12/2021 建模 通过探索型数据分析,把所有数据准备好之后,就可以选用适当的 数据挖掘工具及数据挖掘技术来建立客户信用度分析模型。 12 5/12/2021 历史信用度的定义 从不欠费 1.0 近6月从不欠费(近6月平均欠费天数0) 欠费后及时交费 (0.6,0.9) (近6月平均欠费天数0且近6月未及时缴费次数=0) 0.9 - 0.3*(r6m_owe_duration/30) 欠费后不及时交费 (0.3,0.6) (近6月平均欠费天数0且近6月未及时缴费次数0) 0.6 - 0.3*r6m
7、_owe_cnt 欠费后逃费(这批客户已经被排除) 0 (当前状态=b,本月被局拆) 13 5/12/2021 首先把客户进行适当的分群,即下月欠费天数少于30天的客户定 义为及时缴费客户,高于该值为未及时缴费客户;定义及时缴费客 户为回归时的目标客户群 对目标客户群使用回归算法建立预测模型,抽取600000条记录作 为训练数据集 采用所得回归模型计算每位客户下月缴费可能性的概率得分值 下月缴费可能性 14 5/12/2021 合并客户的历史信用度和下月缴费可能性,计算出最终的客户信 用度评分: 客户信用度评分 (1000*历史贡献度)*0.8 + (quantile(1000,下月缴费可能性
8、)+1)*0.2 通过上面的计算即可得到每位客户的信用度评分在11000之间 客户信用度评分 15 5/12/2021 对客户信用度分析模型在2003年5月的评分结果进行评估,评估 内容包括: 信用评分和下月客户状态(正常、局拆、预拆)的关系 信用评分和信用额度的关系 模型评估 16 5/12/2021 客户信用评分 下个月状态为 正常的用户数 下个月状态为 局拆的用户数 下个月状态为 预拆的用户数 总人数 100以下0000 100199之间0000 200299之间3553463882147 300399之间2128261222448008 400499之间3861186430423371
9、89929 500599之间2481614216329209 600699之间239994372086102455 700799之间13399122168887227135 800899之间6645491531149247919025 9001000之间114037782445791238273 客户信用评分和下月客户状态的对照表 17 5/12/2021 客户信用评分和下月客户状态的对照表 18 5/12/2021 客户信用评分和下月客户状态的对照表 从图中可以看出,信用度评分和客户下月状态为正常的客户数之间 存在明显的正比关系,即信用度越高则缴费行为就越好,因此就不 容易因欠费而导致状态异
10、常,符合业务规则。 信用度评分和局拆状态也存在明显的依赖关系,被局拆的用户基本 上都是信用度评分低于600的用户。 而对于预拆来说,由于目前预拆体现在当月,即月底出帐时预拆的 客户,其预拆状态是作为月底的状态而非下月的状态,因此它和信 用度之间没有明显的相关性。 19 5/12/2021 客户信用度评分和信用额度的对照表 客 户 信 用 度客 户 信 用 评 分 下 个 月 状 态 正 常 的 用 户 占 比 下 个 月 局 拆 用 户 占 比 下 个 月 预 拆 用 户 占 比 总 人 数 100以 下0000 100 199之 间0000 200 299之 间3493453411799 3
11、00 399之 间2086251421787721 400 499之 间376378131440639181193 500 599之 间236395200327727 600 699之 间23123206894398236 700 799之 间1302873364962218295 800 899之 间632964172131606861511 900 1000之 间106575724377641152591 100以 下0000 100 199之 间0000 200 299之 间6147348 300 399之 间429866287 400 499之 间974511616988736 500 599之 间117791601482 600 699之 间8762331434219 700 799之 间370418839258840 800 899之 间3158513591764157514 900 1000之 间7462058681585682 大 于 0 小
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 浙江国企招聘2025浙江南湖文化旅游集团有限公司招聘32人笔试参考题库附带答案详解
- MySQL教程(新体系-综合应用实例视频)(第4版) 习题-第03章-答案
- 二零二五年度文化产品插画设计授权合同
- 浙江国企招聘2024杭州钱塘新区产业发展集团有限公司下属公司招聘13人笔试参考题库附带答案详解
- 二零二五年度航空航天产业员工聘用合同范本
- 二零二五年度快餐店加盟合作协议
- 二零二五年度高新技术园区保安员聘用与管理协议
- 二零二五电子夫妻忠诚协议书:情感契约新时代范本
- 2025年度直管公房租赁合同(含租赁期间房屋安全检查及维修)
- 二零二五年度变压器研发团队转让与项目合作合同
- 《复杂系统理论》课件
- 2025福建省电力电网有限公司高校毕业生(第一批)招聘748人笔试参考题库附带答案详解
- 初中英语语法时态总复习课件
- 2025年济南工程职业技术学院单招职业技能测试题库必考题
- 零碳数据算力中心项目可行性研究报告
- 研究生复试流程
- 220KV线路监理实施细则
- 人教版(2025新版)七年级下册数学第七章 相交线与平行线 单元测试卷(含答案)
- 汽轮机辅机培训
- 国之重器:如何突破关键技术-笔记
- 21ZJ111 变形缝建筑构造
评论
0/150
提交评论