




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、TeradataTM Warehouse MinerTraining Workshop案例-1 客户流失预测分析2 2/8/2022 为什么进行客户流失预测? 移动服务的竞争进入白热化状态 月平均流失率6.5%(即随机抽样10000人中只能找到650个真正有流失倾向的客户) 月租型, 流失预测模型结果 找出流失倾向最高的客户, 前10000人名单中,约8000人(80%)下个月会流失 找出导致客户流失的原因以辅助设计和执行客户挽留的行销活动。数据挖掘自动化机制更有效地利用挖掘的结果专题概要3 2/8/2022 预测性预测性模型模型响应响应模型模型自动化自动化 分段分段描述性描述性模型模型根据业
2、务目标对对象属性的初步划分年龄分组;商业用户/个人用户; 客户价值根据业务目标对对象属性的描述保有期(与客户价值有关); 信用评分根据相关属性将对象划分到已定类别,以便针对性对待流失倾向评分 使用量预测现实模拟以改善预测能力、可控性和实施效果购买倾向评分挖掘结果的发布: 调度执行 收集响应 监控模型性能 记录结果数据仓库数据仓库分析模型的种类4 2/8/2022数据仓库数据仓库 Partly adapted from Fayyad U. M., Piatetsky-Shapiro, P. Smith (1995), From Knowledge Discovery to Data Mining
3、: An Overview in Advanced Knowledge Discovery and Data Mining.选择选择抽样抽样模型评估模型评估验证验证建模建模数据探索数据探索 数据转换数据转换数据清洗数据清洗 预处理预处理确定确定& &理解业务问题理解业务问题数据的数据的后续处理后续处理知识知识预备建模预备建模数据挖掘方法论5 2/8/2022 在这个数据挖掘的初始阶段,需明确阐述项目目标和客户业务需求。在这个数据挖掘的初始阶段,需明确阐述项目目标和客户业务需求。基于客户响应(如客户流失或产品购买趋势)特性,可以从概念上定义基于客户响应(如客户流失或产品购买趋势)
4、特性,可以从概念上定义响应变量,与待选的预测变量没有直接的派生关系响应变量,与待选的预测变量没有直接的派生关系直接的派生关系意直接的派生关系意指响应变量可由一或多个预测变量直接计算出来指响应变量可由一或多个预测变量直接计算出来。最终,为了这些目。最终,为了这些目标可以必要地调整项目计划进程。包括标可以必要地调整项目计划进程。包括明确业务目标明确业务目标定义响应变量定义响应变量项目计划必要的调整项目计划必要的调整业务问题定义6 2/8/2022 搜寻并检查客户数据,创建一个数据映射概念图,将客户数据与建模相搜寻并检查客户数据,创建一个数据映射概念图,将客户数据与建模相关的各个属性对应起来。数据能
5、被整合到一个适当的程度,省略不适当的记关的各个属性对应起来。数据能被整合到一个适当的程度,省略不适当的记录(如若分析仅针对居民客户,则省略非居民客户)、不完整的数据记录、录(如若分析仅针对居民客户,则省略非居民客户)、不完整的数据记录、训练数据、试验数据等等。包括:训练数据、试验数据等等。包括:数据来源数据来源数据映射数据映射准备数据评估准备数据评估数据的必要聚合数据的必要聚合数据抽样数据抽样选取和抽样7 2/8/2022 核查目前的数据源,探索在每个待选的预测变量和响应变量之间是否存核查目前的数据源,探索在每个待选的预测变量和响应变量之间是否存在关系。数值分析是全面理解数据的第一步,随之进行
6、的统计分析便于更好在关系。数值分析是全面理解数据的第一步,随之进行的统计分析便于更好地了解有关数据的分布。包括:地了解有关数据的分布。包括:数据质量检查数据质量检查数据的必要整理数据的必要整理通过图形化呈现工具和其他的统计方法理解数据通过图形化呈现工具和其他的统计方法理解数据分析待选预测变量和响应变量之间的关系分析待选预测变量和响应变量之间的关系数据转换以辅助数据的分析数据转换以辅助数据的分析数据派生为建立模型做准备数据派生为建立模型做准备整理和呈现数据探索的发现整理和呈现数据探索的发现探索型数据分析8 2/8/2022 建立并确认分析模型,尝试不同的建模技术或结合不同数据集,并建立并确认分析
7、模型,尝试不同的建模技术或结合不同数据集,并比较不同模型的性能,选出最好的。包括:比较不同模型的性能,选出最好的。包括:为模型的训练和验证准备数据集为模型的训练和验证准备数据集在模型的建立中使用适当的建模技术在模型的建立中使用适当的建模技术针对不同的建模技术测试模型性能针对不同的建模技术测试模型性能必要地精炼分析模型必要地精炼分析模型和主题专家一起检验分析模型和主题专家一起检验分析模型记录分析模型和结果记录分析模型和结果建模9 2/8/2022 用模型的结果来协助业务开展、战略设计和战术实施。用模型的结果来协助业务开展、战略设计和战术实施。收集结果进行反馈,为模型的退化进行侦测,更进一步改收集
8、结果进行反馈,为模型的退化进行侦测,更进一步改善模型性能善模型性能。实施10 2/8/2022数据仓库数据仓库数据采集数据采集数据衍生数据衍生1建立预测建立预测模型模型定义和识别有意义的数据项定义和识别有意义的数据项评分结果评分结果监测结果监测结果多维分析多维分析/报表报表抽取样本抽取样本测试模型测试模型模型打分模型打分提取全部资料提取全部资料23, 546789数据仓库数据仓库数据采集数据采集数据衍生数据衍生1建立预测建立预测模型模型定义和识别有意义的数据项定义和识别有意义的数据项评分结果评分结果监测结果监测结果多维分析多维分析/报表报表抽取样本抽取样本测试模型测试模型模型打分模型打分提取全
9、部资料提取全部资料23, 546789具体实施过程11 2/8/2022 以以号码号码为单位为单位 用户在网时间至少3个月 分析流失前6个月的数据以了解可能流失原因 正常用户正常用户 状态为正常正常 或 停话停话或强开强开 若状态为停话,停话原因属于自愿停话: 报停双停报停双停 报停单停报停单停 报停完全报停完全 挂失双停挂失双停 挂失单停挂失单停 挂失完全挂失完全若状态为停话,停话原因属于非自愿停话: 冒高双停冒高双停 冒高单停冒高单停 欠停双停欠停双停 欠停单停欠停单停 强关双停强关双停 强关单停强关单停 强关完全强关完全 预拆预拆最近停话期间少于3个月 且6个月內至少有一次缴费记录 流失
10、客户流失客户 状态为预销预销或预拆预拆(一个月以上)客户流失的定义12 2/8/2022市场计划市场调查新用户计费网络网络销售网络合同/买卡神州行上线中心客服传真/电话电脑联网(直营)客服查询/抱怨/停话/催缴异常营业网点申请销号用户使用账单营业网点/银行等缴费缴费离网用户离网原因调查更换/维修销售/营业网点项目行销资费优惠项目业务理解13 2/8/2022客户数据客户数据合约属性合约属性交互行为交互行为客户忠诚度客户忠诚度支付行为支付行为使用行为使用行为近一个月缴费额近三个月平均缴费额近六个月平均缴费额六个月通话移动平均六个月通话移动差受话次数/秒数受话号码数发话次数/秒数拨打号码数发短消息
11、次数话转比例漫游次数网内拨打比例拨打固话次数拨打简码次数通话异常中断次数迟缴次数欠缴金额催缴次数催缴成功次数累计积分数已兑换次数已兑换分数兑换类别限话次数联络次数接触次数接触类别抱怨次数查询销号离网次数资费套餐变动IMSI_DN更换次数客户状态变化情况使用期 年龄资费套餐所属地区缴费方式性别合约多号码客户类型证件多号码开通类型分析月租型流失用户的数据来源14 2/8/2022数据质量问题15 2/8/2022l50元月租全球通,20元月租全球通, 20元月租套餐,20元月租亲情卡,事事发,0元月租惠通卡,30元月租套餐等资费套餐的客户。l有过资费调整的客户。l在J地区,S地区,X地区,JZ地区
12、,Y地区,L地区的用户流失倾向较高。l年龄不超过30岁的年轻族群流失比例高。l最近一个月缴费额不超过前两个月平均缴费额l在网时间少于17个月l六个月内迟缴次数超过5次流失客户特征16 2/8/2022l近六个月內有限话记录的客户。l被叫次数不超过主叫次数的34%。l近三个月主叫固网时长比例不超过8%或超过80%。l近三个月內不曾不超过2个l三个月内被叫次数不超过20次。l三个月内主叫次数不超过45次。l三个月内被叫不同号码不超过17个l三个月内主叫不同号码不超过11个l三个月内主叫秒数不超过2465秒l三个月内发送短消息不超过2个流失客户特征 (续)17 2/8/2022近六个月迟缴超过近六个
13、月迟缴超过5 5次次最近一月出账与近三月平均出账额比例不超过最近一月出账与近三月平均出账额比例不超过0.33曾限话曾限话更换过资费套餐更换过资费套餐在特定地区在特定地区是否是否最近一个月出账额不超过最近一个月出账额不超过1414元元是否Etc是7 76.56.5% % 离网离网是否否Etc.Etc.Etc.EtcEtc否是模型结果18 2/8/2022模型评分最近一月出账与近三月平均出账额 比例不超过0.33曾限话最近一个月出账额不超过14元更换过资费套餐近六个月迟缴超过5次在特定地区得分:得分:0.70.76565分分近六个月迟缴超过近六个月迟缴超过5 5次次最近一月出账与近三月平均出账额比
14、例不超过最近一月出账与近三月平均出账额比例不超过0.33曾限话曾限话更换过资费套餐更换过资费套餐在特定地区在特定地区是否是否最近一个月出账额不超过最近一个月出账额不超过1414元元是否Etc是7 76.56.5% % 离网离网是否否Etc.Etc.Etc.Etc.Etc.否是19 2/8/2022最有可能销号的客户群组 #1最近一个月缴费额不超过前两个月平均缴费额曾限话最近一个月出账金额不超过14元曾更换资费方案六个月内迟缴5次以上属于(J地区,S地区,X地区,JZ地区,Y地区,L地区)资费属于低档普通套餐近三个月被叫次数不超过20次最近一个月缴费减少最近一个月缴费减少曾限话曾限话低档资费套餐
15、低档资费套餐经常迟缴经常迟缴更换过资费方案更换过资费方案20 2/8/2022最有可能销号的客户群组 #2最近一个月缴费额不超过前两个月平均缴费额曾限话最近一个月出账金额不超过14元曾更换资费方案不属于(J地区,S地区,X地区,JZ地区,Y地区,L地区)通过直属营业厅入网六个月内迟缴5次以上近三个月被叫不同号码数不超过11个欠费金额在-246.37和1431.87之间被叫费用不超过13.67元低档资费套餐更换过SIM卡最近一个月缴费减少最近一个月缴费减少曾限话曾限话曾更换资费方案曾更换资费方案普通低档资费套餐普通低档资费套餐缴费行为较差缴费行为较差21 2/8/2022模型评估 命中率Prec
16、ision0.00%10.00%20.00%30.00%40.00%50.00%60.00%70.00%80.00%0.00%20.00%40.00%60.00%80.00%100.00%PopulnCul_Hit_RateX X轴:按离网倾向评分从大到小排序后的客户占目标客户人数的百分比;轴:按离网倾向评分从大到小排序后的客户占目标客户人数的百分比;Y Y轴:前轴:前x%x%的客户中被准确预测为离网的客户占这批客户的百分比,即命中率的客户中被准确预测为离网的客户占这批客户的百分比,即命中率22 2/8/2022X X轴:按离网倾向评分从大到小排序后的离网客户占离网总人数的百分比;轴:按离网倾
17、向评分从大到小排序后的离网客户占离网总人数的百分比;Y Y轴:(前轴:(前x%x%的客户中的命中率)的客户中的命中率)/ /离网率离网率模型评估 LIFT23 2/8/2022 客户流失模型的输出结果中包括一个客户流失指数,用来做为客户流失的客户流失模型的输出结果中包括一个客户流失指数,用来做为客户流失的概率(介于概率(介于0 0到到1 1之间),以区别不同客户间流失可能性的高低,如一个流失指之间),以区别不同客户间流失可能性的高低,如一个流失指数为数为0.80.8的客户比一个流失指数为的客户比一个流失指数为0.60.6的客户更可能离开。当营销部门欲推行一的客户更可能离开。当营销部门欲推行一客
18、户挽留计划,可按照客户流失指数的高低对客户排序,找出最可能流失的客客户挽留计划,可按照客户流失指数的高低对客户排序,找出最可能流失的客户群,以最少的成本,最适当的沟通,达成最佳的客户挽留效果。户群,以最少的成本,最适当的沟通,达成最佳的客户挽留效果。模型发布24 2/8/2022客户离网0.851预测分析图:客户离网预测分析图25 2/8/2022钻取结果26 2/8/2022启动选择下钻获取 前端应用27 2/8/2022数据挖掘自动化 自动化建模过程和结果 数据抽取,变换,衍生和评分自动化。 创建新的数据立方体或报表以产生挽留客户名单并提供各种流失群组的客户特征描述。 自动计算命中率/Li
19、ft报告以监测模型性能 综合信用模型/客户价值模型的结果确定目标客户28 2/8/2022Data Mart自动化模型系统维护数据抽取转换加载(ETL)计算指标制作报表及Cubes系系统统使用者使用者数据数据仓库仓库评估模型质量,重建选择模型建模人员建模人员维护预测模型维护报表及Cubes系系统统管理者管理者数据挖掘自动化29 2/8/2022 Data Source Environment External Data Data Extraction Data Acquisition & Transformation Server Internal Data Application/M
20、ining Server Solution Warehouse Data Warehouse Server DW Storage User Workstation Archive System External Data Interface Source Data Interface Data Load Interface Archive Interface User Access Interface Application Interface Developer Interface Solution develop. Workstation TWM Metadata UNIX Server
21、Database Engine TWM Client SW SAS or Clementine Client SW OLAP/Report SW Win ODBC Driver Windows 2K/XP TWM Client SW SAS or Clementine Client SW OLAP/Report SW Win ODBC Driver Windows 2K/XP DW Admin. Workstation 数据挖掘平台30 2/8/2022关键问题 数据挖掘需要足够的历史数据足够的历史数据支持(按照经验,一般需要积累6个月的历史数据) 数据挖掘需要正确的完备的数据正确的完备的数据
22、支持(错误的数据之上无法挖掘出正确的结果),而PDM和ETL需要一段时间进行模型的完善和数据质量检查 不同省份的数据中蕴含着不同的规律不同省份的数据中蕴含着不同的规律,因此对A省移动挖掘专题来说重要的那些属性未必同样适用于B省,需要进行大量的数据探索和业务理解; 数据挖掘本身需要多次的试验多次的试验,以确定合适的模型、合适的变量选择以及合适的数据 数据挖掘是一个过程而非产品数据挖掘是一个过程而非产品,需要人的大量参与和分析,而这个过程又常常需要螺旋式的循环往复,以达到比较理想的目标 就A省移动的经验来说,客户流失预测专题一共用了三个月得到初步的结果,然后的两个月进行了调整使之稳定;因此对于B省
23、移动来说,预计在ETL基本完成后需要花费至少三个月的时间来完成流失预测专题关键问题业务闭环的形成32 2/8/2022数据采集数据采集/ETL分析报表分析报表 & OLAP数据挖掘数据挖掘经营分析经营分析信息反馈信息反馈主动营销主动营销任务分配任务分配营销活动策略制定营销活动策略制定客户服务客户服务现状分析支撑系统相对孤立33 2/8/2022系统关系闭环营销闭环营销在线查询在线查询轮廓支撑轮廓支撑战略决策战略决策经营分析经营分析系统系统OLAPOLAP分析分析报表报表数据模型数据模型客户细分客户细分 营销案设计营销案设计 营销自动化营销自动化客户信息客户信息合作伙伴信息合作伙伴信息客
24、户轮廓客户轮廓渠道轮廓渠道轮廓合作伙合作伙伴轮廓伴轮廓营销案计划和反馈营销案计划和反馈经营分析系统经营分析系统管理和业务人员管理和业务人员在线服务器在线服务器BOSS系统系统直销直销实体实体代理代理增值增值电子电子合作伙伴合作伙伴营销服务营销服务人员人员客户客户BOSS1.5系统系统决策分析决策分析业务实施业务实施ETL34 2/8/2022 场景假设 假设某地区客户规模为200万,通过对客户离网情况的分析,建立离网规则模型,并对该地区的客户进行分析,获取预离网客户名单,针对客户的特点设计营销活动方案进行客户挽留。 角色分配 市场分析师:提取预离网客户规则;打分、提取预离网客户列表;对预离网客
25、户进行细分;评估挽留工作的效率和效果 营销策划人员:进行营销措施设计 张三:某省移动通信用户用户,其身份是某集团客户中的金卡客户 李四:某省移动通信公司用户,其身份是普通客户业务闭环客户挽留案例35 2/8/2022业务闭环客户挽留案例1、确定离网客户样本范围36 2/8/2022业务闭环客户挽留案例2. 变量选择及数据抽样3. 数据探索4. 建模(获取流失特征)5. 评分并生成挽留名单(预测流失倾向)6. 结果发布37 2/8/2022业务闭环客户挽留案例7、市场分析师需对预离网客户列表进行细分 一级分类二级分类三级分类手机号码其它特征集团高收入群体新业务感兴趣群体1391170ABCD语音
26、业务感兴趣群体长途业务赶兴趣群体中端收入群体低收入群体个人客户高收入群体中端收入群体低收入群体新业务感兴趣群体语音业务感兴趣群体长途业务赶兴趣群体1391081ABCD38 2/8/2022业务闭环客户挽留案例8、营销策划人员进行营销措施设计 市场分析师张三属于集团高收入群体,其对集团新业务非常感兴趣,建议通过客户经理与客户接触,为客户设计适合本集团的新业务综合解决方案进行挽留李四,由于其属于只对长途业务感兴趣的群体,因此通过为客户设计IP长途放心打的业务方案,挽留客户 39 2/8/2022业务闭环客户挽留案例9、营销策划人员对营销措施的可行性分析 市场分析师成本分析成本分析时效性分析时效性分析营销案营销案40 2/8/2022
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版爆破钻孔施工劳务派遣合同
- 二零二五版白酒产品改良委托加工服务合同
- 二零二五版材料买卖合同及市场风险预警机制协议
- 一年级班主任创新教学计划
- 2025新冠肺炎疫情中的环保作文范文
- 【可行性报告】2025年棱镜透镜项目可行性研究分析报告
- 2025-2030年中国卡丹绒面料项目投资可行性研究分析报告
- 电枢短路测试仪项目投资可行性研究分析报告(2024-2030版)
- 2025-2030年中国五金工具与行业深度研究分析报告
- 2025年中国清爽湿巾行业市场前景预测及投资价值评估分析报告
- 公路应急值守管理办法
- 财务离职保密协议及竞业限制合同范本
- 网络安全考试题目及答案
- 市政工程施工员考试试题及答案
- 2025年陕西行政执法资格考试备考模拟题及答案(题型)
- 实验室培育钻石行业技术发展趋势报告
- 扁桃体灼烙的术后护理
- 2025年领英大制造行业人才全球化报告-马来西亚篇
- 心肺复苏双人培训
- 2025年心理咨询师考试试题及答案
- 2025年高考化学试卷(广东卷)(空白卷)
评论
0/150
提交评论