版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
TeradataTMWarehouseMiner
TrainingWorkshop
案例-1客户流失预测分析CMCCHQZhangLeiSunstone.Zhang@TERADATA-NCR.COM为什么进行客户流失预测?移动效劳的竞争进入白热化状态月平均流失率6.5%(即随机抽样10000人中只能找到650个真正有流失倾向的客户〕月租型,流失预测模型结果找出流失倾向最高的客户,前10000人名单中,约8000人〔80%〕下个月会流失找出导致客户流失的原因以辅助设计和执行客户挽留的行销活动。数据挖掘自动化机制更有效地利用挖掘的结果专题概要
预测性模型响应模型自动化
分段描述性模型根据业务目标对对象属性的初步划分年龄分组;商业用户/个人用户;客户价值根据业务目标对对象属性的描述保有期(与客户价值有关);信用评分根据相关属性将对象划分到已定类别,以便针对性对待流失倾向评分
使用量预测现实模拟以改善预测能力、可控性和实施效果购置倾向评分挖掘结果的发布:调度执行
收集响应
监控模型性能
记录结果数据仓库分析模型的种类数据仓库
PartlyadaptedfromFayyadU.M.,Piatetsky-Shapiro,P.Smith(1995),‘FromKnowledgeDiscoverytoDataMining:AnOverview’inAdvancedKnowledgeDiscoveryandDataMining.选择抽样模型评估验证建模数据探索
数据转换数据清洗
预处理确定&理解业务问题数据的后续处理知识预备建模数据挖掘方法论在这个数据挖掘的初始阶段,需明确阐述工程目标和客户业务需求。基于客户响应〔如客户流失或产品购置趋势〕特性,可以从概念上定义响应变量,与待选的预测变量没有直接的派生关系〈直接的派生关系意指响应变量可由一或多个预测变量直接计算出来〉。最终,为了这些目标可以必要地调整工程方案进程。包括明确业务目标定义响应变量工程方案必要的调整业务问题定义搜寻并检查客户数据,创立一个数据映射概念图,将客户数据与建模相关的各个属性对应起来。数据能被整合到一个适当的程度,省略不适当的记录〔如假设分析仅针对居民客户,那么省略非居民客户〕、不完整的数据记录、训练数据、试验数据等等。包括:数据来源数据映射准备数据评估数据的必要聚合数据抽样选取和抽样核查目前的数据源,探索在每个待选的预测变量和响应变量之间是否存在关系。数值分析是全面理解数据的第一步,随之进行的统计分析便于更好地了解有关数据的分布。包括:数据质量检查数据的必要整理通过图形化呈现工具和其他的统计方法理解数据分析待选预测变量和响应变量之间的关系数据转换以辅助数据的分析数据派生为建立模型做准备整理和呈现数据探索的发现探索型数据分析建立并确认分析模型,尝试不同的建模技术或结合不同数据集,并比较不同模型的性能,选出最好的。包括:为模型的训练和验证准备数据集在模型的建立中使用适当的建模技术针对不同的建模技术测试模型性能必要地精炼分析模型和主题专家一起检验分析模型记录分析模型和结果建模用模型的结果来协助业务开展、战略设计和战术实施。收集结果进行反响,为模型的退化进行侦测,更进一步改善模型性能。实施数据仓库数据采集数据衍生1建立预测模型定义和识别有意义的数据项评分结果监测结果多维分析/报表抽取样本测试模型模型打分提取全部资料23,546789数据仓库数据采集数据衍生1建立预测模型定义和识别有意义的数据项评分结果监测结果多维分析/报表抽取样本测试模型模型打分提取全部资料23,546789具体实施过程以号码为单位用户在网时间至少3个月分析流失前6个月的数据以了解可能流失原因正常用户状态为’正常’或‘停话’或‘强开’ 假设状态为停话,停话原因属于自愿停话:报停双停报停单停报停完全挂失双停挂失单停挂失完全假设状态为停话,停话原因属于非自愿停话:冒高双停冒高单停欠停双停欠停单停强关双停强关单停强关完全预拆最近停话期间少于3个月且6个月內至少有一次缴费记录流失客户状态为’预销’或‘预拆’〔一个月以上〕客户流失的定义市场计划市场调查新用户计费网络销售网络合同/买卡神州行上线中心客服传真/电话电脑联网(直营)客服查询/抱怨/停话/催缴异常营业网点申请销号用户使用账单营业网点/银行等缴费缴费离网用户离网原因调查更换/维修销售/营业网点项目行销资费优惠项目业务理解客户数据合约属性交互行为客户忠诚度支付行为使用行为近一个月缴费额近三个月平均缴费额近六个月平均缴费额六个月通话移动平均六个月通话移动差受话次数/秒数受话号码数发话次数/秒数拨打号码数发短消息次数话转比例漫游次数网内拨打比例拨打固话次数拨打简码次数通话异常中断次数迟缴次数欠缴金额催缴次数催缴成功次数累计积分数已兑换次数已兑换分数兑换类别限话次数联络次数接触次数接触类别抱怨次数查询销号离网次数资费套餐变动IMSI_DN更换次数客户状态变化情况使用期
年龄资费套餐所属地区缴费方式性别合约多号码客户类型证件多号码开通类型分析月租型流失用户的数据来源数据质量问题50元月租全球通,20元月租全球通,20元月租套餐,20元月租亲情卡,事事发,0元月租惠通卡,30元月租套餐等资费套餐的客户。有过资费调整的客户。在J地区,S地区,X地区,JZ地区,Y地区,L地区的用户流失倾向较高。年龄不超过30岁的年轻族群流失比例高。最近一个月缴费额不超过前两个月平均缴费额在网时间少于17个月六个月内迟缴次数超过5次流失客户特征…近六个月內有限话记录的客户。被叫次数不超过主叫次数的34%。近三个月主叫固网时长比例不超过8%或超过80%。近三个月內不曾不超过2个三个月内被叫次数不超过20次。三个月内主叫次数不超过45次。三个月内被叫不同号码不超过17个三个月内主叫不同号码不超过11个三个月内主叫秒数不超过2465秒三个月内发送短消息不超过2个流失客户特征(续)近六个月迟缴超过5次最近一月出账与近三月平均出账额比例不超过0.33曾限话更换过资费套餐在特定地区是否是否最近一个月出账额不超过14元是否Etc是76.5%离网是否否Etc.Etc.Etc.EtcEtc否是模型结果模型评分最近一月出账与近三月平均出账额比例不超过0.33曾限话最近一个月出账额不超过14元更换过资费套餐近六个月迟缴超过5次在特定地区得分:0.765分近六个月迟缴超过5次最近一月出账与近三月平均出账额比例不超过0.33曾限话更换过资费套餐在特定地区是否是否最近一个月出账额不超过14元是否Etc是76.5%离网是否否Etc.Etc.Etc.Etc.Etc..否是最有可能销号的客户群组#1最近一个月缴费额不超过前两个月平均缴费额曾限话最近一个月出账金额不超过14元曾更换资费方案六个月内迟缴5次以上属于〔J地区,S地区,X地区,JZ地区,Y地区,L地区〕资费属于低档普通套餐近三个月被叫次数不超过20次最近一个月缴费减少曾限话低档资费套餐经常迟缴更换过资费方案最有可能销号的客户群组#2最近一个月缴费额不超过前两个月平均缴费额曾限话最近一个月出账金额不超过14元曾更换资费方案不属于〔J地区,S地区,X地区,JZ地区,Y地区,L地区〕通过直属营业厅入网六个月内迟缴5次以上近三个月被叫不同号码数不超过11个欠费金额在-246.37和1431.87之间被叫费用不超过13.67元低档资费套餐更换过SIM卡最近一个月缴费减少曾限话曾更换资费方案普通低档资费套餐缴费行为较差模型评估-命中率X轴:按离网倾向评分从大到小排序后的客户占目标客户人数的百分比;Y轴:前x%的客户中被准确预测为离网的客户占这批客户的百分比,即命中率X轴:按离网倾向评分从大到小排序后的离网客户占离网总人数的百分比;Y轴:〔前x%的客户中的命中率〕/离网率模型评估-LIFT客户流失模型的输出结果中包括一个客户流失指数,用来做为客户流失的概率〔介于0到1之间〕,以区别不同客户间流失可能性的上下,如一个流失指数为0.8的客户比一个流失指数为0.6的客户更可能离开。当营销部门欲推行一客户挽留方案,可按照客户流失指数的上下对客户排序,找出最可能流失的客户群,以最少的本钱,最适当的沟通,达成最正确的客户挽留效果。模型发布客户离网0.85-1预测分析图:客户离网预测分析图钻取结果启动选择下钻获取
前端应用数据挖掘自动化自动化建模过程和结果数据抽取,变换,衍生和评分自动化。创立新的数据立方体或报表以产生挽留客户名单并提供各种流失群组的客户特征描述。自动计算命中率/Lift报告以监测模型性能综合信用模型/客户价值模型的结果确定目标客户DataMart自动化模型系统维护数据抽取转换加载(ETL)计算指标制作报表及Cubes系统使用者数据仓库评估模型质量,重建选择模型建模人员维护预测模型维护报表及Cubes系统管理者数据挖掘自动化数据挖掘平台关键问题数据挖掘需要足够的历史数据支持〔按照经验,一般需要积累6个月的历史数据〕数据挖掘需要正确的完备的数据支持〔错误的数据之上无法挖掘出正确的结果〕,而PDM和ETL需要一段时间进行模型的完善和数据质量检查不同省份的数据中蕴含着不同的规律,因此对A省移动挖掘专题来说重要的那些属性未必同样适用于B省,需要进行大量的数据探索和业务理解;数据挖掘本身需要屡次的试验,以确定适宜的模型、适宜的变量选择以及适宜的数据数据挖掘是一个过程而非产品,需要人的大量参与和分析,而这个过程又常常需要螺旋式的循环往复,以到达比较理想的目标就A省移动的经验来说,客户流失预测专题一共用了三个月得到初步的结果,然后的两个月进行了调整使之稳定;因此对于B省移动来说,预计在ETL根本完成后需要花费至少三个月的时间来完成流失预测专题关键问题-业务闭环的形成数据采集/ETL分析报表&OLAP数据挖掘经营分析信息反响主动营销任务分配营销活动策略制定客户效劳客户客户效劳中心××现状分析-支撑系统相对孤立系统关系闭环营销在线查询轮廓支撑战略决策经营分析系统OLAP分析报表数据模型客户细分营销案设计营销自动化客户信息合作伙伴信息客户轮廓渠道轮廓合作伙伴轮廓营销案计划和反馈经营分析系统管理和业务人员在线服务器BOSS系统直销实体代理增值电子合作伙伴营销服务人员客户BOSS1.5系统决策分析业务实施ETL场景假设假设某地区客户规模为200万,通过对客户离网情况的分析,建立离网规那么模型,并对该地区的客户进行分析,获取预离网客户名单,针对客户的特点设计营销活动方案进行客户挽留。角色分配市场分析师:提取预离网客户规那么;打分、提取预离网客户列表;对预离网客户进行细分;评估挽留工作的效率和效果营销筹划人员:进行营销措施设计张三:某省移动通信用户用户,其身份是某集团客户中的金卡客户李四:某省移动通信公司用户,其身份是普通客户业务闭环-客户挽留案例业务闭环-客户挽留案例1、确定离网客户样本范围业务闭环-客户挽留案例变量选择及数据抽样数据探索建模〔获取流失特征〕评分并生成挽留名单〔预测流失倾向〕结果发布业务闭环-客户挽留案例7、市场分析师需对预离网客户列表进行细分一级分类二级分类三级分类手机号码其它特征集团高收入群体新业务感兴趣群体1391170ABCD语音业务感兴趣群体长途业务赶兴趣群体中端收入群体低收入群体个人客户高收入群体中端收入群体低收入群体新业务感兴趣群体语音业务感兴趣群体长途业务赶兴趣群体1391081ABCD业务闭环-客户挽留案例8、营销筹划人员进行营销措施设计市场分析师张三属于集团高收入群体,其对集团新业务非常感兴趣,建议通过客户经理与客户接触,为客户设计适合本集团的新业务综合解决方案进行挽留李四,由于其属于只对长途业务感兴趣的群体,因此通过为客户设计IP长途放心打的业务方案,挽留客户业务闭环-客户挽留案例9、营销筹划人员对营销措施的可行性分析市场分析师成本分析时效性分析营销案业务闭环-客户挽留案例10、提供给市场部经理,供领导决策。审批后再提供给业务支撑部门业务闭环-客户挽留案例11、挽留李四IP的重度使用者〔月平均IP费用到达80元〕,无论IP通话时长、通话次数均明列前茅
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 玩具用服装商业机会挖掘与战略布局策略研究报告
- 牙科用导电漆商业机会挖掘与战略布局策略研究报告
- 国际公法服务行业营销策略方案
- 蜂箱用巢础市场分析及投资价值研究报告
- 带有时钟的收音机产品供应链分析
- 安全网产业链招商引资的调研报告
- 废旧金属回收利用行业相关项目经营管理报告
- 卫星传输带宽出租行业营销策略方案
- 电路测试仪产品供应链分析
- 药用蜂胶商业机会挖掘与战略布局策略研究报告
- 模拟深海高压舱试验系统设计方案
- 加热管制作工艺
- 礼仪队工作计划三篇
- 互补输出级介绍
- 设备运输方案
- (完整版)管道代号对照
- 口腔颌面部外伤的救治2
- 市森林消防(防汛)专业队管理制度森林防火扑火队管理制度.doc
- 路缘石拆除更换专项施工方案(精华版)
- 正交试验设计表.doc
- 儿科常见皮疹疾病课件
评论
0/150
提交评论