




已阅读5页,还剩19页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
佛山市全球通中高端用户价值降低预警模型分析报告 主要内容 背景介绍 分析目标 模型定义 数据分析与探索 模型构建 模型评估 背景 2008年底,运营商重组基本完成,随着全业务运营时代的来临,移动市场上客户争夺越演越烈,尤其是中高端客户市场硝烟四起,战火纷飞。 为了赢得这场战争,集团公司把中高端客户保有作为 09年的战略目标之一,为各省公司下达了相应的中高端保有任务,而省公司也对市公司下发锁定中高端考核指标。 分析目标 利用客户近期通信行为,建立中高端客户的价值流失预警模型,预测集团公司下发的客户以及最新的中高段客户的价值下降的情况,使中高端客户保有更有针对性,更有效地支撑客户挽留活动,实现集团公司中高端客户保有的目标。 模型定义 分析用户群: 集团公司下发的拍照用户中的全球通用户: 08底在网且 10、 11、 12月三个月累计 ARPU不低于 360元,且客户年底状态正常且 12月是通话的二类地市全球通客户。 模型目标: 预测哪些客户的 ARPU将会低于 50元。 时间窗口: 分析窗口 预测窗口 预测点 M M-1 M-2 M-3 M-4 M-5 M+1 M+2 请下载观看 ! 主要内容 背景介绍 分析目标 模型定义 数据分析与探索 模型构建 模型评估 总结 数据分析与探索 我们采用了拍照用户中的 193009个用户在 2008年 8、 9、 10月的数据,利用直方图进行分析各个变量与流失的关系比较 184033,95%8976, 5%ARPU大于 等于50ARPU小于 50数据分析与探索:网内号码情况 客户网内的号码数越多越稳定 ,不易流失。 网内号码占比过高或者过低的人群,流失率都偏大。当此比值是 0.4到 0.8时流失率最小。 H i s t o g r a m 010000200003000040000500006000070000800001 2 3 4 500 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率网内号码数 H i s t o g r a m 0500010000150002000025000300001 2 3 4 5 6 7 8 9 1000 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率网内号码占比 H i s t o g r a m 01000020000300004000050000600007000080000900001000001 1000 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率数据分析与探索 :家庭、集团用户 H i s t o g r a m 0200004000060000800001000001200001 1000 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率H i s t o g r a m 01000020000300004000050000600007000080000900001000001 1000 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率是否家庭产品用户 是否集团产品用户 集团产品用户占 80%,流失率较低; 家庭产品用户占 12%,流失率较高; 用户等级高占 83%,流失率较高,普通用户流失率较低 客户等级 H i s t o g r a m 01000020000300004000050000600007000080000900001 2 300 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率H i s t o g r a m 0100002000030000400005000060000700001 2 300 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率数据分析与探索 :最近新业务情况 用户新业务使用数增加带来的价值增长比较稳定,不易流失 用户新业务使费用用增加带来的价值增长比较稳定,不易流失 用户新业务使用费用占比增加带来的价值增长不稳定,容易流失 H i s t o g r a m 0500010000150002000025000300003500040000450001 2 3 4 5 6 7 8 9 1000 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率最近新业务使用数 新业务费用占比 新业务费用 (最近一月 ) H i s t o g r a m 01000020000300004000050000600007000080000900001000001 2 3 4 5 6 700 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率数据分析与探索 :用户 ARPU情况 平均 ARPU 用户平均 ARPU高带来的价值增长比较稳定,不易流失。 用户当前 ARPU高带来的价值增长比较稳定,不易流失。 。 H i s t o g r a m 01000020000300004000050000600007000080000900001000001 2 3 4 5 600 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率当前 ARPU 数据分析与探索 :用户 ARPU情况 H i s t o g r a m 01000020000300004000050000600007000080000900001000001 2 3 4 500 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率警戒 ARPU H i s t o g r a m 0200004000060000800001000001200001 200 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率ARPU波动 用户警戒 ARPU高比较稳定,不易流失。 ARPU波动大的流失率较高。 H i s t o g r a m 01000020000300004000050000600007000080000900001 2 3 4 5 6 7 8 9 1000 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率数据分析与探索 :月固定费 月固定费 用户月固定费增加带来的价值增长比较稳定,不易流失。 请下载观看 ! 数据分析与探索:变量筛选 通过以下方法来筛选模型的输入变量: 值分析:去掉取值不正常的变量 直方图:选取和流失相关、区分度大的变量 相关分析:从相关性大的变量中选取区分度较大的 201782, 95%9518, 5%ARPU大于 等于50ARPU小于 50数据分析与探索:变量筛选 利用直方图,我们可以直观的看到该变量和流失的关系,对于和流失的关系比较复杂的变量,我们将其排除在模型输入变量之外,或者生成新的变量。 H i s t o g r a m 0500010000150002000025000300003500040000450001 2 3 4 5 6 7 8 9 1000 . 0 20 . 0 40 . 0 60 . 0 80 . 10 . 1 20 . 1 40 . 1 60 . 1 80 . 2arpu = 50 流失率 整体流失率最近新业务使用数 主要内容 背景介绍 分析目标 模型定义 数据分析与探索 模型构建 模型评估 模型构建:建模工具 该业务问题是一个二元预测问题,并且从数据探索的结果来看,与之相关的数据大都是数值型的数据,因而适合用 逻辑回归 的方法来建模。 Teradata Warehouse Miner能够方便的建立逻辑回归模型,并且能够很好的配合 Teradata数据库进行大量数据的计算,是建模工具一个较好选择。 请下载观看 ! 模型构建:建模流程 模型输入变量 抽样 训练集 用 TWM建模 测试集 LG模型 对测试集打分 我们将 2008年 8、 9、 10的数据按照 6: 4的比例分成训练集(115805个用户)和测试集(77204个用户)来构建、评估模型。 模型结果 yyeep1通过用训练集来建模,我们得到用户在下下个月 arpu低于 50元的概率为 : 其中 Y=常数 +变量 1*系数 1+变量 2*系数 2+变量 3*系数 3 +。 变量名称 系数 标准化系数 常数 -2.7654 N/A 网内号码数 -0.0193 -0.3586 警戒 ARPU -0.042 -2.2721 平均 ARPU 0.029 1.8927 最近一月对手主叫次数 -0.0128 -0.6196 当前 ARPU -0.0061 -0.4183 最近新业务使用数 -0.2099 -0.2276 客户等级 0.6831 0.1417 ARPU 波动 -0.013 -0.363 在网时长 -0.0001 -0.0685 月固定费 -0.0002 -0.2225 网内号码占比 0.6178 0.0504 新业务使用数趋势 0.1701 0.0659 是否家庭产品用户 0.2629 0.047 是否飞信 0.1491 0.0332 是否集团产品用户 0.1261 0.0276 月均省外长途费用 -0.0076 -0.0639 省外漫游费用趋势 0.0051 0.0321 月均 WLAN费用 6.2483 0.0178 新业务费用占比 1.5705 0.1173 新业务费用 (最近一月 ) -0.0123 -0.1881 最近一月是否对手客服接触 1.4235 0.0164 最近省外长途费用 0.0047 0.0473 请下载观看 ! 模型结果分析 变量名称 系数 标准化系数 意义解释 常数 -2.7654 N/A 警戒 ARPU -0.042 -2.2721 警戒 ARPU高,最近 ARPU增加, ARPU 波动增加,月固定费高的用户流失风险小 当前 ARPU -0.0061 -0.4183 ARPU 波动 -0.013 -0.363月固定费 -0.0002 -0.2225 最近一月对手主叫次数 -0.0128 -0.6196 最近一月对手主叫次数多的用户流失风险小 网内号码数 -0.0193 -0.3586 网内号码数多的流失风险小 新业务费用 (最近一月 ) -0.0123 -0.1881 新业务使用数,费用多的用户流失风险小 最近新业务使用数 -0.2099 -0.2276在网时长 -0.0001 -0.0685 在网时长长的用户比较稳定,流失风险小 月均省外长途费用 -0.0076 -0.0639 省外长途费用高流失风险小 是否集团产品用户 0.1261 0.0276 集团用户流失风险大 是否飞信 0.1491 0.0332 飞信用户流失风险大 网内号码占比 0.6178 0.0504 网内号码占比高的流失风险大 平均 ARPU 0.029 1.8927 平均 ARPU高的流失风险大 客户等级 0.6831 0.1417 用户等级高流失风险大 新业务费用占比 1.5705 0.1173 新业务使用趋势增加,新业务费用占比高的流失风险大 新业务使用数趋势 0.1701 0.0659是否家庭产品用户 0.2629 0.047 家庭网用户流失风险大 月均 WLAN费用 6.2483 0.0178 月均 WLAN费用高流失风险大 最近一月是否对手客服接触 1.4235 0.0164 有与对手客服接触的流失风险大 最近省外长途费用 0.0047 0.0473 最近省外漫游长途费用高,趋势增加的流失风险大 省外漫游费用趋势 0.0051 0.0321主要内容 背景介绍 分析目标 模型定义 数据质量分析 数据探索 模型构建 模型评估 模型评估 我们使用命中率( Response %)、提升率( Lift)、覆盖率( Capture Respones%)来对模型进行评估: 命中率 =提取的客户中流失的数目 /提取的人数 提升率 =命中率 /总体的流失率 覆盖率 =提取的客户中流失的数目 /总体的流失的人数 请下载观看 ! 模型评估 测试集评估结果: 前 3%(约 0.23万用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030电子支付行业市场发展分析及发展前景与投资机会研究报告
- 2025-2030现代农业行业竞争格局分析及投资前景与战略规划研究报告
- 2025-2030玉米淀粉市场市场现状供需分析及投资评估规划分析研究报告
- 2025-2030特种加工产业行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030燃气灶具行业市场发展分析及投资前景研究报告
- 2025-2030消费贷款产品入市调查研究报告
- 2025-2030活动头部斑点行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030汽车电话支架行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030水净化行业兼并重组机会研究及决策咨询报告
- 2025-2030无气喷涂机行业市场现状供需分析及投资评估规划分析研究报告
- 测试工程师季度述职报告
- XX文化产业投资公司二零二五年度股东退股及文化创意协议
- 跟着电影去旅游知到智慧树章节测试课后答案2024年秋山东大学(威海)
- 2024上海市招聘社区工作者考试题及参考答案
- 2021年高考物理试卷(江苏)(解析卷)
- 第六单元《组合图形的面积》(教学设计)-人教版五年级数学上册
- 地理-北京市朝阳区2024-2025学年高三第一学期期末质量检测考试试题和答案
- 2024年度高中报名辅导中介服务合同
- 【MOOC】信号与系统-哈尔滨工业大学 中国大学慕课MOOC答案
- 19《牧场之国》第二课时说课稿-2023-2024学年五年级下册语文统编版
- 十四五《中成药学》第一章-绪论
评论
0/150
提交评论