四川经分应用模型务工人员识别模型设计说明书_第1页
四川经分应用模型务工人员识别模型设计说明书_第2页
四川经分应用模型务工人员识别模型设计说明书_第3页
四川经分应用模型务工人员识别模型设计说明书_第4页
四川经分应用模型务工人员识别模型设计说明书_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、四川移动春季营销成都务工人员识别模型分析设计说明书版本号 1.0项目名称四川移动春季营销成都务工人员识别模型文档名称四川移动春季营销成都务工人员识别模型设计说明书版本号1.0发布日期2010.12文档变更记录版本修改章节修改类型日期修改人备注目 录1.模型概述12.业务理解与目标定义12.1 模型定义12.2目标定义13.数据准备与数据探索13.1 数据准备13.2数据探索24.模型构建34.1 建模工具34.2 建模流程45.模型评估45.1 模型评估45.2结果解释56.模型部署6附录61. 模型概述在营销意义上的春季是指从当年的12月到次年的3月这段时间。由于地域和经济环境影响,春季是四

2、川地区通信市场的传统营销旺季。成都作为西南地区经济中心和交通枢纽,随着承接产业转移工作的推进,吸纳省内外务工人员市场逐渐增大,需求旺盛且相对集中,当地务工人员以省内为主,流动性强,实名登记信息较少,仅依靠传统的摸底排查难度大,及时性不足,在节假日容易出现市场波动大,客户大进大出,重入网现象严重。因此,成都务工人员识别模型的目标就在于为四川移动成都公司春季营销提供指向支撑和决策参考,协助需求部门有针对性的进行春季营销目标客户的选择、跟踪监控、营销执行等相关工作,降低客户大进大出带来的成本,同时将使长漫产品等业务营销及客户维系工作有效前移,支撑精细化运营。2. 业务理解与目标定义2.1 模型定义务

3、工人员:非成都本地人口,平时在成都市区域内工作,节假日可能返乡的用户。2.2 目标定义建立务工人员识别预测模型并且产生最可能的目标客户的名单,结合每个客户的价值评分,用0和1来标识目标客户的可能性,输出一般特征字段(区域、资费等)和特殊特征字段(老乡圈信息、返乡地市信息等),为老乡网、长漫包等产品及全省统一营销提供精准支撑。3. 数据准备与数据探索3.1 数据准备维度变量计算口径客户基本资料品牌、在网时长、归属区域、集团标识等系统定义客户往返资料客户节假日固定往返特征通过vlr切换触发的实时信令数据判断客户农忙、节假日期间打工地与非打工地之间的固定往返特征客户节假日固定往返次数通过vlr切换触

4、发的实时信令数据判断客户农忙、节假日期间打工地与非打工地之间的固定往返次数客户产品资料主资费、附加包标识系统定义客户消费资料月均arpu及变动近三月arpu均值、波动值月均本地、长途通话费用及变动、占比近三月本地、长途通话费用均值、波动值、占比月均数据业务费用及变动、占比近三月数据业务费用均值、波动值、占比月均手机上网费用及变动、占比近三月手机上网费用均值、波动值、占比客户通话资料月均总通话时长及变动近三月总通话时长平均值、波动值月均本地、长途通话时长及变动、占比近三月本地、长途通话时长平均值、波动值、占比月均非漫游17:00-21:00通话时长及变动、占比近三月非漫游17:00-21:00通

5、话时长平均值、波动值、占比非工作时间(17:00-08:00)通话时长及变动、占比近三月非工作时间(17:00-08:00)通话时长平均值、波动值、占比客户基站资料通话基站数用户有过通话的基站数量通话最长基站通话时长占比客户交往圈资料交往圈人数交往圈中外来工人数及占比交往圈中本地人数及占比交往圈中长途通话人数3.2 数据探索利用spss软件对建模字段进行数据审核和探索,最终入选变量如下:变量名变量描述客户节假日固定往返特征通过vlr切换触发的实时信令数据判断客户农忙、节假日期间打工地与非打工地之间的固定往返特征客户节假日固定往返次数通过vlr切换触发的实时信令数据判断客户农忙、节假日期间打工地

6、与非打工地之间的固定往返次数非工作时间通话时长占比17点至次日早8点之间的通话时长占总通话时长的比重月均长途通话时长及变动近三月平均的长途通话时长以及波动性长途交往圈人数客户长途通话的对端号码数量长途及漫游附加产品包订购标识是否订购长途或漫游附加产品包本地交往圈中外来工人数占比具有明确外地身份的成都移动客户占总交往圈人数的比重品牌客户归属品牌,如神州行4. 模型构建4.1 建模工具经过数据预处理、探索型数据分析, 最终确定了客户流失预测分析模型的变量,采用spss公司的clementine软件的决策树结点作为数据挖掘工具及数据挖掘技术来建立务工人口识别模型。4.2 建模流程5. 模型评估5.1

7、 模型评估用模型增益进行模型评估工作。增益评估图增益图是不同阀值下命中率(pv+,正确预测到的正例数占预测正例总数的比例)与预测成正例的比例(depth)的轨迹。随着阈值的减小,更多的客户就会被归为正例,也就是depth变大,这样pv+就相应减小。一个好的模型,在阈值变大时,相应的pv+就要变大,曲线足够陡峭。如上图所示,在阀值设定为20%的时候,曲线足够陡峭,模型效果较好,使用模型之后效果提升了约3.5倍。5.2 结果解释模型的规则概率如下表所示:大致可总结为:1、通过vlr切换触发的实时信令数据搜集客户农忙、节假日期间打工地与非打工地之间的固定往返信息,具有这种信息的客户为外来务工人员的可能性较大。同时判断节假日内固定往返次数,往返次数在3次以上的客户经验证为外来工的概率超过90%;2、非工作时间长途通话时长占比超过30%且长途交往圈人数较少的客户有约80%的可能性为外来务工人员;3、外来务工人员的交往圈特征和长途通话特征很明显,交往圈中外来工占比较高和长途通话时长占比较高的客户有超过80%的概率是外来务工人员;4、非成都地区身份证号码和订购长漫产品包的客户有超过60%的可能性为外来务工人员;5、与交往圈中的本地客户通话时长占比小于0.3的客户有超过70%的可能性为外来务工人员。务工人员识别模型输出如下字段:目标号码、归属地(可细到片区和渠道)、用户

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论