四川经分应用模型务工人员识别模型设计说明书_第1页
四川经分应用模型务工人员识别模型设计说明书_第2页
四川经分应用模型务工人员识别模型设计说明书_第3页
四川经分应用模型务工人员识别模型设计说明书_第4页
四川经分应用模型务工人员识别模型设计说明书_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、四川移动春季营销成都务工人员识别模型分析设计说明书版本号 1.0项目名称四川移动春季营销成都务工人员识别模型文档名称四川移动春季营销成都务工人员识别模型设计说明书版本号1.0发布日期2010.12文档变更记录版本修改章节修改类型日期修改人备注2目 录1.模型概述12.业务理解与目标定义12.1 模型定义12.2目标定义13.数据准备与数据探索13.1 数据准备13.2数据探索24.模型构建34.1 建模工具34.2 建模流程45.模型评估45.1 模型评估45.2结果解释56.模型部署6附录61. 模型概述在营销意义上的春季是指从当年的12月到次年的3月这段时间。由于地域和经济环境影响,春季是

2、四川地区通信市场的传统营销旺季。成都作为西南地区经济中心和交通枢纽,随着承接产业转移工作的推进,吸纳省内外务工人员市场逐渐增大,需求旺盛且相对集中,当地务工人员以省内为主,流动性强,实名登记信息较少,仅依靠传统的摸底排查难度大,及时性不足,在节假日容易出现市场波动大,客户大进大出,重入网现象严重。因此,成都务工人员识别模型的目标就在于为四川移动成都公司春季营销提供指向支撑和决策参考,协助需求部门有针对性的进行春季营销目标客户的选择、跟踪监控、营销执行等相关工作,降低客户大进大出带来的成本,同时将使长漫产品等业务营销及客户维系工作有效前移,支撑精细化运营。2. 业务理解与目标定义2.1 模型定义

3、务工人员:非成都本地人口,平时在成都市区域内工作,节假日可能返乡的用户。2.2 目标定义建立务工人员识别预测模型并且产生最可能的目标客户的名单,结合每个客户的价值评分,用0和1来标识目标客户的可能性,输出一般特征字段(区域、资费等)和特殊特征字段(老乡圈信息、返乡地市信息等),为老乡网、长漫包等产品及全省统一营销提供精准支撑。3. 数据准备与数据探索3.1 数据准备维度变量计算口径客户基本资料品牌、在网时长、归属区域、集团标识等系统定义客户往返资料客户节假日固定往返特征通过vlr切换触发的实时信令数据判断客户农忙、节假日期间打工地与非打工地之间的固定往返特征客户节假日固定往返次数通过vlr切换

4、触发的实时信令数据判断客户农忙、节假日期间打工地与非打工地之间的固定往返次数客户产品资料主资费、附加包标识系统定义客户消费资料月均arpu及变动近三月arpu均值、波动值月均本地、长途通话费用及变动、占比近三月本地、长途通话费用均值、波动值、占比月均数据业务费用及变动、占比近三月数据业务费用均值、波动值、占比月均手机上网费用及变动、占比近三月手机上网费用均值、波动值、占比客户通话资料月均总通话时长及变动近三月总通话时长平均值、波动值月均本地、长途通话时长及变动、占比近三月本地、长途通话时长平均值、波动值、占比月均非漫游17:00-21:00通话时长及变动、占比近三月非漫游17:00-21:00

5、通话时长平均值、波动值、占比非工作时间(17:00-08:00)通话时长及变动、占比近三月非工作时间(17:00-08:00)通话时长平均值、波动值、占比客户基站资料通话基站数用户有过通话的基站数量通话最长基站通话时长占比客户交往圈资料交往圈人数交往圈中外来工人数及占比交往圈中本地人数及占比交往圈中长途通话人数3.2 数据探索利用spss软件对建模字段进行数据审核和探索,最终入选变量如下:变量名变量描述客户节假日固定往返特征通过vlr切换触发的实时信令数据判断客户农忙、节假日期间打工地与非打工地之间的固定往返特征客户节假日固定往返次数通过vlr切换触发的实时信令数据判断客户农忙、节假日期间打工

6、地与非打工地之间的固定往返次数非工作时间通话时长占比17点至次日早8点之间的通话时长占总通话时长的比重月均长途通话时长及变动近三月平均的长途通话时长以及波动性长途交往圈人数客户长途通话的对端号码数量长途及漫游附加产品包订购标识是否订购长途或漫游附加产品包本地交往圈中外来工人数占比具有明确外地身份的成都移动客户占总交往圈人数的比重品牌客户归属品牌,如神州行4. 模型构建4.1 建模工具经过数据预处理、探索型数据分析, 最终确定了客户流失预测分析模型的变量,采用spss公司的clementine软件的决策树结点作为数据挖掘工具及数据挖掘技术来建立务工人口识别模型。4.2 建模流程5. 模型评估5.

7、1 模型评估用模型增益进行模型评估工作。增益评估图增益图是不同阀值下命中率(pv+,正确预测到的正例数占预测正例总数的比例)与预测成正例的比例(depth)的轨迹。随着阈值的减小,更多的客户就会被归为正例,也就是depth变大,这样pv+就相应减小。一个好的模型,在阈值变大时,相应的pv+就要变大,曲线足够陡峭。如上图所示,在阀值设定为20%的时候,曲线足够陡峭,模型效果较好,使用模型之后效果提升了约3.5倍。5.2 结果解释模型的规则概率如下表所示:大致可总结为:1、通过vlr切换触发的实时信令数据搜集客户农忙、节假日期间打工地与非打工地之间的固定往返信息,具有这种信息的客户为外来务工人员的

8、可能性较大。同时判断节假日内固定往返次数,往返次数在3次以上的客户经验证为外来工的概率超过90%;2、非工作时间长途通话时长占比超过30%且长途交往圈人数较少的客户有约80%的可能性为外来务工人员;3、外来务工人员的交往圈特征和长途通话特征很明显,交往圈中外来工占比较高和长途通话时长占比较高的客户有超过80%的概率是外来务工人员;4、非成都地区身份证号码和订购长漫产品包的客户有超过60%的可能性为外来务工人员;5、与交往圈中的本地客户通话时长占比小于0.3的客户有超过70%的可能性为外来务工人员。务工人员识别模型输出如下字段:目标号码、归属地(可细到片区和渠道)、用户资费、交往圈数目、可能来源

9、地(返乡目的地)、是否务工人员(根据模型打分)、结果的置信度。如下表所示:6. 模型部署务工人员识别模型的主要成果为提供务工人员清单,需求部门可因地制宜设计适合务工人员的产品,并依据清单进行针对性的营销工作。附录模型分析报告感谢您的使用 “小萍,晚上10点以后你为什么老关机?”陈飞很直接的发过来一条这样的疑问。有些按捺不住心头的怒火得力萍想起白天母亲那无休止的唠叨,在看看陈飞所发过来的令人气愤的短信,。平日有着高雅素养的她也很难一下子控制住心头怒火中烧的情绪,“我忙忙碌碌一整天,下班以后我只想回家安安静静好好的睡一觉,沉沉香甜的睡梦中,我不想被外界的因素所打扰,这就是我下班以后回家立刻关机的原

10、因。陈飞你问这话到底是什么意思?”气愤填膺的李萍立刻回复着陈飞。“我知道你白天为了饭店的生意劳碌不堪的,但是白天再累晚上下班以后也不至于回家就倒头大睡呀,你难道没有别的娱乐爱好吗?”陈飞这个令李萍还在踌躇考验的男人竟然还在不知深浅的试探着。“什么娱乐项目?你难道说的是找一群人在一起花天酒地的吃喝?还是闲得无聊漫无目的的在大街上瞎溜达?还是醉醺醺的在酒醉迷离中鬼哭狼嚎?陈飞,我告诉你,我没有那多闲心和空闲的时间去干那些令人觉得无聊的事情”。看到陈飞竟然说出如此之话李萍彻底的被激怒了。“小萍。我不是那个意思,你真的误会我的意思了。我就是觉得你平日认识的朋友也是很多的,并且你也是非常的热情好客的。既

11、然你的交友圈子广泛,晚上不至于就这样按部就班的在家蒙头大睡吧?”当一个男人表露内心所想的时候,小肚鸡肠或者说有点自私的男人本色也就显露无疑。“那晚上我不睡觉我能去干嘛?陈飞,你到底想对我说些什么,如果你真的想知道什么你就直接对我说,你又何必拐弯抹角的用话语来伤人那? ”“小萍,我说的真的不是那个意思,我就是随便的问一句。你千万别生气,我真的没有别的意思。”李萍的回复出乎陈飞意料,他觉得他的话令对方生气了。“陈飞,我没有生气,我为什么要生气?我可以拍着胸脯对天发誓,我没干什么见不得人的事情。陈飞,我再告诉你一遍,以后不管白天你怎么发短信我都会全天开机,可是到了晚上我十点钟准时关机,所以晚上10点以后你就别打我电话了。还有你觉得咱们有相处下去的必要,我就当什么都没发生过,照常的和你交往下去。但如果你觉得咱们俩个性格不和,存在着实质上的差异,兴趣不相投的话那我也只能对你说对不起了。”怒火之下李萍发过去看上去还算比较理智的话。但是过了好大一会陈飞才回复道,“我知道你得意

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论