电信行业数据挖掘介绍_第1页
电信行业数据挖掘介绍_第2页
电信行业数据挖掘介绍_第3页
电信行业数据挖掘介绍_第4页
电信行业数据挖掘介绍_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电信行业数据挖掘介绍数据挖掘系统框架示意图SPSS以客户为中心分析方法客户细分和分析:根据客户的自然属性、消费特征、行为习惯进行客户的分群,分析各客户群体发展(转化)趋势和消费习惯及消费产品、趋势。客户对位客户需求:对位客户的需求,为客户设计和推荐适合客户需求的产品(套餐和资费组合)发现客户需求:发现各业务群体的业务需求。分析的主体:客户新的客户特征:客户对业务的消费行为,形成新的客户特征。客户行为的跟踪:跟踪客户使用业务的情况,投诉情况,流失预测与预警。电信数据挖掘分析所需数据

第一类数据:人口统计学数据1、地址2、家庭(公司)规模3、……第二类数据:通话行为数据1、通话次数2、通话时长度3、通话去向构成(市内、国内、国际、漫游……)4、通话时段构成(忙时、闲时、周末……)5、通话费用及构成6、……第三类数据:使用数据业务和服务数据1、是否使用某类服务(标记变量表示)2、各类型服务花费3、……第四类数据:其他数据1、用户在网时间2、用户付费方式3、……数据准备过程

——对数据进行整理和变换数据的几个来源:CDR(CallDetailedRecord)客户资料数据(CustomerInformation)客户帐务数据销售策略与措施数据其他来源数据的整理与变换数据的简单描述和汇总、缺失值的填补数据挖掘变量的筛选和相关性分析数据的专业变换不同数据源数据的整合其他数据挖掘建模和检验

选择何种工具和算法模型结果是否能在业务中被应用?模型检验方案如何设计和实施?数据挖掘流程第六步:结果发布

——如何把结果发布到业务人员(决策者)手中结果发布的几种可能方式提交书面或者电子报告把相关数据挖掘结果写回数据库,供查询展示开发用户界面,实现主要数据挖掘解决方案的定制化(例如:建立打分系统)模型的更新和维护针对不同的模型制定实施不同的模型更新计划(例如细分模型是其他模型的基础,更新频度慢,客户吸引模型更新频度快)数据挖掘软件的使用作为工具软件供企业数据挖掘分析人员使用作为后台运行,进行日常数据挖掘模型的处理客户流失分析案例商业背景虽然某移动在该地域移动电信市场地位处于龙头地位,但是由于联通、网通、电信的强势营销以及系列优惠活动,该移动的月流失客户率逐月上升。根据统计,该移动中高价值客户年流失率达到了27%以上。该移动希望通过SPSS分析团队的帮助,能够准确定位即将流失的客户,从而采取一定的业务措施把中高价值客户的流失率下降20%左右,实现客户维系活动投资回报最大化。咨询项目实施准备SPSS电信行业数据分析专家,并与该移动公司协商所需的业务和IT资源。SPSS技术人员与移动IT及业务人员讨论流失客户的目标定义、流失客户分析所考虑的因素、经分系统数据现状等情况。SPSS技术人员和移动相关人员制定咨询项目日程、投资回报评估标准、分析结果精准度目标等相关事宜。客户流失分分析范围分析目标分析中高价价值客户在在未来2月月内流失的的可能性,,及高流失失概率客户户前4个月月的行为特特征和人口口统计学特特征等,从从而帮助业业务人员提提前采取业业务措施实实施客户维维系。流失客户分分析的目标标客户群———中高价价值客户前6个月中中有3个月月ARPU>150的非神州州行客户流失客户定定义用户不再继继续使用移移动提供的的服务而终终止合同用户消费2月内最高高资费较前前6月平均均资费下滑滑80%以以上流失分析目目标分群考虑到预付付费和后付付费用户行行为特征有有相当大的的差异,因因此对预付付费客户和和后付费客客户分别分分析,从而而提高模型型的可信度度。咨询分析项项目成功目目标定义成功目标商商业定义客户年流失失率下降到到20%收益率提高高50%以以上成功目标技技术定义准确性:>=70%%命中率:>=40%%覆盖率:>=40%%提升度(流流失概率最最高的10%用户)):>=3客户流失分分析相关因因素欠费标志、、欠费总额额、新欠费费额、通话话次数、主主叫通话次次数占比、、平均每次次通话时长长、漫游时时长、漫游游占比、IP长途时时长、节假假日通话时时长、节假假日通话时时长占比、、节假日主主叫通话时时长占比、、闲时通话话时长、闲闲时通话时时长占比、、优惠通话话时长、优优惠通话时时长主叫占占比、与联联通GSM通话时长长、与联通通GSM通通话时长占占比、与联联通CDMA通话时时长、与联联通CDMA通话时时长占比、、与电信通通话时长、、与电信通通话时长占占比、国际际长途通话话时长、国国际长途通通话占比、、国际长途途主叫通话话占比、国国内长途通通话时长、、应缴费、、代收费、、月租费、、其他费用用、其他费费用占比、、通话费、、主叫通话话费占比、、优惠费、、优惠费占占比、主叫叫优惠费、、长途费、、长途费占占比、国内内长途费占占比、本地地费、本地地费占比、、优惠时段段通话费、、优惠时段段通话费占占比、基本本通话费、、基本通话话费占比、、呼转次数数、呼转次次数占比、、平均每次次呼转通话话时长、无无条件呼转转次数、无无条件呼转转次数占比比、呼转移移动次数、、呼转联通通GSM次次数、呼转转电信次数数、呼转联联通CDMA次数、、呼转其他他设备次数数、呼转秘秘书台次数数、呼转网网通次数、、交往圈、、主叫交往往圈占比、、联通交往往圈占比、、网通交往往圈占比、、最频繁联联系号码通通话次数、、最频繁联联系号码主主叫通话次次数、平均均最频繁联联系号码每每次通话时时长、短信信次数、GPRS时时长、品牌牌大类、客客户类型、、付费方式式、用户在在网时长、、用户状态态、免催标标志、换品品牌标志、、资费品牌牌、新品牌牌、与联通通客服联系系次数、与与电信客服服联系次数数、VPMN标志、、年龄、职职业、客服服联系次数数、离网标标志、停机机标志、停停机时长、、可用资金金额、未缴缴账单数、、预存次数数、预存金金额、有效效期项目实施过过程简述项目实施周周期:40个工作日日移动技术人人员负责从从经分系统统数据仓库库中收集符符合分析范范围的数据据(包含上上述相关因因素),并并整合成以以客户号为为唯一键值值的宽表。。历史史信信息息时时间间为为2006年年7月月————2007年年2月月。。训练练、、测测试试数数据据为为用用2006年年7月月————10月月的的客客户户数数据据分分析析2006年年11-12月月内内客客户户流流失失的的关关系系。。验证证数数据据为为用用2006年年9月月————12月月的的客客户户数数据据验验证证2007年年1-2月月内内客客户户流流失失的的命命中中率率。。对收收集集的的历历史史信信息息进进行行转转换换,,衍衍生生出出4月月内内资资费费波波动动,,4月月内内均均值值等等指指标标。。使用用Pearson和和Cramer’’sV指指标标评评估估预预测测因因子子和和客客户户流流失失之之间间关关系系的的强强弱弱,,进进行行维维度度裁裁减减,,简简化化模模型型并并提提高高模模型型健健壮壮度度。。后付付费费部部分分分分析析结结果果准准确确性性评评估估准确确率率::82.56%覆盖盖率率((预预测测准准确确的的流流失失客客户户数数占占实实际际客客户户流流失失数数的的比比率率————预预测测准准确确的的流流失失客客户户数数/((预预测测错错误误的的实实际际流流失失客客户户数数+预预测测准准确确地地流流失失客客户户数数))))::71.5%预付付费费部部分分分分析析结结果果准准确确性性评评估估准确确率率::81.65%覆盖盖率率((预预测测准准确确的的流流失失客客户户数数占占实实际际客客户户流流失失数数的的比比率率————预预测测准准确确的的流流失失客客户户数数/((预预测测错错误误的的实实际际流流失失客客户户数数+预预测测准准确确地地流流失失客客户户数数))))::92.47%模型型分分析析结结果果与与实实际际目目标标客客户户占占比比上图图为为提提升升图图。。根根据据提提升升图图的的结结果果,,市市场场分分析析人人员员可可以以很很容容易易了了解解客客户户维维系系的的目目标标群群体体定定位位。。根根据据统统计计,,通通常常情情况况下下电电信信公公司司对对提提升升度度大大于于3的的目目标标群群体体进进行行客客户户维维系系,,收收益益大大于于产产出出。。模型型分分析析结结果果的的收收益益情情况况上图图为为累累积积图图。。根根据据累累积积图图的的结结果果,,市市场场分分析析人人员员可可以以直直观观的的了了解解目目标标客客户户群群中中包包含含了了百百分分之之多多少少的的实实际际目目标标客客户户。。咨询询项项目目收收益益评评估估后付费客户预付费客户中高端客户数142,926480,089实际流失客户总数11,87133,310提升度大于3的客户群占比(预付费部分因为前10%客户已经包括了将近100%的流失客户,所以认为需要客户挽留的只占总客户的10%)25%20%实际流失客户占比75%90%预测准确的流失客户(实际流失客户总数*实际流失客户占比)890429,979推广业务的客户(中高端客户数*提升度大于3的客户群占比)35,73196018对流失倾向客户的挽留成功率(业界普遍为10%-25%)15%15%2007年2月流失客户在2006年12月前四月的平均月话费379187可能挽回的收入(预测准确的流失客户*对流失倾向客户的挽留成功率*2007年2月流失客户在2006年12月前四月的平均月话费)506,192840,911可能挽回的收入合计(月)1,347,103案例例分分析析应应用用结结果果应用用SPSS客客户户流流失失分分析析结结果果并并结结合合恰恰当当的的业业务务手手段段,,在在项项目目实实施施后后第第二二个个月月,,该该移移动动中中高高端端客客户户流流失失率率即即从从原原来来的的9.6%下下降降到到了了7%,,取取得得了了非非常常显显著著的的效效果果。。产品品关关联联性性分分析析介介绍绍((交交叉叉销销售售))产品品关关联联性性分分析析范范围围分析析目目标标通过过分分析析现现有有客客户户的的持持有有产产品品情情况况,,找找出出产产品品之之间间的的关关联联性性。。从从而而根根据据客客户户已已持持有有的的产产品品推推荐荐新新的的产产品品给给客客户户,,从从而而提提高高现现存存客客户户价价值值。。产品品关关联联性性分分析析范范围围产品品范范围围为为所所有有增增值值业业务务产产品品。。目标标客客户户为为所所有有现现有有持持有有增增值值业业务务的的客客户户产品品归归类类定定义义所有有产产品品不不能能按按照照产产品品维维表表进进行行简简单单的的归归纳纳,,而而是是根根据据其其实实际际内内容容进进行行归归纳纳或或细细化化((例例如如::短短信信业业务务既既不不能能完完全全按按照照SP商商归归类类,,也也不不能能简简单单的的归归为为一一类类,,而而是是根根据据内内容容进进行行拆拆分分))。。客户户持持有有产产品品定定义义客户户持持有有该该产产品品且且未未解解约约流失失分分析析目目标标分分群群考虑虑到到C网网和和G网网用用户户行行为为特特征征有有相相当当大大的的差差异异,,因因此此对对C网网和和G网网客客户户分分别别分分析析,,从从而而提提高高模模型型的的可可信信度度。。咨询询分分析析项项目目成成功功目目标标定定义义成功功目目标标商商业业定定义义客户户短短信信营营销销响响应应度度提提高高20%以以上上成功功目目标标技技术术定定义义找到到有有强强关关联联性性,,且且有有实实施施价价值值的的产产品品关关联联关关系系。。关联联支支持持度度((规规则则适适用用的的客客户户百百分分比比))::>20%关联联置置信信度度((营营销销的的成成功功概概率率))::40%产品品关关联联分分析析思思路路产品品关关联联分分析析中中的的主主要要问问题题产品品关关联联分分析析的的数数据据源源相相对对简简单单,,训训练练数数据据源源格格式式为为::客客户户号号、、客客户户持持有有产产品品1((T/F))、、客客户户持持有有产产品品2((T/F))…………。。利用用关关联联算算法法,,分分析析人人员员可可以以很很容容易易地地了了解解每每个个产产品品的的关关联联性性。。因因此此产产品品关关联联分分析析的的主主要要难难点点在在于于如如何何归归纳纳产产品品,,如如果果产产品品分分组组过过细细则则会会导导致致规规则则不不具具有有普普遍遍意意义义,,不不具具有有可可操操作作的的价价值值;;如如果果产产品品分分组组过过粗粗则则会会导导致致规规则则变变成成了了一一些些常常识识性性问问题题,,反反而而屏屏蔽蔽了了一一部部份份有有价价值值的的规规则则。。需要要有有针针对对性性地地对对不不同同的的客客户户群群进进行行产产品品关关联联分分析析,,不不同同的的客客户户群群对对应应的的产产品品关关联联关关系系是是不不同同的的。。如如果果简简单单地地对对所所有有客客户户进进行行关关联联分分析析,,得得到到的的结结果果要要么么置置信信度度过过低低,,无无法法操操作作;;要要么么产产生生一一些些业业务务常常识识((通通常常这这类类规规则则,,规规则则支支持持度度和和置置信信度度都都很很高高————例例如如::有有86%的的客客户户都都购购买买产产品品b,,如如果果规规则则告告诉诉你你持持有有产产品品a有有80%以以上上的的概概率率持持有有产产品品b,,则则这这类类规规则则是是没没有有意意义义的的))。。项目目实实施施过过程程简简述述先根根据据客客户户消消费费行行为为进进行行分分类类,,找找出出那那些些增增值值业业务务消消费费能能力力较较强强的的客客户户群群体体。。对产品维重新新定义。对那些增值业业务消费能力力较强的客户户分别进行产产品关联性分分析。由业务人员分分析生成的产产品关联规则则,筛选出那那些有业务含含义的规则。。把有价规则部部署到应用系系统中,根据据客户已持有有的产品推荐荐新产品。市场细分相关关因素客户最近三个个月的月均消消费:应收金额、、传统业务功功能月租应收收金额、传统统短信业务应应收金额、增增值业务应收收金额、本地地通话应收金金额、长途通通话应收金额额、通话应收收金额客户最近三个个月的各项月月均消费占比比:本地通话占比比、传统业务务功能月租占占比、传统短短信业务占比比、增值业务务占比、长途途通话占比、、通话占比客户最近三个个月月均其他他消费指标::传统短信业务务通话时长、、增值业务通通话时长、本本地通话时长长、长途通话话时长、传统统短信业务通通话次数、增增值业务通话话次数、本地地通话次数、、长途通话次次数市场细分结果果从客户数据中中发现一些异异常数据(例例如:发现一一客户话务资资费

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论