版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、淘宝大数据部落移动通信客户流失规律分析1.研究目的通过对某移动通信公司客户的流失数据分析,了解客户流失规律,建立流失预警系统,为客户关系管理服务。2.数据介绍某年度随机抽取的1000个移动通信客户。因变量是他们来年的流失行为(0=未流失,1=流失)。为了能够预测客户的未来行为,我们采集了下面这些来自当年的指标:客户等级(区分VIP客户等级):1,2,3,4;主叫次数(%):7日内日均主叫次数/90日内日均主叫次数;被叫次数(%):7日内日均被叫次数/90日内日均通话时长;费用(%):7日内日均通话费用/90日内日均通话费用。该数据存放在csv文件mobile.csv中。移动通信行业的现有企业中
2、,一般情况下客户月流失率在3%左右,如果静态计算,则所有客户会在2-3年内全部流失。在降低客户流失率方面,哪怕仅仅降低1%就意味着你至少可以有百万元的收入增长!客户是一个公司最宝贵的财富,因此保持客户并增长客户就是头等重要的事情,同是又是很困难的一项任务。在2011年底,中国的人口已达1347350000,同时手机量达到1006923000,也就是说中国的手机普及率差不多达到了75%,现有的用户数几乎已经接近人口总数。在一个如此成熟和饱和的市场中,开拓新用户的难度可想而知。根据美国市场营销学会顾客满意手册的统计数据表明,吸引一个新顾客所耗费的成本大概相当于保持一个现有客户的5倍,而且从传统意义
3、上来讲,移动通信行业保留旧客户利润率为开发一位新客户之16倍,尤其对于剩余客户市场日渐稀疏的移动通信市场来说,减少客户流失就意味着用更少的成本减少利润的流失,这点已经为运营商所广为接受。由此可见客户保持的重要性,也就是说保留旧客户比开发、吸收新客户更重要。在成熟期的产品市场中,要开拓新客户很不容易。客户的忠诚度应该是一个企业能够生存发展的最大资产之一,拥有忠诚度的客户,会因客户有学习的效果,而使企业可以花费较少的成本来服务客户,降低了公司在服务成本上的支出,而且忠诚的客户也会宣传正面的口碑效应以作为他人的参考,进而替企业创造新的交易。因此本文试图通过逻辑回归模型来对某移动通信公司客户的流失数据
4、分析,了解客户流失规律,建立流失预警系统,为客户关系管理服务。3读取数据,并且查看数据概况客户等级主叫次数被叫次数通话时长费用流失TOC o 1-5 h z21.08285871.07469711.23538581.2375469020.87743730.72755790.64985020.6696754011.19642861.00670301.43264441.2237179030.96999151.06681030.64375700.5540078011.22259141.33957851.05421701.9616997010.92740051.29306120.98731841.03
5、9144904绘制变量之间的散点图0240.00.6ini匚|=1=1LO1attach(data)从上面的图中,我们可以看到各个变量之间的相关关系,其中主叫次数和被叫次数呈正相关关系,通话时长和费用也成正相关关系。O00O_CCCO9OO_CN_O_OOOCCO11.011.5I2.0I2.5I3.0i3.5I40容户等级CD96pO04OOCDOOOffi:ozo:o234祓叫次数0123456通话时长0246S1012费用然后绘制各个自变量和因变量(流失)的关系散点图,可以看到他们之间关系不是十分明显,从次数和流失的散点图来看,可能有正相关的关系,因此进行逻辑回归模型的分析。data$流
6、失=factor(data$流失)划分训练集levels(data$流失)1split-sample(1:nrow(data),nrow(data)*(2/3)训练集data_train-datasplit,测试集data_test|z|)(Intereept)2.31780.31377.3891.47e-13*客户等级-0.43110.1613-2.6720.00753*主叫次数-0.65790.2393-2.7490.00597*被叫次数-2.49360.3065-8.1364.07e-16*通话时长0.15020.35420.4240.67159费用0.25790.18931.3620.
7、17312Signif.eodes:0*0.001*0.01*0.05.0.1Coeffieients:1(Dispersionparameterforbinomialfamilytakentobe1)Nulldevianee:895.30on665degreesoffreedomResidualdevianee:672.74on660degreesoffreedomAIC:684.74NumberofFisherSeoringiterations:57优势比解释则客户等级每增加1个单位,客户流失的估计值变为exp(-0.4311)=因此,客户等级越高,客户流失越低则主叫次数每增加1个单位,客
8、户流失的估计值变为exp(-0.6579)79,因此,主叫次数越高,客户流失越低train)0.6497939,=0.517930.0826120则被叫次数每增加1个单位,客户流失的估计值变为exp(-2.4936)=3,因此,被叫次数越高,客户流失越低8Logistics回归拟合的解释从输出结果可以看出,回归方程为流失=2.7885-0.5801客户等级-0.6756主叫次数-2.6843被叫次数-0.5125通话时长+0.7565费用,变量和的统计量的估计值分别为-0.5801,-0.6756,-2.6843,-0.5125和0.7565,除了通话时长以外由对应的值都比显著性水平0.05小
9、,可得4个偏回归系p数在显著性水平0.05下均显著不为零。因此,可以认为客户等级、主叫次数、被叫次数和费用对客户流失具有显著的影响。进一步地剩余方差的估计值,devianee统计量的估计值为898.52,说明,回归方程效果较好。9效应的置信区间置信区间是给定自变量值后,由回归方程得到的的流失预测值(实0y际上是的平均值)的置信区间;预测区间是实际值的置信区间,在这里称为预测区间。0y0y预测区间要比置信区间稍大,命令与显示结果如下2.97.5%(intercept;2.27473363.6137797客户等级主叫灰数械叫次數通话时长费用-1.00272393341573-1.3725962-0
10、.4055661-2.5851576-1.4647493-1.666saao-a.24292420.384.38671.281217410拟合优度与偏差混淆矩阵predictrealbadgood017722134101残差分析:残差分析可以对回归模型的假设条件即随机误差项是否独立同分布进行检验,同时还可以找出离群点。命令语句为plot(lm.1),显示结果如下par(mfrow=c(1,1)plot(fit)淘宝大数据部落淘宝大数据部落075511.Logisti模型的残差:皮尔逊残差与标准化残差sCDnptfliDrvPredictedv-aluesqkn(流失7NormalQ-Qp一(D
11、DUUe一Acup-pls7350-3-2-1012Theoreti匚乱IQuantilesglnif流失_)Scale-Location-6-4-20247&%?6o0I8ONIn0-Ino00一-p巫lgICDXIIco玉lDp.P4ICO一mantelhaen.test(tableCdata_trai门宇客户等级,data_trai门宇主叫次埶,data_trai门坨流尖)cochrmn-MiUTtEl-HaiEnsNEltestdata:tab!e(data_tra-in$户等级,data_t詁砒主叫次埶,data_trainS;:)Cochran-Mante!-HaenszelM2=
12、1926.2,df=1815ap-value=0.0343BCMH统计量=1926.2,df=1815,P-value=0.034.由于p值小于0.05,因此可以认为不同的客户等级客户流失和主叫次数之间不是相互独立的。13总结本文首先通过绘制客户流失与诸影响因素(客户等级主叫次数被叫次数通话时长费用)之间的散点图和计算它们之间的相关系数,可知客户流失与诸因素之间存在比较明显的非线性关系,因此,为简化问题,通过R软件,建立了逻辑回归模型.利用所得模型可对客户流失的因素进行探讨.研究表明,客户流失和货币供应量与人民币短期存款利率并不存在长期的稳定关系.因此,这里只使用此模型对我国移动通信市场作出粗略的线性估计.我们猜测只是由于影响客户流失的因素复杂,如通信公司的经营状况、客户心理等等,并最终反映在客户流失行为上来,表现在客户流失的高低.此外,移动通信市场是一个动态的过程,客户作为通信产品的需求者与供应者,通过流失率来表达对价格水平的意见.当然,值得注意的是,客户流失并不是由上述因素来决定,还有其他的影响因素。通过回归分析可以发现,客户流失与主叫次数、通话时长息息相关。由于移动通信市场是通信呼叫的场所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年浙科版必修1历史下册阶段测试试卷
- 2025年冀教版九年级历史下册阶段测试试卷含答案
- 2025年新科版七年级物理上册月考试卷含答案
- 2025年教科新版八年级地理上册月考试卷
- 2025年牛津译林版八年级地理下册月考试卷含答案
- 2025年岳麓版九年级历史上册阶段测试试卷含答案
- 2025年度煤炭行业安全生产责任保险合同7篇
- 二零二五版门卫服务与社区治安管理合同3篇
- 二零二五版门卫值班人员安全管理聘用合同4篇
- 二零二五年度城市更新项目泥水工施工合同4篇
- 两办意见八硬措施煤矿安全生产条例宣贯学习课件
- 40篇短文搞定高中英语3500单词
- 人教版高中数学必修二《第九章 统计》同步练习及答案解析
- 重大危险源的风险评估模型
- 儿科护理安全警示教育课件
- 三年级下册口算天天100题
- 国家中英文名称及代码缩写(三位)
- 人员密集场所消防安全培训
- 液晶高压芯片去保护方法
- 使用AVF血液透析患者的护理查房
- 拜太岁科仪文档
评论
0/150
提交评论