数据挖掘应用案例RFM模型分析与客户细分-沈浩老师_第1页
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师_第2页
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师_第3页
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师_第4页
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、奥的Insight这里,我先给各位朋友拜年,祝大家新春快乐!兔年就要过去了,本命年的最后一天再不更新博客有点对不住大家!正好刚帮某电信行业完成一个数据挖掘工作,其中的RFM模型还是有一定代表性,就再把数据挖掘RFM模型的建模思路细节与大家分享一下吧!手机充值业务是一项主要电信业务形式,客户的充值行为记录正好满足RFM模型的交易数据要求。根据美国数据库营销研究所ArthurHughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。我早期两篇博文已详述了RFM思想和旧MMode

2、ler操作过程,有兴趣的朋友可以阅读!RFM模型:R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M(Monetary)表示客户在最近一段时间内购买的金额。般原始数据为3个字段:客户ID、购买时间(日期格式)、购买金额,用数据挖掘软件处理,加权(考虑权重)得到RFM得分,进而可以进行客户细分,客户等级分类,CustomerLevelValue得分排序等,实现数据库营销!重要援留杳户重要发展杳尸片个这里再次借用数据挖掘与数据分析的RFM客户RFM分类图。本次分析用的的软件工具:旧MSPSSStatistics19,IBMSPSSM

3、odeler14.1,Tableau7.0,EXCEL和PPT因为RFM分析仅是项目的一个小部分分析,但也面临海量数据的处理能力,这一点对计算机的内存和硬盘容量都有要求。先说说对海量数据挖掘和数据处理的一点体会:(仅指个人电脑操作平台而言) 一般我们拿到的数据都是压缩格式的文本文件,需要解压缩,都在G字节以上存储单位,一般最好在外置电源移动硬盘存储;如果客户不告知,你大概是不知道有多少记录和字段的; Modeler挖掘软件默认安装一般都需要与C盘进行数据交换,至少需要100G空间预留,否则读取数据过程中将造成空间不足 海量数据处理要有耐心,等待30分钟以上运行出结果是常有的现象,特别是在进行抽

4、样、合并数据、数据重构、神经网络建模过程中,要有韧性,否则差一分钟中断就悲剧了,呵呵; 数据挖掘的准备阶段和数据预处理时间占整个项目的70%,我这里说如果是超大数据集可能时间要占到90%以上。一方面是处理费时,一方面可能就只能这台电脑处理,不能几台电脑同时操作; 多带来不同,这是我一直强调的体验。所以海量数据需要用到抽样技术,用来查看数据和预操作,记住:有时候即使样本数据正常,也可能全部数据有问题。建议数据分隔符采用“|”存储; 如何强调一个数据挖掘项目和挖掘工程师对行业的理解和业务的洞察都不为过,好的数据挖掘一定是市场导向的,当然也需要IT人员与市场人员有好的沟通机制; 数据挖掘会面临数据字

5、典和语义层含义理解,在MetaData元数据管理和理解上下功夫会事半功倍,否则等数据重构完成发现问题又要推倒重来,悲剧; 每次海量大数据挖掘工作时都是我上微博最多的时侯,它真的没我算的快,只好上微博等它,哈哈!传统RFM分析转换为电信业务RFM分析主要思考:模型R(近度)F濒度)M(f)客户最近一次啻户一定时期客户一定时期隹统的RFM模型购买距离分析内购买该企业内购买该企业点的时间产品的次散产品的忘金颔客户最后一次客户一定时期客户一定时期电信业RFM模型交费运离分析内交部的次数内的交骂总颔点的时间hitfj;/jh-ilihiiLlJuU-ihlblUuijLLLLIIfi这里的RFM模型和进

6、而细分客户仅是数据挖掘项目的一个小部分,假定我们拿到一个月的客户充值行为数据集(实际上有六个月的数据),我们们先用旧MModeler软件构建一个分析流:心峥曲M皿泣力叫其麻响数据结构完全满足RFM分析要求,一个月的数据就有3千万条交易记录!RFM模型的RFM汇总节点和雪Tbl*lfef«IC,KOrwc«)«1|l3fi>_血狗30402097记录ftRecELE-E-E11J.11_U-MLUE-PH-RcuLUIE二二FCEFFLLFFUI»-T-E*卓词51口51用铜51宗99立叟9|自自33即中?1=1£4£|8|靠31

7、Ei公凿立>12l»543M32Q1l-QMl10*0220il-M-ai1MQ9及通的溺川用flIgQ*这争现都孤zan-w-gi1睥9NGHmWQsr:w.ru4wnmt1NU1iwdt力中&WM95前11业4TIWO991拥1州KB201-Wt1XWto2119428D1UK-01IMOT2U17J?'13期-QM*1WQT22183SX史12011-flt-flT1MQ21mM!0llii1M0215117U29却“,睡不1MQ2292slkM231IMOE券;05门门2QTH-flf1WQ216E45B92加,睡中1HU2'J155M762D1

8、1-0-4T1X)021152602划IMO2155112292011-M-1T1»021QJJ*WR?m,眄由inno加11-特-4iTHiO?3豌虻77M的刘1"亦加IMO于1MT3HW自M11-01moTIMMMg1M09ftH#411M0并找*一讣4620M41iMd强21虻势第50於1,肥4iIMOX21&S1J10&mo21&:0750062D11-IHE-0tIMO312D1104-0132能建3M5”i»«03331Hgi”420吐o«4i咏RFM分析节点产生R(Recency)、F(Frequency)

9、、M(Monetary);.2的q£的O1川二一国中JiT#,lJMvlWOOQ,.w&"-'i-lIbu4-JI.n1取g世业用a1j10X3221I3H4JD3)3S99Q32ni£J«»51Td»GoceW,仲口口口口QRKKSt1。打U14&IB1JTOM72731t4jjHfi1?1g刚,2H-964&31B1Wq21(44130iiCOM典*D*4松117172-53164223722coOO以口TE遇长3a44J*£KX,1121«1U4K2Tni2000014”川E书

10、孙3融皿i7-50M1IT工ii5睹R华J1i1E46M1i73SKHJ2191M43JI5i21Xii地制r.enr,-UnritiarD而加.1帕叽2O1116.MTMfjjHfl'/二口1口口二riAlLiyj;Lr,U.ITLijTj接着我们采用RFM分析节点就完成了RFM模型基础数据重构和整理;http;/mb”曲口yiiuh5tlijxjj现在我们得到了RFM模型的Recency_Score、Frequency_Score、Monetary_Score和RFM_Score;这里对RFM得分进行了五等分切割,采用100、10、1加权得到RFM得分表明了125个RFM魔方块。传

11、统的RFM模型到此也就完成了,但125个细分市场太多啦无法针对性营销也需要识别客户特征和行为,有必要进一步细分客户群;另外:RFM模型其实仅仅是一种数据处理方法,采用数据重构技术同样可以完成,只是这里固化了RFM模块更简单直接,但我们可以采用RFM构建数据的方式不为RFM也可用该模块进行数据重构。Tableau软件进行描述性分析:(数据挖掘软件在描述我们可以将得到的数据导入到性和制表输出方面非常弱智,哈哈)PagesCoJumnsFrequencyScoreR.dw5REtrncyScore11MonettryScor<tFilterEFrequwcyScoreR«<mc

12、yScoreWonrtiryScore123<E1/695©3117249U.TOfl*琳95箫23891117.13779103*9931.8B73182123A&41.0aiti.13913MMarks-t'_Automatic”营*ietil_4®1342805615911J.a574J725福10725SOI16.97267286.863三171li:2539£S112W414,1417.63S1,S»Z964627B,162192J0O12M55T13BO64414IB?ITD.IM6S.722乐4494156124307

13、677.7375T6S18&5SColor*l-o-_LevelofDtuil5550921W74330s3r湖320433110D.28S66G3810751tt»i2.5E221319134068179aMM43910.S65319.41D7763151,095HVlS13.0744521224Q79861D6147,9456*265230214119黄第71572101.&Q14175.S75446339.57J765<04:22力19辨1釉13l,3fr6",盥9”小。3t2.660&gHS.&tl11£悚25.91T

14、4里蝮17.H5671,177lA2,0£i阴骷5152374K303&E8I,S782S0,BMS1<JB39243355.907S97B1W|21.1«*吕彝66,17310,08420JA23772631326G7WN.1212444142,02111587翟23cl10E.3Q116_3S05hi如ihmr短3口以耳如力J知二口hhewj我们也可以进行不同块的对比分析:均值分析、块类别分析等等PagesColumrisFrequencyScoreRawsR-ep5匚0倬,M<?r考匕rySweIFiltersFtetfusncyScoreRece

15、ncySc-MonetarySc.12345Markib匚Automatic*Te)i*aVfi(Mowt»Cobrf*'JG(gutk1Size(_1-CHLvlcfDqtdl|F1$二:5一7?4;$7nM3色亡.-J.i-T<j-a-i-23""i1.ggw:r.:匚二1二m?4J,1i=j,11.£t<5ICE1551:7:?3匚石荒102.09795,50121Mdr,fi-1-f.I£L由I-,一:企3:1,:一节':4:一反.二空i,Ei24£'&11,:入S:,S5439,7

16、04YGvou#e,4Esim31A4.:,JLd.I"一5t!:E32-1二*3",;76.6CT附31。上典3般侬41中"U二二口二口1-I7k3-IL-sI'".1工34_-二<4ma;37-51笠升叼四可飒降那551M/3.二月'一一1歹n1口2工二r14.一.士.5冠匚阳JihmuhauhiLJ:打1匕口.小:;11打叮好口这时候我们就可以看出Tableau可视化工具的方便性接下来,我们继续采用挖掘工具对R、F、M三个字段进行聚类分析,聚类分析主要采用:Kohonen、K-means和Two-step算法:4门力口口J口口I口Mg就丫1.CLirrj这时候我们要考虑是直接用R(Recency)、F(Frequency)、M(Monetary)三个变量还是要进行变换,因为R、F、M三个字段的测量尺度不同最好对三个变量进行标准化,例如:Z得分(实际情况可以选择线性插值法,比较法,对标法等标准化)!另外一个考虑:就是R、F、M三个指标的权重该如何考虑,在现实营销中这三个指标重要性显然不同!有资料研究表明:对RFM各变量的指标权重问题,Hughes,Arthur认为RFM在衡量-个问题上的权重是一致的,因而并没有给予不同的划分。而Stone,Bo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论