版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS利用RFM模型和聚类进行客户细分一、先介绍下什么是RFM模型客户数据库中有3个神奇的要素,这3个要素构成了数据分析最好的指标:最近一次消费(Recency)消费频率(Frequency)消费金额(Monetary)该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。二、再介绍下什么是K-MEANS聚类方法网上有很多解释,但我认为用自己的话描述出来是最好的,可能会不太严谨,但通俗易懂。我的理解是:一堆散点中,选出k个凝聚点,根据相应的计算方法进行欧氏距离计算和迭代,最后将散点分成k类,使 得各类间的相似度尽可能低,各类内的相似度尽可能高。懂原
2、理很重要,我会将自己之前写的一个例子来帮助理解这一算法,其实很简单的。三、展示并处理数据,共有5000+条数据ITi AJAcDEFGHIKL1用户码年份最近一次投资 时间年份总计投资总 金额总计投标最近一 次投资时间距20L&年7月20日累计投资月 数月均投资金 额月均投资254-920162016/6/2620162000032512000033)5-820162016/6/2620165000032515000034Bl-E20162016/6/192016108000432110800045D-A20162016/6/162016300003351300003634-B20162016
3、/6/272016100000324110000037D-S20162016/6/22201615000329115000389F-920162016/6/11201620000340120000393C-B20162016/6/282016160003231160003106E-820162016/6/12201615000239115000211J-A20162016/6/25201620000326120000312IB-820162016/6/29201615000322115000313lD-缺失值曲按列表排蹄个案$幽按对排除个案(E).魅续取满见助|确定后可以仔细看看出现的图表,千
4、万不要连图表都不会看就直接将结果复制粘贴了,这样很危险。不要做工具和模 型的奴隶。初始聚美中心嘴美1234567SLOG最近一次投责时间距 提数日天数1.94481.822.00.48.48.48179LOG月均投赏至额2.8S3.025.854.044.334.796.095.98LOG月均投资次敏-.01.24.06.601.57-.201.142.49这里SPSS选了这八组数作为初始凝聚点经过迭代后,形成了最终聚类中心,而这些聚类中心将会与其他除聚类中心以外的数据进行类间最小距离与类内最大 距离的比较计算如果数据与某个凝聚中心的距离小于类间最小距离,则两个数据就合并,取他们的重心作为新的
5、凝聚点,依次迭代下 去。晨签聚类中心聚笑1234567SLOG最近一次投资时间距 提数日天数1.66.901.681.70.681.18.691.52LOG月均投赏至额3.6S3.go4.684.224.454.605.105.30LOG月均投资次敏-.07.21.70.37.81.371.08.88这是方差分析表(ANOVA),这里的方差分析判断用于聚类的变量是否对于聚类结果有贡献,方差分析检验结果越显著 的变量,说明对聚类结果越有影响。对于不显著的变量,可以考虑从模型中剔除。这里我们可以看到P值真的很小很小, 所以可以判断有显著差异。ftNOVA聚类误差FSig.均方df均方dfLOG最近
6、一次投资时间距 提数日天数1 189.6541.0444967727235.21 4.000LOG月均投资金额1455.6881.05349B772742B.883.000LOG月均投资次数7467901.064496771 1 587.093.000f桐琦应假用于描述性目的,因rr送中的辨类将被用来最大化不同费笑中的案削间的差别源测到的 显著性水平并未据此进行更正,国毗无法将其睥释灯是对聚安均值相等这一麒设的检验把主要的几个表解释完了,现在可以返回到SPSS的数据表格中查看用户被分成了哪几类,我们可以看到:LOG最近一 次 投资时间距提LOG月均孑钧 资 金额LOG月均投 资QCL_111.
7、404.30421.40470631.515.03/上。341.544.48/.484E1.38.483E1.46/&.48411.60/颂.48481.3L/4.20.48491.594.13.304101.414.30.404111.344.18.484121.344.30.606131.454.30.484U1.464.48.486151.38430.6041&1.524 70.703V1.594.00.484181.344.30.4861A1 414 434SK可以把分类那一列复制到Excel里J IK | L | M | N |0| F1累计投资月 数月均投资金月均投资 也LOGH时
8、间段! 数日天数LOG月均LCX3月均 脸也细13000031.579784.477120.47 沙f411027341.929424.011702064107264060.698974.861180781515922966.66721.84514.36n/0.388181334033.335100.602064.591.014246520。0。21.5682401030.20412111300031.95904/M.113940.4771214427501L9M衰3.43933-0.1249136750011.799343.87506-0.079183683666.66751.255274.
9、922550.72699921310461.53821.255274.01960.2662687-1厂m c n n1 Licmfl rr r11r搞定后,就要开始对用户进行具体的分类了。首先,在根据八大类,对各项指标值进行计算,这里一定要熟悉使用countifs、sumifs等函数,反正不要小看excel的各种小技巧,如$这样的锁定键。778076716653941138886794投资月数577104074758113349112567656042123456ssn钢2SS03领4美016投资金额总额1454B63293982B&4368640331571186742投资金额占比10%23
10、%2%5%23%13%均值18.7042.944.317.2985.2827.49总额7608416275657994145800326427274655投资次数均值1021915S440单笔投资均值1.912.020.490.471.020.68投资人数总计r777976686653940638886794F投资人数占比16%15%13%19%8%14%月均投资金颔均值2.528.080.491.9712.913.33月均投资次教均值1414135月均单笔投资均值1.912.020.490.471.020.68最后-雀投资昱匪数日天数均值51.9942.3750.5249.144.666.3
11、0总计40451132503033613846247118105428071接下来,我们把八大类的R、F、M、投资金额占比、投资人数占比的数据再列出来,转置如下,做堆积图月均投簇额最言一铤日玷翘投资金领占比欧A数此,252132处99麴厂2%13%8.083,9941373%10%0491.0049.52激四5%19%1.974.1814翔J-10%16%12.9112.713.6613%14%/4.90530翘八22%5%0.992.09&8223%15%30.4012.2334.25耕U五23%8%44类别五类别二类别八类别六类别一类别四 类别七 类别三除此之外,我们还可以画出以月均投资金
12、额为X值,月均投资次数为Y值,以最后一笔投资距提数日天数为面积画出气泡图月坷投资次数均值14.0012.0010.00B.006.004.002.00.0.00 10.005.0010.0015.0020.0025.0030.00月均投资金额【均值】D0最后根据各项数值,来定义各类用户的类型,顺便做一下图表的美化。八类客户我们可以分成:重要价值客户重要唤回客户重要深耕客户重要挽留客户潜力客户新客户一般维持客户流失客户最好对活跃度、贡献度、覆盖度进行简单描述。覆盖度就是看注册时间和投资时间来比较TDP1:重要价值客户(类别8)重要价值客户活跃度每乓投婿频次1?次,驶活跃一月均投策3。万,单投资风
13、很高,时该产品丽思诚度及唁伫度极有, 是转洒既的高鞭桧资忠岐用户群、贡献度段的松窗人数篇献了 纳的业耀,是接兄而就人群14 ao12 .ao投竟贡献占此知*覆茧度控弱人敷白汕4-网1H年转化,占此:非、53%、45初有T劳是15年转化的用户统计J页投赍人数CA投赍乂.数占比投资金斯1万元】投资金锄占比习以出全笳1】月均投资炭数:,单笔投一孑瓮 t万元至】 赢后一次润买检令壬数玉】1O.UD l&.dO 花 00 月灼授蛭颠ICftl棱心宇段数值2473 319012 22K2- 49总结一下:RFM模型与K聚类相结合并不难,复杂的是对各类指标的理解和掌握。比如说我要怎么从那么多指标里 挑出合适的三个指标作为我的R、F、M ?对这些指标进行怎么样的处理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2020版 沪教版 高中音乐 必修1 音乐鉴赏 下篇《第五单元 声情戏韵》大单元整体教学设计2020课标
- 桶装水店员工合同
- 提前终止租赁合同模板
- 2025年南充道路运输货运考试题库
- 2025年阳泉货运从业资格证考试题库答案
- 《壁纸图集》课件
- 2025年烟台b2从业资格证模拟考试题目
- 2025年孝感道路货运从业资格证模拟考试
- 2025年池州考货运资格证考试内容
- 集团资金支付与收款风险控制
- 公积金调研报告3篇
- 英语口语 购物课件
- AGV智能小车循迹系统的建模与仿真
- 自动喷水灭火系统联动试验记录
- 设备机房出入登记表
- 车辆状况说明书(车辆信息表)
- 附录1职业倾向自我探索SDS汇总
- 六三制青岛版三年级科学上册第六单元《测量工具》全部课件(一共3课时)
- 腮裂囊肿的诊断及治疗介绍学习ppt
- 梅花易数教学用35张幻灯片
- 会计师事务所信息安全管理制度规定
评论
0/150
提交评论