版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
客户价值分析
RFM模型构建报告数据应用部2018年07月01业务背景和建模目的02数据准备和数据清洗03建立模型和效果评估04问题总结和未来展望目录CONTENTS业务背景当前经济环境下,生猪价格持续低位徘徊,养殖业亏损现象普遍,屠宰行业利润大幅下滑;我司作为大型屠宰加工企业,利润同比去年下滑超50%(个人保守估计),企业该如何度过生猪价格寒冬?控制企业成本势在必行。
营销成本作为企业成本的重要一环,当前我司的营销政策存在“一刀切”、涵盖面广、针对性不强等弊端,为避免当前这种情况,我们需对公司现有客户的价值属性进行类别划分,针对不同群体的客户制定差异化的营销策略,提高营销成本的效果转化率,从而达到控制成本的目的。客户划分全量客户客户群A客户群B……..……..客户价值不同群体营销策略A营销策略B……..不同营销策略建模目的截止目前关于用户价值划分的方法有许多种,其中RFM模型是被广泛因其良好的价值区分性能而被广泛应用,RFM模型是指考虑以下三个客户行为特征:利用这三个特征进行聚类从而将客户划分为不同的类别。考虑到客户提货趋势变化、合作时长等因素均会对客户价值产生影响后,我们决定增加客户提货趋势变化指标和客户建档时长指标放入RFM模型。
我们最终的目的是通过这5个字段建立聚类模型从而将客户进行价值划分。R(Recency)最近一次提货F(Frequency)提货频率M(Monetary)提货金额T(Trend)提货趋势L(Length)建档时长
RFM模型01业务背景和建模目的02数据准备和数据清洗03建立模型和效果评估04问题总结和未来展望目录CONTENTS数据准备数据来源来源表表释义取数字段字段释义表用途XYAPP.ST_SALE_X_DETAIL_DAY销售明细表SOLD_TO_PARTY_CODE||ST_DATE||SALE_AMT送达方编码||日期||销售额汇总取数XYAPP.ST_CUST_STATE_INFO新增客户信息表CUSTOMER_ID||CREATE_DATE客户编码||建档时间剔除在统计口径内的新增用户统计口径考虑到数据完整性及时效性,我们选取2018.01-2018.06共计6个月数据作为历史样本数据的统计口径。数据提取字段提取代码见附件一:附件一Tips:趋势指标:二季度销售额比例-一季度销售额比例建档时长:统计截止日期(20180630)–建档日期数据清洗数据汇总处理缺失值处理异常值处理数据变换月销量缺失情况以0替换1月销量为负值的记录以0替换;计算频次时剔除销售额负值记录销售额跨度过大,取对数处理1243将5个特征字段利用用户编码汇总数据清洗过程建模宽表因数据量不大,在excel完成数据清洗过程,最终得到建模所需数据宽表(共2501条样本记录)。01业务背景和建模目的02数据准备和数据清洗03建立模型和效果评估04问题总结和未来展望目录CONTENTS模型建立(一)
RFM模型聚类算法采用的是K-means算法,K-means算法是一种最为常见的聚类算法。K-means算法流程1.确定聚类数m2.随机选取m个初始聚类中心3.计算各样本到各聚类中心距离,将样本划分为距离最近的类4.计算新类的聚类中心(质心)5.对比初始聚类中心是否收敛否结束是模型构建将建模宽表数据读入spssmoleder,选取K-means模型,选取五个特征变量作为输入变量,聚类参数默认数为5,最大迭代次数默认为20,建立聚类模型。模型建立(二)初步建模效果评估聚类模型效果的评估我们主要看轮廓系数和迭代次数两个指标,初次建模的轮廓系数约为0.45,迭代至20次仍未收敛。对于聚类模型而言,轮廓系数越接近1说明模型效果越好,迭代收敛的速度越快说明聚类结果更为可信。轮廓系数:1、将样本i与簇内的其他点之间的平均距离作为簇内的内聚度a(i);2、将样本i与最近簇中所有点之间的平均距离看作是与最近簇的分离度b(i);3、样本i的轮廓系数s(i)计算公式:4、取全部样本点的轮廓系数取均值作为聚类模型的轮廓系数;下
模型建立(三)模型优化因我们采用了默认的聚类数5和全部五个特征作为输入变量,可以通过选取不同的聚类数(3-7较为合适)和不同的特征变量组合来优化模型。
通过上述优化方法最终我们剔除了5个输入变量中的《建档时长》变量,选取聚类参数4作为最终的模型结果(轮廓系数0.62,迭代12次收敛)。模型效果较好,聚类目的基本达成。效果评估(一)数据聚类结果聚类中心分布聚类-1聚类-2聚类-3聚类-4趋势指标-0.13-0.990.82-0.36提货天数136.557.211.3133.68提货间隔2.37133.4826.1123.15销售额6.044.184.635.2主力优质型风险流失型潜力增长型普通稳定型效果评估(二)口径外效果追踪按照历史数据(日期口径为2018.01-208.06)划分的四个类别,我们另外提取了7月份(截止当前19号)销量数据与历史口径数据做对比结果如下:主力优质型潜力增长型风险流失型普通稳定型各类别策略建议现有客户市场政策维稳,营销资源适当倾斜,占有率为考核导向适用扩张型政策,营销资源重点倾斜,增长率为考核导向定位流失原因,尽量维持,流失率为考核导向小程度扩张政策,营销资源均衡为主,依次以增长率、占有率为考核导向01业务背景和建模目的02数据准备和数据清洗03建立模型和效果评估04问题总结和未来展望目录CONTENTS问题总结数据口径问题未能覆盖18年新增及未提货客户客户退货行为难以追溯提货日期销售明细表仅提取了送达方用户,未覆盖以批发为主(售达方)客户趋势指标未消除季节因素影响算法缺陷问题K均值聚类需事先指定聚类数目,虽然我们尝试了几个不同的类别数目,但聚类数目选取仍存在主观性K均值聚类对异常点较为敏感,异常值严重模型效果,我们本次建模异常值处理较为粗糙效果评估问题对非监督模型效果的评估一直都是机器学习难点,后期评估仍主要取决于业务人员的反馈信息现有口径内外销售额占比对比图因7月天数较少,参考性有限未来展望模型定期优化升级由于数据特征会随着时间的发展发生变化,且建模样本数据会随着时间变化偏离真实数据越来越远,客户类别也会不断在各类别间迁移,我们可以定期(1个月/3个月/半年)输出模型销售额占比对比
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省青岛市即墨区2023-2024学年八年级上学期期末英语试题(原卷版)-A4
- 黄金卷04(新课标卷)(新疆、西藏专用)(解析版)-A4
- 2023年新型高效饲料及添加剂项目融资计划书
- 2023年硝酸钾项目筹资方案
- 网店美工试题及答案
- 养老院老人心理咨询师管理制度
- 养老院老人康复护理制度
- 《spc学习资料》课件
- 在实验中寻找规律课件
- 房屋验收服务合同(2篇)
- 2025年重庆货运从业资格证考试题及答案详解
- 生命不是游戏拒绝死亡挑战主题班会
- 新教科版小学1-6年级科学需做实验目录
- 拒绝躺平 停止摆烂-学生心理健康主题班会(课件)
- 现代教育技术智慧树知到期末考试答案章节答案2024年济宁学院
- 现代通信技术导论智慧树知到期末考试答案章节答案2024年北京科技大学
- 印刷服务投标方案(技术方案)
- 医疗器械软件设计和开发-全套开发资料模板范本汇编
- 《计算机学报》论文模版下载
- TPO26听力题目及答案
- 出国劳务合同范本仅供参考
评论
0/150
提交评论