RFM模型在销售数据分析中的应用(综述报告)_第1页
RFM模型在销售数据分析中的应用(综述报告)_第2页
RFM模型在销售数据分析中的应用(综述报告)_第3页
RFM模型在销售数据分析中的应用(综述报告)_第4页
RFM模型在销售数据分析中的应用(综述报告)_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、RFM模型在销售数据分析中的应用(以电气行业为例)本文作者:邓光耀摘要:本文以电气行业销響的数据分析为例,利用RFM模型对客户进行分类,提出了 R值、 F值、M值等三个指标的分类标准,及给出了确定RFM模型中客户在决策者心目中的排名 规则的具体办法,文中比较详细地介绍了确定指标排名规则的层次分析法,并综述了国内外 学者对RFM模型的研究情况。关键词:R (Recency): F (Frequency): M (Monetary):帕累托定律:层次分析法1> RFM模型相关背景知识介绍根据美国数据库营销研究所的Arthur Hughes 1994年的研究,客户数据库中有三个 神奇的要素,这

2、三个要素构成了数据分析AJ好的指标:报近一次消费(Recency):消 费频率(Frequency):消费金额(Monetary)目前国内外学者对RFM模型做了以卜研究:周颖等人利用了聚类分析的方法对 电信市场进行了 RFM模型的分析;陈伯成等人利用了神经网络方法对模拟数据进行 T RFM模型的分析。这些研究均没冇对RFM模型的分类标准进行探讨,另外只简单 地按照各指标是否大于平均值来对客户分类。己经有了的RFM分析将客户群分成觅要 保持客户、眾要发展客户、重要挽留客户、一般更要客户、一般客户、无价值客户等 六个类别,分类规则基本上按照各指标的分值是否人于平均值来分的,本来有2*2*2二8 种

3、,由于论文的作者根据聚类分析的结呆合并了两种客户类型,因此只有六个类别。 读者可以参考以下文献:林盛,肖旭.基于RFM的电信客户市场细分方法J哈尔滨工业 大学学报,2006, 5.以上分类不能达到监控客户交易异常行为,防止巫要客户流失的目的,因此本文提出 一种分类标准供人家参考,并利用层次分析法确定了 R、F、M等三个指标的权重, 从而给出合理的RFM指标的排名规则。本文另外利用实际数据研究了这三个指标的 相关性,并给出数据分析中要用到的excel函数表达式。2、分类标准的确定Spssl7.0以上版本提供了做RFM模型分析的模块,不过对各指标的分类标准却没冇公 布。本文根据公司销儕的实际数据,

4、以2011年1月到2011年3月为样本期,考察了 450 家客户与公司的交易情况。提出以下分类标准:确定R值指标的excel函数表达式为:=if(c3二datevalue( ” 2010-1-31 ”),1 , if(c3<=datevalue( " 2010-2-28 " ),2, if(c3<=datevalue ( M 2010-3-10 ”),3, if (c3<=datevalue( ” 2010-3-20 ”),4,5)。这里datevalue函数的作用是将口期转化为柑应的序列数,这样拖动填允柄,我们町 以快速右效地把各客户分类。确定F值指标、

5、M值指标的分类我们町以按照帕累托定律來做, 所谓帕累托定律是指公司80%的销竹额是由20%的觅点客户创造的。故我们将排名前5$的F 值或者M值定义为5, 5弔到15%之间的客户定义为4, 15%到30%的客户定义为3, 30%到50%的客 户定义为2, 50%到100%的定义为1,根据以上标准可得excel函数表达式如下:F 值:=IF(D3<3, 1, IF(D3<6, 2, IF(D3<10, 3, IF(D3<18, 4,5):Mffi: =IF(F3<7500, 1, IF(F3<25000, 2, IF(F3<lC0000, 3, IF(F3

6、<300000, 1, 5).作者联系方式:dgy203316根据公司的销倂数据的实际情况的变动町能会对分类的具体标准做些调整,但是短期内 可以保持这个标准不变,就是变动了分类的比例也可以保持不变。这样得到齐指标均大于等于3的客户(即排名表中的客户)大约为20%左右,这是因为 还有部分客户的这三个指标出现异常,因此不在排名表中,这些客户出现在异常值统计表中, 这些客户也是数据分析的車点研究对象,通过研究这些异常值我们町以达到提高交易次数、 发现重点客户交易异常行为的目的。3、排名规则的确定制作排名表是为了让决策者明白哪些客户是公司的贯要客户,另外我们町以从这些客户 在去年同期排名、上次排

7、名、本次排名的次序的变化将这些客户分为稳定型、上升型、卜降 型、摆动型四类客户,不同的客户群右不同的销仔对策。另外我们可以发现这三次排名表中 的人部分客户是相同的,部分客户会被挤出排名表,这些客户我们另外用客户排名异常值统 计表来统计,分析这些客户,我们可以发现哪些客户正在流失,从而达到防患于未然的冃的. 当然也有部分客户本次才出现在排名表中,这些客户的销書对策又有所不同。我们利用简单的排列组合知识知道各指标所组成的代码有5*5*5=125种,参与排名的代 码3*3*3=27种,要把27种代码所对应的客户做出排名,必须要制定一套规则,不然无法 排名。例如代码543的客户与代码344的客户谁的排

8、名高?虽然5+4+3=12, 3+4+4=11,12>11. 看起来代码543的客户应该比代码344的客户的排名高,但是由于在决策者的心中般看巫的 是M值指标,这样考虑起来代码344的客户的排名应该更高,这样就产生了矛盾。另外两家 代码均是555的客户谁的排名应该高些?这一点我们可以先比较交易额,交易额大的客户排 名更高,如果客户的交易额也相同,我们按最近交易口期来确定排名次序,如果还是相同的, 我们再看交易次数,看上次的排名情况等等来确定排名次序。实际上,我们一般情况I、只需 要比较交易额就可以确定排名次序。我们来解决代码543的客户与代码344的客户谁的排名高的问题,貝体办法是利用层

9、次 分析法。层次分析法町以将感性认识呈化,从而得到各指标的权审。卜面叙述这种方法:层次分析法(The analytic hierarchy process)简称AHP,在20世纪70年代中期由 美国运智学家托马斯塞蒂(T.L. Saaty)正式提出。它是一种定性和定量相结合的、系统 化、层次化的分析方法。由于它在处理复杂的决策问题上的实用性和有效性,很快在世界范 闌得到重视。它的应用已遍及经济计划和管理、能源玫策和分配、行为科学、军爭指挥、运 输、农业、教育、人才、医疗和环境等领域。层次分析法的基本步骤:1、建立层次结构模型。在深入分析实际问题的基础上,将有关的各个因素按照不同属 性自上而卜地

10、分解成若干层次,同一层的诸因素从属于上一层的因素或对上层冈素有影响, 同时又支配卜一层的因素或受到下层因素的作用。/上层为目标层,通常只有1个因索,瑕 下层通常为方案或对象层,中间可以有一个或几个层次,通常为准则或指标层。当准则过多 时(普如多于9个)应进一步分解出子准则层。2、构造成对比较阵。从层次结构模型的第2层开始,对于从属于(或影响)上一层每个 因索的同一层诸因素,用成对比较法和1一9比较尺度构造成对比较阵,直到瑕卜层。3、计算权向量并做一致性检验。对于每一个成对比较阵计算最人特征根及对应特征向 量,利用一致性指标、随机一致性指标和一致性比率做一致性检验。若检验通过,特征向最 (归一化

11、后)即为权向量:若不通过,需重新构造成对比较阵。4、计算组合权向量并做组合一致性检验。计算放下层对目标的组合权向量,并根据公 式做组合一致性检验,若检验通过,则可按照组介权向量表示的结果进fj决策,否则需要匝 新考虑模型或重新构造那些一致性比率较大的成对比枚阵。构造成对比较矩阵:比较第i个元素与第j个元素相对上一层某个因素的朿要性时,使用数帚:化的相对 权重來描述。设共有n个元素参与比较,则力=(atJ)nxn称为成对比较矩阵。成对比较矩阵中aj的取值可参考Satty的提议.按卜述标度进行赋值。也在1-9及 其倒数中间取值。= 1,元素i与元素j对上一层次因素的巫要性相同:aj = 3. 元素

12、i比元素j略重要;aij = 5,元素i比元素j重要:axj = 7,元素i比元素j 重要得多;axj = 9,元素i比元素j的极其重要;aXj = 2n, n=l, 2, 3,4,元素i与j_ 1的重要性介于a.j = 2n 一 1与a“ = 2n + 1之间: 切一仇,n=l, 2,. , 9,当且仅当 aji =1CLij > 0,0,; 1,a,; 一=no成对比较矩阵的特点:a可。(备注:当i二j时候,1)例如某决策者的评价矩阵A为:51 1 1395 91这里解释一下此矩阵所表示的总思,= 1表示r值指标与r值指标本身相比在决策者心目中同样重要, 兀 =3表示R值指标比F值指

13、标在决策者心目中略重要,"13 = 一表示M值指标比R值指标歪要,"32 = 9表示M值指标相对F值指标在决策者心目中极其觅要,此矩阵中的其他元素类似解释。在决策者心中M值指标最乘要,其次是 R值指标,由于运货需要成本,因此在决策者心中F值指标最不重要。从理论上分析得到:如果A是完全一致的成对比较矩阵,应该有但实际卜在构造成对比较矩阵时要求满足匕述众多等式是不町能的。因此退而要求成对 比较矩阵有一定的一致性,即可以允许成对比较矩阵存在一定程度的不一致性。由分析可知. 对完全一致的成对比较矩阵,其绝对值瑕人的特征值等于该矩阵的维数。对成对比较矩阵的一致性要求,转化为要求:的绝

14、对值最大的特征值和该矩阵的维数相差不大。检验成对比 较矩阵A 一致性的步骤如下:计算衡量一个成对比矩阵A (n>l阶方阵)不一致程度的指标CI:a =兀(0_刀7Z-1这里久 是矩阵A的最大特征值。另外矩阵的一致性标准RI如卜表: DUXn123456789RI000. 580. 901. 121. 211.321.411.45由于某决策者对应的矩阵为3阶方阵,故RI=3.矩阵A的随机-致性比率CR为:CR=CI/RIo当CR<0. 1时,则认为矩阵A具冇满意的一 致性,否则需要调整A中的元素使其貝有满意一致性。由于实际中求矩阵的特征值比较复杂,我们可以有根法与和法两种求近似值的方

15、法:和法:定义则u就是特征:1 A (如向量的近似值,Z =工为蚁人特征值的近似值。nuxn刊ui=(G)则 a?就是特征向量的近似值,Amax1 ”(力)=工为最人特征值的近似值。n J coi我们用两种办法计算矩阵A的近似最人特征值及特征向M:o和法I 特征向量 U二(0. 20, 0. 07, 0. 73), A =3.045。 max根法:特征向量co = (0.18,0.07,0.75),=3.029。我们计算两种方法对应的随机一致性比率,利法:CR二0. 039<0. 1,通过了一致性检验。根 法:CR二0.025<0.1,也可以通过致性检验,故按照和法的权重比例为(R

16、值权重:F值权 重:M值权重)=(0.20,0.07,0.73),根法的权重比例为(R值权重:F值权蔭:M值权 S)= (0. 18, 0. 07, 0. 75)两种方法有点细微的差异.我们分别用两种近似值计算代码对应的分值如卜表: 和法:指标代码555545535455415435355345335分值5. 004.934.864. 804.734.664. 604. 534.46指标代码554544534454444434354344334分值4. 274. 204. 134. 074.003. 933. 873. 803. 73指标代码55354353345344343335334333

17、3分值3. 543.473. 403. 343. 273. 203. 143. 073根法:指标代码555545535455445435355345335分值5. 004. 934. 864. 824. 754. 684. 614. 574. 50指标代码554544534454444434354344334分值4.254. 181. 114.074.003. 933. 893. 823. 75指标代码553543533453443433353343333分值3. 503. 433. 363. 323.253. 183. 143. 073可以从上表看出,实际上无论是按照和法还是根法,对各指标排

18、名是一样的。利用匕表(这里用根法,用和法也是同样的结果),我们解决代码543的客户与代码344 的客户谁的排名高的问题。代码543对应的分值为3.43,代码344对应的分值为3. 82,故代 码314的客户应当比代码543的客户排名高。在确定以上排名规则的过程中,我们町以利用power函数来计算开立方,mmult函数来 计算矩阵的乘积,sumproduct函数來计算各代码的分值,其体excel表达式比较简单,读 者可以看这些函数的帮助功能即可以写出正确的excel函数表达式,故不再赘述。另外不同 的决策考的评价矩阵町能会有所不同,读者町以按照层次分析法甫新确定排名次序。4、各指标的相关性及排名

19、表中各代码的概率分布情况在计算各指标的相关性Z前,我们先计算样本口期数据与2010-12-31 口 Z间的差距, 由于日期在一个“cel单元格里,我们用mid函数来计算口期差,假设某客户的最后交易日 期为2011-3-31 II,他在C3单元格里,我们可以把2010-12-31放在D3单元格里,那么利 用excel函数计算的表达式为:=mid(c3, 1, 15)-mid($d$3, 1, 15),这里$d$3表示用的是绝 对坐标,这样我们町以快速有效地计算出口期差距。我们再分别计算口期差距、交易次数、 交易金额之间的相关系数,这一步可以利用correl函数计算。经计算可得原始的数据中交 易次

20、数与交易金额之间的相关性最大,考察的样本中这个相关系数为0.74,离散化后(指 分类之后)的相关系数达0.81,证明F值与M值是高度相关的,这一定程度上缓解了根据 上面的评价矩阵得到的F值指标的权重比较低的缺点。另外还町以得到离散化后的相关系数 会比原始数据的相关系数更高一些,R值与F值的相关系数0.50R值与M值的相关系数为 0.44。另外读者也町以考虑一卜偏相关系数,以及数据标准化后各指标的相关系数。这些均町 以通过spss软件计算得到。例如固定M值,得到R值与F值的偏相关系数为0.27,耒固定 M值时它们之间的相关系数为0.50。偏相关系数的概念,与回归分析比较密切,这里不介绍 它的定义。考察排名表屮的各代码的分布情况我们町以得到555, 544, 534, 543, 533等出现的概率 比较大,有些代码如335, 553, 334等没有出现过。5、各类指标代码的直观分类

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论