下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多准则客观聚类在客户价值细分中的研究赵珩君/贺昌政CCZhao Heng-jun He Chang-zheng(School of Business, Sichuan University, Chengdu 610064)【论文分类】市场营销(理论版) F513 【学刊期数】2009年12期 【论文期刊来源】管理评论(京)2009年8期第5256页 【英文标题】A Study on the Role of Multi-criteria Objective Cluster in Value-driver Customer Segmentation 【作者简介】赵珩君,贺昌政,四川大学工商管理学院
2、,成都610064 赵珩君,四川大学工商管理学院博士研究生;贺昌政,四川大学工商管理学院教授,博士生导师。 【内容提要】 聚类在商业研究中广泛应用于对未知特征的客户群进行价值细分。分析了传统细分方法对于细分客户初始条件敏感的弱点,多准则客观聚类方法不需要借助领域专家的知识,能够自动、客观地确定聚类个数及最优聚类方案。本文采用多准则客观聚类方法进行客户价值细分。提出新一致性准则体系及算法的实施步骤,并将其应用于客户价值细分中。通过实证对比研究,结果表明新算法具有无需预先指定聚类数、抗干扰性强的特点,使得细分结果更加准确。 Clustering is widely used in customer
3、 value segmentation in business researches. This paper points out the shortcomings typical of traditional techniques and presents multi-criteria objective clustering analysis, a new method for value-driven customer segmentation, which compared with other clustering methods, can determine the number
4、of clusters and find out the optimal clustering scheme in an automatic and objective way independent of specific expertise. The new criterion is followed and be used in segmentation. The results indicate that MEC-OCA may be more useful for customer segmentation because it provides more homogeneous s
5、egmentation solutions than the other clustering algorithm, and is without initial category numbers and noise resistance. The advantage of the new ones is proved through theoretical analysis and demonstration. 【关 键 词】多准则/客观聚类/一致性准则/价值细分multi-criteria/objective clustering analysis/consistency criterio
6、n/value-driven segmentation引言 客户价值细分是客户关系经济学的基本原则之一。有效的细分是企业实现CRM的先决条件之一。国内外学者在细分问题上已做了深入研究,并取得了一定的成果1,2。 传统的价值细分方法仅按照客户过去或现在对企业的利润水平细分客户,如依据帕雷托曲线,将客户分为A、B、C三类3。这种细分方法虽然简单易行,但将客户的潜在价值及其对企业的盈利性排除在外4。另外应用公式计算法进行客户价值细分时,首先要依据一组与客户价值相关的客户行为变量以及用变量计算客户价值的公式,如Hogan JE, Gupta, Rust5等提出的客户价值计算公式,这些模型的缺点是没有给
7、出导出模型参数和所需数据的方法6,并且计算方法中的基本假设在企业的实际运作中难于实现7,8。 聚类分析技术是将数据区分为自然的群体,并给出每个群体特征描述的一种数据挖掘和知识发现的基本方法。在商业研究中广泛应用于对未知特征的客户群进行价值细分9,按照不同特征将客户分群,从而提供差异化服务或产品。常用的聚类算法主要有K-means算法,层次法和神经网络聚类法(SOM)等。这些方法虽各有特点,但存在不足,即需要事先确定类数或是通过一定的指标确定最优的类数10。例如K-means聚类要求预先给定要构建的划分数目;层次聚类要求建模人员根据对系统的先验知识从得到的谱系图中选一个距离水平来确定类数;建立S
8、OM结构必须预先指定聚类的数目。主观确定细分类数会使细分数目过少或过多,这两种情况都使细分失去应有的效果。 本文针对以上问题,提出一种进行客户价值细分的新途径基于自组织数据挖掘的多准则聚类分析(MECOCA),并在标准数据库上,通过对多准则聚类算法准则进行实证对比研究,证明该途径在解决客户价值细分时的有效性。 多准则聚类算法 客户需求是决定企业产品和服务的重要因素,而个人需求又往往受以下因素影响,如性别、家庭组成、社会地位、受教育程度、收入、居住地域等。通常,企业的客户数据库不仅包含了客户的人口统计信息,还记录了客户的购买行为模式数据,如购买时间、购买频率及消费总额等。有研究表明11,利用客户
9、的购买历史数据能够更好的预测其购买潜力以及对企业的潜在价值。本文建立的指标系统增强了客户细分模型的可操作性,指标体系如表1。同时,我们发现:传统聚类分析无法客观地确定聚类的最优个数以及变量的组成。特别是在对复杂不确定对象进行研究时12,一组数据样本可能具有众多的变量,一旦它们中某些变量具有多重共线性,就会造成信息重叠,以致产生过拟合,片面强调某些变量的重要性,从而影响到最优聚类的产生13。其根本原因在于,上述方法只采用单一的内准则来形成类14。Ivakhnenko将GMDH理论的核心概念与原理应用于聚类,形成一种新的聚类方法客观聚类分析法(Objective Cluster Analysis)
10、(简称OCA)。与OCA算法相似,MECOCA算法运用多准则,构成筛选最优聚类的外准则体系:第一类准则(内准则)用于产生类,第二类准则(外准则)用于寻找类的最优个数及变量组成。在待选模型进行自组织时,建模者与计算机之间用准则语言进行对话,外准则(体系)体现了建模者对系统先验知识的认识及建模的不同要求和目的15。同时,基于自组织数据挖掘理论的MECOCA算法可以根据给定的外准则不断检测从待选模型集中选择出的模型16,对于有噪声的小数据样本,外准则的最小值标示一个只有通过自组织建模才能得到的非物理模型,该物理模型表示出类的最优个数及变量组成。MECOCA算法基本步骤如下: 1、计算样本间最近距离,
11、构成距离矩阵MECOCA算法的目标是寻找最优聚类,使它对于某个噪声水平是最优的和一致的。数据的噪声水平越高,由MECOCA得到的最优聚类就越简单(即类的个数越少)。这与参数GMDH算法的基本结论是十分相似的。算法的客观性主要是通过以归纳的方式寻找最优的聚类而给出的17。 算例对比分析 聚类精度是通常用来衡量聚类算法优劣而采用的指标之一,为验证提出的MECOCA算法在新一致性准则体系下聚类的优劣,实验中我们比较了MECOCA算法与OCA、Kmeans、层次聚类法BIRCH、神经网络聚类法SOM在9个UCI数据集18上的聚类精度。通过对比分析在不同数据集的环境下的聚类精度,检验本章所提出的MECO
12、CA算法的优劣。聚类精度是指正确分类数与该类总数的比值,聚类精度(ACC)表示为:实验中采用10层交叉验证方法19(CV10),将数据样本分为训练集和检验集,每次从训练样本中随机取出一部分数据进行模型的结构学习,在检验集上进行聚类结果的验证。用聚类准确率测度进行聚类结果的评价。 鉴于数据之间量纲和数量级不同,需要对数据进行无量纲归一化处理,公式如下:标准化处理后的数据样本仍记为X。 全部实验通过MATLAB和C程序实现。 数据集中变量数目最小为4个,最大为20个,变量中有定性数据,也有定量数据,其中SGCD和ZOO数据集既有定性数据也有定量数据。数据集的基本情况见表2,聚类精度结果如表3所示。
13、从表3可以看出,在9个实验数据集上,MECOCA算法的最小聚类精度为76.17,最大为98.20,平均值为90.36,聚类的总体性能令人满意。表中加粗的黑体字表示该数据集上的最高聚类精度。具体来看,MECOCA算法在4个数据集上具有最高聚类精度,OCA与SOM仅在2个数据集上具有最高聚类精度,而Kmeans在1个数据集上具有最高聚类精度。从表3中横向来看,MECOCA算法在6个数据集上的聚类精度优于OCA算法和SOM神经网络聚类算法,原因可能在于算法是基于神经网络的,所以这三种算法的聚类精度较为接近。MECOCA在8个数据集上优于Kmeans算法,而在7个数据上的聚类精度比BIRCH算法高。对
14、比这些算法在9个数据集上的聚类精度均值,MECOCA算法的精度平均值(90.36)明显高于其他几种算法。 另外,OCA和SOM算法的聚类精度均值较为接近,相差仅为0.8。比较几种算法在9个数据集上的聚类精度的标准差,MECOCA算法的聚类精度稳定性优于其他几种算法,其标准差为6.85。由于聚类精度越高,其算法的聚类准确度越高;而在多数据集上的聚类均值标准差越小,说明算法越稳定。因此,通过表3的数据对比,MECOCA算法在聚类性能上优于OCA、SOM、BIRCH、Kmeans几种算法。值得注意的是,虽然SOM算法与OCA算法的聚类精度较为接近,但OCA算法与MECOCA相似,都能给出比SOM算法
15、建模解释性更明确的系统模型,且在建模过程中能综合运用数据样本和先验知识所提供的信息,而神经网络算法不能直接利用它们,必须经过适当的变换,将其转换为可用的网络结构和阈值函数,而用于这一转换的较为成熟的方法还有待进一步研究,这是基于自组织数据挖掘的聚类方法区别于神经网络聚类法的一个重要特征。 结论 MECOCA聚类方法能够自动、客观地确定聚类个数及最优聚类方案。本文基于外补充原理和偶极子提出的新一致性准则及新算法的实施步骤,进行客户价值细分。通过算例研究,证实了新的一致性补充准则扩大了客观聚类方法的适用范围,具有更强的筛选能力,找出最优聚类。通过算例对比,证明该算法克服了传统客户价值细分对细分需预
16、先指定聚类数的弱点,使得细分结果更准确。 收稿日期:20081010 【参考文献】 1刘英姿,吴昊客户细分方法研究综述J.管理工程学报,2006(1):5357 2V. Kumar, Katherine N. Lemon, A. Parasuraman. Managing Customers for Value: An Overview and Research AgendaJ. Journal of Service Research, 2006(9):87-94 3V. Kumar, Katherin N. Lemon, A. Parasuraman. Managing customers
17、for valueJ. Journal of Service Research, 2006,9(2):82-90 4齐佳音,韩新民,李怀祖一种新的客户企业价值评价体系的设计J.管理工程学报,2002,16(4):48 5Gupta S, Lehmann D, Stuart J. Valuing CustomersZ. New York: working paper, Columbia University, 2002 6Etzion O, Fisher A. E-CLV: A modeling approach for customer lifetime evaluation in e-com
18、merce domains, with an application and case study for online auctionsC. Proceeding of the 2004 IEEE International Conference on e-Technology, e-Commerce and e-Service, 2004:1-8 7白长虹西方的顾客价值研究及其实践启示J.南开管理评论,2001,4(2):5155 8菲利普科特勒,凯文莱恩凯勒营销管理(第12版)M.梅清豪译上海:上海人民出版社,2006 9赵晓煜,康锦江基于客户价值的客户聚类及特征分析方法C.中国市场学会
19、2006年年会暨第四次全国会员代表大会论文集,2006:26792684 10Krycha, Wagner. Applications of artificial neural networks in management science: A surveyJ. Journal of Retailing and Consumer Services, 1999(6):185-203 11权明富,齐佳音,舒华英客户价值评价指标体系设计J.南开管理评论,2004,7(3):1723 12贺昌政,吕建平自组织数据挖掘理论与经济系统的复杂性研究J.系统工程理论与实践,2001,21(12):15 13杨本昭,田耕基于人工神经网络的客户价值分类研究J.科技管理研究,2007(12):168170 14Ivakhnenko. A. G., Mueller, J.-A. Parametric and nonparametric selection procedures in experimental systems analysisJ. SAMS, 1992, 9(5): 157-175 15贺昌政,张九龙,林嫔数据分组处理方法聚类
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 订票合同范本
- 音乐社团演出活动方案计划
- 2024年度德佑房产租赁合同鉴定条件
- 2024版废塑料再生利用合作协议2篇
- 2024年度汽车零部件生产销售合同2篇
- 二零二四年度股权转让合同标的:股东权益与股权交接
- 珠宝销售协议书珠宝店合作协议模板
- 二零二四年LED广告屏购销安装合同
- 北京市2024年度离婚后财产监管协议
- 二零二四年度供应链金融服务合同标的:供应链融资需求与金融服务2篇
- 《地方执法评估体系研究》
- 2024-2030年中国it服务管理(itsm)行业发展规划及投资模式分析报告
- 2024年高考真题-化学(天津卷) 含解析
- 技术合作协议技术引进
- 2024年专用:滑坡防治抗滑桩施工合同
- 发动机的可维修性与维护性分析考核试卷
- 北京邮电大学《计算机网络》2022-2023学年期末试卷
- 二十届三中全会精神学习题库及答案
- 2024年福建福州市仓山区民政局招聘5人历年高频难、易错点500题模拟试题附带答案详解
- 裕华煤矿安全文化建设实施方案
- 历史西汉建立和“文景之治”课件 2024-2025学年统编版七年级历史上册
评论
0/150
提交评论