商务智能应用CRM_第1页
商务智能应用CRM_第2页
商务智能应用CRM_第3页
商务智能应用CRM_第4页
商务智能应用CRM_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章商务智能运用

--分析型CRM企业在扩展市场、提高效率和坚持客户的原始商业驱动力不变的情况下,如何继续坚持竞争的优势。有远见的公司都会认识到,只需将本人建成可以对客户作出迅速反响的公司才干获得诸多收获,这些收获包括收入、新客户、客户称心度、客户回头率以及公司效益的添加,从而使竞争力大为提升。本章内容:CRM概述CRM与商务智能客户行为分析客户分类案例分析CRM概述建立客户关系管理〔CRM〕系统的目的是赋予企业更完善的与客户交流的才干,即从潜在客户识别、生成有需求的客户,到销售结束以及不断进展的效力和支持,提供全过程的自动化处置和更好的协调与协作,以提高客户称心度和客户忠实度,添加市场时机和销售利润,为企业开展效力。操作型CRM的设计目的是为了让业务人员在日常的任务中可以共享客户资源,减少信息流动滞留点。经过市场营销、销售和效力等业务流程的管理,将客户的各种信息搜集并整合在一同,再将这些运营数据和外来的市场数据经过整合和变换,装载进DW。协作型CRM就是可以让企业客户效力人员同客户一同完成某项活动。协作型运用目前主要由呼叫中心、客户多渠道联络中心、协助台以及自助效力协助导航,向客户解释特定内容的网页等。

分析型CRM现实上是以改善业务管理为目的的分析活动,主要是分析现有的历史数据或者操作型CRM中获得的各种数据,进而为企业的运营、决策提供可靠的量化的根据。在一家银行的信誉卡客户中,能够有80%的人几乎不用信誉卡买卖,有10%的客户偶尔用卡买卖,剩下10%的客户会频繁用卡买卖,而这一部分客户能够为银行信誉卡部带来80%的收入,所以这10%自然是最有价值的客户。利用分析型CRM系统对客户进展细分,就可以针对有价值的客户开展特别的促销活动、提供更个性化的效力,这无疑将使企业以最小的投入获得最大的报答。商务智能与CRM假设说操作型与协作型CRM是企业的臂膀,那么分析型CRM就是企业的大脑。数据整合――提供客户全景视图利用数据仓库技术,可以将散落在各个业务数据库中的客户信息经过ETL(抽取、转换、加载)过程,清洗、转化、衔接、概括、集成为一致的分析数据;同时,数据仓库强大的数据存储及管理才干可以对海量客户数据有效的存储、索引、归类。信息提交过程企业信息系统最终的关注点在于信息的传送,实现从数据到信息的深层次转化。(1)OLAP的多维立方体模型为用户提供多维的分析视图,经过钻取、旋转、切片(块)等操作,使得用户可以随心所欲地对客户数据进展多维分析,获取关于客户的细分市场、购买方式、盈利才干等重要信息。(2)经过简单易用的工具使得终端用户可以自在的按照本人的意图来支配数据,从而为本人的业务问题提供信息支持。(3)利用企业信息门户战略可以根据不同的用户定制信息界面,从而保证信息在适当的时间、经过适当的手段、传送到适当的人手中。客户知识的深化发掘(1)根据从客户知识开掘的信息,计算客户生命周期价值,以此作为客户分类的根据。针对不同类别的客户采取不同的措施;(2)预测客户未来一段时期的需求;(3)预测客户流失的能够性,或者采取及时的补救措施,或者做出减少不用要的投资等决策,最大限制地保管客户和降低企业的损失;(4)测评客户忠实度,识别忠实客户。客户知识的展现经过商务智能技术所获得的客户知识(特征、忠实度、盈利才干、行为方式)必需经过操作和协作型CRM系统才干最终实现为客户提供更好效力的目的,从而构成业务行动的闭环,真正发扬CRM的各层次的综合效应。客户智能系统构造图构建一个完好的智能CRM系统的几个步骤:1.整合客户信息资源对于那些以前没有运用过任何CRM系统的企业来说,首先需求把孤立的业务系统整合到一个一致的平台之下,处理“信息孤岛〞。而对于己有CRM系统的企业,那么需求建立一个企业信息门户,使客户和企业能在一个一致的界面下进展数据和信息交换,从而保证客户数据的一致性。2.建立客户数据仓库规划数据仓库,以企业的业务模型为根底,确定需求建立可以描画主要业务主题的数据模型;设计数据仓库,根据逻辑模型和性能要求进展物理模型的设计,制定数据存储战略以及各种商业规那么等;

(3)构造数据分析模型根据企业需求分析的对象和目的,构造有针对性的分析模型。针对客户对企业的奉献差别,构造客户盈利才干分析模型;针对客户对企业信誉程度的不同,构造客户信誉分析模型;根据客户对产品功能的需求不同,构造客户分类分析模型;根据客户的获得、流失情况,构造客户获取流失分析模型等等。(4)建立客户知识管理系统建立一个动态的客户知识库以及制定客户知识的分发规那么和保管机制。与客户数据仓库一样,客户知识管理系统也不是一开场就能建立好的,它需求在运用的过程中进展不断地调整和完善,是一个动态完成的系统。客户行为分析(获取新客户、客户流失与坚持分析、客户盈利才干分析)获取新客户获取新客户就是“压服〞本来不是他的客户的消费者成为他的客户。这些消费者能够是对他的产品/效力不了解的顾客,也能够是他的产品/效力的潜在消费者,还能够是他竞争对手的客户。针对这些不同的消费者需求采用不同的战略才干有效的获取到新客户。另外,在获取新客户之前,不得不确定哪些消费者是值得努力的,预测不同客户对营销努力的反映情况也是提高获取新客户胜利率的一个前提。还有,客户分优劣,有些客户获得时付出的努力要比他们成为公司客户后奉献的利润低,这样的客户还是不获得为好。因此,企业要想经过CRM有效获得新客户,必需明确不同客户的特性。目的市场在哪里?哪些客户是企业的潜在客户?哪些潜在客户是优质客户?客户获取的难易程度如何?常用的数据发掘技术和方法有分类与预测、聚类、关联分析和异类分析等。例如用关联的方法,经过发现诸如“在购买A商品后,一段时间里顾客会接着购买商品B,而后购买商品C〞这样的知识,来构成“A-B--C〞客户行为方式。还可以对现有客户特征进展聚类分析,建立客户特征模型,以最有效地预测目的市场和发现潜在客户。

K-近邻分类方法根本思想:K-近邻分类是基于类比学习的,每个样本代表d维空间的一个点。当给定一个未知样本时,K-近邻分类法将搜索样本空间,找出最接近未知样本的K个训练样本,这K个训练样本是未知样本的K个“近邻〞。近邻性普通用欧几里德间隔定义:或采用绝对值间隔:缺陷:计算量大优点:适宜各种数据类型的数据

利用K-近邻方法进展潜在客户预测调查的客户本身属性:企业总资产值、年销售收入、距电器销售公司的地理间隔及企业所处地域的经济兴隆程度。客户的消费属性为过去一年内对电器销售公司的总购买额。1.数据处置:销售公司把客户的消费属性分为10万元以下、10万至100万、100万500万、500万以上四个区间,分别取值1,2,3,4;把企业所处地域的经济兴隆程度根据实践情况分为贫困、欠兴隆、兴隆、极兴隆四档,分别取值1,2,3,4;其他客户属性(企业总资产值、年销售收入、距销售公司的地理间隔)也经过区间划分完成量化及归一化处置。表1是经过规范化处置的老客户数据,表2是经过规范化处置的潜在客户数据。表1老客户数据老客户总资产年销售收入地理距离所处发达程度年总购买额11.51.61.20.4221.53.21.20.63310.80.40.2141.53.20.40.84511.60.40.4260.51.60.40.42………………………………表2潜在客户数据潜在客户总资产年销售收入地理距离所处发达程度年总购买额A1.51.61.20.4待预测B0.81.20.40.2待预测………………………………2.预测为了预测客户A对公司电器产品的年购买额,我们只须从处置后的老客户数据中找到K个最近邻(这里设定K=2)。例如:A与客户1的间隔:D(A,l)=(1.5-1)+(2.4-1.6)+(1.6-1.2)+(0.4-0.4)=1.7,同理计算可得到:D(A,2)=1.9,D(A,3)=3,D(A,4)=2.9,D(A,5)=1.6,D(A,6)=2.5可以看出,A的2个最近邻为老客户1和5,可以预测其对公司电器产品的年购买额将在10万和100万之间,我们还可以从处置之前的老客户数据库中得到客户1和5的实践年购买额,以对A的年购买额进展更准确的估计,假设销售公司规定年总购买额在500万以上的是公司的重点客户,那么我们可以进一步预测潜在客户的类别,从而可以指定准确的营销方案,来获取客户。将数据发掘运用于客户的获取活动与传统的市场营销战略比较其优势在哪里?下面我们经过一个例子进展详细的阐明。某大银行A进展直邮的市场营销活动以获取信誉卡客户,向100万名潜在客户提供信誉卡的恳求表。运用传统的做法,A银行向这100万名潜在客户寄出信誉卡恳求表,共有6%的邮件得到恳求回应。得到这些潜在客户的回应后,需根据信誉风险程度对它们的恳求进展挑选,毫无疑问,往往是信誉差的潜在客户更能够恳求信誉卡,所以最终挑选后的结果只需16%的回应者是符合信誉要求的,即大约占总潜在客户的1%(6%×16%≈1%)成为最终客户。A银行邮寄一份恳求表需破费¥1的费用,每个客户在随后的两年将为银行带来¥125的利润。那么用传统方法营销得到的净报答:¥250,000(¥125×10,000-¥1×1,000,000=Y250,000)数据发掘技术的运用首先,A银行寄出50,000份进展测试,并对反响的结果进展分析,将这些数据作为训练数据运用数据发掘算法建立预测模型,包括潜在客户的回应的模型(可以用决策树方法)和信誉评分模型(可以用神经网络方法)。然后,结合这两个模型找出哪些潜在客户的信誉风险低且很大能够会接受提供的恳求表。根据这些方法,A银行在剩下的950,000个潜在客户中选取其中信誉好的700,000个进展邮寄。结果是,经过这邮寄的750,000份恳求表,共收到9,000个潜在客户接受信誉卡,即接受的比率为1.2%(9,000÷750,000=1.2%),比传统方法的1%提高了20个百分点。还有1,000个客户在未寄的250,000个潜在客户中,他们是被模型挑选掉的,很明显,假设对他们也进展邮寄的话,需破费¥250,000但他们带来的利益只需¥125,000(¥125×1,000=¥125,000),阐明为获得这些客户的本钱是大于他们所能带来的收益的,故将他们放弃。表3传统方法和数据发掘方法获取新客户的比较指标传统方法数据挖掘方法差异邮寄总数量1,000,000750,000250,000邮寄总成本¥1,000,000¥750,000¥250,000成为新客户的数量10,0009,0001,000每个新客户带来的毛利¥125¥125¥0总毛利¥1,250,000¥1,125,000¥125,000净利润¥250,000¥375,000¥125,000数据挖掘建模成本¥0¥40000¥40000最终净利润¥250,000¥335,000¥85,000从表中可以看到,净利润添加了¥125,000,即使减去数据发掘的本钱¥40,000其最终净利润也还多出¥85,000。另外,本例中建立模型的投资报答率(ROT)也比较高,为212.5%(¥85,000÷¥40,000=212.5%。从而显示了将数据发掘技术运用与新客户获取中的优势所在。决策树分类方法决策树提供了一种展现类似在什么条件下会得到什么值这类规那么的方法。比如,在贷款恳求中,要对恳求的风险大小做出判别,图1是为理处理这个问题而建立的一棵决策树,从中我们可以看到决策树的根本组成部分:决策节点、分支和叶子。是否是否是否收入>40000任务时间>5年高负债低风险高风险低风险高风险决策树的每个节点子节点的个数与决策树运用的算法有关。如CART算法得到的决策树每个节点有两个分支,这种树称为二叉树。允许节点含有多于两个子节点的树称为多叉树。每个分支要么是一个新的决策节点,要么是树的结尾,称为叶子。在沿着决策树从上到下遍历的过程中,在每个节点都会遇到一个问题,对每个节点上问题的不同回答导致不同的分支,最后会到达一个叶子节点。这个过程就是利用决策树进展分类的过程,即利用几个变量〔每个变量对应一个问题〕来判别所属的类别〔最后每个叶子会对应一个类别〕。常用的算法有分类回归树CART、ID3、和C4.5等

ID3算法运用信息熵实际,选择当前样本属性集中具有最大信息增益值的属性作为测试属性。该属性使得对结果划分中的样本分类所需的信息量最小,并反映划分的最小随机性或“不纯性〞。这种信息实际方法使得对一个对象分类所需的期望测试数目到达最小,并确保找到一棵简单树。设S是s个数据样本的集合。假定类标号属性具有m个不同值,定义m个不同类(i=1,⋯,m)。设是类中的样本数。对一个给定的样本分类所需的期望信息是:其中是恣意样本属于的概率,并用估计。设属性A为测试属性,它具有V个不同的值用表示属性A取值为的样本子集属于类的样本数。那么按照属性A的每个属性值进展分割的期望信息称作A的熵,由下式给出:在A上分割获得的信息增益定义为:根据上述方法,计算每个属性的信息增益,属性的信息增益越大,区分度越大。经过对一组训练数据的学习,构造出决策树方式的知识表示,在决策树的内部结点进展属性值的比较并根据不同的属性值判别从该结点向下的分支,在决策树叶结点得到结论。所以从根到叶结点的一条途径就对应着一条规那么,整棵决策树就对应着一组析取表达式规那么。基于决策树学习算法的一个最大的优点就是它在学习过程中不需求运用者了解很多背景知识。这样只需训练实例可以用属性—结论式的方式表达出来,就能运用该算法来进展学习。Id职业收入地区年龄反应1销售<=2000华北年轻02销售<=2000华东年轻13销售<=2000华东中年04非销售>2000华东中年15非销售>2000华北老年16非销售>2000其它老年17非销售<=2000西北中年08销售>2000华北年轻19销售>2000西北中年010销售<=2000西北年轻011销售<=2000东北中年012非销售<=2000其它中年013销售>2000华北年轻114非销售>2000东北中年115销售>2000西北年轻1根据表中的数据,类反响有两个不同的值(0,1),因此有两个不同的类〔m=2〕。设类C1=0,类C2=1。那么类C1有7个样本,类C2有8个样本。那么给定样本分类的期望信息为:I(s1,s2)=I(7,8)=-7/15㏒2(7/15)-8/15㏒2(8/15)=0.997如今计算每个属性的熵,〔1〕职业:销售:S11=5,S21=4那么I(S11,S21)=0.991非销售:S12=2,S22=4那么I(S12,S22)=0.918信息增益:E(职业)=(S11+S21)*I(S11,S21)/S+(S12+S22)*I(S12,S22)/S=0.991*9/15+0.918*6/15=0.9618GAIN(职业)=0.997-0.9618=0.0352同理:〔2〕收入:GAIN(收入)=0.4308〔3〕地域:GAIN(地域)=0.114〔4〕年龄:GAIN(年龄)=0.226图2按照“收入〞分割得到的决策树图3最终决策树从图3中我们可以很直观的分析出客户恳求信誉卡对“收入〞、“年龄〞、“地域〞、“职业〞四个属性的反响。可以得出一下规那么:1〕当收入小于等于2000元,假设年龄为中年的话普通没有兴趣;2〕当收入小于等于2000元,来自地域为华北、西北、东北或其它的年轻人,普通没有兴趣;3〕当收入小于等于2000元,来自地域为华东且为年轻人普通有兴趣;4〕当收入大于2000元,且来自华北、华东、东北或其它地域,普通有兴趣;5〕当收入大于2000元,来自西北地域且为年轻人普通有兴趣;6〕当收入大于2000元,来自西北地域且为中年人普通没有兴趣。选择了适宜的算法后,我们只需求把切分看成是把一组数据分成几份,份与份之间尽量不同,而同一份内的数据尽量一样。假设经过一次切分后得到的分组,每个分组中的数据都属于同一个类别,显然到达这样效果的切分方法就是我们所追求的。假定我们利用历史数据建立了一个包含几百个属性、输出的类有十几种的决策树,这样的一棵树对人来说能够太复杂了,但每一条从根结点到叶子节点的途径所描画的含义依然是可以了解的。决策树的这种易了解性对数据发掘的运用者来说是一个显著的优点。然而决策树的这种明确性能够带来误导。比如,决策树每个节点对应分割的定义都是非常明确毫不模糊的,但在实践生活中这种明确能够带来费事〔凭什么说年收入2001的人恳求信誉卡,而2000的人就没有〕。另外,树的大小与样本数量无关,计算量较小。客户坚持和流失客户开展阶段:潜在客户—新客户—称心的客户—留住的客户—老客户。经济学广泛运用的“80/20定律〞(佩尔图定律),详细到CRM中是说企业80%的利润是由前20%的客户所发明的;又如1989年的哈佛商业评论中提到假设客户坚持率提高5%,平均每位客户的价值就能添加25%到100%。这些数字都充分阐明了提高客户的忠实度、坚持好的客户对于企业本身的利益是至关重要的。比如在美国,挪动通讯公司每获得一个新用户的本钱平均是300美圆,而挽留住一个老客户的本钱能够仅仅是通一个。因此客户关系管理首先提倡的是坚持现有客户,实现现有客户的反复购买是企业追求的首要目的。其次才是开辟新市场,吸引新客户。经过数据发掘可以发现流失客户的特征,这样就可以在那些具有类似特征的客户还未流失之前进展针对性的弥补。例如一家挪动通讯公司发掘出的结果是:年龄在26岁以下、开通了WAP效力、挪动价值(购买时)在1800-2800元、每月通话费在250-350元之间(包月制那么是200元和280元两档)的男性流失的比例最高。掌握了这些信息,就可以针对每个人的奉献,满足他们的一些需求。客户流失的缘由主要有以下4种类型:自然流失客户流失不是人为要素呵斥的,比如客户的搬迁和死亡等。自然流失所占的比例很小。企业可以经过建立连锁效力网点和运营分公司,或者提供网上效力等方式,让客户在任何地方、任何时候都能方便快捷地运用企业的产品和效力,减少自然流失的发生。恶意流失是指一些客户为了满足本人的某些私利而分开企业,比如很多电信运营商的用户在拖欠了大额通讯费用后分开这家电信运营商,选择其他电信运营商提供的效力,从而到达不交费用的目的。恶意流失在客户流失中所占的比例也不大。企业可以经过客户信誉管理制度和欺诈监测来防止客户的恶意流失行为。竞争流失由于企业竞争对手的影响而呵斥的流失称为竞争流失。市场上的竞争突出表如今价钱战和效力战上。过失流失客户流失都是由于企业本身任务中的过失引起客户的不称心而呵斥的,比如企业笼统不佳、产品性能不好、效力态度恶劣等。过失流失在客户流失总量中所占的比例最高,但同时也是企业可以经过采取一些有效手段来防止的。客户流失预测分析能协助企业了解客户将要分开的信号,使企业有充分的时间采取措施挽留有流失倾向的客户。在客户关系分析中,客户流失预测分析模型的可解释性非常重要,企业要能明晰地了解分类模型中的各个要素以及各个要素的作用程度,根据分类模型了解影响客户流失的要素,以便于企业做出相应的改良。影响客户流失的要素主要从以下几个层面思索,竞争对手情况:竞争对手最近开发新产品情况、竞争对手最近开发新促销战略;企业和员工笼统:产品更新快慢程度、员工的态度和笼统、员工的流动率、企业文化和笼统;客户购买行为:客户能否接触竞争对手的产品、客户对企业的称心度、客户与企业交往的时间长度、客户最近的购买频率和数量的变化情况;产品和效力质量:效力体制能否完善、客户赞扬能否处置、效力质量和效力的及时性、产品的质量和价钱;客户流失模型的建立和运用过程如下:在客户数据仓库中抽取适当的字段组成客户分析数据库,为客户描画和客户流失模型提供数据源;客户流失预测分析属于数据发掘中的分类,客户能否己经流失为类标号,因此,根据客户能否流失情况,将客户分析数据库分别为当前客户数据库和流失客户数据库;对流失客户数据库进展分析,建立客户流失模型。随机选择流失客户中的2/3为训练数据,建立分类器,得出分类模型。将剩下的1/3数据作为测试数据代入分类模型中,预测准确率。假设准确率过低,那么反复以上过程,直到分类模型的准确率满足用户的需求,得出客户流失模型;从客户流失模型中分析影响客户流失的各种缘由,找出企业的缺乏之处,发现流失者的行为特征。运用客户流失模型在当前客户数据库中发现预测有流失倾向的客户群体。在预测客户的流失建模中较为常用的数据发掘算法是CART(ClassificationandRegressionTrees,分类回归树),它是分类方法中决策树的一种算法。虽然其他的一些数据发掘技术,如神经网络也可以产生很好的预测模型,但是这些模型很难了解。当用这些模型做预测分析时,很难对客户流失的缘由有深化的了解,更得不到如何对付客户流失的任何线索。在这种情况下,普通需求运用决策树或聚类技术等分类方法进一步的分类,来得到更深化的了解,所以生成的预测模型就相对复杂的多。客户流失数据集有其本身较为显著的特点:客户流失数据集中包含较多的延续值属性,如客户的年龄,收入信息,各项消费信息等。客户流失数据集是一个典型的非平衡分布数据集。流失客户与非流失客户之间相差的比例很大。流失客户在数据集中普通只占一个较小的比例。分类算法在处置非平衡数据集的分类问题时,容易遭到样本类别分布的影响,对少数类的分类精度不高,其效果并不理想。例如:TeleData为某电信运营商提供的客户信息数据集,其中包括用户的人口统计特征和通讯消费特征,经过数据发掘技术,发掘出流失客户的分类模型,从而提出战略,指点客户挽留。客户忠实度分析客户忠实度普通是指客户坚持反复购买或惠顾本人喜欢的同一品牌的产品或效力,不受环境和市场的影响。客户忠实主要表如今以下几个方面:〔1〕会经常反复地购买本企业的产品或效力,甚至可以定量分析出他们的购买频数;〔2〕在购买企业产品或效力时,选择呈多样性,但是优先关怀和选择其忠实的企业品牌的产品或效力以及其产品或效力的开展情况;〔3〕乐于向他人引荐本企业产品,被引荐者相对于其他客户会更容易地认同引荐的产品或效力;〔4〕会排斥本企业的竞争对手,只需忠实的纽带未被突破,他们甚至不屑于略胜一筹的竞争对手。衡量客户忠实的独一尺度就是客户能否反复或耐久地购买企业的产品或者效力,顾客忠实表达为详细的购买行为,具有很强的客观现实颜色,是实真实在的。而客户忠实的诱因主要是客户称心,顾客称心是一种期望值与感知效果的比较,是一种心思反响,它取决于顾客的“期望〞,具有很强的客观颜色。所以,客户忠实度分析规范是一个较为模糊的概念。首先可用聚类分析进展客户忠实度分析,根据所得的聚类结果,将每一类赋以详细标志,然后进展分类,构造出忠实客户的详细特征。或者是经过行业专家进展标志。在现有数据库信息资源的条件限定下,客户忠实度的分析同客户忠实度详细的量化定义就有了亲密的联络。根据需求,企业可以对客户的一些详细表现设定相应的观测变量,如:货款到达的及时性、购物占购货企业货物销量总量的比例、信息的虚伪程度、货物价钱的接受程度、继续买卖的时间、反复购买的次数、购买方式等。客户忠实度分析模型的建立和运用过程如下:〔1〕根据己有定义选定相关的分析变量;〔2〕从企业的业务数据库中搜集整理原始数据,按客户忠实度分析所需的字段组建企业客户的数据仓库系统;〔3〕检验分类与实践的吻合程度,选取或确定适宜的分类数,目前许多企业设定为5类;〔4〕察看分析每类的特点,给每类赋以类标志;〔5〕对带有忠实度类标志的数据建立分类模型;〔6〕根据忠实度模型描画忠实度客户的特征,协助企业识别忠实客户,根据客户忠实度的不同,提出相应的营销与客户管理措施。客户称心度分析客户称心度分析模型的建立过程和客户忠实度分析类似:〔1〕首先,经过多种方式进展客户称心度调查,影响客户称心度模型的主要要素包括:效力和系统支持、产品/效力技术表现、客户互动的要素、情感要素等。不同行业影响客户称心度的要素各不一样,但是根本都离不开这几个层次。客户的称心程度普通分为5个档次,1到5分别代表“很不称心〞、“不很称心〞、“根本称心〞、“称心〞和“很称心’。〔2〕将客户称心度调查结果搜集记录到企业的数据库中,构建客户数据仓库,在客户数据仓库中抽取适当的字段组成客户称心度分析数据。这些字段包括客户根本描画数据和称心度调查数据。客户的根本描画数据,包括客户的受教育程度、客户的性格偏好、客户的职业等,由于这些要素会影响客户对外界事务的态度,因此该当给予思索。〔3〕客户称心度分析属于数据发掘中的分类,对客户称心度数据实施数据发掘技术,建立分类器,得出分类模型。〔4〕研讨客户称心度的分类模型,在分类模型中越接近上层的要素越是主要要素。找出使客户称心的关键要素,企业继续在这些方面努力从而进一步提高客户的称心度。找出导致客户不称心的关键要素,协助企业认清缺乏,加强管理。交叉销售公司与其客户之间的商业关系是一种继续的不断开展的关系。在客户与公司建立起这种双向的商业关系后,可以有很多种方法来优化这种关系:延伸这种关系的时间在维持这样的关系期间添加相互的接触在每一次相互接触中获得更多的利润作为公司,其目的是要到达双赢的结果,即客户和商家都可以从中获益。客户获益是由于他们得到了更好更贴切的效力质量,商家那么由于添加了销售量而获利。因此,企业就需求向已有的客户进展销售,这就是交叉销售。交叉销售就是指他向现有的客户提供新的产品和效力的营销过程。在这里,我们看一下如何回答市场人员经常问的一个问题:“我应该向什么人销售什么产品?〞。更准确的来看,这可以分成以下三个问题:1.哪些产品是经常被一块购买的?2.哪些产品是经常被同类型的顾客购买的?3.顾客购买某种商品的能够性有多大?以上三个问题可以分别用数据发掘中的关联、聚类、预测分析加以处理。关联分析关联分析就是从给定的数据集中发现频繁出现的项集方式知识〔又称关联规那么〕。典型例子是购物篮分析。关联规那么研讨有助于发现买卖数据库中不同商品〔项〕之间的联络,找出顾客购买行为方式,如购买了某一商品对购买其他商品的影响。有时并不知道数据库中数据的关联函数,即使知道也不确定,因此关联分析生成的规那么带有可信度。通常关联规那么具有AB的方式,即:A1A2…AmB1B2…Bn,其中,Ai,Bj均是属性或项,表示数据库中满足X中条件的记录也一定满足Y中的条件。涉及到两个概念:支持度和可信度交易ID购买商品2000A,B,C1000A,C4000A,D5000B,E,F频繁项集支持度{A}75%{B}50%{C}50%{A,C}50%假设要确定{X,Y}Z的规那么,那么支持度s表示一次买卖中包含{X,Y,Z}的能够性。可信度c表示包含{X,Y}的买卖中也包含Z的条件概率。例如:上述表格中左边是买卖工程,右边是根据买卖的现实来确定的支持度,那么如今来确定在买卖现实中能否存在AC的规那么。Confidence(AC)=support({A,C})/support({A})=66.6%为了发掘出具有价值的规那么,通常规定最小支持度和最小置信度作为两个参数的阈值.关联规那么发掘可以分解为两个步骤:首先找出买卖工程中满足最小支持度〔minSupp〕的项集〔称其为频繁项集〕;然后由频繁项集生成关联规那么,对于频繁项集A,假设BA,且置信度confidence(BA-B)不小于最小置信度minConf,那么BA-B构成关联规那么。在第一步的根底上完成第二步比较容易,所以目前的研讨主要集中第一步上。关联规那么的运用:交叉销售:基于消费者的购买方式,自动进展交叉销售;商品摆放:将经常一同购买的东西一同摆放;流失客户分析:可分析能否是由于某些关键商品缺失引起的。

。,Apriori算法是发掘关联规那么的经典算法,发掘的对象是诸如售货记录之类的数据所组成的事务数据库,而发掘的结果那么是类似于“购买面包的同时也能够购买黄油〞的关联规那么。设I={I1,I2,…,Im}是项的全体构成的集合,项的集合称为项集,包含K个项的项集称为K-项集。D是数据库事务构成的集合,其中每个事务T又是一个项集,且TI。Apriori运用一种称作逐层搜索的迭代方法:(K-1)—项集用于搜索K-项集。即:首先找出频繁1-项集的集合,记做L1;L1用于找出频繁2-项集的集合L2,如此下去,直到找到Lk,k不再添加。为了提高频繁集逐层产生的效率,一个称作Apriori性质用于紧缩搜索空间。Apriori性质:频繁项集的一切非空子集都必需是频繁的。根据定义项集I不满足最小支持度阈值,那么I不是频繁的,假设项A添加到I中,那么结果项集〔IA〕不能够比I更频繁。衔接:为了找LK,经过LK-1与本人衔接产生候选K-项集的集合CK。设:li是LK-1中的项集,li[j]表示li的第j项。那么Lk-1的元素l1、l2是可以衔接的,假设满足:l1[1]=l2[1]l1[2]=l2[2]…l1[k-2]=l2[k-2]l1[k-1]<l2[k-1]那么衔接l1、l2的结果项集是l1[1]l1[2]l1[k-1]l2[k-1]。剪枝:CK是LK的超集。扫描数据库确定CK中每个候选项集的计数,从而确定LK。然而CK能够很大,可以利用Apriori性质进展剪枝。假设一个候选K-项集的〔k-1〕-子集不在LK-1中,那么该候选也不能够是频繁的,可以从CK中删除。Apriori算法主要由两步组成:衔接与剪枝TID项ID列表T100I1,I2,I5T200I2,I4T300I2,I3T400I1,I2,I4T500I1,I3T600I2,I3T700I1,I3T800I1,I2,I3,I5T900I1,I2,I3项集计数{I1}6{I2}7{I3}6{I4}2{I5}2项集计数{I1,I2}4{I1,I3}4{I1,I4}1{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2{I3,I5}1C1项集计数{I1}6{I2}7{I3}6{I4}2{I5}2L1C2项集计数{I1,I2}4{I1,I3}4{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2L2项集计数{I1,I2}4{I1,I3}4{I1,I5}2{I2,I3}4{I2,I4}2{I2,I5}2项集计数{I1,I2,I3}2{I1,I2,I5}2项集计数{I1,I2,I3}2{I1,I2,I5}2C3由频繁项集产生关联规那么:1)对于每个频繁项集L,产生L的一切非空子集。2〕对于L的每个非空子集S,假设support(L)/support(S)minconf,那么输出规那么S(L-S)例如:频繁项集l={I1,I2,I5}的非空子集有:{I1,I2},{I1,I5},{I2,I5},{I1},{I2}和{I5}。关联规那么如下:I1I2I5,confidence=2/4=50%I1I5I2,confidence=2/2=100%I2I5I1,confidence=2/2=100%I1I2I5,confidence=2/6=33%I2I1I5,confidence=2/7=29%I5I1I2,confidence=2/2=100%假设最小置信度阈值为70%,那么只需3个规那么输出。3.3客户分类客户分类的方式多种多样,企业可以根据实践需求和本身特点对客户进展各种主题背景下的分类,例如:假设以客户的盈利才干为横轴,以忠实度为纵轴,可把客户划分为四类:高盈利才干且忠实、高盈利才干而不忠实、低盈利才干而忠实、低盈利才干而不忠实;按照客户称心度可分为:非常称心、很称心、根本称心、不称心、很不称心;也可以按照客户的行业或行为进展分类。客户分类结果的有效性取决于分类目的和分类方法的选择,用于评价分类的目的需反映出客户的特征以及企业进展客户分类的目的。分类目的的选择要遵照一定的客观规律,并应根据企业所处的行业特点以及企业本身的实践情况来选择恰当的分类目的。客户分类的方法:分类和聚类以K为参数,把n个对象分为个簇,聚类目的是簇内具有较高的类似度,而簇间的类似度较低。聚类的处置流程如下:首先,随机地选择K个对象,每个对象代表一个簇的平均值或中心。对剩余的每个对象,根据其与各个簇中心的间隔,将它划分到最近的簇。然后重新计算每个簇的平均值。这个过程不断反复,直到准那么函数收敛。通常,采用平方误差准那么,其定义如下:K-均值聚类算法的关键是处理如下问题:选择适宜的簇数;选择适宜的间隔函数和评判函数。(1)确定属性根据中国电信的行业现状,可以把客户的属性分为三种:根本属性、效力属性和分析属性。根本属性:指客户的原始特征,也是分辨客户的最根本方式。包括客户的姓名、年龄、身份证号、国籍、户口、地域、地址、学历、任务单位、工龄、收入、婚否、家庭情况等客户专有特征。效力属性指客户与中国电信之间由效力关系和方式而产生的费用与过程。包括客户每月市内费、通话次数、手机通话费、通话频率、长途通话费及由此产生的效力费、安装费等一系列相关效力费用。分析属性指电信经过分析而产生的分析值。包括客户忠实度、行为分析目的、流失率、综合价值等分析目的。〔2〕数据规范化聚类之前普通的数据都要进展处置,这是聚类算法与其他算法的不同之处,由于聚类算法中需求计算间隔。客户聚类中所用的数据都是区间标度变量,变量的度量单位的选择将直接影响聚类分析的结果。例如,将时间单位由“年〞改为“月〞,能够产生非常不同的聚类结果。普通情况下,所用的度量单位越小,变量能够的值域就越大,这样对聚类结果的影响也越大,为了防止对度量单位选择的依赖,数据该当规范化。常用的规范化的方法是将原来的度量值转换为无单位的值,对于客户聚类分析中的变量我们分为三种,对每种采取不同的规范化方法。1〕增益变量,即该变量的值越大,客户价值越大,包括客户的购买次数、客户在本企业的消费额、客户与企业坚持买卖的时间长度。对该类变量采用如下的处置方法:,2〕损益变量,即该变量的值越小,客户价值越大,包括客户最近一次购买到如今的时间长度。对该类变量采用如下的处置方法:3〕不能用增益和损益来衡量,即客户提出建议或意见的次数。对该类变量采用如下的处置方法:〔3〕间隔度量方法的选择K一平均聚类算法采用基于对象间的间隔来计算各个对象间的相异度。〔4〕确定KK-均值聚类算法必需事先给定聚类的簇k的数目,在详细运用中,普通根据聚类的目的而设定聚类簇的数目。例如客户价值分类:RFM方法是衡量客户价值的一种重要方法,遵照现代管理巨匠佩拍斯先生的划分观念,将客户划分为三类:最有价值客户、最具增长性客户、负值客户,企业的高层经理级决策者普通从比较宏观的角度来了解客户,所以将客户分为3簇。运用K一平均聚类算法,输入初始参数:包含47060条记录的数据库,k=3,聚类实验时只选择了几个主要变量,其他的变量没有参与计算。选择的变量有:R表示客户最近一次购买到如今的时间长度〔天〕、F表示最近两年的购买次数、M表示最近两年客

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论