客户关系管理9_第1页
客户关系管理9_第2页
客户关系管理9_第3页
客户关系管理9_第4页
客户关系管理9_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

CRM中的数据管理2CRM的客户数据数据仓库技术数据挖掘技术数据挖掘技术的应用 听说,下雪天,啤酒和尿布更配哦4案例:尿布+啤酒=更大的利益

先请大家做个脑力游戏——说出任何尿布和啤酒的联系,即在什么情况下它们可以相提并论。

请想象这样的一副情景:在一个大的超级市场里面,人来人往。一角的货架上,尿布和啤酒赫然地摆放在一起出售。而且,尿布和啤酒的销售量双双增加。

这是上个世纪发生在美国沃尔玛连锁超市的真实事件,而且也许是将尿布和啤酒最好地联系起来的方法,因为它甚至符合了今天正在流行的“双赢”原理。5

原来,美国的太太经常嘱咐他们的丈夫下班以后为小孩购买尿布,而丈夫们在买尿布以后又顺手带回了啤酒。啤酒和尿布在一起购买的机会是最多的。

谁在当时就能看出这种带来“利益”的联系?其实想到答案的不是人,是信息技术。具体地说,就是美国沃尔玛超市的数据仓库。是它,通过集中商店一年多的详细原始交易数据,利用自动数据挖掘工具对这些数据进行分析,得到了这个意外的发现。6点评:从本例可以看出,CRM运用的成功必须依靠客户数据,对客户数据进行科学地分析,往往会带来意想不到的商机:对客户数据进行初级处理,可以完成基本业务过程;对数据进行高级处理(如数据挖掘),可以提供企业决策支持,促进销售,保持消费群体的稳定。所以说,客户数据是整个CRM运用的灵魂,本章内容就是以客户数据管理与分析为主。

2023/2/667第一节CRM的客户数据一、客户数据的类型81.直接渠道(1)在市场调查中获取客户数据(2)在营销活动中获取客户数据(3)在服务过程中获取客户数据(4)通过博览会、展销会、洽谈会等获取客户数据(5)网站和呼叫中心是收集客户数据的新渠道(6)从客户投诉中收集92.间接渠道(1)各种媒介(2)工商行政管理部门及驻外机构(3)国内外金融机构及其分支机构(4)国内外咨询公司及市场研究公司(5)从已建立客户数据库的公司租用或购买(6)其他渠道10二、客户的隐私及保护在企业层面保证客户信息安全性2012年3月15日,据央视3.15晚会报道,招商银行信用卡中心风险管理部贷款审核员胡XX就曾向作案人出售个人信息300多份;中国工商银行客户经理曹XX,通过中介向作案人提供了多达2318份个人信息。向朱凯华出售个人征信报告、银行卡信息的,还有中国农业银行无锡荣龙支行员工董某、中国工商银行福州鼓楼支行员工陈某。112.使用匿名身份信息3.尽量使用汇总数据12三、构建客户数据库(1)适当超前。按照可预见未来所需的信息量,尽可能多地考虑预期客户购买产品的情况和购买后的反应。(2)设计弹性。深入策划客户数据库的组成部分,应保留一定的弹性,以满足未来变化的需要。(3)灵活应用。建立数据库,可先建成一个小而实用的数据库,在管理客户数据库中获得经验,并对其评价,不断改进。(4)必要参与。构建客户数据库时,让尽可能多的部门和人员参与。一方面使信息采集科学完备;另一方面让数据库的使用者充分了解设计者的思想。13第二节数据仓库技术一、数据仓库概述从数据库到数据仓库传统的数据库技术由于其高效的数据存储与查询技术,支持了综合型管理信息系统的广泛应用。然而这些数据库主要适应于业务处理的需要,不能提供从全局视图对企业数据进行深入分析和挖掘。响应时间要求短某些业务功能数据对决策分析无关紧要客户信息被割裂在各个不同系统中以二维表格存储,无法进行多视角分析1415营销子系统:

客户特征(类别号,收入水平,交易期限,客户价值,…)客户行为(客户号,购买频次,最近购买时间,。。。)营业推广(编号,推广方式,成本,日期,客户。。。。)销售子系统:客户(客户号,姓名,地址,电话,…

)销售(客户号,商品号,数量,单价,日期,…)售后服务子系统:咨询单(编号,客户号,日期,相关产品…)维修单(编号,客户号,商品号,日期,负责人…)

维修次数、客户特征与客户忠诚度之间具有什么样的关系?162.数据仓库的含义

目前,对于数据仓库的概念,权威的定义是“数据仓库是在企业管理和决策中面向主题的、集成的、时变的、不可修改的数据集合”。3.建立数据仓库的目的

建立数据仓库并不是要取代原有的运作数据库系统,而是为了将企业多年来已经收集到的数据按统一、一致的企业级视图组织、存储,对这些数据进行分析,从中得出有关企业经营状况、客户需求、对手情况、发展趋势等有用信息,帮助企业及时、准确地做出相应决策。16174.数据仓库特征(1)面向主题(subject-oriented)。数据仓库的数据组织是围绕主题的。(2)集成(integrated)。数据仓库通常是结合多个异种数据源构成的。(3)时变(time-variant)。数据仓库中包含时间元素,它所提供的信息总是与时间相关联的。(4)不可修改(nonvolatile)。其数据相对稳定,极少或根本不更新。18

客户基本信息:客户号,姓名,地址,电话。。。。客户行为信息:客户号,购买频次,最近购买时间,。。。客户维修信息:客户号,商品号,日期,负责人…

客户咨询信息:编号,客户号,日期,相关产品,

客户主题域:营销子系统销售子系统售后子系统19整个数据仓库系统是一个包含四个层次的体系结构,具体由下图表示。20三、基于数据仓库的OLAP

1.OLAP基本概念

1)维

维是人们观察数据的特定角度。

2)维的层次

一个维往往具有多个层次,如描述时间维,可以从日期、月份、季度、年等不同层次来捕述,那么日期、月份、季度、年等就是时间维的层次;同样,城市、地区、国家等构成了一个地理维的多个层次。

21

(1)维成员。维的一个取值称为该维的一个维成员。如果一个维是多层次的,那么,该维的维成员是在不同维层次的取值的组合。

(2)多维数组。一个多维数组可以表示为:(维1,维2,…,维n,变量)。例如,日用品销售数据是按时间、地区和销售渠道组织起来的三维立方体,加上变量"销售额”,就组成了一个多维数组(地区,时间,销售渠道,销售额)。

(3)数据单元。多维数组的取值称为数据单元。

22切片

选定多维数组的一个二维子集的方法叫做切片,即选定多维数组(维1,维2,……,维n,变量)中的两个维:维I和维J,在这两个维上取某一区间或任意维成员,而将其余的维都取定一个维成员,则得到的就是多维数组在维I和j上一个二维子集,称这个二维子集为多维数在维I和维J上的一个切片,表示为;(维I,维j,变量)。OLAP的分析方法23

例如,选定多维数组(地区,时间,产品,销售额)中的地区维与产品维,在另外一维:时间维,选取一个维成员(如“2006年1月”),就得到了多维数组(地区,时间,产品,销售额)在产品和地区两维上的一个切片(客户,地区,销售额)。这个切片表示2006年1月各地区、各产品的销售情况。24

产品销售情况2006.1产品销售情况选定两个维:产品维和地区维时间维数据切片产品维地区维产品维地区维25切块

选定多维数的一个三维子集的方法称切块。即选定多维数组(维1,维2,……,维n,变量)中的三个维:维I、维j和维r,在这三个维上取某一区间或任意的维成员,而将其余的维都取定一个维成员,则得到的就是多维数组在维I、维j和维r上一个三维子集,我们称这个三维子集为多维数组在维I、维j和r上的一个切块,表示为:(维I,维j,维r,变量)。切块与切片的作用与目的是相似的。美国中国手机电脑图8-3

三维立方体切块(Slice)26旋转

旋转即是改变一个报告或面显示的维方向。例如,旋转可能包含了交换行和列;或是把某一个行维移到列维中去,或是把一个横向为时间、纵向为产品的报表旋转成为横向为产品、纵向为时间的报表。272005年2006年部门1季度2季度3季度4季度1季度2季度3季度4季度部门一2012182722161929部门二2311241722311234部门三26213433212326321季度2季度3季度4季度部门2005年2006年2005年2006年2005年2006年2005年2006年部门一2022121618192729部门二2322113124121734部门三2621212334263332旋转前的有关数据描述旋转后的有关数据描述28钻取按时间维向下钻取按时间维向上钻取6029第三节数据挖掘技术30什么是数据挖掘?数据挖掘(从数据中发现知识)从大量的数据中挖掘哪些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识数据挖掘的替换词数据库中的知识挖掘(KDD)知识提炼数据/模式分析数据考古数据捕捞、信息收获等等。31数据清理数据集成数据库数据仓库知识任务相关的数据选择数据挖掘模式评估32数据挖掘数据库越来越大有价值的知识可怕的数据数据挖掘背景33数据爆炸,知识贫乏苦恼:淹没在数据中;不能制定合适的决策!数据知识决策模式趋势事实关系模型关联规则序列目标市场资金分配贸易选择在哪儿做广告销售的地理位置金融经济政府POS人口统计生命周期34客户接触

客户信息客户数据库统计分析与数据挖掘客户知识发现客户管理知识发现:从数据中深入抽取隐含的、未知的和有潜在用途的信息从商业数据到商业智能35各行业电子商务网站算法层商业逻辑层行业应用层商业应用商业模型挖掘算法CRM产品推荐客户细分客户流失客户利润客户响应关联规则、序列模式、分类、聚集、神经元网络、偏差分析…WEB挖掘网站结构优化网页推荐商品推荐。。。基因挖掘基因表达路径分析基因表达相似性分析基因表达共发生分析。。。银行电信零售保险制药生物信息科学研究。。。相关行业数据挖掘的应用36零售业用于识别顾客的购买模式,在顾客的统计特征中发现关联,预测促销活动的反应,进行市场分析。啤酒和尿布的的关系,我们非常熟悉!如在购买面包和黄油的顾客中,有90%的人同时也买了牛奶”:(面包+黄油)→(牛奶)。数据挖掘其他应用37银行洗钱:发现可疑的货币交易行为保险如;保险客户流失性判断数据挖掘其他应用收入>5万元年龄>35岁不易流失易流失是否事业单位不易流失易流失YNYYNN38股票预设

预测一支股票的走势几乎是不可能,但是通过相关分析,可以找出一支股票的走势与另一只股票走势的潜在规律,比如数据挖掘曾经得到过这个结论:“如果微软的股票下跌4%,那么IBM的股票将在两周内下跌5%”。医疗探求各种疾病之间的相互关系、各种疾病的发展规律,总结各种治疗方案的治疗效果,以及对疾病的诊断、治疗和医学研究是非常有价值和发展前景的。同时,医疗数据是既有文本、数据挖掘其他应用39在今天,NBA的教练有了他们的新式武器:决策支持下的数据分析。大约20个NBA球队使用了IBM公司开发的数据挖掘软件来优化他们的战术组合。火箭的总经理莫雷该软件就因为研究了魔术队队员不同的布阵,在魔术队与迈阿密热队的比赛中找到了获胜的机会。(1)系统分析显示魔术队先发阵容中的两个后卫哈德卫和伯兰在前两场中被评为-17分,这意味着他俩在场上,本队输掉的分数比得到的分数多17分。然而,当哈德卫与替补后卫阿姆斯创组合时,魔术队得分为正14分。(2)在下一场中,魔术队增加了阿姆斯创的上场时间。此招果然见效:阿姆斯创得了21分,哈德卫得了42分,魔术队以88比79获胜。有趣的数据挖掘----美国NBA40数据挖掘的方法

根据数据挖掘的方法分,可粗分为:统计方法机器学习方法神经网络方法数据库方法41(1)统计方法回归分析(多元回归、自回归、罗吉斯回归等)判别分析(贝叶斯判别、费歇尔判别、非参数判别等)聚类分析(系统聚类、动态聚类等)探索性分析(主元分析法、相关分析法等)以及模糊集、粗糙集、支持向量机等。(2)机器学习归纳学习方法(决策树(ID3算法)、规则归纳等)、基于范例的推理CBR遗传算法贝叶斯信念网络等。(3)神经网络方法前向神经网络(BP算法等)自组织神经网络(自组织特征映射、竞争学习等)等。(4)数据库方法基于可视化的多维数据分析或OLAP方法,另外还有面向属性的归纳方法。数据挖掘是CRM成功的保障CRM中数据挖掘的应用:1.客户的获取。把客户根据其性别、收入、交易行为特征等属性细分为具有不同需求和交易习惯的群体,同一群体中的客户对产品的需求以及交易心理等方面具有相似性,而不同群体间差异较大。这样就有助于企业在营销中更加贴近顾客需求。分类和聚类等挖掘方法可以把大量的客户分成不同的类,适合于进行客户细分。通过群体细分,CRM用户可以更好地理解客户,发现群体客户的行为规律。在行为分组完成后,还要进行客户理解、客户行为规律发现和客户组之间的交叉分析。数据挖掘是CRM成功的保障2.重点客户发现。就是找出对企业具有重要意义的客户,重点客户发现主要包括:发现有价值的潜在客户;发现有更多的消费需求的同一客户;发现更多使用的同一种产品或服务;保持客户的忠诚度。根据80/20以及开发新客户的费用是保留老客户费用的5倍等营销原则,重点客户发现在CRM中具有举足轻重的作用。数据挖掘是CRM成功的保障3.交叉营销。商家与其客户之间的商业关系是一种持续的不断发展的关系,通过不断地相互接触和交流,客户得到了更好更贴切的服务质量,商家则因为增加了销售量而获利。交叉营销指向已购买商品的客户推荐其他产品和服务。这种策略成功的关键是要确保推销的产品是用户所感爱好的,有几种挖掘方法都可以应用于此问题,关联规则分析能够发现顾客倾向于关联购买哪些商品;聚类分析能够发现对特定产品感爱好的用户群;神经网络、回归等方法能够猜测顾客购买该新产品的可能性。数据挖掘是CRM成功的保障4.客户分析。主要包括:客户价值金字塔分析、客户分布分析、新增客户分析、流失客户分析和购买行为分析。其中分类等技术能够判定具备哪些特性的客户群体最轻易流失,建立客户流失猜测模型,从而帮助企业对有流失风险的顾客提前采取相应营销措施。利用数据挖掘技术,可以通过挖掘大量的客户信息来构建猜测模型,较准确地找出易流失客户群,并制订相应的方案,最大程度地保持住老客户。数据挖掘是CRM成功的保障5.性能评估。以客户所提供的市场反馈为基础,通过数据仓库的数据清洁与集中过程,将客户对市场的反馈自动地输入到数据仓库中,从而进行客户行为跟踪。性能分析与客户行为分析和重点客户发现是相互交叠的过程,这样才能保证企业的客户关系治理能够达到既定的目标,建立良好的客户关系。47关联分析

关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。三、数据挖掘方法的应用举例48关联规则挖掘记录号购物清单12345啤酒、尿布、婴儿爽身粉、面包、雨伞尿布、婴儿爽身粉啤酒、尿布、牛奶尿布、啤酒、洗衣粉啤酒、牛奶、可乐客户购物清单单项统计支持度{啤酒}{尿布}{婴儿爽身粉}{牛奶}0.80.80.40.4单项统计结果49双项统计支持度{啤酒,尿布}{啤酒,牛奶}{尿布,婴儿爽身粉}0.60.40.4R1:啤酒~尿布,S=0.6,C=0.6/0.8==0.75R2:尿布~啤酒,S=0.6,C=0.6/0.8==0.75R3:牛奶~啤酒,S=0.4,C=0.4/0.4==1R4:啤酒~牛奶,S=0.4,C=0.4/0.8==0.5R5:尿布~爽身粉,S=0.4,C=0.4/0.8==0.5R6:婴儿爽身粉~尿布,S=0.4,C=0.4/0.4==l50●现代方法——决策树(DecisionTree)决策树的组成决策节点、分支、叶子———根节点分支———叶子Debt<10%ofIncomeDebt=0%GoodCreditRisksBadCreditRisksGoodCreditRisksYesYesYesNONONOIncome>$40K节点

决策树的分支过程就是对数据进行分类的过程,利用几个变量(每个变量对应一个问题)来判断数据所属的类别。在分支后,要使不同分支之间数据的差异尽可能大、同一分支内的数据尽量相同。这一分割过程也就是数据的“纯化”过程。2.决策树方法决策树算法决策树的构造采用自上而下的递归构造。以多叉树为例,其构造思路是:如果训练样本集中所有样本是同类的,则将它作为叶子节点,节点内容即是该类别标记;否则,根据某种策略选择一个属性,按照属性的不同取值,将样本集划分为若干子集,使得每个子集上的所有样本在该属性上具有同样的属性值。然后再依次处理各个子集。实际上就是“分而治之”(divide-and-conquer)的策略。二叉树同理,差别仅在于要选择一个好的逻辑判断。

决策树算法决策树构造的条件构造好的决策树的关键是:如何选择好的逻辑判断或属性。对于同样一组样本,可以有很多决策树能符合这组样本。原则:选择一个最能区别T中实例的属性研究表明,一般情况下,树越小则树的预测能力越强。要构造尽可能小的决策树,关键在于选择恰当的逻辑判断或属性。一般采用启发式策略选择好的逻辑判断或属性。53患者代码嗓子痛发烧淋巴肿充血头痛诊断结果1YesyesYesYesYes咽炎2NoNoNoYesYes敏感症3YesYesNoYesNo感冒4YesNoYesNoNo咽炎5NoYesNoYesNo感冒6NoNoNoYesNo敏感症7NoNoYesNoNo咽炎8YesNoNoYesYes敏感症9NoYesNoYesYes感冒10yesYesnoYesYes感冒淋巴肿数据挖掘实例患者代码嗓子痛发烧淋巴肿充血头痛诊断结果11NoNoYesYesYes?12YesYesNoNoYes?13NoNoNoNoYes?54患者代码嗓子痛发烧淋巴肿充血头痛诊断结果1YesyesYesYesYes咽炎2NoNoNoYesYes敏感症3YesYesNoYesNo感冒4YesNoYesNoNo咽炎5NoYesNoYesNo感冒6NoNoNoYesNo敏感症7NoNoYesNoNo咽炎8YesNoNoYesYes敏感症9NoYesNoYesYes感冒10yesYesNoYesYes感冒淋巴肿发烧NoNoYesYes咽炎敏感症感冒淋巴肿、发烧是有意义的属性嗓子痛、充血、头痛是无意义的属性数据挖掘实例55淋巴肿发烧NoNoYesYes咽炎敏感症感冒患者代码嗓子痛发烧淋巴肿充血头痛诊断结果11NoNoYesYesYes?12YesYesNoNoYes?13NoNoNoNoYes?未知分类的数据实例(检验集)未知分类的数据检验56患者代码嗓子痛发烧淋巴肿充血头痛诊断结果1YesyesYesYesYes咽炎2NoNoNoYesYes敏感症3YesYesNoYesNo感冒4YesNoYesNoNo咽炎5NoYesNoYesNo感冒6NoNoNoYesNo敏感症7NoNoYesNoNo咽炎8YesNoNoYesYes敏感症9NoYesNoYesYes感冒10yesYesnoYesYes感冒淋巴肿发烧NoNoYesYes敏感症敏感症咽炎NoYes头痛淋巴肿感冒发烧淋巴肿NoYes咽炎NoYes选取头痛作为决策属性决策树的属性选取属性选取标准:最大化反映数据差异,使树的层次和节点数最小信用卡促销数据库收入段寿险促销信用卡保险性别年龄4-5万NoNoM453-4万YesNoF404-5万NoNoM423-4万YesYesM435-6万YesNoF382-3万NoNoF553-4万YesYesM352-3万NoNoM273-4万NoNoF433-4万YesNoF414-5万YesNoM432-3万YesNoF295-6万YesNoF394-5万NoNoM552-3万YesYesF19数据挖掘实例—寿险促销我们将试图发现年龄、收入、性别、是否有信用卡保险等因素与是否购买寿险的关联,从而证实已购买寿险与某些相关因素间的规则。58收入段寿险促销信用卡保险性别年龄4-5万NoNoM453-4万YesNoF404-5万NoNoM423-4万YesYesM435-6万YesNoF382-3万NoNoF553-4万YesYesM352-3万NoNoM273-4万NoNoF433-4万YesNoF414-5万YesNoM432-3万YesNoF295-6万YesNoF394-5万NoNoM552-3万YesYesF19○选取收入段为根节点○选取寿险促销为输出属性○沿着每个分支有两个类,选取最频繁出现的类收入段2Yes2No4Yes1No3No1Yes2Yes2—3万3—4万4—5万5—6万○训练集分类的正确性为11/15=73%数据挖掘实例—寿险促销59——决策树(DecisionTree):例信用卡促销数据库○选取信用卡保险为根节点○选取寿险促销为输出属性○沿着每个分支有两个类,选取最频繁出现的类信用卡保险6Yes6No3Yes0NoNoYes○训练集分类的正确性为9/15=60%收入段寿险促销信用卡保险性别年龄4-5万NoNoM453-4万YesNoF404-5万NoNoM423-4万YesYesM435-6万YesNoF382-3万NoNoF553-4万YesYesM352-3万NoNoM273-4万NoNoF433-4万YesNoF414-5万YesNoM432-3万YesNoF295-6万YesNoF394-5万NoNoM552-3万YesYesF1960——决策树(DecisionTree):例信用卡促销数据库○选取数值型属性年龄为根节点○选取寿险促销为输出属性○依照年龄排序,对照输出属性进行数据分割,选择数据分割点年龄9Yes3No0Yes3No≤43>43○以年龄≤43结合寿险促销=Yes,训练集分类的正确性为12/15=80%172729353839404142434343455555YNYYYYYYNYYNNNN收入段寿险促销信用卡保险性别年龄4-5万NoNoM453-4万YesNoF404-5万NoNoM423-4万YesYesM435-6万YesNoF382-3万NoNoF553-4万YesYesM352-3万NoNoM273-4万NoNoF433-4万YesNoF414-5万YesNoM432-3万YesNoF295-6万YesNoF394-5万NoNoM552-3万YesYesF1961信用卡促销数据库年龄Yes(6/1)No(2/1)≤43>43性别FM信用卡保险Yes(2/0)No(3/0)NoYes信用卡数据库的三节点决策树○训练集分类的正确性为13/15=87%收入段寿险促销信用卡保险性别年龄4-5万NoNoM453-4万YesNoF404-5万NoNoM423-4万YesYesM435-6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论