已阅读5页,还剩72页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据挖掘在客户关系管理综合决策中的应用 摘要 随着中国加入w t o ,我国各个行业的竞争也日趋激烈。企业保 有客户留住利润的难度越来越大。如果企业还仅仅依靠产品本身似 乎很难逃脱失败的命运。因此越来越多的企业将重点从“以产品为 中心 的粗放式经营管理模式向“以客户为中心 的集约化商业模 式转移。 愿望虽好,但是却有一个现实不得不面对那就是虽然国内企业 信息化经过了多年的发展,已经积累了相当数量的数据资源,这些 数据背后确实隐藏着许多重要的信息,但由于人们目前所使用工具 的局限性而无法将这些重要的信息快速有效地挖掘出来。得不到这 些信息,企业对客户的了解永远都只是停留在表面上,“以客户为中 心 也永远只能停留在热情服务嘘寒问暖的程度。 基于这种现状笔者对数据挖掘中的决策树分类方法和神经网络 分类方法进行了认真研究,根据实际情况利用i d 3 算法和b p 神经 网络模型设计并实现了客户关系管理综合决策中潜在客户发现、现 有客户等级评定、客户流失预警三个功能模块,并对使用这两种实 现方法和不使用任何数据挖掘方法3 种情况时企业在不同资源丰富 程度下的收益状况进行了分析。得出企业资源越有限,客户竞争越 激烈时,使用数据挖掘方法效果越明显的结论。 关键词:客户关系管理b p 神经网络决策树模型数据挖掘 d a :i :am i n i n ga p p u c a t i o nf o rc r m i n t e g r a t e dd e c i s i o n m 悯n g a b s t r a c t w i t hc h i n e s ea c c e s s i o nt ot h ew t o ,c o m p e t i t i o n si na l ls e c t o r sa r e b e c o m i n gi n c r e a s i n g l yf i e r c e i tb e c o m e sm o r ea n dm o r ed i f f i c u l tt h a t e n t e r p r i s e sr e t a i nt h ec u s t o m e r sa n dp r o f i t s i ft h ee n t e r p r i s e ss t i l lr e l y s o l e l yo nt h ep r o d u c ti t s e l f , t h e ys e e m t ob ed i f f i c u l tt oe s c a p et h ef a t eo f f a i l u r e s om o r ea n dm o r ec o m p a n i e sa r ef o c u s i n go ns h i f t i n gt h e “p r o d u c t c e n t r i c m a n a g e m e n tm o d et ot h e “c u s t o m e r c e n t r i c i n t e n s i v e b u s i n e s sm o d e l a l t h o u g hw i s hi sg o o d ,i ti st h er e a l i t yw h i c hw em u s tt of a c et h a t t h ed o m e s t i cc o m p a n i e sh a v ea c c u m u l a t e dal o to fd a t aw h i c hh a v es o m u c hi m p o r t a n ti n f o r m a t i o nd u r i n gt h e p a s ty e a r s a n dt h e yc a n t e x c a v a t et h ei n f o r m a t i o nb e c a u s eo ft h el i m i t e dt o o l st h e yu s e d w i t h o u t t h e s ei m p o r t a n ti n f o r m a t i o n ,u n d e r s t a n d i n go ft h ec u s t o m e r sw i l lj u s t r e m a i no nt h es u r f a c ef o re v e l b a s e do i lt h i ss i t u a t i o n is t u d i e dd a t am i n i n go i ld e c i s i o nt r e e c l a s s i f i c a t i o na n dn e u r a ln e t w o r kc l a s s i f i c a t i o ns e r i o u s l y i na c c o r d a n c e w i t ht h ea c t u a ls i t u a t i o n id e s i g n e da n dc a r r i e do u tt h r e ea p p l i c a t i o n m o d e l sw h i c ha r e p o t e n t i a lc u s t o m e r s d i s c o v e r y m o d e l c u s t o m e r c l a s s i f i c a t i o nm o d e la n dl o s ec u s t o m e re a r l yw a r n i n gm o d e lf o rc r m i n t e g r a t e dd e c i s i o n m a k i n gw i t hi d 3a l g o r i t h ma n db pn e u r a ln e t w o r k m o d e l t h e nia n a l y z e dt h ee a r n i n go ft h ee n t e r p r i s e su n d e rd i f f e r e n t r e s o u r c es t a t ew i t hi d 3 b pm o d e lo rn o t h i n g i tc o m e st oac o n c l u s i o n t h eu s i n go fd a t am i n i n gi se f f e c t i v ew h e nc o m p e t i t i o ni si n t e n s ea n d r e s o u r c ei sl i m i t e d k e yw o r d s :c u s t o m e rr e l a t i o n s h i p m a n a g e m e n t b pn e u r a l n e t w o r k sd e c i s i o nt r e e d a t am i n i n g 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中 不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或 其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处, 本人签名:三坠u 蝉 本人承担一切相关责任。 嗍趟垒塑刍塑旦 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅 和借阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印 或其它复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在年解密后适用本授权书。非保密 论文注释: 本人签 导师签 适用本 日期: 日期: 北京邮电大学硕士研究生学位论文 1 1 研究背景及意义 第一章绪论 改革开放以来,历经近三十年的经济发展,中国的经济形态正逐渐由稀缺 经济向过剩经济过度,但这种过剩是低层次的过剩,产品的同质化现象很严重, 技术含量差别很小。生产方面,企业习惯了“以产品为中心 ;市场方面,企 业依旧是以推销为主,结果相同的思维、相同的做法、非常接近的技术生产能 力导致了市场上一次又一次爆发“价格战i l l 。这种饮鸩止渴的做法不仅让消 费者对降价习以为常,而且让他们对企业和产品没有任何的信任感,他们所比 较和在乎的仅仅是产品的价格而已。各个企业对这种局面已经是疲于应付,它 们的资本积累、科研开发及后续发展的能力根本就无从谈起。与此同时随着中 国加入w t o ,国外企业尤其是跨国巨头的不断进入,使得本来就激烈的市场竞 争变得更加白热化。近几年,随着信息时代的到来,i n t e m e t 不断普及,金融电 子化的不断推进,电子商务不断为广大群众所接受,国内企业引以为骄傲的网 点和渠道优势在不断被削弱 如此不利的竞争形势,如果企业还仅仅依靠产品本身似乎很难逃脱失败的 命运。因此越来越多的企业将重点从“以产品为中心一的粗放式经营管理模式 向“以客户为中心 的集约化商业模式转移。对于一个企业来说,如果能够争 得所有客户的忠诚固然是最好的,这样不仅可以稳固自己的市场地位也可以压 缩竞争对手的生存空间,但是随着争取客户的增多,就出现了两个不可回避的 问题。一是争取并留住客户所需要付出的边际成本在迅速上升,使得花费了巨 大精力争取到或者挽留住的客户带给企业的可能并不是利益而是负担;这也就 是所谓的“- - - a 一法则,占企业客户总数2 0 的优质客户创造了企业8 0 的利 润,而剩下的8 0 的客户也才能为企业创造2 0 的利润。1 2 l 可以看出,优质客 户是企业的利润之源,哪家企业拥有了广大的优质客户,哪家企业就拥有了生 存和发展的空间。二是企业在一定时期内的资源是有限的,也就使得同时完全 满足所有客户的假设变得不可能。如何才能在众多客户中区分关键客户、普通 客户、垃圾客户并能及时发现那些忠诚度可能发生变化的客户并及时引导他们 维持在有利于企业的方向上就显得非常关键了。未来如何提高客户的忠诚度, 提升客户价值,进而产生企业利益,已成为企业重点考虑的问题,同时也成为 评价一个企业竞争力的重要指标。难怪国外,9 3 的公司首席执行官认为”顾客 第l 页 北京邮电大学硕士研究生学位论文 资源n 是企业成功和更具有竞争力的最重要的因素;忠诚、持久而稳定的顾客群 是企业最宝贵的资源:企业营销的关键是争取和留住顾客,满足消费者个性化 地需求,和顾客建立互相信任的稳定的双向沟通的互动关系。 客户的满意和忠诚是如此的重要,想要得到却也不是那么容易的。客户的 满意和忠诚不是通过简单的削价可以换来,也不是通过折扣、积分等暂时的经 济利益可以买来的,甚至己不再是简单的电话关怀或嘘寒问暖可以换来的,要 靠数据库和客户关系管理系统,从与客户的交流互动中更好地了解客户需求来 逐步实现的。1 3 1 现阶段,国内企业信息化经过了多年的发展,已经逐步成熟完善起来,积 累了相当数量的数据资源。企业所拥有的关于客户的大量数据背后隐藏着许多 重要的信息,但由于人们目前所使用工具的局限性而无法将其快速有效地挖掘 出来。在数据大集中的前提下,目前只能实现数据的录入、查询、统计等较低 层次的功能,却无法发现数据中存在的关联关系和业务规律,更难以根据现有 的数据预测未来的发展趋势。我国企业数据管理应用的普遍现状是,企业积累 了大量数据,因为缺乏挖掘数据背后的知识手段和工具,往往导致“数据爆炸 但知识贫乏 ,客户分析处在较低层次,难以开展一对一营销,难以为客户及 时提供有针对性、差别化、个性化服务。在客户导向时代,企业成功吸引客户 的关键不仅在于了解客户的表面需求,还要挖掘出客户的潜在需求,并加强针 对这些需求的咨询性营销工具的开发和应用。任何一家企业,如果能通过完善 的客户服务和深入的客户分析来让客户满意,就能实现客户保留、客户忠诚和 客户创利的目的。 1 2 数据挖掘国内外研究现状 1 2 1数据挖掘国外研究现状 数据挖掘技术是近年来在国外得到广泛应用的- - f l 新兴边缘技术,首先在 银行、保险公司、电信公司和大型零售行业得到了广泛应用。数据挖掘的研究 正方兴未艾,其发展前景己经在国际上得到了确认。数据挖掘技术在c r m 中 的应用研究是当前的研究热点。国外在c r m 中进行有效的数据挖掘的研究主 要集中在以下几个方面: ( 1 ) 挖掘方法的研究。这方面主要集中在挖掘的类型知识、各个抽象层的交 互知识挖掘、数据查询语言,以及并行挖掘、分布式挖掘和增量挖掘等算法的 研究上。 第2 页 北京邮电大学硕士研究生学位论文 ( 2 ) 挖掘性能研究。主要包括挖掘算法的有效性和可伸缩性、模式的评估和 兴趣度度量、挖掘应用的效益等方面的研究。 ( 3 ) 数据的研究。这方面包括数据库类型的多样性问题、复杂数据类型的处 理、噪声数据和缺失数据的处理,以及异种数据库和w e b 上的数据挖掘等。 ( 4 ) 与用户交互的研究。这方面主要研究数据挖掘结果的表示和可视化,领 域知识的运用,挖掘过程的简化和可理解性等。 ( 5 ) 其他问题的研究。包括数据挖掘的应用开发和它们的社会影响。这些问 题是数据挖掘技术未来发展的主要需求,同时给数据挖掘也提供了许多挑战性 的课题。 国外已有将数据挖掘技术应用于客户关系管理系统的研究,其应用领域主 要是电信业、银行业、保险业和销售业等。国外一些学者对数据挖掘在企业客 户关系管理中的应用做出重要阐述,认为客户关系管理为客户与企业之间创建 了一个沟通渠道,数据挖掘优化了客户关系管理系统的服务功能。通过对客户 的交易行为进行分析,可以更好的了解客户和保留客户,通过挖掘客户的爱好 和兴趣,可以达到最快的速度响应客户的需求,为客户提供最优质的服务,极 大地提高客户的忠诚度。通过使用集成有数据挖掘技术的营销辅助工具商业人 员可以避免因为进入一个新领域没有经验的尴尬,利用企业团队经验有效地策 划和开展营销活动。企业也可以通过有经验的商业人员参与研发有数据挖掘技 术的营销辅助工具,避免因为关键员工流失带来经验和技术的确实,这样企业 就可以保持持续的判断力不受人员变动的影响。 早在1 9 9 5 年,在美国前1 0 0 家商业银行中,就有超过5 0 家投产了数据 挖掘项目。目前在美国,数据挖掘技术己被广泛地应用于信用评估、欺诈发现、 客户保持、营销策划、价格制定、投资组合分析、财务分析、安全管理和战略 规划等银行经营、管理和决策的各个方面。如美国h n c 公司开发了m a r k s m a n 数据挖掘工具,美国f i r s t a r t 银行使用该数据挖掘工具根据客户的消费模式预 测何时为客户提供何种产品;i b m 公司开发了i n t e l l i g e n tm i n e r 软件,m e l l o n 银行使用该数据挖掘软件提高销售和定价金融产品的精确度,如家庭普通贷款。 此外,美国第一银行、f c c 国家银行、w e l lf a r g o 银行和化学银行也都采用了 数据挖掘技术,并取得了显著的效果【4 1 。 据i d c 调查,在客户关系管理中应用数据挖掘技术,为银行提供的投资 回报率平均超过4 0 0 。伴随数据挖掘技术的发展,国外很多大的银行为了能 从庞大的数据中获得有用信息,纷纷把数据挖掘技术运用于经营、管理和决策 的各个方面。可以说,数据挖掘技术己成为外资银行在激烈的市场竞争中获胜 第3 页 北京邮电大学硕士研究生学位论文 的关键技术。 1 2 2数据挖掘国内研究现状 在国内,中国企业的信息化在近年内有了很大的进步,从最初的业务处理 电子化,办公自动化到后来企业内部网络和垂直业务体系的建成,直至数据大 集中工程的实施,达到了前所未有的高度。但是我们现在所掌握的还只是数据 而没有达到信息的程度。我们成绩斐然的电子化和数字化只是企业信息化的保 证、准备和前奏,而信息时代更为本质的信息发掘工具数据挖掘,还没有 被中国企业所广泛掌握。就拿在国外信息化程度非常高的金融业来说,呼叫中 心和数据挖掘这两方面是焦点所在。而我国虽然大部分银行的呼叫中心已经建 成,电话银行,网络银行业务也都逐渐开展起来了,但是银行c r m 的研究和 应用仅有几年的时间,数据挖掘在国内商业银行的实际应用就更少了。在金融 业很少有将数据挖掘与我国银行c r m 相结合的突出的研究成果,也缺乏大规 模的成熟经验。 国内从事数据挖掘研究的人员主要在大学,也有部分在研究所或公司。所 涉及的研究领域很多,一般集中于学习算法的研究、数据挖掘的实际应用以及 有关数据挖掘理论方面的研究。相对国外而言,我国的研究和西方发达国家相 比明显落后。数据挖掘技术在我国企业客户关系管理中应用的研究尚处于起步、 探讨阶段,对国外成果的引进、介绍、吸收阶段。面对数据挖掘这种功能强大 的新兴边缘技术以及国内企业薄弱的客户关系管理系统和长期积累下来的海量 客户数据,如何充分利用如此庞大的客户数据并从中挖掘出有价值,改善企业 与客户的关系,为企业不断创造利益成为数据挖掘进一步发展的关键:只有数 据挖掘技术的应用产生了利益,才能吸引更多的企业资源来推动数据挖掘技术 的革新和进步,才有希望走出现在亦步亦趋人云亦云的处境。 1 3c r m 国内外发展状况 1 3 1国外发展情况 在1 9 9 0 年左右为了满足市场的需要,许多的公司开始开发销售队伍自动化 系统,随后又着力于客户服务系统的开发和推广。到了1 9 9 6 年一些公司把销售 队伍自动化系统和客户服务系统两个系统合并起来,并加上市场营销、现场服 务。在这基础上再结合计算机电话集成技术形成集销售与服务为一体的呼叫中 第4 页 北京邮电大学硕士研究生学位论文 心,这样就形成了今天的客户关系管理系统。从1 9 9 9 年以来,随着电子商务的 兴起,c r m 向e c r m 方向发展。根据国际著名公司的走势分析,全球的c r m 市场正在以每年5 0 的速度增长。到2 0 0 5 年,分析、咨询和系统集成服务将成 为c r m 市场中的生力军,其年增长率将达到惊人的8 2 ,并会对企业造成冲 击。同 最早把c r m 引入银行业的是花旗银行,花旗银行的这一举措使得整个企 业从“以产品为中心 的模式转移到“以客户为中心 的模式,银行关注的焦 点从内部运作转移到客户关系上来1 6 j 。运用c r m 系统后,花旗银能准确地说出 谁是他们盈利来源最多的客户,甚至可以列出表单对所有客户进行贡献排名。 这无疑使花旗银行的资源更加集中有效的投到最合理的地方。 随着花旗的不断成功,榜样效应的感召下,c r m 在国外银行业的应用越来 越广泛,例如挪威联合银行就基于c m r 的理念,提出了“由一家银行变为一 百万家银行,一个客户就是一家银行 的经营策略。 1 3 2国内发展情况 总体上,c r m 系统对于国内企业来说还只是一个概念,或者说是一个简单 的应用,没有形成一个完整的、合理的应用系统1 7 1 。由于很多企业还没有建成 自己的e r p 系统,因此c r m 系统缺乏一个强大的支持系统。实际上,我国企 业普遍存在着对自身资源缺乏整合的问题,没有真正形成后方支持的基础平台。 大部分企业只是开始涉及信息化,但对服务渠道管理和客户管理关系的认识只 是浮于表面。许多企业并未从企业整体角度实施c r m ,前台操作和后台操作未 实现一体化,面对客户的前台操作如销售、市场营销、电话银行和其他的网络 支持必须在组织上与后台操作程序融为一体。虽然在经营的战略上,大多已经 完成了“以产品为中心一向“以客户为中心一的转变,很多企业也都采取不同 方式建立了自己的客户信息资料库,如客户经理手中的记录着密密麻麻客户资 料的联系本,但这最多只能是c r m 系统的一种雏形,在营销活动中并不能充 分发挥作用。应该说,这种“准c r m 数据库”,【8 】只是这种数据库还不具备智 能化的功能,是在目前条件下,向c r m 系统的一种过渡。 1 4 面临的问题和研究的内容 虽然国内企业经过了多年的信息化,也取得了一定的成果但是还是存在这 第5 页 北京邮电大学硕士研究生学位论文 一些问题,主要体现在以下几个方面: ( 1 ) 信息化积累了相当数量的数据资源却由于目前所使用工具的局限性只 能实现简单的数据录入、查询、统计等功能却无法发现数据中存在和隐含的关 系和规则,无法根据现有的数据预测未来的发展趋势; ( 2 ) 很多企业经营的战略上,已经完成了“以产品为中心一向“以客户为 中心一的转变,却苦于没有很好的途径去看清客户更深层次的需要,看不清目 标,自然“以客户为中心一也只能是一种美好的愿望; ( 3 ) 企业辛苦培养的有经验的商业人员只能将自己对客户需求的判断结果 记录在数据库中,却无法将自己多年积累的判断能力传递给同事。新员工的到 来一切从零开始,老员工离开企业承受巨大损失。 面对这些问题,单纯的强调信息化、数据挖掘或者“以客户为中心”的客 户关系管理的应用已经不能取得任何本质进展了i 训。必须将客户关系管理和数 据挖掘技术的优势结合起来,在客户关系管理系统的实现中融入数据仓库的机 制和数据挖掘技术,使得系统在对数据访问、数据分析和制定决策方面为用户 提供更强大的服务,提高系统的可用性。客户关系管理系统解决方案建立在企 业原有数据库系统之上,通过分析各种数据之间的关联,针对不同的客户建立 不同的联系,最大化实现客户价值、保持客户的忠诚度,为企业管理层提供正 确的决策支持,提升企业的竞争能力和盈利能力【1 0 l 。客户关系管理系统的建设 对于企业的发展有重大意义。因此,充分利用企业的信息资源,以客户为中心, 将数据仓库和数据挖掘技术同市场营销相结合,从大量的数据中抽取有用的商 业信息,实现经营管理中的决策支持,从而提高客户关系管理系统的时效性, 在当今的信息时代具有非常重要的意义和巨大的实用价值。 本文将通过对数据挖掘和客户关系管理的重要理论进行研究,试图将数据 挖掘技术和客户关系管理结合起来,在潜在客户发现、客户等级分类和客户流 失预警3 个方面做出尝试。 1 5 本文结构 本文共分为六章 第一章为绪论,描述了本文的研究背景,概括了国内外数据挖掘技术研究 现状和客户关系管理的发展状况,并陈述了国内企业信息化和“以客户为中心一 战略转变中存在的问题。由此引出了本文研究的内容和意义。 第6 页 北京邮电大学硕士研究生学位论文 第二章为客户关系管理重要理论。具体阐述了客户关系管理系统的概念理 解、主要特点和实施意义所在。 第三章为数据挖掘理论研究。主要描述了决策树算法和b p 神经网络模型 的基本理念和实施过程。 第四章为客户关系管理系统综合决策部分中潜在客户发现、客户等级评价 和客户流失预警三个模块的设计与结果分析。 第五章为客户关系管理客户关系管理系统综合决策部分中潜在客户发现、 客户等级评价和客户流失预警三个模块的展示和使用,以及关系管理中其他模 块的功能简述。 第六章为结束语。总结全文,提出有待进一步研究的方向。 第7 页 北京邮电大学硕士研究生学位论文 第二章客户关系管理基本理论 2 1 客户关系管理的基本概念 信息时代是一个“以客户为中心一的时代,企业已经不再只是闭门造车研 发产品而是走到客户当中来,全心全意为客户服务,真正把客户当作上帝。客 户关系管理( c u s t o m e rr e l a t i o n s h i pm a n a g e m e n tc r m ) 就是企业利用信息技术, 通过对客户的跟踪分析,深层次的了解客户,并有针对性的热情服务,以期留 住老客户、吸引新客户的手段和方法。时代在发展科技在进步,现如今产品的 质量优势己经难以留住客户的心,服务才是克敌制胜、提高竞争力的法宝。对 企业来说,针对每个客户的不同需求,提供更为个性化的服务己成为当务之急。 众多的企业已经认识到,实施客户关系管理,能帮助企业深入了解客户需求, 及时将客户意见反馈到产品、服务设计中,为客户提供更为个性化的深层次服 务。 2 1 1客户关系管理的定义 客户关系管理目前还没有十分统一的定义,不同的研究机构或公司或学者 有着不同的表述。 最早提出c r m 的g a r t n e tg r o u p 认为,所谓的客户关系管理就是:为企业提 供全方位的管理视角;赋予企业更完善的客户交流能力,最大化客户的收益率。 c r m 产品市场的领导者i b m 所理解的客户关系管理包括企业识别、挑选、 获取、发展和保持客户的整个商业过程。i b m 把客户关系管理分为三类:关系管 理、流程管理和接入管理。 另外,还有很多其他机构与学者提出了各自不同的c r m 的定义。例如: c r m 是企业与其客户的交流方式,它实施于企业的市场营销、销售、服务与技 术支持等与客户有关的领域。c r m 是通过发现、赢得、发展、保持最有价值的 客户群体,提高客户满意度以获得理想利润的商务战略。通过获得更多的客户 线索、更广泛地共享客户信息,协同工作,增加收益,为客户提供更高的价值, 实现企业和客户的“双赢 。 归纳众多国外著名研究机构和跨国公司对c r m 的理解,现实中c r m 概念 可以从四个层面来表述: 第8 页 北京邮电大学硕士研究生学位论文 ( 1 ) c r m 是一种现代经营管理理念。 以客户为中心,视客户为企业最为宝贵的资源。彻底从过去追求产品质量, 追求产品个性化的产品为中心的思维中解脱出来;彻底从过去追逐市场扩张, 追逐产品营销策略的销售额至上的思维中解脱出来;彻底从过去成本控制,精 细化管理的以利润为中心的思维中解脱出来。保证产品质量,产品营销推广, 成本管理这些都只是为了更好的为客户服务的手段。企业要更多的将注意力集 中在客户身上,深度发掘客户个性化的需求,建立企业和客户之间长期而稳定 的沟通关系,使得客户可以不断的为企业带来利润。 ( 2 ) c r m 包含的是一整套解决方案。 作为解决方案,c r m 集合了i n t e r n e t 和电子商务、呼叫中心、数据仓库和 数据挖掘、专家系统和人工智能、多媒体技术等当今最新的信息技术以及他们 需要的相应硬件环境。在对企业运营、研发、战略、推广等各个方面进行识别 和分类,清晰地理解和决定整个企业运转流程基础上建立一套统一的数据管理 系统,使各部门之间能保持信息一致性。只有实现了企业信息流动自由和一致, 才能给客户提供有效及统一的服务,以赢得客户的满意。 ( 3 ) c r m 意味着一套应用软件系统。 作为一个应用软件系统,c r m 凝聚了市场营销、数据挖掘等科学的核心理 念。在c r m 系统中,信息技术决不仅仅是帮助企业去收集、存储和展示各种 数据,还包括从所有适当的信息来源中获取知识。 ( 4 ) c r m 是一个具体实施的循环过程 c r m 是发现客户,争取客户,保留客户,再到最终成为客户顾问的一个过 程。在这个过程中企业与客户之间不再是单纯的服务过程,而同时也是将客户 信息转化成积极的客户关系的过程,是连续不断反复循环的实际操作的过程。 2 2 客户关系管理c r m 的主要特征 。一对一营销什、大量的信息交流、商业智能化的数据分析和处理、对于w e b 功能的支持是客户关系管理( c r m ) 的四个主要特征,而c r m 的这些特征并不是 彼此孤立的,而是相互支持、高度融合的一个整体,共同组成了c r m 的强大 功能。 ( 1 ) 一对一营销 第9 页 北京邮电大学硕士研究生学位论文 - 一对一营销”就是企业根据客户的特殊需求来相应调整自己的经营行为, 是“以客户为中心一战略的具体体现,是客户关系管理的核心与基石。”一对一 营销”要求企业与每一个客户建立一种学习型关系。所谓学习型关系是指,企业 每一次与客户的接触都使企业对该客户增长一份了解,客户不断地提出需求, 企业不断地按此需求改善产品和服务,从而使企业不断提高满足该客户需求的 能力。 一般的客户发展阶段是:潜在客户一新客户一满意的客户一留住的客户一 老客户。据统计,开发一个新客户的成本是留住一个老客户所花费成本的5 倍, 而2 0 的重要客户可能带来8 0 0 的收益,所以留住老客户比开发新客户更为经 济有效。 亚马逊网上书店( a m a z o n c o r n ) 就是利用遍及全球的i n t e m e t 同时采用先进 的c r m 系统软件来进行”一对一营销”的。面对数以万计的客户,亚马逊网上书 店具有”惊人的记忆力”和”高度的智力”,从而与客户建立了广泛的”一对一”的学 习型关系,这使得该书店的客户保有率高达6 5 。这么高的客户保有率不仅为 亚马逊带了利润,同时也为这些老客户带来了方便与满意,客户关系管理带的 是双赢。 ( 2 ) 大量的信息交流 企业外部( 企业与客户之间) :c r m 将多种与客户交流的渠道,如面对面、 电话接洽、e m a i l 、f a x 或信函以及w e b 访问协调为一体,这样,企业就可以 按客户的喜好使用适当的渠道与之进行交流。但是无论通过哪种渠道,客户与 企业的交流都必须是无缝的、连贯的,而且是有效率的。 企业内部( 企业内部部门与部门之间) :c r m 解决方案的全部数据应集中 存储和管理,不同部门接触客户后的经验要能立即给其它部门分享交流,使得 企业面对客户时始终保持一致性。 ( 3 ) 商业智能化的数据分析和处理 面对浩如烟海的客户及企业营销、销售和服务信息,如果没有一个具有高 度商业智能的数据分析和处理系统是不可想象的。c r m 将最佳的商业实践与数 据挖掘、数据仓库、一对一营销、销售自动化以及其它信息技术紧密结合在一 起,通过充分挖掘客户的商业行为个性和规律,来不断寻找和拓展客户的赢利 点和赢利空间;另一方面,智能化的数据分析和处理本身也是企业向客户”学习 一的一种高效过程。随著c r m 软件的成熟,将来的c r m 软件不再只是帮助商 业流程的自动化,而是能帮助管理者做决策的分析工具。 第1 0 页 北京邮电大学硕士研究生学位论文 ( 4 ) 对基于w e b 的功能的支持 w e b 在企业内部和外部交流及交易方面日益广泛的使用,使得w e b 功能成 为c r m 解决方案中的关键因素。w e b 不仅对于电子商务渠道是不可缺少的, 它在基础架构方面也是十分重要的。而c r m 应用软件的用户,包括客户和雇 员,都能随时随地访问企业的应用程序。这种访问应当通过通常不需要太多培 训就能轻松使用的标准w c b 浏览器来实现。 c r m 使企业可以通过w e b 直接与客户进行销售和服务,企业还可利用w e b 的电子商务优势来进行自助服务、自助销售、潜在客户开发、时间登记、合同 续订、服务请求以及电话反馈等。所有这些都在时间和空间上极大地扩展了传 统的营销、销售和服务渠道,使企业能够面向全球提供每周7 天、每天2 4 小时 ( 7 x 2 4 ) 的访问,从而达到企业收益机遇的最大化。 2 3 客户关系管理的意义 2 3 1在新时代保持企业的利润 科技在发展时代在进步,现在社会生产力水平获得了前所未有的飞跃。在 很多领域社会的总供给无论从质量上还是数量上都开始慢慢超过了社会总需 求。商家要么刺激新的需求,要么从现有的顾客中创造更多的利润。这几乎是 没有什么选择的。因为社会老龄化进程还在不断推进,依赖人口的增加也就是 总需求的增加来保障企业利润的扩大已经成为美好的过去。 “科技及风险资本的大兴其道,使得新产品入市到成熟的时间愈来愈短。一 其导致的结果有: 市场的变化: ( 1 ) 新产品层出不穷,而且质量相差无几,客户的选择非常多,转移成本降 低。那种市场上只有两三种甚至只有一种牌子的消费状况可能很难再出现了。 ( 2 ) 产品生命周期的缩短导致产品在消费者的环境中存在的时间大幅下降, 消费者还来不及对产品产生偏好或者感情,该款产品就已经被新的型号或者新 的产品所替代。消费者选择产品认品牌的时候不再是选某个产品品牌而是某个 公司品牌了。由此,产品品牌的地位下降了,公司品牌的地位上升了。 ( 3 ) 新产品生命周期的缩短决定产品不再重要,产品变成了维持公司与客户 第1 1 页 北京邮电大学硕士研究生学位论文 之间关系的工具。 新产品短暂的生命周期,决定了公司最大的财产不再是某种明星产品而是 与顾客的关系,也就是说阻止产品更新换代,利用一个好的有亲和力的产品抓 住客户已经不可能了,但是我们可以建立一个好的有亲和力的公司来抓住客户。 保持良好的企业和客户的关系,牢牢抓住客户是c r m 的核心工作也是c r m 最 为拿手的工作。 于是顾客购买了什么是次要的,最重要的是你与他建立的关系( 这就是品 牌) ,这种关系构成了你的资产而不是购买本身,这就是说你的公司可以交叉销 售几乎适合与他的所有产品。实际上你和你的客户建立的关系( 品牌) 经过数次 交易和了解后,你的客户的转移成本就会提高,因为竞争者还要对他上同样的 数次了解才能对他的胃口。这实际上说明了另外一个问题,就是你和消费者之 间的关系是由一系列不同的产品来达成的。从某种意义上说:“这就是针对客 户数据的3 6 0 度品牌延伸。一 2 3 2保持企业的判断能力 企业的判断力是企业持续盈利的能力,它是由企业员工的判断力组成的。 过去一方面企业员工之间彼此联系很少,某个顾客的购买喜好只为单个销 售人员所知,到了其他推广或售后服务人员那里就可能无法获得最适意的选择。 企业中每个员工的经验很大程度上只属于他一个人。另一方面企业里的每一位 新员工进来都是从一点经验都没有的新手开始不断的积累经验逐渐成长为一名 经验丰富的老员工。而当他离开另一名新员工进来的时候这个过程又要再来一 遍。 但是有了c r m 以后每一名员工进来以后他所拥有的就是等同于公司年龄 的经验积累。而且这种经验是企业每一个员工的团队经验而不是个人经验。也 就是说这种经验积累过程是大家一起积累的过程而且是不会因为有人离开而减 少的不回溯的过程。 第1 2 页 北京邮电大学硕士研究生学位论文 第三章数据挖掘分类技术 3 1 决策树分类技术 3 1 1决策树概述 决策树算法是一种以决策树这种数据结构为基础的分类算法【1 1 , 1 2 1 。 决策树是一个类似于流程图的树结构,其中每个内部结点表示一个属性上 的测试( 该属性被称为测试属性或决策属性) ,每个分枝代表一个测试输出,而 每个树叶结点代表一个类或类分布。在给未知的样本分类时,由树根开始对该 样本中对象的属性按照顺序逐个测试其值,并且沿着符合条件的分枝向下走, 直至到达某个叶结点,这个叶结点代表的类则为该对象所属的类。 大j :5 0 0 0小i :等j :5 0 0 0 大j :5 0 0 0 小j :耸j :5 0 0 0 否b 6b 图3 - 1 :简早的决果树例f 图3 - 1 为一棵简单的决策树,给出了客户的消费情况。这个例子假定是要 按照客户是否购买电脑将客户进行分类。该客户集合中用来描述客户特征的属 性有年龄,性别和月收入。每个内部结点( 矩形框) 代表客户的属性( 例如有年龄, 性别,月收入) ;每个叶子结点( 椭圆形框) 代表该客户属于的类别( 有买电脑和不 买电脑两类) ;每个分支代表该属性向下需要满足的条件( 如年龄在1 5 到3 5 之 间) 。最左下的叶子结点即表示:如果客户年龄在1 5 到3 5 之间,性别为女性, 而月收入大于5 0 0 0 的时候,认为该客户会购买电脑。 第1 3 页 秒 岁 j 秒 束央 北京邮电大学硕士研究生学位论文 3 1 2决策树算法的基本思想 决策树算法构造决策树来发现数据中蕴涵的分类规则,如何构造精度高、 规模小的决策树是决策树算法的核心内容。决策树构造可以分两步进行。第一 步,决策树的生成:由训练样本集生成决策树的过程。一般情况下,训练样本 数据集是根据实际需要由历史的、有一定综合程度的、用于数据分析处理的数 据集。第二步,决策树的剪枝:决策树的剪枝是对上一阶段生成的决策树进行 检验、校正和修正的过程。主要是用新的样本数据集( 称为测试数据集) 中的数 据校验决策树生成过程中产生的初步规则,将那些影响预测准确性的分枝剪除。 3 1 3决策树的生成 决策树生成的过程中,输入为训练样本数据集,决策树为最终输出结果。 决策树的每一个决策结点对应元组进行分类的一个决策属性( 测试属性) ,分枝 对应着元组按该属性进一步划分的取值特征,叶子代表类或类的分布。首先, 根据用户的实际需要选择类别标识属性( 目标属性) 和决策树的决策属性集, 决策属性集是指在候选属性( 除了类别标识属性之外的所有属性) 中选择的属性 集,然后开始构造决策树。决策树归纳的基本算法是贪心算法,是以自顶向下 递归的各个击破的方式决策树。算法的基本步骤如下: ( d 树以代表训练样本的单个结点开始。 ( 2 ) 如果样本都在同一个类,则该结点成为树叶,并用该类标记。 ( 3 ) 否则,算法选择最有分类能力的属性作为决策树的当前结点。 ( 4 ) 根据当前决策结点属性取值的不同,将训练样本数据集划分为若干子 集。每个取值形成一个分枝,有几个取值形成几个分枝。 ( 5 ) 针对上一步得到的一个子集,重复进行先前步骤,递归形成每个划分样 本上的决策树。一旦一个属性出现在一个结点上,就不必在该结点的任何后代 考虑它。 ( 6 ) 递归划分步骤仅当下列条件之一成立时停止: 给定结点的所有样本属于同一类。 没有剩余属性可以用来进一步划分样本。在这种情况下,使用多数表决, 将给定的结点转换成树叶,并以样本中元组个数最多的类别作为类别标记,同 时也可以存放该结点样本的类别分布。 如果某一分枝决策属性值为a 没有样本,则以样本的多数类创建一个树 叶。 第1 4 页 北京邮电大学硕士研究生学位论文 3 1 4决策属性的选择方法 构造决策树的关键是要选择一个好的划分标准,以决定按哪一个属性进行 节点的划分。一般用统计度量的方法来选择属性对结点进行划分,主要有:信 息增益( i n f o r m a t i o no a i n ) 和基尼指数( g i n i l n d e x ) 两种。 ( 1 ) 信息增益: 分类的目的是提取系统信息,使系统向更加有序、有规则组织的方向发展。 1 9 4 8 年,香农( c e s h a n n o n ) 提出了信息论【1 3 1 ,定义熵( e n t r o p y ) 作为衡量系统混 乱程度的统计量,熵值越大,系统越混乱。由此可见,最佳的方案是使熵减少 量最大的划分方案,划分后熵的减少就是信息增益。因此,选择属性对结点进 行划分的标准应该是选择信息增益最大的属性。经典决策树分类算法i d 3 ,c 4 5 就是使用信息增益作为选择属性对结点进行划分的指标。信息论中对信息量和 熵的定义茭l j 1 4 1 :i n f o r m 口t i o n 。一i 0 9 2 ( 研) e n r t o p y 一一p il 0 9 2 ( 只) 数据集划分前的熵: 对于有s 个数据样本集合s ,其中目标属性c 有m 个不同的离散取值 c l ,c 2 ,勺( 即数据样本s 最终要被分成m 个类别) 。目标属性值为c l ,c 2 ,的 样本数分别墨,s z ,。那么划分之前,样本集s 的总熵( 期望信息) 为: 邢一z , ) i 一善以1 。g : 其中,p ,是s 集中任意一个样本属于类别c 的概率,并用墨厶估计。注意, 对数函数以2 为底,因为信息用二进制编码。容易看出,数据集s 的总熵在划 分前是属于不同类别的样本的信息量的加权平均。 数据集划分后的熵: 一 设属性a 有v 个不同的离散属性值 口- ,口z ,。,口v ) ,可使用属性a 将数据集s 划分为v 个子集 s - ,s z ,s v ,对应每个子集s 中所有样本的属性a 都是口,。 第1 5 页 北京邮电大学硕士研究生学位论文 设子集s ,中的全部样本数为s ,其中目标属性值为c l ,c z ,的样本数为 五,s :p ,钿,则子集墨的熵为:,( s 1 s 2 j s m j ) i 一善珊1 。g z 。 f ) 其中岛4 而卢,是马中样本分别属于类别q 的概率。 使用属性a 把数据集s 划分成v 个子集后,s 的总熵为v 个子集的熵的加 e 翻) 壹当芷三;2 垒“,s :,) 墨芷兰芷二盐 权平均: 箭 s 。 其中 s 为s i 子集的权重,表示s 子集在数据集s 中的比重。 信息增益由系统熵的减少量度,定义数据集s 按属性a 划分后的信息增益 为s 划分前后的熵差:g a i n ( a ) l ,b ,s :,) 一e 似) 算法计算每个属性的信息增益,然后选择具有最高信息增益的属性作为给 定数据集s 的决策属性,创建一个结点,并以该属性标记,对属性的每个值创 建分枝,并据此划分样本。 ( 2 ) 基尼指数( g i n i l n d e x ) 如果决策树是二叉树,常用基尼指数作为选择决策属性的标准1 1 5 1 。数据样 本集s 的分类属性有m 个不同的离散值个类别,那么基尼指数就是 锄f ( s ) - 1 一罗彳 其中p l 是类别出现的概率。如果用属性a 将s 划分成两部分s l ,s 2 。即 这个划分的基尼指数就是:g i n i ( s ) i ( s s ) 事g i n i ( s , ) + ( s 2 s ) 事g i n i ( s 2 ) 执行划分时,选择基尼指数最小的属性对结点数据样本进行划分。决策树 是二叉树时,设属性有v 个离散型取值,则属性a 可有2 v 种划分s 集的方法, 其中一个划分方法的基尼指数最小,称之为属性a 的最佳划分。在选择结点最 佳划分时,首先找出每个属性的最佳划分方法,再比较所有属性的最佳划分方 法,最后确定结点的最佳划分。 1 6 l 3 1 5决策树的修剪 在决策树分类算法中,除了分类的正确性是要首先考虑的因素外,决策
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 腹泻的中医辩证分型及治疗
- 课件开头动画教学课件
- 精准开采课件教学课件
- 胃肠道术后饮食护理
- 虫咬伤课件教学课件
- 2.3.1物质的量+课件高一上学期化学人教版(2019)必修第一册
- 犬咬伤应急演练方案
- 高血压预防:控制血压的方法
- 解决方案总监年终述职
- 舞者表演规范
- 第2章离散傅里叶变换(DFT)课件
- 二年级音乐节奏训练课-动起来教学教案
- 决策心理学第二讲课件
- 舞蹈教室使用记录表
- 提高输液执行单签字规范率品管圈汇报书模板课件
- 教学第七章理性情绪疗法课件
- 北师大版六年级数学上册《比的应用》习题
- 手术器械传递的原则与方法课件
- 小学五年级整本书阅读方案
- 《长相思》 完整版课件
- 作品赏析:《雷雨》集中尖锐的矛盾冲突
评论
0/150
提交评论