(计算机应用技术专业论文)数据挖掘技术在客户关系管理中的应用研究.pdf_第1页
(计算机应用技术专业论文)数据挖掘技术在客户关系管理中的应用研究.pdf_第2页
(计算机应用技术专业论文)数据挖掘技术在客户关系管理中的应用研究.pdf_第3页
(计算机应用技术专业论文)数据挖掘技术在客户关系管理中的应用研究.pdf_第4页
(计算机应用技术专业论文)数据挖掘技术在客户关系管理中的应用研究.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 fft i i i ii ii l l i i ri i i ii ii irl r r l l l f | y 17 4 6 6 3 7 摘要 在日益激烈的市场竞争中,传统的以产品为中心的市场战略逐步被以客户 为中心、以服务为目标的市场战略所取代,企业面临前所未有的市场化和客户 个性化的挑战。先进的信息化系统,使企业积累了大量的客户和产品销售数据, 数据挖掘技术能够有效管理和运用这些快速增长的数据,实现c r m 的理念和 目标。数据挖掘运用于c i r r i 系统可以深入分析客户数据,得到隐含的有价值 信息,并制定相应的销售手段,使客户的收益率最大化。 数据挖掘技术是c r m 系统的关键实施环节,本文结合客户数据信息来研 究如何在c 蹦中使用数据挖掘技术。首先,依据不同的数据挖掘理论应用与 客户关系管理的各个层面,介绍了客户关系管理、数据挖掘、数据挖掘技术在 客户关系管理中应用的基本理论、国内外应用现状,突出了数据挖掘在客户关 系管理中的重要作用,阐述了数据挖掘技术处理c r m 问题的详细流程。其次, 着重探讨了以下几个问题:客户管理的目标:防止客户流失,使客户产生更大 的价值;客户分类、交叉销售、客户获取保持的需求分析及算法设计。最后, 应用经典a p f i o f i 算法和分段优化的f p - t r c e 算法,挖掘客户关系管理系统数据 库中客户购买不同产品的关联性,避免了脱离市场、脱离需求所造成的损失, 节约了资金,提高了效益。 关键词:数据挖掘;客户关系管理;算法;关联规则 i i a b s t r a c t a bs t r a c t i nt h ei n t e n s em a r k e tc o m p e t i t i o n ,t h et r a d i t i o nt a k et h ep r o d u c ta st h ec e n t r a l m a r k e t i n gs t r a t e g yt a k et h ec u s t o m e ra st h ec e n t e r , t a k ei ss e r v e dg r a d u a l l yd a yb yd a y 嬲t h e g o a lm a r k e t i n gs t r a t e g ys u b s t i t u t e s ,e n t e r p r i s ef a c e dw i mu n p r e c e d e n t e dm a r k e t a b i l i t ya n d c u s t o m e rp e r s o n a l i z a t i o nc h a l l e n g e t h ea d v a n c e di n f o r m a t i o n i z a t i o ns y s t e m , m a d et h e e n t e r p r i s et oa c c u m u l a t et h em a s s i v ec u s t o m e r sa n dt h ep r o d u c ts a l ed a t a , t h ed a t am i n i n g t e c h n o l o g yc a nt h ee f f e c t i v em a n a g e m e n ta n du t i l i z e st h e s es w i f tg r o w t h st h ed a t a , r e a l i z e d t h ec r mi d e aa n dt h eg o a l t h ed a t am i n i n gu t i l i z e si nt h ec r ms y s t e mm a ya n a l y z et h e c u s t o m e rd a t at h o r o u g h l y , o b t a i n st h ec o n c e a l m e n tt oh a v et h ev a l u ei n f o r m a t i o n , a n d f o r m u l a t e st h e c o r r e s p o n d i n gm a r k e t i n gs t r a t e g y , c a u s e st h ec u s t o m e rt h er e t u r n sr a t i o m a x i m i z a t i o n t h ed a t am i n i n gt e c h n o l o g yi st h ec r m s y s t e m sk e yi m p l e m e n t a t i o nl i n k , h o wt h i sa r t i c l e u n i f i e st h ec u s t o m e rd a t am e s s a g et os t u d yt h es e r v i c ed a t au n e a r t h st h et e c h n o l o g yi nc r m f i r s t , r e s t so nt h ed i f f e r e n td a t am i n i n gt h e o r ya p p l i c a t i o na n dc u s t o m e rr e l a t i o n s m a n a g e m e n te a c hs t r a t i f i c a t i o np l a n e ,i n t r o d u c e dt h ec u s t o m e rr e l a t i o n sm a n a g e m e n t , t h e d a t am i n i n g , t h ed a t am i n i n gt e c h n o l o g yi nt h ec u s t o m e rr e l a t i o n sm a n a g e m e n tt h e a p p l i c a t i o ne l e m e n t a r yt h e o r y , i n t r o d u c e dt h ed o m e s t i ca n df o r e i g na p p l i c a t i o np r e s e n t s i t u a t i o n ,h a sh i g h l i g h t e dt h ed a t am i n i n gi nt h ec u s t o m e rr e l a t i o n sm a n a g e m e n ti n f l u e n t i a l r o l e ,e l a b o r a t e dt h ed a t am i n i n gt e c h n o l o g yd e a l sw i t ht h ec r mi s s u et h ed e t a i l e df l o w n e x t ,h a sd i s c u s s e dt h ef o l l o w i n gs e v e r a lq u e s t i o n se m p h a t i c a l l y :c l i e n tm a n a g e m e n tg o a l : p r e v e n t st h ec u s t o m e ro u t f l o w , c a u s e st h ec u s t o m e rt oh a v eag r e a t e rv a l u e ;t h ec l i e n t s e g m e n t a t i o n , t h eo v e r l a p p i n gs a l e ,t h e c u s t o m e rg a i n m a i n t a i nd e m a n da n a l y s i sa n d a l g o r i t h md e s i g n f i n a l l y , t h ef p - t r e ea l g o r i t h mw h i c ho p t i m i z e su s i n gt h ec l a s s i c sa p r i o r i a l g o r i t h ma n dt h ep a r t i t i o n ,i nt h ee x c a v a t i o nc u s t o m e rr e l a t i o n sm a n a g e m e n ts y s t e m m a n a g e m e n ts y s t e md a t a b a s et h ec u s t o m e rp u r c h a s ed i f f e r e n tp r o d u c tr e l a t e d n e s s ,a v o i d e d b e i n gs e p a r a t e df r o mt h em a r k e t , b e i n gs e p a r a t e df r o mt h el o s sw h i c ht h ed e m a n dc r e a t e d , s a v e dt h ef u n d ,r a i s e dt h eb e n e f i t k e y w o r d s :d a t am i n i n g ;c u s t o m e rr e l a t i o n sm a n a g e m e n t ;a l g o r i t h m ;c o n n e c t i o nr u l e i i i 目录 目录 第l 章绪论1 1 1 研究的背景和意义1 1 2 国内外研究现状1 1 3 本课题主要研究工作4 1 4 本文结构4 第2 章数据挖掘技术概述6 2 1 数据挖掘的概念6 2 2 数据挖掘的流程7 2 3 数据挖掘的模式9 2 3 1 分类模式1 0 2 3 2 聚类模式1 1 2 3 3 关联模式1 2 2 3 4 序列模式1 2 2 4 数据挖掘的应用1 3 2 5 数据挖掘中存在的问题1 3 第3 章客户关系管理概述1 5 3 1 客户管理的涵义1 5 3 2 c r m 的产生与演变过程1 5 3 3c r m 的定义和内涵1 6 3 4c r m 的分类1 7 3 5c r m 系统的作用1 8 3 6c r m 系统的发展趋势1 9 第4 章c r m 中的数据挖掘模型和算法设计j 2 1 4 1 需求分析和模型选择2 1 4 1 1 客户群体分类分析2 1 4 1 2 交叉销售分析2 2 i v 目录 4 1 3 客户获取与客户保持2 3 4 1 4 客户满意度分析2 4 4 i 5 客户信用分析2 4 4 i 6 客户盈利能力分析和预测2 5 4 2 数据挖掘算法设计2 5 4 2 i 决策树算法2 5 4 2 2 关联规则算法2 7 第5 章数据挖掘在c r m 中的应用研究3 5 5 i 客户分类的数据挖掘应用3 5 5 1 1 数据准备3 5 5 1 2 实例研究3 6 5 2 交叉销售的数据挖掘应用3 9 5 2 1 数据准备3 9 5 2 2 模式实现4 0 5 2 3 实例应用4 2 5 3 客户获取保持的数据挖掘应用4 3 5 3 1 客户获取应用4 4 5 3 2 客户保持应用4 5 第6 章总结和展望4 8 6 1 工作总结4 8 6 2 工作展望4 8 致谢5 0 参考文献5 l 攻读学位期间的研究成果5 4 v 趋于同质化,市场竞争日益激 企业内部管理的模式已经阻碍 应速度快,谁就将在激烈的市 企业不断寻求新的经营管理途 径以提高自身的竞争能力,将管理重心由企业内部逐步转移到企业外部。传统 的以产品为中心的市场战略,逐渐被以客户为中心,以服务为目标的市场战略 所取代【2 】。企业通过客户关怀,及时了解客户的需求,利于建立长期的客户关 系。客户关系管理c r m ( c u s t o m e rr e l a t i o n s h i pm a n a g e m e n t ) i e 是顺应这种发展 的需求而出现的一种新型商业模式,企业将客户作为一切工作的出发点,比过 去更加重视客户满意度、忠诚度和利润贡献率的提升,c r m 也逐步得到了普及 和发展1 3 。 进行有效c r m ,必须通过有效途径,从储存大量客户信息的数据中进行深 层分析,获得利于商业运作、提升企业市场竞争力的有效信息【4 】。而实现有效 管理的关键技术就是数据挖掘( d a t am i n i n g ) ,即从海量数据中挖掘出更有价值 的潜在信息,有助于企业更好地管理客户关系,实现c r m 的目标【5 1 。因此,在 c r m 中有效运用数据挖掘技术,已经成为当前企业急需解决的问题。 1 2 国内外研究现状 在电子商务时代,信息技术改变了市场的商业模式,对企业与客户之间的 关系产生了巨大的影响。通过数据挖掘,可以从市场与客户中搜集积累的大量 数据中高效地挖掘出客户最关心的问题,将客户意见及时反馈到产品生产及销 售中,并为客户提供个性化、深入化的服务,已成为当今企业成功的关键【6 】。 第1 章绪论 一、数据挖掘的现状 随着科技进步,企业数据量不断增长,数据挖掘技术的应用范围逐步扩大。 各个领域都投入了大量精力来研究数据挖掘,它主要研究的是使用各种理论及 方法,从数据库中提取潜在的和有用的知识和模式,并有效运用于后期工作。 由美国人工智能协会主办的数据库中的知识发现国际研讨会已经召开了7 次, 研究重点逐渐从发现方法转向系统应用 7 1 。g a r t n e rg r o u p 的一次技术调查结果 表明,未来五年对工业产生深远影响的五大关键技术之首的是数据挖掘和人工 智能【8 】。数据挖掘的研究掀起了继互联网之后信息技术领域的又一新浪潮。 与国外相比,国内对数据挖掘的研究起步稍晚,1 9 9 3 年国家自然科学基金 首次支持国内对该领域的研究项副9 】。目前,国内的许多科研单位和高等院校 ( 包括清华大学、中科院计算技术研究所等) 都开展了知识发现的基础理论及 应用研究。这些研究主要集中在非结构化数据的知识发现,对模糊方法在数据 挖掘中的应用研究,对关联规则开采算法的优化和改造,w e b 数据挖掘等。计 算机的普及应用及数据量的不断积累,使数据挖掘在我国也逐步形成一个产业。 二、c 砌讧的现状 计算机的普及,科技水平的提高,不但使信息量剧增,还使生产力得到了 很大提高【1 0 1 。消费者、生产者都能很快得到各种有效信息,以适时改变自己的 习惯和行为。生产力的提高,使市场供给超出了人们的需求,市场逐渐由卖方 市场转变为买方市场,市场竞争日益激烈【i i 】。因此,在多变的市场中进行客户 保持、新客户获取成为企业成长和发展的关键【1 2 】,c r m 逐渐得到重视和推崇, 人们越来越关注c r m 的内涵,其关系理念逐步渗透到各行各业。 c r m 在国外起步较早,发展较快,具有一定规模和市场占有率的企业都采 用了自己的c r m 系统。目前,c r m 在软件设计和功能模块上已经取得了非常大 的进展,模块之间的集成也越来越紧密。以s a p ,o r a c e l ,s i e b l e ,i b m 等为代 表的一批顶级i t 企业已经在本领域部署着c r m 解决方案。o r a c l e ,s ie b e l 等 软件巨头业已视c r m 为重要的发展方向,成为c r m 应用中的主流厂商【1 3 1 。全球 2 第1 章绪论 c r m 市场达到1 1 4 亿美元,亚太区c r m 应用的市场收入从2 0 0 3 年的2 2 4 1 亿美 元增长到2 0 0 8 年的4 1 5 5 亿美元【1 4 】。 我国于2 0 0 0 年开始了对c r m 的研究,银行和电信业率先应用c r m 。在我国 c r m 的发展经历了两个阶段,一是c r m 的引入,主要是介绍和引进国外c r m 的 理论及实际;二是c r m 的应用,开发c r m 系统并应用于企业【1 4 1 。一些大公司首 先使用c r m 项目,比如o r a c l e 实施的是上海航空、广东美的;s i e b l e 实施的 是上海通用、北京联想。 三、数据挖掘应用于c r m 的发展和现状 c r m 中的数据挖掘是数据库领域中最重要的课题之一。1 9 8 9 年在美国底 特律第一次召开关于数据挖掘与知识发现的研讨会,第一次提出了知识发现一 词,简称k d d ( k n o w l e d g ed i s c o v e r yi nd a t a b a s e ) ,泛指从源数据中发掘模式的 方法,整个数据发现的描述过程,包括制定业务目标到最终的结果分析【1 5 】。目 前,数据挖掘应用的成功案例越来越多,显示了数据挖掘的强大生命力: 世界最大的啤酒进出口商b a s se x p o r t ,在国内外有大量的交易市场,每周 有几万份订单。要做好这些工作就必须熟知客户的习惯,平日的爱好等等, b a s s e x p o r t 圆满解决上述问题的方法是使用i n t e l l i g e n tm i n e r 强大的数据展示技 巧和并行计算能力。s p s s 公司的c l e m e n t m e 数据挖掘平台,通过可视化工作流 程实现数据挖掘,提升数据库和数据仓库的投资回报率【1 5 1 。除此之外,数据挖 掘工具还成功地应用在体育、电信、保险、零售等各个方面。 我国很多软件公司已开始研发c r m 产品,并取得了一定成果。其成果主 要分为两类:一类是专业c r m 供应商,如创智c r m ,联成互动m y c r m :另 一类是用友、金蝶等综合管理软件商从e r p 向c r m 的扩展【1 6 1 。这些c r m 产 品目前主要是对客户信息的分析统计,对数据挖掘部分比较弱化。但随着c r m 的发展,数据挖掘技术在c r a m 方面的应用范围越来越广泛,促进了我国企业 对c r m 的研究逐步深入,应用水平不断提高。 总之,作为一个跨知识管理、业务运作和电子商务等系统的融合概念,c r m 3 第1 章绪论 正在改变企业的营销观念,改善企业与客户的关系,帮助企业发现潜在客户和 市场,从而获取更高利润【1 7 1 。数据挖掘在激烈的市场竞争中,帮助企业了解客 户特点确定需求,使企业进行针对性服务,在c r m 中的应用逐渐成为现代企 业生存的根本和制胜的关键【1 8 1 。 1 3 本课题主要研究工作 本课题主要研究工作分为以下几个部分: 第一部分主要是基础理论研究。首先阐述了c r m 基础理论、数据挖掘基 础理论以及数据挖掘在c r m 领域中的应用现状,然后根据c r m 实际应用的特 点,介绍了数据挖掘技术在c r m 中应用的具体流程,分析了数据挖掘技术在 应用时所存在的实际问题,并阐述了相应的解决办法。 第二部分是对几种数据挖掘方法进行研究和应用分析。结合数据挖掘方法 要求,根据c r m 这一应用领域的特点,选用关联规则分析方法对c r m 的数据 进行关联分析,重点研究两种关联规则分析算法:经典a p f i o d 算法,以及一种 优化的f p t r e e 算法在c r m 中的应用。 第三部分在实际应用的基础上,给出了数据挖掘技术在处理c r m 具体问 题时的流程、步骤及每一步相关的技术、方法和工具,对解决c r m 中的应用 问题具有一定的代表性,也为数据挖掘技术在c r m 领域的应用发展做出了一 些新的探索和尝试。 1 4 本文结构 本文研究数据挖掘在c r m 中的应用,主要包括以下内容: 第一章对本文研究背景、研究意义和国内外c r m 和数据挖掘的研究现状 做了简要的论述。 第二章对数据挖掘技术进行介绍,包括:数据挖掘概念、数据挖掘流程和 数据挖掘的模式及应用概述。 4 算法为理论基础。 第六章总结全文的工作,并展望数据挖掘技术在c r m 中的应用前景。 5 第2 章数据挖掘技术概述 第2 章数据挖掘技术概述 计算机技术的普及使人们收集、加工、组织、生产的能力逐步提高,各种 类型的数据库不断出现,并在科研、电商、零售业、政府办公等方面发挥着巨 大的作用。如何提高信息利用率? 如何从海量的数据中迅速获取有用的信息? 运用数据挖掘技术能够很好地解决这些问题。 2 1 数据挖掘的概念 什么是数据挖掘? 狭义的数据挖掘是利用各种分析工具在大量数据中发现 数据和模型之间关系的过程,它是知识发现过程中的一个步骤,是知识发现最 核心的过程。广义的数据挖掘是数据库中的知识发现( k n o w l e d g ed i s c o v e r yi n d a t a b a s e s ) ,简称知识发现( k d d ) 【1 9 1 。这个定义包括好几层含义:数据源必须 是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可 接受、可运用,仅支持特定的发现问题,可以被用于信息管理、决策支持、过 程控制及数据维护。因此,数据挖掘作为一门新兴交叉学科,把人们对数据从 简单查询,提升到从数据中挖掘知识,它包括机器学习、数理统计、神经网络、 数据库、模式识别、粗糙集等相关技术【2 0 】。 使用数据挖掘的前提一般没有确定的假设,从而发现事先未知的、有效和 实用的知识,这些知识不但不能直觉发现,而且可能是不符合直觉常理。事实 上挖掘出的知识越是预料之外,可能就越有价值【2 1 1 。 数据挖掘具有以下特点: 1 、海量性。处理的数据规模庞大,达到g b ,t b 数量级,甚至更大。 2 、复杂性。数据挖掘有能力对复杂的数据关系进行建模,适合解决复杂的 问题。 3 、可用性。数据挖掘的目标是发现知识,根据历史数据提出规则和知识, 并管理和维护规则,运用挖掘结果指导企业的行为。 6 第2 章数据挖掘技术概述 4 、相对性。数据挖掘是运用统计规律来发现各种规则,所以在这一过程中 可能会发现大量的规则,而这些规则不可能适于所有数据。当达到某一临界值 时就认为该规则有效。 5 、动态性。数据库中的数据是不断更新的,而使用数据挖掘所发现的规则 只适于当前时段的数据库,所以数据挖掘具有的规则是动态的。 2 2 数据挖掘的流程 在实际应用中,要进行数据挖掘首先必须深入研究挖掘对象,不同挖掘技 术运用于不同对象。所以,我们首先要熟知挖掘对象的背景,明确工作目的, 然后才是选择相关挖掘技术,开始数据挖掘进程。 l 矿 八八n八 卜 触逍处理 被转 触取 被$ 、 一择的 ,、。f 后的l,一换训 。f 样本i ,一化自 锣 7 薮垢数据 7 数据 数彰 uvpc r1,1 数据选择数据预处理数据转换数据挖掘分析和同化 图2 1 数据挖掘的基本过程和主要步骤 数据挖掘的流程一般由5 个阶段组成:数据准备、数据选择、数据预处理、 数据挖掘及结果表达和解释。图2 1 描述了数据挖掘的基本过程和主要步骤, 其中各步骤是按一定顺序完成的。 1 ) 确定业务对象 在数据挖掘中确定被研究的业务对象是整个过程的基础,这一过程分析即 将进行数据挖掘的业务领域,了解业务内容,确定业务对象,并作出可行性分 析及评价。它对整个数据挖掘过程起到驱动作用,是检验最终结果和指导完成 挖掘过程的依据,是制定挖掘计划实施步骤和数据结果的评价标准圈。 2 ) 数据准备 7 第2 章数据挖掘技术概述 数据库中数据量大,数据结构复杂,因此数据准备是数据挖掘工作关键的 第一步,其好坏直接影响到数据挖掘的效率和准确度,以及最终模式的有效性。 这个阶段可以划分以下步骤: 数据收集或获取。收集和抽取各种类型的数据,并对这些数据进行合并 处理,可以采用数据库的查询、选择、汇总等操作确定各种相关业务数据集合, 以提高效率。 数据集成,将多种数据组合在一起,有效分析及决策的前提是具有全面 而正确的数据。搜索所有与业务对象有关的内外部数据信息,选择出挖掘相适 用的数据,提取规则并将多个数据源中的数据存放在统一的数据仓库,这样可 以统一数据格式,消除冗余。 3 ) 数据选择及数据预处理 数据选择是指从集成后的数据中检索与任务相关的数据集合,缩小范围, 保证数据正确性及完整性。 数据预处理。根据实际的任务目标制定数据清理的规则,检查所提取的数 据的合法性,处理数据的噪声、重复及冗余等,填补记录中丢失的数据及不确 定的数据属性,以提高数据质量,确定将要进行的挖掘操作类型。 4 ) 数据挖掘 对所得到的经过转换的数据进行挖掘。除了确定挖掘模型,选择并完善挖 掘算法外,其余大部分工作都利用数据挖掘工具自动完成,数据挖掘人员需要 在挖掘过程中不断地加入人机交互,以把握数据挖掘的准确性。 8 第2 章数据挖掘技术概述 图2 2 数据挖掘建模示意图 建立模型是数据挖掘中一个反复的过程( 如上图2 2 ) 。第一步是选择模型, 这一模型适合需要解决的问题并完成数据的理解、修正及决定数据的预处理工 作。例如,数据转换在神经网络需进行,某些数据挖掘工具可能限制输入数据 的格式等。第二步是建立模型,模型的建立需要使用各种数据反复测试、反复 验证并训练使用,才能使其准确率不断提高。 5 ) 结果表达和解释、知识的同化 数据挖掘之后,需要对这一过程进行解释并评估结果。对挖掘结果的评价 要以最初制订的目标为依据,并评价所发现模式的有效性,评价挖掘的结果并 解释它的价值。如果某些模式不能满足任务的要求,就需要使用以上步骤反复 提取,使挖掘结果更有效、更准确。最后是知识的同化,将分析所得到的知识 集成到业务信息系统的组织结构中去。 数据挖掘完整过程的工作大多数需要人工完成。调查表明,在数据挖掘过 程中6 0 的工作是数据准备,而挖掘工作仅占总工作量的1 0 【2 3 1 。在实际工作 中,模型的准确率会因为数据的不同产生变化,因为建立模型时潜意识用到各 种假设,所以要想建立理想的模型,必须反复验证、测试、修改。 2 3 数据挖掘的模式 数据挖掘的模式按其功能可分为预测型模式和描述型模式。预测型模式是预 9 第2 章数据挖掘技术概述 测某种结果及发展趋势的模式,它是依据数据项的值来确定,这一模式的结果是 可预测的。描述型模式是描述数据库中的数据存在的规则,也可以把相似的数据 进行分组,但该模式不能直接预测。 根据实际作用分析的方法,数据挖掘可以分为四类:分类模式分析、聚类 模式分析、关联模式分析、序列模式分析。 2 3 1 分类模式 分类模式中使用分类器,分类器的输入称“训练集 ,在训练集中找出共同 的特性,然后根据分类模型进行分类,训练集中的每个元组的属性都有一个类 标志。根据数据特性,分类器为每一个类找到准确的描述或者模型,由此生成 的类描述可以分类未来的测试数据,使这些未来的测试数据由未知的类预测出 它所属的类。 分类算法依据它的技术特点分为以下几类:决策树分类算法、b a y e s 分类 算法、基于关联规则的分类算法以及利用数据库技术的分类算法等。 ( 1 ) 决策树分类算法 决策树是用于分类和预测的主要技术,经典的算法有c l s ,i d 3 ,c 4 5 等。 决策树的分析预测模型类似一棵树,树的根结点是一个数据集合空间,每个分 支结点是一个分类问题,即对一个单一属性的测试,根结点到叶结点的一条路 径对应着一条规则,整棵决策树对应着一组分类表达式规则。 决策树分类算法的优点是:决策树的每个分枝都对应一个分类规则,产生 的分类规则易于理解,最终输出的是一个容易理解的规则集;速度比其他分类 方法快;分类准确率相对较高c 2 4 j 。但这种算法也存在一些不足:对连续性的 字段比较难预测。对有时间顺序的数据,需要进行许多预处理的工作。缺 乏伸缩性,由于算法受内存限制,难以处理大训练数据集。 s l i q 和s p r i n t 算法对决策树算法进行了改善,s l i q 算法可以处理大规 模的训练样本集,具有较好的伸缩性,在算法中运用了一些特殊数据结构,但 s l i q 算法具有主存容量的限制。s p r i n t 算法克服了s l i q 内在的限制,能够 1 0 第2 章数据挖掘技术概述 处理超大规模训练样本集,并引入了并行算法的方式,增强了可伸缩性。 s p r i i n t 算法还改进了决策树算法的数据结构,将类别列合并到每个属性列表 中,这样在遍历每个属性列表寻找当前结点的最优分裂标准时,不必参照其他 信息。 ( 2 ) b a y e s 分类算法 b a y e s 分类算法是利用概率统计知识来进行分类,使用b a y e s 定理可以预 测并分析未知类别的样本属于哪个类别的可能性,并将其中可能性最大的类别 作为该样本的最终类别,比如n b 算法。 b a y e s 决策是动态的决策,在决策过程中不断进行知识更新,能利用先验 信息与样本信息得到后验信息,还可以用后验信息与所能得到的信息综合考虑 得到又一后验信息。若有新的变化则可以再综合已有信息得到新的后验信息, 然后根据后验信息作出决策1 2 5 1 。 ( 3 ) 关联规则的分类算法 基于关联规则的分类算法是通过发现训练集中的关联规则来构造分类器, 比如c b a 算法。c b a 算法构造分类器有以下两步:找到全部右部为类别的 类别关联规则c a r ;从c a r 中再选择高优先度的规则,覆盖训练集。 ( 4 ) 数据库技术的分类算法 数据挖掘研究是从数据库领域的研究开始的,但就目前而言,多数算法还 没有使用数据库的一些技术,数据库系统不能较好地集成于数据挖掘应用,这 也是数据挖掘领域研究的一个关键问题。目前有m i n d 和g a c r d b 是用于此 问题的分类算法。 2 3 2 聚类模式 将整个数据对象划分成不同的类或簇就是聚类模式。这一模式中,同一簇 中各对象间相似度较高,不同簇中的对象则差别较大,并由聚类工具来定义标 准,在进行聚类操作时不存在任何已知类别,对输入的记录集划分,不同的聚 类功能会生成不同的划分。 第2 章数据挖掘技术概述 聚类模式的数据挖掘发现的记录,可以是与一般常理或通常行为相违背,这 称为o u t l i n e rm i n i n g ,还可以发现一些特殊客户的购买行为( 包括收入特别高或 特别低的客户) 。这个过程首先要定义好“特例”记录是什么样的记录,然后根 据定义使用有效的方法来发现这些特例。 2 3 3 关联模式 关联模式是一种常用的模式,是目前数据挖掘领域重要的研究方向之一。 它是通过发现数据的相关性,挖掘出隐藏在数据间的联系,寻找在同一个事件 中出现的不同项的相关性【2 6 】。 关联规则提示了数据与数据之间的相互依赖关系。对于事务数据库中大量 的关联规则,一般人们感兴趣的是其中满足一定的支持度和置信度的关联规则, 所以通过确定最小支持度和最小置信度两个阈值找到有意义的关联规则,才是 人们感兴趣且有利的关联规则。前者是一组项集在统计时需满足的最低程度, 即用户规定的最小支持度;后者反应了关联规则的最低可靠度,即用户规定的 最小置信度,它解决的问题如下:找到所有支持度大于等于最小支持度的项 目集( 即频繁项目集) 。使用找到的频繁项目集,产生期望的规则。 2 3 4 序列模式 和关联模式相似,序列模式的目的也是为了挖掘数据间的联系,但与关联 模式不同的是,数据间的前后序列关系是序列模式分析的重点。序列模式是用 已知的值来预测未来的值,但这些值所处的时间不同,序列模式重点是各事件 间的时间相关性。比如一数据库中,“在某一时间内,客户购买顺序为商品a , 商品b ,商品c ,即序列a b c 出现的频度较高。在进行序列模式分析时, 同样也需要由用户输入最小置信度c 和最小支持度s ,以发现满足一定的支持 度和置信度的知识。 在实际应用中,往往要将多种模式进行结合使用。比如,使用关联模式可 以找出具有共同大购买力的商品类型,使用序列模式可以找出购买了a 商品接 1 2 第2 章数据挖掘技术概述 着购买b 商品的群体,这就可以对某一类商品或某一类用户进行一般性描述。 2 4 数据挖掘的应用 数据挖掘技术不但对特定数据库的简单检索及调用,还可以通过事件的关 联性,预测并指导下一步的工作。在当前的电子商务环境下,数据挖掘技术的 影响越来越大,应用领域也越来越广。 ( 1 ) 企业应用。这是数据挖掘技术应用最早也是最重要的领域,其应用主 要有市场营销、产品制造、决策支持等。 ( 2 ) 科学研究。数据挖掘在科学研究方面有着广泛的应用,能够实现生物 研究、医药研究、天文学研究等等。 ( 3 ) w e b 挖掘。因特网是全球最大的、最有影响力的信息网络,w e b 挖掘 利用数据挖掘技术可以发现和获取信息,进行w e b 内容挖掘、记录挖掘等。 ( 4 ) 医学上的应用。利用数据挖掘可以提高效率和效益,实现药物合成、 医疗疹断等。 ( 5 ) 在金融上的应用。利用数据挖掘对各种数据进行深入分析,如金融分 析领域有投资评估、股票交易、市场预测等,辨别出可能的欺诈行为,避免道 德风险,减少成本,提高利润。 2 5 数据挖掘中存在的问题 数据挖掘有许多的优点,但因为它兴起的时间较短,技术还不够成熟,在 研究过程中还面临许多问题,同时也为数据挖掘未来的发展提供了更大的空间。 首先,数据挖掘的基本问题是数据质量问题,数据结构非常复杂。数据安 全如何解决? 挖掘过程中如何解决数据缺值、噪声及应用数据的动态变化? 如 何对数据进行抽样,抽取多大的样本? 这些都是值得研究的难题。其次,数据 挖掘中不同的模型如何应用,其效果如何评价。事实上,同一数据如果是不同 的人进行挖掘,产生的结果可能不同,有时可能差异很大,数据挖掘的可靠性 1 3 笙兰主塾塑笙塑垫查塑垄 一 _ _ _ _ _ - - _ l _ - _ _ _ _ _ - _ _ _ _ - - - _ _ - 一一 如何把握。再次,数据挖掘的结果是不确定的,要和专业知识相结合才能对它 做出判断,这涉及多种技术的集成及交互问题。 总之,数据挖掘的运用,要求对期望解决问题的领域有深刻的了解,理解 数据,了解其实现过程,才能对数据挖掘的结果找出合理的解释。 1 4 3 1 客户管理的涵义 客户是企业生存的基础,客户价值能给企业带来长期的生存能力,吸引、 保持和发展盈利客户是企业最终的目标口7 1 。如何降低客户流失率;使老客户产 生更大的价值,为企业带来更大的经济效益? 这就需要企业实施有效的客户管 理。调查表明,企业每年客户流失率约为1 7 ( 国外平均) 、2 5 ( 国内企业,联 通约为1 7 9 ) ,这个数据说明了客户管理对企业具有重要的意义。客户管理的 内容包括降低客户流失率;建立完善的客户档案;分析、统计客户的消费行为, 消费心理等一系列信息。而这些大量的详细客户信息,必须依赖于客户管理系 统才能实现。 客户管理系统的目的主要有两个,一是防止老客户流失,二是促使老客户 产生更大的价值。客户管理系统是对企业全面的客户管理,分为外部客户管理 和内部客户管理。外部客户管理指客户的沟通与分析,为企业外部客户管理的 正确实施提供参考:内部客户管理以加强客户服务意识、强化产品质量,以促 进外部客户质量的提高,从而提高外部客户的忠诚度。 3 2c r m 的产生与演变过程 客户关系管理( c u s t o m e rr e l a t i o nm a n a g e m e n t ,c r m ) 的理论基础,即来 源于西方的市场营销理论,它是随着市场经济的不断深化,市场营销的不断发 展更新而诞生的产物。在2 0 世纪8 0 年代的数据库营销阶段,企业纷纷建立客 户数据库,并进行“接触管理 ,即专门整理客户与公司联系的全部信息,这就 是c r m 的雏形,到9 0 年代初期演变成为客户关怀。1 9 9 0 年前后许多美国企业 开始开发销售自动化系统,随后又着力发展客户服务系统。1 9 9 6 年后,一些公 1 5 第3 章客户关系管理概述 司把两个系统合并,形成了呼叫中心,结合i n t e m e t 平台,就逐步形成了今天的 c r v l 。 近几年,全球c r m 市场呈现爆炸性的增长趋势,主要原因有下面几个方 面:消费者行为的变迁。互联网技术的发展,客户对产品和服务的选择范围 不断扩大,选择能力不断提高,企业从“以产品为中心”转向“以客户为中心”, 如何吸引并保持客户已成为当今企业竞争的焦点。企业必须了解与客户相关的 各种信息,并根据这些信息相应地调整自己的经营行为。市场竞争不断加剧。 企业为了加强竞争优势,利用各种技术优化内部流程实现企业产、供、销环节 的自动化,提高内部运转效率。为了减少内部资源的浪费,企业需要一个能够 整合多个客户服务部门的前台系统,提高企业前台的工作效率【2 引。信息技术 的快速发展。互联网这种最新的联系渠道使企业和客户能更快、更广地进行双 向交流,使得c r l v l 从实践上成为现实并快速增长。 3 3c r m 的定义和内涵 对于客户关系管理的定义,目前还没有一个统一的表述。不同的研究机构、 不同的c r v l 从业者都从各自角度出发对c r m 作出自己的定义。这是因为c p d v l 研究者的角度、知识结构,在c r v l 市场上的地位或角色不同而造成,也正反 映了c r m 的复杂性。 盖洛普公司( g a n u p ) 将c i u m 定义为:策略+ 管理+ i t 。这个简单的公式,却 蕴藏着复杂的定义。策略是指战略,管理指战术,i t 指工具,三方面缺一不可。 g a r t n e rg r o u p 是一家美国著名的对i t 业术有专攻的咨询顾问公司,也是 c r m 最早定义者之一,他认为客户关系管理是:为企业提供全方位的管理视角: 赋予企业更完善的客户交流能力和最大化客户的收益率。 c r m g u r u c o r n 是网上著名的大型c p d v l 研讨社区,他认为c r _ m 是企业获 取并管理其最有价值客户关系的一种商业策略,是以客户为中心的商业理念和 企业文化,使营销、销售和客户服务更有效率。一个企业有正确的领导者、企 业策略与企业文化,c r v l 的应用就可以保证有效的客户关系管理t 2 9 1 。 1 6 第3 章客户关系管理概述 i b m 把c r m 分为关系管理、流程管理和接入管理三类,他认为c r m 包括 从企业识别客户、获取客户到保持客户的全部商业过程。 企业资源管理研究中心( a m t ) 对c r a m 的理解,是从战术的角度具体描 述c r m 在企业内部的作用:c r a m 的经营策略是以客户为中心,运用的手段是 信息技术,相关业务功能重新设计,相关工作流程进行重组,以达到保留老客 户、吸引新客户、提高客户利润贡献度的目洲3 0 j 。 图3 1c r m 的三个层面 综上所述,c r m 的核心是“以客户为中心”,由上图得知可以看出c r m 包括三个层面:理念、技术、实施。理念是c r m 成功的关键,是c r m 实施应 用的基础;信息技术是c r a m 成功实施的手段和方法;实施过程是决定c r m 成 功与否、效果如何的直接因素。由此得到c r m 的综合涵义:c r m 是企业树立 以客户为中心的发展战略,提高核心竞争力为目的的全部过程;是企业以客户 关系为重点,提高企业利润水平的工作实践;也是企业在不断改进与客户关系 相关业务流程,实现自动化运营过程中所创造并使用的的信息技术、软硬件和 优化的管理方法、解决方案的总和【3 l 】。 3 4c r m 的分类 当今企业面临的竞争是如何拥有更多有价值的客户,为企业赢得最大的利 润,因此以客户为中心、以拓展市场为目标的c r a m 系统成为企业应用系统的 核心。基于c r m 功能侧重不同来划分,美国的调研机构m e t ag r o u p 把c r m 1 7 第3 章客户关系管理概述 分为运营型、分析型和协作型三类。 ( 1 ) 运营型c r m 运营型c r _ m 收集大量客户信息、市场活动信息和客户服务的信息,实现销 售,营销和客户服务三部分业务流程的自动化,提高运营效率、降低运作成本。 c r m 中的核心内容是客户服务,客户服务是保留忠诚客户的关键【3 1 1 。 ( 2 ) 协作型c r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论