CRM系统及应用研究_第1页
CRM系统及应用研究_第2页
CRM系统及应用研究_第3页
CRM系统及应用研究_第4页
CRM系统及应用研究_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、首都经济贸易大学硕士学位论文crm系统及应用研究姓名:门志勇申请学位级别:硕士专业:产业经济指导教师:傅星t h e m a r k e t o fcus t o m e r r e v e 1 o p m e n t a 1 t hough the i n tvna.nvoe mt h e h ot ionofcrm to china i s n ot spotof managemehundredsofcompkeywo rd s: c r a m, softwa rearch itect ure,cal 1 c e nt e r , d a t a m i n i n g , w e b

2、m i n i n gabstractabstractat ionshipmanagement i sexperi enc ingrap iddent soft ware.s o m e h o 1 d t h e o p i n i ontha t c r m i s a c o n c e p tofmanageme nt d o m a in. weagreew i t h t h e0p1n10n .a n d f urther m or e w e stress thattheev01u ti o n o f m an age m entco nce p tsw11de (;1 d

3、e t heresu-to 1r 1 m p i ementi n gc r m d irec t 1 ywesh0u1da1 so k e e p i nm ind t hatth efo r mat10n0fcust0mer c e ntr1cmana g e m en t c o nceptw111def in i t e 1 yd epends0nt hec rm s o ft w a r e s y s tem. ont h i s p o i nt, t h e i n v e s tmentto itfieldwi 1 lnolongerbe abl ackhole .ili f

4、t# ®固血敲幽軸鏈伽国龜倉縣描蠶谶园稱輕d册嫌巅函舸幽圖較羸脚i彎鎭股泡幽遊連鑑承槪握忍砒遞扯嚇碣珮蕨鎭縮聲6减趾血械 啦购御t醴備 lile 虬住 tje a lweneededth rough interact. butamongal 1 the material!h并年 c r m 特讫趙势和对未来发展做出简单预测,无法对其规律进行分析解释,也无法把当前发现的规c rm系统及应用研究第一章c rm的现状及问题近几年,全球的客户关系管理(crm, c u s t o m e r r e 1 a t i o n s h i p m a n a g e爆炸煙的快速増便卯。頁诞插i

5、d c的预测,在未来的5年中.全球c rm市场的增长幅度:悔达到4 7%, 2 0 0 3年市场将达到1 6 8亿美元,2 0 0 4年整个亚太地区的c rm市场的将达到1 2亿美元。而中国的c rm市场将保持超世界水平的增长.长幅达到5 0%。一次调查的结果表明,受访企业中2, 3以上期望在未来五年内改变其客户关系的管理模式,3 / 4以上的企 业计划集成''面对客户''的信息管理系统及其组织的其他部分。国外c rm软件商开始进入 中国,并加大开拓中国市场的力度,国内声称提供crm软件的厂商也已达到2 0 0多个。c rm的中国市场看起来已经白热化。crm市场

6、已经成熟了吗?对该问题可以从概念、系统功能和实际需求角度来探讨。111而害,i最好采用软件巨头提供的crm套件,但是这样可能必须强制同步转变经营思维和c rm系统及应用研究以得到部分信息)。目前看来,我国多数crm产品无法提供全部的功能。从软件成本和技 术人员的实际水平看,多数企业也没有或无法提出相应的需求(参见后文)。所以,那些仅 实现部分功能的c rm产品仍旧十分看好,在市场开拓方面显得十分成功。第二节从需求入手分析c f i m21是否需要c rm系统在决定实施crm之前,要对木公司的业务性质进行分析。并不是所有公司都应当实 施crm, c rm的功能主要定位于客户驱动型的公司。这种类型

7、的公司一般拥有庞大的客户群,客户交流频繁、客户支持要求高,涉及的行业有银行、保险、房地产、电信、家电、 民航、运输、证券、医疗保健等。这种公司采用了 crm后,都会获得显著的回报。通过c rm,上述公司可以迅速地发现潜在客户:通过对客户进行全面地观察和管理,他们能够找上门来,根本不需要进行有针对性的营销。可见,管理层是否有长远的战略考虑,是c rmc rm系统及应用研究等公司瞄准的是中小企业,他们提供的综台软件包虽然功能不全,但丰富实用。第三节c rm系统的实施案例前不久,我考察了几个实施crm系统的公司,这些公司使用的产品用的都是为业内 认可的,他们的项目实施情况应该认为有一定的代表性。.以

8、其中一个公司的情况为例。该公司实施c rm大约有一年时间,采用的是一个基于c / s结构的crm产品。整个系统只能运行在公司内部网上,客户通过互联网进行的接触无 法直接反馈到该系统中。在这一年时间里,该公司按照惯例,首先进行系统的定制,使之 符合本公司的情况。这一点做的他们做得很好.原因是所采用的crm软件十分容易配置。 接下来.就要进行客户信息和营销活动的输入,以及启动其中的客户管理和分析功能,使 系统产生实际效果。这时候,公司发现一个问题:几乎很少有人输入客户的往来信息,因 为销售人员不太愿意公开自己的客户资源。于是公司就制定规则,强制员工输入相关信息,费尽力气用c rm系统段应用研究网络

9、经济虽然被媒体大肆炒作,但真正着手实施的的企业却寥寥无几。4. 2来自员工的阻碍因素从员,i j方面看.虽不赞成实施c rm系统的可能是销售人员。crm系统需要对客户接 触进行记录,这意味着销售人员可能会失去对客户的“控制权j如果没有很好的对应策略 手约束机制,没有转变对销售人员的考核方式,就会出现本文案例中握刮的现象:crm系 统几乎无法收集剑需要的信息。另外必须对输入的信息进行检查,防【l销售人员输入不可 信的数据。所谓“8 a r b a g e i n . garbageo ut”,不可信的信息是不可能产生有效的决策的。实际上,上述因素都来自于落后的管理方式,真正科学的、现代化的管理模

10、式中是不 歪莊棚源恸翻的e腑国e 6腋m的赛施如同物料资源计划mate n g h十样启需要另外一个阻碍米自管理层。除了管理思想方面的因素之外,管理层从其自身利益考虑, 会自然的产生抵制情绪。管理层拥有对员工的任务分配、业绩考核等重要权力,这些权力 的执行在许多企业的管理过程中是不公开的。c rm系统对所有员工的工作量和工作绩效都 加以记录,这就销弱了管理层的权利,使其管理过程处于可监察的环境中。u r c e pc rm系统及应用研究火多数公司提供的crm产品没有提供数据挖掘功能,只有对客户数据的简单统计分析。如前所述,这是远远不够的。数据仓库和数据挖掘技术在国外己日趋成熟,但是国内 基本上

11、还停留于研究阶段,没有可以商业化的产品问世,所以只有采j : i国外的产品,无论是技术支持方面还是产品的价格、易_ j性方面均存在一定问题。4 . 4 . 3信息系统的利用存在没有充分利,q4crm系统的现象。c rm系统,无论是人烈的产品还是中小型的产品,部有统计分析或其它信息提取的功能。e ii使相应的功能很弱,也还是可以提供些有螺考核以及业务流程管理方面l j信息的。目前许多公司对crm中蕴含的信息只有有限的利 【 =1,基本上注重销售人员,没有把重点放在crm所应当关注的客户信扈、挖掘方面。这似乎有失偏颇,毕竟他们使用的客户关系管理系统而不是服务管理系统或者营销信息 系统。第五节结论内

12、公司或者针对特定领域提供专业的解决方案(虽然s i e b e 1 crm、t e md a t a crm产7x24小时不问c rm系统及应用研究第二章c rm软件模型第一节cr i v i软件系统cram改变了企业前台业务运作方式,各部门间信息共享,密切合作。位于模型中央的 共享数据库作为所有crm过程的转换接口,可以全方位地提供客户和市场信息。过去, 前台各部门从自身角度去掌握企业数据,业务割裂。而对于crm模型来说,建立一个相 互之间联系紧密的数据库是最基本的条件。这个共享的数据库也被称为所有重要信息的”翻j环"(closed1 0 0 p )。由于c rm系统不仅要使相关流

13、程实现优化和自动化,而且必须 春流程中建立统一的规则,以保证所有活动在完全相同的理解下进行。这一全方位的视角>!>狂于客户以刍奮业组织本身的一体化蓝ii r渠道,t如金r !ii重要作用体现在以下几点:帮助企业根据客户生命周期价值来区分各类现有客户;帮助企c rm系统及应用研究员对客户的使用情况进行跟踪,为客户提供个性化服务,并且对服务合同进行管理。其实,上述三组业务功能之间是相互合作的关系,具体情况可参见有关资料,篇幅所 限,这里不再作详细解释。针对中小型企业的crm产品多数不能覆盖所有的功能范围,一股地最多能够支持两 至三种功能(如t u r b o c rm 1 . 0版只支

14、持市场营销和销售)。因此,在软件评价中,功能范 围可以作为决定性的评判依据。表2 . 1给出了 c rm软件备业务功能子系统较为详细的描 述。市场销售服务宣传管理直接营销访问准备关系管理选择判据的确立扶得信息 9 | f求分析附加服务的识别和了解定义接触渠道制作演示和样本识别和了解进步的潜在客设计、计划展开宣传活动客户接触计划户需求反馈处理提取客户信息指导客户考虑新产品或服务生成进度计划投资建议,样本组合或行情信息成在一起。黠c ac rm系统及应用研究业准确地找到目标客户群:帮助企业在最合适的时机以最合适的产品满足客户需求,降低 成本,提高效率:帮助企业结合最新信息和结果制定出新策略,塑造客

15、户忠诚。运用数据 库这一强人的1:具,可以与客户进行高效的、可衡量的、双向的沟通,真正体现了以客户为导向的管理思想;可以与客户维持长久的、甚至是终身的关系来保持和提升企业短期雨 k =明的利润。可以这样说,数据库是c rm管理思想和信息技术的有机结合。一个高质量的数据库包含的数据应当能全面、准确、详尽和及时地反映客户、市场及 销售信息。数据可以按照市场、销售和服务部门的不同用途分成三类:客户数据、销售数 据、服务数据。客户数据包括客户的基本信息、联系人信息、相关业务信息、客户分类信 息筲,它不但包括现有客户信息.还包括潜在客户、合作伙伴、代理商的信息等。销售数 据主要包括销售过程中相关业务的跟

16、踪情况,如与客户的所有联系活动、客户询价和相应 报价、每笔业务的竞争对手以及销售订单的有关信息等等。服务数据则包括客户投诉信息、 服务合同信息、售后服务情况以及解决方案的知识库等。这些数据可放在同个数据库中, 实现信息共享,以提高企业前台业务的运作效率和工作质量。目前,飞速发展的数据仓库技术,如联机分析处理(olap. on ineanalys i sandprocess)数据挖掘(d法c rm系统及应用研究目标主要功能块销售用于帮助决策者管理钳售业务.主要功能是额度管理、销售力量管理和地域管理销提高销售现场销售f理为现场销售人员提供联系人/客户管理、机会管理、日程、佣金预测、报价、报告分析

17、售过程的自现场错曹/掌上工具为移动设备提铺售供柑关互联服务模动化和销电话镉售可以进行报价生成、订单创建、联系人和客户管理等工炸块售效果还有一些针对电话商务的功能,如电话路由、呼入提示、潜在客户管理以及回应蕾理悄售佣金允许销售经理创建和管理销售队伍的奖励和佣金计划帮助销售代表了解各自的销售业绩计划、执蕾悄使得营销部门实时地蹲踪活动的效果,执行和管理多样的,多渠道的营销活动 营口 行,监视电信行业蕾南部件在上面的基本营销功能基础上针对电信行业的具体情况增加了一些附加特色 销和分析童 其它功瞧可帮助营销部门管理其营销资料:列表生成与管理:授权和许可;预算;回应管理 接市场营开放蔗接量务支持绝大多教的

18、自动捧队机.如lucenc. nor te, rockrel 1 . a 1 c a cc rm系统及应用研究基于上述软件结构的0 r a c 1 e c rm系统具有如下三个关键特点,这些特点是一般观念 上的c rm系统应当具备的:(一)综合性o r a c 1 e的crm产品功能全面,可满足大多数组织的客户服务、销售和 营销自动化功能的要求。从crm系统产生和演化的角度来看,目前国内大多 数c rm产品提供商所提供的产品都只具有部分或不完善的功能,例如只提供 c allc e n ter、s f a或c s s方面的部分功能,不能称为完备的c r m产品。(二)集成性该系统不仅集成c rm

19、套件的所有应用软件,而且集成o r a c 1 e的其他后 端应用产品,尤其是供应链管理、制造和财务应用。而服务应用软件与前端、 后端应用软件的集成可实现全企业一致的数据共享。国内c rm供应商针对中小型企业开发的c rm系统,可能不具备对erp、mrp或scm等系统的集成 功能,但是通常至少应当具备对企业财务系统的集成,否则在实施过程中会产生一些不必要的阻碍:如果是针对大型企业的crm应用,对原有系统提供集 成就更是先决条件。(三)全面的网络支持为了与基于互联网的体系结构以及使各组织在自助式服务的c rm系统及应用研究第三章呼叫中心第一节基本概念和功能当前呼n q中心一股基于ct 技术,它是

20、充分利用电信网和计算机网的多项功能并集成 企业其他信息化系统的完整的综合信息服务系统,为客户提供全新的、现代化的服务方式。呼叫中心源于零售行业,经历了人工应答阶段、交互应答(ivr, int e r a c ti vevirre o s a s e )阶段,目前主要是基于c t i技术的第三代呼叫中心。考虑到对i n t e m e t技(voip,voiceover 口)、短消息服务(sms,simplemessageservi军辭籲豚耳乎叫中心已经开始向第四代迁移,未来的呼叫中心将成为多媒体的、可移动的、智能化的呼叫中心。呼叫中心的功能可以大致分为业务功能和管理功能两类。)管理:针对特定的

21、v i p级用户,定期回访觀驢蠶寰継離鱷翩礬爛赫腿蘿孩饗離ii臟轟him畫鸞梅艦觀遥音呼嗚n dc rm系统及应用研究f呵:】1棚腫瞬欄如儷16攒揭b 硕瘢締 mm 瞬c rm系统及应用研究2 . 3交互式语音应答系统i vr可以利用驻留在数据库中的信息来筛选来电并选择传送路由,也可以与计算机连接,使呼叫者得以直接访问主机数据库的信息.这一点尤其重要,当客户来点仅仅是查询 或提出惯例型的问题时,ivr可以回复他们,从而大大节省了人工,提高工作效率。系统 把大部分常见问题的应答交由机器、印”自动话务员”应答和处理,自动应答员无法解决的 问题再交由专业人员处理(这实际上是第二代呼叫中心与第一代呼叫

22、中心的区别)。2 . 4 c t i技术和c t i中间件ct i技术可以使电话与计算机系统实现信息兆享,并允许根据呼叫者、呼叫原因、呼叫所处的时间和呼叫中心的通话情况来选择呼叫路由、启动功能和更新主机数据库。该技 术在呼叫中心的典型运用有:屏幕弹出功能、协调的语音和数据传输功能、个性化的呼叫 路由功能(如将客户路由给上一次为其服务的业务代表)、预览和预拨功能。这一技术是呼 叫中心演化到第三代的标志。实现c t i技术的部分是c t i服务器,它与p bx相连,接收 来自pbx的事件和状态消息,并向pbx发出命令。c t i服务器向上提供统一编程接口,的i s乞应用程序帶得到的。实际上,从呼叫

23、中心入手开发crm系统是三个主要的c黜八系统开发途径之一。c rm系统及应用研究第三节第四代呼叫中心随着通讯手段的快速发展,客户服务已经发生革命性的变化客户通过包括互联网、手机在内的多种媒介与经营者发生联系,获的服务,他们对服务响应的要求也越来越高,传统的以语音为中心的呼叫中心已经无法满足要求。新一代呼叫中心必须是与经营者关键业1cic应用服务jr务流程1 i vr、传真服务、网页互动、电子邮件、c i i、com、统一消息、远程座席、商可靠 性选项i心(第四伐呼叫申心曲£)mte er rl ancttei rv ae cl tnitgeiicagfea公某3该於司的沪品开c rm

24、系统及应用研究第四章数据挖掘第一节数据挖掘基本概念数据挖掘作为一种数据分析的重要工具,在c rm系统中占有十分重要的地位。但是, 目前普遍存在一种误导,认为数据挖掘是一种自动过程,通过一种类似代理的程序在数据 库系统中运行,自动寻找到有用信息并反馈给用户。能够做到这一点当然很好.但是目前 的技术水平来说,数据挖掘并不是这样。11数据挖掘的释义知识对数刚瞬禅预趣離的皆做牺昭越国删琳f a 1 )流程(f a y y a d等c rm系统及应用研究12数据挖掘能够解决的问题数据挖掘强调从大量数据中发现潜在的、有价值的及未知的关系、模式和趋势,并以 易被理解的方式表示出来。在以d s s为代表的应用

25、中,通过进行数据挖掘发现数据之间的 复杂联系以及这种联系对决策的影响。在数据仓库基础上挖掘的知识通常以图表、可视化、类自然语言等形式表示出来,但 所挖掘的知识并不都是有意义的,必须进行评价、筛选手【j验证,把有意义的知识放到知识 库中,随着时间的推移将积累更多的知识。知识库根据挖掘的知识类型包括总结性知识、 关联性知识、分类模型知识、聚类模型知识,这些知识通过相应挖掘算法得到。数据挖掘任务通常分为两大类:描述型(descrip ti ve)挖掘和预测型(p r e d i c 挖掘。t描述型挖掘注重数据库中数据的总体特征,而预测型挖掘则根据现有数据进行推测 以辅助决策。通常情况下我们无法预知用

26、户究竟需要进行什么样的挖掘工作,所以需要一 个能够提供多种数据挖掘手段的系统,以满足不同用户或应用。数据挖掘系统还应当可以发现不同粒度的数据模式(pa t t e r n),而且能够指引用户发现有用的数据模式。有些数据y36(師缽111鐵1商可处理谒辑性旦为8驗剧关机事务2 - “id带皿"。心 tc rm系统及应用研究开发质量和效率,使人机界面更加简洁、标准化。另外,可选用手写输入和声音输入工具 软件,便于决策者提出问题。该系统根据对决策问题的判断,在知识库和信息库中查找解 决方案,如查找到以直观易理解的形式呈现给决策者,如查找不到再根据问题的性质向下 调用相应的决策工具。第二节数

27、据挖掘流程数据挖掘基本上是一个高度反复的流程可以简短描述如图4 1。在最高水平时数据挖掘可视为由两个阶段组成:知识发现和知识发展。发展阶段包括 从发展了的模型获得成果,并且将成果应用到业务中:成果包括报表、模型、出现在运营 系统中的编码指令或者数据可视化。发现阶段由三个部分组成:数据预处理阶段、模型设槪觀翻昨圖蹬测翩翻厲働蠅融卿她麗蹄嬲瀰删觀蹄劇h圈鋤逊鱷題其中v ,表c rm系统及应用研究3 . 1 关联分析(associa ti° 11逵諭分析方法侧重挖掘隐藏在数据之间的相互关系。例如:分析两种商品销售数量变 化之间的关系。用于关联规则发现的主要对象是事务型数据库,其中针对的应用

28、则是售货 数据,也称货篮数据。关联分析的目标事务一般由如下几个部分组成:事务处理时间,一组顾客购买的物品,有时也包括顾客标识号(或信用卡号)。由于条形码技术的发展,零售部门可以利用前端收 款机收集存储大量的售货数据。因此,如果对这些历史事务数据进行分析,则可对顾客的 购买行为提供极有价值的信息。例如,可以帮助解决货架上的商品摆放问题和搭配进货问 题。由此可见,从事务数据中发现关联规则,对于改进零售业等商业活动的决策非常重要。实际情况下,一种更有用的关联规则是泛化关联规则。因为物品概念间存在一种层次 关系.如夹克衫属于外套类,外套、衬衣又属于衣服类。有了层次关系后.可以帮助发现一 些更多的有意义

29、的规则。例如:"买外套同时买鞋子"(此处.外套和鞋子是较高层次上的物品 或概念,翩椿电穂滝咽缺联辄见)i。a由1于谪店或超市中有成千上万种物品,平均,莎曲密申你栃诲据瀨麴邇展極畏罐的繡車薙橈征就通通莊发鞭测橈型乘验桩客户特性如瘫模filleflkc rm系统及应用研究不同的分类器育不同的特点。有三种分类器评价或比较尺度:预测准确度、计算复杂 度和模型描述的简洁度。另外要注意的是,分类的效果一般和数据的特点有关,有的数据 噪声人,有的出现缺值,有的分布稀疏.有的字段或属性间相关性强.有的属性是离散的 而有的是连续值或混合式的。目前普遍认为不存在某种方法能适合于各种特点的数据。

30、34聚类分析(c 1 u s teri 11棗来分析对新的数据记录根据分类分析的结果或现有知识进行划分,将数据归入合适 的类别(如将某新客户按照经验或特定分类模型应该归于特定类别)。它的目的是让属于同 一类别的个体之间的距离尽可能的小,而不同类别上的个体间的距离尽可能的大。聚类方 法包括统计方法、机器学习方法、神经网络方法和面向数据库的方法。在统计方法中,聚类称聚类分析,是多元数据分析的主要方法之一。它主要研究基于 几何距离的聚类,如欧氏距离、海明距离等。传统的统计聚类分析方法包括系统聚类法、 分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。这种聚类方法crm系统及应用研究另

31、一个功能是辅助客户的划分。数据挖掘对基于各种各样的个人和社会的经济数据进 行客户细分,并且为每一个验证通过的细分建立预测模型。系统针对不同的细分方案结合 相关的客户信息估计商业活动的成功率,对每个细分的具体分析可以得到随吋间变化的 利润率和客户保留率。这样,我们就可以得到比较满意的细分方案。对每一个细分估算目 标客户的平均月利润率,加上产品平均寿命等信息,营销人员就可以确定有针对性的营销 方案。4. 2客户保留这个问题也需要预测客户倾向的模型。该模型通过历史数据,来验证又转向竞争对手 倾向的客户(而不是所有流失的客户),需要的数据包括近期已经转向对手的客户和尚未转 向对手的客户。然后,商业活动

32、将针对转向倾向较强的客户进行。客户保留也可能只针对 高价值客户进行。对高价值客户的确认需要客户细分信息,通过何种手段才能维系客户也需要客户细分 信息。除此之外,数据挖掘在至少三个方面服务与客户保留:验证保留客户的主因素、验c rm系统及应用研究we b页面和市场数据;其数据挖掘的手段相对单纯,主要是关联规则的发现:we b挖掘的 应用不只是针对营销和销售部门,更常见的情况是应用we b挖掘的结果进行页面导航和缓 冲系统的动态凋整。因此,这里把它单独作为一节提出来。w e b挖掘在电子商务零售业方面有较多的研究,但是它对于c rm系统有着特殊的意 义.作为与客户进行接触的主要媒介之一,网站的作用

33、是其它媒介不可替代的.所有己知 的媒介中,可以说只有它突破了时空限制。通过网络同客户进行交流,是一种方便、经济 而有效的手段。目前几乎所有媒体都有联动的网站,这就是一个说明其地位的例子。51应用背景和概况互联网包含丰富的动态信息,以及对这些信息的访问和使用记录,这为数据挖掘提供 了,“泛的空间。但是we b上的信息杂乱无章,对we b信息进行有效地挖掘是一项极具挑 战性的工作,这体现在下面几点:1 . web信息是庞大的,快速变化的,几乎不可能通过构建数据仓库复制、存储器内容。很多页面的内容时常更新,而且不同的页面缺乏统一的结构,大量的页面内m i r2两介ni的c rm系统及应用研究设置禁止

34、来自服务器端的c o o k i e,所以不会采用。如果把问题泛化到非零售类型网站,那么可能遇到的问题就是客户识别。多数情况下 我们遇到的是为注册访问者,只能猜测其身份。由于信息的匮乏,我们所借助的手段儿乎 只能是i p识别和行为测度。但是如前所述,i p识别局限性很大,所以其可靠性十分值得 怀疑。这类问题在没有新的技术突破之前,儿乎无法得到满意的解决。5. 2 we b挖掘常用技术w e b挖掘可以分为两种,即针对w e b内容的挖掘(webco ntent mining) : 1针对w e b 州记慕的挖掘(webusagemining)。前一种主要解决w e b链接结构、文档自动分类和多

35、层 次信息库的问题,它需要内容管理二l具(如v ignette、netpercept io n等工具)的强量要轿对客户访问记录和we b服务器的日志文件。内容挖掘方面,实用的算法并不是很多巒t爾酬hits (hyperl ink. inducedt火工41一1 1 i 1 1l/l/*4一"n, 勺链 腳m y d 0" 1c rm系统及应用研究通过新的j 2 e e服务器,我们可以开发专用的s e r v 1 e t过滤器(servlet过滤器是j 2 e e増的功寵,遵从sijde r v 1 e t规范2 3版本,主要用于客户端与服务器端之间的数据的预处理和转化工作,

36、所以比较适合在这种v自况下使用)记录客户端发生的访问行为,该记录手段是 我们可以控制的,所记录的是纯净的数据,可以直接使用,这就免去了数据清洗:作。比 较有意思的是,由于服务器本身对客户端的会话(session)有一个管理对象(如j 2 ee服务器 中的s e s s i o n对象)该对象的生存;c j是我们通过服务器配置文件确定的,所以我们不必太 注重于对i p识别的自动处理,如果结合s e r v 1 e t过滤器和s e s s i o n对象两者的特点,上面提 剑的客户识别等问题还是可以应付的。使删记录挖掘中主要应用的技术是关联分析和序列数据挖掘技术。我们通过类似的分 析可以得到丰富

37、的信息.提供很多帮助。女口.通过序列数据挖掘技术可以实现页面预存取, 提高访问效率:日志分析可以帮助我们发现用户的行为模式,帮助我们理解用户的需求。c rm系统及应用研究第五章基于微软分析服务器的数据挖掘微软分析服务器是日:于联机分析处理和数据挖掘的中层服务器,它可以构造多维数据 集、支持数据挖掘,同时还提供多种客户端访问手段。分折服务器将数据仓库中的数据组 纵成包含预先计算聚合数据的多维数据集,以便为复杂的分析查询提供快速解答。该服务 可以从多维数据源和关系数据源这两者创建和应用数据挖掘模型。在数据展示方面,系统 采川比较低端的p i v o t t a b 1 e服务作为数据接口,exce

38、l和其它供应商提供的应用程序通过 p i v o t t a b 1 e来检索服务器中的数据并将结果显示给用户,或用它创建用于脱机分析的本地 数据多维数据集。这样,微软通过其低成本、易扩充的服务器体系为申小型的厂商和公司 提供了一套简单的数据仓库、联机数据分析和数据挖掘工具。鎗韦蕭简 acledarwin> sasenterpri seminer)趋向于提供基crm系统及应用研究的集合的信息。除了包含关于其数据类型的信息之外,每个数据挖掘列对象还包含描述该对象在数据挖掘模型中的用途的特性,例如它与其它数据挖掘列的关系,它是否用作可预 测的列,它是否包含其它列,它是否刚作数据挖掘进程的输入

39、等等。这些数据挖掘列由挖 掘模型对象中的列对象集合表示。数据挖掘模型是一个抽象对象,它不保存阍于构造事例集的培训数据。相反,将保存漠型本身的抽象性,还有培洲数据分忻的结果,因而同一个数据挖掘模型可以和适用于其 事例集的其它数据一起使_【 j以提供预测分析。第二节数据挖掘例析分析过程以销售样本数据库为基础进行,该样本数据库文件大小约2 im。考虑到试验用机的性能(2 5 6 ms dram,主频4 3 3 mh z, 7 2 0 0 r p m高速硬盘),处理百兆以上的数据 需要消耗大量时间用于训练挖掘模型,所以没有采用更大的数据源。实验主要涉及的的基本表描述如下:表名称描述表列数表行数c u

40、s t om e t存储所有客户基木情况2 8 j 0 . 2 8p r o a u c l存储页有产品基本估况j 5 i , 5 6 0product_clas s产品的分类信息,多层分类5 1 1 0p r o m o t io n促销情况记录7 1 . 8 6 4sales fact_1998199« 年公司销售详细记录:8 1 6 4, 5 5 «star c応铺分布情况2 5 2 5t i me b y_d a y时问代码与对应的日期映射1 0 7 3 0表5- 1对分析涉及的表包含信息的描述利用c a e r w i n 4 . 0数据库设计工具,通过宣接分析相

41、关数据库的数据文件对实施逆向工程,挑岀我们关心的部分表及它们之间的依赖关系,截取并整理如下:accovnttcllt mlxtrnkocfl j 誓_ t : a 说:球 1 o iii z n 计 1 m:a匕 t y p : w,©严咖一t 0 1 1 , 00:ke m ( 1 )2. 1建立多维数据集为了加快数据挖掘的速度,需要对原始数据进行加工。该步骤实际上完成的是数据预处理阶段的数据选择和数据准备工作。由于样本数据库较小,而且不存在多系统整合中容易出现的数据不一致问题,所以没有做数据清洗工作,整个过程相对简单。选择表sales 一 fact 1 998作为事实表,即分析中

42、心表,并指定store _ sales、s t u n iot jes_ac loesst傑明度量值。然后围绕该表建立多维数据集的维度,具体包括:来自t i m e b y d a 衰的“时间”维度,这是时间划分测度,分为年、月、日三个层次:来自product和p r o d u c t c 1 a 两个关联表的“商品”维度,分为类、子类和品牌三个层次,由于采用多表连接,所以使用了雪花结构;利用c u s t ome r表建立“客户”维度,按照具体的客户特性进行层次划分。其它还建立了若干辅助维度。如果需要进行更详细的分析,可以绕过具体表和数据建立虚拟维度,映射或筛选我们感兴趣的数据。通过设计存

43、储、并花约2分钟时间进行处理,最终围绕客户分析这个主题建立了一个多维数据集,如图5. 2所示。如1)ttaix)阿期叫. -j|h| 2|i| *-|ir| v|®j j| 4'lml 毛iiwwmto;j fl fl? 4 hjt 比 ttl-1 & 廉"户-4: w * u花嗝的1 ax crjl d $tat* 常 *«v cb$ ini 1 £il«f e计rq g ux>x j wxtincldthxiofti0nt h ttuu cu、订 imtll rwor心i. of je* ilieil .periods

44、tcr?sur».td wty” t3timl_14 wr>.fv»©«r vrv nusc; *ljitcrza >2 izcrs.oit unxt.ialesfimrf am?t oi11 1>lduj lli prctjtlxi.ll1 kuft»er.id ceejr c illkms1 ilnia!gubtmwt*p n. , 9 丹円pt&jrm*ar. .cj1. prmot ' on. p i ”5 . li 11 uji i图5-2以sales_factl998为中心建立的星形链实际上我们实际

45、侵立了一个o l心数据库,各维表围绕中心表进行雪花连接。结果 会投影出我们感兴趣的内容,屏蔽无关的数据。在这个基础上,已经可以进行基本的olap分析,但是分析的结果还不十分育观。通 过选择不同的维度和一层次,可以对多维数据集进行切割,观察每个度量值。图5. 3展示了对客户、促销活动和商品三个维度进行的观测,可从中观察一月份年收入1 1至1 3万的客户交易情况。横轴是度量值,纵轴为客户维区域层和促销活动维的联合。2. 2基于聚集的分析现在要在上面建立的多维数据集的基础上,对客户数据和销售情况进行分析,找出主 要客户群,以便开展目标营销活动。采用微软聚集设计向导,对多维数据集进行聚类分析.首先需要

46、把事例定义到客户维上.即指定该维作为将要调查的维度,通过客户的l n ame属性区分客户。然后选择多维数据集中的若干维度作为可能的聚类分析指标,选择s t o r e s a 1 e s度量值设置为数据挖掘算法 划分cu s t ome r维度所用信息.接下来系统会自动选择与聚类事例相关的人口统计特性指标.如i yearlylncome、mari talstatus、gender、e d u c a t ion、o c 等加快遨度苛以牲茶统酋劫逸择的墓血上甫感变化,去掉了明显不可能的测度指标以加快挖掘速度。对该聚集模型进行训练,采用了大约1 6万事例中的7 0 0 0个作为样本,要求结果产生&

47、#163; 口 4时昭 中咚痢处 于ei岭不户©剛7殒*丽曲1wbif fll六个聚集,训练时间大约1分2 4秒,产生结果如图5 4所示。聚类颜色的深浅对应该聚集 中事例的密度。为了节约空间,该图进行了不影响结论的修饰。s * snie ttonnzti g cl:y a-ta r g 沁 otfcler.2 cjb eirtbdi te;o li1 t« sutuj©gtgrulcr -.qtftoeil odldronq hum4t 3<«cqtfldumatlon p racff lekbcr card-o 阳 hfi b mui gajv

48、(>vnbd s- n /tn-e *it st »r» sal isu 和 jt*rc cs,图5-4对客户进行聚集操作的结果显然,第一类和第一-类客户划分是比较密集的.审查其节点路径,可以得出客户的具 体特性,但是该方法不太直观.一般通过调节节点特性集逐项分析各类客户的特性。在调节节点特性集的同时,通过育方图观测客户分类特性,如图5. 5。很容易发现这两类客户都是单身无子女的.其中第一类主要是大学学历的专业人员和管理人员,年收入7至9万.在河及部分得知他们每年在商店购买金额平均9 7. 6 5元;第二类主要是熟练或普通技工.隹收入1至5万,每年平均购买金额8 9. 9 8元.同样可以对其它聚类进行分析, 以便找出非主要客户的特征.通过上述步骤,就可以利用聚集方法找出潜在的客户群落的特性.我们可以增加或减 少聚集的数目,看看是否可以更有效地划分客户:也可以在结果的基础上进行其它的操作。 如。我们已经知道婚否、子女数、学历、收入和职业这五个特性对客户的划分特别重要, 就可以建立虚拟维,指定后三个特性为主要属性,并过滤非单身客户和有子女客户,以屏 蔽其他无关的信息,然后进行二次分析.>wwclim b4tlwto节祷特肚;合计(0_二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论