CRM系统中的商业智能技术培训课件_第1页
CRM系统中的商业智能技术培训课件_第2页
CRM系统中的商业智能技术培训课件_第3页
CRM系统中的商业智能技术培训课件_第4页
CRM系统中的商业智能技术培训课件_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第7章CRM系统中的商业智能技术数据仓库技术数据挖掘理解三种技术的的应用CRM系统中商业智能技术本章主要内容:)联机分析处理数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能第一节商业智能商业智能是从大量的数据和信息中发掘有用的知识,并用于决策以增加商业利润,是一个从数据到信息到知识的处理过程。商业智能用来辅助商业活动作出快速反应,加快知识的获取速度,减少企业不确定性因素的影响。因此能很好地满足管理层和决策层对信息知识的时间性和准确性的要求。商业智能在我国尚处于起步阶段,虽然其在发展和应用过程中仍存在很多不足,但商业智能正朝着实时性、标准化、集成性、实用性、大众化方向发展。

商业智能的定义数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能支撑技术:数据仓库为平台,数据挖掘OLAP互补,进行分析体系结构:以Web服务形式提供,以XML形式发放BI应用的分析结果是新的发展趋势。应用系统:BI系统将更具专业化和行业化的特点,与企业门户、企业应用集成紧密相连商业智能的发展商业智能的发展第一节商业智能数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能数据仓库决策支持企业决策层OLAP数据挖掘数据存储提取、清洗、转化业务数据库决策信息反馈到实际的业务系统中

商业智能系统的构成商业智能系统由业务数据仓库系统、决策支持系统等部分构成。图7-12商业智能系统的数据处理循环第一节商业智能数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能商务智能系统的三大支撑技术数据仓库技术

OLAP

数据仓库完成了数据的收集、集成、存储、管理等工作,商务智能面对的是经过加工的数据,能更专注于信息的提取和知识的发现。OLAP从多种角度对原始数据进行分析,将其转化为用户所理解、并真实反映企业经营情况的信息,为决策提供依据。数据挖掘技术

数据挖掘技术能高度自动化地分析数据,做出归纳性推理,挖掘出潜在的模式,帮助决策者作出正确的决策。

商业智能系统的支撑技术第一节商业智能数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能客户智能是创新和使用客户知识,帮助企业提高优化客户关系的决策能力和整体运营能力的概念、方法、过程以及软件的集合。

客户智能客户智能的理解理论基础信息系统层面数据分析层面知识发现层面战略层面

客户智能的定义第一节商业智能数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能客户知识,顾名思义,是有关客户的知识。客户知识包括客户的消费偏好、喜欢选用的接触渠道、消费特征等许多描述客户的知识。客户知识是人们通过实践认识到的、与客户有关的规律性,而客户智能是获得客户知识并使用客户知识求解问题的能力。客户智能是对企业战略决策真正有价值的事物和行动。生成客户知识的过程称之为客户知识的加工处理过程,客户智能不仅包括了客户知识的生成,而且强调了客户知识在企业中的分发、使用,直到产生客户智能。

客户知识第一节商业智能数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能客户知识生成客户知识分发客户档案客户知识使用营销客户服务。。。。客户智能客户智能图7-13客户智能的生成、分发和使用第一节商业智能数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能

(1)客户知识的生成(generation):使用商业智能提供的OLAP分析工具、数据挖掘工具或两种工具的组合,发现存在于客户数据中的模式、规则、概念、规律的整个过程,称为客户知识的生成。

(2)客户知识的分发(distribution):客户知识必须到达组织内每一个需要客户知识的部分。将客户知识存储与动态知识库,借助CRM的系统平台,将客户知识分发到需要的终端。

(3)客户知识的使用(usingit):将客户信息和知识投入使用是CRM的最后一个环节。许多CRM和知识发现没有成功,很大程度上在于产生的与客户有关的信息和知识不能投入使用。第一节商业智能数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能第二节数据仓库概述数据仓库的产生没有(一致的)全局信息→很难产生正确的决策没有(完整的)历史数据→历史数据分析(经验)发展趋势预测隐含信息挖掘→更难支持企业决策研究企业范围内的数据集成多数据库系统面向问题的分析海量数据存储产生一项新的信息技术

DataWarehousingDW的概念起源于20世纪80年代美国著名信息工程学家W.H.Inmon博士RecordSystemAtomicData→提出数据仓库的概念DecisionSupportDatabase数据挖掘

OLAP的应用

数据挖掘应用基本步骤设计与实施数据仓库技术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能第二二节节数数据据仓仓库库概概述述早期期数数据据仓仓库库的的定定义义的的重重要要文文献献::MartinHubel1986.10DataBaseandtheDataWarehousingConcept数据据仓仓库库的的定定义义AnArchitectureforaBusinessandInformationSystem—IBMSystemJournal其中中,,披披露露了了一一项项IBM的内内部部研研究究计计划划目的的::构构造造一一种种“以关关系系数数据据库库为为基基础础的的公公司司数数据据的的集集成成化化仓仓储储”仓储储的的使使用用者者::不不是是IT人员员而是是各各级级决决策策者者→→数据据仓仓库库1991年,,IBM公司司正正式式公公布布其其DW构架架INDEPTH→成功功开开发发DW数据据挖挖掘掘OLAP的的应应用用数据据挖挖掘掘应应用用基本本步步骤骤设计计与与实实施施数据据仓仓库库技技术术体系系结结构构数据据仓仓库库客户户智智能能定义义、、构构成成OLAP技术术应用用商业业智智能能第二二节节数数据据仓仓库库概概述述数据据仓仓库库(datawarehouse)是一一个个面面向向主主题题的的(subjectoriented)、集集成成的的(integrated)、非非易易失失的的(non-volatile)、随随时时间间变变化化的的(timevariant)数据据集集合合,,用用于于支支持持管管理理决决策策。。面向主题集成性非易失性时变性

在数据仓库中,所有数据都是围绕一定主题进行。对于同一主题:关系数据库中,数据分布在相关的数据表中,在数据仓库中,数据存放在同一数据表中。数据仓库中数据都经过清洗、过滤、转换。都有统一得格式、消除了源数据中结构、表示方式、代码含义,不一致性

对于支持决策,历史数据非常重要。数据一旦写入,几乎不再更改,除非错误。对数据仓库的操作只是数据追加。所以数据仓库中数据是非易失的(稳定的)数据仓库中数据是只增不删的,所以记录了所有的数据。反映企业各个时期的信息,即反映企业随时间动态变化的数据。数据据仓仓库库的的定定义义数据据挖挖掘掘OLAP的的应应用用数据据挖挖掘掘应应用用基本本步步骤骤设计计与与实实施施数据据仓仓库库技技术术体系系结结构构数据据仓仓库库客户户智智能能定义义、、构构成成OLAP技术术应用用商业业智智能能第二二节节数数据据仓仓库库概概述述面向主题案例数据据结结构构::销售售管管理理系系统统顾客客((顾顾客客号号,,姓姓名名,,性性别别,,年年龄龄,,文文化化程程度度,,地地址址,,电电话话))销售售((员员工工号号,,顾顾客客号号,,商品品号号,数量,单价,日期期)采购管理系统统订单单(订单号,,供应商号,,总金额,日日期)订单细则(订订单号,商品号,类别,单价价,数量)供应商((供应商号,,供应商名,,地址,电话话)库存管理系统统领料单(领料料单号,领料料人,商品号,数量,日期)进料单(进料料单号,订单单号,进料人人,收料人,,日期)库存(商商品号,库房房号,库存量量,日期)库房(库库房号,仓库库管理员,地地点,库存商商品描述)数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能第二节数据据仓库概述面向主题案例这种数据组织织的特点:对相关部门的的数据进行收收集和处理,,重点是“数据”和“处理”数据按部门的的组织结构和和业务活动特特点进行;数据是不断变变化和反复更更新的,所以以,是动态的的,要求的是是处理的速度和和即时性(只只反映当时的的情况);数据库中存储储的表与部门门中的业务报报表基本上是是对应的,所所以,直观,处理方方便,易理解解;数据库建立的的本质:数据据与处理分离离(在程序中中不分离)因为:很多应应用涉及同一一数据项,而而同一数据项项分散在不同同的数据库中→→造成数据据的不一致性性。这样的数据处处理方式称为为“联机事务处理理”——OLTP数据库的存储储要求冗冗余小(各各种范式)速度快(保保留一定的冗冗余)数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能第二节数据据仓库概述按主题组织数数据的数据结结构:商品商品固有信息息(商品号,商品名,类别,颜色,…)商品采购信息息(商品号,供应商号,供应价,供应日期,供应量,…)商品销售信息息(商品号,顾客号,售价,销售日期,销售量,….)商品库存信息息(商品号,库房号,库存量,日期,…)供应商供应商固有信信息(供应商号,供应信息,地址,电话,…)供应商品信息息(供应商号,商品号,供应价,供应日期,供应量,…)顾客客顾客固有信息息(顾客号,顾客名,性别,年龄,文化程度,住址,电话,…)顾客购物信息息(顾客号,商品号,售价,购买日期,购买量,…)①企业关心的业业务方向:客客户,商品,,供应商②对上述分析对对象,可围绕绕主题进行数数据组织:采购销售库存商品(一致)信息息,便于联联机分析处理理OLAP数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能(1)数据粒度面向数据挖掘掘面向OLAP粒度的大小反反映数据仓库库的数据综合程程度。粒度越越小,数据越详详细,数据量量也越大。(表表7-1)反映的是抽样样率。抽样率率的确定取决于源源数据量的大大小和数据挖掘的的具体要求。。源数据量越大,,抽样率越低低。表7-1数数据粒度度的相关指标标数据粒度的划划分是设计最最重要的工作作,需考虑数数据仓库可接接受的分析类类型和最低粒粒度以及能存存储的数据量量。一般数据据仓库都选择择多重粒度的的结构。重要概念第二节数据据仓库概述数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能数据分割常见见形式垂直分割水平分割图解分割(2)数据分割数据分割就是将大量的的数据分成独独立的、较小小的单元进行行存储以提高高数据处理的的效率。在进进行分割时要要考虑数据量量、数据对象象和粒度划分分策略等几个个方面。一个表垂直分分成两部分,把把一个大表分成成两个表,表之之间通过关键字段关联。表按行分成两两部分,表被用用来存储用户联联系紧密的本地地重要数据,减减少网络查询。。经过多个分布布系统把一个图分分解成两部分,从从指定的服务器或或在多个服务器之之间建立连接而得得到一个表所需要要的全部数据。第二节数据据仓库概述数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能第二节数据据仓库概述数据仓库与数数据库的区别别表7-2数据库和数据据仓库的区别别数据库只存储储当前数据,,而数据仓库库存放历史数数据;数据库库主要面向业业务操作,而而数据仓库面面向数据分析析和决策支持持;数据库中中的数据是动动态变化的,,随时刷新,,而数据仓库库中的数据是是静态的,一一般不会改变变;数据库使使用频率比数数据仓库高,,数据访问量量少,要求响响应时间短。。数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能企业外部数据据数据仓库存储储业务操作型系系统数据清洗/转换数据提取提取仓库数据挖掘系统/数据展现系统数据集市数据集市数据集市数据集市数据仓库的体体系结构数据元数据据图7-3数数据仓库的体体系结构图第二节数据据仓库概述数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能数据仓库的体体系结构由于数据库和和数据仓库应应用的出发点点不同,因此此数据仓库与与业务数据库库系统是相互互独立的,但但数据仓库又又同业务数据据库系统密切切相关。数据仓库是将将业务操作型型系统中的数数据提取出来来,辅以企业业外部数据,,这些数据经经过清洗和转转换,存储在在数据仓库中中。数据仓库库不只存储业业务数据,还还存储记录数数据信息的元元数据。数据仓库中还还可以抽取部部门型数据仓仓库,即数据据集市。数据据最终传送给给数据挖掘系系统或数据展展现系统,以以供数据分析析或展现给用用户。所以,,数据仓库不不是简单地对对数据进行存存储,而是对对数据进行““再组织”。。第二节数据据仓库概述数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能传统数据库面面向操作型环环境,系统设设计人员能够够明确了解用用户需求,因因此传统数据据库一般采用用系统生命周期期法(systemdevelopmentlifecycle,SDLC))。而数据仓仓库面向分析析型应用,设设计人员要在在与用户不断断沟通的基础础上,逐步明明确与完善系系统需求,因因此数据仓库库设计采用CLDS(cyclelifedevelopmentsystem)方法。需求分析贯穿穿整个数据仓仓库设计过程程。数据仓库的设设计方法与步步骤第二节数据据仓库概述数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能数据仓库的设设计方法与步步骤第二节数据据仓库概述图7-4SDLC方法法和CLDS方法比较数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能数据仓库的的设计方法法与步骤第二节数数据仓库概概述表7-3数数据仓库设设计与数据据库设计的的区别数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能数据仓库的的设计方法法与步骤第二节数数据仓库概概述图7-5数数据仓库库设计的主主要步骤数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能第三节CRM系系统中的数数据仓库技技术最终用户信息使用者知识挖掘者数据仓库的的用户信息使用者者使用数据据仓库是经经常性的、、重复性的的,只访问问很少的一一部分数据据。每次查查询也许是是相同的几几个指标,,运用数据据仓库可以以快速、准准确地得到到他们所需需要的信息息。信息使使用者是操操作型用户户。知识挖掘者者不只查询询数据仓库库目前能够够提供的信信息,还通通过数据分分析找到其其中的隐含含信息,用用以发现更更深层次的的知识来指指导决策。。知识挖掘掘者是分析析型用户。。知识挖掘者者在使用数数据仓库时时,先对数数据进行概概括分析,,然后根据据需要从数数据仓库中中抽取数据据,对抽取取出来的数数据选择合合适的数据据挖掘算法法进行建模模分析,最最后是根据据建模分析析得到的知知识对数据据仓库进行行分类处理理。数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能客户数据仓库的功能动态、整合合的客户数数据管理和和查询功能能基于数据仓仓库支持的的客户关系系结构和忠忠诚客户识识别功能基于WEB数据仓库的的信息共享享功能基于数据仓仓库支持的的客户购买买行为参考考功能基于数据仓仓库支持的的客户流失失警示功能能CRM系统统中数据仓仓库的功能能CRM的数据仓库库必须是动动态的、整整合的数据据库系统。。动态指数据库能能够实时地地提供客户户的基本资资料和历史史交易行为为等信息,,并在客户户每次交易易完成后,,能够自动动补充新的的信息;整合是指客户数数据库与企企业其他资资源和信息息系统要综综合、统一一,各业务务部门及人人员可根据据职能、权权限的不同同实施信息息查询和更更新功能,,客户数据据仓库与企企业的各交交易渠道和和联络中心心必须紧密密结合等。。实施忠诚客客户管理的的企业需要要制定一套套合理的建建立和保持持客户关系系的格式或或结构。即即企业要像像建立雇员员的提升计计划一样,,建立一套套把新客户户提升为老老客户的计计划和方法法。例如,,航空公司司的里程积积累计划——客户飞行了了一定的里里程数,便便可以获得得相应的免免费里程,,或根据客客户要求提提升舱位等等级等。企业运用客客户数据仓仓库,可以以使每一个个服务人员员在为客户户提供产品品和服务时时,明确客客户的偏好好和习惯,,从而提供供更具有针针对性的个个性化服务务。例如,,读者俱乐乐部都有定定制寄送服服务,他们们能根据会会员最后一一次的选择择和购买记记录,以及及他们最近近一次与会会员交流获获得的有关关个人生活活信息,向向会员推荐荐不同的书书籍。企业的客户户数据仓库库将通过对对客户历史史交易行为为的观察和和分析,发发挥警示客客户异常购购买行为的的功能。如如一位客户户的购买周周期或购买买量出现显显著萎缩变变化时,就就是潜在的的客户流失失迹象。客客户数据库库通过自动动监视客户户的交易资资料,对客客户的潜在在流失现象象作出警示示。Web数据仓库将将成为企业业信息共享享的基础架架构。客户户数据仓库库应拥有可可以通过浏浏览器使用用的接口,,以成为支支持客户关关系管理的的基本架构构,并且数数据仓库要要能够通过过用户的简简单点击就就可以获得得分析结果果。CRM环境下连接接分散单位位的数据中中心建成关关键在于Web数据仓库构构造之初就就为其所有有部分确立立一致的数数据元,并并通过一致致的数据元元实现数据据仓库的总总线体系结结构。第三节CRM系系统中的数数据仓库技技术数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能能图7-6客户数据据仓库的的体系结结构数据挖掘对分析的结果进行评估客户信息客户活动清洗、转换外部数据联机分析处理数据仓库数据准备客户数据集市CRM系系统中数数据仓库库的系统统结构第三节CRM系统统中的数数据仓库库技术数据挖掘掘OLAP的应用用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能CRM系系统中数数据仓库库的系统统结构数据通过过抽取、转转换和装装载,形成数数据仓库库,并通通过OLAP和报表,,将客户户的整体体行为分分析和企企业运营营分析等等传递给给数据仓仓库用户户。在数据仓仓库中,,利用数数据仓库库的ETL(extraction-transformation-loading)工具,针针对行为为分组和和寻找重重点客户户的需要要,产生生相应的的数据集市市(DM),将分析析结果与与性能评评价等传传递给CRM用户。对对于客户户量巨大大、市场场策略对对企业影影响较大大的企业业,CRM要以数据据仓库为为核心。。数据来源客户信息息客户行为为生产系统统其他相关关数据第三节CRM系统统中的数数据仓库库技术数据挖掘掘OLAP的应用用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能分析建立企业模型概念模型设计逻辑模型设计物理模型设计数据仓库生成确定系统边界及主题域技术准备工作确定数据的存储结构

确定数据存放位置

确定存储分配

CRM系系统中数数据仓库库的设计计与实施施第三节CRM系统统中的数数据仓库库技术数据挖掘掘OLAP的应用用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能客户数据仓库的建立注意问题数据信息息收集和和集成确保数据据的质量量按规则更更新客户户数据,保持对已已有客户户的统一一看法数据仓库库统一共共享,以以发挥最最大作用用为进一步步了解客客户身份份及其需需求,并并做出预预测,企企业需要要花费一一些精力力进行分分析,因因此产生生了数据据信息搜搜集。成成功地使使用数据据信息搜搜集是CRM建设的重重要步骤骤。CRM的客户数数据仓库库需要把把企业内内外的客客户数据据集成起起来。就就客户数数据集成成来讲,,企业需需要对客客户进行行匹配和和合并。。首先,在在建立CRM数据库时时,一定定要确认认由应用用程序所所生成的的客户编编码的唯唯一性;;其次,,建立完完整、准准确的客客户数据据仓库,,姓名和和地址这这两个信信息片段段是很重重要的,,一定要要进行分分解和规规范化;;最后,,对企业业想收集集又没有有一定结结构且信信息量比比较大的的数据一一定要非非常慎重重,比如如文本信信息。首先识别别新数据据性质,,新客户户的数据据给一个个独立的的标识,,在数据据仓库中中插入一一条新的的记录;;如果是是已有客客户的数数据,更更新客户户记录的的相关信信息片段段。数据据更新要要求同步步化是CRM数据仓库库的特点点之一。。统一共享享的客户户数据仓仓库把销销售、市市场营销销和客户户服务的的所有信信息连接接起来。。如果一一个企业业的信息息来源互互相独立立,那么么这些信信息会不不可避免免地出现现重复、、互相冲冲突等现现象,这这对企业业的整体体运作效效率将产产生消极极的影响响。第三节CRM系统统中的数数据仓库库技术CRM系系统中数数据仓库库的设计计与实施施数据挖掘掘OLAP的应用用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能CRM中数据仓库的应用客户行为为分析重点客户户发现市场性能能评估客户行为为分析包包括整体行为为分析和群体行为为分析两个方面面。整体行行为分析析用来发发现企业业所有客客户的行行为规律律,行为为分组时时按照客客户的不不同种类类的行为为,将客客户划分分成不同同的群体体。在行为分分组完成成后,要要进行客客户理解解、客户户行为规规律发现现和客户户组间交交叉分析析等。重点客户户发现主主要是发发现能为为企业带带来潜在在效益的的重要客客户。根根据客户户的属性性特点就就可以挖挖掘出重重点客户户,然后后做好保保持和提提高这些些重点客客户的忠忠诚度工工作。此此外,通通过数据据仓库的的数据清清洗与集集中过程程,可以以将客户户对市场场的反馈馈自动输输入数据据仓库中中,这个个获得客客户反馈馈的过程程,称为为客户行为为追踪。根据客户户行为分分析,企企业可以以准确地地制定市市场策略略和市场场活动。然而,这这些市场场活动是是否能够够达到预预定的目目标,是是改进市市场策略略和评价价客户行行为分组组性能的的重要指指标。因因此,在在CRM中必须须对行为为分析和和市场策策略进行行评估。第三节CRM系统统中的数数据仓库库技术CRM系系统中数数据仓库库的应用用数据挖掘掘OLAP的应用用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库客户智能定义、构成OLAP技术应用商业智能第四节OLAP技术及其在CRM系统中中的应用OLAP是共享多维信信息的、针对对特定问题的的联机数据快速访问和分析的的软件技术。。它通过对信信息的多种可可能的观察形形式进行快速速、稳定一致致和交互性的的存取,允许许管理决策人人员对数据进进行深入观察察。相关概念变量维维的层次性维成员多维数组数据单元联机分析处理理的概念数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能变量:分析数据时要要考虑的属性性,即描述数数据“是什么么”。维:是人们观察数数据的特定角角度,是考虑虑问题时的一一类属性,属属性集合构成一个维。维的层次性::人们观察数据据的某个特定定角度(即某某个维)还可可以存在细节节程度不同的各各个描述方面面,我们称这这多个描述方方面为维的层层次。一个维维往往具有多个层层次。维成员:维的一个取值值,若维分为为几个层次,,那么维成员员就是不同维维层次取值的组合合。多维数组:多维数组是维维和变量的组组合表示。一一个多维数组组可以表示为为:(维1,维2,…,维n,变量)。。数据单元:数据单元是多多维数组的取取值。当多维维数组的各个个维都选中一一个维成员,这这些维成员的的组合就唯一一确定了一个个变量的值。。那么数据单单元就可以表示为为:(维1维维成员,维2维成员,……,维n维成成员,变量的的值)。联机分析处理理的概念第四节OLAP技术及其在CRM系统中中的应用数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能多维数据模型型上的OLAP操作对多维数据集集(维1、维2、维3……维n、变量值)在在维度i上选定一个维维成员,得到到一个n-1维多维数据集集,称得到的的这个n-1维多维数据集集为原数据集集在第i维上的数据切切片。OLAP的分析方法数据切片数据切块数据钻取数据聚集数据旋转在多维数据立立方体中,确确定某些维度度的取值范围围,得到一个个原立方体的的子立方体的的过程被称为为数据切块。。数据切块与与数据切片得得到的多维数数组都是原多多维立方体的的子集,不同同的是数据切切片使多维立立方体降低了了一个维度,,而数据切块块得到的多维维立方体与原原立方体的维维度是相同的的。数据钻取(数据下钻),是由概括的的数据到详细细的数据的过过程。数据钻钻取对应于维维的层次,它它是由维的高高层次展开到到低层次的一一个动作。比比如,我们由由“年”数据下钻到“季度”数据,这无疑疑会增加数据据细节和数据据量,得到更更详细的数据据。数据钻取取的具体操作作参见图7—2中的数据钻取取部分。数据聚集又叫叫数据上卷,,是数据钻取取的逆过程。。数据聚集是是将详细的数数据聚集为较较概括的数据据,是一个综综合数据的动动作。数据旋转即变变换维度的位位置,也就是是转动数据的的视角,给用用户提供一个个从不同的角角度观察数据据的方法。第四节OLAP技术及其在CRM系统中中的应用数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能原数据立方体体包含了时间间(年)、城城市、产品三三个维度,其其中a1,a2为产品名。钻钻取过程是按按时间下钻,,由年数据得得到季度数据据,数据由原原来的两行展展为八行。聚聚集过程是按按地区维度上上卷,将城市市维上卷为国国家维,即将将北京、上海海两城市数据据统计为中国国的数据,将将东京、大阪阪两城市的数数据统计为日日本的数据。。数据聚集和和数据钻取为为用户提供了了不同层次观观察数据的方方法。20073季20071季20061季20063季20074季20072季20064季20062季a1a2

北京上海东京大阪钻取聚集a2a120062007中国日本20062007北京上海东京大阪a1a2图7-7

数据钻取与聚集聚集钻取第四节OLAP技术及其在CRM系统中中的应用数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能20062007A1200230A2456478A3100120A1A2A320062004561002007230478120图7-8数据旋转图7-8是数据旋旋转的一个简简单示例,只只体现了二维维表的旋转。。当数据是三三维或是三维维以上的多维维数据时,数数据旋转将更更有意义,每每进行一次数数据旋转就可可以从一个新新的视角观察察数据。第四节OLAP技术及其在CRM系统中中的应用数据挖掘OLAP的应应用数据挖掘应用用基本步骤设计与实施数据仓库技术术体系结构数据仓库客户智能定义、构成OLAP技术应用商业智能OLAP的特点联机分析处理理的用户是企企业中的专业业分析人员及及管理决策人人员,在分析析业务经营的的数据时,从从不同的角度度来审视业务务的衡量指标标是一种很自自然的思考模模式。比如,,分析销售数数据时,综合合时间周期、、产品类别、、分销渠道、、地理分布、、客户群类生生成一张张报报表,各个分分析角度的不不同组合又可可以生成不同同的报表,使使得IT人员的工作量量相当大。联机分析处理理的主要特点点是直接仿照照用户的多角角度思考模式式,预先为用用户组建多维维的数据模型型。一旦多维维数据模型建建立完成,用用户可以快速速地从各个分分析角度获取取数据,也能能动态地在各各个角度之间间切换或者进进行多角度综综合分析,具具有极大的分分析灵活性。。这也是联机机分析处理近近年来被广泛泛关注的根本本原因,它从从设计理念和和真正实现上上都与旧的管管理信息系统统有着本质的的区别。第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能OLAP的应用数据仓库系系统核心是是联机分析处理,从应用的角角度来说,,数据仓库还可以以采用传统统的报表或或数理统计计和数据挖挖掘等人工工智能方法法,涵盖的范围围更广;从应用的范范围来说,,联机分析处处理往往根根据用户分分析的主题题进行应用分类类,如销售分析析、市场推推广分析、、客户利润润率分析等等,每一个分析的的主题形成成一个OLAP应用,而所所有的OLAP应用实际上上只是数据仓库系系统的一部部分。以某家电企企业为例介介绍OLAP的应用。家家电的多维维分析涉及及产品、销售售数量、地地区和时间间4个维。所有有抽查的数数据都是第第1季度的。第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能冰箱销售第1季度,冰箱箱在什么地地区销售情情况最好??第1季度,哪个个省份的冰冰箱销量处处于领先地地位?第1季度,哪个个城市的冰冰箱销售数数量最高??负责冰箱销销售的副总总裁提出了了以下3个问题:解决方法需需要用到OLAP的两种多维维分析方法法,即数据切片片/切块和数据据钻取,其他的分析析方法还有有数据旋转转和数据聚聚集等。第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能产品地点时间电视冰箱空调华东东北西北2006.42007.12007.22007.3冰箱图7-9运用数据切切片来进行行数据分析析首先使用数数据切片方方法来对第第一个问题题进行分析析。在图7-9的数据立方体体中,时间间、地区和和产品分别别是3个维度,销销售额是度量变量。。在产品维维上选定“冰箱”则形成在产产品维上的的数据切片,显示了了冰箱在各各地区和各各月份的销销售情况。。第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能数据钻取和和聚集会改改变维的层层次,变换换分析的粒粒度,在家家电企业的例子中,,必须采用用联机分析析处理工具具深入的地地区维中,,通过数据据钻取来查看某某地区维中中更细致的的数据。((如图7-10所示示)。表7-4按按地区划分分的销售数数据通过模型驱驱动工具来来查询数据据仓库的数数据,如表表7-4第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能冰箱44899西北79954华东36040东北25309浙江29344江苏17866吉林18174辽宁西北东北华东冰箱24632陕西20267甘肃25301山东图7-10运用数据钻钻取来进行行数据分析析图7-10表示示的是对地地区维数据据钻取的第第一步,即即显示了该该家电企业业按地区划划分的各省省份的冰箱箱销售量(如表7-5所示);更深一步步的钻取可可以显示出出各城市的的销售情况况,得到表表7-6。第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能表7-5按按地地区和省进进行划分的的销售数据据第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能表7-6按按地区区、省和城城市进行划划分的销售售数据第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能通过OLAP得出了负责责冰箱销售售的副总裁裁所提出的的3个问题的答答案:2007年第1季度,冰箱箱在华东地地区销售情情况最好。。2007年第1季度,在华华东地区,,江苏的冰冰箱销售量量处于领先先地位。2007年第1季度,江苏苏的南京冰冰箱销售量量最高。OLAP的应用第四节OLAP技术及其在在CRM系系统中的应应用数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能第五节数数据挖掘掘概述数据挖掘((datamining)是从大量的的、不完全全的、有噪噪声的、模模糊的、随随机的实际际应用数据据中提取人人们感兴趣趣的知识,,这些知识识是隐含的的、事先未未知的、潜潜在有用的的信息。它它是通过分分析数据发发现数据内内部的信息息和知识过过程。数据挖掘的的基础是大大量数据,,所以具有有高效处理理大量数据据的能力。。这也是目目前数据挖挖掘技术的的一个难题题,一些算算法在小数数据集上效效果很好,,但数据量量增加到一一定程度,,算法的实实现代价过过大、效率率太低,甚甚至无法实实现。数据挖掘的的定义数据挖掘OLAP的的应用数据挖掘应应用基本步骤设计与实施施数据仓库技技术体系结构数据仓库客户智能定义、构成成OLAP技术应用商业智能数据来源事务数据库库高级数据库库数据仓库关系数据库库数据据挖挖掘掘的的数数据据来来源源关系系数数据据库库::关系系数数据据库库中中的的数数据据是是最最丰丰富富、、最最详详细细的的。。在在进进行行数数据据挖挖掘掘之之前前也也要要对对数据据进进行行清清洗洗和和转转换换。。数数据据的的真真实实性性和和一一致致性性是是进进行行数数据据挖挖掘掘的的前前提提和和保保证证。。数据据仓仓库库::数据据经经过过清清洗洗和和转转换换,,不不存存在在错错误误和和不不一一致致的的情情况况,,数数据据仓仓库库在在获获取取数数据据后后就不不需需要要再再进进行行这这些些数数据据处处理理工工作作了了。。数据据仓仓库库、、数数据据挖挖掘掘和和联联机机分分析析处处理理共共同同构构成成了了系系统统的的决决策策支支持持模模块块。。事务务数数据据库库::数据据挖挖掘掘可可从从事事务务数数据据库库中中提提取取数数据据。。其其每每个个记记录录代代表表一一个个事事务务。。在进进行行数数据据挖挖掘掘时时,,可可以以只只将将一一个个或或几几个个事事务务数数据据库库集集中中到到数数据据挖挖掘掘库库中中进进行行挖挖掘掘。。高级级数数据据库库::面向向对对象象的的数数据据库库、、空空间间数数据据库库、、时时间间和和时时间间序序列列数数据据库库、、文文本本和和多多媒媒体数数据据库库等等新新的的数数据据库库。。这这些些结结构构更更为为复复杂杂的的数数据据库库为为数数据据挖挖掘掘提提供供了了更更加加全全面面、、更更加多多元元化化的的数数据据,,也也为为数数据据挖挖掘掘技技术术提提出出了了更更大大的的挑挑战战。。第五五节节数数据据挖挖掘掘概概述述数据据挖挖掘掘OLAP的的应应用用数据据挖挖掘掘应应用用基本本步步骤骤设计计与与实实施施数据据仓仓库库技技术术体系系结结构构数据据仓仓库库客户户智智能能定义义、、构构成成OLAP技术术应用用商业业智智能能数据据挖挖掘掘的的基基本本步步骤骤数据据挖挖掘掘包包括括确确定定分分析析和和预预测测目目标标、、建建立立数数据据挖挖掘掘库库、、分分析析数数据据、、建建立立模模型型、、模模型评估估与验验证、、模型型实施施等几几个基基本步步骤。。第五节节数数据据挖掘掘概述述图7-11数数据挖挖掘的的基本本步骤骤数据挖挖掘OLAP的的应用用数据挖挖掘应应用基本步步骤设计与与实施施数据仓仓库技技术体系结结构数据仓仓库客户智智能定义、、构成成OLAP技术应用商业智智能数据挖挖掘的的基本本步骤骤第五节节数数据据挖掘掘概述述数据挖掘的基本步骤1)确确定定分析析和预预测目目标确定分分析和和预测测目标标相当当于需需求分分析,主要要是明明确业业务目目标。。确定定分析析和预预测目目标是是数据据挖掘掘的基基础条条件。。同时时,定定义了了数据据挖掘掘的分分析目目标也也就定定义了了评价价这一一挖掘掘模型型的标标准。2)建建立立数据据挖掘掘库首先要要进行行数据收收集,对于于收集集到的的数据据,应应对数数据的的来源源、大大小、、存储储位置置和数数据在在使用用上的的限制制等进进行详详细的的记录。完成成数据据收集集后,要对对数据据进行行描述述。数据挖挖掘库库可以是是一个个单独独的数数据库库,也也可以以和数数据仓仓库建建立在在相同同的物物理介介质上上。数数据挖挖掘库库中还还应包包括数数据的的元数数据。。3)分分析析数据据分析数数据即即对数数据挖挖掘库库中的的数据据进行行分析析,对对数据据有了了全面面、细细致的的了解解以后后,就就可以以针对对数据据挖掘掘分析析目标标选择择合适适的变变量和和记录录。对对于变变量的的选择择,首首先要要考虑虑对结结果有有影响响、可可以反反映结结果的的变量量。4)建建立立模型型建立模模型是是选择择合适适的方方法和和算法法对数数据进进行分分析,得到到一个个数据据挖掘掘模型型的过过程。。建立立模型型是一一个反反复进进行的的过程程,它它需要要不断断地改改进或或更换换算法法以寻寻找对对目标标分析析作用用最明明显的的模型型,最最后得得到一一个最最合理理、最最适用用的模模型。5)模模型型评估估与验验证为了验验证模模型的的有效效性,一般般会将将数据据集分分为两两部分分:一一部分分用于于建立立模型型,另另一部部分则则用于于测试试模型型。对对模型型的验验证主主要需需要考考虑以以下几几个方方面:(1)模型的的准确确性;(2)模型的的可理理解性性;(3)模型的的性能能。模型型建立立和模模型检检验是是一个个反复复的过过程。。6)模模型实实施模型的的实施施有两两种情情况:一种种是将将数据据挖掘掘模型型得到到的结结果提提供给给信息息需求求者或或者管管理者者,以以辅助助管理理者的的决策策分析析;还有一一种情情况就就是保保留模模型,以后后每遇遇到类类似问问题就就用这这个模模型进进行分分析,或者者将模模型用用于不不同的的数据据集上上(这这些数数据分分析需需要采采用相相同的的方法法)进进行分分析。。在模型型的使使用过过程中中,随随时间间及环环境的的变化化,还还应对对模型型进行行重新新测试试,并并对模模型进进行相相应的的修改改,这这就是是模型维维护的的过程程。数据挖挖掘OLAP的的应用用数据挖挖掘应应用基本步步骤设计与与实施施数据仓仓库技技术体系结结构数据仓仓库客户智智能定义、、构成成OLAP技术应用商业智智能数据挖挖掘工工具及及其选选择第五节节数数据据挖掘掘概述述数据挖挖掘工工具包包括数据挖挖掘(datamining)工具具和文本挖挖掘(textmining)工具具。数据据挖掘掘工具具主要要是用用来进进行聚聚类分分析、、关联联分析析、时时间序序列分分析以以及统统计分分析的的。文文本挖挖掘工工具主主要应应用在在市场场调研研报告告中或或呼叫叫中心心(callcenter)的的客户户抱怨怨定级级、专专利的的分类类、网网页的的分类类以及及电子子邮件件的分分类等等方面面。一一般而而言,目前前市场场上这这些数数据挖挖掘工工具又又可以以分成成两类类:企企业级级工具具以及及小型型工具具。数据挖挖掘OLAP的的应用用数据挖挖掘应应用基本步步骤设计与与实施施数据仓仓库技技术体系结结构数据仓仓库客户智智能定义、、构成成OLAP技术应用商业智智能数据挖挖掘工工具及及其选选择第五节节数数据据挖掘掘概述述数据挖掘工具的选择①公司司的数数据挖挖掘需需求是是短期期行为为还是是长期期使用用②公司司的数数据挖挖掘经经验和和水平平③公司司的数数据状状态④公司司的预预算⑤工具具的性性能数据挖挖掘OLAP的的应用用数据挖挖掘应应用基本步步骤设计与与实施施数据仓仓库技技术体系结结构数据仓仓库客户智智能定义、、构成成OLAP技术应用商业智智能CRM中常用用的数数据挖挖掘算算法1)关联联分析析(associationanalysis)设I={i1,i2,……………im}是项的的集合合。设任务务相关关的数数据D是数据据库事事务的的集合合,其其中每每个事事务T是项的的集合合,使使得T∈I。每一一个事事务有有一个个标识识符,,称作作TID。设A是一个个项集集,事事务T包含A当且仅仅当A∈T。项的集集合称称为项项集((Itemset)。包含含k个项的的集合合称为为K-项集。。项集的的出现现频率率是包包含项项集的的事务务数,,简称称为项项集的的频率率、支支持计计数或或计数数。关联规规则是形如如AB的蕴含含式,,其中A∈I,B∈I,并且且A∩B=。规则AB在事务务集D中成立立,具具有支支持度度s,其中s是D中包含含A∪B的事务务的百百分比比。它是概概率P(A∪B)。规则AB在事务务集D中具有有置信信度c,如果D中包含含A的事务务中同同时也也包含含B的事务务的百百分比比是c。这是是条件件概率率P(B|A)。第五节节数数据据挖掘掘概述述数据挖挖掘OLAP的的应用用数据挖挖掘应应用基本步步骤设计与与实施施数据仓仓库技技术体系结结构数据仓仓库客户智智能定义、、构成成OLAP技术应用商业智智能CRM中常用用的数数据挖挖掘算算法支持度Support(AB)=P(A∪B)置信度Confidence(AB)=P(B|A)同时满足足最小支支持度和和最小置置信度的的规则称称为强规则。关联规规则挖掘掘就是寻寻找强规规则的过过程。如果项集集满足最最小支持持度,则则称为频频繁项集集Apriori算法是一一个关于于单维、、单层、、布尔规规则的方方法。因因此它也也是关联联规则挖挖掘中形形式最简简单的方方法。Apriori算法是一一个逐层层迭代寻寻找频繁繁集的方方法。如果项集集满足最最小支持持度,称称为频繁项集集。Apriori算法的性性质是频繁项集集的所有有非空子子集一定定是频繁繁的。Apriori算法第五节数数据据挖掘概概述1)关联分分析(associationanalysis)数据挖掘掘OLAP的应用用数据挖掘掘应用基本步骤骤设计与实实施数据仓库库技术体系结构构数据仓库库客户智能能定义、构构成OLAP技术应用商业智能能Apriori算法的实实例表7-7是一一个事务务数据,,ID表示顾客客号,“购买商品品”表示顾客客一次购购买的商商品名称称。规定定最小支支持度为为60%,最小置置信度为为80%。表7-7事务务数据第四步,,L2与L2连接,得得到候选选项集。。根据Apriori算法的性性质去掉掉不符合合条件的的候选项项,即有有不频繁繁子集的的项。然然后扫描描记录,,对候选选集中剩剩余候选选项计算算支持度度。根据据最小支支持度得得到频繁繁项集L3。第五步,继续重复上上述动作,,直到所得得频繁项集集Ln为空,则频频繁项集Ln-1即为最大频频繁项集。。第一步,扫描每条记记录,对每每个项(即即每种商品品)出现的的次数计数数。第二步,根据最小支支持度确定定频繁项集集L1。第三步,L1与L1连

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论