版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、教学目的教学目的掌握客户数据、客户信息和客户知识的关系及其在数据仓库中的过程熟悉解数据仓库的定义、特征、类型、技术结构了解面向CRM系统的数据仓库设计/开发流程以及避免数据仓库建设项目失败的措施熟悉数据挖掘的定义、发展方向及其基本任务了解数据挖掘的技术、算法和技术视角的流程了解在CRM中利用数据挖掘所形成的商业价值熟悉知识发现的定义和过程熟悉OLAP的定义、特征及其基本操作分析教学重点教学重点客户数据、客户信息和客户知识的关系及其在数据仓库中的过程数据仓库、数据挖掘、知识发现和OLAP的概念教学难点教学难点数据仓库的技术结构数据挖掘的技术、算法和技术视角的流程第第9章章 客户信息的整合与运用客
2、户信息的整合与运用知识发现与CRM客户信息、信息技术与CRM1CRM系统和数据仓库23CRM系统中的数据挖掘45联机信息分析处理与CRM9.1 客户信息、信息技术与客户信息、信息技术与CRM9.1.1 客户信息概述1.客户信息、客户数据与客户知识信息信息知识知识加工过的数据简单给出事实、清晰明了的、简单的、结构化的、方便的、以正式方式书写的通过精简、校正、整理、计算相关数据获得不具有所有者独立性,由信息系统掌握,大量数据处理的主要来源从数据演化而来,形成数据库、手册和文件等正式的、点滴积累的、说明性的、易于形成、可重复应用的形式动态数据可随意组合并用于预测性决策,没有完全结构化,模糊的、直觉的
3、、难以沟通和表达的存在于人们之间的联系、谈话及基于经历与体验的直觉中,反映在人们的比较情境和处理问题的能力之中取决于所有者和需要信息渠道等预测、设计、计划、诊断和直觉判断的主要资源在集体智慧中形成并在集体中共享,随着经历与成败而演化,需要日积月累地通过经历积淀而成表9-1 信息与知识的比较补充内容:数据、信息、知识的联系和区别补充内容:数据、信息、知识的联系和区别 数据 数据是知识阶层中最底层也是最基础的一个概念;数据是形成信息,知识和智慧的源泉数据是对现实生活的理性描述,尽可能地从数量上反映现实世界;也包括汇总、排序、比例、等等处理数据泛指对客观事物的数量、属性、位置及其相互关系的抽象表示,
4、以适合于用人工或自然的方式进行保存、传递和处理例如,水的温度是100,礼物的重量是500克,木头的长度是2米,大楼的高度时100层。在这些表述中:水,温度,100,礼物,重量,500克,木头,长度,2米,大楼,高度,100层就是数据,通过这些数据的描述我们的大脑里形成了对客观世界的清晰印象信息信息从自然现象和社会现象中搜集的原始材料是数据,根据使用数据人的目的按一定的形式加以处理,找出其中的联系,就形成了信息信息数据处理,这个公式符合我们的思路,但我们认为它还不够完整。信息事实上还包括有一个非常重要的特性 时效性。例如新闻说北京气温9摄氏度,这个信息对我们是无意义的,它必须加上今天或明天北京气
5、温9摄氏度。再例如通告说,在会议室三楼开会,这个信息也是无意义的,他必须告诉我们是哪天的几点钟在会议室三楼开会。注意信息的时效性对于我们使用和传递信息有重要的意义。它提醒我们失去信息的时效性,信息就不是完整的信息,甚至会变成毫无意义的数据流。所以我们认为信息是具有时效性的有一定含义的,有逻辑的、经过加工处理的、对决策有价值的数据流。信息数据时间信息数据时间+处理处理。 知识知识是让从定量到定性的过程得以实现的、抽象的、逻辑的东西。知识是需要通过信息使用归纳、演绎得知识是需要通过信息使用归纳、演绎得方法得到方法得到。知识只有在经过广泛深入地实践检验,被人消化吸收,并成为了个人的信念和判断取向之后
6、才能成为知识。信息虽给出了数据中一些有一定意义的东西,但它往往会在时间效用失效后价值开始衰减,只有通过人们的参与对信息进行归纳,演绎,比较等手段进行挖掘,使其有价值的部分沉淀下来,并于已存在的人类知识体系相结合,这部分有价值的信息就转变成知识。例如,北京7月1日气温为30度,在12月1日气温为3度。这些信息一般会在时效性消失后,变得没有价值,但当人们对这些信息进行归纳和对比就会发现北京每年的7月气温会比较高,12月气温比较低,于是总结出一年有春夏秋冬四个季节,有价值的信息沉淀并结构化后就形成了知识。 2.客户信息的类型客户信息的类型n在在CRM中,按照客户信息来源的不同,可以将客户信息分为中,
7、按照客户信息来源的不同,可以将客户信息分为3种种n描述客户是谁的信息描述客户是谁的信息n描述对客户进行营销或者促销活动的信息,主要包括市场活动的类描述对客户进行营销或者促销活动的信息,主要包括市场活动的类型、预算或描述等型、预算或描述等n描述客户与企业交易的信息,主要是过程信息与结果信息的结合描述客户与企业交易的信息,主要是过程信息与结果信息的结合n上述这些信息可能是客户直接或间接告诉给服务人员的,也可能是从信息服务提供商那里购买的,还有可能是企业员工利用Web技术从网络中获取的n这些客户信息为未来进行客户细分、客户价值的确定、客户生命周期的管理和客户忠诚计划提供了保证3.客户信息的重要性说明
8、客户信息的重要性说明n客户信息质量低下的危害性客户信息质量低下的危害性n储存和管理重复资料的高额成本储存和管理重复资料的高额成本n无法有效地、准确地处理客户联系和活动无法有效地、准确地处理客户联系和活动n对客户目前和潜在的价值,以及过去已经发生和未来对客户目前和潜在的价值,以及过去已经发生和未来可能发生的行为和要求无法进行深刻分析可能发生的行为和要求无法进行深刻分析n无法适当地划分和描述客户,从而也就无法针对不同无法适当地划分和描述客户,从而也就无法针对不同的客户群提供不同的服务的客户群提供不同的服务客户信息对客户管理系统的重要性客户信息对客户管理系统的重要性受客户信息水平影响最大的受客户信息
9、水平影响最大的4个领域(麦凯恩)个领域(麦凯恩)一是开辟新的分销渠道、关闭旧的分销渠道及重新部署现一是开辟新的分销渠道、关闭旧的分销渠道及重新部署现有的分销渠道等决策有的分销渠道等决策二是事半功倍的能力二是事半功倍的能力用更少的员工为更多的客户服务用更少的员工为更多的客户服务三是提高销售和营销活动的效率,并以较低的成本实现相三是提高销售和营销活动的效率,并以较低的成本实现相同的市场效率同的市场效率四是如何依据客户需求分配宝贵的客户服务资源,从而提四是如何依据客户需求分配宝贵的客户服务资源,从而提高客户服务水平高客户服务水平4.客户信息对其他管理活动的影响客户信息对其他管理活动的影响n减少外部采
10、购的需求减少外部采购的需求n对不断变化的经营环境的反应对不断变化的经营环境的反应5.客户数据客户数据客户信息客户信息客户知识客户知识呼叫中心呼叫中心网上交流网上交流电子邮件电子邮件传真传真直接接触直接接触OLAP数据挖掘数据挖掘运营分析运营分析市场专家市场专家知识发现知识发现数据仓库数据仓库客户数据客户数据客户信息客户信息客户知识客户知识图图9-1 客户数据客户数据客户信息客户信息客户知识过程图客户知识过程图补充内容:客户信息的来源9.1.2 CRM中的信息技术介绍中的信息技术介绍n数据库管理系统(数据库管理系统(Database Management System,DBMS)客户服务代表与存
11、储于计算机中的数据之间的软件界面,就是数据库管理系统对于任何重要的CRM系统而言,好的DBMS都是必不可少的数据仓库数据仓库它能使客户服务代表、呼叫中心经理、管理人员和其他得到授权的个体或实体接触各种信息数据挖掘数据挖掘数据挖掘软件支持从貌似无关的大量数据中挖掘出有用数据的工作数据挖掘通过确定数据间的关系和关联来工作数据挖掘的结果利于促销,如识别客户的喜好决策支持决策支持决策支持软件包含使用电话中心经理和公司领导能回顾和利用数据以作出更好决策的软件工具从简单的电子表格程序,到复杂的图形界面的过程模拟器电子邮件电子邮件9.1.3 CRM系统中的信息技术的应用系统中的信息技术的应用1.数据仓库的应
12、用数据仓库的应用n数据仓库技术能比较好地解决来自销售、市场、制造、库存和客户服务等部门的分散数据提取和问题处理,从而达到更好地了解客户,更方便地提供服务的目的2.数据挖掘技术的应用数据挖掘技术的应用n数据挖掘是一门广义的交叉科学,包括了数据库、人工智能、数据统计和并行计算等方面的技术n数据挖掘能够帮助企业确定客户的特点,从而可以为客户提供有针对性的服务9.2 CRM系统和数据仓库系统和数据仓库9.2.1 数据仓库( Data Warehouse,DW)概述1.数据库技术的发展n数据库系统是数据库和数据库管理系统的总称n1968年,IBM研制出信息管理系统n1969年,美国数据系统语言委员会的数
13、据库任务组提出了网络数据库模型的数据规范,于1971年发表了DBTG报告,正式确定了数据库设计的网络方法n1970年,Codd提出了数据库关系模型,开创了数据库的关系方法和数据库规范化理论的研究n80年代后,关系型数据库理论得到空前广泛的应用n90年代数据库技术并没有出现革命性的创新2.数据仓库的提出、发展与兴起n20世纪80年代中后期出现数据仓库思想的萌芽,从而为数据仓库概念的最终提出和发展打下了基础n1992年, Inmon W. H. 在其里程碑式的建立数据仓库一书中提出了“数据仓库(Data Warehouse)”的概念,数据仓库的研究和应用从此得到了广泛的关注9.2.2 数据仓库的定
14、义、特征与类型1.定义nInmon(1992)认为,数据仓库是面向主题的、集成的,是随时间推移而发生变化的数据集合,可用来支持管理决策n面向主题n集成的数据:从分散的子系统中提取,但不是简单拷贝,而是经过统一、综合n数据对最终用户而言只读:不可更改n数据随时间不断变化n用于支持管理决策nInfomix公司:数据仓库把分布在企业网络中的不同“信息孤岛”中的业务数据集成到一起,存储在单一的集成关系型数据库中;利用这种集成信息,可方便用户对信息的访问,更可使决策人员对一段时间内的历史数据进行分析,研究事物发展趋势nSAS:一种管理技术,旨在通过通畅、合理、全面的信息管理,达到有效的决策支持。数据库与
15、数据仓库:以银行业为例数据库是事务系统的数据平台,客户在银行做的每笔交易都会写入数据库,被记录下来,可以简单地理解为用数据库记帐。数据仓库是分析系统的数据平台,它从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。比如,某银行某分行一个月发生多少交易,该分行当前存款余额是多少。如果存款又多,消费交易又多,那么该地区就有必要设立ATM了。显然,银行的交易量是巨大的,通常以百万甚至千万次来计算。事务系统是实时的,这就要求时效性,客户存一笔钱需要几十秒是无法忍受的,这就要求数据库只能存储很短一段时间的数据。而分析系统是事后的,它要提供关注时间段内所有的有效数据。这些数据是海量的,汇总计算起来
16、也要慢一些,但是,只要能够提供有效的分析数据就达到目的了。数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。2.共同特征n数据仓库中包含大量数据,这些数据可能来自企业或组织内部,也可能来自外部n以数据仓库方式进行组织的目的是为了能够更好地支持决策n数据仓库为最终使用者提供了用于存取、分析数据的工具3.类型n根据数据仓库所管理的类型和它们所解决的企业问题范围,一般可将数据仓库分为下列3种类型n企业数据仓库(Enterprise DataWarehouse,EDW)n操作型数据库(Operational Data System,O
17、DS)n数据集市(Data Mart)9.2.3 数据仓库的技术结构n设计模块:是由数据仓库的设计者和管理者来设计和定义数据仓库数据库n数据获取模块:用于开发和运行数据获取应用程序,从源系统中获取数据,并整合到数据仓库的数据库中去n数据管理员模块:用来生成、管理和访问数据仓库中数据n管理模块:包括一整套用于维护数据仓库环境的系统管理服务n信息目录模块:能帮助技术用户和业务用户访问数据仓库系统n数据访问模块:所提供的数据访问工具使最终用户能够访问和分析数据仓库中的数据n中间件模块:将仓库数据库与最终用户工具连接起来数据数据获取获取模块模块数据管理员数据管理员 模块模块数据仓库数据仓库 数据数据元
18、数据数据传递数据传递模块模块中间件中间件模块模块信息目录信息目录 模块模块元数据元数据外部元数据数据访问数据访问模块模块外部数据设计模块设计模块管理模块图图9-2 数据仓库的技术结构数据仓库的技术结构补充:数据仓库系统模型数据仓库系统由四个主要部分组成处理过程实现:集散区域、管理控制数据的提供:仓库数据储藏室、元数据储藏室9.2.4 面向CRM系统的数据仓库设计与开发1.任务和环境的评估2.需求的收集和分析3.构造数据仓库4.数据仓库技术的培训5.回顾、总结与再开发9.2.5 数据仓库解决方案(略)1.Sybase提供的数据仓库解决方案2.SAS提供的数据仓库解决方案3.Platinum提供的
19、数据仓库解决方案4.HP提供的数据仓库解决方案5.IBM公司提供的数据仓库解决方案6.Informix公司提供的数据仓库解决方案7.Oracle公司提供的数据仓库解决方案9.2.6 Eddie Bauer的客户数据仓库1.新的观点2.信息决定商业决策3.跟踪客户4.了解客户5.客户忠诚度9.2.7 如何避免数据仓库建设项目的失败如何避免数据仓库建设项目的失败1.缺少领导的大力支持和积极参与2.过高的期望值3.没有以决策支持为核心4.人员配备不够充分5.低估了数据清洁、转换、载入的工作量6.低估了用户对系统扩充的需要7.对用户界面和前端工具的重视(不够)9.3 CRM系统中的数据挖掘系统中的数据
20、挖掘9.3.1 数据挖掘(Data Mining)概述1.从与数据仓库、OLAP和统计分析的联系中定义数据挖掘n数据挖掘:从大量的、不完全的、有噪声的、从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含于其模糊的、随机的实际应用数据中提取隐含于其中的、人们事先不知道但又具有潜在用途的信中的、人们事先不知道但又具有潜在用途的信息和知识的过程息和知识的过程n从大量的数据中,抽取出潜在的、有价值的知识、模型或规则的过程进化阶段商业问题支持技术产品厂家产品特点数据搜集(20世纪60年代)过去5年中,总收入是多少?计算机、磁带和磁盘IBM和CDC提供历史性的、静态的数据信息数据访问(20
21、世纪80年代)在新英格兰的分部,去年三月的销售额是多少?关系数据库、结构化查询语言(SQL)、ODBCOracle、Sybase、Informix、IBM和Microsoft提供历史性的、动态的数据信息数据仓库决策支持(20世纪90年代)在新英格兰的分部,去年三月的销售额是多少?波士顿可以据此得出什么结论?联机分析处理、多维数据库、数据仓库Pilot、Comshare、Arbor、Cognos和Microstrategy在各种层次上提供回溯性的、动态的数据信息数据挖掘(正在流行)下个月波士顿的销售会怎么样?为什么?高级算法、多处理器计算机和“海量”数据库Pilot、Lockheed、 IBM、
22、SGI和其他新创企业提供预测性信息表9-2 数据挖掘的进化历程2.数据挖掘的主要特征数据挖掘的主要特征n数据挖掘面对的是海量数据n数据可能是不完全的、有噪声的、随机的、又复杂的数据结构,且维数较大n数据挖掘是多学科的交叉,综合运用了统计学、计算机和数学等学科的技术3.数据挖掘的未来发展方向数据挖掘的未来发展方向n与专家系统结合的数据挖掘n网络数据挖掘n数据挖掘的时序性n对非结构化数据的挖掘n引入新的数据挖掘算法补充内容:数据挖掘的主要功能分类分类企业可以按照客户的行为对他们进行分类,以便使特定的产品和服务能够被提供给更加有价值的客户群(即最佳客户)族群族群/聚类聚类将具有相似特点的客户分成几个
23、族群(市场细分)联系联系/关系关系探寻产品或行为间的联系是否存在以及联系的强度,以便能够基于相关产品做出决策方式或次序方式或次序客户的购买行为的方式或次序补充内容:典型数据挖掘系统的结构9.3.2 数据挖掘的基本任务数据挖掘的基本任务1.自动预测趋势和行为自动预测趋势和行为2.关联分析关联分析n若两个或多个变量的取值之间存在某种规律性,就称为关联n关联可分为简单关联、时序关联和因果关联等多种类型n关联分析的目的是找出数据库中隐藏的关联网3.聚类分析聚类分析n数据库中的记录可被划分为一系列有意义的子集,即聚类4.概念描述概念描述n是对某类对象的内涵进行描述,并概括这类对象的有关特征5.偏差检测偏
24、差检测n基本方法是寻找观测结果与参照值之间有意义的差别9.3.3 数据挖掘的技术与算法简介数据挖掘的技术与算法简介1.数据挖掘的集合论技术n粗糙集技术n是一种处理含糊和不精确数学问题的新型数学工具n粗糙集将知识定义为不可精确区分的关系的一个族集,这就使知识有了明确的数学含义,易于进行数学分析n概念树技术n一个数据库中的不同数据都拥有许多的不同属性,根据这些属性可以对数据进行分类,然后对每个属性进行概念提升中国江苏台湾其他省份淡水 基隆 南京 苏州 图9-3 籍贯概念树籍贯概念树2.数据挖掘中的仿生物技术数据挖掘中的仿生物技术n神经网络技术(Neutral Network)n模拟了人脑神经元结构
25、,可以为解决复杂程度高的问题提供一个比较简便的方法n神经网络基本结构是:输入层、输出层、隐含层1输入层隐含层输出层图9-4 简单的人工神经网络结构图23645生物进化遗传算法适者生存在算法停止时,获得最优解个体解染色体解的编码(字符串、向量等)基因解中每个分量的特征(如数值)适应度适应性函数值种群根据适应度函数值进取的一组解杂交通过变换两个解的对应分量产生新的解的过程 变异通过变换一个解得某些分量产生一个新解的过程表9-3 遗传算法与生物进化的比较遗传算法遗传算法遗传算法主要借助生物进化中的“适者生存”的概念,模仿生物进化中的遗传繁殖机制,对优化问题解空间的每一个个体进行编码,然后对编码后的优
26、化问题解空间进行组合划分,并通过迭代从中寻找含有最优解和较优解的组合3.统计分析方法统计分析方法n相关分析和回归分析:相关分析是用相关系数来度量变量间相关程度的数量关系,回归分析研究是变量间的因果关系n差异分析:从样本统计量的值得出的差异来确定总体参数之间是否存在差异(假设检验),典型的方法是方差分析,即通过分析实验数据中不同来源的变异对总体变异的贡献大小,确定实验中的可控因素(自变量)是否对实验结果(因变量)有重要的影响n因子分析:是把多个可直接观测的变量转化为少数几个不相关的总和指标的多远统计分析方法,在医学、心理学和经济学与管理学等科学领域得到十分广泛的应用n聚类分析:是根据事物本身的特
27、征研究个体分类的方法,是直接比较样本中事物之间的性质的一种方法,把性质相近的归为一类,将性质差别比较大的分为不同的类n判别分析:根据表明事物特点的变量值和他们所属的类求出判别函数,再根据判别函数对未知所属类别的事物进行分类的一种分析方法4.关联规则算法关联规则算法n关联规则是描述数据库中数据项之间存在潜在关系的规则,形式为“A1 A2 Am B1 B2 Bn”,其Ai(i=1,2,m), Bj(j=1,2,n)是数据库中的数据项n数据项之间的关联就是根据一个事务中某些项的出现,可推导出另一些项在同类事务中也出现n关联分析的目的是找出数据库中隐藏的关联n关联规则算法分为两个步骤n求支持度大于用户
28、指定的最小支持的数据项集,即大数据项集,对于语义约束的规则,仅求得满足约束的大数据项集n利用大数据项集产生关联规则,关联规则是挖掘算法的核心逻辑数据库被选择的数据预处理后的数据被转换的数据被抽取的信息被同化的知识选择预处理转换挖掘分析和 简化图9-6 数据挖掘流程图9.3.4 数据挖掘的流程数据挖掘的流程技术视角技术视角从逻辑数据库开始,经过选择流程获得被选择的数据,然后对这些数据进行预处理,从而得到经过预处理的数据库在此基础上,再对新生成的数据进行某种转换,并利用所获取的新数据进行挖掘,提出其中有用信息,再加以分析和同化,最终形成经过同化的知识,为企业决策提供支持9.3.5 用数据挖掘优化用
29、数据挖掘优化CRM系统系统1.什么是优化?n优化是对结果进行明确评价的问题,是在一定的约束和限制条件下,得到最优安排的过程2.使用数据挖掘技术优化CRM系统的一般步骤n评价,即检测发生的结果n预测,即根据已发生的事情来进行预测n行动,即进行尝试3.优化形式n存在一种明确定义的数值有待优化n对复杂的、因果关系不明确的问题进行优化9.3.6 在在CRM中利用数据挖掘所形成的商业价值中利用数据挖掘所形成的商业价值1.客户盈利模型2.客户获取模型3.客户挽留模型4.客户细分模型n科学的客户细分需满足两个基本条件:完整性;互斥性5.交叉销售模型n通过数据挖掘中的聚类分析,锁定交叉销售所要面对的目标客户n
30、通过关联分析确定最优的销售组合,并向相应的客户展开交叉销售9.3.7 数据挖掘工具及其评估数据挖掘工具及其评估1.数据挖掘工具的类型n通用工具n主要包括:SAS公司的Enterprise Miner、IBM的Intelligent Miner、SPSS公司的Clementine、Oracle公司的Darwin、Angoss的Knowledge Seekern综合数据挖掘工具n面向特定应用的数据挖掘工具n主要包括:KDI(主要在零售业)和Unica Modell(重点在市场领域)等2.数据挖掘工具的评估标准数据挖掘工具的评估标准n操作的数据类型n结果的有用性和确定性n知识的表达n多层次互动知识n
31、并行分布的数据挖掘算法n私有保护和数据安全n其他标准:产品成熟度和公司力量、产品的数据操作能力、产品的用户界面,管理复杂程度等9.4 知识发现与CRM9.4.1 知识发现概述nFayyad等(1996)认为,知识发现(Knowledge Discovery in Database,KDD)就是指在从大量数据中提取有效的、新颖的、潜在有用的、最终可被理解的模式的非平凡的过程nKDD具有自动性和一定的智能性9.4.2 知识发现的过程知识发现的过程(P323 图图9-7)n数据准备数据准备理解有关KDD的背景和用户的具体需求n数据选取数据选取确定要选取的目标数据,从原始数据库中选取数据或者数据样本n
32、数据预处理数据预处理对选取的数据和数据样本进行一定的预处理,检查数据的完整性、消除噪声、清除多余数据n数据变换数据变换对进行过预处理后的数据再进一步进行相关的转换操作,如转换数据的类型等n确定确定KDD的目标的目标为下一步选择算法做出准备n选择算法选择算法根据KDD的目标选择合适的算法,使之与整个KDD过程的评价标准相一致n解释解释/评价评价对经过发掘所发现的知识进行解释,并将知识以客户能够理解的方式描述出来,让客户进行评估图 数据挖掘中的知识发现流程9.4.3 在在CRM中运用知识发现中运用知识发现n对于许多实施CRM系统的企业来说,仅仅依靠CRM系统对数据的组织和存储功能,并不能满足企业对
33、决策支持的需要n如果不能够对大量的信息进行高级处理以便形成可理解的模式,那么企业花费高昂的成本所收集和积累的这些信息实际上就被浪费掉了n因此,发现隐藏于大量客户信息背后的关联性与规律性,就形成了CRM中的知识发现体系9.5 联机信息分析处理与CRM9.5.1 作为数据仓库前端接口的联机分析处理(OLAP)图图9-8 数据仓库与数据仓库与OLAP整合图整合图DB1DB2数据仓库客户客户1客户客户2OLAP服务器图9-8 数据仓库与OLAP整合图9.5.2 从从OLTP到到OLAP的转变的转变n20世纪60年代,关系数据库之父E.F.Codd提出了关系模型,促进了联机事务处理(OLTP)的发展n1
34、993年,Codd提出来OLAP概念(On Line Analytical Processing,OLAP)OLTP( On Line Transaction Processing )数据OLAP( On Line Analytical Processing )数据原始数据细节性数据当前值数据可更新一次处理的数据量小面向应用,是事务驱动型的面向操作人员,支持日常操作导出数据综合性和提炼性数据历史数据不可更新,但周期性刷新一次处理的数据量大面向分析,是分析驱动型的面向决策人员,支持管理需要表9-4 OLTP与OLAP的主要区别9.5.3 OLAP的定义与特征的定义与特征1.定义定义nOLAP委员
35、会把OLAP界定为具有下列功能的软件技术:使使分析人员、管理人员或执行人员能够从多种角度对从原始分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的信息(这些信息是能够真正为用户所理数据中转化出来的信息(这些信息是能够真正为用户所理解,并且能够真实反映出企业特性的信息)进行快速、一解,并且能够真实反映出企业特性的信息)进行快速、一致、互动地存取,从而实现对数据的更深入理解致、互动地存取,从而实现对数据的更深入理解2.特征特征nOLAP的显著特征是它能够提供数据的多维视图n强大的分析功能:OLAP的分析操作主要包括切片(Slice)、切块(Dice)、下钻(Drill-down)、
36、上钻(Roll-up)和旋转(Rotate)n基本特点:多维、快速、分析、共享、信息9.5.4 OLAP中的一些基本概念中的一些基本概念1.变量:数据的实际意义,描述数据是什么2.维:是人们观察数据的特定角度,每个不同的视角就叫做一个“维”n例如,进行客户细分可以从客户与企业的互动的角度加以细分,也可以从客户终身价值角度加以细分3.维的层次性:是指人们观察数据的某个角度还可以存在细节差异的多个方面。n例如,客户互动的层次包括“从不”、“偶尔”、“经常”等n多维数组可以表示为(维1,维2,维n,变量)9.5.5 OLAP结构介绍数据库服务器DBMS元数据请求处理OLAP服务器SQL结果设定前端工
37、具结果设定信息请求图9-9 OLAP系统的一般结构9.5.6 OLAP的基本分析操作的基本分析操作1.切片和切块(Slice and Dice)n在多维数组的某一维上选定一维成员的动作,称为切片,即在多维数组(维1,维2,维n,变量)选定维i,并对维i选择一个维成员,得到了(维1,维2,维成员 维i,维n,变量),这个操作叫做切片n切块也有相似的操作,只不过切块选择的是对某一区间的维选定维成员地理维规模维盈利维上海市场潜量图9-10 切片与切块操作2.钻取钻取n钻取主要包含向下钻取(Drill-down)和向上钻取(Roll-up)操作3.旋转(旋转(Rolate)/转轴(转轴(Pivot)n
38、旋转,即改变一个报告或者页面的维方向,包含交换行维和列维,以及把页面显示的一个维和页面外的一个维进行交换地理维盈利维盈利维地理维行列交换(a)盈利维地理维盈利维规模维旋转以改变页面显示(b)图9-11 旋转操作9.5.7 OLAP市场状况和产品评测(略)市场状况和产品评测(略)1.Hyperion公司2.Oracle公司3.Cognos公司4.MicroStrategy公司5.微软公司(Microsoft)6.IBM公司7.Brio公司在CRM系统中,OLAP主要应用于以下几个方面快速查询客户信息决策支持数据分析实时、动态、直观地展示CRM中的客户数据电信行业目前主要的数据来自于计费系统和网电
39、信行业目前主要的数据来自于计费系统和网管数据。电信系统经过多年的运行,已经存储管数据。电信系统经过多年的运行,已经存储了大量的历史数据。这些数据中蕴涵着丰富的了大量的历史数据。这些数据中蕴涵着丰富的信息,从中可以了解企业在电信市场经营过程信息,从中可以了解企业在电信市场经营过程中所处的态势、竞争对手的经营形势、客户群中所处的态势、竞争对手的经营形势、客户群的分布状况、消费特征、企业经营发展的趋势的分布状况、消费特征、企业经营发展的趋势等,对其进行分析处理可以得到很多令人欣喜等,对其进行分析处理可以得到很多令人欣喜的结论。的结论。 强大的数据处理能力,加上丰富的强大的数据处理能力,加上丰富的企业
40、数据,可以有力地促进企业经营和竞争。企业数据,可以有力地促进企业经营和竞争。 案例:数据仓库在电信行业中的应用案例:数据仓库在电信行业中的应用 基于数据仓库的应用设计从系统结构看,电信行业数据仓库解决方案系统一般包括应用系统部分、中央数据仓库系统部分,数据源系统部分三大部分数据来源电信行业数据仓库解决方案数据源主要来自电信各业务系统,包括计费系统、营业系统、客服系统、财务系统、结算系统、网管系统、112系统、114系统、电信网络资源管理系统以及其它系统,此外数据源还有来自电信系统外的数据,如人口统计、社会各企业的财务数据、银行数据等。 业务应用系统则主要包括以下10个方面功能客户管理客户发展分
41、析业务量分析收入分析营销管理分析市场竞争分析服务质量分析大客户分析欠费和动态防欺诈行为分析代理商及渠道分析客户管理客户管理电信企业要吸引客户、发展客户并留住客户,首先必须要了解客户。客户管理应用的目的是根据客户的属性(包括自然属性和行为属性),从不同角度深层次分析客户,从而针对不同的客户采取不同的促销活动以及提供更好和更有针对性的服务,以此增加新的客户,提高客户的忠诚度,降低客户流失率,提高客户消费额度等。客户发展分析客户发展分析这主要是依照客户的自然属性和消费行为属性对客户进行分析。其主要指标包括客户总量分析、新增客户分析、客户流失分析、客户行为分析,客户信用度分析、客户风险分析等等。 业务量分析业务量分析包括业务总量分析、业务增长和流失分析、网络通话流量及流向分析、热点区域分析、业务量结构分析、收益分析、呼叫特征分析等。 收入分析收入分析包括收入总量分析、收入变化分析、收入结构分析、客户缴费及欠费分析等。 营销管
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度影视后期制作与剪辑服务合同范本4篇
- 2025年度专业树木种植与生态旅游开发合同4篇
- 2025年度夏令营教育成果评估与分析合同4篇
- 把羊包给他人的合同
- 2025年度林业资源开发与合作经营合同模板3篇
- 2025年度牛只运输与饲料配送综合性服务合同4篇
- 2025年度内墙涂料工程旧房翻新改造施工合同2篇
- 二零二五年度煤矿资源整合项目合同书4篇
- 2025版民宿布草租赁与民宿客栈特色文化打造合同4篇
- 2025年度股权转让与客户关系维护合同范本3篇
- 9.1增强安全意识 教学设计 2024-2025学年统编版道德与法治七年级上册
- 《化工设备机械基础(第8版)》全套教学课件
- 人教版八年级数学下册举一反三专题17.6勾股定理章末八大题型总结(培优篇)(学生版+解析)
- 2024届上海高考语文课内古诗文背诵默写篇目(精校版)
- DL-T5024-2020电力工程地基处理技术规程
- 2024年度-美团新骑手入门培训
- 初中数学要背诵记忆知识点(概念+公式)
- 驾照体检表完整版本
- 农产品农药残留检测及风险评估
- 农村高中思想政治课时政教育研究的中期报告
- 20100927-宣化上人《愣严咒句偈疏解》(简体全)
评论
0/150
提交评论