BI的选型、体系架构与相关技术_第1页
BI的选型、体系架构与相关技术_第2页
BI的选型、体系架构与相关技术_第3页
BI的选型、体系架构与相关技术_第4页
BI的选型、体系架构与相关技术_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、更多企业学院: 中小企业管理全能版版183套讲座+89700份资料总经理、高层管理49套讲座+16388份资料中层管理学院46套讲座+6020份资料国学智慧、易经46套讲座人力资源学院56套讲座+27123份资料各阶段员工培训学院院77套讲座+ 324份资料员工管理企业学院67套讲座+ 8720份资料工厂生产管理学院52套讲座+ 13920份资料财务管理学院53套讲座+ 17945份资料销售经理学院56套讲座+ 14350份资料销售人员培训学院72套讲座+ 4879份资料更多企业学院: 中小企业管理全能版版183套讲座+89700份资料总经理、高层管理49套讲座+16388份资料中层管理学院4

2、6套讲座+6020份资料国学智慧、易经46套讲座人力资源学院56套讲座+27123份资料各阶段员工培训学院院77套讲座+ 324份资料员工管理企业学院67套讲座+ 8720份资料工厂生产管理学院52套讲座+ 13920份资料财务管理学院53套讲座+ 17945份资料销售经理学院56套讲座+ 14350份资料销售人员培训学院72套讲座+ 4879份资料更多企业学院: 中小企业管理全能版版183套讲座+89700份资料总经理、高层管理49套讲座+16388份资料中层管理学院46套讲座+6020份资料国学智慧、易经46套讲座人力资源学院56套讲座+27123份资料各阶段员工培训学院院77套讲座+ 3

3、24份资料员工管理企业学院67套讲座+ 8720份资料工厂生产管理学院52套讲座+ 13920份资料财务管理学院53套讲座+ 17945份资料销售经理学院56套讲座+ 14350份资料销售人员培训学院72套讲座+ 4879份资料什么是BI?商业智能也称作BI,是是英文单词Business Intelligence的的缩写。商业智能能的概念最早在1996年年提出。当时将商商业智能定义为一一类由数据仓库(或或数据集市)、查查询报表、数据分分析、数据挖掘、数据备份和恢复复等部分组成的、以帮助企业决策策为目的技术及其其应用。目前,商商业智能通常被理理解为将企业中现现有的数据转化为为知识,帮助企业业做出

4、明智的业务务经营决策的工具具。这里所谈的数数据包括来自企业业业务系统的订单单、库存、交易账账目、客户和供应应商等来自企业所所处行业和竞争对对手的数据以及来来自企业所处的其其他外部环境中的的各种数据。而商商业智能能够辅助助的业务经营决策策既可以是操作层层的,也可以是战战术层和战略层的的决策。为了将数数据转化为知识,需需要利用数据仓库库、联机分析处理理(OLAP)工工具和数据挖掘等等技术。因此,从从技术层面上讲,商商业智能不是什么么新技术,它只是是数据仓库、OLAP和和数据挖掘等技术术的综合运用。图 1 商务智能的发发展因此,把商业智能看成成是一种解决方案案应该比较恰当。商业智能的关键是从许多来自

5、不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。c。图 2 商务智能的原原理BI的选型要选型,首先要了解目目前市场上主流的的BI产品:数据库方面,有DB2、Oracle、SQL Server、Teradata,早早先还有专门用于于数据仓库

6、的Redbrick(被被IBM收编以后后,退出历史舞台台)。M。ETL工具上,像Datastage、Powercenter都都是比较主流的,此此外,还有很多公公司也有自己的ETL产产品,例如SAS的的ETL Server、BO的Data Integrator等等。1。OLAP工具上,则还还可以细分为MOLAP(Muilt-Dimension OLAP,多维度型在线分析系统)和ROLAP(Relational OLAP,关系型在线分析系统),前者可以选择Hyperion、Cognos、Microsoft公司的产品,而后者可供选择的余地就不多,像Microstrategy可能是目前能够看得见市场份

7、额比较大的,以前和Redbrick一起。此外,还有一个叫Metacube的ROLAP工具,早在2000年以后也退出市场。B。数据挖掘产品领域,有有SAS、SPSS等等两大厂家,而像像IBM、Teradata也也都有自己的挖掘掘工具。除此之外外,在报表服务器器、前端工具上的的选择可就多了,其其中,Cognos、BO、Brio是是比较主流的。E。从这些主流产品来看,大大多是舶来品。国国内也有研发BI产产品的,但多限于于ETL、前端以以及数据挖掘产品品。j。从目前各类用户的产品品选型过程来看,问问题多出在以下几几个方面。其一,只见树木不见森森林,只顾得降低低单个工具的成本本,却忽视了总体体成本。有些

8、大企企业在IT建设上上一掷千金,从不不在乎在购买产品品上投入多少,每每一块都是选用最最好的。但是,更更多的企业则不得得不出于成本考虑虑,能省则省。除除了数据库和OLAP工工具两项之外,经经常动心思的地方方就是,设想如果果把ETL和前端端展现自己来开发发是不是会省点资资金出来。b。然而问题是,如果仅仅仅从单个产品的成成本考虑而忽视综综合的项目成本,最最后很可能会被难难以维护的程序所所困扰,甚至要完完全推翻重来,这这样的成本恐怕会会更高。而对于那那些财大气粗的大大企业来说,即便便选择了每个领域域最好的产品,组组合起来也不一定定就是最好的。v。其二,评估报告难以客客观。企业负责产产品选型的人,通通常

9、要求厂商提供供一份评估报告,要要列出几种方案选选择,各自优劣何何在,最后得出哪哪种方案是最适合合自己的。M。如果从字面上理解此报报告,某种产品哪哪方面比较好,哪哪方面不好,这并并不客观。对于厂厂商而言,这就是是一笔单子,当然然会尽量把自己产产品的优势体现出出来,而回避自己己的弱势。同时对对于选型负责人来来说,也许其早就就对某种工具有好好感,或是跟某个个厂家的关系不错错,甚至有更进一一步的交易。这样样的情况,想客观观一点不容易。j。选型要点其实,如果是选择这些些主流的产品的话话,大家知道一句句话,“没有最好好的,只有最合适适的”。什么是最最合适?抛开上面面提到的幕后因素素,其实也就是三三点需要考

10、虑产品成本、开发发人员对这个产品品的熟悉程度、有有没有类似案例。P。首先看成本。NCR、IBM和Oracle的的产品线完整,但但却很贵。微软的的产品便宜些,可可如果数据量大,恐恐怕又不太敢用它它,就更别谈那些些不要钱的开源产产品了。当然,成成本不光是产品本本身的价格决定的的,后面人员学习习、项目延期、客客户满意度低都要要作为成本考虑,这这些隐型成本才是是难以计算的。提提到成本,就不能能不提一下BI模模型,因为BI产产品中模型是最昂昂贵的一部分,在在国内很大一部分分企业采用的自主主开发的方式,采采用这种方式可以以避免高额的费用用,但却无法学习习到国外先进的商商业经验。R。再看人员的经验。人的的学

11、习曲线是不可可避免的,不要妄妄想人们接触一个个新产品就能立马马成为高手,能够够基于陌生的产品品做出良好架构。这这方面,显然Oracle和和微软有优势,因因为在这两家产品品上有经验的人多多,好找。当然,如如果你们原来的业业务系统用的就是是这几家产品之一一,不妨仍然用它它。x。其次案例比白皮书更重重要。如今很多BI厂厂商可以提供全方方位解决方案,提提供一站式服务。像像IBM、Oracle、SAS都称自己己是这样的全方案案提供商,也就是是说它们的产品线线已经包含了数据据库、OLAP、ETL等各类工工具。直接选用它它们,就不用再为为工具选型烦恼了了,但企业有时由由于各方面的原因因,决定不使用一一家产品

12、时,要考考虑他们之间是否否兼容。但如果你你要是从产品的白白皮书里去寻找此此类信息,会发现现说得很美,互相相之间会如何完美美地“无缝”兼容容,但实际上却不不是那么回事。因因此,不要去看这这些文字的东西,要要去寻找同行业类类似的案例,如果果同行业没有,就就去寻找数据量类类似、业务复杂度度类似以及相似应应用的其他行业案案例。U。BI的体系架构及相关关技术一个BI系统为了满足足企业管理者的要要求,从浩如烟海海的资料中找出其其关心的数据,必必须要做到以下几几步:Q。为了整合各种格式的数数据,清除原有数数据中的错误记录录数据预处理理的要求。C。对预处理过数据,应该该统一集中起来元数据(Meta Data)

13、、数数据仓库(Data Warehouse)的要求;4。最后,对于集中起来的的庞大的数据集,还还应进行相应的专专业统计,从中发发掘出对企业决策策有价值的新的机机会OLAP(联机事务分析)和数据挖掘(Data Mining)的要求。0。所以,一个典型的BI体体系架构应该包含含这3步所涉及的的相关要求。图 3 BI的体系架架构整个体系架构中包括:终端用户查询和和报告工具、OLAP工工具、数据挖掘(Data Mining)软软件、数据仓库(Data Warehouse)和和数据集市(Data Mart)产品品、联机分析处理理 (OLAP) 等工具。J。1)、终端用户查询和和报告工具。专门用来支持初级

14、用户户的原始数据访问问,不包括适应于于专业人士的成品品报告生成工具。U。2)、数据预处理(STL-数据抽取、转换换、装载)从许多来自不同的企业业运作系统的数据据中提取出有用的的数据并进行清理理,以保证数据的的正确性,然后经经过抽取(Extraction)、转换(Transformation)和和装载(Load),即即ETL过程,合合并到一个企业级级的数据仓库里,从从而得到企业数据据的一个全局视图图。o。3)、OLAP工具。提供多维数据管理环境境,其典型的应用用是对商业问题的的建模与商业数据据分析。OLAP也也被称为多维分析析。y。4)、数据挖掘(Data Mining)软软件。使用诸如神经网络

15、、规规则归纳等技术,用用来发现数据之间间的关系,做出基基于数据的推断。w。5)、数据仓库(Data Warehouse)和和数据集市(Data Mart)产品品。e。包括数据转换、管理和和存取等方面的预预配置软件,通常常还包括一些业务务模型,如财务分分析模型。K。6)、联机分析处理 (OLAP) 。OLAP是使分析人员员、管理人员或执执行人员能够从多多角度对信息进行行快速、一致、交交互地存取,从而而获得对数据的更更深入了解的一类类软件技术。2。其中核心技术在于数据据预处理、数据仓仓库的建立(DW)、数据挖掘(DM)和和联机分析处理(OLAP)三三个部分。接下来来,我们对这几个个核心部分进行详详

16、细说明:s。数据预处理:当早期大型的在线事务务处理系统(OLTP)问世后不久,就就出现了一种用于于“抽取”处理的的简单程序,其作作用是搜索整个文文件和数据库,使使用某些标准选择择合乎要求的数据据,将其复制拷贝贝出来,用于总体体分析。因为这样样做不会影响正在在使用的在线事务务处理系统,降低低其性能,同时,用用户可以自行控制制抽取出来的数据据。但是,现在情情况发生了巨大的的变化,企业同时时采用了多个在线线事务处理系统,而而这些系统之间的的数据定义格式不不尽相同,即使采采用同一软件厂商商提供的不同软件件产品,或者仅仅仅是产品版本不同同,之间的数据定定义格式也有少许许差距。由此,我我们必须先定义一一个

17、统一的数据格格式,然后把各个个来源的数据按新新的统一的格式进进行转换,然后集集中装载入数据仓仓库中。m。其中,尤其要注意的一一点时,并不是各各个来源的不同格格式的所有数据都都能被新的统一格格式包容,我们也也不应强求非要把把所有数据源的数数据全部集中起来来。Why?原因因很多。有可能原原来录入的数据中中,少量的记录使使用了错误的数据据,这类数据如果果无法校正,应该该被舍去。某些数数据记录是非结构构化的,很难将其其转化成新定义的的统一格式,而且且从中抽取信息必必须读取整个文件件,效率极低,如如大容量的二进制制数据文件,多媒媒体文件等,这类类数据如果对企业业决策不大,可以以舍去。P。目前已有一部分软

18、件厂厂商开发出专门的的ETL工具,其其中包括:Ardent DataStageEvolutionary Technologies,Inc. (ETI) Extractq。Information PowermartSagent SolutionSAS InstituteOracle Warehouse BuilderMSSQL Server2000 DTS数据仓库:数据仓库概念是由号称称“数据仓库之父父”William H.Inmon在在上世纪80年代代中期撰写的建建立数据仓库一一书中首次提出,“数据仓库是一个面向主题的、集成的、非易失性的,随时间变化的用来支持管理人员决策的数据集合”。G。面向

19、主题是数据仓库第第一个显著特点,就是指在数据仓库中,数据按照不同的主题进行组织,每一个主题中的数据都是从各操作数据库中抽取出来汇集而成,这些与该主题相关的所有历史数据就形成了相应的主题域。2。数据仓库的第二个显著著特点是集成。数数据来源于不同的的数据源,通过相相应的规则进行一一致性转换,最终终集成为一体。y。数据仓库的第三个特点点是非易失性。一一旦数据被加载到到数据仓库中,数数据的值不会再发发生变化,尽管运运行系统中对数据据进行增、删、改改等操作,但对这这些数据的操作将将会作为新的快照照记录到数据仓库库中,从而不会影影响到已经进入到到数据仓库的数据据。4。数据仓库最后一个特点点是它随时间变化化

20、。数据仓库中每每一个数据都是在在特定时间的记录录,每个记录都有有着相应的时间戳戳。v。图 4 数据仓库体系系架构数据仓库对外部数据源源和操作型数据源源的元数据,按照照数据仓库模式设设计要求进行归类类,并建成元数据据库,相对应的数数据经过ETL后后加载到数据仓库库中;当信息客户户需要查询数据时时先通过信息展现现系统了解元数据据或者直接浏览元元数据库,再发起起数据查询请求得得到所需数据。V。一个典型的企业数据仓仓库系统,通常包包含数据源、数据据存储与管理、数数据的访问三个部部分。f。图 5 数据仓库系统统数据源:是指企业操作作型数据库中的各各种生产运营数据据、办公管理数据据等内部数据和一一些调查数

21、据、市市场信息等来自外外环境的数据总称称。这些数据是构构建数据仓库系统统的基础是整个系系统的数据源泉。q。数据的存储与管理:数数据仓库的存储主主要由元数据的存存储及数据的存储储两部分组成。元元数据是关于数据据的数据,其内容容主要包括数据仓仓库的数据字典、数据的定义、数数据的抽取规则、数据的转换规则则、数据加载频率率等信息。各操作作数据库中的数据据按照元数据库中中定义的规则,经经过抽取、清理、转换、集成,按按照主题重新组织织,依照相应的存存储结构进行存储储。也可以面向应应用建立一些数据据集市,数据集市市可以看作是数据据仓库的一个子集集,它含有较少的的主题域且历史时时间更短数据量更更少,一般只能为

22、为某个局部范围内内的管理人员服务务,因此也称之为为部门级数据仓库库。T。数据的访问:由OLAP(联机分析处理)、数据挖掘、统统计报表、即席查查询等几部分组成成。例如OLAP:针对特定的分析析主题,设计多种种可能的观察形式式,设计相应的分分析主题结构(即即进行事实表和维维表的设计),使使管理决策人员在在多维数据模型的的基础上进行快速速、稳定和交互性性的访问,并进行行各种复杂的分析析和预测工作。按按照存储方式来分分,OLAP可以以分成MOLAP以以及ROLAP等等方式,MOLAP (Multi-Dimension OLAP)将OLAP分分析所需的数据存存放在多维数据库库中。分析主题的的数据可以形成

23、一一个或多个多维立立方体。ROLAP (Relational OLAP)将OLAP分分析所需的数据存存放在关系型数据据库中。分析主题题的数据以“事实实表-维表”的星星型模式组织。R。数据挖掘:数据挖掘的定义非常模模糊,对它的定义义取决于定义者的的观点和背景。如如下是一些DM文文献中的定义:B。数据挖掘是一个确定数数据中有效的,新新的,可能有用的的并且最终能被理理解的模式的重要要过程。i。数据挖掘是一个从大型型数据库中提取以以前未知的,可理理解的,可执行的的信息并用它来进进行关键的商业决决策的过程。B。数据挖掘是用在知识发发现过程,来辩识识存在于数据中的的未知关系和模式式的一些方法。数数据挖掘是

24、发现数数据中有益模式的的过程。T。数据挖掘是我们为那些些未知的信息模式式而研究大型数据据集的一个决策支支持过程。N。虽然数据挖掘的这些定定义有点不可触摸摸,但在目前它已已经成为一种商业业事业。如同在过过去的历次淘金热热中一样,目标是是开发矿工。利利润最大的是卖工工具给矿工,而不不是干实际的开发发。4。目前业内已有很多成熟熟的数据挖掘方法法论,为实际应用用提供了理想的指指导模型。其中,标标准化的主要有三三个:CRISP-DM;PMML;OLE DB for DM。p。CRISP-DM(Cross-Industry Standard Process for Data Mining)是是目前公认的、

25、较较有影响的方法论论之一。CRISP-DM强调,DM不不单是数据的组织织或者呈现,也不不仅是数据分析和和统计建模,而是是一个从理解业务务需求、寻求解决决方案到接受实践践检验的完整过程程。CRISP-DM将整个挖掘掘过程分为以下六六个阶段:商业理理解(Business Understanding),数数据理解(Data Understanding),数据准备(Data Preparation),建模(Modeling),评估(Evaluation)和发布(Deployment)。其框架图如下下:L。图 6 CRISP-DM模型框架图图从技术层来看,数据挖挖掘技术可分为描描述型数据挖掘和和预测型数

26、据挖掘掘两种。描述型数数据挖掘包括数据据总结、聚类及关关联分析等。预测测型数据挖掘包括括分类、回归及时时间序列分析等。B。数据总结:继承于数据据分析中的统计分分析。数据总结目目的是对数据进行行浓缩,给出它的的紧凑描述。传统统统计方法如求和和值、平均值、方方差值等都是有效效方法。另外还可可以用直方图、饼饼状图等图形方式式表示这些值。广广义上讲,多维分分析也可以归入这这一类。A。聚类:是把整个数据库库分成不同的群组组。它的目的是使使群与群之间差别别很明显,而同一一个群之间的数据据尽量相似。这种种方法通常用于客客户细分。在开始始细分之前不知道道要把用户分成几几类,因此通过聚聚类分析可以找出出客户特性

27、相似的的群体,如客户消消费特性相似或年年龄特性相似等。在在此基础上可以制制定一些针对不同同客户群体的营销销方案。Q。关联分析:是寻找数据据库中值的相关性性。两种常用的技技术是关联规则和和序列模式。关联联规则是寻找在同同一个事件中出现现的不同项的相关关性;序列模式与与此类似,寻找的的是事件之间时间间上的相关性,如如对股票涨跌的分分析等。Z。分类:目的是构造一个个分类函数或分类类模型(也常常称称作分类器),该该模型能把数据库库中的数据项映射射到给定类别中的的某一个。要构造造分类器,需要有有一个训练样本数数据集作为输入。训训练集由一组数据据库记录或元组构构成,每个元组是是一个由有关字段段(又称属性或

28、特特征)值组成的特特征向量,此外,训训练样本还有一个个类别标记。一个个具体样本的形式式可表示为:( v1, v2, .,vn;c ),其中vi表表示字段值,c表表示类别。a。回归:是通过具有已知知值的变量来预测测其它变量的值。一一般情况下,回归归采用的是线性回回归、非线性回归归这样的标准统计计技术。一般同一一个模型既可用于于回归也可用于分分类。常见的算法法有逻辑回归、决决策树、神经网络络等。e。时间序列:时间序列是是用变量过去的值值来预测未来的值值。数据挖掘(Data Mining)软软件。使用诸如神神经网络、规则归归纳等技术,用来来发现数据之间的的关系,做出基于于数据的推断。w。图 7 数据

29、挖掘系统统以下是一些当前的数据据挖掘产品:IBM: Intelligent Miner 智智能矿工Tandem: Relational Data Miner 关系数据矿工U。AngossSoftware: KnowledgeSEEDER 知识搜索者Z。Thinking Machines Corporation: DarwinTM4。NeoVista Software: ASICISL Decision Systems,Inc.: Clementine 3。DataMind Corporation: DataMind Data Crunchery。Silicon Graphics: MineSe

30、tCalifornia Scientific Software: BrainMakery。WizSoft Corporation: WizWhyLockheed Corporation: ReconSAS Corporation: SAS Enterprise Miner q。联机分析处理(OLAP):OLAP的概念最早是是由关系数据库之之父E.F.Codd于于1993年提出出的,他同时提出出了关于OLAP的的12条准则。B。OLAP的提出引起了了很大的反响,OLAP作作为一类产品同联联机事务处理 (OLTP) 明明显区分开来。A。当今的数据处理大致可可以分成两大类:联机事务处理OLTP(On

31、-Line Transaction Processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是是传统的关系型数数据库的主要应用用,主要是基本的的、日常的事务处处理,例如银行交交易。OLAP是是数据仓库系统的的主要应用,支持持复杂的分析操作作,侧重决策支持持,并且提供直观观易懂的查询结果果。y。OLAP是使分析人员员、管理人员或执执行人员能够从多多角度对信息进行行快速、一致、交交互地存取,从而而获得对数据的更更深入了解的一类类软件技术。OLAP的的目标是满足决策策支持或者满足在在多维环境下特定定的查询和报表需需求,它的技术核核心是维这个

32、个概念。8。“维”是人们观察客观观世界的角度,是是一种高层次的类类型划分。“维”一般包含着层次次关系,这种层次次关系有时会相相当复杂。通过把把一个实体的多项项重要的属性定义义为多个维(DImension),使用户能对不不同维上的数据进进行比较。因此OLAP也也可以说是多维数数据分析工具的集集合。M。OLAP的基本多维分分析操作有钻取(Roll Up和Drill Down)、切切片(Slice)和和切块(Dice)、以及旋转(Pivot)、Drill Across、Drill Through等等。O。钻取是改变维的层次,变变换分析的粒度。它它包括向上钻取(Roll Up)和向下钻钻取(Drill

33、 Down)。Roll Up是在某一维维上将低层次的细细节数据概括到高高层次的汇总数据据,或者减少维数数;而Drill Down则相反反,它从汇总数据据深入到细节数据据进行观察或增加加新维。U。切片和切块是在一部分分维上选定值后,关关心度量数据在剩剩余维上的分布。如如果剩余的维只有有两个,则是切片片;如果有三个,则则是切块。g。旋转是变换维的方向,即即在表格中重新安安排维的放置(例例如行列互换)。2。OLAP有多种实现方方法,根据存储数数据的方式不同可可以分为ROLAP、MOLAP、HOLAP。U。ROLAP表示基于关关系数据库的OLAP实实现(Relational OLAP)。以以关系数据库

34、为核核心,以关系型结结构进行多维数据据的表示和存储。ROLAP将将多维数据库的多多维结构划分为两两类表:一类是事事实表,用来存储储数据和维关键字字;另一类是维表表,即对每个维至至少使用一个表来来存放维的层次、成员类别等维的的描述信息。维表表和事实表通过主主关键字和外关键键字联系在一起,形形成了“星型模式式”。对于层次复复杂的维,为避免免冗余数据占用过过大的存储空间,可可以使用多个表来来描述,这种星型型模式的扩展称为为“雪花模式”。N。MOLAP表示基于多多维数据组织的OLAP实实现(Multidimensional OLAP)。以以多维数据组织方方式为核心,也就就是说,MOLAP使使用多维数组

35、存储储数据。多维数据据在存储中将形成成“立方块(Cube)”的结构,在MOLAP中中对“立方块”的的“旋转”、“切切块”、“切片”是产生多维数据据报表的主要技术术。S。HOLAP表示基于混混合数据组织的OLAP实实现(Hybrid OLAP)。如如低层是关系型的的,高层是多维矩矩阵型的。这种方方式具有更好的灵灵活性。E。还有其他的一些实现OLAP的的方法,如提供一一个专用的SQL Server,对对某些存储模式(如如星型、雪片型)提提供对SQL查询询的特殊支持。M。OLAP工具是针对特特定问题的联机数数据访问与分析。它通过多维的方式对数据进行分析、查询和报表。维是人们观察数据的特定角度。例如,

36、一个企业在考虑产品的销售情况时,通常从时间、地区和产品的不同角度来深入观察产品的销售情况。这里的时间、地区和产品就是维。而这些维的不同组合和所考察的度量指标构成的多维数组则是OLAP分析的基础,可形式化表示为(维1,维2,维n,度量指标),如(地区、时间、产品、销售额)。多维分析是指对以多维形式组织起来的数据采取切片(Slice)、切块(Dice)、钻取(Drill Down和Roll Up)、旋转(Pivot)等各种分析动作,以求剖析数据,使用户能从多个角度、多侧面地观察数据库中的数据,从而深入理解包含在数据中的信息。C。根据综合性数据的组织织方式的不同,目目前常见的OLAP主主要有基于多维

37、数数据库的MOLAP及及基于关系数据库库的ROLAP两两种。MOLAP是是以多维的方式组组织和存储数据,ROLAP则则利用现有的关系系数据库技术来模模拟多维数据。在在数据仓库应用中中,OLAP应用用一般是数据仓库库应用的前端工具具,同时OLAP工工具还可以同数据据挖掘工具、统计计分析工具配合使使用,增强决策分分析功能。5。一个典型的BI系统介介绍商业智能系统应具有的的主要功能:读取数据可读取多多种格式(如Excel、Access、以Tab分割的的txt和固定长长的txt等)的的文件,同时可读读取关系型数据库库 (对应ODBC)中的数据。X。分析功能关联/限限定 关联分析主主要用于发现不同同事件

38、之间的关联联性,即一个事件件发生的同时,另另一个事件也经常常发生。关联分析析的重点在于快速速发现那些有实用用价值的关联发生生的事件。o。数据输出功能打印印统计列表和图表表画面等,可将统统计分析好的数据据输出给其他的应应用程序使用,或或者以HTML格格式保存。z。定型处理所需要的的输出被显示出来来时,进行定型登登录,可以自动生生成定型处理按钮钮。以后,只需按按此按钮,即使很很复杂的操作,也也都可以将所要的的列表、视图和图图表显示出来。1。以国外的一个BI系统统为例,我们来介介绍一个BI系统统的主要功能,这这个系统主要包含含数据仓库管理器器(Warehouse Manager)、数据复制(Data

39、 Propagator)、多维数据库(OLAP Server)、前台分析工具具(Wired for OLAP)以及数据挖掘(Intelligent Miner)、On Demand。e。数据仓库管理器(Warehouse Manager)它主要由以下几部分功功能组成:数据访访问,数据转换,数数据分布,数据存存储,靠描述性数数据查找和理解数数据,显示、分析析和发掘数据,数数据转换过程的自自动化及其管理。它它缩短了复杂的海海量数据与有洞察察力的商务决策之之间的差距,有助助于公司更进一步步了解其业务、市市场、竞争对手和和客户。O。数据复制 (Data Propagator)Data Propagat

40、or提提供的复制功能允允许从一个数据源源读取数据并把它它送到另外一个地地方,而且可以是是双向的。当发生生冲突时,可自动动检测出来并进行行补偿。此外,它它还有以下特色:T。(1)Pull Architecture Through Staging Tables(分级表牵引式体体系结构):二个个组成部分-Capture和和Apply。Capture部部分在源数据库服服务器上运行,它它捕获要被复制的的数据,并把数据据放入服务器分级级表中;Apply部部分在目标机上运运行。在用户定义义的时间间隔里或或某个事件发生后后,它连到源数据据库中,并从分级级表中抽取所需的的数据。这种被动动的“牵引式”体体系结构减

41、少了数数据源的额外开销销,能够支持数据据源及目标机的独独立运作性以及新新一代流动计算机机作为目标机的数数据复制。这种体体系结构还支持中中介分级表,其中中最初的源可以复复制到区域目标中中,然后再复制到到各区域内的目标标机上。U。(2)支持更新和修正正:既支持更新也也支持修正复制。Apply可可以完全替换目标标数据或者仅仅修修正上次复制以来来所发生的改变。C。(3)改变事务运行记记录的Capture:捕获数据修改。它它从数据库运行日日志(LOG)中中读出修改,从而而抓取用于复制的的数据修改,进而而安排好这些数据据。这就减少了对对源的额外开销,不不需要另外处理如如触发器。甚至可可以直接从内存中中读运

42、行记录,以以减少I/O。c。(4)加工数据:数据据首先要从运行记记录移到分级表,所所以能在复制之前前加工或处理它;由于分级表是数数据库表,使用标标准SQL就能定定义加工处理功能能。除了通过SQL来来构造子集,汇总总并连结表以外,分分级表还能提供基基于时间分析源数数据改变的方法。这这要考虑到整个新新一类的应用包括括检查跟踪,历史史分析,asof查询等等。M。(5)GUI管理机构构:通过图形用户户界面可以定义和和管理数据拷贝,定定义代码和触发器器没有专门语言。这这样最终用户就有有权定义和管理,而而不仅仅是DBA和和程序员的范围。7。多维数据库服务器(OLAP Server)该工具在商务智能中扮演着

43、重要角色,可以深入最终用户的业务,对桌面上的数据进行实时操作,能够快速地分布传统监视和报告范围之外的应用程序数据。5。数据挖掘工具(Intelligent Miner)当用户的数据积累到一一定数量时,这些些数据的某些潜在在联系、分类、推推导结果和待发现现价值隐藏在其中中,该工具帮助客客户发现这些有价价值的数据。V。Wired for OLAP使用该功能可以提高信信息技术组织的效效率。信息技术人人员可以让用户利利用分析和报表的的功能获得他们所所需的信息,而不不会失去对信息、数据完整性、系系统性能和系统安安全的控制。K。强大功能的报表繁忙的信息技术部门可可以在几分钟内创创建用于在企业中中分发的完善

44、的报报表。,决策人员员可以从该Web页页面上找到可用的的一系列报表。M。图形化分析远远超出对数据的静态态图形化视图,提提供强壮的图形化化OLAP分析。决决策人员可以根据据需要排序、分组组数据并改变“图图表”(Chart)的类型(直方图图、饼形图、线图图、堆积图)。图图表中的元素可以以被“钻取”到其其他的细节层次,并并可以返回来恢复复一个概要性的视视图。c。多种图表视图:直方图图、线图、组合图图、饼形图、堆积积图和离散点图可在任何地方“钻取”没有路径的预先先定义完善的报表复合报表通过用各种不不同的形式(交叉叉表、图表、表格格或以上几种形式式的组合)来表现分析结果果,对工作进行概概括;优美格式的的

45、商用报表。1。交互式的、立即的“所所见即所得”(WYSIWYG)显示On Demand该工具提供给客户一套套高性能的解决方方案来进行在线捕捕获、存储和重取取计算机输出的文文档。它使得落后后的纸张文件搜索索和使用缩微胶片片阅读器搜索称为为历史。有了OnDemand,客客户可以立刻发现现特定的信息并且且很容易地浏览它它,而不用在庞大大的数据和纸张中中苦苦寻找;存储储、重取和分发企企业产生的信息比比以前更加方便和和易于接受。i。BI的实施实施商业智能系统是一一项复杂的系统工工程,整个项目涉涉及企业管理, 运作管理, 信信息系统, 数据据仓库, 数据挖挖掘, 统计分析析等众多门类的知知识。因此用户除了

46、要要选择合适的商业业智能软件工具外外,还必须按照正确确的实施方法才能能保证项目得以成成功。商业智能项目的的实施步骤可分为为:7。需求分析:需求分析是是商业智能实施的的第一步, 在其其他活动开展之前前必须明确的定义义企业对商业智能能的期望和需求, 包括需要分析的的主题, 各主题题可能查看的角度度(维度);需要发现企业那那些方面的规律,用户的需求必须须明确。J。数据仓库建模:通过对对企业需求的分析析,建立企业数据据仓库的逻辑模型型和物理模型,并并规划好系统的应应用架构,将企业业各类数据按照分分析主题进行组织织和归类. M。数据抽取:数据仓库建建立后必须将数据据从业务系统中抽抽取到数据仓库中中, 在

47、抽取的过过程中还必须将数数据进行转换、清洗、以适应分析的需需要. A。建立商业智能分析报表表:商业智能分析报报表需要专业人员员按照用户制订的的格式进行开发, 用户也可自行开开发(开发方式简简单,快捷) . C。用户培训和数据模拟测测试:对于开发使用用分离型的商业智智能系统, 最终终用户的使用是相相当简单的,只需需要点击操作就可可针对特定的商业业问题进行分析。m。系统改进和完善:任何何系统的实施都必必须是不断完善的的. 商业智能系系统更是如此, 在用户使用一段段时间后可能会提提出更多的,更具具体的要求, 这这时需要再按照上上述步骤对系统进进行重构或完善。5。其中,在BI系统实施施中要注意以下问问

48、题:统一协调,全局规划BI系统由于是构筑于于所有的业务系统统之上,有着独特特的复杂性和全面面性。BI系统决决不仅仅是一个单单纯的IT项目的的实施,它涉及到到企业经营管理的的各个方面,需要要上至公司高层领领导下至基层业务务人员的大力配合合。实施这样的系系统的难度和所需需要投入的资源远远超于普通的业务务支持系统。企业业必须进行缜密的的思考和全局的计计划,把BI软件件纳入企业软件管管理的整体战略之之中。全局规划不不仅要对项目实施施队伍做出规划,同同时还要对项目后后续的部署维护和和功能的增强完善善所需要的资源做做出规划。商务智智能计划必须有一一个整体的愿景和和路线图,否则,就就很难统一起来。F。一把手

49、工程BI也是一把手工程。BI同同ERP和CRM等等软件一样也是一一把手工程。一般般的工作人员想到到的只是利用BI迅迅速生成报表,提提高劳动效率;而而一把手的角度,是是从提高企业业务务增值的目的出发发,两者在需求模模型设计时侧重点点完全不同,结果果也大相径庭。另另一方面,没有一一把手的大力支持持,企业的业务流流程调整会遇到很很大阻力,甚至是是难以贯彻下去。O。因此,在决定上BI之之前,企业用户的的老总和其智囊团团需要慎重考虑哪哪些业务首先需要要决策支持,这项项业务的内部流程程是否清楚,如何何对其进行内部流流程重整。并要配配套相应的部门来来专门负责数据的的跟踪和优化分析析,这样企业的决决策将会变得

50、越来来越理智客观,在在日益激烈的商业业竞争中将也会领领先一步。J。BI的组织和技能要素素建立BI体体系需要许多技能能,包括商务技能能、信息技术技能能和分析技能。然然而要建立同时具具备以上三种能力力的数据分析部门门谈何容易。善于于联系看似不相关关的事物并能有效效地呈现它们之间间的关系是一种非非常难得的能力,通通常企业里面具备备这种能力的人才才很少,即使有也也没有被充分重视视。国际国内的BI人人才奇缺。如果企企业不能有效地组组织BI活动(如如着手建立集中化化的BI能力中心心和投资BI技能能建设)将无法在在战略层面展示BI的的作用,且将面对对至少50%的额额外实施费用。而而没有集中的,专专门的BI功

51、能部部门,BI系统无无法被深入和有效效的支持。G。由于人才的稀少,建立立一个集中的,汇汇集各种人才的BI能能力中心是非常必必要的(要成立专专门的数据分析部部门)。来自不同同部门的人以建立立一种互相协作的的BI队伍远比寻寻找同时具备三种种能力的人才更现现实可行。7。一个有效的BI能力中中心有三个重要的的任务:指导用户能够实实现重复的BI任任务(如管理报表表和简单的重复分分析)的自我服务务;承担复杂的,额额外的分析工作直直到这些分析能够够成为可重复使用用的简单工作;确保BI系统的的功能和潜力不被被高估,实实在在在地解决现实的问问题。s。企业建设BI系统的目目的,是要从大量量的数据中找出可可以给企业

52、带来增增值效益的数据分分析,但是这些数数据必须有相应的的人对其进行跟踪踪处理,否则BI的的价值也就只停留留在迅速做出报表表的层面,BI的的核心价值也被大大打折扣。而所有有的任务,都需要要精心的策划和长长期的努力。A。数据基础先行“BI是数据驱动的应应用”。BI系统统建设的核心是坚坚固、高质量的数数据基础。建立这这样一个数据资料料库的任务是极其其艰巨的,要消耗耗大量的时间和资资源。而企业数据据的积累是伴随着着各种基础信息系系统的建设而进行行的,这是一个长长期的过程。 M。在基础系统尚未建立和和完善阶段,切忌忌同时发动不同的的系统建设,如在在实施BI系统的的同时就在建设分分销供应链系统。不仅资源捉

53、襟见肘,数据的质量和完备问题也是不可预料的因素。本意是整合公司所有的数据资源,但是数据资源仍在不断地变化,如何整合这些尚未确定的资源是一个巨大的挑战。o。找准切入点BI要想大做小,从最最迫切的业务入手手。无论是上哪种种管理软件,几乎乎都会听到同样的的声音:不要贪大大求全,从最迫切切的业务入手,BI也也不例外,它可以以做成一个独立的的庞大系统,把企企业中所有的业务务数据全部放在一一个数据仓库里,进进行多维分析;也也可以将其嵌入到到各项单独的业务务数据中,进行单单独的业务分析。咨咨询顾问的意见是是先把最紧要的业业务管理起来,以以便迅速响应市场场需求,做出最佳佳决策。积累了一一定经验后,再逐逐渐增加

54、BI系统统继续对其他业务务进行决策分析,这这样可以在一定程程度上规避风险,因因为上BI也要进进行流程的重整,一一个部门的整顿对对公司的影响要比比整个公司整顿的的影响小得多,就就好比动小手术总总要比作大手术的的疼痛小一些一样样。f。坚持业务趋动坚持业务趋动而不是IT趋趋动。涉及到管理理的问题,就是行行为科学的问题,也也就是人的问题。因因此管理软件的需需求拉动都是从业业务部门牵头做起起,而不是IT部部门。也许一些企企业也明白应由业业务部门来提出对对软件的设计需求求,但业务人员的的水平不足以达到到提出未来管理模模型架构的水平,如如果出于这样的原原因,企业老总要要给予IT部门绝绝对的权威,让他他有权来

55、要求业务务部门必须配合IT部部门共同协商提出出需求模型,以尽尽量准确的把握企企业的业务发展方方向。Q。BI与其它系统的差别别商业智能(BI)帮助助企业的管理层进进行快速,准确的的决策,迅速的发发现企业中的问题题,提示管理人员员加以解决。但商商业智能软件系统统不能代替管理人人员进行决策,不不能自动处理企业业运行过程中遇到到的问题。商业智智能为企业带来的的是一种经过科学学武装的管理思维维,给整个企业带带来的是决策的快快速性和准确性,发发现问题的及时性性,以及发现那些些对手未发现的潜潜在的知识和规律律。z。BI与报表系统实现现有业务报表的问问题常被作为BI应应用的开始,虽然然务实,但却是一一个陷阱。

56、传统的的报表系统和BI是是有本质区别的。传传统的业务报表系系统针对分离的事事务处理而设计扁扁平系统,并不擅擅长于结构化的分分析和统计。而一一个独立的BI系系统,能够从传统统业务系统中获取取各类业务数据,通通过数学模型建立立多层次的分析体体系,并将其转化化成有商业意义的的信息。BI的应应用需求往往复杂杂多变。BI的实实施复杂性远远超超过传统的报表系系统。不能带着传传统事务处理系统统的思维模式进行行BI系统实施。q。另外,报表系统和BI的的使用对象和目的的也不尽相同。报报表系统更着重于于短期的运作支持持,而BI则关注注长期的战略决策策,甚至更着重于于商业趋势和业务务单元的联系而非非具体的数据和精精

57、确度本身。BI并并不是用来代替着着眼于日常运做的的报表系统的!这这种理解的含糊非非常容易导致对BI项项目复杂度和资源源的投入要求估计计不足。Q。BI与ERP在ERP环境中安装数数据仓库是一个相相当经济的建议。因为,从基础架构的角度上看,BI数据库和ERP有许多共通之处。两者都采用分布式架构存储海量数据,因此,双方进行融合的可能性很大;两者都为大范围终端用户提供深度访问的能力;两者都具有高度的分布性和应用程序的可扩展性,尽管这种特性在BI上体现得不是很明显;两者基于同样的前提。即利用直接或者间接数据作为预测工作的信息参考。D。在过去10年中,ERP技技术和BI都有重重大的发展,但它它们的发展道路

58、或或多或少是并行的的。两者的商业判判断能力都有赖于于信息技术,但功功能特点却各自针针对于商业智能(Business Intelligence)和业绩跟踪(Performance Tracking)的不同方面。j。虽然存在类似之处,但但BI和ERP绝绝对不是同一事物物或是同一事物体体的两个方面,它它们是互补的系统统。w。它们最大的共性就是,它它们使企业运行得得更有效率、响应应更及时并易于整整合。因此,已实实施了ERP的企企业需要BI是显显而易见的。M。行业客户实施ERP之之后,就建立起了了新的业务处理模模式。ERP系统统所涉及的所有业业务流程通过整合合彼此协调,打破破了原有的部门分分割局面。公司

59、内内所有环节的信息息获知能力都得到到了提升,企业内内外的业务处理瓶瓶颈将被打破,响响应速度也能相应应改善。x。BI能提高行业用户在在关键领域的信息息获知能力及掌控控精度。首先,报报告格式将大大改改良,整合后的用用户数据无疑使报报告进行得更快、更及时、更精确确。其次,信息传传输也将越来越实实时化,在各部门门周转时间将大为为减少。最后,业业务处理流程当中中可能出现的问题题和失误也易于及及时发现,从而使使纠错工作更加迅迅速和准确。O。通过BI,孤立、分散散的企业数据按历历史记录顺序彼此此相关了,而且能能按高效、易于提提取的结构进行存存储;行业用户由由此就可以按不同同的透视方法进行行快速分析。与传传输

60、数据不同,一一旦信息进入数据据仓库或局部领域域的数据集市,它它就不可改变。它它成为了分析型数数据,而非传输型型数据。因此,行行业用户可以做的的分析就不再是简简单的总结,他们们可以按自己设置置的分析方法对数数据进行任何深度度的分析。这种数数据仓库按照执行行快速、灵活可变变的形式组织起来来,数据访问变得得异常简便(用户户不需专门应用软软件就能访问,就就像从书架上取下下一本书一样方便便)。d。BI与DSS、ISS商业智能作为一种新兴兴的决策支持体系系,与传统的DSS、EIS相比,在在以下方面存在明明确的优势。q。使用对象范围商业业智能的使用对象象不再像DSS、EIS仅仅局限限于企业的领导与与决策、分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论