迪比特数据仓库方案书_第1页
迪比特数据仓库方案书_第2页
迪比特数据仓库方案书_第3页
迪比特数据仓库方案书_第4页
迪比特数据仓库方案书_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章 系统规划 1.1 系统目标系统的目标是建立面向业务(宏观)战略的商务智能平台,整合迪比特集团各业务系统。整个系统分为四个阶段来完成:第一阶段:灵活报表系统第二阶段:大MIS系统:流程再造第三阶段:统一数据平台:决策支持第四阶段:优化第四阶段:优化1.2 灵活报表系统1.2.1 系统目标迪比特在长期的生产经营中,已经积累了大量的历史数据;由于这些数据分布在不同的系统中,以及缺乏良好的工具手段,导致公司在日常的生产管理中,却常常感到信息不够,或数据提出非常困难。如何将这些历史数据变成有价值的信息,如何提高信息的快速反馈能力,使企业有足够的、及时的信息,来面对迅速变化的市场,以成为迪比特信息

2、应用的一个课题。通过灵活的报表与数据查询功能,运用先进的绩效和企业管理手段,力求搭建完整、稳健、高效的自动化综合统计信息展现平台。灵活报表系统的具体设计目标主要有:1、最大限度地科学管理信息资源,以先进的数据库管理系统为基础,完成数据采集、整理、存储、利用,提高信息资源的管理水平;2、充分挖掘信息的价值,借助计算机及网络通信技术,通过系统自动生成各类管理报表和经营管理统计分析指标,并提供强大的查询系统,辅助管理人员动态监控的业务状况、财务状况;3、提高工作效率,帮助公司各层级管理人员摆脱烦琐的数据整理工作,实现管理水平和管理质量的飞跃;4、减少工作误差,提供更加完善的指标校验功能,自动验证用户

3、数据输入是否正确,保证输入数据的正确性、完整性。1.2.2 系统特点1 数据抽取ETL分别是三个单词的首字母缩写(Extract Transform Load)也就是抽取、转换、装载,但我们日常往往简称其为数据抽取。ETL包含了三方面,首先是抽取:将数据从各种原始的业务系统中读取出来,这是所有工作的前提。其次转换:按照预先设计好的规则将抽取得数据进行转换,使本来异构的数据格式能统一起来。最后的装载:将转换完的数据按计划增量或全部的导入到数据仓库中。ETL完成的工作主要包括三方面,其在数据仓库和业务系统之间搭建了一座桥梁,确保新的业务数据能源源不断进入数据仓库,同时用户的分析和应用也能反应出最新

4、的业务动态。如果从整体角度来看,ETL主要作用在于其屏蔽了复杂的业务逻辑从而为各种基于数据仓库的分析和应用提供了统一的数据接口,这也可以说是构建数据仓库最重要的意义所在。2 数据存储系统数据存储采用关系型数据库技术和ROLAP技术。存储分为ODS层(操作型细节数据层)和数据集市层。具有以下特点:关系数据存储模型直接ETL装载保留数据细节同时建立必要的数据预聚合不丢弃业务信息3 业务特性:作为世界一流的商务智能平台产品,MicroStrategy具有以下一些特点:1) 完美的客户化展现: 查询、报表和图表MicroStrategy产品具有非常强大的报表定制功能。通过GUI方式,只需简单鼠标拖拽方

5、式就可以实现复杂报表的定制,并且报表的定义逻辑可以保存,以便于以后在此基础上再次编辑加工。如下图所示报表:MicroStrategy Report Service支持中国式报表格式2)可实现OLAP分析提供多维视图的数据组织、管理与多维分析。提供增量汇总技术。提供分析作业调度管理。提供最优/最差分析、例外分析、排名分析、比较分析等分析功能。具有丰富的图形展现功能。能够灵活地建立、定制不同的分析指标和各种指标计算公式,实现OLAP分析的动态化处理。并具有切片、切块、旋转、钻取和钻透等多维分析操作。能直接钻取到详细数据,也能进行多维数据和详细数据的混合分析。提供丰富的函数,可自由扩展,便于二次开发

6、。OLAP分析结果可输出为Excel、HTML、文本文件等多种类型的文件。对分析指标指定警告值的,在分析报表或图形中以突出方式进行显示。3)可实现即席查询通过定义业务逻辑到数据库结构映射层,使最终用户无需了解数据库和SQL的复杂性,只需按业务逻辑规则即可快速简洁地定义查询需求,系统自动完成连接操作、条件定义等复杂的SQL定义操作。提供各种向导式界面、图形查询生成器、提示窗口等,通过简单的鼠标拖拉操作即可实现即席查询、报告生成、图表生成、深入分析和发布等功能。具备多表之间的钻取访问、具备主表与子表之间的钻取访问功能。提供资源控制机制。它能够监控查询的运行进程,并停止长时间运行的查询,控制资源使用

7、效率。而且还提供查询预测能力,使分析人员在运行查询之前,能够预测查询所需时间。能访问各种数据源的数据,访问结果也能输出到多种通用文件格式中。可以对用户设立不同的查询优先级,实现数据仓库资源的合理分配。信息发布默认情况下就已经是发布到Web方式。还能够以电子邮件、手机短信等方式发布。提供订阅门户,使用者可以在门户中自定义发送方式。1.3 大MIS系统流程再造 作为业务决策人 (BDM) 或技术决策人 (TDM),您始终都在寻找能够更好地分析、策略化并改善组织业务流程的方法。 了解 Microsoft 门户和集成解决方案如何帮助您的公司简化异种系统、提高雇员生产力、降低运营成本并改善整体 IT 基

8、础结构。 将企业资源计划 (ERP)、供应链管理 (SCM) 和客户关系管理 (CRM) 系统等内部业务系列应用程序与客户和贸易合作伙伴进行集成,从而实现实时协作。 实现订单处理和合同管理业务流程自动化。是通过数据整合和报表整合以及未来的门户(工作流整合)实现对原有分立系统的信息整合。这样做既不需要“推倒重来”而且风险和投入都相对小业务流程管理 BPM(Business Process Management)是将生产流程、业务流程、各类行政申请流程、财务审批流程、人事处理流程、质量控制及客服流程等70%以上需要两人以上协作实施的任务全部或部分由计算机处理,并使其简单化、自动化的业务过程。1.4

9、 统一数据平台1.4.1 统一数据平台特性统一数据平台是面向主题的、综合的、不同时间的、稳定的数据集合,用于支持经营管理中的决策制定过程。也就是说,数据平台是一个大的数据库,存储了该公司所有业务数据,从在线事务处理(OLTP)系统中获取的综合数据,这些数据可能驻留在许多不同的数据源中。这些数据源可能是文档、层次型数据库、网络结构化的数据库、反向列表数据库、关系型数据库,或者更常见的由上述系统组成的混合系统。 数据平台为决策支持和在线分析提供数据。数据平台除了具有传统数据库管理系统(DBMS)的共享性、完整性、数据独立性外,还具有下列特征: * 统一性和一致性 * 面向主题 * 历史性 * 只读

10、性 统一性和一致性 数据平台使用一致的命名规定、测度、物理属性和语义来统一来自多种数据源的经营数据。例如,在许多企业中,应用程序常常以不同的格式使用类似的数据:日期按照Julian或者Gregorian格式存储,真/假数据可能表示为1/0、ON/OFF、TRUE/FALSE、正/负等。不同的应用程序可能使用不同的术语来描述同样的数据,例如一个应用程序可能使用“平衡表”来描述银行帐户,另外一个应用程序可能使用“总量表”表示银行的帐户。在数据仓库中存储的数据需要一种单一的、可以由企业分析人员接受的格式存储,而不考虑各种外部数据源。这种统一性允许数据来自跨组织和部门,例如企业以前保存的数据、表格中的

11、数据、甚至来自Internet上的数据。这些数据可以统一在数据仓库中,使企业经营人员更好地分析和理解企业的经营状况。 面向主题 传统的数据库是面向应用设计的,它的数据只是为处理具体应用而组织在一起的。应用是客观世界既定的,它对于数据内容的划分未必适用于分析所需。而主题是一个在较高层次将数据归类的标准,每一个主题基本对应一个宏观的领域,基于主题组织的数据被划分为各自独立的领域,每一个领域都有自己的逻辑内涵互不交叉。因此,在数据进入数据仓库之前,必然要经过加工和集成,将原始数据结构做一个从面向应用到面向主题的大转变。跨组织的经营数据源保存着企业方方面面的大量数据,例如客户记录、产品信息等等。而这些

12、数据没有被用于对企业的全面经营状况相关分析。数据仓库只是组织这些关键的企业信息,以便简化对企业的分析过程。 历史性 存储在OLTP系统中的数据可以正确地表示现在时间的任何值。OLTP系统经常只是包含当前的数据。例如,处理定单的应用程序总是显示库存的当前值,而不显示在过去某一时间的库存值。不同时间的查询一般地会得到不同的查询结果。然而,存储在数据仓库中的数据,可以准确地表示过去某一时刻的数据,因为这些存储的数据表示了历史信息。存储在数据仓库中的数据一般表示过了一段比较长的时间的数据,一般是五年到十年。数据仓库存储了企业一段时间的快照形式。这些数据一般是不改变的。与此不同的是,业务数据库通常只保存

13、有用事务数据30-90天。数据经集成进入数据仓库后是极少或者根本不更新的。因此,常用的操作是追加操作和历史查询。 只读性 因为存储在数据仓库中的数据表示是某一时刻点的数据,所以在数据仓库中,不允许删除、插入和修改。当数据移动到数据仓库之后,一般是不改变的,除非存储的数据是不正确的。一般地,在数据仓库中发生的操作是建立数据仓库时的加载数据和查询数据。因为数据在加载之后不再修改,所以对数据仓库的设计可以通过使用索引、预先计算的数据和物理的数据库正规化来优化查询的性能。1.4.2 统一数据平台建模数据模型是对现实世界进行抽象的工具。它描述了企业内的实体和联系,即主题域,是企业最高层次的抽象。数据模型

14、采用ERD(实体关系模型),整体ERD由各分ERD综合而成,不仅消除了分ERD之间的不一致,而且消除了不必要的冗余。ERD在逻辑上实现了数据仓库集成和面向主题的特点。数据平台的建模首先是根据迪比特公司的业务,确定主题领域,然后扩充每个主题域,以得到主码(包括时间主属性)和各属性,并实现主题域之间的联系。生产制造也得主题领域有:机构组织、产品、客户、订单、地区、仓库、促销、服务等。1.4.3 统一数据平台应用在同一数据平台基础上,除了能产生各种报表,满足日常生产管理需求外,还能支持各种决策支持系统,和数据挖掘功能。决策支持应用如:经营分析与计划达成、kpi指标监控、企业战略管理平衡计分卡应用等等

15、。数据挖掘应用,如客户贡献度分析、客户分类分析等等,为公司的产品设计提供更多的客户信息。1 kpi指标监控对于企业高层管理人员来说,可定义一些企业的关键绩效指标,如企业销售收入、税后利润等等,根据业务实际状况推算出下一个年度合适的阀值,通过后台存储过程技术定时计算迪比特的实际数值,最后通过MicroStrategy产品的告警功能实现数据的push,刷新客户端,使用户及时了解监管指标的当前状况。2 经营分析与计划达成经营分析会关注市场接受度指标集、服务水平指标集、生产费率科学性指标集等五个指标集,每个指标集里面都包括丰富的指标。如在市场接受度指标集中会有产品市场占有率、客户满意度等等。通过对这些

16、指标集多角度多手段的观察,可以把握经营的总体特征,如同期比、前期比、占比、TopN、绝对值分布等等数理统计。计划达成主要包括业务收入人力资源计划达成情况、业务收入计划达成情况、业务支出计划达成情况等几个主要方面,以及其他五个方面的辅助方面。3 企业战略管理平衡计分卡应用通过仪表板表现形式:灵活报表方案设计在开发灵活报表系统时,国天商业智能采用成熟的数据仓库原理和方法,根据应用主题建立各种多维分析模型,使系统能灵活地生成各种报表和图形等多种多样的信息表现形式,为企业的经营决策提供各种信息。系统逻辑设计系统分为三大模块:数据抽取、数据存储、数据展现。数据抽取:通过此模块,将生产系统或外部系统的数据

17、抽取到数据仓库中。数据存储:数据存储包括数据仓库和数据集市。数据仓库为企业统一的信息平台;数据集市为面向多维分析的数据存储。 数据展现:数据仓库信息输出部分,输出方式可分为固定报表、即席查询、多维分析。按功能可分为各种应用分析系统,如:客户关系管理系统、资产负债分析系统、管理会计、绩效考核系统。2.2 系统部署拓扑结构前面已经提到过,分析展示层将全部采用MicroStrategy产品,作为前端应用系统支撑软件的MicroStrategy产品将按如下方式部署:用户用户2.3 应用功能 详见本方案1.1.2节的第三点:业务特性。2.4 软件配置此次项目主要使用MicroStrategy产品作为前端

18、展现的解决方案,因此软件配置主要为MicroStrategy产品的软件配置。下表列出了MicroStrategy产品各组件所需的软件配置MicroStrategy软件操作系统其它BI服务器MicroStrategy Intelligence ServerWindows NT/2000 Server;Solaris;AIXWeb服务器(JSP版本)MicroStrategy Web UniversalWindows NT/2000或Unix(Sun Solaris, IBM AIX, HP-UX)或Linux需要J2EE中间件平台,比如WebLogic, WebSphere, SunOne,To

19、mcat等应用建模MicroStrategy ArchitectWindows NT/2000 /98/XPC/S客户端(查询、报表、OLAP、高级分析)MicroStrategy Designer/AnalystWindows NT/2000 /98/XPWeb客户端(查询、报表、OLAP、高级分析)MicroStrategy Web Professional /Analyst /Reporter/report severseWindows NT/2000 /98/XP, Unix, Linux需Web浏览器2.5 硬件配置1 MicroStrategy各产品组件所需的硬件配置客户端所需硬件

20、资源MicroStrategy软件最小配置推荐配置CPU(1000M HZ)数目内存CPU(1000M HZ)数目内存应用建模MicroStrategy Architect1128M1256MC/S客户端MicroStrategy Designer/Analyst1128M1256MWeb客户端MicroStrategy Web Professional /Analyst /Reporter1128M1256M服务器端所需硬件资源基本假设:业务用户并发操作率假设为50%;业务用户全部使用B/S方式进行报表操作;服务器端的CPU主频假设为1000MHZ。为了保证报表系统的高可用,报表应用服务器、

21、Web服务器采用群集。计算方法:根据MicroStrategy实验室的测算结果及在世界各地的实施经验,在Intelligence Server上每1000MHZ的CPU可支撑40-50个并发操作用户,如果Web服务器只用于支撑MicroStrategy Web/Web Universal应用,其支持容量与Intelligence Server相当。用户数并发用户数(50%并发率)MicroStrategy Intelligence ServerMicroStrategy Web服务器汇总2001002 CPU;2048M RAM2 CPU;2048M RAM4 CPU;4096M RAM100

22、501 CPU;1024M RAM1 CPU;1024M RAM2 CPU;2048M RAM50250.5 CPU;512M RAM0.5 CPU;512M RAM1CPU;1024+YM RAM2 数据库与ETL硬件平台配置此次项目数据库与ETL服务硬件平台的配置规格,我们给予以下三点意见:运维环境的硬件平台可以根据开发环境的负载情况在系统切换上线前再作准确确定;鉴于客户当前的IT状况,我们认为不排除对“现有数据管理系统”的设备例旧的可能;根据我们的经验,至少的配置是:双PU,4G内存的配置;高载荷的配置可以达到4CPU,8内存的配置;也可以更高。 第三章:灵活报表系统的实施我们将采用DW

23、M(Data Warehouse Method)为迪比特公司实施项目。DWM是我们经过多年的数据仓库系统实施而提炼、总结好的结构化实施方法,详细定义了用于构造一个完善的、满足业务功能的数据仓库系统所不可缺少的步骤和任务。DWM是一组预定义好的、在整个数据仓库项目中起指导作用的、可用多种方法管理的实施步骤。DWM可以帮助我们解决诸如确定正确的系统范围和用户需求、建立灵活的系统架构以满足不断变化的应用需求以及不可预测的使用需求等等比较棘手的问题。采用DWM这不仅可以提高工作效率及项目实施质量,而且可以尽可能的减少系统的实施风险。DWM是一个抽象的方法论,需要结合项目实际环境作定制。DWM把数据仓库

24、系统的实施分为13个过程,7个阶段。如下表所示:过程|阶段实施策略系统定义系统分析系统设计系统建立系统应用系统维护业务需求定义34.6%9.3%13.3%数据获取8.4%8.5%23.1%16.4%17.2%21.4%系统结构定义11.5%22.2%14.3%5.4%14.5%数据质量控制2.2%12.1%6.5%7.9%0.6%数据仓库管理3.4%4.4%3.9%11%16.1%元数据管理3.7%4.7%4.9%数据访问6.3%4.7%4.9%数据库设计与建立4%2%文档设置1%1.1%2%4.5%3.9%系统测试1.2%7.4%15%19.8%19.7%培训0.5%7.7%2.7%4.1%

25、4.7%27.8%系统上线1.7%0.2%0.4%17.8%技术支持45%上表中各个过程中的阴影表示每个过程涉及到哪个实施阶段,表中的百分比表示以一个中等规模的项目为例,每个过程在各个实施阶段中所占的比例。3.1 DWM实施过程在不同的数据仓库系统项目中,在7个实施阶段中均会涉及上述大部分或全部的实施过程。1业务需求定义本过程主要通过了解客户业务的策略性目标和建立系统的初衷,明确数据仓库解决方案能够满足的业务需求,确定系统的实施范围,初步建立系统实施的方向。2数据获取本过程的目标是确定数据仓库系统将要使用的数据的来源数据获取过程会涉及数据仓库的多个组成部分,包括内部的业务处理系统和外部相关系统

26、。同时,需要确定从这些数据源抽取、转换和传递原数据的方法,包括制定第一次数据装载的方案、数据更新方案,以及确定数据获取模块的功能。3系统结构定义本过程侧重于定义数据仓库的技术基础的组成和结构化设计,包括各种产品的集成方法、系统不同组成部分的集成方法,以便提供一个易扩展、可伸缩性好的系统结构。从技术角度讲,系统结构决定了对下列技术性方案的选择,包括数据库环境是分布式的还是集中式的,以及数据获取、基础结构优化和平台配置等方面对网络、硬件平台和软件需求的定义和实施。在平台配置中,包括了数据获取的环境、服务器结构、中间件的选择、数据库规模等方面。本过程中还需要确定数据访问的安全性控制、数据备份与恢复等

27、方面的策略和方案。4数据质量控制本过程用于保证数据仓库中的数据的一致性、可靠性和准确性。在客户认可了确定数据正确性和一致性方法的基础上,制定出数据质量控制策略,以及数据管理流程。同时,还需要对数据质量控制工具进行评估和推荐。此外,本过程还需要确定用于识别和处理错误数据、数据清洁、监测和控制脏数据的业务规则。数据质量控制模块还需要与数据获取模块集成在一起,用于检查质量控制功能在从源数据环境转换到目的环境的全过程中是否按照正确的顺序完成,以保证进入到数据仓库中的数据是可靠的数据。5数据仓库管理本过程用于定义维护、使用和修改数据仓库的策略和需求,主要包括版本控制、数据使用方法和安全性控制,以及数据管

28、理。过程初期,需要确定管理流程、所用工具、评估和测试方案。过程期间,需要设计和建立数据仓库管理模块,用于实现版本控制、数据备份与恢复、数据归档、数据管理和监测,以及建立其他管理和检测任务,最终实现管理的自动化。6元数据管理本过程侧重于确定元数据管理的策略,以及定义元数据类型、元数据库、元数据集成和访问的需求。其主要目标是如何形成和组织数据仓库中涉及各个方面的元数据,使之既满足技术要求,又符合业务需求。技术要求的侧重点在于,如何汇集在系统开发过程中创建的元数据和用于支持系统管理的元数据。技术性元数据包括,数据获取规则,数据转换方法,数据的时间,数据权限,数据刷新、归档、备份和恢复的计划和结果,以

29、及被访问的数据,其中包括访问频率和访问请求数量等因素。对技术人员而言,如何有效的管理数据仓库是其最关心的问题。业务需求的侧重点在于,最终用户关心的是可以从数据仓库中获取什么样的数据,以及如何获取这些数据。多数情况下,是通过为用户提供有效的元数据访问工具实现的。用户使用这些简单易用的工具,浏览创建对数据的查询和编制报表,在元数据上完成drill-down/up分析。通过开发元数据管理模块实现对元数据的获取、集成和访问。7 数据访问本过程侧重于对支持用户访问数据仓库中数据的工具的确认、选择和设计。根据用户要访问的数据的级别、数据决策的需求和用户的技能水平,来评估、选择、推荐和测试数据访问工具。8数

30、据库设计与建立本过程的目标是如何定义数据库对象,既能满足数据需求,又能满足对数据有效访问的需求。本过程包括对数据库的逻辑设计和物理设计,关系型数据库设计和多维数据库设计,还包括对开发环境、测试环境和产品环境的建立。9文档设置本过程涉及系统应用之前的各个实施阶段,是系统设计、开发、运行和维护所不可缺少的一个重要环节。无论是系统需求文档、还是技术文档、用户操作手册等等,都是保证系统开发和运行正常进行的重要辅助手段。10 系统测试本过程是保证系统正确运行的重要环节。系统测试之前,需要制定测试策略、准备测试方案、测试步骤和测试数据。从功能角度讲,系统测试包括各个模块的单独测试,系统集成测试;从数据角度

31、讲,系统测试包括系统正确性测试,大数据量测试(即系统性能测试)。11 培训本过程定义了开发人员和最终用户的培训需求,确定需要接受培训的技术和业务人员,并估算出培训计划和实施培训的时间表,设计和编制培训资料。本过程的目标是通过提供适当有效的培训,保证不同类型的人员更好地使用和维护已投入运行的系统。12 系统上线本过程的目标是把系统移植到产品环境中,包括制定安装计划,准备客户维护和产品环境。13 技术支持系统上线之后,继续为用户提供在系统管理方面的技术支持3.2 DWM实施阶段使用增量开发方法(Incremental Approach)开发的数据仓库系统,其实施过程分成下列7个阶段。1实施策略本阶

32、段以客户策略性业务需求和目标为基础,完成对系统目标、增量开发的优先级和企业数据仓库基础结构的定义,并对客户组织结构、成功的关键因素、主要的限制因素、事项、风险和由数据仓库系统带来的好处进行评估。此外,还完成对高层的技术实现结构和数据仓库结构进行定义。2 系统定义本阶段会明确定义增量开发过程的目标和范围,确定数据源和数据质量控制范围,以及在已确定的解决方案实施范围内确定技术结构和数据仓库结构。此外,在本阶段还需建立在数据获取、数据质量控制、数据仓库管理、元数据管理、数据访问和培训等方面的策略性方案。3 系统分析在本阶段中,在已确定的解决方案实施范围内,明确详细的业务需求,包括建立逻辑模型、收集源

33、于源数据的详细需求,以及最终用户对数据的访问需求。在系统分析阶段,确定数据获取方案,包括从源系统中抽取什么数据,以及数据量控制、数据校验和转换规则;确定业务数据处理周期、更新周期,以及提取、传递和装载周期;完成源系统的分析,数据映射,源系统和目标系统的差异分析,源系统的变化,以及数据获取工具的选择。此外,建立与企业技术结构相吻合的用于增量实施的技术结构,它是以支持增量实施的硬件、软件、数据访问工具、网络、备份与恢复等方面为基础的。同时,对用于数据访问、数据质量控制、数据仓库管理和元数据管理等数据仓库解决方案中各部分的工具进行评估和选择。4系统设计本阶段的目标是使用在系统分析阶段确定的信息建立满

34、足需求的详细技术定义。包括数据获取和装载模块的设计,数据元素、数据汇总层次的验证,数据一致性的检查,元数据的定义,对数据访问和查询、编制报表等部分的详细定义。此外,详细定义逻辑模型、数据需求、来自系统分析阶段的数据映射,以及关系型、多维数据和元数据库对象的物理结构设计。系统设计阶段还完成平台配置,制定测试方案,编制用户使用和技术参考手册、培训资料,以及制定系统上线策略。5 系统建立本阶段依据系统设计阶段的方案,完成数据仓库系统各组成部分的建立,包括数据库、数据获取模块和数据访问机制;构造数据抽取、转换、装载、更新和集成模块;安装数据访问工具,并于数据对象集成;构造查询、编制报表。此外,制定测试

35、计划,准备测试环境;完成模块的独立和集成测试,系统正确性测试,系统性能测试。6 系统应用本阶段完成数据仓库解决方案的安装,让用户具备使用和管理系统的能力,把系统移植到产品环境中。7 系统维护本阶段完成对前一阶段实施的评估和回顾,为下一阶段的实施做好准备。3.3 项目实施计划第四章 技术服务计划、维护与承诺我方承诺项目交付后3年5天*8小时的技术支持服务,服务内容包括免费和收费两部分。4.1 免费服务内容在线支持:使用在线支持,更新并记录技术问题。电话支持:对于日常的操作问题,可以不限次数的电话咨询。Email支持:对于客户在工作中碰到的问题,我方在收到Email 请求后,将及时给予回复。传真支

36、持:对于客户通过传真方式发出的问题请求,我方收到请求后及时给出回复。热线电话我们可以做到8小时内的做出服务回应,72小时内的解决问题。我们还会安排不定期的客户回访。4.2 收费服务内容对于不能通过免费维护服务实现的技术支持,安排资深技术人员赴现场进行问题处理。第五章 培训计划MicroStrategy产品培训5.1.1培训时间表培训课程培训时间参加培训人员MicroStrategy: 基础报表2天项目设计人员、高级报表开发人员、系统管理员MicroStrategy:系统管理2天系统管理人员MicroStrategy Desktop:高级报表4天高级报表开发人员Mic

37、roStrategy Architect:项目设计2天项目设计人员5.1.2培训课程下列所有开设的培训模块全部本地化为中文。它们包括了所有要在迪比特环境下使用的MicroStrategy产品。所有的培训皆基于MicroStrategy总部所发布的已有的培训内容。MicroStrategy:报表基础时间2天先导课程熟练使用Windows操作界面培训对象报表开发人员或设计人员分析人员高级报表用户任何需要进一步的MicroStrategy课程培训的人员所覆盖的MicroStrategy产品MicroStrategy DesktopMicroStrategy Web课程描述两天的课程将向学员介绍Mic

38、roStrategy Desktop和MicroStrategy Web的报表制作能力。学员将学会使用模板、筛选、度量、提示、搜索等对象构建报表,还将学会组合多张报表、使用钻取功能操作报表以及导出数据等。学员也将学会使用各种格式化选项比如排序、旋转、分页、大纲模式、以及显示总计和小计等。培训内容MicroStrategy决策支持介绍MicroStrategy Desktop介绍在Desktop中创建、保存、查看报表在Desktop中操作报表创建、保存、编辑基本过滤器创建、格式化基本度量基本提示和搜索创建和查看文档在MicroStrategy Web中操作报表MicroStrategy:系统管理

39、时间2天先导课程MicroStrategy:报表基础培训对象系统管理员开发人员咨询人员项目经理所覆盖的MicroStrategy产品MicroStrategy Intelligence ServerMicroStrategy WebMicroStrategy Administrator课程描述两天的课程将引导学员理解MicroStrategy Intelligence Server, MicroStrategy Web和MicroStrategy Administrator的基本工作原理。学员将学会服务器平台的安装、管理、故障排除。学员还将学会怎样通过调整缓存、调度和群集来优化服务器平台。这些

40、培训内容将通过手工实验和讨论方式来进行。学员还将学会使用MicroStrategy Administrato中的一些工具软件:Object Manager, Command Manager和Project Merge Wizard.通过这样的培训,学员将具备成功实施BI项目所需的设计、实施、调优和维护平台的知识。培训内容系统管理综述系统架构和查询流程系统安装配置和管理界面启动和连接安全LDAP鉴权Intelligence Server系统管理缓存和调度数据集市群集Object Manager Command Manager项目及用户合并向导MicroStrategy Web综述MicroStr

41、ategy Web系统管理MicroStrategy Desktop:高级报表时间4天先导课程MicroStrategy:报表基础培训对象报表开发人员或设计人员需要创建高级报表并具有一定的SQL基础知识的分析人员项目经理咨询人员高级用户所覆盖的MicroStrategy产品MicroStrategy Desktop培训内容高级度量(Metrics)事实层次扩展(Fact Level Extensions)复合型和自定义组(Consolidations and Custom Groups)高级提示(Prompts)高级筛选(Filters)钻取地图(Drill Maps)报表数据选项(Repor

42、t Data Options)Engine LogicVLDB属性 报表实验MicroStrategy Architect:项目设计时间2天先导课程MicroStrategy:报表基础培训对象Project DesignersProject or Data ArchitectsDatabase 系统管理员所覆盖的MicroStrategy产品MicroStrategy Architect培训内容MicroStrategy Architect介绍决策支持架构逻辑数据模型(Logical Data Model)数据仓库物理框架(Physical Warehouse Schema)数据建模和框架设计

43、高级培训在MicroStrategy Architect中创建项目MicroStrategy FactsMicroStrategy AttributesMicroStrategy Hierarchies项目创建和配置项目维护聚合表分区和分区映射转换(Transformations) 培训教师张吉,董宝明系统交付使用培训5.2.1培训时间表培训课程培训时间参加培训人员最终用户培训2天迪比特中,负责今后对最终用户进行培训的业务或IT人员。系统维护培训3天将要负责系统运维的IT人员5.2.2培训内容系统的登陆与退出;系统各功能模块的使用方法;系统客户端常规报错/非经验现象的解释与解决办法;良好的系统

44、使用习惯。ETL调度管理;ETL与Modeling随业务变化的调整开发方法;系统权限管理;系统迁移方法;系统Trouble Shooting;系统应用扩展开发方法。培训教师储冬冬、曾健民附录资料:不需要的可以自行删除如何构建银行数据仓库数据仓库技术作为一项数据管理领域的新技术,其精髓在于针对联机分析处理(OLAP)提出了一种综合的解决方案,与以往很多技术不同的是,它主要是一种概念,在此概念指导下完成系统的构造。既没有可以直接购买到的现成产品,也没有具体的分析规范和实现方法,也就是说没有成熟、可靠且被广泛接受的数据仓库标准。在以往关系数据库的设计和实现中,不仅有详细的理论推导,还有无数的设计实例

45、,无论你使用的是什么公司的数据库产品、开发工具,只要按照规范做,那么实现同一业务需求的方案都会很相似。而现有数据仓库的实现中,出现了MOLAP方案和ROLAP方案的区别,出现了形形色色的数据仓库建模工具、表现工具,而设计人员的个人经验和素质也会在其中扮演很重要的角色。 数据仓库技术的实现方式 目前在数据仓库技术的实际应用中主要包括如下几种具体实现方式。 1、在关系数据库上建立数据仓库(ROLAP) 2、在多维数据库上建立数据仓库(MOLAP) MOLAP方案是以多维方式来组织数据,以多维方式来存储数据;ROLAP方案则以二维关系表为核心表达多维概念,通过将多维结构划分为两类表:维表和事实表,使

46、关系型结构能较好地适应多维数据的表示和存储。在多维数据模型的表达方面,多维矩阵比关系表更清晰且占用的存储更少,而通过关系表间的连接来查询数据的ROLAP系统,系统性能成为最大问题。MOLAP方案比ROLAP方案要简明,索引及数据聚合可以自动进行并自动管理,但同时丧失了一定的灵活性。ROLAP方案的实现较为复杂,但灵活性较好,用户可以动态定义统计和计算方式,另外能保护在已有关系数据库上的投资。 由于两种方案各有优劣,因此在实际应用中,往往将MOLAP和ROLAP结合使用,即所谓的混合模型。利用关系数据库存储历史数据、细节数据或非数值型数据,发挥关系数据库技术成熟的优势,减少花费,而在多维数据库中

47、存储当前数据和常用统计数据,以提高操作性能。 3、在原有关系库上建立逻辑上的数据仓库 由于目前正在运行的OLTP系统中已经积累了海量数据,如何从中提取出决策所需的有用信息就成为用户最迫切的需要。新建数据仓库固然能从功能、性能各方面给出一个完整的解决方案,但需要投入大量的人力、物力,并且数据仓库的建设和分析数据的积累需要一段时间,无法及时满足用户对信息分析的迫切需要。因此在筹建数据仓库的前期,可以采用一些合适的表现工具,在原有OLTP系统上建立起一个逻辑的数据仓库系统。尽管由于原有OLTP系统设计上的局限性,这样的系统可能无法实现很多分析功能,但这样一个系统中数据结构固定、信息分析需求相对稳定成

48、熟,因此数据仓库的建模、实现过程会相对容易、便捷;同时,这样的系统也会成为将来真正数据仓库建设的原型。 信息系统与数据仓库的关系 由于数据量大、数据来源多样化,在商业银行构建管理信息系统时,不可避免地会遇上如何管理这些浩如烟海的数据,以及如何从中提取有用的信息的问题;而数据仓库的最大优点在于它能把企业网络中不同信息岛上的商业数据集中到一起,存储在一个单一的集成的数据库中,并提供各种手段对数据进行统计、分析。因此可以说,在银行使用数据仓库构建管理信息系统,既有压力,又有数据基础,它们之间的联系是必然的,难以割舍的。 数据仓库在商业银行的应用范围包括存款分析、贷款分析、客户市场分析、相关金融业分析

49、决策(证券、外汇买卖)、风险预测、效益分析等。 在银行信息系统构建时,由于历史情况和现实需求的不同,存在两种途径: 1、建设新系统 由于目前国内商业银行对银行内部运营的监管,缺乏很好的数据搜集机制,因此可以在构建管理信息系统时,分数据收集录入和数据汇总分析两部分来考虑。这样的系统中由于不需考虑大量历史数据的处理问题,同时考虑到搜集过程中可能存在多个数据来源,因此可以在系统建设的同时构建数据仓库,将搜集来的各种数据通过数据抽取整合到数据仓库中。 2、完善原有系统 而对于已经存在OLTP系统,其中沉淀了大量历史数据,则可以先在原有系统上建立逻辑数据仓库,即使用数据分析的表现工具,在关系模型上构建一

50、个虚拟的多维模型。当系统需求稳定后,再建立物理数据仓库,这样既节省投资,又缩短开发工期。 实现中需要注意的问题 一、模型设计中的问题 模型设计(包括逻辑模型设计和物理模型设计)是系统的基础和成败的关键,在实际操作中,视实现技术的不同应分别对下列问题引起注意。 1、直接构建数据仓库 直接构建数据仓库时,必须按业务分析的要求重组OLTP系统中的数据,并要按不同侧重点分别组织,使之便于使用。 *主题的确定 主题是一个逻辑概念,它应该能够完整、统一地刻画出分析对象所涉及的各项数据以及相互联系。划分主题的根据主要来源于两方面:对原有固定报表的分析和对业务人员的访谈。原有固定报表能较好地反映出以往工作对数

51、据分析的需求,而且数据含义和格式相对成熟、稳定,在模型设计中需要大量借鉴。但仅仅满足于替代目前的手工报表还远远不应是构建管理信息系统的目标,还应该通过业务访谈,进一步挖掘出日常工作中潜在的更广、更深的分析需求。只有这样,才能真正了解构建数据仓库模型所需的主题划分。 *分析内容的细化 主题的划分实际上是与分析内容的范围直接相关的,一旦主题划分清楚了,下一步就是细化分析的具体内容以及根据分析内容的性质确定它在数据仓库中的位置。通常维元素对应的是分析角度,而度量对应的是分析关心的具体指标。一个指标究竟是作为维元素、度量还是维属性,取决于具体的业务需求,但从实际操作中可以总结出如下的概念性经验:作为维

52、元素或维属性的通常是离散型的数据,只允许有限的取值;作为度量的是连续型数据,取值无限。如果一定要用连续型数据作为维元素,则必须对其按取值进行分段,以分段值作为实际的维元素。判断分析指标是作为维元素还是维属性时,则需要综合考虑这个指标占用的存储空间与相关查询的使用频度。 需要特别强调的是,在细化分析内容的过程中,务必解决指标的歧义问题。在不同报表中以及在业务访谈中同一名称的指标,是否是在同样条件限定下,通过同样方法提取或计算得到的,它们之间的相互关系是什么,这些问题都必须从熟悉业务的分析人员那里得到准确、清晰的答案,否则将会影响到模型设计、数据提取、数据展现等多个方面。 *粒度的设计 数据仓库模

53、型中所存储的数据的粒度将对信息系统的多方面产生影响。事实表中以各种维度的什么层次作为最细粒度,将决定存储的数据能否满足信息分析的功能需求,而粒度的层次划分、以及聚合表中粒度的选择将直接影响查询的响应时间。 如果同一个信息系统要在大范围、多层次上同时运行,如部门级和企业级,还应考虑不同层次的数据仓库采用不同的粒度。 *模型设计中的技巧 复合指标尤其是比率类指标的定义,必须注意累加时是先加减后乘除,还是反之。户数、笔数的计算,这类指标在分析或报表中经常出现,但不需要作为单独的指标物理存在于数据库中,但定义分析模型时一定应该准备。度量的时间特性,针对分析指标在时间维上的不同表现,可分为可累加指标、半可累加指标和不可累加指标。 2、在原有数据基础上构建逻辑数据仓库 如果直接使用OLTP系统中的数据进行数据分析处理,会遇到许多麻烦,有时甚至是不可能实现的。这并不是说关系数据库不好,而是因为其设计思路不适应较大规模数据分析。因此在使用这种方法时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论