迪比特数据仓库方案书_第1页
迪比特数据仓库方案书_第2页
迪比特数据仓库方案书_第3页
迪比特数据仓库方案书_第4页
迪比特数据仓库方案书_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章系统规划

1.1系统目标

系统的目标是建立面向业务(宏观)战略的商务智能平台,整合迪比特集团各业

务系统。整个系统分为四个阶段来完成:

第一阶段:灵活报表系统

1.2灵活报表系统

1.2.1系统目标

迪比特在长期的生产经营中,已经积累了大量的历史数据;由于这些数据

分布在不同的系统中,以及缺乏良好的工具手段,导致公司在日常的生产管理中,

却常常感到信息不够,或数据提出非常困难。

如何将这些历史数据变成有价值的信息,如何提高信息的快速反馈能力,

使企业有足够的、及时的信息,来面对迅速变化的市场,以成为迪比特信息应用

的一个课题。

通过灵活的报表与数据查询功能,运用先进的绩效和企业管理手段,力求搭

建完整、稳健、高效的自动化综合统计信息展现平台。

灵活报表系统的具体设计目标主要有:

1、最大限度地科学管理信息资源,以先进的数据库管理系统为基础,完成

数据采集、整理、存储、利用,提高信息资源的管理水平;

2、充分挖掘信息的价值,借助计算机及网络通信技术,通过系统自动生成

各类管理报表和经营管理统计分析指标,并提供强大的查询系统,辅助管理人员

动态监控的业务状况、财务状况;

3、提高工作效率,帮助公司各层级管理人员摆脱烦琐的数据整理工作,实

现管理水平和管理质量的飞跃;

4、减少工作误差,提供更加完善的指标校验功能,自动验证用户数据输入

是否正确,保证输入数据的正确性、完整性。

1.2.2系统特点

1数据抽取

ETL分别是三个单词的首字母缩写(ExtractTransformLoad)也就是抽

取、转换、装载,但我们日常往往简称其为数据抽取。ETL包含了三方面,首先

是‘抽取’:将数据从各种原始的业务系统中读取出来,这是所有工作的前提。

其次‘转换':按照预先设计好的规则将抽取得数据进行转换,使本来异构的数

据格式能统一起来。最后的'装载':将转换完的数据按计划增量或全部的导入

到数据仓库中。

ETL完成的工作主要包括三方面,其在数据仓库和业务系统之间搭建了一

座桥梁,确保新的业务数据能源源不断进入数据仓库,同时用户的分析和应用也

能反应出最新的业务动态。如果从整体角度来看,ETL主要作用在于其屏蔽了复

杂的业务逻辑从而为各种基于数据仓库的分析和应用提供了统一的数据接口,这

也可以说是构建数据仓库最重要的意义所在。

2数据存储

系统数据存储采用关系型数据库技术和ROLAP技术。存储分为ODS层(操作

型细节数据层)和数据集市层。具有以下特点:

•关系数据存储模型

•直接ETL装载

•保留数据细节

•同时建立必要的数据预聚合

•不丢弃业务信息

3业务特性:

作为世界一流的商务智能平台产品,MicroStrategy具有以下一些特点:

1)完美的客户化展现:查询、报表和图表

3BuyAnyOnngXpvSQWegj)W«b.

FA»£&YbwFfvcNteBlook』

AJdwc曷内两式而W

Update

Fortnightlysalestwnupbyonayear

Iwteductlontoyearb4ti$.ThucuilomorrtHnntion

HelpD出analysissuggeststhatcustomerloyaltywas

StoreDirectoriesupby30%.

ServiciJ

DlrecWds

Announceinents

IKMU

Q-**>

IndiKtryNews

MayJUu2Q0比SflctLDfifiQLWAinsQiZMlWuflftMB血“口乳|脚

'MoY.ze.ZOOQ^ictoflaSecretCaptivatesSurfers18QMW

53Me

*WlUiULAfiOiftlLSdlMAKmitflflmEfi!TnrtQu班

*May25,2000:Japan<HondaSetsAmbMousSakslarge]fMtiQwtle

B即cffi加M总

MicroStrategy产品具有非常强大的报表定制功能。通过GUI方式,只需简

单鼠标拖拽方式就可以实现复杂报表的定制,并且报表的定义逻辑可以保存,以

便于以后在此基础上再次编辑加工。如下图所示报表:

指标批雇贷款累计发放余糠不良贷款情况

个金额1.11.金融同比金敢新增余额金额比年初小良率比年初

数增减增减金增M(%)增减

项目1分点)

BostonBooks17•14326%366()27%34513150.2()%24.6

iXewYorkBooks1837727%302124%2921427%10970.27()%33.9%

iBostonElectronics1[2533427%81247848%236637327%2111()90.270%26.3%

NewYorkElectronicsI21918727%r18477I42%1H4536227%1X2-1260.270%27.7、

IiostonMovies132012325%I6507056%142811525%542400.25g26.6%

NewYorkMovies161520825%r■•50%110211525%116600.25(W27.5%

fiostonVusicI42037211%19363952%149491511%239370.110%27.供

NewYorkMusic151569911%15094945%116491511%1H7950.11(后28.3。

今计:361674324%77028550%,.56457911.

MicroStrategyReportService支持中国式报表格式

2)可实现OLAP分析

>提供多维视图的数据组织、管理与多维分析。

>提供增量汇总技术。

>提供分析作业调度管理。

>提供最优/最差分析、例外分析、排名分析、比较分析等分析功

能。

>具有丰富的图形展现功能。

>能够灵活地建立、定制不同的分析指标和各种指标计算公式,实

现OLAP分析的动态化处理。并具有切片、切块、旋转、钻取和钻透等多

维分析操作。

>能直接钻取到详细数据,也能进行多维数据和详细数据的混合分

析。

>提供丰富的函数,可自由扩展,便于二次开发。

>OLAP分析结果可输出为Excel、HTML、文本文件等多种类型的文

件。

>对分析指标指定警告值的,在分析报表或图形中以突出方式进行

显不。

3)可实现即席查询

>通过定义业务逻辑到数据库结构映射层,使最终用户无需了解数

据库和SQL的复杂性,只需按业务逻辑规则即可快速简洁地定义查询需

求,系统自动完成连接操作、条件定义等复杂的SQL定义操作。

>提供各种向导式界面、图形查询生成器、提示窗口等,通过简单

的鼠标拖拉操作即可实现即席查询、报告生成、图表生成、深入分析和

发布等功能。

>具备多表之间的钻取访问、具备主表与子表之间的钻取访问功

能。

>提供资源控制机制。它能够监控查询的运行进程,并停止长时间

运行的查询,控制资源使用效率。而且还提供查询预测能力,使分析人

员在运行查询之前,能够预测查询所需时间。

>能访问各种数据源的数据,访问结果也能输出到多种通用文件格

式中。

>可以对用户设立不同的查询优先级,实现数据仓库资源的合理分

配。

4)信息发布

>默认情况下就已经是发布到Web方式。

>还能够以电子邮件、手机短信等方式发布。

>提供订阅门户,使用者可以在门户中自定义发送方式。

1.3大MIS系统一流程再造

作为业务决策人(BDM)或技术决策人(TDM),您始终都在寻找能够更好地

分析、策略化并改善组织业务流程的方法。了解Microsoft门户和集成解决方

案如何帮助您的公司简化异种系统、提高雇员生产力、降低运营成本并改善整体

IT基础结构。

将企业资源计划(ERP)、供应链管理(SCM)和客户关系管理(CRM)系统等

内部业务系列应用程序与客户和贸易合作伙伴进行集成,从而实现实时协作。实

现订单处理和合同管理业务流程自动化。

是通过数据整合和报表整合以及未来的门户(工作流整合)实现对原有分立系统的信息整合。这样做既不

需要“推倒重来”而且风险和投入都相对小

业务流程管理BPM(BusinessProcessManagement)是将生产流程、业务流程、各类行政申请流程、

财务审批流程、人事处理流程、质量控制及客服流程等70%以上需要两人以上协作实施的任务全部或部分

由计算机处理,并使其简单化、自动化的业务过程。

1.4统一数据平台

1.4.1统一数据平台特性

统一数据平台是面向主题的、综合的、不同时间的、稳定的数据集合,用于

支持经营管理中的决策制定过程。也就是说,数据平台是一个大的数据库,存储

了该公司所有业务数据,从在线事务处理(OLTP)系统中获取的综合数据,这些

数据可能驻留在许多不同的数据源中。这些数据源可能是文档、层次型数据库、

网络结构化的数据库、反向列表数据库、关系型数据库,或者更常见的由上述系

统组成的混合系统。

数据平台为决策支持和在线分析提供数据。数据平台除了具有传统数据库管

理系统(DBMS)的共享性、完整性、数据独立性外,还具有下列特征:

*统一性和一致性

*面向主题

*历史性

*只读性

统一性和一致性

数据平台使用一致的命名规定、测度、物理属性和语义来统一来自多种数据

源的经营数据。例如,在许多企业中,应用程序常常以不同的格式使用类似的数

据:日期按照Julian或者Gregorian格式存储,真/假数据可能表示为1/0、

ON/OFF、TRUE/FALSE,正/负等。不同的应用程序可能使用不同的术语来描述同

样的数据,例如一个应用程序可能使用“平衡表”来描述银行帐户,另外一个应

用程序可能使用“总量表”表示银行的帐户。在数据仓库中存储的数据需要一种

单一的、可以由企业分析人员接受的格式存储,而不考虑各种外部数据源。这种

统一性允许数据来自跨组织和部门,例如企业以前保存的数据、表格中的数据、

甚至来自Internet上的数据。这些数据可以统一在数据仓库中,使企业经营人

员更好地分析和理解企业的经营状况。

面向主题

传统的数据库是面向应用设计的,它的数据只是为处理具体应用而组织在一

起的。应用是客观世界既定的,它对于数据内容的划分未必适用于分析所需。而

主题是一个在较高层次将数据归类的标准,每一个主题基本对应一个宏观的领

域,基于主题组织的数据被划分为各自独立的领域,每一个领域都有自己的逻辑

内涵互不交叉。因此,在数据进入数据仓库之前,必然要经过加工和集成,将原

始数据结构做一个从面向应用到面向主题的大转变。跨组织的经营数据源保存着

企业方方面面的大量数据,例如客户记录、产品信息等等。而这些数据没有被用

于对企业的全面经营状况相关分析。数据仓库只是组织这些关键的企业信息,以

便简化对企业的分析过程。

历史性

存储在OLTP系统中的数据可以正确地表示现在时间的任何值。OLTP系统经

常只是包含当前的数据。例如,处理定单的应用程序总是显示库存的当前值,而

不显示在过去某一时间的库存值。不同时间的查询一般地会得到不同的查询结

果。然而,存储在数据仓库中的数据,可以准确地表示过去某一时刻的数据,因

为这些存储的数据表示了历史信息。存储在数据仓库中的数据一般表示过了一段

比较长的时间的数据,一般是五年到十年。数据仓库存储了企业一段时间的快照

形式。这些数据一般是不改变的。与此不同的是,业务数据库通常只保存有用事

务数据30-90天。数据经集成进入数据仓库后是极少或者根本不更新的。因此,

常用的操作是追加操作和历史查询。

只读性

因为存储在数据仓库中的数据表示是某一时刻点的数据,所以在数据仓库

中,不允许删除、插入和修改。当数据移动到数据仓库之后,一般是不改变的,

除非存储的数据是不正确的。一般地,在数据仓库中发生的操作是建立数据仓库

时的加载数据和查询数据。因为数据在加载之后不再修改,所以对数据仓库的设

计可以通过使用索引、预先计算的数据和物理的数据库正规化来优化查询的性

能。

1.4.2统一数据平台建模

数据模型是对现实世界进行抽象的工具。它描述了企业内的实体和联系,

即主题域,是企业最高层次的抽象。数据模型采用ERD(实体关系模型),整体ERD

由各分ERD综合而成,不仅消除了分ERD之间的不一致,而且消除了不必要的冗

余。ERD在逻辑上实现了数据仓库集成和面向主题的特点。

数据平台的建模首先是根据迪比特公司的业务,确定主题领域,然后扩充每

个主题域,以得到主码(包括时间主属性)和各属性,并实现主题域之间的联系。生

产制造也得主题领域有:机构组织、产品、客户、订单、地区、仓库、促销、服

务等。

「eqion

京regionid>----------------------------]

product

eproductid

warehouse

久warehousejd

regionjd(FK)

7customer

organization

久orgid

FnJ

♦4

order

念order_id

custjd(FK)

region_id(FK)

org_id(FK)

promotion

念promotion_idservice

org_id(FK)

region_id(FK)cust_id(FK)

order_ld(FK)

product—id(FK)

□rgjd足K)

1.4.3统一数据平台应用

在同一数据平台基础上,除了能产生各种报表,满足日常生产管理需求外,

还能支持各种决策支持系统,和数据挖掘功能。决策支持应用如:经营分析与计

划达成、kPi指标监控、企业战略管理一一平衡计分卡应用等等。数据挖掘应用,

如客户贡献度分析、客户分类分析等等,为公司的产品设计提供更多的客户信息。

1kpi指标监控

对于企业高层管理人员来说,可定义一些企业的关键绩效指标,如企业销

售收入、税后利润等等,根据业务实际状况推算出下一个年度合适的阀值,通过

后台存储过程技术定时计算迪比特的实际数值,最后通过MicroStrategy产品的

告警功能实现数据的push,刷新客户端,使用户及时了解监管指标的当前状况。

2经营分析与计划达成

经营分析会关注市场接受度指标集、服务水平指标集、生产费率科学性指标

集等五个指标集,每个指标集里面都包括丰富的指标。如在市场接受度指标集中

会有产品市场占有率、客户满意度等等。通过对这些指标集多角度多手段的观察,

可以把握经营的总体特征,如同期比、前期比、占比、TopN、绝对值分布等等数

理统计。

计划达成主要包括业务收入人力资源计划达成情况、业务收入计划达成情

况、业务支出计划达成情况等几个主要方面,以及其他五个方面的辅助方面。

3企业战略管理一一平衡计分卡应用

・D<03

FnvcdBenpoctM!IMerfAP»<XMSFneefg

通过仪表板表现形式:

M«e«vtT7A**A«BAcwe,・”■

hililifiitlLiiiiliiiiil

*•*•*4*4**..**..・.«•*•WtfiW**■*.

*C='J

ef»«Mr

iijjiiLJiiilijiiJidjjd

--rwr^T*~—3“56•二…jj-

第二章灵活报表方案设计

在开发灵活报表系统时,国天商业智能采用成熟的数据仓库原理和方法,根

据应用主题建立各种多维分析模型,使系统能灵活地生成各种报表和图形等多种

多样的信息表现形式,为企业的经营决策提供各种信息。

2.1系统逻辑设计

数据展现

数据抽取数据存储It-*1

决策支持

统计分析

I)

抽取数据挖掘

数据仓库数据集市

清洗

在线分析(OLAP、

加载

数据集市3多维展现

查询

-一鱼鱼一报表

,111

原始数据获取一…一信息、知识输由

和据有序、结物化存储I

系统分为三大模块:数据抽取、数据存储、数据展现。

数据抽取:通过此模块,将生产系统或外部系统的数据抽取到数据仓库中。

数据存储:数据存储包括数据仓库和数据集市。数据仓库为企业统一的信

息平台;数据集市为面向多维分析的数据存储。

数据展现:数据仓库信息输出部分,输出方式可分为固定报表、即席查询、

多维分析。按功能可分为各种应用分析系统,如:客户关系管

理系统、资产负债分析系统、管理会计、绩效考核系统。

2.2系统部署拓扑结构

前面已经提到过,分析展示层将全部采用MicroStrategy产品,作为前端应

用系统支撑软件的MicroStrategy产品将按如下方式部署:

企业数据仓库

2.3应用功能

详见本方案1.1.2节的第三点:业务特性。

2.4软件配置

此次项目主要使用MicroStrategy产品作为前端展现的解决方案,因此软件

配置主要为MicroStrategy产品的软件配置。下表列出了MicroStrategy产品各

组件所需的软件配置

MicroStrategy操作系统其它

软件

BI服务器MicroStrategyWindowsNT/2000

IntelligenceServerServer;Solaris;AIX

Web服务器(JSPMicroStrategyWebWindowsNT/2000需要J2EE

版本)Universal或UnixCSunSolaris,中间件平台,比

IBMAIX,HP-UX)或如WebLogic,

LinuxWebSphere,

SunOne,Tomcat

应用建模MicroStrategyWindowsNT/2000

Architect/98/XP

C/S客户端(查MicroStrategyWindowsNT/2000

询、报表、0LAP、高Designer/Analyst/98/XP

级分析)

Web客户端(查MicroStrategyWebWindowsNT/2000需Web浏览

询、报表、OLAP、高Professional/Analyst/98/XP,Unix,Linux器

级分析)/Reporter/report

severse

2.5硬件配置

1MicroStrategy各产品组件所需的硬件配置

•客户端所需硬件资源

MicroStrategy软件最小配置推荐配置

CPUdOOOMHZ)内存CPUdOOOMHZ)内存

数目数目

应用建模MicroStrategy1128M1256M

Architect

C/S客户端MicroStrategy1128M1256M

Designer/Analyst

Web客户端MicroStrategy1128M1256M

WebProfessional

/Analyst/Reporter

•服务器端所需硬件资源

基本假设:业务用户并发操作率假设为50%:业务用户全部使用B/S方式进行报表操作;

服务器端的CPU主频假设为1000MHZ。为了保证报表系统的高可用,报表应用服务器、

Web服务器采用群集。

计算方法:根据MicroStrategy实验室的测算结果及在世界各地的实施经验,在Intelligence

Server上每1000MHZ的CPU可支撑40-50个并发操作用户,如果Web服务器只用于支

撑MicroStrategyWeb/WebUniversal应用,其支持容量与IntelligenceServer相当。

用户数并发用户MicroStrategyMicroStrategy汇总

数(50%并IntelligenceWeb服务器

发率)Server

2001002CPU;2CPU;4CPU;

2048MRAM2048MRAM4096MRAM

100501CPU;1CPU;2CPU;

1024MRAM1024MRAM2048MRAM

50250.5CPU;0.5CPU;1CPU;

512MRAM512MRAM1024+YMRAM

2数据库与ETL硬件平台配置

此次项目数据库与ETL服务硬件平台的配置规格,我们给予以下三点意见:

1.运维环境的硬件平台可以根据开发环境的负载情况在系统切换上线

前再作准确确定;

2.鉴于客户当前的IT状况,我们认为不排除对“现有数据管理系统”

的设备例旧的可能;

3.根据我们的经验,至少的配置是:双PU,4G内存的配置;高载荷的

配置可以达到4CPU,8内存的配置;也可以更高。

第三章:灵活报表系统的实施

我们将采用DWM(DataWarehouseMethod)为迪比特公司实施项目。

DWM是我们经过多年的数据仓库系统实施而提炼、总结好的结构化实施方

法,详细定义了用于构造一个完善的、满足业务功能的数据仓库系统所不可缺少

的步骤和任务。DWM是一组预定义好的、在整个数据仓库项目中起指导作用的、

可用多种方法管理的实施步骤。DWM可以帮助我们解决诸如确定正确的系统范围

和用户需求、建立灵活的系统架构以满足不断变化的应用需求以及不可预测的使

用需求等等比较棘手的问题。采用DWM这不仅可以提高工作效率及项目实施质

量,而且可以尽可能的减少系统的实施风险。

DWM是一个抽象的方法论,需要结合项目实际环境作定制。

DWM把数据仓库系统的实施分为13个过程,7个阶段。如下表所示:

过程1阶段实施策略系统定义系统分析系统设计系统建立系统应用系统维护

业务需求定义34.6%9.3%13.3%

数据获取8.4%8.5%23.1%16.4%17.2%21.4%

系统结构定义11.5%22.2%14.3%5.4%14.5%

数据质量控制2.2%12.1%6.5%7.9%0.6%

数据仓库管理3.4%4.4%3.9%11%16.1%

元数据管理3.7%4.7%4.9%

数据访问6.3%4.7%4.9%

数据库设计与4%2%

建立

文档设置1%1.1%2%4.5%3.9%

系统测试1.2%7.4%15%19.8%19.7%

培训0.5%7.7%2.7%4.1%4.7%27.8%

系统上线1.7%0.2%0.4%17.8%

技术支持45%

上表中各个过程中的阴影表示每个过程涉及到哪个实施阶段,表中的百分比表

示以一个中等规模的项目为例,每个过程在各个实施阶段中所占的比例。

3.1DWM实施过程

在不同的数据仓库系统项目中,在7个实施阶段中均会涉及上述大部分或全

部的实施过程。

1业务需求定义

本过程主要通过了解客户业务的策略性目标和建立系统的初衷,明确数据仓库解决方案能够

满足的业务需求,确定系统的实施范围,初步建立系统实施的方向。

2数据获取

本过程的目标是确定数据仓库系统将要使用的数据的来源数据获取过程会涉及数据仓库的

多个组成部分,包括内部的业务处理系统和外部相关系统。同时,需要确定从这些数据源抽

取、转换和传递原数据的方法,包括制定第一次数据装载的方案、数据更新方案,以及确定

数据获取模块的功能。

3系统结构定义

本过程侧重于定义数据仓库的技术基础的组成和结构化设计,包括各种产品的集成方法、系

统不同组成部分的集成方法,以便提供一个易扩展、可伸缩性好的系统结构。从技术角度讲,

系统结构决定了对下列技术性方案的选择,包括数据库环境是分布式的还是集中式的,以及

数据获取、基础结构优化和平台配置等方面对网络、硬件平台和软件需求的定义和实施。在

平台配置中,包括了数据获取的环境、服务器结构、中间件的选择、数据库规模等方面。本

过程中还需要确定数据访问的安全性控制、数据备份与恢复等方面的策略和方案。

4数据质量控制

本过程用于保证数据仓库中的数据的一致性、可靠性和准确性。在客户认可了确定数据正确

性和一致性方法的基础上,制定出数据质量控制策略,以及数据管理流程。同时,还需要对

数据质量控制工具进行评估和推荐。此外,本过程还需要确定用于识别和处理错误数据、数

据清洁、监测和控制脏数据的业务规则。数据质量控制模块还需要与数据获取模块集成在一

起,用于检查质量控制功能在从源数据环境转换到目的环境的全过程中是否按照正确的顺序

完成,以保证进入到数据仓库中的数据是可靠的数据。

5数据仓库管理

本过程用于定义维护、使用和修改数据仓库的策略和需求,主要包括版本控制、数据使用方

法和安全性控制,以及数据管理。过程初期,需要确定管理流程、所用工具、评估和测试方

案。过程期间,需要设计和建立数据仓库管理模块,用于实现版本控制、数据备份与恢复、

数据归档、数据管理和监测,以及建立其他管理和检测任务,最终实现管理的自动化。

6元数据管理

本过程侧重于确定元数据管理的策略,以及定义元数据类型、元数据库、元数据集成和访问

的需求。其主要目标是如何形成和组织数据仓库中涉及各个方面的元数据,使之既满足技术

要求,又符合业务需求。

技术要求的侧重点在于,如何汇集在系统开发过程中创建的元数据和用于支持系统管理的元

数据•技术性元数据包括,数据获取规则,数据转换方法,数据的时间,数据权限,数据刷

新、归档、备份和恢复的计划和结果,以及被访问的数据,其中包括访问频率和访问请求数

量等因素。对技术人员而言,如何有效的管理数据仓库是其最关心的问题。

业务需求的侧重点在于,最终用户关心的是可以从数据仓库中获取什么样的数据,以及如何

获取这些数据。多数情况下,是通过为用户提供有效的元数据访问工具实现的。用户使用这

些简单易用的工具,浏览创建对数据的查询和编制报表,在元数据上完成drill-down/up

分析。

通过开发元数据管理模块实现对元数据的获取、集成和访问。

7数据访问

本过程侧重于对支持用户访问数据仓库中数据的工具的确认、选择和设计。根据用户要访问

的数据的级别、数据决策的需求和用户的技能水平,来评估、选择、推荐和测试数据访问工

具。

8数据库设计与建立

本过程的目标是如何定义数据库对象,既能满足数据需求,又能满足对数据有效访问的需求。

本过程包括对数据库的逻辑设计和物理设计,关系型数据库设计和多维数据库设计,还包括

对开发环境、测试环境和产品环境的建立。

9文档设置

本过程涉及系统应用之前的各个实施阶段,是系统设计、开发、运行和维护所不可缺少的一

个重要环节。无论是系统需求文档、还是技术文档、用户操作手册等等,都是保证系统开发

和运行正常进行的重要辅助手段。

10系统测试

本过程是保证系统正确运行的重要环节。系统测试之前,需要制定测试策略、准备测试方案、

测试步骤和测试数据。从功能角度讲,系统测试包括各个模块的单独测试,系统集成测试;

从数据角度讲,系统测试包括系统正确性测试,大数据量测试(即系统性能测试)。

11培训

本过程定义了开发人员和最终用户的培训需求,确定需要接受培训的技术和业务人员,并估

算出培训计划和实施培训的时间表,设计和编制培训资料。本过程的目标是通过提供适当有

效的培训,保证不同类型的人员更好地使用和维护已投入运行的系统。

12系统上线

本过程的目标是把系统移植到产品环境中,包括制定安装计划,准备客户维护和产品环境。

13技术支持

系统上线之后,继续为用户提供在系统管理方面的技术支持

3.2DWM实施阶段

使用增量开发方法(IncrementalApproach)开发的数据仓库系统,其实施过程分成下

列7个阶段。

1实施策略

本阶段以客户策略性业务需求和目标为基础,完成对系统目标、增量开发的优先级和企业数

据仓库基础结构的定义,并对客户组织结构、成功的关键因素、主要的限制因素、事项、风

险和由数据仓库系统带来的好处进行评估。此外,还完成对高层的技术实现结构和数据仓库

结构进行定义。

2系统定义

本阶段会明确定义增量开发过程的目标和范围,确定数据源和数据质量控制范围,以及在已

确定的解决方案实施范围内确定技术结构和数据仓库结构。

此外,在本阶段还需建立在数据获取、数据质量控制、数据仓库管理、元数据管理、数据访

问和培训等方面的策略性方案。

3系统分析

在本阶段中,在已确定的解决方案实施范围内,明确详细的业务需求,包括建立逻辑模型、

收集源于源数据的详细需求,以及最终用户对数据的访问需求。

在系统分析阶段,确定数据获取方案,包括从源系统中抽取什么数据,以及数据量控制、数

据校验和转换规则;确定业务数据处理周期、更新周期,以及提取、传递和装载周期;完成

源系统的分析,数据映射,源系统和目标系统的差异分析,源系统的变化,以及数据获取工

具的选择。

此外,建立与企业技术结构相吻合的用于增量实施的技术结构,它是以支持增量实施的硬件、

软件、数据访问工具、网络、备份与恢复等方面为基础的。同时,对用于数据访问、数据质

量控制、数据仓库管理和元数据管理等数据仓库解决方案中各部分的工具进行评估和选择。

4系统设计

本阶段的目标是使用在系统分析阶段确定的信息建立满足需求的详细技术定义。包括数据获

取和装载模块的设计,数据元素、数据汇总层次的验证,数据一致性的检查,元数据的定义,

对数据访问和查询、编制报表等部分的详细定义。

此外,详细定义逻辑模型、数据需求、来自系统分析阶段的数据映射,以及关系型、多维数

据和元数据库对象的物理结构设计。

系统设计阶段还完成平台配置,制定测试方案,编制用户使用和技术参考手册、培训资料,

以及制定系统上线策略。

5系统建立

本阶段依据系统设计阶段的方案,完成数据仓库系统各组成部分的建立,包括数据库、数据

获取模块和数据访问机制;构造数据抽取、转换、装载、更新和集成模块;安装数据访问工

具,并于数据对象集成;构造查询、编制报表。

此外,制定测试计划,准备测试环境;完成模块的独立和集成测试,系统正确性测试,系统

性能测试。

6系统应用

本阶段完成数据仓库解决方案的安装,让用户具备使用和管理系统的能力,把系统移植到产

品环境中。

7系统维护

本阶段完成对前一阶段实施的评估和回顾,为下一阶段的实施做好准备。

3.3项目实施计划

O任务名称工期

1心田系统开发环境搭建与调试(含产品与数据)2工作日?

7移1国系统技术单元调试与技术路线确定!26工作日?

15E需求分析与数据仓库逻辑设计32工作日?

16需求的业务分析25工作日?

17数据仓库模型设计所需的输入信息的获得12工作日?

18指标与维度分析8工作日?

19回®主题设计3工作日?

20维表设计10工作日?

21事实表设计4工作日?

22日数据仓库物理设计与实0115工作日?

23模型体系规划3工作日?

24回口接口数据模型的实现7工作日?

25回口星型模型的实现8工作日?

26日ETLJF发36工作日?

国27ETL总体设计9工作日?

矍28ET®批量处理设计5工作日?

29ET迎量处理设计7工作日?

30国£1年流程开发28工作日?

34日报表开发36工作日?

35创建框架对象25工作日?

36创建报表23工作日?

37

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论