数据仓库的构建及其多维数据集分析_第1页
数据仓库的构建及其多维数据集分析_第2页
数据仓库的构建及其多维数据集分析_第3页
数据仓库的构建及其多维数据集分析_第4页
数据仓库的构建及其多维数据集分析_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、科技广场 2007.6208入 (Import 、 导出 (Export 以及转换的服务。 DTS 中最常 用的两大工具是DTS向导和 DTS设计器, 因为本文涉及的数 据转换是由多个表取得数据并转换至目的数据库, 因此选择 DTS设计器。将Northwind数据库中的数据转移到数据仓库的目的数 据库中, 遵循以下步骤:设置数据源;设置数据目的地; 设置转换方式;将数据转移任务存储为一个包;执行包 进行实际数据转移。在正式进行数据转换之前, 首先要为Northwind的数据 仓库新建一个数据库Northwind_DW, 这样数据源和数据目的 地分别为数据库Northwind和 Northwin

2、d_DW。 然后激活DTS 设计器并创建转移数据包NorthwindToNorthwind_DW。 接下来便可以进行事实表和维度表的数据转换任务了, 这个过程是将源数据库中的某些表中的字段抽取出来, 进行 相应的组合和转换, 生成目的数据库中的事实表或维度表, 这些工作都可用SQL语句及VB转换脚本语句来完成。 以事实 表 Sales 为例, 在其转换数据任务属性中, 对应的 SQL 语句 如下:SELECTe.EmployeeID,p.ProductID,s.SupplierID,c. CustomerID,o.OrderDate,od.Quantity,od.UnitPrice,od. D

3、iscountFROMOrderso,OrderDetailsod,Employeese, Productsp,Supplierss,CustomerscWHEREo.OrderID=od.OrderIDANDo.EmployeeID=e. EmployeeIDANDo.CustomerID=c.CustomerIDANDod. ProductID=p.ProductIDANDp.SupplierID=s.SupplierID 除了以上抽取出的字段外, 事实表Sales还包含一个度 量值字段Total, 是将已抽取出的字段UnitPrice、 Discount、 Quantity进行组合转换而

4、成, 对应的VB转换脚本语句如下 : FunctionMain(DTSDestination("Total"=DTSSource("UnitPrice" *D T S S o u r c e (" Q u a n t i t y " *(1. 0-D T S S o u r c e ("Discount"Main=DTSTransformStat_OKEndFunction员工维度表Employee数据转换方法同事实表数据转换方 法, 其它维度表数据转换更容易, 方法基本相同, 只是在进 行转换选项时, 不需要选择

5、新建选项。至此, 数据转换包设计完毕, 保存并执行, 便将数据由 Northwind数据库加载到Northwind_DW中。 最后进行设置表 的主键和外键工作。3多维数据集分析在分析数据时, 用户往往并不是以单一的维度为基准, 而是以多个维度为依据。 譬如在Northwind的数据仓库中包 括了员工、 顾客、 产品、 供货商以及时间等 5个维度, 就会 经常有查询某供应商于某年提供了多少金额的某产品或查询 某员工于某年销售了多少金额的产品给某顾客等这类查询。 正因为用户查询具有使用多重维度的特点, 所以应该将多个 维度集合在一起成为一个单位, 即构成一个多维数据集。 微软公司在SQLServe

6、r2000上提供了AnalysisSer- vices 5,是数据仓库的解决方案,其主要组件是分析服务器AnalysisServer, 它是执行于 Windows2000或WindowsNT服务器上的一个服务, 会由数据仓库中抽取信息, 并且生成多维数据集 6。激活管理分析服务器的工具AnalysisManager, 创建一个存储多维数据集的数据库Northwind_OLAP, 设置数据源为前面已创建好的数据库Northwind_DW, 然后按以下步骤创建多维数据集:从数据源中选择事实数据表Sales。从事实表中选取字段 Total、 Quantity、 UnitPrice、 Discount

7、作为多维数据集度量值。创建星型架构维度。 从数据源中分别选择与Sales表呈星型架构的维度表Customer、 Supplier、 Employee、 Time创建顾客维度、 供货商维度、 员工维度和时间维度, 其中顾客维度包括Country、 Region、 City和CustomerName四个级别, 前者为父级别, 后者为子级别;供货商维度和员工维度包括的级别分别为SupplierName和Name;时间维度级别选择【年,季度,月】 。创建雪花架构维度。从数据源中同时选中维度表 Product和Category创建与Sales事实表呈雪花架构的产品维度, 维度级别包括CategoryNa

8、me和ProductName, 前者为父级别, 后者为子级别。创建好所有的维度后, 将多维数据集命名为CUBE5并存储处理,即可浏览数据了,如图二所示。4结束语在进行数据仓库项目开发过程中, 数据的抽取转换工作是重点, 直接关系到数据仓库中数据的好坏, 而如何访问数据仓库中的数据也是用户所关心的问题, 本文以SQLServer2000中的Northwind数据库为模板, 探讨了一个商用数据仓库的创建以及对其进行多维数据集分析的一般过程。 如何对已有的数据仓库采用适当的算法进行数据挖掘, 为高层领导提供有用的决策信息, 是笔者下一步要研究的方向。参考文献1InmonWH.BuildingtheDataWarehouseM.USA:ByWileyComputerPublishing,JohnWiley&Sons,Inc.1998.2李超, 余昭平.基于最大模式的关联规则挖掘算法研究J.微计算机信息,2006, (22:2-3.3罗会兰.数据提取、 转换和装载技术研究J.计算机工程与设计,2004, (255:761-765.4郭和伟,孙德宝等.数据仓库实现过程及在线分析J.计算机与应用化学,2004, (212:293-298.5沈兆阳.SQLServer2000OLAP解决方案:数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论