数据仓库的构建及其多维数据集分析._第1页
数据仓库的构建及其多维数据集分析._第2页
数据仓库的构建及其多维数据集分析._第3页
数据仓库的构建及其多维数据集分析._第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、科技广场2007.6208入 (Import 、 导出 (Export 以及转换的服务。 DTS 中最常 用的两大工具是 DTS向导和 DTS设计器, 因为本文涉及的数 据转换是由多个表取得数据并转换至 目的数据库 , 因此选择 DTS设计器。将 Northwind 数据库中的数据转移到数据仓库的目的数 据库中 , 遵循以下步 骤:设置数据源 ;设置数据目的地 ; 设置转换方式 ;将数据转移任务存储为一 个包 ;执行包 进行实际数据转移。在正式进行数据转换之前 , 首先要为 Northwind 的数据 仓库新建一个数据库 Northwind_DW, 这样数据源和数据目的 地分别为数据库 Nor

2、thwind 和 Northwind_DW 。 然后激活 DTS 设计器并创建转移数据包 NorthwindToNorthwind_DW 。 接下来便可以进行事实表和维度表的数据转换任务 了, 这个过程是将源数据库中的某些表中的字段抽取出来 , 进行 相应的组合和转换 生成目的数据库中的事实表或维度表 , 这些工作都可用 SQL 语句及 VB 转换脚本语 句来完成。 以事实 表 Sales 为例, 在其转换数据任务属性中 , 对应的 SQL 语句 如下:SELECT e.EmployeeID,p.ProductID,s.SupplierID,c.CustomerID,o.OrderDate,o

3、d.Quantity,od.UnitPrice,od. DiscountFROM Orders o,Order Details od,Employees e, Products p,Suppliers s,Customers cWHERE o.OrderID=od.OrderID AND o.EmployeeID=e. EmployeeID AND o.CustomerID=c.CustomerID AND od. ProductID=p.ProductID AND p.SupplierID=s.SupplierID 除了以上抽取出的字段外 , 事实表 Sales还包含一个度 量 值字段 To

4、tal, 是将已抽取出的字段 UnitPrice、 Discount、 Quantity 进行组合转换而 成, 对应的 VB 转换脚本语句如下 : Function Main(DTSDestination("Total"=DTSSource("UnitPrice" *D T S S o u r c e (" Q u a n t i t y " *(1. 0-D T S S o u r c e ("Discount"Main=DTSTransformStat_OKEnd Function员工维度表 Employee数

5、据转换方法同事实表数据转换方 法, 其它维度表数据 转换更容易 , 方法基本相同 , 只是在进 行转换选项时 , 不需要选择新建选项。至此, 数据转换包设计完毕 , 保存并执行, 便将数据由 Northwind 数据库加载到 Northwind_DW 中。 最后进行设置表 的主键和外键工作。3多维数据集分析在分析数据时 , 用户往往并不是以单一的维度为基准 , 而是以多个维度为依据。 譬如在 Northwind 的数据仓库中包 括了员工、 顾客、 产品、 供货商以及时间等 5 个维度, 就会 经常有查询某供应商于某年提供了多少金额的某产品或查询某员工于 某年销售了多少金额的产品给某顾客等这类查

6、询。 正因为用户查询具有使用多重 维度的特点 , 所以应该将多个 维度集合在一起成为一个单位 , 即构成一个多维数据 集。 微软公司在 SQL Server 2000上提供了 Analysis Ser- vices 5,是数据仓库 的解决方案 ,其主要组件是分析服务器 Analysis Server, 它是执行于 Windows 2000 或 WindowsNT 服务器上的一个服务 , 会由数据仓库中抽取信息 , 并且生成多维数据集 6 。激活管理分析服务器的工具 Analysis Manager, 创建一个存储多维数据集的数据库 Northwind_OLAP, 设置数据源为前面已创建好的数据

7、库 Northwind_DW, 然后按以下步骤创建多维数据集 : 从数据源中选择事实数据表 Sales。 从事实表中选取字段 Total、 Quantity、 UnitPrice、 Discount 作为多维数据 集度量值。 创建星型架构维度。 从数据源中分别选择与 Sales表呈星型架构的维度表 Customer、 Supplier、 Employee、 Time创建顾客维度、 供货商维度、 员工维度和时间维度 , 其中顾客维度包括 Country、 Region、 City 和 CustomerName四个级别, 前者为父级别 , 后者为子级别 ; 供货商维度和员工维度包括的级别分别为 S

8、upplierName 和 Name; 时间维度级别选择【年,季度,月】 创建雪花架构维度。从数据源中同时选中维度表 Product和 Category 创建与 Sales事实表呈雪花架构的产品维度, 维度级别包括 Category Name和 Product Name, 前者为父级别, 后者为子级别。创建好所有的维度后 , 将多维数据集命名为 CUBE5 并存储处理 ,即可浏览数据了 ,如图二所示。4 结束语在进行数据仓库项目开发过程中 , 数据的抽取转换工作是重点, 直接关系到数据仓库中数据的好坏 , 而如何访问数 据仓库中的数据也是用户所关心的问题 , 本文以 SQL Server 20

9、00中的 Northwind 数据库为模板 , 探讨了一个商用数据仓 库的创建以及对其进行多维数据集分析的一般过程。 如何对 已有的数据仓库采用适当的算法进行数据挖掘 , 为高层领导 提供有用的决策信息 , 是笔者下一步要研究的方向。参考文献1 Inmon WH. Building the Data WarehouseM. USA:By Wiley Computer Publishing,John Wiley&Sons,Inc. 1998.2 李超, 余昭平.基于最大模式的关联规则挖掘算法研究J.微计算机信息 ,2006, (22:2-3.3 罗会兰 .数据提取、 转换和装载技术研究 J.计算机 工程与设计 ,2004, (255:761-765.4 郭和伟,孙德宝等 .数据仓库实现过程及在线分析J.计算机与应用化学 ,2004, (212:293-298.5 沈兆阳. SQL Server 2000

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论