数据仓库应用实验_第1页
数据仓库应用实验_第2页
数据仓库应用实验_第3页
数据仓库应用实验_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据仓库应用实验Analysis Service 的安装与启动 为了使用 SQL Server 2000 的数据仓库进行在线数据分析,除了安装数据库服务器外,还必须安装 Analysis Service 。1. 安装安装 Analysis Service ”。下载提供的“Analysis Service ”压缩包,解压后,双击autorun”,依次单击“SQL Server 2000 组件”程序” “ Microsoft SQL Server ” “ Analysis Service ”,即可进入 Analysis Manager2. 启动 单击“开始” 的工作界面。、使用SQL Server

2、 创建数据仓库在 SQL Server 2000 中,创建数据仓库 (多维数据集 )的总体步骤包括:设置 ODBC 数据 源、建立数据库、建立数据库与 ODBC 数据源的连接、建立多维数据集、编辑多维数据集、 设计存储和处理多维数据集。(一 )设置 ODBC 数据源Microsoft SQL Server 2000 的 Analysis Service 提供了一个样本数据集,存放在名为 foodmart2000.mdb 的 ACCESS 数据库中,在安装时已经自动建立了数据源。如果是用户自 己建立的数据集,则在开始使用 Analysis Manager 之前,必须先在 ODBC 数据源管理器中

3、 设置相应的系统数据源,以便 Analysis Service 能够通过系统数据源与源数据连接,从而进 行联机分析处理。如果源数据本身就存放在 SQL Server 中的,则不需要本过程。以样本数据集 foodmart2000.mdb 为例,设置系统数据源的方法:(1) 进入数据源管理器对于 Windows NT4.0 的用户:单击“开始”“设置”“控制面板”双击“数据源(ODBC) ”;对于 Windows 2000 的用户:单击“开始”“设置”“控制面板”双击“管理工 具”双击“数据源 (ODBC) ”。(2) 在“系统 DSN ”选项卡上单击“添加”按钮(3) 选择相应的驱动程序,本例为

4、“Microsoft Access Driver(*.mdb) ”,单击“完成” ,弹出新的对话框。FootMart2000 ”,然后(4) 在“数据源名”框中输入用户自定义的数据源名称,此处为“ 在“数据库”下单击“选择” 。(5) 在 “ 选 择 数 据 库 ” 对 话 框 中 浏 览 到 “ C:Program FilesMicrosoft Analysis ServicesSamples,然后单击FoodMart2000.mdb ”,单击确定”。(假定 Analysis Services 的安装目录为 C:Program FilesMicrosoft Analysis Services

5、) 。(6) 单击“确定” ,在“ ODBC 数据源管理器”对话框中再一次单击“确定” ,完成数据 源的设置。(二)建立数据库 在设计多维数据集前,需要建立一个数据库结构,该数据库是存放多维数据集、角色、 数据源、共享维度和挖掘模型的一种结构。然后和早期在 ODBC 数据源管理器中建立的数 据源连接。具体操作:(1) 在 Analysis Manager 树视图中展开“ Analysis Services ”;(2) 单击服务器名称,即可建立与“Analysis Services ”的连接;(3) 右击服务器名称,然后单击“新建数据库”命令;(4) 在“数据库” 对话框中的“数据库名称” 框中

6、,输入要建立的数据库的名称, 如 Sample, 然后单击“确定” ;在An alysis Ma nager树视图中展开服务器,然后展开刚才创建的“Sam pie”数据库,此时可看到该数据库包括项目:数据源、多维数据集、共享维度、挖掘模型、数据库角色。(三 )建立数据库与 ODBC 数据源的连接 将数据源与前面建立的 ODBC 数据源中的数据连接,必须在 Analysis Manager 中建立 一个数据源,通过它将数据库连接到在 ODBC 数据源管理器中建立的系统数据源名称上。 以后多维数据集中的数据都将来自这个数据源。在 Analysis Manager 中建立数据源的步骤:在Analys

7、is Manager树视图中,右击SampIe”数据库下的数据源”文件夹,然后 单击“新建数据源” ;Microsoft OLE DB Provider(2) 在“数据连接属性”对话框中,单击“提供者”单击“ for ODBC Drivers ”;(3) 单击“连接”选项卡,从“使用数据源名称”列表中单击“foodmart2000 ”一单击“测 试连接”,连接成功,单击“确定” ,关闭“数据链接属性”对话框。(四) 建立多维数据集 多维数据集是数据仓库多维数据模型的具体形式,由维度和度量值的集合构成。多维数据模型可简化联机业务分析,提高查询性能。通过创建多维数据集,Analysis Manag

8、er 可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。管理数据库进行多维使用的最常用方式是使用星型模型。例如:样本数据库中的数据来源于一家大型的连锁店FoodMart。市场部想要按产品和顾客两个方面来分析 1998 年进行的所有销售业务数据。使用存储在公司数据仓库中的数据 建立多维数据集,可以使市场分析人员查询数据库时获取快速的响应。多维数据集可以使用多维数据集向导来建立:(1) 启用向导在Analysis Manager树视图中“ SampIe”数据库下,右击“多维数据集”一“新建多维 数据集”“向导” 。(2) 建立事实表 事实表中包含各种度量值,按以下步骤建立事实表

9、,增加度量值。根据上一步打开的“多维数据集向导”窗口,在“从数据源中选择事实数据表”步骤,展开“ FootMart2000 ”数据源,然后单击“ sales_face_1998”一 “浏览数据”一浏览完后, 关闭“浏览数据窗口”一“下一步”一在“事实数据表数据列”下,选择销售金额(storesales)、销售成本(store cost)和销售数量(unit_sales)为多维数据集度量值一“下一步”。(3) 建立时间维度表 在向导“选择多维数据集的维度”步骤中,单击“新建维度”命令一在维度向导的“欢迎”步骤,单击“下一步”一选择“星型架构:单个维度表”一“下一步”一单击“ time_by_da

10、y ” 一“下一步” 一选择“时间维度” 一“下一步” 一选择时间级别中的 “年、 季度、 月” 一“下一步”一“下一步”一在维度名称中输入“ Time” 一 “完成” ,此时可以在“多维数据集维 度”列表中看到“ Time”维度。(4) 建立产品维度 同前操作,单击“新建维度”命令一“下一步”一选“雪花构架:多个相关维度表”“下一步”一将“ Product”和“Product_class”添加到“选定的表”中一“下一步”一“下 一步” 将 “ Product_category(产品类)、product_subcategory(产品子类)禾口 brand_name(品牌)” 添加到“维度级别”

11、中一“下一步”一“下一步”一在维度名称框中输入“Product” 一 “完成”,此时在“多维数据集维度”列表中看到“Product”维度。(5) 建立客户维度Coutry 、State_Province、city“下一步” 列表中看到“在维度名称Customer” 维同上 (4),单击“新建维度”命令一“下一步”一选“星型构架:单个维度表”一“下 一步”一单击“ Customer” 一“下一步”一“下一步”一将“ 和lname”添加到“维度级别”中一“下一步”一“下一步” 框中输入“ Customer” 一 “完成” ,此时在“多维数据集维度” 度。“下 state、store city(6)

12、 建立商店维度同上 (4),单击“新建维度”命令一 “下一步” 一选“星型构架:单个维度表” 一步”一单击Store” 一“下一步”一“下一步”一将 store_ coutry、store 和store_name”添加到“维度级别”中一“下一步”一“下一步”一“下一步”一在维度名称框中输入“ Store”一 “完成”,此时在“多维数据集维度”列表中看到“Store”维度。(7) 生成多维数据集 在建立四个维度之后在多维数据集向导中,单击“下一步” ,在“事实数据表行数”提示对话框出现时,单击“是”,在出现的对话框中将多维数据集命名为“Sales”,单击“完成”。向导关闭之后,随之启动 多维数据

13、集编辑器 。(五) 编辑多维数据集 多维数据集创建之后,仍然可以使用多维数据集编辑器对现有多维数据集进行更改, 包括删除、添加维度,新建、删除度量值等。假定添加一个新维度以提供有关产品促销的数据,则步骤如下: 在多维数据集编辑器中,在“插入”菜单上单击“表”命令在“选择表”对话框中,单击Pro moti on ”表一单击 添加” 一单击 关闭” 一双击 “ pro moti on ”表中的“ pro mot in_n ame ” 列,打开“映射列”对话框选择“维度”选项单击“确定”,则树视图中出现了一个新的维度“ Promotion Name ”一右击“ Promotion Name ”,将其

14、重命名为“ Promotion ”。(备注: 此种方法生成的维度默认为专用维度,即只能用于当前所处理的多维数据集。)(六) 设计存储和处理多维数据集Microsoft SQL Server 2000 Analysis Service 支持三种存储模式,即 MOLAP 、 ROLAP 或 HOLAP 。 Analysis Service 允许设置聚合,即预先计算好的汇总数据,利用这些数据可以极 大地提高查询效率,缩短查询的响应时间。选择MOLAP作为存储模式,创建 Sales多维数据集的聚合设计,然后处理该多维数据 集。处理Sales多维数据集将从ODBC数据源中装载数据并按照聚合设计中的定义计

15、算汇总 值。在多维数据编辑器窗口中,选择“工具”菜单中的“设计存储” ,弹出向导“下一步” 选择“ MOLAP ”“下一步”选择“性能提升达到”选项,并填写“40%” 单击“开始”完成设计聚合的进程之后,单击“下一步”选择“立即处理”单击“完成” 处理完之后,单击“关闭” ,返回 Analysis Manager 。二、使用 SQL Server 进行联机分析经过前面的处理后, 可以对多维数据集中的数据进行分析处理了。 分析工作使用多维数 据集浏览器来完成。可以用不同的方式查看数据,如筛选出可见的维度数据量(切片/切块 ),可以下钻查看数据的细节,也可以上钻查看较为概括的数据等等。如何使用多维

16、数据集浏览器对 Sales 多维数据集进行各种分析操作。(一)启动或关闭多维浏览器在Analysis Manager树视图中,右击“ Sales”多维数据集一单击“浏览数据”启动多维 数据集浏览器。单击下方的“关闭” ,即可关闭多维数据集浏览器。浏览器中显示了由多维数据集的一个维度和度量值组成的网格,其他四个维度显示在浏览器的上方。而不(二)替换网格中的维度 (旋转 ) 要用另一个维度替换网格中的维度, 拖动上方框中的维度到网格中要与其交换的维度列 上,当鼠标指针的形状为双向箭头时,松开鼠标即可。如果想要将维度添加到网格中, 是与另一个维度进行替换,则将该维度拖动到网格的中间即可。(三)筛选数据 (切片/切块 ) 通过在维度框中选择相应的维度值,即可筛选出相应的数据。(四)如何深化或浅化观察数据 (下钻/上钻 )双击前面带“ +”号的维度成员,则其下级维度成员被“展开”,从而可以观察到更详(上钻)。细的数据, 这叫“深化” (下钻);双击前面带 “” 号的维度成员, 则其下级维度成员被 “折 叠”,观察到的是更概括的数据,这叫“浅化”/或函数组合起来创建自定义的度量值或 使用计算成员可以将原始数据建模为有意 计算成员的数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论