(2021年整理)数据仓库应用实验_第1页
(2021年整理)数据仓库应用实验_第2页
(2021年整理)数据仓库应用实验_第3页
(2021年整理)数据仓库应用实验_第4页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据仓库应用实验数据仓库应用实验 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(数据仓库应用实验)的内容能够给您的工作和学习带来便利。同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快 业绩进步,以下为数据仓库应用实验的全部内容。数据仓库应用实验analysis service的安装与启动为了使用sql server 2000的数据仓库进行在线数据分析,除了安装数据库服务器外,

2、还必须安装analysis service。1.安装下载提供的“analysis service”压缩包,解压后,双击“autorun”,依次单击“sql server 2000 组件”“安装analysis service。2。启动单击“开始”“程序”“microsoft sql server”“analysis service”,即可进入analysis manager的工作界面。一、使用sql server创建数据仓库在sql server 2000中,创建数据仓库(多维数据集)的总体步骤包括:设置odbc数据源、建立数据库、建立数据库与odbc数据源的连接、建立多维数据集、编辑多维数据

3、集、设计存储和处理多维数据集。(一)设置odbc数据源microsoft sql server 2000的analysis service提供了一个样本数据集,存放在名为foodmart2000.mdb的access数据库中,在安装时已经自动建立了数据源。如果是用户自己建立的数据集,则在开始使用analysis manager之前,必须先在odbc数据源管理器中设置相应的系统数据源,以便analysis service能够通过系统数据源与源数据连接,从而进行联机分析处理。如果源数据本身就存放在sql server中的,则不需要本过程。以样本数据集foodmart2000。mdb为例,设置系统数

4、据源的方法:(1)进入数据源管理器对于windows nt4.0的用户:单击“开始”“设置”“控制面板”-双击“数据源(odbc);对于windows 2000 的用户:单击“开始”“设置”-“控制面板”双击“管理工具”双击“数据源(odbc)”.(2)在“系统dsn”选项卡上单击“添加”按钮(3)选择相应的驱动程序,本例为“microsoft access driver(.mdb)”,单击“完成,弹出新的对话框。(4)在“数据源名框中输入用户自定义的数据源名称,此处为“footmart2000”,然后在“数据库”下单击“选择”.(5)在“选择数据库”对话框中浏览到“c:program fil

5、esmicrosoft analysis servicessamples”,然后单击“foodmart2000.mdb,单击“确定”。(假定analysis services的安装目录为c:program filesmicrosoft analysis services).(6)单击“确定”,在“odbc数据源管理器”对话框中再一次单击“确定”,完成数据源的设置。(二)建立数据库在设计多维数据集前,需要建立一个数据库结构,该数据库是存放多维数据集、角色、数据源、共享维度和挖掘模型的一种结构.然后和早期在odbc数据源管理器中建立的数据源连接.具体操作:(1)在analysis manager树

6、视图中展开“analysis services”;(2)单击服务器名称,即可建立与“analysis services的连接;(3)右击服务器名称,然后单击“新建数据库”命令;(4)在“数据库”对话框中的“数据库名称”框中,输入要建立的数据库的名称,如sample,然后单击“确定”;(5)在analysis manager树视图中展开服务器,然后展开刚才创建的“sample数据库,此时可看到该数据库包括项目:数据源、多维数据集、共享维度、挖掘模型、数据库角色。(三)建立数据库与odbc数据源的连接将数据源与前面建立的odbc数据源中的数据连接,必须在analysis manager中建立一个数

7、据源,通过它将数据库连接到在odbc数据源管理器中建立的系统数据源名称上。以后多维数据集中的数据都将来自这个数据源。在analysis manager中建立数据源的步骤:(1)在analysis manager树视图中,右击“sample”数据库下的“数据源”文件夹,然后单击“新建数据源”;(2)在“数据连接属性”对话框中,单击“提供者”单击“microsoft ole db provider for odbc drivers”;(3)单击“连接”选项卡,从“使用数据源名称”列表中单击“foodmart2000”单击“测试连接”,连接成功,单击“确定”,关闭“数据链接属性”对话框。(四)建立多

8、维数据集多维数据集是数据仓库多维数据模型的具体形式,由维度和度量值的集合构成。多维数据模型可简化联机业务分析,提高查询性能.通过创建多维数据集,analysis manager可将存储在关系数据库中的数据转换为具有实际含义并且易于查询的业务信息。管理数据库进行多维使用的最常用方式是使用星型模型。例如:样本数据库中的数据来源于一家大型的连锁店foodmart。市场部想要按产品和顾客两个方面来分析1998年进行的所有销售业务数据.使用存储在公司数据仓库中的数据建立多维数据集,可以使市场分析人员查询数据库时获取快速的响应.多维数据集可以使用多维数据集向导来建立:(1)启用向导在analysis ma

9、nager树视图中“sample数据库下,右击“多维数据集”“新建多维数据集“向导”。(2)建立事实表事实表中包含各种度量值,按以下步骤建立事实表,增加度量值。根据上一步打开的“多维数据集向导”窗口,在“从数据源中选择事实数据表”步骤,展开“footmart2000”数据源,然后单击“sales_face_1998“浏览数据-浏览完后,关闭“浏览数据窗口”-“下一步”在“事实数据表数据列下,选择销售金额(storesales)、销售成本(storecost)和销售数量(unit_sales)为多维数据集度量值“下一步。(3)建立时间维度表在向导“选择多维数据集的维度”步骤中,单击“新建维度”命

10、令在维度向导的“欢迎步骤,单击“下一步”选择“星型架构:单个维度表”-“下一步”单击“time_by_day”“下一步”-选择“时间维度”“下一步选择时间级别中的“年、季度、月”“下一步”-“下一步-在维度名称中输入“time”-“完成”,此时可以在“多维数据集维度”列表中看到“time”维度。(4)建立产品维度同前操作,单击“新建维度命令“下一步”选“雪花构架:多个相关维度表”“下一步将“product”和“product_class”添加到“选定的表中“下一步”“下一步”-将“product_category(产品类)、product_subcategory(产品子类)和brand_nam

11、e(品牌)”添加到“维度级别”中“下一步“下一步”在维度名称框中输入“product”“完成,此时在“多维数据集维度”列表中看到“product维度.(5)建立客户维度同上(4),单击“新建维度”命令-“下一步选“星型构架:单个维度表”“下一步”单击“customer-“下一步“下一步”将“coutry、state_province、city和lname”添加到“维度级别”中“下一步”-“下一步” “下一步”在维度名称框中输入“customer”“完成,此时在“多维数据集维度”列表中看到“customer”维度。(6)建立商店维度同上(4),单击“新建维度”命令“下一步”选“星型构架:单个维度

12、表“下一步”单击“store“下一步”“下一步”将“store_ coutry、store_state、store_city和store_name”添加到“维度级别中“下一步”-“下一步” “下一步在维度名称框中输入“store”“完成”,此时在“多维数据集维度”列表中看到“store维度。(7)生成多维数据集在建立四个维度之后在多维数据集向导中,单击“下一步”,在“事实数据表行数提示对话框出现时,单击“是”,在出现的对话框中将多维数据集命名为“sales,单击“完成”。向导关闭之后,随之启动多维数据集编辑器。(五)编辑多维数据集多维数据集创建之后,仍然可以使用多维数据集编辑器对现有多维数据集

13、进行更改,包括删除、添加维度,新建、删除度量值等。假定添加一个新维度以提供有关产品促销的数据,则步骤如下:在多维数据集编辑器中,在“插入”菜单上单击“表”命令在“选择表对话框中,单击“promotion”表单击“添加”-单击“关闭”双击“promotion”表中的“promotin_name”列,打开“映射列”对话框选择“维度”选项单击“确定”,则树视图中出现了一个新的维度“promotion name”右击“promotion name”,将其重命名为“promotion。(备注:此种方法生成的维度默认为专用维度,即只能用于当前所处理的多维数据集。)(六)设计存储和处理多维数据集micros

14、oft sql server 2000 analysis service支持三种存储模式,即molap、rolap或holap。analysis service允许设置聚合,即预先计算好的汇总数据,利用这些数据可以极大地提高查询效率,缩短查询的响应时间。选择molap作为存储模式,创建sales多维数据集的聚合设计,然后处理该多维数据集。处理sales多维数据集将从odbc数据源中装载数据并按照聚合设计中的定义计算汇总值。在多维数据编辑器窗口中,选择“工具”菜单中的“设计存储,弹出向导“下一步”选择“molap”“下一步”选择“性能提升达到”选项,并填写“40%单击“开始完成设计聚合的进程之后

15、,单击“下一步”选择“立即处理”单击“完成处理完之后,单击“关闭”,返回analysis manager。二、使用sql server进行联机分析经过前面的处理后,可以对多维数据集中的数据进行分析处理了.分析工作使用多维数据集浏览器来完成。可以用不同的方式查看数据,如筛选出可见的维度数据量(切片/切块),可以下钻查看数据的细节,也可以上钻查看较为概括的数据等等.如何使用多维数据集浏览器对sales多维数据集进行各种分析操作。(一)启动或关闭多维浏览器在analysis manager树视图中,右击“sales多维数据集-单击“浏览数据”启动多维数据集浏览器。单击下方的“关闭”,即可关闭多维数据

16、集浏览器。浏览器中显示了由多维数据集的一个维度和度量值组成的网格,其他四个维度显示在浏览器的上方.(二)替换网格中的维度(旋转)要用另一个维度替换网格中的维度,拖动上方框中的维度到网格中要与其交换的维度列上,当鼠标指针的形状为双向箭头时,松开鼠标即可。如果想要将维度添加到网格中,而不是与另一个维度进行替换,则将该维度拖动到网格的中间即可。(三)筛选数据(切片/切块)通过在维度框中选择相应的维度值,即可筛选出相应的数据.(四)如何深化或浅化观察数据(下钻/上钻)双击前面带“+”号的维度成员,则其下级维度成员被“展开”,从而可以观察到更详细的数据,这叫“深化”(下钻);双击前面带“”号的维度成员,则其下级维度成员被“折叠”,观察到的是更概括的数据,这叫“浅化(上钻)。(五)创建和使用计算成员(不要求)可以将多维数据集数据、算术

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论