数据仓库复习重点_第1页
数据仓库复习重点_第2页
数据仓库复习重点_第3页
数据仓库复习重点_第4页
数据仓库复习重点_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据仓库的用途(数据仓库与事务性数据库的区别)事务性数据库帮助人们执行活动,数据仓库帮助人们制定计划事务性数据库侧重于细节,数据仓库侧重于高层次的聚合事务性数据库通常为特定的应用程序而设计,而数据仓库集成了不同源头的数据事务性数据库关心的是现在,数据仓库关心的是随时间变化的活动事务性数据库是易变的,数据仓库是稳定的事务性数据库必须能够对详细信息快速获取或更新,数据仓库必须能够对高度汇总的信息 快速获取。事实表:在多维数据仓库中,保存度量值的详细值或事实的表。度量值:在数据仓库中,用来监视业务的可以汇总的数值。成员:维度中的项目称为维度的成员主键列:数据库维度表中的一个列,它包含的值唯一地表示每

2、行数据。主键列在维度表。外键列数据库表中的一个列,某个其他数据库表的主键列的每个值都可能在其中出现多次。雪花型设计:一种数据库布局,其中维度的属性被保存在单独的(规范化的)表中。星型设计一种数据库布局,其中维度的多个属性被冗余地保存在单个(反规范化的)维度表中第2章:计算成员:一种使用比存储在多维数据集中更复杂的公式来聚合度量值的机制多维数据集:一个或多个度量值组以及它们相关的维度的集合度量值组单个事实表中明细数值的概念容器,附带一个或多个维度层次结构的所有可能聚合第3章由顶至底开发方法即是首先要创建一个没有数据源的多维数据集,然后再生成关系架构并加载数据源商业智能开发平台Visual Stu

3、dio中的商业智能设计器称为商业智能开发工作台。在BIDS环境中,可以创建为高 性能分析组织数据的分析服务项目,可以创建为分析服务项目准备和加载数据的集成服务 包,还可以创建把分析结果呈现给业务用户社区的报表服务报表。SQL Server管理工作台对生产数据库进行常规维护工作一一例如处理数据库项目分析服务项目(主要构成)主要构成:“数据源”、“数据源视图”、“多维数据集”、“维度”、“挖掘结构”、“角 色”、“程序集”和“其他”。第4章:由底至顶开发方法即是首先添加数据源,接着创建数据源视图,然后使用维度向导创建维度的初始结构,最后 创建多维数据集角色共享维度同一维度可以在事实表中担任不同的角

4、色,当事实表中多个外键连接到同一个维度表时,可 以认为该维度是一个角色共享维度。(向多维数据集中添加角色共享维度:确保在事实表和维度表之间定义了多个关系。通过维 度向导创建维度,打开多维数据集设计器,右击“多维数据集结构”选项卡上“维度”窗格 的背景,单击“添加多维数据集维度”,单击列表中的维度,然后单击“确定”按钮)父子维度父子维度是指构建一个包含一个内置的递归层次结构的表,可以使用这个层次结构中的每个 分支的所有级别来聚合数值。(手工创建父子维度:遵循创建标准维度的过程,在维度向导“定义父子关系”页面选中“这 个维度的属性中含有父子关系”复选框,最后指定父属性键)第5章:度量值组(重命名度

5、量值组:在多维数据集设计器的“多维数据集结构”选项卡中,右击度量值组, 然后选择“重命名”,或在属性窗口中更改Name属性;向已有的多维数据集添加度量值组: 在多维数据集设计器的“多维数据集结构”选项卡中,右击“度量值”窗格的任何区域,选 择“新建度量值”,然后选择相应的事实表)粒度属性当关系类型为常规时,必须指定一个粒度属性,它是表示事实表中对应最低粒度明细信息的 维度属性。半累加性度量值半累加性度量值只能按照多维数据集中部分维度进行累加,而不是全部。通常用于固定时间 点数值(也称为快照)。(把半累加性度量值添加到多维数据集时,不管是通过多维数据集 向导还是通过多维数据集设计器手工添加的,都

6、要更改它的默认聚合行为)无重复计数度量值无重复计数度量值返回事实表中唯一成员的计数。必须包含在单独的度量值组中。(添加无重复计数器度量值:在多维数据集设计器的“多维数据集结构”选项卡中,右击“度 量值”窗格的任何区域,单击“新建度量值”,从“用法”下拉列表中选择“无重复计数”, 然后从“源表”下拉列表中选择事实表,然后单击源列。)第6章:一元操作符加法为+,减法为一,乘法为*,除法为/,表示不对成员进行聚合。这些代码称为一元操 作符。第7章:聚合设计因为要避免数据爆炸,方法就是避免把聚合数据都存储起来,在需要的时候再计算它们。而且,对于大型的多维数据集,聚合会对查询速度产生巨大的影响,帮助分析

7、服务快速地 响应查询。不需要存储多维数据集所有可能的聚合值。分析服务可以使用已有的聚合尽快地计算出需 要的数值。聚合值:聚合值是从多维数据集中获取的单个总计值。聚合聚合包含了多维数据集中一个属性层次结构与所有其他层次结构所有可能的组合。是累加性 度量值预先计算好的总计值。层次结构第8章:MDX查询式的写法(8.2)SelectCrossJoin(Time.CalendarYear.All.Children,Measures.ResellerSalesAmount,Measures.ResellerOrderQuantityonColumns, Product.ProductCategory.C

8、ategory.&1,Product.ProductCategory.Category.&1.CHILDRENonRowsFromSSAS计算的次序关键性能指标关键性能指标KPI度量的是业务为满足其目标所进行的过程。对于每个KPI,需要为KPI的 数值、目标、当前状态和走向创建表达式。目标表达式:定义业务目标。状态表达式:定义怎样比较值与目标。走向表达式:用来比较当前状态数值与前一个时间点状态的数值。第9章:引用关系(创建引用维度:使用维度向导创建一个新维度。这个维度必须关联到另一个维度表,而后 者必须关联到一个事实表。在多维数据集设计器的“多维数据集结构”窗格添加这个新维度。 在多维数据集设

9、计器的“维度用法”窗格,单击新维度与某个度量值组的交叉点,在“选择 关系类型”下拉列表中选择“被引用”,在“维度”列表框中选择关联维度,最后在“维度 属性”和“中间维度属性”下拉列表中选择相应的键列)多对多关系维度表中的多个成员与事实表中的多条记录相对应,这种类型的关系称为多对多关系。(定义多对多关系:使用维度向导创建两个维度,每个都与一个事实表相关,这些事实表必 须是存储第一个维度中多个成员与第二个维度中多个成员映射关系的中间事实表。其中一个 维度要关联到一个主事实表。在“多维数据集结构”选项卡为每个事实表逐一创建度量值组, 并添加这两个新维度。在多维数据集设计器的“维度用法”选项卡,单击关

10、联到主事实表的 维度与此事实表对应度量值组的交叉点,在“选择关系类型”下拉列表中选择“常规”,然 后在“度量值组列”列表框选择相应的列值。在“维度用法”选项卡中单击另一个维度与中 间度量值组的交叉点第10章:标准操作、钻取操作、数据集写回数据仓库是一个用以支持企业或组织的决策分析处理的、面向主题的、集成的、不可更新的、 随时间不断变化的数据集合。数据仓库有四个基本特征:数据仓库的数据是面向主题的;数 据仓库的数据是集成的;数据仓库的数据是不可更新的;数据仓库的数据是随时间不断变 变化的。数据仓库的开发模式自顶向下的模式自底向上的模式“”的方法:数据集市和数据仓库的关系是单方向的,即数据从数据仓

11、库流向数据集市。建立全局数据仓库,建设规模往往较大,建设周期长,投资大。在全局数据仓库建立好 后,随着使用数据仓库的部门增多,对数据仓库资源的竞争将成为企业所面临的一个难题。“自底向上”模式“自底向上”模式是从建立各个部门或特定的商业问题的数据集市开始,全局性数据仓库建立 在这些数据集市的基础上。“自底向上”模式的特点是初期投资少,见效快,因为它在建立部 门数据集市时只需要较少的人做决策,解决的是较小的商业问题。“自底向上”的开发模式可 以使一个单位在数据仓库发展初期尽可能少地花费资金,也可以在做出有效的投入之前评估 技术的收益情况。“平行开发”模式“平行开发”模式是指在一个全局性数据仓库的数

12、据模型的指导下,数据集市的建立和全局性 数据仓库的建立同时进行。在“平行开发”模式中由于数据集市的建立是在一个统一的全局数 据模型的指导下进行的,可避免各部门在开发各自的数据集市时的盲目性,减少各数据集市 之间的数据冗余和不一致。在“平行开发”模式中数据集市的这种相对独立性有利于全局性数 据库的建设。一旦全局性数据仓库建立好后,各部门的数据集市将成为全局数据仓库的一个 子集#全局数据仓库将负责为各部门已建成和即将要建的数据集市提供数据。数据仓库与事务性数据库的区别:事务性数据库帮助人们执行活动,数据仓库则帮助人们制定计划。事务性数据库侧重于细节,然而数据仓库侧重于高层次的聚合。事务性数据库通常

13、是为特定应用程序设计的,然而数据仓库集成了不同源头的数据。事务性数据库关心的是现在,数据仓库关心的是随着时间变化的活动。事务性数据库是易变的,它的信息随着新订单的确认或者取消而更改,随着新产品的生 产或者装配而更改,或者新的预定而更改。事务数据库必须能够提供对详细信息的快速获取或者更新,数据仓库必须能能够提供对 高度汇总的信息进行快速获取。为什么企业需要数据仓库在日益激烈的商业竞争中,企业迫切需要更加准确的战略决策信息。在以往的操作型 数据库系统中,企业拥有海量的数据,并不缺乏足够的信息,而是因为这些数据不是战略决 策要使用的信息。这些大量的数据对于企业的运作是非常有用的,但是对于商业战略决策

14、和 目标制定的作用甚微。但是信息技术资源和操作型数据库系统不能把这些数据转换为企业真 正需要的决策信息。为什么呢?首先,企业数据分散在多种互不兼容的的结构和系统中,导 致数据很难被整合成需要的决策信息;其次,战略决策所需的数据格式必须适合趋势分析, 但操作型数据是由事件驱动的,不能直接反映趋势的变化;再次,对于战略决策来说,决策 者必须从不同的商业角度观察数据,比如说产品、地区、客户群等不同方面观察数据,操作 型数据不适合从不同的角度进行分析。提供战略决策信息需要大量的企业数据,能够以合适的格式存放并能快速检索。随着 计算机技术的快速发展,存储成本迅速降低和计算能力大大提高,使建立数据仓库成为

15、可能。数据仓库的五大好处:一个数据仓库是一个成功的商业智能(BI)的基础。数据仓库的概念是很容易理解的一 为支持企业的分析、报表和其它商业智能(BI)功能所需要的各种数据源创建一个中央的位 置和永久储存的空间。而且它对你的业务真的很重要。一个数据仓库提供利用从各种数据源提供的数据,加强的商业智能(BI)一个数据仓库足以让业务用户可以在一个地方快速访问许多数据源可节省时间一个数据仓库能提高数据的质量和一致性一个数据仓库能提供历史的智慧一个数据仓库能创建高的投资回报率数据仓库学习体会说实话,才选这门课的时候就是想着它和数据库是没有什么大的区别的,只是数 据量上大小上的区别,对它的概念很模糊。认真学

16、习了这门课,参阅了一些资料才算 对它的概念有了真正的认识。数据库是面向事务的设计,数据仓库是面向主题设计的。数据库一般存储在线交 易数据,数据仓库存储的一般是历史数据。数据库设计是尽量避免冗余,一般采用符 合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。 数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是 维表和事实表。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善 的信息应用的基础上,用于支持高层决策分析,而事务处理数据库在企业的信息环境 中承担的是日常操作性的任务。数据仓库是数据库技术的一种新的应用,而且到目前 为止,数据仓库

17、还是用关系数据库管理系统来管理其中的数据。这些概念上的区别, 理解起来很晦涩,可以这样记住,但是具体操作起来还是有困难的。我想还是要多做 数据库的设计,从中才能真正体会他们之间的去区别。事实上,我觉得上这门课最大的感触在于老师讲的一句话:数据仓库30%靠的是 技术,70%靠的是各种关系的处理。在具体的操作过程中,技术一般不存在大的问题, 对于不同主题的数据仓库,一般都有很成熟的模型,根据实际做相应的修改。最大的 问题在于数据的提取,准确性,统一性等等上边。不由自主想起本科时辅导员的一句 话:做计算机的,要时刻考虑转行或者转型,你永远干不过那些年轻人。我想仅仅通 过这门课的学习,也不可能说以后就

18、成为数据仓库这一方面的专家或者说有多么豁然 开朗的收获,重要的是,对于计算机这个行业,对于技术层面在一个项目中所占的比 重,对于自己以后的出路,对于自己今后的定位,有了新的思考。有了这些思考,我想,这也就够了。还有,谢谢老师。安装SQL遇到的问题以及处理的方法:在 Windows Server 2003 、Windows XP 或者 Windows 2000 中安装 SQL Server 2008开发版和企业版还有专业版,我们要将我们电脑的WIN 7最好升级为旗舰版,你到网上搜下SQL Server2008专业版,下载安装就可以了,在安装前最好使用软件自带的检 查工具检查你的系统是否满足安装条件,以便想办法解决兼容问题,或者说选择合适电脑以 及上课需要的SQL Server版本。同时,安装程序在卸载的时候的错误,会造成了注册表中键值不一致的现象。正是由 于这个差异,造成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论