




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、定义数据仓库数据仓库是一个面向主题的、集成的、稳定的、反映历史变化的、随着时间的流逝发生变化的数据集合。它主要用来支持企业管理人员的决策分析。数据集市也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据中心的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。数据中心的用户希望数据是由他们熟悉的术语表现的。数据集市类型独立型数据集市独立型数据集市从属型数据集市从属型数据集市操作型数据库抽取数据集市操作型数据库数据仓库数据集市数据仓库与数据
2、集市区别数据仓库数据仓库数据集市数据集市数据来源外部数据数据仓库范围企业级部门或者工作组级主题企业主题部门或者特殊的分析主题数据粒度最细粒度较粗的粒度数据结构规范化结构(第3范式)星型模式、雪花模式或两者混合历史数据大量历史数据适度的历史数据优化处理海量数据数据探索便于访问分析快速查询索引高度索引高度索引数据仓库系统与数据库生产系统的区别数据库生产系统数据库生产系统数据仓数据仓库系库系统统面向应用、事务处理实时性高数据检索量少只存储当前数据访问频率高响应时间1s以下用户并发高面向主题,分析型处理数据实时性要求不高数据检索量大存储大量的历史数据和当前数据访问频率中、低响应时间几秒或更长用户并发低
3、定义OLAP联机分析处理(On- Line Analytical Processing, OLAP) 是一类软件技术,它针对特定问题的联机数据访问和分析,可使决策者通过对信息的多种观察角度进行快速、一致和交互的存取,以获得对信息的深入理解。,通过对信息的 多种观察形式进行交互存取。CubeCube是多维立方体的简称,主要用于支持联机分析应用(OLAP),为企业决策提供支持。Cube就象一个坐标系,每一个Dimension代表一个坐标轴,要想得到一个点,就必须在每一个坐标轴上取的一个值,而这个点就是Cube中的Cell。CUBE基本概念时间20112010(2010,x)(一季度,x)(1月份,
4、x)(2月份,x)(3月份,x)一季度二季度三季度四季度一季度二季度时间20112012(2012,手机数码,x)201020112012广州上海北京家用电器手机数码电脑办公手机数码电脑办公时间产品产品(2010,电脑办公,广州,x)地区维度时间维度产品维度2012基本单元2010电脑办公时间层次结构年季度月日广州产品时间产品类别产品城市CUBE星型模式时间维度产品维度地区维度用户多维数据视图销售记录号(销售记录号(PK)日期编号(FK)地区编号(FK)产品编号(FK)销量日期编号(日期编号(PK)月季度年地区编号(地区编号(PK)省市县产品编号(产品编号(PK)类别规格生产日期产地定义一种使
5、用关系数据库实现多维分析空间的模式,称为星型模式。星型模式的基本形式必须实现多维空间(常常被称为方块),以使用关系数据库的基本功能。星型结构示意图星型结构示意图CUBE雪花型模式时间维度产品维度地区维度用户多维数据视图销售记录号(销售记录号(PK)日期编号(FK)地区编号(FK)产品编号(FK)销量日期编号(日期编号(PK)月季度年地区编号(地区编号(PK)省市县产品编号(产品编号(PK)产品类别(FK)规格生产日期(FK)产地(FK)雪花雪花型结构示意图型结构示意图产品类别(产品类别(PK)时间维度产品l类别维度地区维度定义维度进行进一步规范化。我们不需要冗余的维度表,这只会使数据切片变得更
6、加复杂。这种过程中我们得到的模式被称为雪花模式。CUBE基本操作钻取、卷起一季度 二季度三季度家用电器手机数码电脑办公广州上海北京7月份8月份9月份家用电器手机数码电脑办公广州上海北京定义钻取(Drill-down):卷起(Roll-up):钻取卷起第三季度多维数据集多维数据集钻取CUBE基本操作切片、切块一季度 二季度三季度家用电器手机数码电脑办公广州上海北京家用电器手机数码电脑办公广州上海北京定义切片(Slice):在多维分析过程中,如果对多维数据集的某个维选定某一维成员,这种选择操作就称为切片。切块(Dice):在多维分析过程中,如果对多维数据集的某个维选定多个维成员,这种选择操作就称为
7、切块。一季度 二季度三季度广州上海北京一季度 二季度三季度切块切片多维数据集多维数据集切片多维数据集切块CUBE基本操作旋转、转轴一季度 二季度三季度家用电器手机数码电脑办公广州上海北京家用电器手机数码电脑办公一季度二季度三季度广州上海北京定义:旋转(Pivot):转轴(Roll-up):旋转多维数据集多维数据集旋转数据从业务系统到数据仓库发生了什么数据抽取数据推送数据加载数据仓库定义ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程)作为BI/DW(Business Intelligence)的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完
8、成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。抽取(Extract)转换(Transform)加载(Load)清洗转换补充报表与子报表报表SQL Server Reporting Services 报表是包括报表数据和报表布局元素的基于 XML 的报表定义。 在客户端文件系统中,报表定义具有文件扩展名 .rdl。报表和表体表体是包含报表内容的报表元素。 报表包含表体以及表头和表尾,后两者是可选的。 子报表子报表是在主报表的表体中显示其他报表的报表项。 从概念上说,报表中的子报表类似于网页中的框架。 子报表用于在报表中嵌入另一个报表。 任何报表都可以用作子报表。哪些场景用到子
9、报表 同一个数据区域内嵌套来自不同数据源的数据组在多个父报表中重复使用某个子报表,或者在另一个报表中显示独立的报表。报表的钻取与深化钻取报表是指用户通过单击其他报表中的链接打开的报表。 钻取报表通常包含某原始汇总报表中所包含的某项的详细信息。可以控制在用户查看报表时一开始是显示还是隐藏报表项。 另外,通过在文本框上提供加号或减号切换功能,可以使用户能够以交互方式隐藏和显示项。 这称为深化操作。数据集(Datasets) “报表数据”窗格中的数据源 在创建嵌入数据源或添加共享数据源后,会在“报表数据”窗格中显示一个数据源。 “连接”对话框 使用“连接”对话框可以生成连接字符串或粘贴连接字符串。 数据连接信息 将连接字符串传递给数据扩展插件。 凭据 凭据与连接字符串是分开管理的。 数据扩展插件/数据访问接口 可通过多个数据访问层连接数据。 外部数据源:检索来自关系数据库、多维数据库、SharePoint 列表、Web 服务或报表模型的数据。共享模式共享模式(Shared dataset)本地模式本地模式(Embedded dataset )TablixTable + Matrix = Tablix Tablix 数据区域具有四个包含 Tablix 单元的区域:角部区、行
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 商铺土方回填施工方案
- 商品房现房买卖合同
- 贷款申请资料清单表
- 土地股权转让合同
- 合同协议书意向书
- 湖州路基换填施工方案
- 铝格栅幕墙施工方案
- 随州金属氟碳漆施工方案
- 外墙干挂铝塑板施工方案
- 黑龙江省黑河市龙西北高中名校联盟2024-2025学年高一下学期开学英语试题(原卷版+解析版)
- 幼儿园小班健康公开课《笑一笑》课件
- 认识晶体(完整版)课件
- 小学五年级家长会-主题班会
- DB11T 211-2017 园林绿化用植物材料 木本苗
- 16S524塑料排水检查井-井筒直径Φ700~Φ1000
- 行政区划管理条例学习解读课件
- 2024年上半年教师资格证《高中物理》真题及答案
- 咽喉科内镜诊疗技术培训大纲
- GB 8903-2024电梯用钢丝绳
- DL-T 1071-2023 电力大件运输规范
- 冲击波疗法指南解读2024
评论
0/150
提交评论