




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
BI,数据仓库仓库(DW)建模与ETL的实实践技巧 作者:MALONE 日期:2009-02-20 主要内容主要内容( (一一) ) 一、什么是BI(Business Intelligence) (一)、什么是BI的定义? (二)、BI的诞生? (三)、基本技术 (四)、数据处理 (五)、数据展现 (六)、常用的BI 厂商和产品 主要内容主要内容( (二二) ) 二、数据仓库的架构 (一)、什么是数据仓库? (二)、数据仓库和OLTP数据库的区别? (三)、数据仓库的架构模型有哪些? 三、构建企业级数据仓库五步法 (一)、确定主题 (二)、确定量度 (三)、确定事实数据粒度 (四)、确定维度 1.如何理解维度?及维度的层次和级别? 2.什么是缓慢变化维度? 3.缓慢变化维度 几种基本情况? 几种情况的利弊? (五)、创建事实表 主要内容主要内容( (三三) ) 四、什么是ETL(ETL中的关键技术) (一)、数据抽取 (1)全量抽取 (2)增量抽取 增量数据抽取中常用的捕获变化数据的方法: a.触发器b.时间戳 c.全表比对d.日志对比 (二)、数据转换和加工 (1)ETL引擎中的数据转换和加工 (2)在数据库中进行数据加工 (三)、数据装载 (1)直接SQL语句进行insert、update、delete操作 (2)采用批量装载方法,如bcp、bulk、关系数据库 特有的批量装载工具或api (四)、主流ETL工具介绍 主要内容主要内容( (一一) ) 一、什么是BI(Business Intelligence) (一)、什么是BI的定义? (二)、BI的诞生? (三)、基本技术 (四)、数据处理 (五)、数据展现 (六)、常用的BI 厂商和产品 Marketing Design 而雪花型结构明确, 便于与OLTP系统交互。 因此,在实际项目中,我们将综合运用星型架构与雪花型架构来设计数据仓库。 (三)、数据仓库的架构模型有哪些? 主要内容主要内容( (二二) ) 二、数据仓库的架构 (一)、什么是数据仓库? (二)、数据仓库OLAP和OLTP数据库的区别? (三)、数据仓库的架构模型有哪些? 三、构建企业级数据仓库五步法 (一)、确定主题 (二)、确定量度 (三)、确定事实数据粒度 (四)、确定维度 1.如何理解维度?及维度的层次和级别? 2.什么是缓慢变化维度? 3.缓慢变化维度 几种基本情况? 几种情况的利弊? (五)、创建事实表 Marketing Design 分析角度是各个维度;我们将通过维度的组合,来考察量度。 那么,“某年某月某一地区的卷烟销售情况”这样一个主题,就要求我们通过时间,地区和卷烟三个维度的组合 ,来考察销售情况这个量度。 从而,不同的主题来源于数据仓库中的不同子集,我们可以称之为数据集市。数据集市体现了数据仓库某一方面 的信息,多个数据集市构成了数据仓库。 (二)、确定量度 在确定了主题以后,我们将考虑要分析的技术指标,诸如:年销售额之类。它们一般为数值型数据。 我们或者将该数据汇总,或者将该数据取次数、独立次数或取最大最小值等,这样的数据称为量度。 量度是要统计的指标,必须事先选择恰当,基于不同的量度可以进行复杂关键性能指标(KPI)等的设计和计算。 Marketing Design 反过来,如果我们不能确认将来的分析需求在卷烟上是否需要精确到包,那么,我们就需要遵循“最小粒度原则 ”,在数据仓库的事实表中保留每一支的进销存数据,以便日后对“支”进行分析。 举例:卷烟零售分析系统中,需求变更要求以万支为单位分析卷烟进销存情况。 附加:DDS层 销售,库存及进货事实表结构 和 卷烟单位代码表 三、构建企业级数据仓库五步法 DDS.F_XS销售事实表 DDS.F_KC库存事实表 DDS.F_SY损益事实表 DDS.F_JH进货事实表 DDS.F_DH订货事实表 Marketing Design Marketing Design & BI Application Consulting Company四、什么是ETL(ETL中的关键技术) 主要内容主要内容( (三三) ) 四、什么是ETL(ETL中的关键技术) (一)、数据抽取 (1)全量抽取 (2)增量抽取 增量数据抽取中常用的捕获变化数据的方法: a.触发器b.时间戳 c.全表比对d.日志对比 (二)、数据转换和加工 (1)ETL引擎中的数据转换和加工 (2)在数据库中进行数据加工 (三)、数据装载 (1)直接SQL语句进行insert、update、delete操作 (2)采用批量装载方法,如bcp、bulk、关系数据库 特有的批量装载工具或api (四)、主流ETL工具介绍 Marketing Design & BI Application Consulting Company四、什么是ETL(ETL中的关键技术) (三)、数据装载 (1)直接SQL语句进行insert、update、delete操作 (2)采用批量装载方法,如bcp、bulk、关系数据库特有的批量装载工具或api (四)、主流ETL工具介绍 Informatica NCR Teradata Cognos, Hyperion Oracle warehouse builder、 Oracle Data Integrator 主要内容主要内容( (三三) ) 总结总结 四、什么是ETL(ETL中的关键技术) (一)、数据抽取 (1)全量抽取 (2)增量抽取 增量数据抽取中常用的捕获变化数据的方法: a.触发器b.时间戳 c.全表比对d.日志对比 (二)、数据转换和加工 (1)ETL引擎中的数据转换和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年八一建军节95周年活动实施方案
- 汽车使用与维护 课件 1.3.4 汽车制动器的操作方法和使用注意事项
- 2025年甲酸钠项目可行性研究报告
- 2025年珠光包项目可行性研究报告
- 2025年牛仔裤水洗机项目可行性研究报告
- 四川省眉山市龙正区重点达标名校2025年下学期初三语文试题中考仿真模拟考试试卷(四)含解析
- 浙江省宁波市江东区2024-2025学年三年级数学第二学期期末教学质量检测模拟试题含解析
- 扬州市江都区实验重点名校2024-2025学年全国初三模拟考三全国I卷物理试题含解析
- 湖北省襄阳市第七中学2024-2025学年初三阶段性诊断考试化学试题含解析
- 2025春新版【二年级语文下册】 期中复习知识点
- 【9数一模】2025年安徽合肥市第四十五中学九年级中考一模数学试卷(含答案)
- 国家民政部所属单位招聘笔试真题2024
- 眼底病变三维重建技术-全面剖析
- 2024年安徽马鞍山技师学院专任教师招聘真题
- 汽车装潢服务合同范本
- 2025年03月江苏镇江市扬中市事业单位集开招聘48人笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 口腔科设备器具项目深度研究分析报告
- 2025四川泸天化弘旭工程建设有限公司社会招聘3人笔试参考题库附带答案详解
- 2025中国煤炭地质总局招聘20人笔试参考题库附带答案详解
- 中国文化传媒集团招聘笔试真题2024
- 电网工程设备材料信息参考价(2024年第四季度)
评论
0/150
提交评论