数据整理--ETL入门.ppt_第1页
数据整理--ETL入门.ppt_第2页
数据整理--ETL入门.ppt_第3页
数据整理--ETL入门.ppt_第4页
数据整理--ETL入门.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、,融合拓展,创新云端 ,商务智能与ETL,ETL定义,目录,ETL模式,ETL过程,面向对象,提供解决方案,商务智能,数据处理,银行、券商、保险,对数据、信息处理,提供决策,BI,数据整理、挖掘、分析、建模,金融工程应用简介,企业决策层,OLAP,数据挖掘,目标数据库,提取、清洗、转换,业务系统,数据仓库,BI,Business Intelligence,ETL,商务智能与ETL,ETL定义,目录,ETL模式,ETL过程,数据优化。 以最小代价(包括对日常操作的影响和对技能的要求) 将针对日常业务操作的数据转化为针对数据仓库而存储的决策支持型数据。,数据的抽取(Extract)、转换(Tran

2、sform)、装载(Load)的过程,ETL定义,ETL目标,ETL过程,数据抽取,清洗、转换,加载,ETL过程就是数据流动的过程,从不同的数据源流向不同的目标数据。,图示,复杂的源数据环境,繁重的的开发任务,有限的加载时间,多种多样的数据源平台,参差不齐的数据质量,繁多的数据种类,巨大的加载数据量,错综复杂的数据关系,?,ETL所面临的挑战,ETL前提,ETL工具,通过对目标表信息的收集,确定ETL的范围,考虑资金 运行的平台、对源和目标的支持程度、可编程的灵活性、对源数据变化的监测、数据处理时间的控制、管理和调度功能、对异常情况的处理,ETL遵循原则,应尽量利用数据中转区对运营数据进行预处

3、理。保证数据的安全性、集成与加载的高效性,ETL的过程应是主动“拉取”,而不是从内部“推送”,其可控性将大为增强,流程化的配置管理和标准协议,数据质量的保证: 正确性、一致性、完整性、有效性、可获取性,商务智能与ETL,ETL定义,目录,ETL模式,ETL过程,ETL架构模式,同构,异构,模式比较,特点,环境,ETL模式-同构,ETL模式-异构,两种模式的比较-特点,两种模式的比较-环境,商务智能与ETL,ETL定义,目录,ETL模式,ETL过程,字段映射(销售额),类似于关键字搜索,ETL过程,数据抽取,数据来源,抽取方式,抽取策略,文件系统,业务系统,全量抽取,增量抽取,抽取时间、频率,数

4、据清洗,清洗规则,数据补缺,数据替换,格式规范化,主外键约束,对空数据、缺失数据进行数据补缺操作,无法处理的作标记,对无效数据进行数据的替换,将源数据抽取的数据格式转换成为便于进入仓库处理的目标数据格式,通过建立主外键约束,对非法数据进行替换或导出到错误文件重新处理,转换规则,数据验证:lookup,sum,count,在ETL引擎中进行 (SQL无法实现的),在ETL引擎中进行在数据库中进行 (SQL可以实现的),实现方式,去除重复记录,排序/修改序号,行列互换,数据拆分,数据合并,ETL的实现三种方法,借助ETL工具,如Oracle的OWB,SQL Server2000的DTS,SQL Server 2005的SSIS等,SQL方式实现,ETL工具与SQL相结合,简单、快速. 大部分的ETL工具含有整合的元数据资料库,用于从源系统、目标系统和其他BI产品中获取元数据. 大部分ETL工具都能够取得好的性能,甚至是大数据量的情况下. ETL工具包含了预建立的Connect,连接大部分的源系统和目标系统. 大部分的ETL工具包含了统一的调度平台. ETL 工具的文档和后期维护更加的便捷.,可以更加自由的控制元数据 可以使用常见的编程语言完成开

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论