数据的转换方法_第1页
数据的转换方法_第2页
数据的转换方法_第3页
数据的转换方法_第4页
数据的转换方法_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据的转换方法学习目标2知识目标●数据的转换●数据转换和加工的方法能力目标●了解数据的转换●掌握数据转换的方法学习任务3初步探索数据的转换初步探索数据转换的方法初步探索数据加工的方法总结数据转换的方法数据转换和加工的方法数据的转换4目录5数据的转换数据转换是指对业务系统中抽取的数据根据数据仓库系统模型的要求,进行数据的转化处理,保证来自不同系统、不同格式的数据具有一致性和完整性,并按要求装入数据仓库。数据转换的任务主要进行不一致的数据转换、数据粒度的转换,以及一些商务规则的计算。6数据的转换不一致的数据转换这个过程是一个整合的过程,将不同业务系统的相同类型的数据统一,比如同一个供应商在结算系统的编码是XX0001,而在CRM中编码是YY0001,这样在抽取过来之后统一转换成一个编码。7数据的转换数据粒度的转换业务系统一般存储非常明细的数据,而数据仓库中数据是用来分析的,不需要非常明细的数据。一般情况下,会将业务系统数据按照数据仓库粒度进行聚合。8数据的转换商务规则的计算不同的企业有不同的业务规则、不同的数据指标,这些指标有的时候不是简单的加加减减就能完成,这个时候需要在ETL中将这些数据指标计算好了之后存储在数据仓库中,以供分析使用。9数据转换和加工的方法从数据源中抽取的数据不一定完全满足目的库的要求,例如数据格式的不一致、数据输入错误、数据不完整等等,因此有必要对抽取出的数据进行数据转换和加工。数据的转换和加工可以在ETL引擎中进行,也可以在数据抽取过程中利用关系数据库的特性同时进行。10数据转换和加工的方法ETL引擎中的数据转换和加工ETL引擎中一般以组件化的方式实现数据转换。常用的数据转换组件有字段映射、数据过滤、数据清洗、数据替换、数据计算、数据验证、数据加解密、数据合并、数据拆分等。这些组件如同一条流水线上的一道道工序,它们是可插拔的,且可以任意组装,各组件之间通过数据总线共享数据。同时ETL工具还提供了脚本支持,使得用户可以以一种编程的方式定制数据的转换和加工行为。相比在数据库中加工,性能较高,但不容易进行修改和清晰辨认。11数据转换和加工的方法在数据库中进行数据加工关系数据库本身已经提供了强大的SQL、函数来支持数据的加工,如在SQL查询语句中添加where条件进行过滤,查询中重命名字段名与目的表进行映射,substr函数,case条件判断等等。12数据转换和加工的方法数据的转换方法(1)在数据抽取过程中进行数据处理。(2)使用异步数据装载,以文件的方式进行处理。(3)在数据装载过程中进行数据处理。(4)进入数据仓库以后再进行数据处理。13数据转换和加工的方法相比在ETL引擎中进行数据转换和加工,直接在SQL语句中进行转换和加工更加简单清晰;但依赖S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论