数据集成概述_第1页
数据集成概述_第2页
数据集成概述_第3页
数据集成概述_第4页
数据集成概述_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

讲师:黄珊财务大数据分析基础数据集成概念1了解数据集成概念2了解数据集成的意义学习目标3理解数据集成主要内容数据集成概念PART01数据关联:两份数据表做左右联接(不同)数据集成最常见的两种方法数据合并:两份数据表做上下联接(相同/类似)(一个字段)(多个字段)一、数据集成概念数据集成意义PART02数据集成意义:将多个数据源中的数据集成起来,能够减少或避免结果数据中的冗余与不一致性,从而可以提高挖掘的速度和质量。

模式集成:整合不同数据源中的元数据;

数据值冲突检查与消除问题:对现实世界中的同一实体,来自不同数据源的属性值可能不同;

冗余数据。二、数据集成意义数据集成的主要内容PART03数据关联数据关联的四种方式三、数据集成的主要内容数据合并

含义:也称为数据追加,是指对多份数据字段基本完全相同的数据进行上下连接。IDABC111213121222323132333IDABC6627283773839388494104IDABC1112131212223231323336627283773839388494104三、数据集成的主要内容数据组合—合并查询

数据关联在PowerBI中表现为数据组合中的合并查询。

合并查询中,新表会生成为两张表的所有字段,生成哪些数据记录要看两张表的联接关系。

合并查询中,表的联结关系包括左外部、右外部、完全外部、内部、左反、右反6种。三、数据集成的主要内容数据组合—合并查询表的联结关系三、数据集成的主要内容数据组合—合并查询三、数据集成的主要内容数据组合—追加查询

数据合并在PowerBI中表现为数据组合中的追加查询。

追加查询是把字段一样的数据追加到一张表中,且相同字段的数据追加到同一个字段下。若两张表中存在不同的字段,则不同字段的数据单列。

进行追加查询时,两张表的列名必须一致,列顺序可以不一致。三、数据集成的主要内容数据组合—追加查询三、数据集成的主要内容课程小结01.数据集成的类型02.Power

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论