Hive管理数据方式电子_第1页
Hive管理数据方式电子_第2页
Hive管理数据方式电子_第3页
Hive管理数据方式电子_第4页
Hive管理数据方式电子_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Hive管理数据方式目录内部表2外部表分区表教学内容Hive管理数据方式内部表内部表的概念及用法分区表3外部表外部表的概念及用法内部表了解内部表的概念;了解内部表的用法;外部表了解外部表的概念;了解外部表的用法;Step1Step2Step34教学要求分区表了解分区表的概念及用法;一、内部表Hive并不存储数据,而是管理存储在HDFS上的数据,通过Hive表导入数据只是简单地将数据移动(如果数据是在HDFS上)或复制(如果数据是在本地文件系统中)到hive表所在的HDFS目录中。Hive管理数据的方式主要包括以下几种:Table内部表ExternalTable外部表Partition分区表BucketTable桶表5一、内部表6与数据库中的Table在概念上是类似每一个Table在Hive中都有一个相应的目录存储数据。例如,一个表test,它在HDFS中的路径为:/warehouse/test。warehouse是在hive-site.xml中由${hive.metastore.warehouse.dir}指定的数据仓库的目录所有的Table数据(不包括ExternalTable)都保存在这个目录中。删除表时,元数据与数据都会被删除7二、外部表指向已经在HDFS中存在的数据,可以创建Partition它和内部表在元数据的组织上是相同的,而实际数据的存储则有较大的差异外部表只有一个过程,加载数据和创建表同时完成,并不会移动到数据仓库目录中,只是与外部数据建立一个链接。当删除一个外部表时,仅删除该链接三、分区表8Partition对应于数据库的Partition列的密集索引在Hive中,表中的一个Partition对应于表下的一个目录,所有的Partition的数据都存储在对应的目录中例如:test表中包含date和city两个Partition,

则对应于date=20130201,city=bj的HDFS子目录为:/warehouse/test/date=20130201/city=bj

对应于date=20130202,city=sh的HDFS子目录为/warehouse/test/date=201302

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论