




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hive管理数据方式目录内部表2外部表分区表教学内容Hive管理数据方式内部表内部表的概念及用法分区表3外部表外部表的概念及用法内部表了解内部表的概念;了解内部表的用法;外部表了解外部表的概念;了解外部表的用法;Step1Step2Step34教学要求分区表了解分区表的概念及用法;一、内部表Hive并不存储数据,而是管理存储在HDFS上的数据,通过Hive表导入数据只是简单地将数据移动(如果数据是在HDFS上)或复制(如果数据是在本地文件系统中)到hive表所在的HDFS目录中。Hive管理数据的方式主要包括以下几种:Table内部表ExternalTable外部表Partition分区表BucketTable桶表5一、内部表6与数据库中的Table在概念上是类似每一个Table在Hive中都有一个相应的目录存储数据。例如,一个表test,它在HDFS中的路径为:/warehouse/test。warehouse是在hive-site.xml中由${hive.metastore.warehouse.dir}指定的数据仓库的目录所有的Table数据(不包括ExternalTable)都保存在这个目录中。删除表时,元数据与数据都会被删除7二、外部表指向已经在HDFS中存在的数据,可以创建Partition它和内部表在元数据的组织上是相同的,而实际数据的存储则有较大的差异外部表只有一个过程,加载数据和创建表同时完成,并不会移动到数据仓库目录中,只是与外部数据建立一个链接。当删除一个外部表时,仅删除该链接三、分区表8Partition对应于数据库的Partition列的密集索引在Hive中,表中的一个Partition对应于表下的一个目录,所有的Partition的数据都存储在对应的目录中例如:test表中包含date和city两个Partition,
则对应于date=20130201,city=bj的HDFS子目录为:/warehouse/test/date=20130201/city=bj
对应于date=20130202,city=sh的HDFS子目录为/warehouse/test/date=201302
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 咨询居间协议书范本
- 品牌授权场景详尽主播代言合作协议
- 战略合作协议书粮油范本
- 高端酒店厨师团队聘用与职业培训协议
- 夜间出租车营运承包合作协议
- 常州二手房租赁合同书(含交易税费)
- 项目收回协议书范本
- 住宅小区配套教育设施拆迁协议书
- 防水材料员专项聘用合同
- 防灾设备采购委托代理服务合同模板
- 2024年 黄冈市法院系统招聘审判辅助人员考试真题试题含答案
- 荆州中学2024-2025学年高二下学期6月月考历史试题答案
- 公司消防网格化管理制度
- 外科换药拆线技术规范
- 2025至2030中国氧化铝纤维行业供需趋势及投资风险报告
- 2025年四川泸州市中考数学试卷真题及答案详解(精校打印)
- 2025年中考考前最后一卷化学(武汉卷)(全解全析)
- 2026届高考语文复习:直击2025年语文高考阅读客观题关键词比对
- 电子政务概论-形考任务5(在线测试权重20%)-国开-参考资料
- 19S406建筑排水管道安装-塑料管道
- 国家开放大学《病理生理学》形考任务1-4参考答案
评论
0/150
提交评论