




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hive组件1.掌握Hive组件
2.理解执行过程
3.理解元存储1.Hive组件
2.执行过程
3.元存储Hive组件:元存储(Metastore)-存储“系统目录以及关于表、列、分区等的元数据”的组件。驱动(Driver)-控制HiveQL生命周期的组件,当HiveQL查询穿过Hive时。该驱动管理着会话句柄以及任何会话的统计。查询编译器(QueryCompiler)-是一个组件,将HiveQL编译成有向无环图(directedacyclicgraph,DAG)形式的map/reduce任务。执行引擎ExecutionEngine-是一个组件,依相依性顺序(dependencyorder)执行由编译器产生的任务。Hive组件:Hive服务器HiveServer-一个提供“健壮的接口(thriftinterface)、JDBC/ODBC服务器以及提供一种整合Hive和其它应用的”组件。客户端组件-类似命令行接口CLI(CommandLineInterface),webUI以及JDBC/ODBC驱动。包含了正反序列化(SerDe)以及对象观察器(ObjectInspector)接口的可扩展接口,类似于前述用户定义函数UDF(UserDefinedFunction)以及用户定义聚合函数UDAF(UserDefinedAggregateFunction)接口,允许用户定义自己的列函数。
存储列所有关于表、表的分区、模式、列及其类型、表地址等的表的元数据,可以通过thrift接口查询得到,由于需要快速的提供到编译器中,所以使用RDBMS。元存储(Metastore) HiveQL通过CLI/webUI或者thrift、odbc或jdbc接口的外部接口提交,经过complier编译器,运用Metastore中的云数据进行类型检测和语法分析,生成一个逻辑方案(logicalplan),然后通过简单的优化处理,产生一个以有向无环图DAG数据结构形式展现的map-reduce任务。执行的过程:查询编译器(querycomplier)用云存储中的元数据来生成执行计划,步骤如下:1).解析(parse)-anlr解析其生成语法树AST(hibernate也是这个):将HQL转化为抽象语法树AST2).类型检查和语法分析(typecheckingandsemanticanalysis):将抽象语法树转换此查询块(queryblocktree),并将查询块转换成逻辑查询计划(logicplanGenerator);3).优化(optimization):重写查询计划(logicaloptimizer)-->将逻辑查询计划转成物理计划(physicalplangenerator)-->选择最佳的join策略(physicaloptimizer)查询编译器(querycomplier)parse
sa
lpg
lo
ppg
pohql------->AST------>QB----->OPTREE------->OPTREE------->tasktree------->tasktree首先进行hql语句解析,构造一颗AST树,从AST树中得到QueryBlock,再将QB转为对应的操作符,生成逻辑查询计划,对逻辑查询计划进行优化(谓词下推),生成物理查询计划,对物理查询计划进行优化(MapJoinResolver/SkewJoinResolver/CommonJoinResolver),得到最后的执行计划。MapJoinResolver:将小表的MR结果放入HashTableFiles-->DistributedCache,大表从分布式缓存中取得数据进行join;当hash数据较大时,分布式缓存查询效率降低,同时大表的Map都>在等待hashfiles;所以对其进行列优化处理小表的结果放到DC中进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 监控合同保密协议
- 预存话费合同协议模板
- 软件委托分包协议合同
- 技术引进协议合同模板
- 用电纠纷协议合同
- 货车租车合同协议
- 抗洪救灾合同协议
- 终止合同协议标题
- 代理销售协议纸质合同
- 注册协议是哪种合同
- 生物医学体系的确立与发展
- 社会心理学(西安交通大学)智慧树知到期末考试答案2024年
- 行政管理学#-形考任务4-国开(ZJ)-参考资料
- 2024中国餐饮加盟行业白皮书-ccfax美团-202404
- 2024年山东省济南市莱芜区中考一模语文试卷
- 用工审批单(模板)
- 极光大数据:王者荣耀研究报告
- 【基于层次分析法的极兔快递配送网点选址的案例分析10000字(论文)】
- 古诗词诵读《客至》高二语文课件(统编版选择性必修下册)
- 【我国“独角兽”企业的发展问题及优化建议分析-以字节跳动为例16000字(论文)】
- 高压氧治疗注意事项及操作规范指南
评论
0/150
提交评论