




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、序号组件名称CDHHDPMAPRDKHTranswarp(美国(美国(美国(中国(中国Cloudera)Hortonworks)MapR)大快)星环)1HadoopVVVVV2HBaseVVVV3ZookeeperVVVVV4SparkVVVV5HiveVVVV6HueVVV7ImpalaVV8SqoopVVVVV9FlumeVVVVV10OozieVVVVV11SolrVVV12IsilonV13KVindexerV14ClouderaManagerV15kafkaVV16StormVVV17ElasticsearchVV18DK-ESSQLV19DK-NLPV20DK-SPIDERV21D
2、KMV22DK-DMYSQLV23FalconV24KnoxV25PhoenixV26PigVV27RangerV28SliderV29TezV30DrillV31MapR-DBV32MapRStreamsV33MahoutVV34HttpFSV35SentryV36SaharaV37MyriadV38TranswarpInceptorV39TranswarpHyperbaseV40TranswarpStreamV41AmbariV二、组件简介:1、Hadoop简介:集群基础组件,分为存储(HDFS)和计算(Mapreduce)两大部分。apache社区开源。技术来源于的GFS和Mapredu
3、ce。2、Hbase简介:键-值非关系型数据库,apache社区开源。是的Bigtable一个的实现。3、Zookeeper简介:集群协调组件,已开源。是的Chubby一个的实现。4、Spark简介:内存计算框架,伯克利首先提出,现已开源。5、Hive简介:基于HDFS的SQL工具,facebook开发,后开源。6、Hue简介:图形化集群工具,cloudera开发,后开源。7、Impala简介:基于HDFS的SQL工具,cloudera开发,后开源。8、Sqoop简介:用于关系型数据库与NOSQL数据库之间的数据导入导出。Cloudera开发,已开源。9、Flume简介:用于数据流的导入,Cl
4、oudera开发,已开源。10、Oozie简介:工作流系统,用于提交、监控集群作业。Cloudera开发,已开源。11、Solr简介:基于Lucene的全文搜索服务器。已开源。12、Isilon简介:基于OneFs操作系统的存储产品,美国赛龙公司开发,后属于EMC,一种集群存储方案。13、K-Vstoreindexer简介:为HBase到solr的索引中间件,为NGDATA公司开发,已开源。14、ClouderaManager简介:CDH集群安装管理工具。Cloudera开发。15、kafka简介:消息队列组件。已经开源。Storm简介:流数据处理组件。Elasticsearch简介:基于Lu
5、cene的全文搜索服务器。已开源。ESSQL简介:基于Elasticsearch的SQL工具,大快开发。DK-NLP简介:自然语言处理组件。大快开发,已开源。DK-SPIDER简介:分布式爬虫组件。大快开发。DKM简介:集群安装管理工具。大快开发。DK-DMYSQL简介:分布式MYSQL组件,大快改写。23、ApacheFalcon简介:Falcon是一个面向Hadoop的、新的数据处理和管理平台,设计用于数据移动、数据管道协调、生命周期管理和数据发现。ApacheKnox简介:Apacheknox是一个访问hadoop集群的restapi网关,它为所有rest访问提供了一个简单的访问接口点。
6、ApachePhoenix简介:Phoenix是HBase的SQL驱动。ApachePig简介:Pig定义了数据流语言PigLatin,它是MapReduce编程抽象。ApacheRanger简介:ranger是一个hadoop集群权限框架,提供操作、监控、管理复杂的数据权限,它提供一个集中的管理机制,管理基于yarn的hadoop生态圈的所有数据权限。ApacheSlider简介:Slider是一个YARN应用,用于发布已有的分布式应用到YARN上,并对这些应用进行监控以及根据需要调整规模。Tez简介:Tez支持DAG作业的计算框架,它直接源于MapReduce框架,核心思想是将Map和Re
7、duce两个操作进一步拆分形成一个大的DAG作业。ApacheDrill简介:ApacheDrill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSISQL兼容语法。MapR-DB简介:MapR开发MapRStreams简介:MapR开发Mahout简介:机器学习算法库,现已停止更新。HttpFS简介:Cloudera开发的基于http协议的HDFS操作组件。Sentry简介:ApacheSentry是Cloudera公司发布的一个Hadoop开源组件,截止目前还是Apache的孵化项目,它提供了细粒度级、基于角色的授权以及多租户的管理模式。Sahar
8、a简介:Sahara旨在为用户提供简单部署Hadoop集群的能力,提供在OpenStack上快速配置和部署Hadoop集群的能力。37、Myriad0.1.0简介:Myriad是一个Mesos框架用来动态扩展YARN集群,并支持运行Hadoop应用,如Spark和非Hadoop应用,如Node.js、Memcached、RoR等。TranswarpInceptor简介:由ApacheSpark改写,TranswarpInceptor交互式分析引擎提供高速SQL分析和R语言数据挖掘能力,可帮助企业建立高速可扩展的数据仓库和/或数据集市,结合多种报表工具提供交互式数据分析、即时报表和可视化能力。星环开发。TranswarpHyperbase简介:TranswarpHyperbase实时数据库是建立在ApacheHBase基础之上,融合了多种索引技术、分布式事务处理、全文实时搜索、图形数据库在内的实时NoSQL数据库。星环开发。TranswarpStream简介:TranswarpStream实时流处理引擎提供了强大的流计算表达能力,支持复杂的应用逻辑,生产系统的消息通过实时消息队列进入计算集群,在集群内以流水线方式被依次处理,完成数据转换、特征
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 股份制公司管理策略报告
- 国际贸易市场进出口数据分析报告表
- 工程热力学及传热学测试卷解析
- 2025昇兴(四川)智能科技有限公司招聘22人笔试参考题库附带答案详解
- 2025国家能源集团新能源技术研究院有限公司高校毕业生直招第一批拟录用人员笔试参考题库附带答案详解
- 2025年上半年安徽省芜湖企业服务中心客服团队招聘10人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年安徽省淮南市招聘专职消防员37人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年安徽岳西县医共体乡镇卫生院绿色通道招聘“乡聘村用”30人员易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年安徽宿州市埇桥区事业单位招聘116人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年安徽合肥肥西县山南镇招考村级后备干部35人易考易错模拟试题(共500题)试卷后附参考答案
- 无人机技术在物流配送中的应用
- 建设用地报批服务投标方案(技术方案)
- 大学体验英语项目组《大学体验英语综合教程(1)》(第3版)学习指南【词汇短语+课文精解+全文翻译+练习答案】
- DB4412T 25-2023 电动自行车停放充电场所消防安全规范
- 苏轼《答黄鲁直书》与苏辙《答黄庭坚书》比较阅读(附答案解析与译文)
- 成人机电一体化实习报告
- (完整版)数字信号处理教案(东南大学)
- 一本书读懂不良资产
- 2022-2023学年河北省唐山市十县联盟高二下学期期中考试英语试题原卷版+解析版含听力音频无听力原文
- 《饭店服务与管理》认识饭店的“神经中枢”
- GB/T 15856.5-2023六角凸缘自钻自攻螺钉
评论
0/150
提交评论