CDHHDPMAPRDKH星环组件比较_第1页
CDHHDPMAPRDKH星环组件比较_第2页
CDHHDPMAPRDKH星环组件比较_第3页
CDHHDPMAPRDKH星环组件比较_第4页
CDHHDPMAPRDKH星环组件比较_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、序号组件名称CDHHDPMAPRDKHTranswarp(美国(美国(美国(中国(中国Cloudera)Hortonworks)MapR)大快)星环)1HadoopVVVVV2HBaseVVVV3ZookeeperVVVVV4SparkVVVV5HiveVVVV6HueVVV7ImpalaVV8SqoopVVVVV9FlumeVVVVV10OozieVVVVV11SolrVVV12IsilonV13KVindexerV14ClouderaManagerV15kafkaVV16StormVVV17ElasticsearchVV18DK-ESSQLV19DK-NLPV20DK-SPIDERV21D

2、KMV22DK-DMYSQLV23FalconV24KnoxV25PhoenixV26PigVV27RangerV28SliderV29TezV30DrillV31MapR-DBV32MapRStreamsV33MahoutVV34HttpFSV35SentryV36SaharaV37MyriadV38TranswarpInceptorV39TranswarpHyperbaseV40TranswarpStreamV41AmbariV二、组件简介:1、Hadoop简介:集群基础组件,分为存储(HDFS)和计算(Mapreduce)两大部分。apache社区开源。技术来源于的GFS和Mapredu

3、ce。2、Hbase简介:键-值非关系型数据库,apache社区开源。是的Bigtable一个的实现。3、Zookeeper简介:集群协调组件,已开源。是的Chubby一个的实现。4、Spark简介:内存计算框架,伯克利首先提出,现已开源。5、Hive简介:基于HDFS的SQL工具,facebook开发,后开源。6、Hue简介:图形化集群工具,cloudera开发,后开源。7、Impala简介:基于HDFS的SQL工具,cloudera开发,后开源。8、Sqoop简介:用于关系型数据库与NOSQL数据库之间的数据导入导出。Cloudera开发,已开源。9、Flume简介:用于数据流的导入,Cl

4、oudera开发,已开源。10、Oozie简介:工作流系统,用于提交、监控集群作业。Cloudera开发,已开源。11、Solr简介:基于Lucene的全文搜索服务器。已开源。12、Isilon简介:基于OneFs操作系统的存储产品,美国赛龙公司开发,后属于EMC,一种集群存储方案。13、K-Vstoreindexer简介:为HBase到solr的索引中间件,为NGDATA公司开发,已开源。14、ClouderaManager简介:CDH集群安装管理工具。Cloudera开发。15、kafka简介:消息队列组件。已经开源。Storm简介:流数据处理组件。Elasticsearch简介:基于Lu

5、cene的全文搜索服务器。已开源。ESSQL简介:基于Elasticsearch的SQL工具,大快开发。DK-NLP简介:自然语言处理组件。大快开发,已开源。DK-SPIDER简介:分布式爬虫组件。大快开发。DKM简介:集群安装管理工具。大快开发。DK-DMYSQL简介:分布式MYSQL组件,大快改写。23、ApacheFalcon简介:Falcon是一个面向Hadoop的、新的数据处理和管理平台,设计用于数据移动、数据管道协调、生命周期管理和数据发现。ApacheKnox简介:Apacheknox是一个访问hadoop集群的restapi网关,它为所有rest访问提供了一个简单的访问接口点。

6、ApachePhoenix简介:Phoenix是HBase的SQL驱动。ApachePig简介:Pig定义了数据流语言PigLatin,它是MapReduce编程抽象。ApacheRanger简介:ranger是一个hadoop集群权限框架,提供操作、监控、管理复杂的数据权限,它提供一个集中的管理机制,管理基于yarn的hadoop生态圈的所有数据权限。ApacheSlider简介:Slider是一个YARN应用,用于发布已有的分布式应用到YARN上,并对这些应用进行监控以及根据需要调整规模。Tez简介:Tez支持DAG作业的计算框架,它直接源于MapReduce框架,核心思想是将Map和Re

7、duce两个操作进一步拆分形成一个大的DAG作业。ApacheDrill简介:ApacheDrill是一个低延迟的分布式海量数据(涵盖结构化、半结构化以及嵌套数据)交互式查询引擎,使用ANSISQL兼容语法。MapR-DB简介:MapR开发MapRStreams简介:MapR开发Mahout简介:机器学习算法库,现已停止更新。HttpFS简介:Cloudera开发的基于http协议的HDFS操作组件。Sentry简介:ApacheSentry是Cloudera公司发布的一个Hadoop开源组件,截止目前还是Apache的孵化项目,它提供了细粒度级、基于角色的授权以及多租户的管理模式。Sahar

8、a简介:Sahara旨在为用户提供简单部署Hadoop集群的能力,提供在OpenStack上快速配置和部署Hadoop集群的能力。37、Myriad0.1.0简介:Myriad是一个Mesos框架用来动态扩展YARN集群,并支持运行Hadoop应用,如Spark和非Hadoop应用,如Node.js、Memcached、RoR等。TranswarpInceptor简介:由ApacheSpark改写,TranswarpInceptor交互式分析引擎提供高速SQL分析和R语言数据挖掘能力,可帮助企业建立高速可扩展的数据仓库和/或数据集市,结合多种报表工具提供交互式数据分析、即时报表和可视化能力。星环开发。TranswarpHyperbase简介:TranswarpHyperbase实时数据库是建立在ApacheHBase基础之上,融合了多种索引技术、分布式事务处理、全文实时搜索、图形数据库在内的实时NoSQL数据库。星环开发。TranswarpStream简介:TranswarpStream实时流处理引擎提供了强大的流计算表达能力,支持复杂的应用逻辑,生产系统的消息通过实时消息队列进入计算集群,在集群内以流水线方式被依次处理,完成数据转换、特征

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论