Hadoop发展历史发展历程_第1页
Hadoop发展历史发展历程_第2页
Hadoop发展历史发展历程_第3页
Hadoop发展历史发展历程_第4页
Hadoop发展历史发展历程_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据计算平台《大数据导论》课程IntroductiontobigdataHadoop发展历史(2)Hadoop的发展历程022Hadoop的发展历程2Hadoop的发展历程2002年Nutch项目开始于2002年,当时互联网第一轮泡沫刚刚结束。2004年谷歌又发表了论文“MapReduce:SimplifiedDataProcessingonLargeClusters”,向全世界介绍他们的MapReduce框架。2003年Google发表的论文“TheGoogleFileSystem”2005年Nutch的开发人员在Nutch上实现了一个MapReduce算法,半年左右的时间,Nutch的所有主要算法均完成移植,用MapReduce和NDFS来运行。2Hadoop的发展历程2007年纽约时报在100个亚马逊的虚拟机服务器上使用Hadoop转换了4TB的图片数据,更加深了人们对Hadoop的印象。2008年Yahoo将Hadoop团队独立出来,成立了一个子公司Hortonworks,专门提供Hadoop相关的服务。2006年DougCutting在经过一系列周密考虑和详细总结后,决定加入优秀的公司进一步完善Nutch的性能。2011年>2008年1月,Hadoop已经成为Apache的顶级项目。>2008年4月,Hadoop打破世界纪录,成为最快的TB级数据排序系统。2Hadoop的发展历程2012年Hortonworks在Hadoop发展上推出了与原框架有很大不同的YARN框架的第一版本,从此对Hadoop的研究又迈进一个新的层面。2014年Hadoop2.x的更新速度非常快,从2.3.0到2.6.0,极大地完善了YARN框架和整个集群的功能。很多Hadoop的研发公司如Cloudera、Hortonworks都与其他企业合作共同开发Hadoop新功能。2013年大型IT公司,如EMC、Microsoft、Intel、Teradata、Cisco都明显增加了Hadoop方面的投入,Hortonworks宣传要100%开源软件,Hadoop2.0转型基本上无可阻挡。2015-2016年>2015年,在Hadoop创新阶段走向错误道路的供应商逐步退出,与其他Hadoop版本发行企业整合,数据的实时访问处理是一个关注的重点。>2016年,Hadoop及其生态圈(包括Spark等)在各行各业落地并且得到广泛的应用,YARN将持续发展以支持更多应用。总结summaryHa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论