版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据计算平台《大数据导论》课程IntroductiontobigdataHadoop发展历史(2)Hadoop的发展历程022Hadoop的发展历程2Hadoop的发展历程2002年Nutch项目开始于2002年,当时互联网第一轮泡沫刚刚结束。2004年谷歌又发表了论文“MapReduce:SimplifiedDataProcessingonLargeClusters”,向全世界介绍他们的MapReduce框架。2003年Google发表的论文“TheGoogleFileSystem”2005年Nutch的开发人员在Nutch上实现了一个MapReduce算法,半年左右的时间,Nutch的所有主要算法均完成移植,用MapReduce和NDFS来运行。2Hadoop的发展历程2007年纽约时报在100个亚马逊的虚拟机服务器上使用Hadoop转换了4TB的图片数据,更加深了人们对Hadoop的印象。2008年Yahoo将Hadoop团队独立出来,成立了一个子公司Hortonworks,专门提供Hadoop相关的服务。2006年DougCutting在经过一系列周密考虑和详细总结后,决定加入优秀的公司进一步完善Nutch的性能。2011年>2008年1月,Hadoop已经成为Apache的顶级项目。>2008年4月,Hadoop打破世界纪录,成为最快的TB级数据排序系统。2Hadoop的发展历程2012年Hortonworks在Hadoop发展上推出了与原框架有很大不同的YARN框架的第一版本,从此对Hadoop的研究又迈进一个新的层面。2014年Hadoop2.x的更新速度非常快,从2.3.0到2.6.0,极大地完善了YARN框架和整个集群的功能。很多Hadoop的研发公司如Cloudera、Hortonworks都与其他企业合作共同开发Hadoop新功能。2013年大型IT公司,如EMC、Microsoft、Intel、Teradata、Cisco都明显增加了Hadoop方面的投入,Hortonworks宣传要100%开源软件,Hadoop2.0转型基本上无可阻挡。2015-2016年>2015年,在Hadoop创新阶段走向错误道路的供应商逐步退出,与其他Hadoop版本发行企业整合,数据的实时访问处理是一个关注的重点。>2016年,Hadoop及其生态圈(包括Spark等)在各行各业落地并且得到广泛的应用,YARN将持续发展以支持更多应用。总结summaryHa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防用电课件教学课件
- 2024「销售代理」合同标的与代理商责任义务
- 2024年度租赁合同标的及租赁期限的详细约定
- 2024年度供应链管理服务合同协同操作与风险控制
- 2024年建筑工程项目安全协议
- 2024年度石油化工企业BIM模型设计与安全评估合同
- 2024年度园林绿化工程施工合同范例
- 2024标准劳务合同书3
- 2024年土地暂时使用协议
- 2024年度技术开发成果共享协议
- 市场主体迁移申请书
- 2023科室医疗质量、安全管理持续改进记录本
- (完整word)大学西门子plcs7-1200考试复习习题
- 中考数学复习微专题:有理数运算中的错解及对策
- DB11-972-2013保险营业场所风险等级与安全防范要求
- 高中政治部编版教材高考双向细目表
- 轮扣式模板支撑架安全专项施工方案
- 酒店装饰装修工程验收表
- 中国行业分类代码表
- 社会组织协会换届选举会议主持词
- 呼吸科(呼吸与危重症医学科)出科理论试题及答案
评论
0/150
提交评论