《Hadoop技术原理》课件-5.资源管理器Yarn_第1页
《Hadoop技术原理》课件-5.资源管理器Yarn_第2页
《Hadoop技术原理》课件-5.资源管理器Yarn_第3页
《Hadoop技术原理》课件-5.资源管理器Yarn_第4页
《Hadoop技术原理》课件-5.资源管理器Yarn_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Hadoop技术原理资源管理器YarnYarn产生背景与基础架构01Yarn的产生背景01Hadoop的主要组成MapReduce随着Hadoop的变化也经历了两个版本,Hadoop1.x及之前对应的是MapReduce1,Hadoop2.x对应的是MapReduce2,MapReuce两个版本的两大任务是不变的,分别是Map任务和Reduce任务,不同的是MapReduce1和MapReduce2的资源管理器是不一样的。Yarn的产生背景02MapReduce1架构Client:客户端JobTracker:负责资源管理和所有作业的控制TaskTracker:负责接收来自JobTracker的命令并执行Yarn的产生背景03了解MapReduce1工作流程Yarn的产生背景04MapReduce1局限性直接源于MRv1在几个方面的缺陷扩展性受限JobTracker单点故障难以支持MR之外的计算多计算框架各自为战,数据共享困难MR:离线计算框架Storm:实时计算框架Spark:内存计算框架Yarn的产生背景05Hadoop1.0与Hadoop2.0初识Yarn06什么是YarnYARN:YetAnotherResourceNegotiator,另一种资源协调者。最初是为了改善MapReduce的实现,但也是一种资源调度框架,具有通用性,可为上层应用提供统一的资源管理和调度,可以支持其他的分布式计算模式(如Spark)。它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。Yarn的基础架构07架构Yarn的基础架构08Container(容器)YARN中资源包括内存、CPU、磁盘输入输出等等。Container是YARN中资源的抽象,它封装了某个节点上的多维度资源。ResourceManager(资源管理器)ResourceManager负责整个系统的资源分配和管理,是一个全局的资源管理器。主要由两个组件构成:调度器和应用程序管理器:调度器(Scheduler):

调度器根据资源情况为应用程序分配封装在Container中的资源。应用程序管理器(ApplicationManager):

应用程序管理器负责管理整个系统中所有应用程序。Yarn的基础架构09NodeManager(节点管理器)NodeManager是每个节点上的资源和任务管理器。定时向ResourceManager汇报本节点上的资源使用情况和各个Container的运行状态;接收并处理来自ApplicationManager的Container启动/停止等请求。Yarn的基础架构10ApplicationMaster(主应用)ApplicationMaster是一个详细的框架库,它结合从ResourceManager获得的资源和NodeManager协同工作来运行和监控任务。用户提交的每一个应用程序均包含一个ApplicationMaster。主要功能包括:与ResourceManager调度器协商以获取抽象资源(Container);负责应用的监控,跟踪应用执行状态,重启失败任务等;并且与NodeManager协同工作完成Task的执行和监控。Yarn工作机制与调度器02Yarn的工作机制01YARN中应用(Application)运行机制(流程)Yarn的工作机制02YARN中任务进度监控Yarn新增功能03新旧框架比较同:客户端不变,其调用API及接口大部分保持兼容异:原框架中核心的JobTasker和TaskTracker不见了,取而代之的是RM,AppMaster和NM三个部分Yarn的改进RM相对于JobTracker,大大减少了资源的消耗,并且让监测每个Job子任务(task)状态的程序分布式化了。在Yarn中,AppMaster是一个可变更的部分,用户可以对不同的程序模型编写自己的AppMaster,让更多类型的编程模型能够跑在Hadoop集群中。容错率更好,AppMaster监控task运行情况,RM监控AppMaster的状况,一旦出问题会在其他机器上重启Yarn调度器04调度器种类YARN调度器分三种:(1)FIFOScheduler→先进先出调度器(2)CapacityScheduler→容器调度器(3)FairScheduler→公平调度器Yarn调度器05FIFOScheduler最简单的调度器job1运行完后,job2才能获取到资源Yarn调度器06CapacitySchedule分成多个队列,每个队列占用一定资源,可以看作是FIFOScheduler的多队列版本。每个队列可以限制资源使用量。但是,队列间的资源分配以使用量作排列依据,使得容量小的队列有竞争优势。注意:如果不限制某队列最大容量,则运行过程中,它可以占用全部资源。YARN默认采用CapacitySchedul

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论