2023学年完整公开课版YARN 运行机制_第1页
2023学年完整公开课版YARN 运行机制_第2页
2023学年完整公开课版YARN 运行机制_第3页
2023学年完整公开课版YARN 运行机制_第4页
2023学年完整公开课版YARN 运行机制_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

YARN运行机制1、了解YARN运行机制01目录导语02YARN运行机制导语1导语

yarn运行机制图解。YARN运行机制2YARN运行机制

1、作业提交。该过程与MR1的很相似。步骤1使用的API以及过程与MR1的相同,让后从ResourceManager中获取新的ID,这是一个应用程序的ID(步骤2)。接着客户端检查作业的输出分片,计算输入分片并将作业资源复制到HDFS中。最后,调用ResourceManager调用submitApplication()提交作业。YARN运行机制

2、作业初始化。(1)首先,ResourceManager里的ApplicationManager会为每一个application(比如一个用户提交的MapReduceJob)在NodeManager里面申请一个container,schedule则在NodeManager里面分配申请的container。然后在该container里面启动一个ApplicationMaster(步骤5a,5b)。(2)ApplicationMaster的主类是MRAppMaster。其通过创造一些bookkeeping对象来监控作业的进度,得到任务的进度和完成报告(步骤6).然后其通过分布式文件系统得到由客户端计算好的输入分片(split)(步骤7).然后为每个输入分片创建一个map任务,根据mapreduce.job.reduces创建reduce任务对象。YARN运行机制

2、作业初始化。(3)ApplicationMaster决定如何运行构成整个作业的任务。如果作业很小,ApplicationMaster会选择在其自己的JVM中运行任务,这种作业称作是被unerized,或者是以uber模式的方式运行。(4)在任务运行之前,作业的setup方法被调用来创建输出路径,在YARN中是由ApplicationMaster调用的。YARN运行机制

3、任务分配。如果不是小作业,那么应用管理器向资源管理器请求container来运行所有的map任务和reduce任务(步骤8),每个任务对应一个container,且只能在该container上运行。这些请求是通过心跳来传输的,包括每个map任务的数据位置,比如存放输入分片的主机名和机架(rack).调度器利用这些信息来调度任务,尽量将任务分配给存储数据的节点,或者退而分配给和存放输入分片的节点相同机架的节点。请求也包括了任务的内存需求,默认情况下map和reduce任务的内存需求都是1024MB,可以通过mapreduce.map.memory.mb和mapreduce.reduce.memory.mb来配置。YARN运行机制

4、任务执行。当一个任务由ResourceManager的调度器分配给一个container后,ApplicationMaster通过节点管理器来启动container(步骤9a,步骤9b)。任务有一个主类为YarnChild的Java应用执行,在运行任务之前首先本地化任务需要的资源

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论