LSF作业管理系统使用方法_第1页
LSF作业管理系统使用方法_第2页
LSF作业管理系统使用方法_第3页
LSF作业管理系统使用方法_第4页
LSF作业管理系统使用方法_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、LSF作业管理系统使用方法LSF作业管理系统使用方法8/8LSF作业管理系统使用方法页眉内容LSF作业管理系统使用方法这份文档将指导您经过LSF提交和管理作业。文档包含了使用LSF提交、查察、删除作业的相关内容。依据文档的操作规范和反响方法,将帮助您顺利完成工作。也欢迎大家对文档内容提出建议,感谢!Contentshide1经过LSF查察集群运行状态1.1查察LSF计算节点列表bhosts1.2查察LSF队列bqueues1.3查察计算节点负载lsload2使用LSF提交作业bsub2.1手动提交作业2.2交互式批量提交2.3编写LSF作业控制脚本2.4一个功能更圆满的LSF作业控制脚本其他作

2、业管理操作3.1查察作业状态bjobs3.2停止作业bkill3.3监察作业输出bpeek3.4作业历史信息bhist4参照资料Birthday页眉内容经过LSF查察集群运行状态查察LSF计算节点列表bhosts#bhostsHOST_NAMESTATUSJL/UMAXNJOBSRUNSSUSPUSUSPRSVfat01ok-1600000fat02ok-1600000fat03ok-1600000fat04ok-1600000fat05ok-1600000fat06ok-1600000fat07ok-1600000fat08ok-1600000fat09ok-1600000fat10ok-1

3、600000查察LSF队列bqueues查察所有队列的整体信息:#bqueuesQUEUE_NAMEPRIOSTATUSMAXJL/UJL/PJL/HNJOBSPENDRUNSUSPcpu40Open:Active2072020720fat40Open:Active0000gpu40Open:Active28802880Birthday页眉内容mic40Open:Active0000cpu-fat40Open:Active160160查察某个队列的信息:#bqueuesfatQUEUE_NAMEPRIOSTATUSMAXJL/UJL/PJL/HNJOBSPENDRUNSUSPfat40Open

4、:Active0000查察计算节点负载lsload查察整体负载:#lsloadHOST_NAMEstatusr15sr1mr15mutpglsittmpswpmemnode011ok0.00.30.40%0.0049024193G62G61Gnode039ok0.00.60.50%0.0049024194G62G61Gnode041ok0.00.00.00%0.0049024194G62G61Gnode050ok0.00.00.00%0.0049024194G62G60Gnode064ok0.00.70.60%0.0049024194G62G61Gnode077ok0.00.70.50%0.0

5、049024194G62G61G查察某个节点的负载:#lsloadnode001HOST_NAMEstatusr15sr1mr15mutpglsittmpswpmemnode001ok0.30.10.11%0.00332152G62G61G使用LSF提交作业bsub手动提交作业Birthday页眉内容LSF使用bsub提交作业。bsub命令的格式是:bsub-nZ-qQUEUENAME-iINPUTFILE-oOUTPUTFILECOMMAND其中:Z提交作业需要的线程数,-q指定作业提交的队列。若是不增加-q选项,系统将把作业提交到默认的作业队列。INPUTFILE表示程序需要读入的文件名,

6、OUTPUTFILE表示输出文件名,作业提交后的输出到标准输出信息将会保存在这个文件中。对于串行作业,COMMAND可以直接使用您的程序名。比方,将串行程序mytest的经过LSF提交:bsub-n1-qq_default-omytest.out./mytest对于MPI并行作业,COMMAND的格式为-ampich_gmmpirun.lsfPROG_NAME。比方,将并行程序mytest,经过LSF提交,使用16个线程运行这个作业:bsub-n16-qq_default-omytest.out-ampich_gmmpirun.lsf./mytest交互式批量提交使用bsub还可以启动一个交互

7、式的shell环境,一次提交多个运行参数相同的并行作业。比以下面的操作:bsubbsub-n16bsub-qq_defaultbsub-ooutput.txtbsubCOMMAND1bsubCOMMAND2bsubCOMMAND3等价于:Birthday页眉内容bsub-n16-qq_default-ooutput.txtCOMMAND1bsub-n16-qq_default-ooutput.txtCOMMAND2bsub-n16-qq_default-ooutput.txtCOMMAND3编写LSF作业控制脚本#BSUB-n16#BSUB-qq_default#BSUB-ooutput.tx

8、t-ampich_gmmpirun.lsf./mytestbsub还接受来自标准输入的作业说明。因此,我们可以编写LSF脚本提交作业。bsub脚本简单易写,上面一段代码是名为bsub.script的圆满例子,将bsub.script经过输入重定向,提交给LSF:bsub&/dev/nulltouchnodelisttouchnodesNP=0forhostinecho$LSB_MCPU_HOSTS|sed-es/:/g|seds/:n/nn/gdoecho$hostnodelistecho$host|cut-d:-f1nodesnn=echo$host|cut-d:-f2NP=echo$NP+$nn|bcdone其他作业管理操作查察作业状态bjobs检查已提交的作业的运行状态:bjobs以宽格式来显示作业运行状态:bjobs-w显示所有作业:bjobs-a显示正在运行的作业:bjobs-r显示等待运行(pending)的作业和等待的原因:bjobs-pBirthday页眉内容显示已经挂起(suspending)的作业和挂起的原因:bjobs-s显示JOBID这个作业的所有信息:bjobs-lJOBID停止作业bkill停止不需要的作业:bkill停止JOBID这个作业:bkillJOBID直接将作业JOBID从LSF中移除,而不等待该作业的进度在操

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论