北京师范大学并行计算实验室作业调度_第1页
北京师范大学并行计算实验室作业调度_第2页
北京师范大学并行计算实验室作业调度_第3页
北京师范大学并行计算实验室作业调度_第4页
北京师范大学并行计算实验室作业调度_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京师范大学并行计算实验室作业调度主要内容一、作业提交流程二、WEB作业提交及管理三、命令行作业提交及管理四、常见问题及错误作业提交流程作业提交一览Ssh至登录节点(0)新建工作目录(mkdirtest)进入工作目录(cdtest编辑作业提交脚本(vi)提交作业脚本(qsub)查看作业运行状态(qstat)WEB作业提交-基本属性1. 作业提交基本属性:0:8080/TSJMWEB作业提交-基本属性作业提交基本属性介绍作业名称

自定义作业名称,用于区分该作业与其他作业(必填,英文)2. 队列

选择作业所要提交的队列(必选)资源(必填,串行作业为1:1)

作业运行所需要的资源。以节点数:核数形式列出

如2:4,即需要2个节点,每个节点4个核心注意:节点数不要超过5,每节点核心不要超过10工作目录

指定作业运行的工作目录。作业运行产生的中间数据将存放在此目录作业提交脚本(必填)

指定作业提交脚本(也可以在线编辑)WEB作业提交-高级属性1. 作业提交高级属性删除线表示不常用作业提交高级属性介绍选择网络

集群中多套网络时,选择作业运行所在网络(IB,千兆)2. 正确输出

作业的正确输出文件路径(默认输出在工作目录下)错误输出

作业的错误输出文件路径(默认输出在工作目录下)报警

可以选择是否要在作业开始、结束或发生故障时报警检查点

指定作业是否设置检查点,以及作业添加检查点时间间隔(只支持串行作业)WEB作业管理作业列表:当前登录用户所有已提交作业删除线表示不常用作业管理操作说明运行

使作业无需排队,直接运行(需要管理员权限)2. 停止、释放

使作业暂时停止、恢复作业运行删除

删除一个作业保存检查点

手动保存当前时刻作业检查点获取检查点、从检查点恢复

获取所有已保存检查点,可以从中选择一个检查点恢复作业运行WEB作业管理作业管理右键操作WEB作业管理查看作业详细信息WEB作业管理查看作业输出WEB作业管理查看作业调度日志命令行作业提交准备一、注意先要申请帐号,获得帐号后,通过远程登录,执行以下操作,完成无密码访问配置:1:”cp/opt/ssh/ssh-configure/hostfile.”2:”/opt/ssh/ssh-configure/step1.expusername”3:”/opt/ssh/ssh-configure/step2.expusernamepassword”二、服务器集群节点信息:刀片节点cu01~cu05胖节点:fatGPU节点:gpu管理节点:mu01(禁止在管理节点上运行自己的任务)命令行作业提交qsubxx.sh-lnodes=2:ppn=4

需要2个节点,每个节点上4核-epath

错误信息输出的路径-opath

正常输出信息输出的路径 -qbatch

作业提交队列(目前有batch和gpu两个队列)作业提交串行脚本编写-N作业名

-lnodes=2:ppn=4需要2个节点,每个节点4个核-lnodes=cu01指定具体计算节点cu01-lnodes=cu01+cu02指定具体节点cu01,cu02注意:提交作业时,1个作业不要占用集群所有资源。如当前6个节点每个节点12个核,不要使用nodes=

作业脚本xx.sh编写如下:#PBS–Njob_name#PBS–lnodes=2:ppn=4#PBS–Pzhangsansleep1000作业提交并行脚本编写(拷贝下面粗体脚本内容,存储为xx.sh)#/bin/bashEXEC=“/home/【你的用户名】/【可执行文件】"ARGS=""echo$PBS_NODEFILEcat$PBS_NODEFILE>~/nodefileNP=`cat$PBS_NODEFILE|wc-l`/opt/intel/impi/08/intel64/bin/mpirun-hostfile~/nodefile-np$NP$EXEC$ARGScat~/nodefile注意:一般情况只要复制上面的脚本,修改红色部分就可以了。不要用中文作业提交查询

qstat无参数查询所有作业信息-B查询服务器状态-Q查询队列状态-n查询每个作业的基本信息

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论