集群作业管理系统简介_第1页
集群作业管理系统简介_第2页
集群作业管理系统简介_第3页
集群作业管理系统简介_第4页
集群作业管理系统简介_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、集群作业管理系统简介报告人:罗正平 导 师:肖炳甲研究员1报告主要内容1、集群简介2、作业管理系统PBS简介3、作业脚本示例21 集群简介 集群是一组独立的计算机(节点)的集合体,节点间通过高性能的互连网络连接;各节点除了可以作为一个单一的计算资源供交互式用户使用外,还可以协同工作并表现为一个单一的、集中的计算资源供并行计算任务使用。 机群的各节点都是一个完整的系统:工作站,PC机或SMP机器;互连网络通常使用商品化网络,如以太网、FDDI、ATM等;网络接口与节点的I/O总线松耦合相连;各节点通常有一个本地磁盘;各节点有自己的完整的操作系统。各节点除了可以作为一个单一的计算资源供交互式用户使

2、用外,还可以 协同工作并表现为一个单一的、集中的计算资源供并行计算任务使用。特征:3Internet1 集群简介Ctrldata Cluster(.8)管理节点配置:CPU:Intel(R) Xeon(R) 1.6G内存:4G(41.0G)系统:Linux AS4.0计算节点配置:CPU: Intel(R) Xeon(R) 3.0G内存: 4G(41.0G)系统:Linux AS4.042 作业管理系统-PBS最初由NASA在20世纪90年代早期开发面向集群系统提供有效的作业管理服务目前有两个版本:OpenPBS(开源)和PBSPro(商业)CHESS集群管理系统集成了PBS系列管理软件TOR

3、QUE。PBS: Portable Batch SystemTORQUE:Tera-scale Open-source Resource and QUEue manager52 作业管理系统-PBS特点易用性:PBS为所有资源提供统一的借口,易于配置,作业调度灵活移植性:用于shell和批处理等各种环境适配性:适配与各种管理策略,提供可扩展的认证和安全模型灵活性:支持交互、批处理、串行及并行作业扩展性:标准PBS支持约300个节点,满足集群需要TORQUE:基于PBS项目的开源软件,可以认为是开源的OpenPBS的改进版。其优点有:扩展性强:TORQUE可以支持超过1500个节点容错性好:修正

4、了大量的bug,提供更多故障支持62 作业管理系统-PBS结构PBS Server:运行于集群的管理节点。创建并接受作业、修改作业、激活调度器(PBS Scheduler)以及通知PBS执行器(PBS Moms)执行作业PBS Scheduler:根据资源管理器获知各个节点的资源状况和系统的作业信息生成相应的作业优先级列表PBS Moms:每个节点均有一个后台进程,该进程真正启动和停止提交到该节点的作业72 作业管理系统-PBS作业会话实现clientserverscheduler1723456mommommommommommommommommomqsub82 作业管理系统-PBS常用命令作业

5、提交命令-qsub命令格式: qsub my_script返回信息: 作业ID号92 作业管理系统-PBS常用命令作业状态检查命令qstat命令格式:qstat -f102 作业管理系统-PBS常用命令作业挂起命令-qhold命令格式: qsub job_id作业删除命令-qdel命令格式: dsel job_id 详细信息请查询PBS使用指南113 作业脚本示例runefit.pbs#PBS -S /bin/bash#PBS -o out_runefit#PBS -e err_runefit#PBS -l nodes=4:ppn=2echo -echo -n Job is running o

6、n node ; cat $PBS_NODEFILEecho -echo PBS: qsub is running on $PBS_O_HOSTecho PBS: originating queue is $PBS_O_QUEUEecho PBS: executing queue is $PBS_QUEUEecho PBS: working directory is $PBS_O_WORKDIRecho PBS: execution mode is $PBS_ENVIRONMENTecho PBS: job identifier is $PBS_JOBIDecho PBS: job name

7、is $PBS_JOBNAMEecho PBS: node $PBS_NODEFILEecho PBS: current home directory is $PBS_O_HOMEecho -cd $PBS_O_WORKDIR./efitd129d不必要部分12-Job is running on node chess_004.localdomainchess_004.localdomainchess_003.localdomainchess_003.localdomainchess_002.localdomainchess_002.localdomainchess_005.localdomainchess_005.localdomain-PBS: qsub is running on chess_001.localdomainPBS: originating queue is defaultPBS: executing queue is verysmallPBS: working directory is /home/lzp/efit/efitht7uPBS: execution mode is PBS_BATCHPBS: job identifier is 270.chess_001.localdomainPBS: job name is ru

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论