曙光集群用户使用手册_第1页
曙光集群用户使用手册_第2页
曙光集群用户使用手册_第3页
曙光集群用户使用手册_第4页
曙光集群用户使用手册_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-.z.登录和文件传输登录方式为ssh,与telnet功能类似,推荐的登录工具为putty或者SecureShell〔.oklinu*./html/download/ser/20070917/35112.html,绿色版无需安装〕在地址栏输入本集群的登录地址(node1对应的局域网IP),点击“翻开〞,就会出现登录窗口,输入用户名、密码即可。文件传输为sftp,与传统ftp类似,但其协议更平安可靠,推荐工具为filezilla。〔,绿色版无需安装〕输入登录地址,输入用户名和密码,端口填22〔本软件支持ftp,端口为21〕,点击快速连接,即可使用,操作方法与常用ftp工具类似。图形窗口支持Linu*推荐使用vnc。vnc可以将用户的操作状态保持在效劳器端,即使断开连接也不会影响到正在进展的操作、计算等。登录到linu*效劳器中,在命令行运行vncserver。第一次运行时需要输入VNC登陆用的密码:根据提示输入新的vnc密码。此密码与用户登录密码无关,将在登录vnc时需要。此处提示的node1:2即为vnc成功翻开的端口。运行vncclient,输入登录效劳器地址和端口号,点确定,输入前面设置的密码,即进入了图形窗口。注意:在第一次启动了vncserver之后,vnc的连接一直可用,全部图形窗口保持在Linu*效劳器上。因此,只在每次效劳器重新启动后运行一次vncserver即可,由于用户较多,请勿启动多个。如果需要使用node2的图形界面,可执行ssh-*node2。作业提交Fluent图形方式运行首先通过VNC登陆到图形界面,如果没有Terminal的话在桌面点击左键选择*term,输入以下命令即可运行:此处myhosts为用户指定的host文件,容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。在图形界面下导入cas和data文件,修改和设置边界条件等并计算(和在windows下操作单机版Fluent一样,略):注:通过VNC使用图形界面方式运行fluent时,无需保持PC机与效劳器的连接,只要vncserver没有重新启动,即可随时连接到原有的窗口。命令行方式运行建立script1文件:script1容如下:〔注:其中fl5m1.cas为cas文件名,根据实际进展修改;solve/iterate25表示迭代25步,也可根据需要修改步数。〕用命令行进展fluent计算:此处myhosts为用户指定的host文件,容如下所示:node1node1node1node1node2node2node2node2-t8即指定8个核心参与计算,分别为node1上的4个核心和node2上的4个核心。作业调度方式运行注:PBS只持Fluent命令行运行方式的作业提交1.编译脚本script1,容如下〔与上面脚本运行方式一样〕:file/rcdsolve/iterate25/file/wcdfl5m1_final.datparallel/timer/usagee*ityes2.编辑pbs脚本fluent.pbs,容如下:*!/bin/bash*PBS-Njob1-8cpu*PBS-lnodes=1:ppn=8*PBS-joeINPUTFILE=script1OUTPUTFILE=script1.logcd$PBS_O_WORKDIR**pib.daplindicateusingibprotocalandtheudaplway.t8indicatesusing*8processors*NP=`cat$PBS_NODEFILE|wc-l`datefluent3d-t$NP-f=$PBS_NODEFILE-g-i$INPUT>&$OUTPUTdatee*it0提交作业:qsubfluent.pbs用qstat-a和pbsnodes-a以及top命令查看作业是否正常排队运行。注:红色字体局部需要根据实际情况改动,黑色字体为固定格式的容。获取计算结果1.如果用图形界面的方式运行fluent,可以在菜单中选择选择保存dat文件到当前工作目录或其他*个目录下,然后用ftp软件将dat文件下载到终端pc机上,即可进展后处理。2.如果用命令行的方式运行fluent,dat文件自动保存到当前目录,文件名由script1文件的容决定〔例如“file/wcdfl5m1_final.dat〞则表示dat文件为fl5m1_final.dat〕,用软件将dat文件下载到终端pc机上,即可进展后处理。Ansys作业图形方式运行通过vnc登录以后,运行launcher121,即可进入ansys界面,选择相关的模块点击run即可。命令行方式运行在命令行方式下,不能进展交互的图形操作,所有的命令需要通过命令流来实现。假设写好的命令流文件为input.inp,运行方式如下:单节点:ansys121-np16-iinput.inp>&output.log&多节点运行:ansys121-dis-machinesnode1:16:node2:16-iinput.inp>&output.log&作业调度方式运行编写一个pbs脚本ansys.pbs如下所示:*!/bin/bash*PBS-joe*******************whatyoujustneedandcouldeditarebetweenthetwolines***********************PBS-Nmy_ansys_test*PBS-lnodes=1:ppn=16INPUTFILE=wing.inpOUTPUTFILE=wing.log***********************************************theend**********************************************cd$PBS_O_WORKDIRnp=1forNODEin`cat$PBS_NODEFILE`;dohost=$NODEif[!-z$lasthost];thenif[$host=$lasthost];thennp=`e*pr$np+1`elseif[-z$mList];thenmList=$lasthost:$npelsemList=$mList:$lasthost:$npfinp=1fifilasthost=$hostdoneif[-z$mList];thenmList=$lasthost:$npelsemList=$mList:$lasthost:$npfiansys121-dis-machines$mList-i$INPUTFILE-o$OUTPUTFILE写完以后提交方式与fluent一样,qsubansys.pbs即可。CF*作业图形方式运行在图形窗口中运行cf*5即可。命令行方式运行CF*支持PVM和MPI两种方式的并行,通常MPI的性能更好一些,建议采用。同时还有Local和Distributed两种运行模式,单机上建议采用Local模式,而跨节点时只能采用Distributed模式。cf*5solve命令可直接进入求解模式。cf*5solve-defBenchmark.def-par-dist'node1*8'在本机上用8个核心并行cf*5solve-defBenchmark.def-par-dist'node1*8,node2*8'采用2个节点各8个核心进展分布式并行计算作业调度方式运行[testnode34cf*bm]$catpbs_cf*.ib*!/bin/bash*PBS-NCF*_8cpu*PBS-lnodes=1:ppn=8INPUTFILE=Benchmark.defOUTPUTFILE=Benchmark.log************************************************************************Youdon'tneedtomodifythelinesbelow************************************************************************PeHostfile2MachineFile(){cat$1|whilereadline;do*echo$linehost=`echo$line`*addherecodetomapregularhostnamesintoATMhostnamesif[-z$mList];thenmList=$host"*1"elsemList=$mList,$host"*1"fiecho$mListdone}CF*_PBS_NODEFILE="/tmp/cf*_`whoami`_$PBS_JOBID"PeHostfile2MachineFile$PBS_NODEFILE|sed"s*bnode*node*g">$CF*_PBS_NODEFILENPROCS=`wc-l$PBS_NODEFILE`cd$PBS_O_WORKDIRcf*5solve-def$INPUTFILE-par-dist`tail-n1$CF*_PBS_NODEFILE`写完脚本就可以按如下方式提交作业:[testnode34cf*bm]$qsubcf*.pbsABAQUS作业图形方式运行在图形窗口中运行abaquscae即可。命令行方式运行单节点运行:abaqus-jBeamloading.inpcpus=8跨节点运行:首先需要添加指定运行节点。在工作目录进展以下操作:echo"mp_host_list=[[\‘node1\’,8],[\‘node2\’,8]]">abaqus_v6.env表示分别从node1、node2调用8个core来进展计算。设置好了环境变量以后,通过abaqus-jBeamloading.inpcpus=16int来运行。作业调度方式运行[testnode34cf*bm]$catpbs_cf*.ib*!/bin/bash*PBS-Nabaqus_job*PBS-lnodes=2:ppn=8*PBS-joe****changeyourinputfileandjobnamehere****INPUTFILE=studyQA_std.inpJOB=`echo$INPUTFILE|cut-d"."-f1`cd${PBS_O_WORKDIR}source/public/software/Abaqus-6.9/abaqus.shcpus=$(wc-l$PBS_NODEFILE|awk'{print$1}')mp_host_list="["fornin$(sort-u$PBS_NODEFILE)domp_host_list="${mp_host_list}['$n',$(grep-c$n$PBS_NODEFILE)],"donemp_host_list=$(echo${mp_host_list}|sed-e"s/,$/]/")echo"mp_host_list=${mp_host_list}">abaqus_v6.envSTARTTIME=`date`****themaine*ecutemandabaqusjob=${JOB}cpus=${cpus}mp_mode=mpistandard_parallel=allinteractiveENDTIME=`date`echo"thejobstartat:${STARTTIME}"echo"thejobendat:${ENDTIME}"Web提交使用IE翻开:8080,并使用对应的用户名和密码登陆,点击作业调度-作业提交集群名称为唯一的选项Cluster_node。。。,队列选择必须是用户对应的许可的队列,工作路径为输入文件所在的目录,通常为用户home目录下的含有模型文件的*一子目录,如test用户目录下的fluent目录中存放了fluent的输入文件fluent.jou、fluent.dat、fluent.cas,则工作路径为/cae01/home/test/fluent。选择命令行提交方式,将前面写好的pbs脚本放入输入框中,点击提交,即可将作业提交到对应的队列。常用pbs命令qsub命令—提交作业命令格式:qsub[-adate_time][-cinterval][-Cdirective_prefi*][-epath][-I][-jjoin][-kkeep][-lresource_list][-mmail_options][-Muser_list][-Nname][-opath][-ppriority][-qdestination][-rc][-Spath_list][-uuser_list][-vvariable_list][-V][-Wadditional_attributes][-z][script]参数说明:因为所采用的选项一般放在pbs脚本中提交,所以具体见PBS脚本选项。例:*qsubaaa.pbs提交*作业,系统将产生一个作业号qstat命令—查询作业命令格式:qatat[-f][-a][-i][-n][-s][-R][-Q][-q][-B][-u]参数说明:-fjobid列出指定作业的信息-a列出系统所有作业-i列出不在运行的作业-n列出分配给此作业的结点-s 列出队列管理员与scheduler所提供的建议-R 列出磁盘预留信息-Q操作符是destinationid,指明请求的是队列状态 -q列出队列状态,并以alternative形式显示-auuserid列出指定用户的所有作业-B列出PBSServer信息-r列出所有正在运行的作业-Qfqueue列出指定队列的信息-u假设操作符为作业号,则列出其状态。假设操作符为destinationid,则列出运行在其上的属于user_list中用户的作业状态。例:*qstat-f211查询作业号为211的作业的具体信息。qdel命令—删除作业命令格式:qdel[-W间隔时间]作业号命令行参数:例:*qdel-W1521115秒后删除作业号为211的作业setserverdefault_queue=batch"PBS脚本文件PBS脚本文件由脚本选项和运行脚本两局部组成。(1)PBS作业脚本选项〔假设无-C选项,则每项前面加‘*PBS’〕-adate_time:date_time格式为:[[[[CC]YY]MM]DD]hhmm[.SS]表示经过date_time时间后作业才可以运行。-cinterval:定义作业的检查点间隔,如果机器不支持检查点,则忽略此选项。-Cdirective_prefi*:在脚本文件中以directive_prefi*开头的行解释为qsub的命令选项。〔假设无此选项,则默认为’*PBS’〕-epath:将标准错误信息重定向到path-I:以交互方式运行-jjoin:将标准输出信息与标准错误信息合并到一个文件join中去。-kkeep:定义在执行结点上保存标准输出和标准错误信息中的哪个文件。 keep为o表示保存前者,e表示后者,oe或eo表示二者都保存, n表示皆不保存。假设忽略此选项,二者都

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论