南师大数科院重点实验室集群使用手册应用_第1页
南师大数科院重点实验室集群使用手册应用_第2页
南师大数科院重点实验室集群使用手册应用_第3页
南师大数科院重点实验室集群使用手册应用_第4页
南师大数科院重点实验室集群使用手册应用_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、南师大数科院省重点实验室集群使用手册V1.0)1. 集群的各项配置信息1.1硬件配置集群共有108个计算节点,4台登陆管理节点,2台I/O节点,1台胖节点,1 台 GPU 节点组成。根据具体情况,会开启部分或全部节点供计算使用。108个计算节点配置如下:a) CPU:2* Intel Xeon 6C X5650 2.66GHzb) Memory: 12* 4GB DDR3 LP RDIMMc) Hard Disk: 1* 2.5in SFF Slim-HS 10K 6Gbps 300GB SAS 10K胖节点配置如下:a)CPU: b )Memory: c)Hard Disk:4* Intel

2、 Xeon 8C E7-4820 2.0GHz64*8GB DDR3 LP RDIMM4* 2.5in SFF Slim-HS 10K 6Gbps 300GB SAS 10K 1.2 软件配置集群域名: 集群登录 IP:33操作系统: Red Hat Enterprise Linux 5.7编译器 : Intel C+ Linux 2011.7.256, Intel Fortran Linux2011.7.256数学库: Intel Math Kernel Library 11.0MPI 实现: MVAPI2集群管理软件:君富 EasyCluster 高性能计算集群管理

3、软件 V1.6已安装的科学软件: vasp 4.6 2. 使用指南2.1 如何登录集群?两种方法可以访问集群:(1) 使用 ssh client ,如 ssh secure shell client ,启动后连接集群即可,第 1 页 共 13 页如下图所示:Ole Edt yjsw 匹indciw yelpIB aa圖単p錢jQ %够擀彳 Wl Quick 匚onnect Profiles翱H SecHES heil 3*29 (Build 263)Copyrigtit (c) 2000-2003 33H Comiaunications Security Corp - tittp: /uini

4、r. ash. com/Thia ccipy of SSH Secure Shell is a non-conuaercial version. Thi3 versionConnect tP ReMoteHostHolt Hut;Uitr Nw;202. lie. 111. IDOEort应uthenticatifln|uisr02|Elrofile SetUlt5CflMlMtjlCmctl IHot conntcted - prtii Entar or Sptct to (2)使用 EasyCluster打开IE 浏览器,输入URL :htt P: /33/easy

5、cluster,出现如下界面:共13页厂邑S艷畝iti?弁H宣理Ufl Tlx S FindDVff IntcEne ExploEe-r二 P二冏-n * F卫味面吧 5 x* QD ?迎来劃玄&科MH目响正旺运钉由旺村 T -t- fc至目丽JeR夹罰了朗4个任务 *期4目方S長長皐奎t rtiLifwJ Siii ( rtichen)有甘見店目灯郭|欧鼠第 12 页 共 13 页M 吕琲,直士衣吒无菲申 iStlkTS1v-riiidcve6iLi仃V花.玛口I纟小J1览甜餌用戸苗壬比址下S,丈55- Ag6_6C:?pvr ::i m仃! ?QQ? hJ.Jiii HJ :i TlFGr

6、r:jL- Corp. Al RiqtiL:; PjL-:;rhd注:(1)首次使用EasyCluster,请按照上述界面提示,下载插件并安装,否则将无法正常浏览EasyCluster。单机界面中黄颜色的“此处”超级链接,即可下载插件(使用IE的 windows 用户和使用firefox的Linux用户,请根据界面提示下载对应的插件包),下载完成后双击即可开始安装。EasyCluster的帐户系统和服务器(指安装 EasyCluster 服务器端程序的服务器)操作系统的帐户是一致的。换句话说,用户只需要使用一套用户名和口令就可以登录EasyCluster 和服务器的Linux/UNIX 操作系

7、统。插件安装完成后,输入帐号和密码,进入EasyCluster系统主界面,如下图所示:I ais.iC 岀 i ffB i宙刃W范如悝!1=计H玉薛i its主功能导航厂子功能 导航段百正S执厅的辭?超!童1于毛,址滙曰期设右枉何ima?冋?呼IT删T Biff写一幷FatcATjaam康吗页a提交as任世帀as谨Si)爭 Q讪師a技料顶更虫持必5宜3本恒E那tfcS =ibU善iin户耳买姓屯:未SS门:E亜任4am单任务a栓B!:铀 niatri.q可卑臥列:maOb.q Ma嚅 q輙右XL腔方*搖(时己Effi直E:IMO.OnOD己悽用点ffi:4J503呵用直E :9K.2igT2.

8、2如何退出登录? 使用方法然后关闭ssh clie nt 软件即可。将清除用户的登录信1、退出系统链接。通过单击该超链接,EasyCluster息,回到登录界面,从而安全的退出EasyCluster系统。在此,我们强烈推荐用户每次退出系统都通过这种方式进行,而不是直接将浏览器关闭。2、主功能导航。此处是EasyCluster全部功能的清单,从图上可以看出,EasyCluster的功能模块主要有提交任务、任务管理、消息管理、待办事宜、记帐信息、控制面板。1,即ssh client登录集群的用户,请输入命令“exit ”退出登录。使用方法2,即EasyCluster的用户,请单击主界面中的“退出”

9、超链接退出登录,然后关闭浏览器即可。2.3如何上传/下载文件?使用ssh client登录上集群之后,使用sftp功能即可上传下载文件。sftp是基于SSH的FTP实现,传输安全稳定。以上述 ssh secure shell client软件为例,登录进入集群之后,单击下图 1中所示的工具栏按钮,即可打开 SFTP的界面(如下图2):9 2U2. I Jl. 111. lUU - default - SSU Srcuie JhEll国 |f7Ete Ed(t览0料翌的如 bJat)B刍a 釧电冃戸料ZjQ專应k?/1 Qutt Comect PnofilKLarc ioffin: Itiu U

10、 X0;0: 09 2009 uneuDEEhfiC |J aaa eJ9”山十单击这个按钮即可打开SFTP2:192JtSr&.25J - Eric/pricvm - Sire FiteTranpfer鉀举髯旳vn 凹iMh 戦鼻臥 ElQ电!炉叵1七E住S jff衢摩x57U快理S式2m7-IM-30 2Z3L:2OMySqL 5$Hn Irxf htonftiH2,X快强”式zmz-Dti-zi 血(n:s孕 5ahA 砂 hKMcfi.-+3快JIH式2IM7-IM-O6 lc33:iaIVflrtfia-b-efLJ+3快J1S式2IM7-CH- 1ML:Z2QyajltinstBf

11、crBUI快J1S式2IM7-IH-M 1C53:3E+ML,45flISfflfl 式2IM7-C+L3 HkLJfU|AwtTranpfci- j jC I SXJH FitSOLTCtCWKtlKVDestnabOTiDwectDTVSue S加応SpeedTme在SFTP的界面中,左侧是本地硬盘的文件浏览界面,右侧是远程服务器上 的文件浏览界面,使用“拖拽”的方法即可完成文件的上传和下载。即将文件或 文件夹从左侧拖拽到右侧,即可完成文件的上传;将文件从右侧拖拽到左侧, 可完成文件的下载。2.4如何提交一个普通计算任务?使用EasyCluster提交计算任务。EasyCluster带有一

12、个任务调度系统, 在EasyCluster中提交的任务,将根据任务的要求和相应的配置情况,被放入 任务排队队列。同时,EasyCluster会根据集群目前的负载情况,自动挑选出 满足任务条件的计算节点,将任务放到这些节点中运行。(1)提交一个普通的计算任务,在 EasyCluster左方的主功能导航中,单击【提交任务】,出现如下界面:雨亟丸学SI空幅计UK群I II肉爲I亜凹田将单01 f SUP 0塞1151对式1曲再商; I一 as任务时列一*|诵an-R因 一 V康蜿页口 虹1任Ea帀倉它理11破钢:待办$11皐 iStHnfl 11整类31:控时面颈1ahsttj?:1工菲目裂;H1岭

13、出目录:出 va*11?;IEH2K再、GajisianOl 1Wjiflftf PE JFFluent1jS&R:高缰耳项将这种任务提交表单填写完成,即可提交一个任务,该表单中各字段的含义和填写方法如下:填写项必须填写描述及操作任务名称VI用来标识任务的文字,建议不要超过8个字符。任务名称的第一个字符不能是数字,且任务名称中不能包含空格。任务类型VI选择是串行任务还是单机并行任务还是多机并行任务。串行:任务只有一个进程和线程做计算,只会只用一个CPU核;单机并行:在一个节点上采用多线程做并行计算,进程数项目的“最小”、“最大”栏目填写的数字均不得超过一个计算节点上的CPU核总数,否则任务会一

14、直处于等待状态。多机并行:多进程方式做并行计算, 特指基于MPI的分布式 多进程并行方式。如果选择并行任务,则后续的并行环境将成为必填项。执行程序71单击该项的【浏览】按钮将打开对话框供用户选定本次任 务的可执行程序。工作目录JI单击该项的【浏览】按钮将打开对话框供用户选定本次任 务的应用程序数据文件所在的子目录。输出目录71规定任务的输出信息文件存放的路径。单击该项中【浏览】按钮可弹出对话框供用户选择输出目录。EasyCluster会将任务的“写屏”信息重定向一个输出文件中,该项配置即指定 EasyCluster将该输出文件放置到哪个目录下。任务队列VI选择本次任务所使用的任务队列。任务队列

15、是指用户的任务在哪个队列里排队、运行。队列是用户授权和计算资源的集 合体,队列里定义了属于队列的节点机、用户组、并行环境、附属队列以及其它的属性。并行环境(PE)屮併)本项只对并行任务有效。并行环境中定义了MPICH并行软件的操作命令行、包含的节点列表等信息。此项配置将在 EasyCluster安装过程中配置完毕,用户无需关心。集群默认 的并行环境是mva pi2。进程数/ 併)本项只对并行任务有效。指本次并行任务需要多少进程进行 计算,必须填写数字。EasyCluster将自动查找满足任务条件的节点并启动程序,如果没有满足任务条件的节点存在,任 务将被挂起并排队。“最小” 一栏必须填,“最大

16、”一栏不填 写的话将默认使用预设的该用户的单任务最大进程数。合并输出EasyCluster任务调度模块在任务运行过程中或结束后会生成该任务的输出文件。输出文件共有四个,格式如下:.ovjobn ame.evjobn ame .po .p e其中.o和.e两个文件中存放的是任务本身的标准输出信息和标准出错信息;.po和.pe两个文件中存放的是EasyCluster任务调度模块本身的一些调试信息。如果将本项设置选中,表示将.o和.e文件合并,将.po和.pe文件合并,也就是说,输出变成两个文件, 不再是四个文件,这样方便阅读。邮件提醒选中“ Email地址”左方的复选框表示该任务需要打开邮件提醒功

17、能。在此情况下,Email地址将成为必填项。您还可以选择需要在什么情况下发出提醒,这可以通过勾选下方的“任务启动”、“任务完成”、“任务挂起”和“任务恢复”四个复选框来完成。未选中“ Email地址”左方的复选框表示该项任务不需要邮件提醒功能,此时,Email地址、任务启动、任务完成、任务挂起、任务恢复这几项界面元素的填写内容将被忽略。启动时间单击该项中的【浏览 】按钮可弹出日期时间选择对话框。此处供用户选择本次任务的预约启动时间。当预约启动时间达到时,EasyCluster将任务排入任务队列,如此时集群有满足任务条件的计算节点存在时,任务将启动,否则将继续排队。该项不填表示立即将任务排入任务

18、队列。命令行选本项目前只对并行任务有效。运行并行程序通常都需要一些第三方的软件的支持,如 MPICH、LAM等。本项内容指的是传递给启动并行程序脚本的参数,如传递给mpirun命令的参数。注意不要和“程序参数”一项混淆。程序参数指的是传递给执行程序的参数(用户选定的执行程序)。程序参数传递给执行程序的参数,如执行程序的输入数据文件。2.5如何查看正在执行的任务?单击EasyCluster功能菜单【任务管理】-【查询未完成任务】即可查询到正在执行的任务。在输出信息中,任务状态一栏若为“qw”表示任务正在排队;若为“ t”或“ r”状态表示任务已经开始运行。同时在这些信息中,可以查看到EasyCl

19、uster将任务放置到了哪个/哪些节点上执行。2.6如何修改我的登录密码?单击EasyCluster主功能菜单【控制面板】的子模块【修改登陆密码】,出 现如下界面:输入两次新密码即可完成密码的修改。注:EasyCluster的帐户系统和使用ssh client登录系统的帐户是一套系统,也就是说,在EasyCluster中修改了密码之后,下次登录,无论使用sshI ffi車兮:4吊Iclient还是EasyCluster,都必须使用修改后的密码方可登录。南甌愛逅主爭础11计虹痢*1 III型出F律叨II岳码;m认SS;H Sis* 页 口 113任务诵a垢机峦玛EmwCkJ日日rfflifcpr

20、au巩J程帏尸=1丑至花.址兀里删湮匚成陆后也谊桂用!(斤S辺fi量Lins系壻.Si/CJuiferterVEiJ?馳用户倍息a 鰹jtassEa使用命令行修改密码的步骤为:$ Passwd第9页 共13页$ mypass后面的 mypass 是同步帐户的2.7 如何编译一个串行程序?使用集群上的 Intel 编译器可以编译一个程序。如编译一个 C 程序,使用命令行:icc -o 如编译一个 C+ 程序,使用命令行:icpc -o 使用命令行:ifort -o 2.8 如何编译一个并行程序?如编译一个C 并行程序,使用命令行:第 18 页 共 13 页mpicc -o 如编译一个C+ 并行程

21、序,使用命令行:Mpicxx -o 如编译一个Fortran 程序( 77 或 90 均可),使用命令行:mpif90 -o 2.9 如何提交 Matlab 任务?数据准备启动 ssh/sftp 客户端软件并登录,将 *.m 文件上传至一个任务目录里。2 hpc.njnu - Xftp 4 (Free for Home/Schoci)JMew FolderHie Edit View Commands Tools Window HelpStmtusProgress SizePropertiesriiCreated a new. empty folder.29 objt(3)345.02MBH 1

22、 -二sh 1 1 1L 1Corr e r:pic話11 thpc.njnu xED LT些罔ED 丄 /h&rn/use4)01直苣1 -NameSize TypeNameSize TypeModiffed 二I_ 1 -1 - -&-匚 matlabjohjpg67KE JPEG 到it.config宜険3fll2/E/27, Li1. .ea&ycluter立夹2012/B/30, 2.gconf2G12/E/31, 91 .geon 阳卜 CL2/B/31, 91 .gnome-de&ktopArrange Imhj by卜 CL2/B/23, L.gnom已2.9nDme2_pri

23、;ate-Select 如 1t)L2/E/27, Ltol2/B/27, L,.TntaNShieHRefreshL2/E/23, L .(frkP菲怕Cfrl-yq FS 2富T煜nT曰玉I LogsReceire-C 屈 _* Run - 11pics X1 國 lEH-r;1 hpcnjnu 二匚! 1 /home/uierOOl/ca&es/matlabConnrrt1 c-b 也 1in丄.p花&NamesizeType 上NameSizeTypeM-odjfiedL., JI文11夬J - 昆 matlabjobjpg67KBJPEG 蚩jnC.m1KBM妬20I2/?/7. g

24、;w匚jiiTik 日iqpg1曲KBJPEG a,|,1 JunL.mIKeM文件2012/7. 9:19IfunO.mtKBM知* rfun.miKeIwl文件2QI12/5/7. 9:14L J-funl.mIKBM文It ; fun.miKeM文怦2012/7. g;19.(un2rmLKBM却,fuR4.mIKEM袁件2012/7, 9:L9fun3-mIKEM知4,:Jun5.mIKeM文件ZDIJ/?/?. 3:19jfun4_m1KB制文忡一.-fun.mIKBM卤t11Transtera Log?NameStatusP fogrestSheLocal Rath一1提交Matlab 任务有两种方式可以提交matlab 任务(1)通过Easycluster 界面提交任务首先登录进入Easycluster的普通用户界面,点击提交任务,在右边的提交任务框内填写必要的项目。任务名称:要求最多8个西文字母或数字,且首字符必须是字母。基本信息maobf捞类型:扭行程瘙:工作目录:辂岀目录:忌串行 厂单机(SMP笄行 參机(分布式)并行pm国fus r/l ocal/Tvl aitlab2l 10 a/bin/m atlab/horn e/us e rtJ01 /casesitiom e/Us e rO01 /case smatlab.q#行环愦(PE):谨程数:最小:昂大:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论