阿里云高性能计算-软件镜像简介-D_第1页
阿里云高性能计算-软件镜像简介-D_第2页
阿里云高性能计算-软件镜像简介-D_第3页
阿里云高性能计算-软件镜像简介-D_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高性能计算软件镜像高性能计算/软件镜像高性能计算/软件镜像 PAGE 4 PAGE 4软件镜像深度学习和HPC工具集用户手册专为阿里云GPU物理机定制的深度学习和HPC工具集,在阿里云Docker Hub上发布。阿里云官方DockerHub地址 HYPERLINK /search.html /search.html访问hub可以查看阿里云提供的镜像以及缓存的社区公开镜像;进入控制台可以创建和管理自己的docker镜像。新用户第一次使用阿里云Docker服务,用户需要先注册成为开发者,步骤如下:打开上面的阿里云Docker Hub,未登陆的,先使用云账号登录,登录/注册在左上角;点击右上角管理中

2、心,如下图:对新用户会弹出去注册开发者的页面:注册成功之后,点击进入管理控制台,下次进入也可以在Docker Hub页面,点击右上角管理中心进入。界面如下:选择左侧的Docker服务下面的镜像管理标签,新用户会提示设置自己的镜像仓库命名空间和密码。命名 空间是私人镜像的地址前缀。完成设置之后,可以开始使用阿里云Docker仓库。Dockerdocker阿里云官方docker仓库地址为: registry . aliyuncs . com (公网) 在GPU物理机上,对应替换为内网地址: registry - internal . aliyuncs . com (内网) HelloWorld(G

3、PU物理机预装CentOS 7系统,以下操作仅以CentOS 7为例,且使用root用户) 首先检查机器上安装的docker服务状态:# docker info正常会显示当前存储空间等信息。如果出错,请先尝试重启docker服务:# systemctl restart docker下一步,使用阿里云账号和之前设定的docker仓库密码,登录阿里云docker仓库:docker login Hello World:# docker run /alicloudhpc/hello-world 如果一切正常,说明机器的docker服务运行正常。使用深度学习和HPC工具集需要使用GPU的用户,最好先检查

4、物理机上的GPU状态是否正常,运行:# nvidia-smi 或者:# /usr/local/cuda/samples/1_Utilities/deviceQuery/deviceQuery 列出两块NVidia K40卡为正常。工 具 集 的 发 布 地 址 是 : HYPERLINK /detail.html?repoId=2 /detail.html?repoId=2 列出了包含的软件工具和简介。docker login之后,可以下载toolkit的镜像到本地:# docker pull /alicloudhpc/toolkit 重命名一个短名称:# docker tag /aliclo

5、udhpc/toolkit toolkit因为需要在docker容器中使用gpu设备,启动docker容器需要设定额外参数。推荐将如下内容保存到一个shell脚本(比如run-toolkit.sh),方便以后运行: #!/bin/bash DOCKER_BIN = /usr/bin/docker INTERACT = -ti #INTERACT=-d DATA_VOLUME = /disk1 DATA_MOUNT_POINT = /disk1 MEM_LIMIT = 96g set - e if $ # -lt 2 ; then echo Usage: $0 image command exi

6、t - 1elseIMAGE=$1shift1CMD=$fidevices=$(ls- 1 / dev | grep nvidia ) dev_param = for d in $devices ; do dev_param = $dev_param - device=/dev/$ddonetime_param=-v/etc/localtime:/etc/localtime:ro if!-z$CUDA_VISIBLE_DEVICES;thendev_env=-eCUDA_VISIBLE_DEVICES=$CUDA_VISIBLE_DEVICES else dev_env = fi exec $

7、DOCKER_BIN run $INTERACT - P $dev_env $dev_param $time_param - m $MEM_LIMIT - v $DATA_VOLUME : $DATA_MOUNT_POINT $IMAGE $CMD 运行脚本,启动toolkit: # chmod +x run-toolkit.sh # ./run-toolkit.sh toolkit /bin/bash 成功运行之后,已经进入交互式的docker容器(理解为一个与host隔离的运行环境)中,物理机上的 /disk1 /disk1/disk1(如果容器销毁,其他数据不会保留)。检查GPU工作正常

8、:# nvidia-smi检查通过以后,您可以像普通终端一样,运行软件。重新进入在交互式docker容器中,如果您运行 exit,退出docker容器之后,该容器即停止。如果您在容器中修改了/disk1 以外的内容(比如安装软件),下次还需要继续使用,则不应该运行 run-toolkit.sh 新建容器,而是重启原先的,操作如下:查询已经停止的容器id:# docker ps -a返回结果中,复制下需要重启的容器的 container_id 重启容器:# docker start container_id 成功则返回一串重复的id重新进入交互式docker容器:# docker attatch

9、 container_id使用进阶获得更新如果toolkit发布新的版本,可以重新pull获得更新:# docker pull /alicloudhpc/toolkit 重命名一个短名称:# docker tag /alicloudhpc/toolkit toolkit创建私有镜像访 问 阿 里 云 docker 控 制 台 : /#/docker/image/list 可以创建自己的私有镜像(选择本地仓库)。使用和创建本地镜像的方法,可以参考docker官方文档相关部分: HYPERLINK /userguide/dockerimages /userguide/dockerimages另外有一份中文教程: HYPERLINK /book/docker.html /

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论