中科曙光HPC培训教程汇总:D17-集群调试—GPU调试_第1页
中科曙光HPC培训教程汇总:D17-集群调试—GPU调试_第2页
中科曙光HPC培训教程汇总:D17-集群调试—GPU调试_第3页
中科曙光HPC培训教程汇总:D17-集群调试—GPU调试_第4页
中科曙光HPC培训教程汇总:D17-集群调试—GPU调试_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、GPU基础调试,曙光信息产业(北京)有限公司 高性能计算事业部,提纲,GPU环境安装,1、使用cuda安装包进行安装(推荐下载run类型安装包) https:/ 选择相应操作系统下载cuda安装包,GPU环境安装,1、GPU驱动http:/,GPU环境安装,1、确保硬件已经识别到PCIE设备 2、将nouveau加入黑名单 3、进入命令行界面 4、安装GPU驱动-不安装opengl库(使用独立显卡做视频输出可安装,GPU环境安装,1、也可使用cuda安装文件安装GPU驱动 2、安装cuda Toolkit SDK export PATH=/usr/local/cuda-8.0/bin:$PAT

2、H export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH ubuntu: touch /etc/ld.so.conf.d/cuda.conf 添加:/usr/local/cuda-8.0/lib64 ldconfig 3、安装Cuda Samples 安装位置:/root/NVIDIA_CUDA-8.0_Samples,提纲,GPU基础测试,测试当前GPU的基础性能,保证GPU的正常可用 1、确保GPU驱动安装正常,PCIE设备和nvidia-smi检测到的设备数量一致,GPU基础测试,2、确保GPU PCIE实测带

3、宽正常,GPU基础测试,3、p2p带宽及延时测试,GPU基础测试,3、矩阵运算测试sgemm/dgemm,提纲,GPU基础调试,1、桌面无法显示问题 (为保证不因界面问题而导致系统无法启动,请在安装驱动之前将系统的启动方式修改为命令行方式启动) (GPU计算卡不提供显示输出接口,以server方式提供) 安装驱动时安装了opengl库 nvidia-uninstall(卸载GPU驱动) 安装GPU驱动,不装opengl(-no-opengl-files) 操作系统版本与硬件兼容性问题 降低操作系统版本(W780建议使用centos7.0) X11问题(使用的nvidia-xconfig) /e

4、tc/X11/xorg.conf中的内容清空,重启界面 Ubuntu下可尝试使用其他界面解决(xfce,GPU基础调试,2、无法使用nvidia-smi或显示出错 communication错误(驱动提示无法与显卡进行通信) 更换GPU最新驱动 rmmod nouveau(尝试) 多可能出现在硬件本身的问题 power(提示power低) 检查GPU的电源线是否全部插满,保证GPU的正常供电 GPU空载问题 可使用nvidia-smi -pm 1解决 安装驱动时出现kernel-source问题 Linux内核已经升级,驱动不能识别,尝试-kernel-source-path给出内核路径 确保驱动与操作系统的匹配 重新装操作系统,包装全,通讯地址:北京市海淀区东北旺西路8号中关村软件园36号 邮政编码:100094 联系电话:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论