数据密集计算系统-GPU计算.pptx_第1页
数据密集计算系统-GPU计算.pptx_第2页
数据密集计算系统-GPU计算.pptx_第3页
数据密集计算系统-GPU计算.pptx_第4页
数据密集计算系统-GPU计算.pptx_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、报告人:董艳超 学 号:21421291,数据密集的计算系统 GPU计算,报告提纲,GPU的前世今生 GPU的诞生 GPU与CPU的对比 GPU在高性能计算方面的优势 GPU不能取代CPU 优势互补 强强联合 GPU通用计算 GPU计算在各领域的应用 GPU集群在生物医药领域的运用 展望GPU计算,Graphic Processing Unit (GPU) 用于个人计算机、工作站和游戏机的专用图像显示设备 NVIDIA和ATI (now AMD)是主要制造商 GPU是显卡的“心脏” 2D显示卡和3D显示卡的区别依据,GPU的前世今生,GPU的诞生,GPU是相对于CPU而言的概念,最初是用于完成

2、图形图像处理。现在的GPU已经从由若干专用的固定功能单元组成的专用并行处理器,发展成以GPU内部的通用计算资源为主,固定功能单元为辅的架构,这一架构的出现奠定了GPU计算的发展基础。 最初的目的:GPU最初设计目标是尽可能快速完成图像像素点的处理和显示,设计结构决定了GPU适合于并行计算,其流处理器能够用于大规模并行处理。 时代的需求:尽管CPU的处理能力不断增强,但在进入3D时代后,人们发现庞大的3D图像处理数据计算使得CPU越来越不堪重荷,并且远远超出其计算能力;图形计算需求日益增多,计算机的显示芯片也飞速发展,其功能被脱离出来,单独设计为一块芯片GPU (也就是显卡)。,CPU的内部结构

3、:控制单元、逻辑单元和存储单元 运算器:算术运算(如加减乘除)和逻辑运算( 如逻辑加、逻辑乘和非运算) 控制器:读取各种指令,并对指令进行分析,作出相应的控制。 若干个寄存器:可直接参与运算并存放运算的中间结果。 GPU采用了大量的执行单元,这些执行单元可以轻松的加载并行处理,而不像CPU那样的单线程处理。另外,现代的GPU也可以在每个指令周期执行更多的单一指令。 3.GPU:核心的一个流处理器相当于一个“核”,GPU的“核”数量已经不再停留在单位数,而是几十甚至是上百个,被称为“众核”。,GPU与CPU的对比,设计结构决定了GPU适合于并行计算,其流处理器能够用于大规模并行处理。总之,GPU

4、通过简化处理逻辑和增加处理单元实现了高效、高性能的并行计算。 基于GPU的高性能计算机一般体积较小,可以实现桌面高性能计算,能够满足实验室及野外场地的高性能计算需求,避免了在公共高性能计算机计算时的任务排队。 基于GPU的高性能计算机价格相对低廉,维护费用低。 CPU结构复杂,主要完成控制和缓存功能,运算单元较少。而GPU结构简单,缓存需求少,运算单元丰富,浮点运算能力非常强大,GPU的计算能力远远高于相同数目的CPU。 CPU计算的线程粒度较粗,在并行计算的时间同步阶段需要缓存大量的计算数据,而GPU计算的线程粒度较细,用于并行计算的线程数远大于CPU,在时间同步时GPU的线程通过重复计算来

5、避免缓存数据(缓存速度较慢,影响计算速度)。,GPU在高性能计算方面的优势,GPU在运算能力方面远远超越CPU。 GPU是否能取代CPU呢? 答案是否定的。 GPU只提供单指令多数据类型处理,适合于并行计算,在条件控制方面的能力非常弱。若程序使用条件控制语句会极大影响GPU程序的执行效率。 当然,有部分条件控制语句可以用计算来代替。例如,判断两个整数是否相等可以用两个整数异或后再映射成0和1来代替。 另外现在的GPU与主机数据交换只能通过总线来实现,对于需要大量I/O的应用,通讯就会成为GPU的性能瓶颈。,GPU不能取代CPU,报告提纲,GPU的前世今生 GPU的诞生 GPU与CPU的对比 G

6、PU在高性能计算方面的优势 GPU不能取代CPU 优势互补 强强联合 GPU通用计算 GPU计算在各领域的应用 GPU集群在生物医药领域的运用 展望GPU计算,目前,基于GPU的高性能计算主要采用异构架构,即CPU+GPU模式。异构运算能够“使用合适的工具做合适的事情”。 CPU在分支处理以及随机内存读取方面有优势,处理串行工作的能力较强。 GPU由于其特殊的核心设计,在处理大量有浮点运算的并行计算时能力较强。 所以异构计算使用CPU做串行工作,GPU主管并行运算,CPU控制主程序的复杂流程,而将需要批量处理的向量数据通过高速总线传输给GPU,由GPU实现快速并行计算。通过GPU和CPU的配合

7、使用,充分挖掘计算机的硬件潜能,使其达到高效协同的计算效果。 目前主流的GPU计算开发软件都是采用CPU+GPU的计算模式,如NVIDIA公司的CUDA。,优势互补 强强联合,为了能使GPU在图形处理功能之外发挥强大的通用计算能力,开发人员提出GPGPU,即通用GPU的计算解决方案。 GPGPU利用API接口,将通用计算问题强制转化为图形运算后在图形处理芯片进行计算,这种方法无法使用C、C+等高级语言进行程序开发,编程难度较大,不利于快速掌握开发技术,所以使用范围有限。 为此,NVIDIA公司推出了全新的基于GPU的并行计算架构CUDA。这种架构可以使用C语言进行程序开发,能够直接访问GPU硬

8、件资源。当程序代码需要CPU执行时,由CUDA集成的C语言编译器编译后提交给CPU执行;程序代码需要在GPU中运行时,由CUDA编译成机器码交由GPU执行。 此外,AMD公司也推出了基于ATI显卡的GPU计算开发工具Stream。为支持GPU上的程序设计,研究人员已经开发了多种基于GPU的数学函数库,如Matlab等数学工具箱推出了利用GPU加速计算的工具模块。,GPU通用计算,通用计算问题,GPGPU,CUDA,Stream,报告提纲,GPU的前世今生 GPU的诞生 GPU与CPU的对比 GPU在高性能计算方面的优势 GPU不能取代CPU 优势互补 强强联合 GPU通用计算 GPU计算在各领

9、域的应用 GPU集群在生物医药领域的运用 展望GPU计算,随着各种高新技术的发展,GPU计算的应用将会越来越广。GPU作为一种非常有潜力的计算工具,仍在不断发展。对GPU计算需要不断加强研究,积极改进已有算法,通过引进和开发GPU计算软件使各个应用领域发展速度不断提升,为社会科学研究发展提供强有力的支撑。 云计算时代,GPU的计算能力被进一步挖掘出来,GPU越来越被市场所认可,尤其在并行计算领域,由于GPU出色的浮点运算能力、超大的内存带宽和相对较低的价格,基于GPU的通用计算在视频处理、石油勘探、生物化学等行业取得了巨大的成功,这一市场也被各家厂商所认同,分别推出产品以期占领先机。 在越来越

10、多的领域,GPU所表现出来强大性能正在逐步蚕食传统的CPU市场。在航空航天装备研制、卫星遥感数据处理、气象预报、海洋环境数值模拟、石油勘探数据处理、生物医药研究、金融工程数据分析、新材料开发和设计、计算结构力学、生命科学计算、流体动力学、计算机视觉、数据挖掘、数值分析等领域,GPU计算正在发挥出强大的能量。 而传统上这些计算属于使用CPU计算领域,用户为了完成这些运算,会选择工作站、刀片甚至集群方案。相对以上方CPU方案,GPU方案具有价格低、速度快等优点,无疑非常适合用户使用。,GPU计算在各领域的应用,该实例选自计算机辅助设计与图形学学报 主要讲述了如何运用GPU集群系统加速一个适合基于量

11、子化学的蛋白质分子场的计算模拟。 该系统利用MPI编程环境连接集群中的各个结点 ,采用CUDA作为GPU编程语言,并对单结点中GPU和多核CPU协同计算进行了架构优化设计。利 用开放多线程编程标准进行多核CPU计算 ,将其中的主要插值计算写入CUDA子程序,安排在GPU上进行并行计算,充分发挥两者各自的优势,从而使系统的整体计算效率有了大幅度的提高。 问题背景:蛋白 质分子体系中的各种相互作用决定了分子内各结构域在空间的形态和结构方式,而这些多重作用在空间中叠加成为一个综合性作用分子场。当体系外分子接近该蛋白质分子体系时,蛋白质分子相关部位的局部场会将发生变化。分子场构成了对蛋白质分子,特别是

12、活性中心行为的一种限制和表达,研究分子场对于揭示蛋白质结构与功能之间的内在关系,尤其是对蛋白质识别 、稳定和黏附行为具有重要意义。 但是,由于生物计算涉及的分子体系很大,计算过程十分复杂。因此,如何加速其计算过程是结构生物信息学等领域一个亟待解决的问题。,GPU集群在生物医药领域的运用,系统针对蛋白质分子场模拟计算的特点,搭建起一个的GPU集群系统 。 系统硬件组成:由1个控制台、 8个计算结 点组成,每个结点安装Ubuntu8.02操作系 统,配置2个Intel公司的至强5410型CPU和 1个NVIDIA公司的GTX260(显存为896MB) 的GPU,以及8GB的内存和1TB的硬盘;所

13、有结点通过千兆以太网相连。 系统软件组成 MPI编程环境:主要用于连接集群上的各个结点,实现结点之间的消息传递(交换数据、同步、规约)。目前MPI标准的具体实现主要有3种:MPICH,LAMMPI和CHIMP。其中MPICH是影响最大、用户最多的一种。由于它能支持多程序多数据编程和异构集群系统,故采用MPICH作为MPI编程环境。 GPU编程环境:前面介绍过两种GPU编程环境。由于CUDA以C语言为基础,因此较容易将数据送给GPU来完成计算,而无需再利用图形 API,并使得编程、程序可读性和维护调试变得更为容易。,GPU集群在生物医药领域的运用,计算流程:将蛋白质所在的包围盒均匀划分成 8 个部分,利用MPICH对应分配到集群中的8个计算结点,以实现粗粒度并行。进程间通过调用MPI函数来实现通讯。,GPU集群在生物医药领域的运用,计算结果对比:原文在蛋白质数据库中选取了3类不同体系和规模的蛋白质: 1A30,1GCV和1DPS。分别采用了CPU单机、GPU单机、CPU集群和GPU集群这 4种不同的方法计算了上面3类蛋白质不同空间分辨率的分子场,其计算的耗时值 及它们之间的比较如下表: 计算效率极为显著。,GPU集群在生物医药领域的运用,虽然GPU通用计算推出的时间较短,但其具有的高性能、高性价比、低功耗、主机体积小等诸多优点,使得其研究应用迅速升

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论