并行计算--硬件基础及性能评测概要_第1页
并行计算--硬件基础及性能评测概要_第2页
并行计算--硬件基础及性能评测概要_第3页
并行计算--硬件基础及性能评测概要_第4页
并行计算--硬件基础及性能评测概要_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、并行计算 Parallel Computing,基本概念,2020/6/29,2,如何满足不断增长的计算力需求?,用速度更快的硬件,也就是减少每一条指令所需时间 优化算法(或者优化编译) 用多个处理机(器)同时解决一个问题 并行计算,2020/6/29,3,串行计算与并行计算,2020/6/29,4,并行的层次,程序级并行 子程序级并行 语句级并行 操作级并行 微操作级并行,并行粒度,粗,细,2020/6/29,5,FLOPS,Floating point number Operations Per Second -每个时钟周期执行浮点运算的次数 理论峰值CPU主频每时钟周期执行浮点运算数CP

2、U数目 部分处理器每时钟周期执行浮点运算数:,2020/6/29,6,,2020/6/29,7,Top5002007年11月,高居榜首的依然是来自IBM的“蓝色基因/L”。自从2004年11月以来,该系统已经连续三年遥遥领先,而且计算能力不断提升,Linpack基准测试性能478.2 TFlop/s(每秒478.2万亿次运算),而半年前还是280.6 TFlop/s 拿下亚军位置的还是IBM,不过换成了一台落成不久的“蓝色基因/P”。位于德国尤里希研究中心的这套新系统运算能力167.3 TFlop/s,不过按照IBM的设计规划,蓝色基因/P的性能将有望突破1 TFl

3、op/s大关,即每秒一千万亿次运算。,2020/6/29,8,Top5002007年11月,第三名也是个新面孔,同时也是新墨西哥计算应用中心(NMCAC)的第一套超级计算机,由SGI基于Altix ICE 8200打造,计算能力126.9 TFlop/s。 同时印度史上首次杀入了TOP10行列,印度计算研究实验室的HP Cluster Platform 3000 BL460c以117.9 TFlop/s的性能拿到了第四位,2020/6/29,9,供应商系统数量,2020/6/29,10,供应商计算能力,2020/6/29,11,国家分布系统数量,2020/6/29,12,国家分布计算能力,20

4、20/6/29,13,体系结构系统数量,2020/6/29,14,体系结构计算能力,2020/6/29,15,应用领域系统数量,2020/6/29,16,应用领域计算能力,2020/6/29,17,操作系统系统数量,2020/6/29,18,操作系统计算能力,2020/6/29,19,处理器家族系统数量,2020/6/29,20,处理器家族计算能力,2020/6/29,21,系统数量,2020/6/29,22,计算能力,2020/6/29,23,2007年中国高性能计算机性能TOP100,2020/6/29,24,并行化方法,域分解(Domain decomposition) 任务分解(Tas

5、k decomposition) 流水线(Pipelining),2020/6/29,25,域分解,First, decide how data elements should be divided among processors Second, decide which tasks each processor should be doing Example: Vector addition,2020/6/29,26,域分解,Find the largest element of an array,2020/6/29,27,域分解,Find the largest element of a

6、n array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,28,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,29,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,30,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,31,域分解,Find the largest

7、element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,32,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,33,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,34,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,35,域分解,Find

8、the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,36,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,37,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,38,任务(功能)分解,First, divide tasks among processors Second, decide which data ele

9、ments are going to be accessed (read and/or written) by which processors Example: Event-handler for GUI,2020/6/29,39,任务分解,f(),s(),r(),q(),h(),g(),2020/6/29,40,任务分解,f(),s(),r(),q(),h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,41,任务分解,f(),s(),r(),q(),h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,42,任务分解,f(),s(),r(),q(),

10、h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,43,任务分解,f(),s(),r(),q(),h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,44,任务分解,f(),s(),r(),q(),h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,45,流水线,Special kind of task decomposition “Assembly line” parallelism Example: 3D rendering in computer graphics,Rasterize,Clip,Project,Model,In

11、put,Output,2020/6/29,46,Processing One Data Set (Step 1),Rasterize,Clip,Project,Model,2020/6/29,47,Processing One Data Set (Step 2),Rasterize,Clip,Project,Model,2020/6/29,48,Processing One Data Set (Step 3),Rasterize,Clip,Project,Model,2020/6/29,49,Processing One Data Set (Step 4),Rasterize,Clip,Pro

12、ject,Model,The pipeline processes 1 data set in 4 steps,2020/6/29,50,Processing Two Data Sets (Step 1),Rasterize,Clip,Project,Model,2020/6/29,51,Processing Two Data Sets (Time 2),Rasterize,Clip,Project,Model,2020/6/29,52,Processing Two Data Sets (Step 3),Rasterize,Clip,Project,Model,2020/6/29,53,Pro

13、cessing Two Data Sets (Step 4),Rasterize,Clip,Project,Model,2020/6/29,54,Processing Two Data Sets (Step 5),Rasterize,Clip,Project,Model,The pipeline processes 2 data sets in 5 steps,2020/6/29,55,Pipelining Five Data Sets (Step 1),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU

14、 2,CPU 3,2020/6/29,56,Pipelining Five Data Sets (Step 2),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,57,Pipelining Five Data Sets (Step 3),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,58,Pipelining Five Data Set

15、s (Step 4),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,59,Pipelining Five Data Sets (Step 5),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,60,Pipelining Five Data Sets (Step 6),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,61,Pi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论