版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、并行计算 Parallel Computing,基本概念,2020/6/29,2,如何满足不断增长的计算力需求?,用速度更快的硬件,也就是减少每一条指令所需时间 优化算法(或者优化编译) 用多个处理机(器)同时解决一个问题 并行计算,2020/6/29,3,串行计算与并行计算,2020/6/29,4,并行的层次,程序级并行 子程序级并行 语句级并行 操作级并行 微操作级并行,并行粒度,粗,细,2020/6/29,5,FLOPS,Floating point number Operations Per Second -每个时钟周期执行浮点运算的次数 理论峰值CPU主频每时钟周期执行浮点运算数CP
2、U数目 部分处理器每时钟周期执行浮点运算数:,2020/6/29,6,,2020/6/29,7,Top5002007年11月,高居榜首的依然是来自IBM的“蓝色基因/L”。自从2004年11月以来,该系统已经连续三年遥遥领先,而且计算能力不断提升,Linpack基准测试性能478.2 TFlop/s(每秒478.2万亿次运算),而半年前还是280.6 TFlop/s 拿下亚军位置的还是IBM,不过换成了一台落成不久的“蓝色基因/P”。位于德国尤里希研究中心的这套新系统运算能力167.3 TFlop/s,不过按照IBM的设计规划,蓝色基因/P的性能将有望突破1 TFl
3、op/s大关,即每秒一千万亿次运算。,2020/6/29,8,Top5002007年11月,第三名也是个新面孔,同时也是新墨西哥计算应用中心(NMCAC)的第一套超级计算机,由SGI基于Altix ICE 8200打造,计算能力126.9 TFlop/s。 同时印度史上首次杀入了TOP10行列,印度计算研究实验室的HP Cluster Platform 3000 BL460c以117.9 TFlop/s的性能拿到了第四位,2020/6/29,9,供应商系统数量,2020/6/29,10,供应商计算能力,2020/6/29,11,国家分布系统数量,2020/6/29,12,国家分布计算能力,20
4、20/6/29,13,体系结构系统数量,2020/6/29,14,体系结构计算能力,2020/6/29,15,应用领域系统数量,2020/6/29,16,应用领域计算能力,2020/6/29,17,操作系统系统数量,2020/6/29,18,操作系统计算能力,2020/6/29,19,处理器家族系统数量,2020/6/29,20,处理器家族计算能力,2020/6/29,21,系统数量,2020/6/29,22,计算能力,2020/6/29,23,2007年中国高性能计算机性能TOP100,2020/6/29,24,并行化方法,域分解(Domain decomposition) 任务分解(Tas
5、k decomposition) 流水线(Pipelining),2020/6/29,25,域分解,First, decide how data elements should be divided among processors Second, decide which tasks each processor should be doing Example: Vector addition,2020/6/29,26,域分解,Find the largest element of an array,2020/6/29,27,域分解,Find the largest element of a
6、n array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,28,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,29,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,30,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,31,域分解,Find the largest
7、element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,32,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,33,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,34,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,35,域分解,Find
8、the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,36,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,37,域分解,Find the largest element of an array,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,38,任务(功能)分解,First, divide tasks among processors Second, decide which data ele
9、ments are going to be accessed (read and/or written) by which processors Example: Event-handler for GUI,2020/6/29,39,任务分解,f(),s(),r(),q(),h(),g(),2020/6/29,40,任务分解,f(),s(),r(),q(),h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,41,任务分解,f(),s(),r(),q(),h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,42,任务分解,f(),s(),r(),q(),
10、h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,43,任务分解,f(),s(),r(),q(),h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,44,任务分解,f(),s(),r(),q(),h(),g(),CPU 0,CPU 2,CPU 1,2020/6/29,45,流水线,Special kind of task decomposition “Assembly line” parallelism Example: 3D rendering in computer graphics,Rasterize,Clip,Project,Model,In
11、put,Output,2020/6/29,46,Processing One Data Set (Step 1),Rasterize,Clip,Project,Model,2020/6/29,47,Processing One Data Set (Step 2),Rasterize,Clip,Project,Model,2020/6/29,48,Processing One Data Set (Step 3),Rasterize,Clip,Project,Model,2020/6/29,49,Processing One Data Set (Step 4),Rasterize,Clip,Pro
12、ject,Model,The pipeline processes 1 data set in 4 steps,2020/6/29,50,Processing Two Data Sets (Step 1),Rasterize,Clip,Project,Model,2020/6/29,51,Processing Two Data Sets (Time 2),Rasterize,Clip,Project,Model,2020/6/29,52,Processing Two Data Sets (Step 3),Rasterize,Clip,Project,Model,2020/6/29,53,Pro
13、cessing Two Data Sets (Step 4),Rasterize,Clip,Project,Model,2020/6/29,54,Processing Two Data Sets (Step 5),Rasterize,Clip,Project,Model,The pipeline processes 2 data sets in 5 steps,2020/6/29,55,Pipelining Five Data Sets (Step 1),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU
14、 2,CPU 3,2020/6/29,56,Pipelining Five Data Sets (Step 2),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,57,Pipelining Five Data Sets (Step 3),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,58,Pipelining Five Data Set
15、s (Step 4),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,59,Pipelining Five Data Sets (Step 5),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,60,Pipelining Five Data Sets (Step 6),Data set 0,Data set 1,Data set 2,Data set 3,Data set 4,CPU 0,CPU 1,CPU 2,CPU 3,2020/6/29,61,Pi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安装项目承揽协议范本2024年
- 2024年企业间合作联营协议
- 2024年度保安职位劳动协议模板
- 2024年软件开发项目合作协议
- 课件的封面教学课件
- 小熊孵蛋课件教学课件
- 仓库安全管理规范化守则
- 企业并购咨询合作协议
- 交通运输行业司机薪资协议
- 传染病分类解析:体育场馆卫生管理
- 副总经理招聘面试题及回答建议(某大型国企)
- 期中测试卷(试题)-2024-2025学年统编版语文五年级上册
- 建筑工地台风过后复工复产工作方案
- 借款协议(父母借款给子女买房协议)(二篇)
- 税务师涉税服务相关法律真题2021年
- 2024年太仓市城市建设投资集团限公司公开招聘3人高频难、易错点500题模拟试题附带答案详解
- 琴行培训机构合同协议书
- 少儿趣味编程Scratch综合实战《小车巡线》教学设计
- 中国融通集团招聘笔试题库2024
- 期中测试卷(1-4单元)(试题)2024-2025学年人教版数学六年级上册
- ICU谵妄患者的护理
评论
0/150
提交评论