并行计算复习摘要_第1页
并行计算复习摘要_第2页
并行计算复习摘要_第3页
并行计算复习摘要_第4页
并行计算复习摘要_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、二、并行计算硬件,性能评测§并行计算机系统结构 Flynn分类 SIMD / MIMD 并行计算机结构模型 1)PVP( Parallel Vector Processor ) §含有为数不多、功能强大的定制向量处理器(VP),定制的高带宽纵横 交叉开关及高速的数据访问。 §通常不使用高速缓存,而是使用大量向量寄存器及指令缓存,使得该系统 对程序编制的要求较高。 §只有充分考虑了向量处理特点的程序才能在该系统上获得较好的性能。 §银河I,NEC地球模拟器,GPU。 2)SMP( Symmetric Multiprocessor ) §

2、采用商品化的处理器,这些处理器通过总线或交叉开关连接到共享存储 器。§每个处理器可等同地访问共享存储器、I/O设备和操作系统服务§扩展性有限§曙光1号,IBM RS/6000,多核处理器。 3)MPP(Massively Parallel Processor)§处理节点采用商品微处理器§系统中有物理上的分布式存储器§采用高通信带宽和低延迟的互连网络(专门设计和定制的)§能扩展至成百上千乃至上万个处理器§异步MIMD,构成程序的多个进程有自己的地址空间,进程间通信消息 传递相互作用§Tianhe, K-Co

3、mputer, Cray XT5, BlueGene。 4)Cluster(集群)§分布式存储,MIMD,工作站+商用互连网络,每个节点是一个完整的 计算机,有自己的磁盘和操作系统,而MPP中只有微内核§优点: 投资风险小 系统结构灵活 性能/价格比高 能充分利用分散的计算资源 可扩展性好§问题 通信性能 并行编程环境§IBM Cluster 1350/1600。 内存访问模式1)UMA(Uniform Memory Access)均匀存储访问。 物理存储器被所有处理器均匀共享; 所有处理器访问任何存储字取相同的时间; 每台处理器可带私有高速缓存; 外围

4、设备也可以一定形式共享。 2)NUMA(Nonuniform Memory Access)非均匀存储访问。 被共享的存储器在物理上是分布在所有的处理器中的,其所有本地 存储器的集合就组成了全局地址空间; 处理器访问存储器的时间是不一样的;访问本地存储器LM或群内共 享存储器CSM较快,而访问外地的存储器或全局共享存储器GSM较慢 (此即非均匀存储访问名称的由来); 每个处理器可带私有高速缓存,外设也可以某种形式共享。 3)NORMA(No-RemoteMemory Access)非远程存储访问。 所有存储器私有; 节点间通过消息传递进行数据交换。§多核处理器 多核技术概述 多核计算环

5、境 多个复杂度适中,相对低功耗的处理核心并行工作 CPU时钟频率基本不变 计算机硬件不会更快,但会更“宽” 操作系统、应用程序设计?双核技术 VS. 超线程技术§双核是真正意义上的双处理器 不会发生资源冲突 每个线程拥有自己的缓存、寄存器和运算器§一个3.2GHz Smithfiled在性能上并非等同于3.2GHz P4 with HT 的2倍 HT 使处理器的性能至少提升了1/3 双核的性能相当于2块 non-HT 处理器§双核技术与HT技术在性能上的对比§Ex 1: 两个floating point线程 (Smithfield client) 每个线

6、程拥有自己的FPU, 没有资源冲突 尽管性能上没有提升太多,但仍然优于HT§Ex 2: 一个integer线程与一个floating point线程 性能大幅度提升 没有资源冲突§并行计算性能评测 1)参数定义§P:处理器数;§W:问题规模(计算负载、工作负载,给定问题的总计算量); Ws:应用程序中的串行分量,f是串行分量比例(f = Ws/W); WP:应用程序中可并行化部分,1-f为并行分量比例; Ws +W p =W;§Ts :串行执行时间,Tp :并行执行时间;§S:加速比,E:效率。 2)加速比性能定律§Amda

7、hl 定律§Gustafson 定律§Sun and Ni 定律04 OpenMPOpenMP概述 §OpenMP 是一种面向共享内存以及分布式共享内存的多处理器多线程并行编程语言。 §OpenMP是一种能够被用于显式制导多线程、共享内存并行的应用程序编程接口(API)。OpenMP编程模型:Fork-JoinFork-Join 执行模式在开始执行的时候,只有主线程程存在。主线程在运行过程中,当遇到需要进行并行计算的时候,派生出(Fork)线程来执行并行任务。在并行执行的时候,主线程和派生线程共同工作。在并行代码结束执行后,派生线程退出或者挂起,不再工作

8、,控制流程回到单独的主线程中(Join)。编译制导语句(Compiler Directive)§§ 并行域§§ 共享任务§§ 同步§§ 数据域 数据共享属性子句 threadprivate子句 数据拷贝子句并行域并行域中的代码被所有的线程执行共享任务共享任务结构将它所包含的代码划分给线程组的各成员来执行 并行for循环 并行sections 串行执行for编译制导语句for语句指定紧随它的循环语句必须由线程组并行执行;Sections编译制导语句1)sections编译制导语句指定内部的代码被划分给线程组中的各线程

9、2)不同的section由不同的线程执行single编译制导语句§§ single编译制导语句指定内部代码只有线程组中的一个线程执行。§§ 线程组中没有执行single语句的线程会一直等待代码块的结束,使用nowait子句除外parallel for编译制导语句Parallel for编译制导语句表明一个并行域包含一个独立的for语句parallel sections编译制导语句parallel sections编译制导语句表明一个并行域包含单独的一个sections语句critical制导语句critical制导语句表明域中的代码一次只能执行一个线程reduction子句§§ reduction子句使用指定的操作对其列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论