并行计算基础知识讲座1.ppt_第1页
并行计算基础知识讲座1.ppt_第2页
并行计算基础知识讲座1.ppt_第3页
并行计算基础知识讲座1.ppt_第4页
并行计算基础知识讲座1.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、并行修正计算的基础知识、主要内容、并行修正计算环境并行算法的基础哪些问题可以使并行化串行计程仪报变成并行计程仪报, 为什么需要并行订正机问题3360科学和工程问题的数值模拟和仿真订正密集数据密集网络密集三种混合要求:在合理的时限内完成订正任务的秒级制造业分级短时间天气预报(当天)时间级中期天气预报(310天)尽快进行长期天气预报(气候) 可以修正湍流模拟的塔斯克,通常修正量非常多,PC无法满足要求或完全无法修正,非常适合在超级计算环境中执行。 例如,(1)需要分布式并行处理的科学校准塔斯克包括(2)对校准资源的需求过大而不满足当前硬件条件的校准塔斯克,通过将串行原代码改编为并行原代码的校准,或

2、者通过的并行校准计程仪程序(商业或者非商业),但是花费过多时间并行校准功能的分类、并行运载体机器(PVP )对称多处理共享存储器多处理机(SMP )大规模并行处理器(MPP )工作站(微机)机器群(COW )分散式共享记忆体多处理机(DSM )、cow(clusteer )各节点通常互联互通在商品化网络上的机器群使用着千兆二进制位网。 每个节点通常都有本地磁盘。节点上的网络接口松散耦合到I/O男低音。每个节点都有完整的执行操作系统,但通过中间阶层实现了单个系统映像(服务器端包含)。单系统图像、单系统图像(Single System Image,服务器端包含)并不意味着内存中只有系统中的唯一执行

3、操作系统图像,而是感觉像单个系统。 其基本特征是单系统、单一制控制、对称性、位置透明。 采用服务器端包含的主要目的是使机器群的使用、控制和维护与一台工作站相同。 单个系统映像包括单个入口点、单个文件层、单个I/O空间、单个网络、单个作业管理系统、单个存储空间和单个进程空间。 并联机软件环境、执行操作系统端: RatHat9.0软件编程语言: Fortran 77、Fortran 90、C/C等,什么是并行算法,算法是解题的精确描述, 在规定解决某些规则的并行修正运算时,云同步可解的各过程集合、这些个的过程相互作用和协调动作,以及最终得到问题的求解并行算法是并行修正运算过程的精确描述、并行算法分

4、类、非数值修正运算并行算法数值修正并行算法、矩阵运算、多项式求解、线性方程求解等代数关系运算的修正运算问题。 传统的串行校正算法分为“指令”和“数据”两部分,在执行普通堆计程仪时,“独立申请和占用”有空间,所有校正算法都有限,并行校正算法将进程分配给相对独立的不同节点,并且各自独立进程间的互相信息交换通过消息来进行,过程1、过程2、过程间通讯、现代执行操作系统提供基本的系统呼叫函数,行政许可在同一处理器或不同处理器内的多个进程之间交换信息,具体地讲是以通讯、同步、聚合三种形式以上三种形式统称为进程间通讯,操作的具体数据对象称为消息,具体操作称为消息传递。通讯、进程间的数据传输称为进程间通讯。

5、在同一处理器中,通讯可以读写执行操作系统提供的共享数据缓冲区。 在不同的处理器中,通讯可以通过网络来实现。 同步、同步是在同一处理器或不同处理器中的多个进程之间相互等待的操作,要求进程的所有操作都必须等待到某个控制状态。、集合、集合可以聚集在相同数目的后续、不同的处理器上的多个过程的本地结果以产生具有特定操作(例如,最大、最小值、累积和等)的新的结果,并且在指定过程变量或所有过程变量中存储该新的结果。 共享存储机型和语言(PVP、SMP、DSM) X3H5、主题开放式消息传递机型和语言(MPP、群集、COW) MPI (Fortran、c、) c )数据并行机型和语言(MPP群集上Fortra

6、n 90hpf (高性能)、并行编程环境和MPI (消息传递互联网软件编程语言)支持c、fortran等。 MPI已成为定义接口库的标准,该接口库的格式与不包含特定制造商、执行操作系统和硬件特性的语言无关。 因此,MPI被并行校正行业广泛接受.MPI标准的实现包括MPICH、LAM、IBM MPL等,提供与c、Fortran语言的绑定。 可以将MPI视为“库”。 现在使用的消息库是MPICH 1.2,有数百个接口,可以通过FORTRAN 77和习语言直接调用这些个的函数。 多个处理通过调用这些个的函数(像调用子例程)进行通讯。Include文件是习语言应用程序,则为#include “mpi.

7、h” Fortran语言应用程序,则为#include mpif.h、MPI并行预计程仪单计程仪多数据流模式(SPMD )需要多计程仪多数据流模式的MPI计程仪柱的SPMD执行模式是指,一个柱计程仪柱将多个部分激活到云同步以形成多个独立的过程,并由不同的处理器执行以实现独立的处理SPMD模式:单计程仪多数据流,例如1,过程0向过程1发送整数过程1将1加到该数上,过程2传递到过程2再将1加到该数上,依次类推到过程3,最后,过程N-1将其编译执行指令,mpif77 o exam exam.f mpirun np 4 exam其中,exam.f表示需要编译的源文件,o表示生成的输出文件,exam表示

8、输出文件名,np表示进程数。 使用mpicc和mpif77省略与MPI相关的路径设定,能够并行执行什么、能够将按顺序执行的程序转换为在意义上等效且并行执行的计程仪程序,主要依赖于程序计程仪程序的结构形式、特别是其中的数据相关性。 其中,变量a是与P1和P2的发生数据关联的原因。 为了保证计程仪执行的语义精准性,变量a必须在被写入到P1后从P2读出,即,在被写入后被读出。 显然,P1和P2不能并行执行。 数据相关、数据逆相关定、P1: ABC P2: CE D P1通过变量c数据相关P2。 为了确保意义的正确性,P1读出变量c之后,P2必须能够对变量c进行写入操作,即,需要先进行读出之后写入。

9、也无法并行化并且与数据输出相关联,P1: AB C P2: ADE必须行政许可P1首先写入a,然后P2写入a,以保证意义的正确性。 除了上述三个相关性之外,还有一种特殊情况,即两个段的输入变量互为输出变量。 在这种情况下,两者必须并行执行才能保不定意义的精准性。 这就要求硬件机构能够保证两者的同步读写。 然而,若两个处理器分别具有本地存储器则能够降低同步请求。相关性和并行化,伯恩斯坦基准I1O2,即P1的输入变量定径套和P2的输出变量定径套不交叉的I2O1,即P2的输入变量定径套不与P1的输出变量定径套交叉,O1O2,即P1和P2的输出变量定径套不交叉,可以进行并行处理, 首先定义三个重要概念

10、:塔斯克、进程和处理器,以了解串行计程仪报如何变为并行,以及创建并行计程仪报的步骤。、塔斯克、塔斯克是一项计程仪方案完成的工作,其内容和大小是任意的,它是并行计程仪方案可以处理的并发性最小的用户针织面料,也就是说,一个塔斯克只能由一个处理器执行,处理器间的并发性只能在任务间开发。 进程和进程(也称为线程)是完成塔斯克的实体。 一个并发计程仪程序由多个团队精神进程组成,是每个完成计程仪程序中塔斯克的子定径套。 一个分配反应历程将塔斯克分配给进程。 通过在机器的物理处理器上执行,从进程和处理器的区别、并行化的观点来看,处理器是物理资源、进程是抽象的,或者是虚拟化多处理机的方便方法:我们将在处理器中写入并行计程仪程序的过程映射到处理器在一次计程仪程序的执行中,过程的数目不必须等于处理器的数目。 进程越多,一个处理器可能执行多个进程;进程越少,一些处理器空闲,串行计程仪程序并行化的几个步骤, 从一个串行计程仪程序获得一个并行程序计程仪程序的工作由四个步骤组成:1.将修正计算问题分解为塔斯克2 .将塔斯克分配给进程3 .在进程之间需要的数据网站数据库、通讯、同步4 .将进程映射或绑定到处理器,但上述的几个方面考虑到消息传送的开销等于或大于校正开销

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论