计算机系统结构清华模拟器第8章并行处理机_第1页
计算机系统结构清华模拟器第8章并行处理机_第2页
计算机系统结构清华模拟器第8章并行处理机_第3页
计算机系统结构清华模拟器第8章并行处理机_第4页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第八章并行处理机Simultaneity:Concurrency:两个或两个以上事件在同一时间间隔内发生。并行处理机模型并行处理机的基本结构并行处理机算法举例8.1PUCUCU看,指令是串行执行的,从PU看,数据是并行处理的。并行处理机也称为阵列处理机。按照佛林分类法,它属于 SIMD第八章并行处理机Simultaneity:Concurrency:两个或两个以上事件在同一时间间隔内发生。并行处理机模型并行处理机的基本结构并行处理机算法举例8.1PUCUCU看,指令是串行执行的,从PU看,数据是并行处理的。并行处理机也称为阵列处理机。按照佛林分类法,它属于 SIMDPP以及其它由每个活动的 P

2、E 对它的数据所执行的局部操作。MCUPEPE以及其它由每个活动的 PE 对它的数据所执行的局部操作。MCUPEPEMP-1 的每个 PE 装有 1 位逻辑单元、4 位整数 ALU、64 位尾16位指。所以,MP-1 是中粒度并行处理机。由于每个 PE 比较简单,故可将几个 PE 在一上。MP-1 的每32PE,每PE4032位寄存器。32CM-2DAP61064-PE格互相连接组成一个大网格(6464)。目前,Fortran 90、C 的各种修订文本、Lisp和其它同步程序设计语言都已研制成功,可为 SIMD 机编制程序用。支MasPar计算机公司MP-1102416384PE26GIPSF

3、ortran77、MasParFortran(MPF)MasParX-窗口 PE可有1M位 器,32PE共享FPUVAX,SunSymbolics360主机1K位/PE方形网格互连成4096PE的细粒、位片SIMD阵列,正交4,20GIPS和560Mflops峰值性由 主 机Fortran-plus或DAP上APAL提供,主机的 Fortran77 或 C 。与 Fortran90 标 准 有 关 的分共器并行处理机器并行处理并行处理机的特8.2.1MPP(MassivelyParallelPECU。8.2.2LMPE互连Fortran-plus分共器并行处理机器并行处理并行处理机的特8.2.

4、1MPP(MassivelyParallelPECU。8.2.2LMPE互连Fortran-plus共BurroughsScientificsor(BSP)采用了这种结构。1617模块性好,生产可靠性高,容易实现容错和重构。需要共BurroughsScientificsor(BSP)采用了这种结构。1617模块性好,生产可靠性高,容易实现容错和重构。需要有一台高性能的标量处理机。如果一台机器的向量处理速度极高,但标量83IlliacIVSIMD如GoodyearMPP、AMT/DAP610和TMC/CM-2。 保留阵列结构,但每个处理单元的规模减小,如一个bitGF-11是由IBM MasPa

5、rMP1是中粒度并行处理机的典型代表。1963 年,西屋电器公司提出“ SlotnickThe SOLOMON ComputerSimultaneousOperationlinkedOrdinalModularNetwork1966PEM2K641GFLOPS网接口如GoodyearMPP、AMT/DAP610和TMC/CM-2。 保留阵列结构,但每个处理单元的规模减小,如一个bitGF-11是由IBM MasParMP1是中粒度并行处理机的典型代表。1963 年,西屋电器公司提出“ SlotnickThe SOLOMON ComputerSimultaneousOperationlinked

6、OrdinalModularNetwork1966PEM2K641GFLOPS网接口PI/O 总线模式位64 控制P64 X CU总PPP器Burroughs 公司和伊利诺依大学于 1972 年共同设计和生产,1975 年实际投入运行。用了 4 倍的经费,只达到 1/20 的速度。只实现Burroughs 公司和伊利诺依大学于 1972 年共同设计和生产,1975 年实际投入运行。用了 4 倍的经费,只达到 1/20 的速度。只实现了 8864 个 PE,只达到 BurroughsB67001、阵列控制器2、输入输出系统器 BIOM 三个部分组成。3、IlliacIV 处理器 PEM 组成。P

7、Ui+1 mod64、PUi-1 mod 64、PUi+8 mod64、PUi-8 mod8或)或或 IlliacIV8.3.2BSPBSP(BuroughsScientific sor)IlliacIV8.3.2BSPBSP(BuroughsScientific sor)BSP等 5 个部分组成。1、并行处理机172、控制处理机3、文。器BSP等 5 个部分组成。1、并行处理机172、控制处理机3、文。器4、对准网。5、无系17160ns 的I/O行。问有限差分问题把8.4.222U(x,。问有限差分问题把8.4.222U(x,U(x, 2U(x, 2224h在并行处理机上求解,FORTRAN 程序如下:DO10I0,7 C(I, J)=0DO 20 K=0, (I, J)+A(I,K)*B(K,局器中的数据分布在并行处理机上求解,FORTRAN 程序如下:DO10I0,7 C(I, J)=0DO 20 K=0, (I, J)+A(I,K)*B(K,局器中的数据分布如下:PE7:c07 a00b07a01b17 a02b27a07b77 PE0:c10 a10b00a11b10 a12b20a17b70 7cij aikbkj, 0i,j7如果把 IlliacIV 的 64 个处理单元全部利用起来并行运如果把 Illiac

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论