计算机系统结构41PPT学习教案_第1页
计算机系统结构41PPT学习教案_第2页
计算机系统结构41PPT学习教案_第3页
计算机系统结构41PPT学习教案_第4页
计算机系统结构41PPT学习教案_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1 计算机系统结构计算机系统结构41 2 第1页/共44页 3 第2页/共44页 4 nn 算叫做向量处理向量处理。相应指令叫向向 量指令量指令。 第3页/共44页 5 考察向量计算表达式: C(I)A(I5)B(I)I10,11,12,1000 (1)使用FORTRAN语言,循环部分为: DO40I10,1000 40C(I)A(I5)B(I) 一般机器上可用下列指令序列实现 I=10 100LOADA(I+5) LOADB(I) ADDC(I),A(I),B(I) INCREMENTII+1 IFI=1000,GOTO100 STOP 第4页/共44页 6 (2)在具有向量数据表示的

2、机器中可用如下指令实现 C(10 1000) A(105 10005)B(10 1000) 向量指令的基本格式 参加运算的每个向量都需指明其基地址、位移量和向量长度。 第5页/共44页 7 分析分析向量向量计算计算 Y=a X+ Z 用向量处理机处理用向量处理机处理 LD F0 a ; a装入装入F0 LV V1 M(X) ;X装入装入V1 MULV V2 , F0 ,V1 ; V2 =a X LV V3 , M(Y) ;Y装入装入V3 ADDV V4 , V3, V2 ; 向量加向量加 SV M(Y) , V4 ;存;存 V4 第6页/共44页 8 基本思想是把两个向量的对应分量进行计算,产

3、生一 个结果向量。基本模式表示为下列形式 C=A+B 按向量运算中各计算相继的次序,归结为3种方法种方法: (1)横向处理横向处理:计算按行的方式行的方式从左至右横向进行,逐 个求向量中的每个分量。 (2)纵向处理纵向处理:计算按列的方式列的方式自上而下纵向地进行。 (3)纵横处理:纵横处理:又称分组处理,上述两种方法的结合, 即组内采用纵向处理,组间采用横向处理。 第7页/共44页 9 (1)横向处理:按以下表达式计算每个分量: d1a1(b1c1) d2a2(b2c2) : dNaN(bNcN) 采用流水方式计算时,每个向量加、乘运算中 都会发生数据相关。 计算一个分量要进行2次乘法和加法

4、功能的转移。 共出现N次数据相关、2N次功能转换。 横向处理:不适合于向量流水处理 缺点 DA(BC) 第8页/共44页 10 用向量指令,相当于: KBC DKA DA(BC) 纵向处理:适合于向量流水线处理机, 第9页/共44页 11 当向量长度N超过向量寄存器限度时,需分组处理。 纵横方法适合于寄存器-寄存器工作的向量处理机。 第10页/共44页 12 第11页/共44页 13 存储器存储器-存储器结构存储器结构框框图:向量中对应分量的能并发 访问,计算结果能并行地保存。 需要的带宽是一般存储器的3倍:一个时钟周期内读 出两个操作数并写回一个结果。 第12页/共44页 14 为满足运算器

5、带宽的要求,存储器可采用多个存储 器模块组成的结构方式。如图4.1(b)。 运算器与主存间有3条相互独立的数据通路,数据 通路可并行工作,但一个存储器模块在同一时刻只 能为一个数据通路服务。 第13页/共44页 15 例如, A、B所对应的分量若在 同一个存储器模块,就不能同时 读取,计算的中间结果也不能存 放在正“忙”的存储器模块中。 第14页/共44页 16 时钟周期0,有两个存储模块同时工作; 时钟周期1、2、3、4,5,各有4个存储模块同时工作; 时钟周期6(7)时,有5或6个存储模块同时工作。 实际中,数据存放并非理想,如RAi和RBi存放Mi中。 如何实现无冲突访问? 第15页/共

6、44页 17 在运算流水线的输入端和输出端分别增加一个可变延迟缓冲 器。即可实现无冲突访问。 假设向量A的输入延迟两个时钟周期,输出延迟4个时钟周期 。所有向量都从模块M0开始规则存放,分析向量计算的时空的时空 图图 第16页/共44页 18 1)假设一个存取周期等于两个时钟周期 2)A的输入延迟两个时钟周期 3)输出延迟4个时钟周期 第17页/共44页 19 水线内部加缓冲器以消除内部冲突 的思想是一致的。 第18页/共44页 20 第19页/共44页 21 组成及标量和向量操作: 流水部件由向量部件、浮点部件、标量部件和和地 址运算部件组成。共12个。 指令缓冲器:由256个16位寄存器组

7、成,存放预取 指令。主要程序段可留在其中。内循环指令可全部放 在其中,不必到主存去反复取指令。大大减少取指次 数。 第20页/共44页 22 CRAY-1向量处理机简介 第21页/共44页 23 第22页/共44页 24 n- 存储系统结构设计思想是一致的。 即使操作数离处理器尽可能近, 使处理器处于忙碌状态。 第23页/共44页 25 存储器层次结构 随着处理器速度、存储器容量和级数增加,存储器效率? 计算机系统的高功耗、低效率及存储颈问题突出 第24页/共44页 26 第25页/共44页 27 12个功能部件都是独立的,只要满足一定约束条件,可并行工作。 约束条件为:1.无向量寄存器使用冲

8、突;2.无功能部件使用冲突。 第26页/共44页 28 第27页/共44页 29 第28页/共44页 30 写后读的数据相关性写后读的数据相关性,加快向量指 令序列执行速度。 n链接技术链接技术是流水线定向技术的发展。 第29页/共44页 31 MULV VV2,V3 ; V V2V3 1、2条指令可并行执行:无寄存器和功能部件冲 突。 第3条指令与前两条指令均能链接。 1、2条指令执行时间和寄存器长度必须相同 第30页/共44页 32 处理机自动检测每一条向量指令是否与前一条指令形成链接。 若满足链接条件,便启动本指令工作而形成链接。 数据进(出)每个功能部件,包括存器,需1个时钟周期。 L

9、VV3,M(A);V3A ADDVV2,V0,V1;V2V0V1 MULVV,V2,V3;VV2V3 第31页/共44页 33 如 链接条件问题 LVV3,M(A);V3A ADDVV2,V0,V1;V2V0V1 MULVV,V2,V3;VV2V3 第32页/共44页 34 假定,一个程序段有以下三个向量操作:假定,一个程序段有以下三个向量操作: V3 A V2 V0 + + V1 V4 V2 * * V3 +1 +1 +1+1 +1 数据进出每个功能部件,需1个时钟周期 向量在加法部件的执行时间为(1+6+1)+N-1 链接后执行时间增加? (1+7+1) 第33页/共44页 35 第34页/共44页 36 度计算出循环的次数。 第35页/共44页 37 第36页/共44页 38 前三种技术措施都是在单处理机结构的向量计算机上实现的。 为了有效地提高向量处理性能,新型向量机可采用多处理 机体系结构。 下图是CRAYX-MP的结构框图,它由4个CPU组成。CPU的 结构同CRAY-1向量处理机相似。 第37页/共44页 39 到发挥。 第38页/共44页 40

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论