第五章-标量处理机及流水线(共26页)_第1页
第五章-标量处理机及流水线(共26页)_第2页
第五章-标量处理机及流水线(共26页)_第3页
第五章-标量处理机及流水线(共26页)_第4页
第五章-标量处理机及流水线(共26页)_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上第五章 标量处理机与流水线选择题 25,简答题10,演算题 151 选择题1. 假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间分别为、和,顺序执行n条指令至少需要花费的时间为:A. B. C. D. 答案:C2. 假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间均为,连续执行n条指令所需要花费的最短时间约为(假设仅有“取指令”和“执行”可重叠并假设n足够大):A. B. C. D. 答案B3. 假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间均为,连续执行n条指令所

2、需要花费的最短时间约为(假设仅有“取指令”和“分析”可重叠并假设n足够大):A. B. C. D. 答案B4. 假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段的执行时间分别为、和,连续执行n条指令所需要花费的最短时间约为(假设仅有“取指令”和“执行:”可重叠并假设n足够大):A. B. C. D. 答案B5. 假设一条指令的执行过程可以分为“取指令”、“分析”和“执行”三段,每一段分别只有一个部件可供使用并且执行时间分别为、和,连续执行n条指令所需要花费的最短时间约为(假设“取指令”、“分析”和“执行”可重叠并假设n足够大):A. B. C. D. 答案C6. 看下述

3、程序段:k:R0=R1×R4k+1:R6=R51k+2:R2=R0×R3k+3:R3=R4-1k+4:R2=R5K+5:下列哪个数据相关没有在上述程序段中发生A. 先写后读相关B. 写-写相关C. 先读后写相关D. 以上都不对答案:D7. 看下述程序段:k:R5=R2k+1:R0=R1×R4k+2:R2=R51k+3:R4=R0×R3k+4:R3=R4-1K+5:k和k+2之间发生的是什么数据相关I. 先写后读相关II.写-写相关III. 先读后写相关A. 只有IB. 只有I、IIC. 只有I、IIID. 以上都不对答案:C8. 一条流水线可分为k段,各

4、段的执行时间都是,共向该流水线输入n个任务,第n个任务结束于:A.B.C. D.答案:D9. 一条流水线的可分为k段,各段的执行时间都是,共向该流水线输入n个任务,求该流水线实际吞吐率的为:A. B. C. D. 答案:D10. 一条流水线可以由以下时空图来表示,求该流水线的实际吞吐率(假设n=100)4ns0空间时间nn-1321nn-1321nn-1n-1321n321A. B. C. D. 答案:C11. 一条4段的流水线可以由以下时空图来表示,求该流水线的实际吞吐率(假设n=100)0543216空间时间(ns)321n321nn321321nA. B. C. D. 答案:D12. 一

5、条流水线可以由以下时空图来表示,求该流水线的加速比24ns0空间时间nn-1321nn-1321nn-1n-131n321A. 2B. 3C. 4D. 6答案:C13. 一条4段流水线,每段执行时间为1ns,求该流水线执行100条指令最大效率为:A. 100%B. 96.2%C. 97.1%D. 388%答案:C14. 如下图所示的浮点加法流水部件,计算,流水线经过多少时钟后排空(假设时钟为)t1=3tS2S2S1S4S3t1=tt1=tt1=t输入输出S2A. 16B. 15C. 14D. 13答案:B15. 某动态流水线有S1、S2、S3和S4段,其特性由下图所示的预约表来表示t0t1t2

6、t3t4t5t6S1S2S3S4问该流水线的冲突向量是:A. ()B. ()C. ()D. ()答案:D16. 某动态流水线有S1、S2、S3和S4段,其特性由下图所示的预约表来表示t0t1t2t3t4t5t6S1S2S3S4求该流水线的最小平均启动周期A. 6B. 5C. 4D. 3.5答案:C17. 下图所示的时空图对应的处理机为:43212143时钟周期I6I5I3I2I1指令4321432143214321A. 标量处理机B. 超标量处理机C. 超流水处理机D. 超标量超流水处理机答案:C18. 一台度的超标量超流水线处理机的指令并行度为A. mB. m(n-1)C. (m-1)(n-

7、1)D. mn19. 连续执行100条指令时,一台2度的超标量处理机的最大效率是多少(假设这里的每条流水线是4段标准流水线的流水线)A. 100%B. 97.1%C. 94.3%D. 92.6%答案:C20. 连续执行100条指令时,一台5度的超标量超流水线处理机的最大效率是多少(假设这里的每条流水线是基于4段标准流水线的超标量流水线)A. 100%B. 97.09%C. 96.34%D. 96.15%答案:C21. 在不同结构的处理机上运行的矩阵乘法CA×B,假设A是m×n阶的矩阵,B是n×l阶的矩阵,则最少需要进行多少次乘法和多少次加法A. mn, nlB.

8、mnl, ml(n-1)C. mnl, mn(l-1)D. mnl, mnl答案:B22. 试比较在指令并行度较低的情况下,具有相同指令并行度的超标量处理机a和超流水线处理机b的效率A. a>bB. a=bC. a<bD. 不能确定(和指令数有关)答案:A23. 一条4个功能段的加乘静态流水线,四个功能段如下所示,计算,最少需要经过多少时间,假设运算的结果必须先写入到缓冲存储器才能供输入端使用。并且只有当一个流水线排空后流水线才可以发生另一种运算。(1) 取指(2) 译码、取数(3) 运算(4) 写结果A. 19B. 23C. 25D. 27答案:C24. 一条4个功能段的加乘静态

9、流水线,四个功能段如下所示,计算,最少需要经过多少时间,假设运算的结果有专门的输出通路连接到输入端。并且只有当一个流水线排空后流水线才可以发生另一种运算。(5) 取指(6) 译码、取数(7) 运算(8) 写结果A. 16B. 23C. 25D. 27答案:B25. 一台标量处理机,具有一条5级指令流水线,每级均耗时1个时钟周期,执行一个具有20条指令的代码序列。现将此标量处理机改为超流水线处理机,采用同样基准的指令流水线,不同的是每隔1/4个时钟周期发射1条指令,执行相同的代码序列。问前后两次执行的加速比。A. 2.4B. 2.46C. 2.67D. 2.75答案:B2 问答题1. 简述流水线

10、技术的特点答:流水线技术具有以下特点:流水过程由多个相联系的子过程组成,每个过程称为流水线的“级”或“段”。流水技术适合于大量重复的时序过程。2. 请写出2种乱序流动方式中的数据相关,并举例说明分别在什么情况下发生(采用设计程序段的方式来说明)答:写读相关:例如程序段R0=R1×R4; R2=R0×R3若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读相关读写相关例如程序段R2=R0×R3; R3=R4-1若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读数据相关写写相关例如程序段R2=R0×R3; R3=R4-1

11、; R2=R5若指令三在指令一前发生则最终的结果与正确结果不同,此时发生写写数据相关3. 在流水线处理机当中,可能有哪几种操作数据相关?这几种相关分别发生在什么情况下?解决操作数相关的基本方法有哪几种?答:a. 写读相关(先读后写)例如程序段R0=R1×R4; R2=R0×R3若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读相关b. 写写相关例如程序段R2=R0×R3; R3=R4-1; R2=R5若指令三在指令一前发生则最终的结果与正确结果不同,此时发生写写数据相关c. 读写相关(先写后读)例如程序段R2=R0×R3; R3=R4

12、-1若第二条指令在第一条指令前执行则最终的结果与正确结果不同,此时发生写读数据相关解决数据相关的方法可以分为2大类:延迟执行、建立专用路径4. 解决流水线结构相关的方法有哪些?写出2种答:(1) 流水化功能单元(2) 资源重复5. 降低流水线分支损失的方法有哪些?答:(1) 在流水线中尽早判断出分支转移是否成功(2) 尽早计算出分支转移成功时的PC值(即分支的目标地址)“冻结”“排空”流水线的方法:l 预测分支失败l 预测分支成功l 延迟分支6. 试写出延迟分支的3种调度策略,并对其进行评价答:(1) 从前调动分支必须不依赖于被调度阿指令,总是可以有效提高流水线的性能(2) 从目标处调度若分支

13、转移失败,必须保证被调度的指令对程序的执行没有影响,可能需要复制调度指令。分支转移成功时,可提高流水线性能。单由于复制指令,可能加大程序空间(3) 从失败处调度若分支转移成功,必须保证被调度的指令对程序的执行无影响。分支转移失败时,可提高流水线性能7. 简述单流水线标量处理机、超标量处理机、超流水线处理机、超标量超流水线处理机的特点答:具有标量数据表示和标量指令系统的处理机称为标量处理机,通常只有一条流水线,一个时钟周期内可以完成一条指令。超标量处理机一般具有多于一条的流水线,一台m度的超标量处理机可同时发射m条指令,指令的发射等待时间为1个时钟,指令的并行度为m。超流水线处理机一般具有一条k

14、段的超流水线,一台n度的超流水处理机可以同时发射一条指令,指令的发射等待时间为1/n个时钟周期,每个时钟周期共发射n条指令。指令的并行度为n。超标量超流水处理机一般具有多余1条的超流水线,一台度的超标量超流水处理机可以同时发射m条指令,指令的发射等待时间为1/n个时钟周期,每个时钟周期共发射mn条指令,指令的并行度为mn。8. 画图说明什么是流水线“瓶颈”简述解决流水线瓶颈的方法答:S1S4S3t1=tt1=tt1=3tt1=t输入输出S2上图中的S3段就是流水线瓶颈A. 将流水线的“瓶颈”部分再细分B. 重复设置瓶颈流水段,让多个瓶颈流水段并行工作9. 什么是静态流水线?什么是动态流水线答:

15、静态流水线:在同一时间内,多功能流水线种的各个功能只能按照一种固定的方式连接,实现一种固定的功能。只有当按照这种连接方式工作的所有任务都流出流水线之后,多功能流水线才能重新尽心连接,以实现其他功能。动态流水线:在同一时间内,多功能流水线种的割断可以按照不同的方式连接,同时执行多种功能。其中流水线种各个功能部件不能发生冲突。10. 程序中有哪两类相关,分别可以采取什么方法来解决答:程序中可能出现下两类相关(1) 数据相关数据相关指在执行本条指令的过程中,如果用到的指令、操作数、变址偏移量等是前面指令的执行结果,则必须等待前面的指令执行完成,并把结果写道主存或通用寄存器中之后,本条指令才能开始执行

16、。可以采取设置专用数据通路、延迟执行等方法来解决数据相关。(2) 控制相关控制相关指由条件分支指令、转子程序指令、中断等引起的相关。可以采取静态分支预测技术、动态分支预测技术、提前形成条件码等来解决控制相关。3 演算题2. 一条流水线连接图如下所示,画出100条指令连续通过该流水线的时空图,并计算该流水线的吞吐率和最大吞吐率。(其中)S1S4S3t1=tt1=3tt1=tt1=t输入输出S2解:321n321nn321n3210543216空间时间(ns)TP=100/(3*100+6-3)=0.3303MIPS(分母是305,300都不对)TPmax=1/3=0.MIPS3. 一条流水线连接

17、图如下所示,画出100条指令连续通过该流水线的时空图,并计算该流水线的加速比。(其中)S1S4S3t1=tt1=tt1=tt1=3t输入输出S2解:0543216空间时间(ns)321n321nn321321n顺序执行的时间为T06×100600ns采用流水方式执行的时间为T13×10061305ns加速比ST0/T1=600/305=1.974. 连续执行100条指令时,一台2度的超标量超流水线处理机的最大效率是多少(假设这里的每条流水线是基于5段标准流水线的超标量流水线),画出时空图来说明解:n+4.51n321n32n321n321n3211n3221n3321n32

18、1n3210543216空间时间(ns)n效率由以下方法计算100*5/(5*(100+4.5)=95.69%5. 用1条5个功能段的浮点加法器流水线计算。每个功能段的延时均相等,流水线的输出端与输入端之间有直接的数据通路,而且设置有足够的缓冲寄存器。要求用尽可能短的时间完成计算工作,画出流水线时空图,计算流水线的实际吞吐率、加速比和效率解:假设每个功能段的延迟时间为,则上式中加法右下侧地座标表示这是第几个加法时空图略吞吐率为:加速比为:6. 设有一个15000条指令地程序在一台时钟频率为25MHz的线性处理机上执行。假设该指令流水线有5段,并且每个时钟周期发射一条指令。忽略由于转移指令和无序

19、执行造成的损失。(a) 用该流水线执行这一程序,并用通过延迟时间与其相等的一个等效非流水线处理机执行同一程序,将两者加以比较,并计算其加速比。(b) 该流水线处理机的效率和吞吐率是多少?解:(a) 等效的非流水处理机执行一条指令需要的时间是5个时钟周期。按照加速比定义,应有(b) 效率为(c) 吞吐率为7. 设有图3.5所示的浮点加法流水部件,其中第2功能的延迟时间是,其余功能段都是S1S4S3t1=tt1=tt1=tt1=3t输入输出S2试提出改进这条流水线的2种方法,并计算改进后的效率(针对100个任务)。解:改进方案1:将S2细分为3个功能断Z1,Z2,Z3,分别有的延迟时间,则现在流水

20、线有6个功能段,效率为改进方案2:另外补充与S2相同的2个功能段,如下图所示t1=3tS2S2S1S4S3t1=tt1=tt1=t输入输出S2这样,任务可以连续进入流水线,不存在瓶颈问题,效率为8. 某动态流水线有S1、S2、S3和S4段,其特性由下图所示的预约表来表示t0t1t2t3t4t5t6S1S2S3S4确定禁止表F和冲突向量C画出状态图,确定其最小平均等待时间和最大吞吐率解:由预约表可以看出,引起冲突的启动时间是2,4,5,则冲突向量。此流水线的状态图如下所示要找出最小平均等待时间,首先要从状态图种找出迫切循环。迫切循环的定义是,从它们各自的初始状态输出的边缘都具有最小等待时间。从状

21、态图中可以看出(3)和(1,6)是迫切循环,(1,6)平均为3.5。所以最小平均等待时间为3此时最大吞吐率为MAL的倒数为33.3%9. 下列汇编代码在一台3段流水线处理机上执行,每一段都有(相关)检测和分解。这3段是取指令、取操作数(根据要求取一个或多个)和执行(包括写回操作)。试说明在代码执行中所有可能的相关情况。k:INCR0k+1:MULACC, R0k+2:STORER1, ACCk+3:ADDACC, R0k+4:STOREM, ACC其中,双操作数指令,第1个操作数是目的寄存器,第2个操作数是源寄存器。答:1234567IFINCMULSTOREADDSTOREOFR0ACC,R

22、0ACCACC,R0ACCEXR0ACCR1ACCM由此可以看出在t3时刻,发生先写后读相关在t4时刻,发生先写后读相关在t6时刻,发生先写后读相关。10. 某动态流水线有S1、S2、S3、S4和S5段,其特性由下图所示的预约表来表示t0t1t2t3t4t5t6S1S2S3S4S5确定禁止表F和冲突向量C画出状态图,确定其最小平均等待时间和最大吞吐率从简单循环中找出迫切循环使用此流水线时,列出可允许的最小恒定循环如果使用最小恒定循环,则吞吐率是多少?解:禁止等待时间为:3,4,5冲突向量为:(11100)简单循环如下(1,1,6),(2,6),(6),(1,6)迫切(最小启动)循环为(1,1,

23、6)最小平均等待时间为(1+1+6)/3=2.67最小恒定循环为(6)设该流水线的时钟周期为,则最大吞吐率为使用最小恒定循环时,流水线的吞吐率为11. 在不同结构的处理机上运行8×8的矩阵乘法CA×B,计算所需要的最短时间。只计算乘法指令和加法指令的执行时间,不计算取操作数、数据传送和程序控制等指令的执行时间。加法部件和乘法部件的延迟时间都是3个时钟周期,另外,加法指令和乘法指令还要经过一个“取指令”和“指令译码”的时钟周期,每个时钟周期为20ns,C的初始值为0。各操作部件的输出段有直接数据通路连接到有关操作部件的输入端,在操作部件的输出端设置有足够容量的缓冲寄存器。求:

24、(a) 处理机那只有一个通用操作部件,采用顺序方式执行指令的时间(b) 单流水线标量处理机,有一条2个功能的静态流水线,流水线每个功能段的延迟时间均为1个时钟周期,加法操作和乘法操作各经过3个功能段解:(a)共需要进行512次乘法和448次加法,需要时间(512+448)*20*(3+1+1)=96000ns(b)先进行所有的乘法,512次乘法,需要51251516个时钟周期。再进行所有的乘法,每出一个C矩阵中的结果需要考虑时钟相关,即8个数连加需要18个时钟周期,出64个数就需要16×641152个时钟周期,则供需要516+1152=1668个时钟周期,则需要ns12. 某RISC

25、机有8个通用寄存器,有一条4级流水线(1) 取指(2) 译码、取数(3) 运算(4) 写结果试编写出8个通用寄存器那所存的数据之和的程序,要求此程序的执行时间最短,并计算出时间(假设,每级流水线的周期为50ns,加法运算的结果只能送回寄存器,而不能再传送途中被截取,另外假设运算的结果可以直接送到输出端)解:程序如下:ADD R1, R2ADD R3, R4ADD R5, R6ADD R7, R8ADD R1, R3ADD R5, R7ADD R1, R5指令的执行周期数为13,共需要13×50650ns13. 一条具有k个流水段的流水线,由于条件转移指令的影响,再最坏的情况下,每一次

26、条件转移将造成k-1个时钟的“断流”。另外,假设条件转移指令再一般程序中所占的比例为p,转移成功的概率为q。对于一个由n条指令组成的程序,总的执行时间是多少解:由于条件转移需要额外增加的时钟周期数是因此,这n条指令的总执行时间是:14. 某RISC机有16个通用寄存器A1A8,B1B8,有一条如下所示的加乘双功能静态流水线,加法时按照1、2、3、5连接,乘法时按照1、2、3、4、5连接。流水线的输出可直接送到其输入端或存入缓冲器,不计期间的传送延迟,操作数可连续提供。(1) 取指(2) 译码、取数(3) 运算1(4) 运算2(5) 写结果试编写出求的程序,要求此程序的执行时间最短,并计算出时间(假设,每级流水线的周期为50ns)解:程序如下:FOR i=1 TO 8 DOMUL Ai, BiADD A1, A2ADD A3, A4ADD A5, A6ADD A7, A8ADD A1, A3ADD A5, A7ADD A1, A5乘法指令的执行周期数为8+5-1=12,共

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论