下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 二 章 2.13 在一台单流水线多操作部件的处理机上执行下面的程序,每条指令的取指令、指令译码需要一个时钟周期,MOVE、ADD和MUL操作分别需要2个、3个和4个时钟周期,每个操作都在第一个时钟周期从通用寄存器中读操作数,在最后一个时钟周期把运算结果写到通用寄存器中。k: MOVE R1,R0 ;R1 (R0)k+1: MUL R0,R2,R1 ;R0 (R2)×(R1)k+2: ADD R0,R2,R3 ;R0 (R2)+(R3)(1)就程序本身而言,可能有哪几种数据相关?(2)在程序实际执行过程中,哪几种数据相关会引起流水线停顿?(3)画出指令执行过程的流水线时空图,并计算
2、完成这3条指令共需要多少个时钟周期?解:(1)就程序本身而言,可能有三种数据相关。若3条指令顺序流动,则k指令对R1寄存器的写与k+1指令对R1寄存器的读形成的“先写后读”相关。若3条指令异步流动,则k指令对R0寄存器的读与k+1指令对R0寄存器的写形成的“先读后写”相关,k+2指令对R0寄存器的写与k+1指令对R0寄存器的写形成的“写写”相关。(2)在程序实际执行过程中,二种数据相关会引起流水线停顿。一是“先写后读”相关,k指令对R1的写在程序执行开始后的第四个时钟;k+1指令对R1的读对指令本身是第三个时钟,但k+1指令比k指令晚一个时钟进入流水线,则在程序执行开始后的第四个时钟要读R1。
3、不能在同一时钟周期内读写同一寄存器,因此k+1指令应推迟一个时钟进入流水线,产生了流水线停顿。二是“写写”相关,k+1指令对R0的写对指令本身是第六个时钟,而要求该指令进入流水线应在程序执行开始后的第三个时钟,所以对R0的写是在程序执行开始后的第八个时钟。k+2指令对R0的写对指令本身是第五个时钟,而k+2指令比k+1指令晚一个时钟进入流水线,则在程序执行开始后的第四个时钟,所以对R0的写是在程序执行开始后的第八个时钟。不能在同一时钟周期内写写同一寄存器,因此k+2指令应推迟一个时钟进入流水线,产生了流水线停顿。另外,可分析“先读后写”相关不会产生流水线的停顿。 (3)由题意可认位该指令流水线
4、由六个功能段取指、译码、取数、运一、运二和存数等组成,则程序指令执行过程的流水线时空图如下图所示。若3条指令顺序流动,共需要9个时钟周期。 空间存数 K存数 K+1存数 K+2存数 运二 K+1运二 运一 K+1运一 K+2运一 取数 K取数 K+1取数 K+2取数 译码 K译码 K+1译码 K+2译码 取指 K取指 K+1取指 K+2取指 时间 0 1 2 3 4 5 6 7 8 92.23 有一条5个功能段的线性动态多功能流水线如图所示,其中1235功能段组成加法流水线,145功能段组成乘法流水线,设每个功能段的延迟时间均相等为t。用这条流水线计算F=,画出流水线时空图,并计算流水线的实际
5、吞吐率、加速比和效率。S1S2S3S5S4XYZ解:由于该流水线为动态双功能流水线,计算要求先加后乘,因此应先设置加法功能,连续计算出(a1+b1)、(a2+b2)、(a3+b3)、(a4+b4)四个加法后;再设置乘法功能,而且按(a1+b1)×(a2+b2)×(a3+b3)×(a4+b4)顺序做3个乘法。因此可画出该流水线的时空图如图所示,图中A=a1+b1,B=a2+b2,C=a3+b3,D=a4+b4。空间S5S4S3S2S11234三一二一二一二1234ABCDA·B C·D(A·B)×(C·D) t7t1
6、2a1b1a2b2a3b3a4b4ABCDA·BC·D时间12341234三三由时空图可以看出,在总共12个t的时间内输出7个结果,所以有:TP = n/Tn = 7/12t而当用串行方法完成操作时,需要四次加法和三次乘法,完成一次加法需要4t,完成一次乘法需要3t,完成该运算总共需要时间为:T0 = 4×4t+3×3t = 25t所以 S = T0/Tn = 2.08E = 有效时空区面积/全部时空区面积 = (4×4t+3×3t)/(5×12t) = 0.422.24 有一条3个功能段的流水线如下图所示,每个功能段的延迟
7、时间均为t,但是,功能段S2的输出要返回到它自己的输入端循环执行一次。S1S2S3 输入 输出 t t t(1)如果每隔一个t向流水线连续输入任务,这条流水线会发生什么问题?(2)求这条流水线能够正常工作的实际吞吐率、加速比和效率。 (3)可用什么办法来提高流水线的吞吐率,画出改进后的流水线结构。解:(1)每个任务在段S2要反馈循环一次,执行时间为2t,其它各段的执行时间为t,因此应按瓶颈段的执行时间2t流入任务,才不会发生冲突现象,否则会发生流水线的阻塞。 (2)若连续输入n个任务,则流水线的实际吞吐率、加速比和效率分别为: TP = n/(4t +2(n1)t)= n/2(n + 1)t
8、1/2tS = 4nt/(4t +2(n1)t)= 2n/(n + 1)2 E = 4nt/3(4t +2(n1)t)= 2n/3(n + 1)2/3(3)为提高流水线的吞吐率,可重复设置段S2,并使两个段S2串连在一起,从而消除瓶颈段S2,而且各段执行时间相等为t,流水线的段数为4。流水线的结构如下图所示。S3S2S2S1 输入 输出 t t t t2.25 在一个5段的流水线处理机上需经9t才能完成一个任务,其预约表为: 时间 1 2 3 4 5 6 7 8 9流水段S1 × ×S2 × × ×S3 ×S4 ×
9、5;S5 × ×延迟D2 × (1)写出流水线的初始冲突向量。(2)画出流水线任务调度的状态有向图。(3)求出流水线的最优调度策略及最小平均延迟时间和流水线的最大吞吐率。(4)按最优调度策略连续输入8个任务时,流水线的实际吞吐率是多少? 解:(1)根据初始冲突向量的构成方法,对预约表各行中打“×”的拍数求出差值,除去重复的后汇集在一起,即得到延迟禁止表为F =1,5,6,8。由F可得到初始冲突向量为: C =(10110001) (2)根据后继冲突向量的递推规则Cj = SHR(k)(Ci)C0则可得出所有的后继状态,具体有:10110001 C0C0四
10、个后继状态:C1 =SHR(2)(C0)C0 = 10111101 7 C2 =SHR(3)(C0)C0 = 10110111 C3 =SHR(4)(C0)C0 = 10111011 3 2C4 =SHR(7)(C0)C0 = 10110001=C0 7 4 710111101 C110110111 C2C1二个后继状态:C5 =SHR(2)(C1)C0 = 10111111 C6 =SHR(7)(C1)C0 = 10110001=C0 7C2二个后继状态:C7 =SHR(4)(C2)C0 = 10111011=C3 3 4 7 210111011 C310111111 C5C8 =SHR(7
11、)(C2)C0 = 10110001=C0C3二个后继状态:C9 =SHR(3)(C3)C0 = 10110111=C2C10=SHR(7)(C3)C0 = 10110001=C0C5一个后继状态:C11=SHR(7)(C5)C0 = 10110001=C0 由后继状态和引起状态转移的时间间隔可得到状态有向图如上图所示。 (3)由状态转移有向图可得到无冲突的任务调度策略及其平均延迟时间,如下表所示。调度策略 平均延迟时间 特别地,从C0出发的3,(4,3)也是一个(2,2,7) (2+2+7)t/3 = 3.67t 任务调度策略,除第一条有向弧外,第二、三条 (2,7) (2+7)t/2 = 4.5t 有向组成一个环路,该调度策略为(4,3)。从表 (3,4,7) (3+4+7)t/3 = 4.67t 中可以得到平均延迟时间最小的调度策略为(4, (3,7) (3+7)t/2 = 5t 3),该调度策略则为最优调度策略,相应的最小(4,3,7) (4+3+7)t/3 = 4.67t 平均延迟时间为3.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024居间合同受法律保护居间合同正式合同范本
- 编剧合同编剧合同终止协议2024年
- 2024常规解除劳动合同证明书范本
- 标准版采购协议样本
- 大学毕业生就业意向协议书
- 人才公寓优惠政策协议
- 个人个人存单质押贷款合同
- 广告拍摄合同案例
- 企业合伙协议合同样本欣赏
- 企业劳动合同范本汇编
- 晨会安全讲话稿范文大全集
- 汽车美容装潢技术电子教案 2.2-汽车内部清洗护理
- 2023年中国铁塔招聘笔试真题
- DB11∕T 2103.4-2023 社会单位和重点场所消防安全管理规范 第4部分:大型商业综合体
- 常规弱电系统施工单价表纯劳务
- 上海市闵行区2024-2025学年九年级上学期期中语文试题
- 2024年代持法人报酬协议书模板范本
- 2024年贵州贵阳市信访局招聘历年高频难、易错点500题模拟试题附带答案详解
- 2024年人教版六年级数学上册《第5单元第7课时 扇形的认识》单元整体教学课件
- 2023湖南文艺出版社五年级音乐下册全册教案
- 职业教育国家在线课程申报书
评论
0/150
提交评论