多指令流出技术PPT学习教案_第1页
多指令流出技术PPT学习教案_第2页
多指令流出技术PPT学习教案_第3页
多指令流出技术PPT学习教案_第4页
多指令流出技术PPT学习教案_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1多指令流出技术多指令流出技术以以一一台台 k k 段段流流水水线线的的普普通通标标量量处处理理机机为为基基准准超超标标量量处处理理机机、超超流流水水线线处处理理机机和和超超标标量量超超流流水水线线处处理理机机的的主主要要性性能能:机器类型k 段流水线基准标量处理机m 度超标量处理机n 度超流水线处理机(m,n)度超标量超流水线处理机机器流水线周期1 个时钟周期11n1n同时发射指令条数1 条m1m指令发射等待时间1 个时钟周期11n1n指令级并行度 ILP1mnmn第1页/共31页第2页/共31页整整 数数部部 件件整整 数数部部 件件位位 操操作作浮浮 点点加加乘乘 法法部部 件件除

2、除 法法部部 件件图图 形形部部 件件图图 形形部部 件件内内 部部 总总 线线读读 数数 存存 数数部部 件件通通 用用 寄寄存存 器器 堆堆扩扩 展展寄寄 存存 器器 堆堆目目 标标指指 令令指指 令令 分分 配配 转转 移移 部部 件件数数 据据 C Ca ac ch he e( 8 8K KB B)指指 令令 C Ca ac ch he e( 8 8K KB B)3 32 2 位位 地地 址址 总总 线线6 64 4 位位 数数 据据 总总 线线 系系 统统 总总 线线超超 标标 量量 处处 理理 机机 M MC C8 88 81 11 10 0 的的 结结 构构 Motorola公司

3、的MC88110。有10个操作部件。 两个寄存器堆:整数部件通用寄存器堆,32个32位寄存器; 浮点部件扩展寄存器堆,32个80位寄存器。 缓冲深度为4的先行读数栈,缓冲深度为3的后行写数栈。 两个独立的高速Cache中,各为8KB,采用两路组相联方式, 转移目标指令Cache,存放一条分支上的指令。第3页/共31页第4页/共31页单单发发射射处处理理机机的的指指令令流流水水线线时时空空图图 1 2 3 4 5 6 I1 IF ID EX WR 时时钟钟周周期期 I2 IF ID EX WR I3 IF ID EX WR 指指令令 多多发发射射处处理理机机的的指指令令流流水水线线时时空空图图

4、1 2 3 4 5 6 I1 IF ID EX WR 时时钟钟周周期期 I2 IF ID EX WR I3 IF ID EX WR I4 IF ID EX WR I5 IF ID EX WR I6 IF ID EX WR I7 IF ID EX WR I8 IF ID EX WR I9 IF ID EX WR 指指令令 第5页/共31页2021年7月30日第6页/共31页NmmTT mm kNNm k( , )(, )()()1 1111第7页/共31页2021年7月30日第8页/共31页每每个个时时钟钟周周期期分分时时发发射射 3 3 条条指指令令的的超超流流水水线线处处理理机机的的指指令令

5、执执行行时时空空图图 1 1 2 2 3 3 4 4 5 5 6 6 I1 IF I ID D EX WR 时时钟钟周周期期 I2 IF ID EX W WR R I3 IF ID EX WR I4 IF ID EX WR I5 IF ID EX WR I6 IF ID EX WR I7 IF ID EX WR I8 IF ID EX WR 指指令令 I9 IF ID EX WR 第9页/共31页2021年7月30日典型处理机结构 MIPS R4000处理机,每个时钟周期包含两个流水段, 是一种很标准的超流水线处理机结构。 指令流水线有8个流水段。 有两个Cache,指令Cache和数据Cac

6、he的容量各8KB, 每个时钟周期可以访问Cache两次, 因此在一个时钟周期内可以从指令Cache中读出两条指令, 从数据Cache中读出或写入两个数据。 主要运算部件有整数部件和浮点部件。第10页/共31页译译 码码 数数 据据 C C a a c c h h e e 标标 志志 标标 志志 指指 令令 C C a a c c h h e e 译译 码码 存存 入入 缓缓 冲冲 对对 准准 器器 IB U S 写写 入入 缓缓 冲冲 器器 数数 据据 标标 志志 地地 址址 D B U S 系系 统统 控控 制制 浮浮 点点 存存 储储 管管 理理 部部 件件 寄寄 存存 器器 堆堆 指指

7、 令令 快快 表表 浮浮 点点 流流 水水 线线 专专 用用 通通 路路 指指 令令C a c h e 控控 制制 快快 表表T L B 浮浮 点点 控控 制制 寄寄 存存 器器 D V A 浮浮 点点 乘乘 法法 部部 件件 地地 址址 部部 件件 浮浮 点点 除除 法法 部部 件件 数数 据据C a c h e 控控 制制 程程 序序 计计 数数 器器 浮浮 点点 加加 法法 部部 件件 流流 水水 线线 通通 用用 寄寄 存存 器器 堆堆 转转 换换 部部 件件 控控 制制 算算 术术 逻逻 辑辑 部部 件件A L U 求求 平平 方方 根根 部部 件件 装装 入入 对对 准准 器器 /

8、 / 存存 入入 驱驱 动动 器器 整整 数数 乘乘 法法 除除 法法 部部 件件 M M I I P P S S R R 4 4 0 0 0 0 0 0 超超 流流 水水 线线 处处 理理 机机 结结 构构 第11页/共31页2021年7月30日MIPS R4000MIPS R4000 处理机的流水线操作处理机的流水线操作 IF IS RF EX DF DS TC WB 指令指令 指令译码指令译码 Cache 数据数据 寄存寄存 读读寄寄存存器器 ALU Cache 标标 志志 检检 验验 器堆器堆 IF:取第一条指令;:取第一条指令;IS:取第二条指令;:取第二条指令;RF:读寄存器堆,指

9、令译码;:读寄存器堆,指令译码; EX:执行指令;:执行指令;DF:取第一个数据;:取第一个数据;DS:取第二个数据;:取第二个数据;TC:数据标志检验;:数据标志检验; WB:写回结果:写回结果 第12页/共31页 MIPS R4000MIPS R4000 正常指令流水线工作时序正常指令流水线工作时序 主时钟周期主时钟周期 当前当前 CPU 周期周期 IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF

10、 IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF IS RF EX DF DS TC WB IF:取第一条指令;:取第一条指令;IS:取第二条指令;:取第二条指令;RF:读寄存器堆,指令译码;:读寄存器堆,指令译码; EX:执行指令;执行指令;DF:取第一个数据;:取第一个数据;DS:取第二个数据;:取第二个数据;TC:数据标志检验;:数据标志检验; WB:写回结果:写回结果 流水流水 线线 周期周期 第13页/共31页2021年7月30日TnkntN( , )()11tnNktNknTTnS)1()1(), 1 ()1 , 1 (), 1 (1

11、) 1(), 1 (NnkNknnS第14页/共31页2021年7月30日第15页/共31页每每个个时时钟钟周周期期发发射射 3 3 次次,每每次次同同时时发发射射 3 3 条条指指令令的的 超超标标量量超超流流水水线线处处理理机机的的指指令令执执行行时时空空图图 1 1 2 2 3 3 4 4 5 5 6 6 I1 IF ID EX WR 时时钟钟周周期期 I2 IF ID EX WR I3 IF ID EX WR I4 I IF F ID EX WR I5 IF ID EX WR I6 IF ID EX WR I7 IF ID EX WR I8 IF ID EX WR I9 IF ID E

12、X WR I10 IF ID EX WR I11 IF ID EX WR I12 IF ID EX WR 指指令令 I IF F:取取指指令令,I ID D:指指令令译译码码,E EX X:执执行行指指令令,W WR R:写写回回结结果果 第16页/共31页第17页/共31页指指 令令 Cache( 8KB)转转 移移 历历 史史区区 号号指指 令令 地地 址址 总总 线线EBOXIBOXFBOX 3 3 4 4 位位乘乘 法法 器器预预 取取 器器乘乘 法法 器器 / /加加 法法 器器资资源源冲冲突突检检测测加加 法法 器器移移 位位 器器P P C C 计计 算算 数数 据据 总总 线线

13、逻逻 辑辑 单单 元元指指 令令 快快 表表除除 法法 器器 1 1 2 2 8 8 位位流流 水水 线线控控 制制定定 点点 寄寄 存存 器器 堆堆( 3 3 2 2 6 6 4 4 )浮浮 点点 寄寄 存存 器器 堆堆( 3 3 2 2 6 6 4 4 )ABOX总总线线接接口口部部外外 部部 Cache写写 数数 缓缓 冲冲 器器地地 址址 发发 生生 器器数数 据据 快快 表表读读 数数 缓缓 冲冲 器器 控控 制制件件数数 据据 Cache( 8KB)区区 号号数数 据据A A l l p p h h a a 2 2 1 1 0 0 6 6 4 4 处处 理理 机机 结结 构构除 法

14、 器第18页/共31页2021年7月30日第19页/共31页7 7 个流水段的整数操作流水线个流水段的整数操作流水线(0)(0)(1)(1)(2)(2)(3)(3)(4)(4)(5)(5)(6)(6)IFSWAPI0I1A1A2WRIFIF:取指令;:取指令;SWAPSWAP:交换双发射指令,转移预测;:交换双发射指令,转移预测;I0I0:指令译码;:指令译码;I1I1 访问通用寄存器堆,发射校验;访问通用寄存器堆,发射校验;A1A1:计算周期:计算周期 1 1,IBOXIBOX 计算新的计算新的 PCPC 值;值;A2A2:计算周期:计算周期 2 2,查指令快表;,查指令快表;WRWR:写整

15、数寄存器堆,指令:写整数寄存器堆,指令 CacheCache 命中检测。命中检测。7 7 个流水段的访问存储器流水线个流水段的访问存储器流水线 (0) (0)(1)(1)(2)(2)(3)(3)(4)(4)(5)(5)(6)(6)IFSWAPI0I1ACTBHMACAC:ABOXABOX 计算有效数据地址;计算有效数据地址;TBTB:查数据快表;:查数据快表;HMHM:写读数缓冲栈,数据:写读数缓冲栈,数据 CacheCache 命中命中/ /不命中检测。不命中检测。 10 10 个流水段的浮点操作流水线个流水段的浮点操作流水线 (0) (0)(1)(1)(2)(2)(3)(3)(4)(4)(

16、5)(5)(6)(6)(7)(7)(8)(8)(9)(9)IFSWAPI0I1F1F2F3F4F5FWRF1F1F5F5:浮点计算流水线;:浮点计算流水线;FWRFWR:写回浮点寄存器堆。:写回浮点寄存器堆。第20页/共31页T m nkNmm nt( , )()mNknmNknmnmS) 1(),(tmnmNktNknmSSnmS)()1(),()1 , 1(),(第21页/共31页2021年7月30日第22页/共31页2021年7月30日第23页/共31页2021年7月30日Loop:LDF0,0(R1) ; F0=vector element ADDD F4,F0,F2 ;add sca

17、lar from F2 SD0(R1),F4 ;store result SUBI R1,R1,8 ;decrement pointer 8B (DW) BNEZ R1,Loop ;branch R1!=zero 第24页/共31页2021年7月30日循环展开5次调度后的代码:第25页/共31页2021年7月30日整数指令浮点指令时钟周期 LOOP:LD F0,0(R1)1LD F6,-8(R1)2LD F10,-16(R1)ADDD F4,F0,F23LD F14,-24(R1)ADDD F8,F6,F24LD F18,-32(R1)ADDD F12,F10,F25SD 0(R1),F4ADDD F16,F14,F26SD -8(R1),F8ADDD F20,F18,F27SD-16(R1),F128SUBI R1,R1,#409SD -24(R1),F1610BNEZ R1,LOOP11SD8(R1),F2012在DLX超标量流水线上展开并调度后的代码第26页/共31页2021年7月30日第27页/共31页2021年7月30日第28页/共31页2021年7月30日件。由于编译器在编译时间已解决可能出现的数据相关和资源冲突,故控制硬件比较简单

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论