下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、指令存诸蓼OPCODE第一章:1 .试述Flynn分类的4种计算机系统结构有何特点。2 .假设高速缓存 Cache工作速度为主存的 5倍,且Cache被访问命中的概率为 90%, 则采用Cache后,能使整个存储系统获得多高的加速比3 .某工作站采用时钟频率为15 MHz、处理速率为10 MIPS的处理机来执行一个已知混合程序。假定每次存储器存取为 1周期延迟,试问:(1)此计算机的有效 CPI是多少(2)假定将处理机的时钟提高到30 MHz,但存储器子系统速率不变。这样,每次存储器存取需要两个时钟周期。如果30%指令每条只需要一次存储存取,而另外5%每条需要两次存储存取,并假定已知混合程序的
2、指令数不变,并与原工作站兼容, 试求改进后的处理机性4,处理机的时钟 30 MHz指会娄里CPU指令国合七,:正算本和是高1/僮噗耳曲中的加戢/春鹏213械412在述学年优央的存活基工问E10(1)计算在单处理机上用上述跟踪数据运行程序的平均CPI(2)根据(1)所得CPI,计算相应的 MIPS速率。1、解释图中各控制信号的作用。萤括伊镭器ZEROSIMM ialuopW7评型器ZEROB:AKLN2、各流水级存放控制信号的流水线寄存器有何异同3、设流水线模型机采用load前推和数据前推,按时钟周期画出以下指令序列的时序图,标 示出前推示意。load r2, 12(r3)addi r4, r2
3、, 10and r1, r2, r4store r1, 10(r5)4、给出节PPT中图的BDEPEN腔制信号的真值表。AA DOPCODE fB 1 # ird I-h-M:HEXE_rdZERO数据存慵器MEMWREGMEM _rdLIA K J<i . -二二= .一 一 一 一 .一 一 一 一半期:1、试分析采用哪种设计方案实现求浮点数除法FPMUL对系统性能提高更大。假定FPMUL操作占整个测试程序执行时间的15%。一种设计方案是增加专门的FPMUL硬件,可以将FPMUL操作的速度加快到 10倍;另一种设计方案是提高所有FP运算指令的执行速度,使得FP指令的执行速度加快为原来
4、的倍,设FP运算指令在总执行时间中占40%。(3分)解:对这两种设计方案的加速比分别进行计算。增加专门FPDIV硬件方案:Fe = 15% = , Se = 10&PDIV = 1/(+10)=1/ =提高所有FP运算指令速度方案:Fe = 40% = , Se =Sfp = 1/(+ = 1/ =增加专门FPDIV硬件方案的加速比更高,对系统性能提高更大。2.设流水线模型机结构如下图所示,采用load前推和数据前推(包括 store指令)。假设模型机使用subicc指令,它将根据减法结果设置标志寄存器Z的内容为0或为1;其它的ALU计算指令不影响Z。指令bne的控制相关处理采用插入
5、nop指令的策略。(7分)LOADDEPENEXK-SLDZERON-HWCTL黑七 WHFL3-1-弓=MEM VPF<.带有内部前推及load相关暂停功能的流水线处理机设有以下指令序列:Lop:loadr1,100(r3)addi r2, r1, 10storer2,100(r3)subiccr5,r5, 1bne r5,lop ;如果r5的内容不为 0,则转Lop(1) 按时钟周期画出以上指令序列第1次循环执行及转移到“ load r1, 100(r3)”指令,在模型机中执行的时序图,标出内部前推示意。(3分)(2) 如果以上指令序列在流水线CPU执行,当第2条指令" a
6、ddi r2, r1, 10”进入EXE级时,试给出 ADEPEN BDEPEN言号的值、 WB级信号SLD的值。(2分)ADEPEN =BDEPEN =SLD=(3) 设模型机采用延迟转移,调整以上指令序列的顺序,使得指令序列在模型机中执行时只有最小停顿,写出调整后的指令序列(不需要画时序图)。(2分)解:(1)toad13,100addMl 三 IVl riloadI“ etc flq(jd |mHrl,io 1addf2111Storer3,100,r2addMEMIsub leesubi5I11nop1 1 ilzero"?moo(2) ADEPEN = 3或(11) BDE
7、PEN = 1 或(01) SLD=1 (3 )Lop:loadr1, 100(r3)subiccr5, r5, 1addir2, r1, 10bner5,lopstorer2, 100(r3)第四章: 1、浮点流水线延迟如PPT例4-1,将下面的循环展开并进行指令调度,直到没有任何延迟。LOOP: LD F0,0(R1);MULD F0,F0,F2;LD F4,0(R2);ADDD F0,F0,F4;SD F0,0(R2);DSUBI R1,R1,#8;DSUBI R2,R2,#8;BNEZ R1, R0 LOOP;2、按PPT例4-4中的一段指令代码和记分牌信息初始状态,试给出SUBD指令
8、写结果前各记录表的状态。LDF6,34(R2)LDF2,45(R3)MULTD F0 , F2 , F4SUBD F8 , F6 , F2DIVDF10 , F0 , F6ADDD3、采用Tomasulo算法,按PPT例4-6中的一段指令代码和各表的初始状态,试给出 SUBD 指令写结果前的指令状态、保留站状态和寄存器状态。第五章:某个计算机系统有128字节的高速缓存。它采用每块有8个字节的4路组相联映射。物理地址大小是32位,最小可寻址单位是 1个字节。(1)画图说明高速缓存的组织并指明物 理地址与高速缓存地址的关系;(2)可以将地址000010AFH分配给高速缓存的哪一组(3)假如地址00
9、0010AFH和FFFF7AxyH可以同时分配给同一个高速缓存组,地址中的x与y的值为多少假设对指令 Cache的访问占全部访问的 75%,而对数据Cache的访问占全部访问的 25%。 Cache的命中时间为1个时钟周期,失效开销为50个时钟周期,在混合 Cache中一次LOAD或STOR既作访问Cache的命中时间都要增加一个时钟周期,32KB的指令Cache的失效率为, 32 KB的数据Cache的失效率为%, 64 KB的混合Cache的失效率为%。又假设采用写 直达策略,且有一个写缓冲器,并且忽略写缓冲器引起的等待。试问指令Cache和数据Cache容量土匀为32 KB的分离Cache和容量为64 KB的混合Cache相比,哪种 Cache的失效率更低 两种情况下平均访存时间各是多少给定以下的假设,试计算直接映象Cache和两路组相联 Cache的平均访问时间以及 CPU的性能。由计算结果能得出什么结论(1)理想Cache情况下的CPI为,时钟周期为2 ns,平均每条指令访存次。(2)两者Cache容量土匀为64KB,块大小都是32B。(3)组相联Cache中的多路选择器使 CPU的时钟周期增加了 10%。(4)这两种Cache的失效开销都是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 策划招商洽谈活动方案
- 七年级历史下册期末复习课件第二单元
- 研学旅游可持续发展研究-洞察分析
- 体育管理信息化技术应用-洞察分析
- 乙酰氨基酚的质量控制技术研究-洞察分析
- 无人配送技术与应用-洞察分析
- 游戏跨平台营销效果比较-洞察分析
- 月球基地安全防护技术-洞察分析
- 物理层切片技术探索-洞察分析
- 细胞骨架在肿瘤发生发展中的角色-洞察分析
- IT项目周报模板
- 地脉动测试原理及应用
- 基坑排水计算
- 沟槽式连接管道工程技术规程
- 原料罐区设备操作规程
- 厦门市2023-2024学年度初中语文初一上学期语文期末质量检测
- 项目施工员安全生产责任制考核记录
- 中职英语教学总结
- 高中数学人教A版知识点与公式大全
- 2023年八省联考普通高等学校招生全国统一考试语文试题含答案
- 《Windows 网络操作系统》-教学教案
评论
0/150
提交评论