2022年体系结构复习归纳总结_第1页
2022年体系结构复习归纳总结_第2页
2022年体系结构复习归纳总结_第3页
2022年体系结构复习归纳总结_第4页
2022年体系结构复习归纳总结_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、小小的总结了一下,有些不怎么准,不妥之处请见谅哈哈一,名词说明本大题20 分,每道题2 分1.虚拟运算机:由软件实现的机器,以区分于由硬件实现的机器2.层次结构:从运算机语言的角度,把运算机系统按功能划分成多级层次结构第6 级 L6 :应用语言虚拟机第5 级 L5 :高级语言虚拟机第4 级 L4 :汇编语言虚拟机第3 级 L3 :操作系统虚拟机第2 级 L2 :机器语言 传统机器级 第1 级 L1 :微程序机器级3.透亮性:在运算机技术中,对原先存在的事物或属性,但从某种角度看又好象不存在的概念称为透亮性;4.运算机系统结构运算机体系结构是程序员所看到的概念性的结构和功能特性 界面的确定及功能

2、支配 1 分;5. 系列机1 分,是运算机系统软,硬件由同一厂家生产的具有相同的系统结构,但具有不同组成和实现的一系列不同型号的机器;6. 系统的加速比对系统中的某些部件进行改进,改进后的系统性能与改进前 的系统性能之比;7. Amdahl 定律加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统 中所占的重要性;8.程序的局部性原理程序在执行时所拜望地址的分布不是随机的,部分;9. CPI 指令时钟数;CPI = 总时钟周期数 / IC 而是相对地簇聚;这种簇聚包括指令和数据两反映了运算机实现技术,运算机指令集的结构和运算机组织;10. 流水线技术将一个重复的时序过程分解成为如干个子

3、过程,上与其他子过程同时执行;11静态流水线而每一个子过程都可有效地在其专用功能段第 1 页,共 9 页在同一时间内,流水线的各段只能按同一种功能的连接方式工作;12. 动态流水线在同一时间内,当某些段正在实现某种运算时,另一些段却在 实现另一种运算;13. 结构冲突因硬件资源中意不了指令重叠执行的要求 而发生的冲突;14. 数据相关对于两条指令i(在前)和j(在后),假如下述条件之一成立,就称指令j 与指令i 数据相关:(1)指令j 使用指令i 产生的结果;k 又与指令i 数据相关;(2)指令j 与指令k 数据相关,而指令15. 把握相关由分支指令引起的相关;它需要依据分支指令的执行结果来确

4、定后续指令是否执行;16. 名相关指令使用的寄存器或储备器称为名1 分;假如两条指令使用相同的名,但是它们之间并没有数据关系,就称之为名相关;1 分 17. 非线性流水线流水线中除有串行连接的通路外,仍有反馈回路;18. 流水线寄存器文件 没找到19. 冲突失效在组相联或直接映像 Cache 中,如太多的块映像到同一组(块)中,就会显现该组中某个块被别的块替换(即使别的组或块有闲暇位置)失效;20. 线性流水线流水线的各段串行连 接,没有反馈回路;21. 强制性失效,然后又被重新拜望的情形;这就发生了冲突当第一次拜望一个块时,该块不在Cache 中,需从下一级储备器中调入Cache,这就是强制

5、性失效;22. 多指令流出技术多指令流出技术是指令流水线在每个时钟周期内可以流出多条指令(1 分),包括超标量,超流水线和超长指令字三种技术(1 分);23. 超标量流水线在一个机器周期内一条流水线可执行一条以上的指令;路单元完成;24. 失效开销一条指令分为十几段指令来由不同电CPU 向其次级储备器发出拜望请求到把这个数据块调入第一级储备器所需的时间;25. 失效率CPU 在第一级储备器中没有找到所需数据的概率;26. 命中时间CPU 在第一级储备器中找到所需数据所用的时间;27. 定向技术当流水线中显现数据冲突时,可以将运算结果从其产生的地方直接送到其他指令中需要它的地方,或全部需要它的功

6、能单元,防止暂停;第 2 页,共 9 页28. 并行性并行性是指运算机系统具有可以同时进行运算或操作的特性,上工作;它包括同时性与并发性两种含义;同时性指两个或两个以上大事在同一时刻发生;并 发性指两个或两个以上大事在同一时间间隔发生;29. 多体交叉储备器在同一时间完成两种或两种以把储备芯片组织为多个体,让它们并行工作,从而能一次读或写多个字;储备器的各个体是按字交叉的;30. RAID廉价磁盘冗余阵列或独立磁盘冗余阵列;31. 分支推测缓冲分支推测技术是提高通用处理器性能的重要方法;分支推测的本质是减弱指令的把握相关,从而提高指令执行的并行度,提高处理器的性能;(不太对啊)32. MIMD

7、 多指令流多数据流(MultipleInstructionStreamMultipleDataStream ,简称MIMD ),它使用多个把握器来异步地把握多个处理器,从而实现空间上的并行性;二,选择题本大题20 分,每道题2 分翻译,说明:翻译和说明是语言实现的两种基本技术;其共同点是:都是以执行一串 L 级指令来实现一条 L+1 级指令;不同点是:翻译技术是先把 L+1 级程序全部转换成 L 级程序后,再去执行新产生的 L 级程序,在执行过程中 L+1 级程序不再被拜望:而说明技术就是每当一条L+1 级指令被译码后,就直接去执行一串等效的 L 级指令,然后再去取下一条 L+1 级的指令,依

8、次重复进行;软件兼容同一个软件可以不加修改地运行于系统结构相同的各档机器,而且它们所获得的结果一样,差别只在于运行时间不同;兼容机不同厂家生产的具有相同系统结构的运算机;向上下兼容按某档运算机编制的程序,不加修改的就能运行于比它高(低)档的运算机;向前后兼容按某个时期投入市场的某种型号机器编制的程序,不加修改地就能运行于在它之前(后)投入市场的机器;CISC复杂指令集运算机;把越来越多的功能交由硬件来实现,并且指令的数量也越来越多;RISC精简指令集运算机;它尽可能的把指令集简化;不仅指令的条数少,而且指令的功能也较为简洁;性能设计和评测的基本原就:自己看书吧 太多了流水线相关概念(多个题):

9、同上全相联映像:当把一个块从主存调入 Cache 时,它可以被放置到 Cache 中的任意一个位置;组相联:当把一个块从主存调入 Cache 时,它可以被放置到 Cache 中唯独的一个组中的任何第 3 页,共 9 页一个位置(Cache 被等分为如干组,每组由如干个块构成);全局性相关:都没找到啊 谁找完了再共享下局部性相关:都没找到啊 谁找完了再共享下SISD ,SIMD ,MISD MIMD :多指令流多数据流(MultipleInstructionStreamMultipleDataStream ,简称MIMD ),它使用多个把握器来异步地把握多个处理器,次对应就行,S 代表单的)RA

10、ID 廉价磁盘冗余阵列或独立磁盘冗余阵列;RAID0 接受数据分块技术,把数据分布在多个盘上,无冗余信息;RAID1从而实现空间上的并行性;(依镜像盘;每当数据写入一个磁盘时,也将该数据写到另一个冗余盘(镜像盘),形成数据的两个备份(数据镜像);假如一个磁盘失效,系统可以到镜像盘中获得所需要的数据;RAID2位交叉式汉明编码阵列;数据字以位交叉方式分别记录在各个磁盘上,编码位被存放在多个校验(Ecc)磁盘的对应位上;RAID3位交叉奇偶校验盘阵列;数据以位或字节交叉的方式存于各盘,冗余的奇偶校验信息储备在专用的冗余盘上;特点是可以获得特殊高的数据传输率;缺点是一次只能执行一个 I/O 请求;R

11、AID4专用奇偶校验独立存取盘阵列;校验信息存放在一个专用盘上;RAID5数据以块(块大小可变)交叉的方式存于各盘,冗余的奇偶块交叉分布式奇偶校验盘阵列,是旋转奇偶校验独立存取的阵列;即数据以块交叉的方式存于各盘,但无专用的冗余盘,而是把冗余的奇偶校验信息均匀地分布在全部磁盘上;RAID6双维奇偶校验独立存取盘阵列;即数据以块(块大小可变)交叉的方式存于各盘,冗余的检,纠错信息均匀地分布在全部磁盘上;可容忍双盘出错;1,以下描述哪个不正确?()A 传统机器级的体系结构是一般所说的高级语言程序员所看到的传统机器级所具有的属 性;B 运算机体系结构是程序员所看到的运算机的属性,即概念性结构与功能特

12、性;C 依据运算机系统的多级层次结构,不同级程序员所看到的运算机具有不同的属性;D 透亮性是指在运算机技术中,对这种原先是存在的事物或属性,但从某种角度看又好象不存在;答:A 第 4 页,共 9 页2,运算机系统结构设计者所关怀的是(A 硬件设计人员B 规律设计人员C 机器语言或汇编语言程序员D 高级语言程序员 答:C )所看到的的运算机结构;3,能实现指令,程序,任务级并行的运算机系统属于();ASISD BSIMD CMISD DMIMD 答:D 4,在提高CPU 性能的问题上,从系统结构角度,可以();A 提高时钟频率B 削减程序指令条数C 削减每条指令的时钟周期数D 削减程序指令条数和

13、削减每条指令的时钟周期数三,简答题本大题20 分,每道题5 分(感觉这几个会考,别的自己看吧)1. 在体系结构课程中经常提到诸如SPEC92 等测试程序,并得出一系列统计表格数据;请问它们的作用是什么?答:在相应的部件设计中,测试所设计部件见的性能(的性能,并作为设计方案的评判基础(3 分)2. RAID0 到5 的特点区分 答:看P225 页的表吧2 分),用以评判所设计的部件3. 某一执行部件改进后其速度为原先的1/5 ,改进后此部件的执行时间占系统总时间的40%;问改进后获得的加速比是多少?答:此部件改进前的相对执行时间为40%*5 (1 分),所以系统改进前的相对执行时间为40%*5+

14、60% (2 分),因此加速比为(2 分);4. Cache 失效的种类有哪些?哪些失效与 Cache 容量无关?哪些失效与相联度无关?答:分为3 类:强制性失效,容量失效,冲突失效;强制性失效不受 cache 容量的影响;强制性和容量失效不受相连度的影响;5. 为什么增加Cache 块的大小不愿定会降低Cache 失效率?答:P177 页第一段 四,问答题:(本大题16 分,每道题8 分)(感觉这几个是重点,其余的自己看着办吧)1. 写出构成多处理机动态网络的四种方法,以及它们各有什么优缺点?必考 答:构成多处理机动态网络方法有四种:器和多级开关网络系统(2 分);总线系统的优点是结构简洁,

15、分别是总线系统,交叉开关系统,多端口储备易实现易扩展,但它的传输速度低,特殊是多处理机较多的时候(1 分);交叉开关系统可实现多通道并行通讯,是通信带宽最高的一种方式,但它的开关和 N*N 成正比,所以成本很高,一般仅用在多处理机较少的场合(2 分);多端口储备器是一种折衷的方案,它的成本和性能都介于总线和交叉开关系统之间,它适用于由大型机构成的多处理机系统2 分);多级开关网络系统是针对交叉开关系统的缺点来(设计的,它接受多级交叉开关系 既保证了可连接的多处理机数量,又把握了成本(1 分);统,2. RISC 运算机指令集结构的功能设计必需遵循的原就有哪些?答:只保留常用的和必需的指令(1

16、分);接受指令流水线技术(1 分);除了Load/Store 指令之外,其他的指令在一个时钟周期内完成(1 分);第 5 页,共 9 页3. 不用或少用微程序设计,用硬布线规律设计电路(1 分);指令的格式简洁,全部长度都相同(1 分);只保留最少的寻址方式,简化译码电路(1 分);接受Cache,并使用大量的寄存器(1 分);优化编译器设计,提高流水线效率(1 分);Cache 的写策略有哪些?各自有什么特点?答:Cache 的写策略有写直达法和写回法两种;写直达法是指在执行写操作的时候,不仅把数据写入Cache 的相应块中,也将数据写入下一级储备器中的相应块中(1 分);Cache 写回法

17、是指Cache 执行写操作的时候,仅储存到 Cache 中,当块替换的时候才将数据块写回到主存中(1 分);写回法的优点是速度快,而且由于同一地址的多次写操作只有最终一次的结果被储存到主存中,所以使用的储备器的带宽较低(1 分);但写回法产生数据一样性的机会要多(1 分);写直达法的优点是实现简洁,而且下一级储备器的数据总是最新的(1 分),但写储备器的次数较频繁,所以需要接受写缓冲器(支配式;按写支配式是指1 分);在写失效的时候,有两种选择:按写支配式和不按写 Cache 执行写操作的,假如不命中,先将相应的数据块主存调度到Cache 中,然后执行写操作;不按写支配式是在写失效的时候,直接

18、写入下一级储备器而不将相应的数据块调入Cache 中(1 分);由于两种写策略的差异,所以写回法经常接受按写支配式,而写直达法经常接受不按写支配式(1 分);五,运算题1. 给定以下的假设,试运算直接映象Cache 和两路组相联Cach 的平均拜望时间以及CPU 的性能;由运算结果能得出什么结论?理想Cache 情形下的CPI 为,时钟周期为2ns,平均每条指令访存次;两者Cache 容量均为64KB ,块大小都是32 字节;组相联Cache 中的多路选择器使CPU 的时钟周期增加了10;这两种Cache 的失效开销都是80ns;命中时间为1 个时钟周期;64KB 直接映象Cache 的失效率

19、为1.4,64KB两路组相联Cache 的失效率为;解:平均拜望时间命中时间失效率失效开销平均拜望时间 1-路=2.0+1.4% 平均拜望时间 2-路=2.0*1+10%+1.0% 可以看出:两路组相联的平均拜望时间比较低CPUtime= (CPU 执行+储备等待周期)* 时钟周期 =IC (CPI 执行+总失效次数/指令总数* 失效开销)* 时钟周期=IC (CPI 执行* 时钟周期)+(每条指令的访存次数*失效率* 失效开销* 时钟周期)CPU time 1-way=IC2.0*2+1.2*0.014*80 5.344*IC CPU time 2-way=IC2.2*2+1.2*0.01*

20、80 5.36*IC 相对性能比:两路组相联;两路组相联Cache 的平均性能比直接映象 cache 要高倍;因此这里选择2. 在改进的DLX 流水线上运行如下代码序列:LOOP: LD F0, 0R1 MULTD F0, F0, F2 LD F4, 0R2 ADDD F0, F0, F4 SD 0R2, F0 SUBI R1, R1, 8 SUBI R2, R2, 8BNEZ R1, LOOP 其中,R1 的初始值是320,假设全部储备器拜望都命中 Cache,流水线中使用定向技术时,浮点指令的推迟表如下:产生结果的指令使用结果的指令推迟数量浮点运算浮点运算3浮点运算SD 2LD 浮点运算1

21、LD SD 01 假设在流水线中使用定向技术和接受推测分支失败的方法,判定需要多少个时钟周期执行完成?2 假设在流水线中使用定向技术和一个单周期推迟分支,依据需要开放上面的循环并进行指令调度,直到没有任何闲暇周期,写出指令调度方案并判定需要多少个时钟周期执行完成?答: 1)依据表所给的推迟,程序执行情形如下 :LOOP: LD F0, 0R1Stall 产生 F0 的为取操作,使用 F0 的为浮点运算操作,所以推迟为 1MULTD F0, F0, F2LD F4, 0R2Stall 产生 F4 的为取操作,使用 F4 的为浮点运算操作,所以推迟为 1Stall 产生 F0 的为浮点运算操作,使用 F0 的为浮点运算操作,所以推迟共为3ADDD F0,F0,F4StallStall 产生F

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论