计算机体系结构复习_第1页
计算机体系结构复习_第2页
计算机体系结构复习_第3页
计算机体系结构复习_第4页
计算机体系结构复习_第5页
免费预览已结束,剩余6页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、名词解释填空选择简答计算1. 计算机系统的多级层次结构:2. 系统结构的概念:计算机系统结构指的是计算机系统的软、硬件的界面,即机器语言程序员或编译程序设计 者所能看到的传统机器级所具有的属性。3. 在计算机技术中,对本来存在的事物或属性,但从某种角度看又好象不存在的概念称为透明性。4. 对于通用寄存器型机器,这些属性主要是指:(选择题)1) 指令系统(包括机器指令的操作类型和格式、指令间的排序和控制机构等)2) 数据表示(硬件能直接辩认和处理的数据类型)3) 寻址规则(包括最小寻址单元、寻址方式及其表示)4) 寄存器定义(包括各种寄存器的定义、数量和使用方式)5) 中断系统(中断的类型和中断

2、响应硬件的功能等)6) 机器工作状态的定义和切换(如管态和目态等)7) 存储系统(主存容量、程序员可用的最大存储容量等)8) 信息保护(包括信息保护方式和硬件对信息保护的支持)9) I/O结构(包括I/O连接方式、处理机/存储器与I/O设备间数据传送的方式和格式以及I/O操作的状态等)5. 计算机组成指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计。6. 计算机实现指的是计算机组成的物理实现。7. 数据表示是指计算机硬件能够直接识别、指令集可以直接调用的数据类型。8. 数据类型、数据结构、数据表示之间的关系9. 系列机指由同一厂商生产的具有相同体系结构、但具有

3、不同组成和实现的一系列不同型号的机器。10. 常见的计算机系统结构分类法有两种:Flynn分类法和冯氏分类法。冯氏分类法是用系统的最大并行度对计算机进行分类;Flynn分类法是指按照指令流和数据流的多倍性进行分类。11. 定量分析技术(简答题):1) 以经常性事件为重点:在计算机系统设计中,经常需要在多种不同的方法之间进行折中,这时应按照对经常发生的情况采用优化方法的原则进行选择。2) Amdahl定律:加速某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统中总执行时间的百分比。3) CPU性能公式:执行一个程序所需的CPU时间=执行程序所需的时钟周期数 *时钟周期时间4)

4、程序的局部性原理:指程序执行时所访问的存储器地址分布不是随机的,而是相对簇聚的。分为时间局部性和空间局部性。12. 冯诺依曼结构的特点:以运算器为中心;在存储器中,指令和数据同等对待;存储器是按地址访问、按顺序线性编址的一维结构,每个存储单元的位数是固定的;指令是按顺序执行的;指令由操作码和地址码组成;指令和数据均以二进制编码表示,采用二进制运算。13. 实现可移植性的常用方法有三种:采用系列机、模拟与仿真、统一高级语言。14. 系列机在兼容方面,向后兼容一定要保证,尽量保证向上兼容15. 模拟是指用软件的方法在一台现有的计算机上实现另一台计算机的指令集。(软件方法)16. 仿真是指用一台现有

5、计算机上的微程序去解释实现另一台计算机的指令集。(硬件方法)17. 并行性包括同时性和并发性。18. 从执行程序的角度来看,并行性等级从低到高可分为:(简答)1) 指令内部并行:单条指令中各微操作之间的并行2) 指令级并行:并行执行两条或两条以上的指令3) 线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位。4) 任务级或过程级并行:并行执行两个或两个以上的过程或任务,以子程序或进程为调度单位。5) 作业或程序级并行:并行执行两个或两个以上的作业或程序。19. 提高并行性的技术路径( 12 字):时间重叠、资源重复、资源共享20. 能够对紧密耦合系统和松散耦合

6、系统进行区分:紧密耦合系统共享主存,松散耦合系统共享外设21. CISC 指令集结构存在的问题 :1) 各种指令的使用频度相差悬殊2) 指令集庞大,指令条数很多,许多指令的功能又很复杂,3) 许多指令由于操作繁杂,其 CPI 值比较大,执行速度慢。4) 由于指令功能复杂,规整性不好,不利于采用流水技术来提高性能。22. 设计 RISC 机器遵循的原则1) 指令条数少而简单。只选取使用频度很高的指令,在此基础上补充一些最有用的指令。2) 采用简单而又统一的指令格式,并减少寻址方式;指令字长都为 32 位或 64 位。3) 指令的执行在单个机器周期内完成。(采用流水线机制)4) 只有 load 和

7、 store 指令才能访问存储器,其他指令的操作都是在寄存器之间进行。(即采用 load-store 结构)5) 大多数指令都采用硬连逻辑来实现。6) 强调优化编译器的作用,为高级语言程序生成优化的代码。7) 充分利用流水技术来提高性能。23. 指令动态调度是在程序的执行过程中,依靠专门硬件对代码进行调度。静态调度的流水线依靠编译器对代码进行静态调度,以减少相关和冲突。24. 数据结构指由软件进行处理和实现的各种数据类型。25. MIPS 的数据寻址方式只有立即数寻址和偏移量寻址。26. 流水技术是指: 将一个重复的时序过程分解成为若干个子过程, 而每个子过程都可有效地在其专用功能段上与其他子

8、过程同时执行。流水线的段数称为流水线的深度。27. 流水技术的特点1) 流水线把一个处理过程分解为若干个子过程(段),每个子过程由一个专门的功能部件来实现。2) 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞、断流。时间长的段将成为流水线的瓶颈。3) 流水线每一个功能部件的后面都要有一个缓冲寄存器(锁存器),称为流水寄存器。4) 流水技术适合于大量重复的时序过程,只有在输入端不断地提供任务,才能充分发挥流水线的效率。5) 流水线需要有通过时间和排空时间。28. 流水线分类:1) 按流水线所完成的功能分:单功能流水线和多功能流水线2) 按照同一时间段内各段之间的连接方式分:静态流水线和动态

9、流水线3) 按照流水的级别分:部件级流水线、处理机级流水线和处理机间流水线4) 按照流水线中是否有反馈回路分:线性流水线和非线性流水线5) 按照任务流入和流出的顺序分:顺序流水线和乱序流水线29. 解决流水线瓶颈问题的常用方法:细分瓶颈段、重复设置瓶颈段30. 程序中的相关有三种类型:数据相关、名相关(反相关、输出相关)、控制相关流水线中的相关有:数据相关、结构相关、控制相关处理机找中的相关:数据相关、控制相关31. 控制相关带来了两个限制:1) 与一条分支指令控制相关的指令不能被移到该分支之前,否则这些指令就不受该分支控制2) 如果一条指令与某分支指令不存在控制相关,就不能把该指令移到该分支

10、之后。32. 流水线冲突三种类型:结构冲突、数据冲突和控制冲突33. 数据冲突:写后读冲突、写后写冲突、读后写冲突V 或 Q 字段只有一个有效。ROB 缓冲器中。通过保留站重增加有效操作时间与控制操作时34. 在 Tomasulo 算法中, Vj , Vk :源操作数的值。对于每一个操作数来说,35. 基于硬件的前瞻执行时,执行的结果不是写回到寄存器或存储器,而是放到新命名寄存器。36. 多流出处理机有两种基本风格:超标量和超长指令字37. 循环展开技术: 多次复制循环体并相应调整展开后的指令和循环结束条件,间比率,也给编译器进行指令调度带来了更大的空间。38. 循环展开和指令调度时要注意以下

11、几个方面(简答题)1) 保证正确性。注意两个地方的正确性:循环控制,操作数偏移量的修改。2) 注意有效性。只有找到不同寻呼台之间的无关性,才能够有效地使用循环展开。3) 使用不同的寄存器。如果使用相同,或较少数量的寄存器,可能导致新的冲突。4) 尽可能减少循环控制中的测试指令和分支指令。5) 注意对存储器数据的相关性分析6) 注意新的相关性。 由于原循环不同次的迭代在展开后都到了同一次循环体中, 因此可能带来新的相关性。39. 从用户角度看,存储器的三个主要指标:容量、速度和价格。40. 存储层次的性能参数。 P1551) 存储层次的平均每位价格 C2) 命中率 H3) 平均访存时间 Ta41

12、. 映像规则:全相联映像、直接相联映像、组相联映像42. 可以从三个方面改进 Cache 的性能:(简答题)1) 降低失效率:增加块大小、增加 Cache 容量、提供相联度、 Victim Cache 、伪相联映像 Cache 、硬件预取指令和数据、编译器控制的预取、用编译技术减少Cache 失效次数。2) 减少失效开销: Victim Cache 、硬件预取指令和数据、编译器控制的预取、使读失效优于写、写缓存归并、尽早重启动和关键字优先、非阻塞Cache、两级Cache3) 减少命中时间:容量小且结构简单的Cache、对Cache进行索引时不必进行地址变换、流水化 Cache访问、 Trac

13、e Cache43. 按照产生失效的原因不同,可以把失效分为:强制性失效、容量失效和冲突失效44. 2: 1 的 Cache 经验规则,即大小为N 的直接映像Cache 的失效率约等于大小为 N/2 的 2 路组相联 Cache 的失效率。45. 请求字优先: 调块时, 从请求字所在的位置读起。 这样, 第一个读出的字便是请求字, 将之立即发送给CPU46. 有关虚拟存储器问题:1) 映像规则:全相联映像2) 查找算法:页表、段表、 TLB3) 替换算法: LRU4) 写策略:写回法47. 中断响应次序由硬件决定,不可改变,中断处理次序通过中断屏蔽码的设置来改变。48. 反映存储外设可靠性性能

14、参数有:可靠性、可用性和可信性。49. 通道的种类:字节多路通道、选择通道和数组多路通道。50. 在字节多路通道中,实际流量是连接在这个通道上所有设备的数据传输率之和。51. 对于选择通道和数组多路通道,在一段时间内,一个通道只能为一台设备传送数据。此时通道的实际流量就等于该设备的数据传输率。 因此这两种通道的实际流量就是连接在这个通道上所有设备中数据流量最大的那一个。52. 互联网络是一种由开关元件按照一定的拓扑结构和控制方式构成的网络, 用来实现计算机系统中结点之间的 互相连接。53.54. 互联网络的主要特性参数:1) 网络规模:网络中结点的个数。2) 结点度:与结点相连接的边数(通道数

15、),包括入度和出度。3) 距离:对于网络中的任意两个结点,从一个结点出发到另一个结点终止所需要跨越的边数的最小值。4) 网络直径:网络中任意两个结点之间距离的最大值。5) 结点之间的线长:两个结点之间连线的长度,用米、千米等表示。6) 等分宽度:当某一网络被切成相等的两半时,沿切口的边数(通道数)的最小值称为通道等分宽度,用 b 表示。7) 对称性:从任何结点看到的拓扑结构都是相同的网络称为对称网络。55. 线性阵列1) 端结点的度: 12) 其余结点的度: 23) 直径: N 14) 等分宽度 b=156. 环和带弦环1) 对称2) 结点的度: 23) 双向环的直径:N/24) 单向环的直径

16、:N57. 静态网络有:线性阵列、环、度为 3 的带弦环、度为 4 的带弦环。循环移数网络和全网络58. 动态网络有:总线网络、多级互联网络和交叉开关网络等59. 分布式处理机分为:分布式共享存储器和对称式共享存储器60. 共享存储器通信主要优点(简答题)1) 与常用的对称式多处理机使用的通信机制兼容。2) 易于编程,同时在简化编译器设计方面也占有优势。3) 当通信数据量较小时,通信开销较低,带宽利用较好。4) 通过硬件控制的 Cache 减少了远程通信的频度,减少了通信延迟以及对共享数据的访问冲突。5) 消息传递通信机制的主要优点: 硬件较简单; 通信是显式的, 因此更容易搞清楚何时发生通信

17、以及通信 开销是多少,以便编程者和编译程序设法减少通信开销。1. 透明性:在计算机技术中,对本来存在的事物或属性,但从某种角度看又好象不存在的概念称为透明性。2. 系列机 在一个厂家内生产的具有相同的体系结构,但具有不同组成和实现的一系列不同型号的机器。3. CPU 性能公式:CPU时间=执行程序所需的时钟周期数X时钟周期时间=IC XCPI的钟周期时间其中,时钟周期时间是系统时钟频率的倒数。每条指令执行的平均时钟周期数 CPICPI = 执行程序所需的时钟周期数ICIC :所执行的指令条数4. 程序的局部性原理(构成存储层次的理论依据)包括程序的时间局部性,程序的空间局部性5. 冯诺依曼结构

18、的主要特点? 以运算器为中心。? 在存储器中,指令和数据同等对待。? 存储器是按地址访问、按顺序线性编址的一维结构,每个单元的位数是固定的。? 指令的执行是顺序的。? 指令由操作码和地址码组成。? 指令和数据均以二进制编码表示,采用二进制运算。6. 实现可移植性的常用方法采用系列机,模拟与仿真,统一高级语言。7. 软件兼容方式:向前(后)兼容, 向上(下)兼容四种。向后兼容一定要保证,他是系列机的根本特征(填空)8. 模拟:用软件的方法在一台现有的机器(称为宿主机)上实现另一台机器(称为虚拟机)的指令集。9. 仿真:用一台现有机器 (宿主机)上的微程序去解释实现另一台机器(目标机) 的指令集。

19、10. 并行性: 计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。同时性和并发性(填空)11. 从执行程序的角度来看,并行性等级从低到高可分为:? 指令内部并行? 指令级并行? 线程级并行? 任务级或过程级并行? 作业或程序级并行12. 耦合度分为: (了解区别)紧密耦合系统(直接耦合系统):在这种系统中,计算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。松散耦合系统 (间接耦合系统) : 一般是通过通道或通信线路实现计算机之间的互连, 可以共享外存设备 (磁 盘、磁带等)。机器之间的相互作用是在文件或数据集一级上进行的。13. 数据表示:计算机硬件能够直接

20、识别、指令集可以直接调用的数据类型。14. 数据结构:由软件进行处理和实现的各种数据类型。15. MIPS 的寄存器:32 个 64 位通用寄存器( GPRs )也被称为整数寄存器, R0 的值永远是032 个 64 位浮点数寄存器( FPRs )16. MIPS 的数据寻址方式立即数寻址与偏移量寻址17. DLX 的数据寻址方式寄存器寻址,寄存器间接寻址,立即数寻址与偏移量寻址18. 流水线技术? 把一个重复的过程分解为若干个子过程,每个子过程由专门的功能部件来实现。? 把多个处理过程在时间上错开, 依次通过各功能段, 这样, 每个子过程就可以与其他的子过程并行进行。19. 流水技术的特点?

21、 流水线把一个处理过程分解为若干个子过程(段),每个子过程由一个专门的功能部件来实现。? 流水线中各段的时间应尽可能相等,否则将引起流水线堵塞、断流。时间长的段将成为流水线的瓶颈。? 流水线每一个功能部件的后面都要有一个缓冲寄存器(锁存器),称为流水寄存器。? 流水技术适合于大量重复的时序过程, 只有在输入端不断地提供任务, 才能充分发挥流水线的效 率。? 流水线需要有通过时间和排空时间。20. 从不同的角度和观点,把流水线分成多种不同的种类。? 单功能流水线:只能完成一种固定功能的流水线。? 多功能流水线:流水线的各段可以进行不同的连接,以实现不同的功能21. 按照同一时间内各段之间的连接方

22、式对多功能流水线做进一步的分类? 静态流水线:在同一时间内,多功能流水线中的各段只能按同一种功能的连接方式工作? 动态流水线: 在同一时间内, 多功能流水线中的各段可以按照不同的方式连接, 同时执行多种功台匕能。22. 按照流水的级别来进行分类? 部件级流水线(运算操作流水线):把处理机的算术逻辑运算部件? 处理机级流水线(指令流水线):把指令的解释执行过程按照流水方式处理。? 处理机间流水线(宏流水线):它是由两个或者两个以上的处理机串行连接起来,对同一数据流 进行处理,每个处理机完成整个任务中的一部分。23. 按照流水线中是否有反馈回路来进行分类? 线性流水线:流水线的各段串行连接,没有反

23、馈回路。? 非线性流水线:流水线中除了有串行的连接外,还有反馈回路。24. 根据任务流入和流出的顺序是否相同来进行分类? 顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。? 乱序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任 务先完成(从输出端流出)。25. 流水线的性能指标p61吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。26. 解决流水线瓶颈问题的常用方法? 细分瓶颈段? 重复设置瓶颈段27. 相关有3种类型(填空)? 数据相关(也称真数据相关)? 名相关(有读后写,写后写两种相关)? 控制相关28. 流水线冲突

24、有3种类型:(填空)结构冲突,数据冲突,控制冲突29. 有一指令流水线如下所示(1)求连续输入10条指令,该流水线的实际吞吐率和效率;瓶颈”。对于你所给出的两种新的流水(2)该流水线的 瓶颈”在哪一段?请采取两种不同的措施消除此线,连续输入10条指令时,其实际吞吐率和效率各是多少?解:(1)1由-4 4 -50ns(2)瓶颈在3、4段。入1 T 1I 2I 3 1I 3 2I 4 1i50ns50ns50ns50ns50ns变成八级流水线(细分)T pipelineti (n 1) tmaxi 150 8 9 50850(ns)重复设置关和 期间 令拉30. 静态调度技术依靠编译器对代码进行静

25、态调度,以减少相冲突。它不是在程序执行的过程中、而是在编译 进行代码调度和优化。静态调度通过把相关的指 开距离来减少可能产生的停顿。31. 动态调度方法在流水线中出现相关时,通过硬件重新安排指令的执行顺序,来调整相关指令实际执行时的关系,减少处理器空转32. 记分牌算法和Tomasulo算法是两种比较典型的动态调度算法33. 动态分支预测技术:是根据本条指令之前的行为判断本次行为34. 前瞻执行(speculation )的基本思想:对分支指令的结果进行猜测,并假设这个猜测总是对的,然后按这个猜测结果继续取、流出和执行后续的指令。只是执行指令的结果不是写回到寄存器或存储器,而是放到一个称为RO

26、B (ReOrder Buffer )的缓冲器中。等到相应的指令得到确认”(commit)(即确实是应该执行的)之后,才将结果写入寄存器或存储器。通过保留栈。关键思想:允许指令乱序执行,但必须顺序确认35. 多指令流出技术基本风格:超标量;超长指令字;超流水处理机36. 循环展开和指令调度时要注意以下几个方面? 保证正确性。? 注意有效性。? 使用不同的寄存器。? 删除多余的测试指令和分支指令,并对循环结束代码和新的循环体代码进行相应的修正? 注意对存储器数据的相关性分析? 注意新的相关性37. 存储层次的性能参数P1551 .每位价格C2 . 命中率H和失效率F3 .平均访问时间Ta38.

27、映像规则:直接映象:主存中的每一块只能被放置到 Cache 中唯一的一个位置。(空间利用率最低,冲突概率最高,实现最简单)全相联:主存中的任一块可以被放置到Cache 中的任意一个位置。(空间利用率最高,冲突概率最低,实现最复杂,命中时间最长)是组相连的特例,所以的都是一组组相联:主存中的每一块可以被放置到Cache 中唯一的一个组中的任何一个位置。组相联是直接映象和全相联的一种折中39. 替换算法 P16340. 改进Cache 的性能平均访存时间=命中时间+失效率X失效开销41. 可以从三个方面改进Cache 的性能: (与 p201 结合)? 降低失效率? 减少失效开销? 减少 Cache 命中时间42. 子块放置技术:把 cache 块进一步划分为更小的块(子块),并给每个子块赋予一位有效位,用于指明该子块中的数据是否有效。43. 请求字从下一级存储器调入 Cache 的块中,只有一个字是立即需要的。这个字称为请求字。44. 请求字优先:调块时,从请求字所在的位置读起。这样,第一个读出的字便是请求字。将之立即发送给 CPU 。45. 映象规则:全相联(填空)替换算法: LRU写策略:写回法46. 反映外设可靠性能的参数有:1. 可靠性(Reliability )2. 可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论