




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机组成与体系结构从性能角度出发认识计算机COMPUTER前言QIAN YAN经典计算机体系结构概念的实质是计算机系统中软硬件界面经典计算机体系结构概念的实质是计算机系统中软硬件界面的确定,其界面之上的是软件的功能,界面之下的是硬件和的确定,其界面之上的是软件的功能,界面之下的是硬件和固件的功能。固件的功能。广义(现代)的计算机体系结的构概念,它除了包括经典的计算机体广义(现代)的计算机体系结的构概念,它除了包括经典的计算机体系结构的概念范畴(指令集结构),还包括计算机组成和计算机实现系结构的概念范畴(指令集结构),还包括计算机组成和计算机实现的内容的内容计算机的演变和性能01计算机的发展历
2、史主要由提高处理器速度、减小部件尺寸、增大存储容量、加快 I/O 能力和速度来表征计算机的演变和性能导致处理器速度大幅度提高的一个关键因素是,缩减微处理器部件的尺寸,即减少部件间的距离,从而提高速度。然而近年来在速度上的真正增益却是来自于处理器的组成,这包括流水线处理技术和并行执行技术的大量使用,以及推测执行技术的使用(推测执行技术可使将来可能需要的指令提前探测性的执行)。所有这些技术的出发点是,最大限度地使处理器保持运行状态。计算机系统设计的一个关键问题是在各元器件之间的性能平衡,以便在一个领域内所获得的性能增益不被另一领域的滞后所妨碍。特别是,处理器速度的提高远超出存储器存储速度的提高,因
3、此,包括高速缓存技术,从存储器到处理器的更宽的数据路径和更智能的存储芯片等多种技术,用来补偿这种平衡的失调。计算机功能和互连的顶层视图02计算机功能和互连的顶层视图指令周期的组成如下概述首先取指令,随后取零个或多个操作数,再后存零个或多个操作数,最后是中断检查(若中断允许)。计算机系统的主要部件(处理器、主存、I/O 模块)为了交换数据和控制信号,需要进行互连。最流行的互连方式是使用多条线组成的共享系统总线。在当今系统中,通常采用层次式总线来改善性能总线的设计要素包括仲裁(以集中式或分布式控制来裁决是否允许把型号发送到总线上)、时序(总线上的信号是与中央时钟同步,还是基于最近传送事件的异步传送
4、)和宽度(地址线条数和数据线条数)03Cache存储器计算机的存储器被组织成层次结构Cache存储器最顶层(最靠近处理器的一层)是处理器内的寄存器。接下来是一级或多级的高速缓存,当使用多级 cache 时,它们分别标记为 L1, L2 等。再往下的是主存,它通常由动态随机存储器 DRAM 构成,所有这些都被认为是系统内部的存储器。存储层次继续划分外部存储器,下一层通常是固定硬盘,再往下的是可装卸的存储设备,如光盘、磁带机等。Cache存储器沿着存储器层次结构自顶向下,存储器成本也逐层下降,其容量在变大,而存取时间在边长。只使用最快的存储器当然好,但是它也是最昂贵的,因此我们通过使用更多较慢的存
5、储器,以便达到存取时间与成本之间的均衡。其中的技巧是,在存储器中恰当地组织程序和数据,使需要存取的数据通常在较快的存储器中。通常,处理器将要访问的主存位置极有可能是刚被访问过的或其临近的位置,所以 cache 会自动保存一些来自近期被使用过的 DRAM 字的副本(地址本身,或地址的一部分就是索引,索引的思维)。如果 cache 设计得合理,那么大多数时候处理器所需要的存储器数据便已经在 cache 中。04内部存储器动态 RAM(DRAM)静态 RAM(SRAM)内部存储器半导体随机存取存储器静态 RAM(SRAM):存取速度快、价格更昂贵,并且集成度较低,一般用于 cache 存储器。动态
6、RAM(DRAM):存取速度慢、价格更低廉,并且集成度较高,一般用于主存储器。两种基本形式为了补偿 DRAM 相对较低的速度,现已推出几种先进的 DRAM 组织。使用最普遍的两种是同步 DRAM 和总线式 DRAM(Rambus DRAM)。两者都使用系统时钟以支持数据块传送。存储器系统中通常都使用纠错技术,这包括添加一些与原数据位成函数关系的冗余位来构成纠错码。如果出现错误位,纠错码会检测并通常能纠正该错误位。05外部存储器磁盘至今仍然是最重要的外部存储器外部存储器从个人计算机到大型机,乃至超级计算机,都广泛使用活动式磁盘和固定式磁盘(硬盘)。磁盘至今仍然是最重要的外部存储器。为了实现更高的
7、性能和更好的可用性,服务器以及更大的系统使用 RAID 磁盘技术。RAID 使用了多个磁盘座位数据存储设备的并行阵列的一系列技术,并具有内在冗余性来弥补磁盘故障。06输入/输出计算机系统的 I/O 体系结构是系统与外部世界的接口输入/输出I/O 体系结构这种体系结构提供了一种控制计算机与外部世界交互的系统化方式,并向操作系统提供有效地管理 I/O 行为的必要信息。输入/输出编程式 I/O (Programmed I/O) 技术,即在请求 I/O 操作的程序的直接和连续的控制下所发生的 I/O 操作3 3 种基本的种基本的 I/O I/O 技术技术中断驱动式 I/O (Interrupt-dri
8、ver I/O) 技术,即程序发出 I/O 命令后继续执行,直到被 I/O 硬件中断,通知它 I/O 操作完成直接存储器存取(DMA) 技术,即一个专门的 I/O 处理器接管 I/O 操作的控制,在 I/O 设备与存储器之间直接传送大量数据除了处理器和一组存储器模块外,计算机系统的第三个关键部件是一组输入 / 输出模块。每个模块连接到系统总线或中央交换器,并且控制一个或多个外围设备。一个 I/O 模块不是简单地将设备连接到系统总线的一组机械连接器,而是包含了执行设备与系统总线之间通信功能的逻辑。输入/输出为什么不把外设直接连接到系统总线上,原因如下:各种外设的操作方法是不同的,将控制一定范围的
9、外设的必要逻辑合并到某个处理器内是不现实的外设的数据传送速度一般比存储器或处理器慢得多,因此,使用高速的系统总线直接与外设通信是不切实际的另一方面,某些外设的数据传送速率比存储器或处理器要快,同样,若不适当管理,则速度失配将导致无效外设使用的数据格式和字长度通常与处理器不同因此 I/O 模块是必须的,它有两大主要功能通过系统总线或中央交换器与处理器和存储器连接通过专用数据线与一个或多个外设连接07操作系统支持操作系统是控制程序在处理器上执行和管理该处理器资源的软件操作系统支持 进程调度 存储管理 操作系统操作系统最重要的功能之一是进程或任务的调度,操作系统决定在给定时间内运行哪个进程。一般情况
10、下,硬件不断中断运行进程,使操作系统做出新的调度裁决,从而使处理器时间被几个进程公平分配。所有处理器都或多或少具备这种能力,如虚拟存储器管理硬件和进程管理硬件。这些硬件包括专用寄存器、缓冲器以及完成基础资源管理任务的电路。处理器硬件的支持操作系统支持010002操作系统的另一个重要功能是存储管理。大多数当代操作系统都包含虚拟存储器的功能,虚拟存储器有两个优点:进程在主存中运行时不需要将程序的全部指令和数据一次性地装入主存程序可用的总存储空间可以大大超过系统的实际主存容量虽然存储管理是用软件完成的,但操作系统依赖于处理器中的硬件支持,包括分页管理硬件和分段管理硬件08计算机算术数的表示方法(二进
11、制格式)基本算术运算(加减乘除)计算机算术计算机算数涉及的两个基本方面是数的表示方法(二进制格式)和基本算术运算(加减乘除)的算法。这两个方面既适用于整数算术、也适用于浮点算术。浮点数表示成一个数(有效值,significant)乘以一个定值(基值,base) 的某个整数幂(指数,exponent)。浮点数能够表示很大的数和很小的数。CAL大多数处理器都实现了 IEEE 754 标准,用于浮点表示和浮点运算。IEEE 754 定义了 32 位和 64 位两种浮点数格式。09指令集:特征和功能计算机指令最重要的元素是操作码(opcode)指令集:特征和功能opcode计算机指令最重要的元素是操作
12、码(opcode),它指明将完成的操作、源和目的操作数的引用方式,并通常隐式指明下一条指令的来源。opcode操作码指定的操作,一般可有如下类型:算术和逻辑运算,在两个寄存器、寄存器和存储器或存储器两个位置之间传送数据,输入/输出,控制。opcode操作数引用方式指定如何寻找被操作数据的寄存器或存储器的位置。数据类型可以是地址、数值、字符或逻辑数据。指令集:特征和功能各类处理器中的一个普遍的体系结构是栈 stack 的使用,栈对程序员是可见的或是不可见的。栈用于管理过程的调用和返回,也可用来提供另一种寻址存储器的方式。栈的基本操作是 PUSH 和 POP,以及在栈顶部一或两个位置上完成的操作。
13、一般来说,栈都实现为从高地址向低地址增长。字节可以寻址的处理器可分为大端(big endian)、小端(little endian)、双端(bi-endian)这几类。如果多字节的数值是以最高有效字节存于最低地址值的字节来顺序存储,则称为大端;如果它们是以最低有效字节存于最低地址值的字节来顺序存储,则称为小端。既支持大端又支持小端的处理器是双端处理器。10指令集:寻址和指令寻址方式和指令格式指令集:寻址和指令操作数引用指令一是指令中含有操作数的实际值(立即数)二是指令中含有对操作数地址的引用单各种指令集使用类型广泛的寻址方式。这包括直接寻址(操作数地址在指令的地址字段中)、间接寻址(地址字段指
14、向一个存储位置,此位置含有操作数地址)、寄存器寻址、寄存器间接寻址,以及各种形式的偏移寻址(寄存器值加上地址值产生操作数地址)。指令格式定义了指令中字段的布局。指令格式设计是一件非常复杂的事情,要考虑到诸多因素,如指令长度是定长还是变长,指派给操作码和每个操作数引用的位数,以及如何确定寻址方式等。11CPU结构和功能处理器包括用户可见的寄存器和控制/状态寄存器CPU结构和功能用户可见寄存器是指,用户使用机器指令显式或隐式可访问的寄存器。它们可以是通用寄存器,也可以是用于定点或浮点数、地址、变址和段指针这样的专用寄存器。控制和状态寄存器用于控制 CPU 的操作。一个明显的例子是程序计数器,另一重
15、要的例子是程序状态字(PSW)。PSW包含各种状态和条件位,例如反映最近一次算术运算结果的标志位、中断允许位和指示 CPU 当前运行于特权模式下还是用户模式下的状态位。CPU结构和功能处理器采用指令流水方式来加速指令的执行。从本质上讲,流水是将指令周期分解成几个连续出现的阶段,如取指令、译码指令、确定操作数地址、取操作数、执行指令和写结果操作数。指令向前移动通过这些段,就像车间的一条装配线一样;于是,不同的指令能同时在各个段上工作。不过,转移和指令间相关性的出现,使流水线的设计和使用变得复杂了。123412精简指令集计算机RISC精简指令集计算机对设计新型处理器体系结构来说,高级语言程序行为的
16、研究具有指导意义,成果之一就是产生了精简指令集计算机(RISC)。程序中赋值语句占最大份额,这暗示着简单的数据传送应当优化。程序中还是许多 IF 和 LOOP 语句,意味着基本的顺序控制机制需要进行优化,以便有效地使用流水技术。操作数引用样式的研究表明,在寄存器中保持适当数量的操作数会有助于性能的提高。精简指令集计算机其三,强调对指其三,强调对指令流水线的优化。令流水线的优化。其一,有限的其一,有限的指令集并具有指令集并具有固定格式;固定格式;其二,大量的其二,大量的寄存器或利用寄存器或利用编译器来优化编译器来优化寄存器的使用;寄存器的使用;RISC 的简单指令集便于有效的流水化,因为每条指令
17、只有少数几种操作,并且这些操作是比较容易确定的。RISC 指令集体系结构自身也有助于实施延迟分支(delayed branch) 技术,这种技术将分支指令和其他指令重排从而提高流水线效率。 RISC 机器的关键特征:13超标量处理器指令级并行性和超标量处理器超标量处理器每条流水线由多个段(stage)组成,因此每条流水线能同时处理多条指令。多流水线引入了新一级并行性,允许同时处理多个指令流。超标量处理器是一种使用多条相互独立的指令流水线的处理器。超标量处理器利用了所谓的指令级并行性(instruction-level parallelism),指令级并行性指的是程序中的指令可以并行执行。超标量
18、处理器一次取多条指令,然后试图找出几条彼此不相关因而能够并行执行的指令。如果一条指令的输入取决于前面指令的输出,则这条指令不能同时,更不能先于前面指令完成执行。一旦这种相关性被确认,处理器可以以不同于原来代码的顺序发射和完成指令。通过使用更多的寄存器,或对原代码中的寄存器引用换名,处理器可取消某些不必要的相关性纯 RISC 处理器经常使用延迟分支来最大限度地利用指令流水线,然而,这种方法不太适用于超标量处理器,大多数超标量机器使用了传统的分支预测法来提高流水线效率。超标量处理器超标量设计紧跟 RISC 体系结构的脚步。虽然 RISC 机器的精简指令集体系结构自身已倾向于应用超标量技术,但超标量
19、方法既能用于 RISC 也能用于 CISC 体系结构。超标量实现的处理器结构是指,在这样的结构中,包括整数和浮点运算、装载、保存以及条件分支之类的普通指令,能通水启动并独立执行。这种实现引出了涉及指令流水线的几个复杂问题。超标量14控制器操作一条指令的执行涉及一系列的统称为周期的子步骤控制器操作处理器的控制器完成两项任务:处理器的控制器完成两项任务:1 1)它使得处理器以正)它使得处理器以正在运行的程序所确定的次序来执行微操作;在运行的程序所确定的次序来执行微操作;2 2)它产生)它产生引起微操作执行的控制信号。引起微操作执行的控制信号。一条指令的执行涉及一系列的统称为周期的子步骤。一条指令的
20、执行涉及一系列的统称为周期的子步骤。例如,一条指令的执行可由取指、间接寻址、执行例如,一条指令的执行可由取指、间接寻址、执行和中断周期组成。每个周期又是由一系列更基本的和中断周期组成。每个周期又是由一系列更基本的操作(称为微操作)组成。一个单一的微操作可以操作(称为微操作)组成。一个单一的微操作可以完成寄存器间的一次传送,寄存器与外部总线的一完成寄存器间的一次传送,寄存器与外部总线的一次传送,或一个简单的次传送,或一个简单的 ALU ALU 操作。操作。控制器产生的控制信号引起逻辑门的打控制器产生的控制信号引起逻辑门的打开与管理,从而导致寄存器数据的传送开与管理,从而导致寄存器数据的传送和和 ALU ALU 的操作。的操作。一种控制器的实现技术是硬布线技术,一种控制器的实现技术是硬布线技术,采用此技术实现的控制器是一个组合电采用此技术实现的控制器是一个组合电路。当前机器指令支配的输出逻辑信号路。当前机器指令支配的输出逻辑信号被转换为一组输出控制信号被转换为一组输出控制信号15并行处理cac
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 面肌痉挛的护理诊断和措施
- 隧道工程工作总结
- 4.7 第1课时 相似三角形中特殊对应线段的性质课件-北师大版数学九年级上册
- 甘肃省张掖市高台第一中学2025年高三语文试题二模试题含解析
- 2025年广西名校高三教学质量监测(一)物理试题含解析
- 辽宁轨道交通职业学院《SoftwareEngneerng(软件工程)》2023-2024学年第二学期期末试卷
- 天津市宁河区芦台第一中学2025年高三下学期模拟检测试题英语试题含解析
- 衡水学院《跨境电商物流实务》2023-2024学年第一学期期末试卷
- 长春工业大学人文信息学院《园艺植物生理学》2023-2024学年第二学期期末试卷
- 中国人民公安大学《魅力化学》2023-2024学年第二学期期末试卷
- 网络评论的意识形态边界及治理
- TCUWA50054-2023钢结构装配式污水处理设施技术规程
- 24秋国家开放大学《经济法学》形考任务(记分作业)1-4参考答案
- 诺如病毒课件教学课件
- 2024年国家公务员考试《行测》真题卷(副省级)答案及解析
- 2024年重庆市中考数学真题卷(A)及答案解析
- 小学道德与法治诚信教育
- 天津市部分区2022-2023学年七下期中考试数学试卷(解析版)
- 阴道镜在阴道萎缩性疾病的诊断
- 北京市《配电室安全管理规范》(DB11T 527-2021)地方标准
- 2025年电工(技师)考试100题及答案
评论
0/150
提交评论