计算机组成原理:6-4 中央处理器_第1页
计算机组成原理:6-4 中央处理器_第2页
计算机组成原理:6-4 中央处理器_第3页
计算机组成原理:6-4 中央处理器_第4页
计算机组成原理:6-4 中央处理器_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复习思考题161.一段机器指令组成的程序可由一个微程序来完成。( )2.在微程序控制的计算机中,其核心是_。它是用来存放它是用来存放_的。的。按存储器的存取方式分,它属于按存储器的存取方式分,它属于_存储器。存储器。3.计算机采用微程序控制器是为了提高速度。( )4.取指周期的微操作与指令的操作码无关。( )5.假设某计算机共有100个微命令,若用直接控制法直接控制法,微指令的操作控制字段要有,微指令的操作控制字段要有_位;位;最短编码法最短编码法,则操作控制字段需要,则操作控制字段需要_位;位;字段直接编码法字段直接编码法,若,若3位为一段,则操作控制字段为位为一段,则操作控制字段为_位位。

2、第六章 中央处理器6.1 中央处理器的功能和组成6.2 控制器的组成和实现方法6.3 时序系统与控制方式6.4 微程序控制原理6.6 流水线技术6.7 精简指令系统计算机6.8 微处理器中的新技术6.6.1 重叠控制n重叠方式n在解释第在解释第K条指令的操作完成之前,就可开始条指令的操作完成之前,就可开始解释第解释第K+1条指令。条指令。n重叠方式并不能加快一条指令的实现,但能加重叠方式并不能加快一条指令的实现,但能加快相邻两条指令以至一段程序的执行快相邻两条指令以至一段程序的执行n重叠越多,速度越快。重叠越多,速度越快。取指取指K+2分析分析K+2 执行执行K+2取指取指K+1分析分析K+1

3、 执行执行K+1取指取指K分析分析K执行执行Kt重叠部分重叠部分K:K+1:K+2:重叠控制中出现的问题及解决1n设备利用冲突问题n访存冲突访存冲突n 在内存中在内存中设置两个存储器设置两个存储器,独立编址,分,独立编址,分别存放指令和数据别存放指令和数据哈佛结构哈佛结构。n 采用采用多体交叉存储器结构多体交叉存储器结构,只要不是同时,只要不是同时在同一存储体内取指、取数,就可避免冲突。在同一存储体内取指、取数,就可避免冲突。取指取指K+1分析分析K+1 执行执行K+1取指取指K分析分析K执行执行KtK:K+1:重叠控制中出现问题及解决1n设备利用冲突问题n设备利用冲突设备利用冲突n设置设置指

4、令缓冲器(指令预取队列)指令缓冲器(指令预取队列),预先把,预先把未执行的指令由主存取到指令缓冲器。这样未执行的指令由主存取到指令缓冲器。这样“取指取指K+1”只是从指令缓冲器只是从指令缓冲器中取出中取出,不,不用访存,避免冲突。用访存,避免冲突。取指取指K+1分析分析K+1 执行执行K+1取指取指K分析分析K执行执行KtK:K+1:分析分析K+1 执行执行K+1分析分析K执行执行K无冲突无冲突重叠控制中出现的问题2n遇到条件转移指令时n因条件的建立一般都是在前一条指令结束时,因条件的建立一般都是在前一条指令结束时,所以下一条将要执行哪条指令是不确定的。所以下一条将要执行哪条指令是不确定的。n

5、若转移成功,则按原顺序预取的指令就可能无若转移成功,则按原顺序预取的指令就可能无效,并且,重叠部分越多越严重。效,并且,重叠部分越多越严重。取指取指P分析分析P执行执行P取指取指K+1分析分析K+1 执行执行K+1取指取指K分析分析K执行执行KtK:K+1:P:.条件转移指令条件转移指令转移不成功时转移不成功时转移成功时转移成功时重叠控制中出现问题的解决2n遇到条件转移指令时n将重叠执行改为顺序执行将重叠执行改为顺序执行n即此时重叠执行的是即此时重叠执行的是空操作空操作,以等待上一条指,以等待上一条指令条件的建立。令条件的建立。n此时的执行效率会大大降低。此时的执行效率会大大降低。等等 待待

6、等等 待待取指取指P分析分析P执行执行P取指取指K分析分析K执行执行KtK:P:条件转移指令条件转移指令重叠控制中出现的问题3n数相关问题n设设M为内存变量,为内存变量,Ri为寄存器,分析下面操作为寄存器,分析下面操作 R1+R2 M M R3 R4 n若第若第K+1条指令的操作数地址即为第条指令的操作数地址即为第K条指令条指令保存结果的地址时,会产生保存结果的地址时,会产生数相关问题数相关问题。取指取指K+1分析分析K+1 执行执行K+1取指取指K分析分析K执行执行KtK:K+1:重叠控制中出现问题的解决3n数相关问题n设设M为内存变量,为内存变量,Ri为寄存器,分析下面操作为寄存器,分析下

7、面操作 R1+R2 M M R3 R4 n可采用可采用等待操作等待操作或设置或设置数相关专用通路数相关专用通路:直接:直接从从ALU的输出口取的输出口取数据。数据。取指取指K+1分析分析K+1 执行执行K+1取指取指K分析分析K执行执行KtK:K+1:取指取指K+1等等 待待分析分析K+1 执行执行K+16.6.2 先行控制原理n 设每次都可以在指令缓冲器中取指令,则取指阶段可合并到中。n执行n条指令 所需时间为:分析分析K执行执行K分析K+1执行K+1分析K+2执行K+2分析分析K+3执行执行K+3t1t2t3nniiittttT执行21执行分析1分析,maxt由于由于“分析分析”与与“执行

8、执行”的的时间各不相同,各时间各不相同,各阶段阶段控制控制部件出现部件出现间断间断等待等待现象现象先行控制原理n 为使各阶段专用控制部件不间断工作,提出先行控制的方式,以提高的设备利用率及执行速度。n执行n条指令 所需时间为:分析分析K执行执行K分析K+1执行K+1分析K+2执行K+2t1t2t3分析K+3执行K+3tniittT2执行1分析一条指令的解释过程分解为一条指令的解释过程分解为“分分析析”、“执行执行”两个子过两个子过6.6.3 流水工作原理n流水流水处理处理技术技术是是在在重叠、先行控制方式重叠、先行控制方式的基础上发展起来的,的基础上发展起来的,它基于重叠的原理,但却是在更高程

9、度上的重叠。它基于重叠的原理,但却是在更高程度上的重叠。n流水的概念分析分析K+1 执行执行K+1分析分析K执行执行KtK:K+1:一条指令的解释过程分解为一条指令的解释过程分解为“分分析析”、“执行执行”两个子过程两个子过程可并行执行可并行执行一条指令的解释过程分解为一条指令的解释过程分解为“分分析析”、“执行执行”两个子过两个子过流水控制方式n流水的概念分析分析K+1 执行执行K+1分析分析K执行执行KtK:K+1:一条指令的解释过程分解为一条指令的解释过程分解为“分分析析”、“执行执行”两个子过程两个子过程n若将这两个子过程分别用独立部若将这两个子过程分别用独立部件实现,实现每个子过程都

10、件实现,实现每个子过程都需要需要 t1时间时间n则就一条指令来看,需要则就一条指令来看,需要T=2 t1n但从机器输出来看,每但从机器输出来看,每隔隔 t1完成完成一指令的解释。一指令的解释。可并行执行可并行执行一条指令的解释过程分解为一条指令的解释过程分解为“分析分析”、“执行执行”两个子程两个子程流水控制方式n流水的概念分析分析K+1 执行执行K+1分析分析K执行执行KtK:K+1:一条指令的解释过程分解为一条指令的解释过程分解为“分分析析”、“执行执行”两个子过程两个子过程n机器吞吐率机器吞吐率TP 单位时间内机器所能处理的指单位时间内机器所能处理的指令数或是机器能输出的结果数量令数或是

11、机器能输出的结果数量n串行执行时,串行执行时,TP1=1/(2 t1)n重叠执行时,重叠执行时,TP2=1/ t1nTP2=2TP1 ,吞吐率为原来的两倍吞吐率为原来的两倍可并行执行可并行执行流水控制方式n 若将“分析”子过程再分解成“取指令”、“指令译码”和“取操作数”子过程,并改进运算器的结构以加快其“执行”子过程,则可构成下面的解释过程:n若这四个子过程分别若这四个子过程分别用独立部件实现,并且用独立部件实现,并且每个子过程都每个子过程都需要需要 t2n则就一条指令来看,则就一条指令来看,需要需要T=4 t2n但从机器输出来看,但从机器输出来看,每每隔隔 t2完成一指令的完成一指令的解释

12、。解释。nTP2=1/ t2流水控制方式n 流水线n将复杂的处理过程将复杂的处理过程分为分为时间大致时间大致相同、复杂程度相当相同、复杂程度相当的的多多个子过程个子过程,每个子过程由一个独立的功能部件来,每个子过程由一个独立的功能部件来完成,完成,处理对象在各子过程连成的线路上连续处理对象在各子过程连成的线路上连续流动。流动。在同一时间,多个部件同时进行不同的操作,完成对在同一时间,多个部件同时进行不同的操作,完成对不同子过程的处理。不同子过程的处理。n各子过程间顺序各子过程间顺序执行,但对执行,但对多个处理对象而言多个处理对象而言,各子各子过程间过程间重叠重叠执行执行。21实际tnTnTP)

13、(T=4 t2TtTPTPn412limmax流水线的分类按处理级别分n 操作部件级n将复杂的将复杂的算逻运算算逻运算组成流水线工作方式组成流水线工作方式n 指令级n将将指令执行过程指令执行过程分成多个子过程分成多个子过程n 处理机级n由由2个处理机通过存储器串行连接起来,每个处理机对同个处理机通过存储器串行连接起来,每个处理机对同一数据流的不同部分分别进行处理。一数据流的不同部分分别进行处理。处理机处理机1处理机处理机2处理机处理机n1存储器存储器2存储器存储器n存储器存储器输输入入输输出出处理机级流水线(宏流水线)处理机级流水线(宏流水线)流水线的分类按功能分n单功能流水结构n只能完成一种

14、功只能完成一种功能的流水处理能的流水处理n多功能流水结构n同一流水结构可同一流水结构可完成多种功能的完成多种功能的流水处理流水处理流水线的分类按工作方式分n静态流水结构n同一时间只能同一时间只能完成一种运算完成一种运算n动态流水结构n同一时间可完同一时间可完成不同种运算成不同种运算输入减阶对阶移位相加规格化相乘累加输出输入减阶对阶移位相加规格化相乘累加输出指令流水线的相关性n指令流水线的相关性包括n结构相关结构相关(资源相关资源相关)n同一时刻争夺同一资源而形成的同一时刻争夺同一资源而形成的冲突冲突。n数据相关数据相关n后续指令要使用前面指令的操作结果,而这后续指令要使用前面指令的操作结果,而

15、这一结果尚未产生或未送到指定的位置,造成一结果尚未产生或未送到指定的位置,造成后续指令无法后续指令无法运行运行。n控制相关控制相关n主要是由转移指令引起主要是由转移指令引起的相关的相关。6.7 RISC与CISC的特点和优势比较比较内容比较内容CISCRISC指令总数指令总数 200条条 4种种 23种种 基本寻址方式基本寻址方式 4种种 4种种 各种指令执行时间各种指令执行时间相差很大相差很大绝大多数在单周期内完成绝大多数在单周期内完成控制器实现方式控制器实现方式微程序控制微程序控制组合逻辑控制组合逻辑控制指令字长指令字长不固定不固定等长等长可访存的指令可访存的指令不加限制不加限制取数、存数

16、指令取数、存数指令各种指令使用频率各种指令使用频率相差很大相差很大相差不大相差不大优化编译实现优化编译实现很难很难较容易较容易程序源代码长度程序源代码长度较短较短较长较长CPU中通用寄存器中通用寄存器32个个(甚至甚至1000个个) CISC和RISC的比较n 设程序的总执行时间 = ICTnI 程序中的指令总数程序中的指令总数nC平均指令执行所需的时钟周期数平均指令执行所需的时钟周期数nT 每个时钟周期的时间每个时钟周期的时间n 不同种类机器减少 的措施nCISCI C nRISCC I n RISC不仅是要不仅是要简化指令系统简化指令系统,而且要通过简化指令系统而,而且要通过简化指令系统而

17、使计算机的使计算机的硬件结构变得简单合理硬件结构变得简单合理,以提高运算速度,以提高运算速度,最最有效的办法是减少指令的执行周期数。有效的办法是减少指令的执行周期数。ICTRISC1.21.4 1.31.71CISC14 101根据上述统计折算下来,根据上述统计折算下来,RISC的处理速度要比相同的处理速度要比相同规模的规模的CISC提高提高35倍。倍。6.7.2 RISC 的基本技术nRISC寄存器管理技术nRISC为减少访存操作,在为减少访存操作,在CPU芯片上芯片上设置大量设置大量通用寄存器通用寄存器以保存常用数据。以保存常用数据。n采用采用重叠寄存器窗口技术重叠寄存器窗口技术以提高过程

18、转换速度。以提高过程转换速度。n流水线技术n由于每条指令功能简单,由于每条指令功能简单,CU用用组合逻辑方式组合逻辑方式实现实现由于程序增长,用流水线技术来进一步提速。由于程序增长,用流水线技术来进一步提速。n延时转移技术n在流水线遇到在流水线遇到条件转移指令条件转移指令时,采用时,采用延迟转移法延迟转移法或或优化延迟转移法优化延迟转移法来节省时间。来节省时间。6.8 微处理器中的新技术基本流水线基本流水线6.8.1 超标量和超流水线技术超标量流水线超标量流水线超流水线超流水线改善指令流水线的途径依赖依赖空间空间并行度,要求并行度,要求芯片为有芯片为有更高集成度更高集成度的的半导体材料半导体材

19、料超标量流水线超标量流水线超流水线超流水线依赖于依赖于时间时间并行度,要并行度,要求求更快更快的半导体材料的半导体材料n 目前提高速度比提高集成度更难,使超标量流水线结构目前提高速度比提高集成度更难,使超标量流水线结构发展迅速。发展迅速。n 超标量实际上是并行处理思想在微处理器设计中的应用超标量实际上是并行处理思想在微处理器设计中的应用。Pentium 超标量流水线n 预取预取(PF) 指令缓存取一指令,存入预取缓冲区指令缓存取一指令,存入预取缓冲区n 译码译码1(D1)译码指令确认它的操作码及寻址方式译码指令确认它的操作码及寻址方式n 译码译码2(D2)计算并产生存储器操作数地址计算并产生存

20、储器操作数地址n 执行执行 (EX)完成指令指定的运算完成指令指定的运算n 写回写回 (WB)将计算结果送往目的地,将计算结果送往目的地, 并标上标志。并标上标志。U、V共享共享D1D1D1D1PF PFPFPFEXEXEXEXD2D2D2D2WBWBWBWBPentium 超标量流水线n 超标量流水线n它是它是Pentium系统系统结构的核心。结构的核心。n由由U、V两条两条指令指令流水线流水线构成,每条构成,每条流水线都有自己的流水线都有自己的ALU、地址生成电、地址生成电路和与路和与数据数据cache的接口。的接口。n U、V两条两条指令流水线指令流水线可使两条指令并行执行,在每个时钟可

21、使两条指令并行执行,在每个时钟周期内同时执行两条指令。周期内同时执行两条指令。6.8.3 超线程技术n 线程n是是程序执行的基本原子单位,一个程序执行的基本原子单位,一个进程进程可以由多个线程可以由多个线程组成组成。n 超线程技术n将将一个物理一个物理CPU当作当作两个逻辑两个逻辑CPU使用,使使用,使CPU可同可同时执行多重线程(多条指令)。时执行多重线程(多条指令)。n 超线程技术的特点n当当第一个逻辑处理器第一个逻辑处理器跟踪一个软件线程时跟踪一个软件线程时,第二个逻辑第二个逻辑处理器处理器也开始对另外一个软件线程进行跟踪;也开始对另外一个软件线程进行跟踪;n为避免为避免CPU处理资源冲

22、突,负责处理第二个线程的那处理资源冲突,负责处理第二个线程的那个逻辑处理器个逻辑处理器仅使用运行第一个线程时空闲的资源仅使用运行第一个线程时空闲的资源;n大大提高处理器内资源的利用率和数据、指令吞吐率。大大提高处理器内资源的利用率和数据、指令吞吐率。6.8.4 双核与多核技术n双核处理器n指一个处理器上集成了两个独立的运算核心。指一个处理器上集成了两个独立的运算核心。n双核处理器的特点双核处理器的特点n双核处理器的效率比单核约提高双核处理器的效率比单核约提高60%,n它的优势在于多线程应用它的优势在于多线程应用nPentium D 采用采用 双核单线程技术双核单线程技术CPU核核和和L1 cacheCPU核核和和L1 cache总线接口总线接口和和L2 cache双核双核CPU芯片芯片超线程技术与双核技术的比较超线程技术双核技术物理处理器数目物理处理器数目12逻辑处理器数目逻辑处理器数目22同时执行线程数同时执行线程数22执行多个线程时,执行执行多个线程时,执行单元、寄存器、缓存、单元、寄存器、缓存、总路线接口单元等部件总路线接口单元等部件多个线程多个线程共用共用每个核心均有其每个核心均有其独立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论