自考计算机系统结构重叠流水和向量处理机PPT学习教案_第1页
自考计算机系统结构重叠流水和向量处理机PPT学习教案_第2页
自考计算机系统结构重叠流水和向量处理机PPT学习教案_第3页
自考计算机系统结构重叠流水和向量处理机PPT学习教案_第4页
自考计算机系统结构重叠流水和向量处理机PPT学习教案_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1自考计算机系统结构自考计算机系统结构 重叠流水和向量处重叠流水和向量处理机理机5.1.1 基本思想和一次重叠是在解释第k条指令的操作完成之前,就可开始解释第k+1条指令。显然,重叠解释并不能加快一条指令的解释,但却能加快相邻两条以至整段程序的解释。分析指令重叠过程,首先看。它们在时间上重叠,但取指要访问主存,分析中取操作数也可能访问主存,这样,在一般的指令和数据混存于同一台机器的情况下,就出现了问题。一种方法。这有利于实现指令的保护,但增加了主存总线控制的复杂性及软件设计的麻烦。第二种方法是,就能在一个主存周期取得。但如果正好共存于同一个存储体就不能重叠了。第三种方法是。可乘主存有空时

2、,预取下一条或几条指令存于指缓中。第1页/共24页接着,看。为了实现它们的重叠,。而且,由于执行时间的不同,还需在。此外,当使重叠效率不致下降。在控制上的问题。第2页/共24页5.1.2 相关处理1.如果采用机器指令可修改的办法经第k条指令的执行来形成第k+1条指令,由于在执行k的末尾才形成第k+1条指令,按照一次重叠的时间关系,为避免出错,第k、k+1条指令就不能同时解释,这时这两条指令之间就发生了。为解决指令相关问题,可。在这条执行指令中,被修改的指令以“执行”指令操作数形式出现,这样就因为操作数可以存放在主存,也可以存放在通用寄存器中,这样就有了和。第3页/共24页2.如图5.6所示,主

3、存空间数相关是相邻两条指令之间出现对主存同一单元要求先写而后读的关联。要想不出错,只有推后分析k+1的读。当第k和第k+1出现主存数相关时,存控先处理执行k的写数,而将分析k+1的读申请推迟到下一个主存周期才能处理,自动实现推后分析k+1。3.通用寄存器可以存放操作数、运算结果、基址值或变址值,在指令解释过程中,使用通用寄存器作不同用途所需微操作的时间不同。如,。第4页/共24页要解决通用寄存器组数相关,一种办法是可以。该方法降低了速度,当不增加设备另一种方法就是如图5.9P130所示。该方法增加了设备,当重叠效率并不下降。特别的,当(如图5.10P131)时,也(如图5.11P131)和(如

4、图5.12P131)的方法。综上所述,首先,如增设数据总线、控制总线、指令缓冲器、地址加法器、相关专业通路,将指令分析部件和指令执行部件功能分开、单独设置,主存采用多体交叉存取等。其次,。此外,还应该,使分析和执行的时间尽可能相等,以提高重叠的效率。第5页/共24页5.2 流水方式5.2.1 基本概念5.2.2 流水线处理机的主要性能5.2.3 流水机器的相关处理和控制机构第6页/共24页5.2.1 基本概念1.流水是重叠的引申如图5.14P132所示,。显然,如能把一条指令的解释分解成时间相等的m个子过程,则每隔t=T/m就可以处理一条指令。因此,t越小,流水线的最大吞吐率就越高。实际上,流

5、水线从开始启动到流出第一个结果,需要经过一段流水线的建立时间T0,在这段时间里流水线并未流出任何结果。所以实际吞吐率总是低于其最大吞吐率。在实际流水线中,由于各子部件经过的时间不同,。第7页/共24页2.流水线依据向下和向上扩展的思路,可分类出在计算机系统不同等级上使用的流水线。指的是把子过程进一步细分,让每个子过程经过的时间都同等程度减少,吞吐率就会进一步提高。可理解为在多个处理机之间流水;流水线按照处理级别可分为(部件内各子部件间的流水)、(构成处理机的各部件之间的流水)和(构成计算机系统的多处理机之间的流水);从流水线具有功能的多少来看,可以分为(只能实现单一功能的流水)和(同一流水线的

6、各个段之间可以有多种不同的联接方式以实现多种不同的功能或功能);按多功能流水线的各段能否允许同时用于多种不同功能联接流水,可把流水线分成(同一时间内各段只能按一种功能联接流水)和(同一时间内可按不同运算或功能联接);以机器所具有的数据表示可把流水线处理机分为没有向量数据表示,只能以标量循环方式处理向量和数据)和;从流水线中各功能段之间是否有反馈回路,分为和。第8页/共24页5.2.2 流水线处理机的主要性能1.是流水线单位时间里能流出的任务数或结果数一般,如果各子过程所需的时间不同时,取最大的时间作为时钟周期,这样,流水的最大吞吐率就等于1/最大子过程时间。可见流水线最大吞吐率受限于流水线中最

7、慢子过程经过的时间。流水线中经过时间最长的子过程称为。为提高流水线的最大吞吐率,需找到并消除瓶颈。消除瓶颈的是如图5.20P137。另一种是如图5.21P137通过,让它们交叉并行。设一m段流水线的各段经过时间均为t0,则完成n个任务后流水线的实际吞吐率TP=n/(mt0+(n-1)t0)=1/t0(1+(m-1)/n)=TPmax/(1+(m-1)/n)可见,。第9页/共24页加速比SP表示流水方式相对于非流水顺序方式速度提高的比值,SP=nmt0/(mt0+(n-1)t0)=m/(1+(m-1)/n)所以,。这样一来,就可以通过让子过程细分增大m的方法来提高加速比。但是,如果增大m缩短t0

8、,却未能再软件、算法、语言编译、程序设计上保证连续流动的任务数n能远大于子过程数m,则实际吞吐率将大大低于最大吞吐率。极限情况下,当n=1时,由于m增大。锁存器个数增多,实际增大了任务在流水线上的通过时间,反而使其速度会比顺序串行的还要低。如果ti,其中瓶颈段的时间是tj ,则完成n个任务的TP=n/(ti+(n-1)tj)其SP=nti/(ti+(n-1)tj)第10页/共24页2.是指流水线中设备的实际使用时间占整个运行时间之比,也称为流水线设备的时间利用率。如果是,如图5.22P138所示,则在n个任务执行的整个时间T中,均为0,即1=2=m=nt0/T=n/(m+(n-1)=0=(1+

9、2+m)/m=0=mnt0/mT式中,分母mT是时空图中m个段和流水线总时间T所围成的面积,分子mnt0是时空图中n个任务实际使用的面积。因此,。显然,只有当nm时,才趋于1。同时还可以看出,即=nt0/T=n/(m+(n-1)=TPt0尽管,在非线性流水线或线性流水线各段时间不等时,这种正比关系并不存在。但是,。第11页/共24页如果,各段的效率就会不等,=n个任务实际占用的时空区/m个段总的时空区 =nti/m(ti+(n-1)tj)3.(略)第12页/共24页5.2.3 流水机器的相关处理和控制机构流水线只有连续不断流动,不出现断流,才能提高效率。流水机环境下,转移指令和其后的指令之间存

10、在关联,使之不能同时解释,其造成的对流水机器的吞吐率和效率下降的影响要比指令相关、主存操作数相关和通用寄存器组相关及基址值或变址值相关严重得多,所以称为。而后者只影响相关得两条或几条指令,最多影响流水线某些段工作的推后,不会改变指缓中预取得指令,影响是局部得,故称为。第13页/共24页1.包括指令相关、访存操作数相关和通用寄存器组相关等局部性相关都是由于在机器同时解释的多条指令之间出现了对同一主存单元或寄存器要求先写后读。重叠机器处理局部性相关采用的方法,这两种方法。而其中,因为流水机器同时解释多条指令,如果,而且控制复杂,因此,如图5.25P143所示的方法进行处理。任务在流水线中流动顺序的

11、安排和控制可以有两种方式。一种是让任务流出流水线的顺序保持与流入流水线的顺序一致,称为顺序流动方式或称;另一种是让流出流水线的任务顺序和流入流水线的顺序不同,称为。一般,同步流动方式控制比较简单,但流水线的吞吐率和效率都要下降;而尽管控制复杂,流水线的吞吐率和效率则均未下降,但是。第14页/共24页2.1)若指令i是条件转移指令,有两个分支。一个是按原来顺序执行的i+1、i+2、的转移不成功分支;另一个是转向p、p+1、的转移成功分支。当指令i进入流水线时,只有等到条件码建立才能确认如何进行转移,这必将让i之后的指令停等,流水线就会断流,性能急剧下降。为此,可采用猜测法。在猜测时,因为它已经预

12、取进缓指,可以很快从中取出进入流水线而不用等待。而。可以根据转移指令类型或程序执行期间转移的历史状况来,但需要事先对大量程序的转移类型和转移概率进行统计,且统计出的概率也不一定能保证较高的猜测准确度。如果采用,由编译程序根据执行过程中转移的历史纪录来动态预测未来的转移选择,可使预测准确度提高到90%。第15页/共24页。一般有三种方法:是在执行猜测分支时对指令只译码和准备好操作数,在转移条件码出现之前不进行运算;是运算但不送回结果;是采用后援寄存器保存可能被破坏的原始状态,一旦猜错,就取出后援寄存器的内容来恢复分支点的现场。此外,为了让猜错后能尽快回到原分支处转入另一个分支,在,还可以由存储器

13、中,以便在猜错时不必从访存取p开始;有些机器的指令流水线设置外,还设置了。2)一方面,不等指令执行完成就提前形成反映运算结果的条件码;另一方面是3)第16页/共24页4)一是可以,避免执行循环时由于指令预取导致指缓中需循环执行的指令被冲掉,减少访主存重复取指的次数;二是由于循环分支概率高,可以,减少因条件分支造成流水线断流的机会。3.流水机器的中断会引起流水线断流,但出现的概率比条件转移的概率低得多,且又是随机发生,故。即不论指令i在流水线的那一段发生中断,未进入流水线的后续指令不再进入,已在流水线的指令仍继续流完,然后再转入中断处理程序执行。这样断点就不一定是i,即断点不精确。即不论指令i是

14、在流水线的那一段响应中断,给中断处理程序的现场全都对应i,i之后流入流水线的指令的原有现场都能恢复第17页/共24页4.由于线性流水线在执行每个任务的过程中,每段均只通过一次,故每拍都可以将一个新的任务送入流水线,这些任务不会争用同一个流水段。而在非线性流水线中,因段间有反馈回路,一个任务在流水的全过程中,可能会多次通过同一段或越过某些段,这样就有可能会出现多个任务争用同一功能段的使用冲突现象。要想不发生冲突就得间隔适当的节拍数之后再向流水线送入下一个任务。为了对流水线任务进行优化调度和控制,提出了。该方法分为以下几个步骤:第18页/共24页5.3 向量的流水处理与向量流水处理机5.3.1 向

15、量的流水处理5.3.2 向量流水处理机第19页/共24页5.3.1 向量的流水处理由于向量内部各元素很少相关,且一般又是执行同一种操作,易于发挥出流水线的功效,所以可将向量数据表示和流水线结合构成。向量的流水处理与所采用的计算机结构有关。向量的处理方式有横向处理方式和纵向处理方式两种。每次从向量中逐次取出分量,完成所有运算,得到结果向量的相应分量;而则按照运算的先后次序,逐个向量进行运算。如果,可以,使每组都能装得进向量寄存器组中第20页/共24页5.4 指令级高度并行的超级处理机5.4.1 超标量处理机5.4.2 超长指令字处理机5.4.3 超流水线处理机第21页/共24页5.4.1 超标量处理机常规的标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论