高等计算机系统结构_第1页
高等计算机系统结构_第2页
高等计算机系统结构_第3页
高等计算机系统结构_第4页
高等计算机系统结构_第5页
已阅读5页,还剩88页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、高等计算机系统结构黑龙江大学计算机科学技术学院李金宝2006年2月-2010年4月计算机科学技术学院研究生课程高等计算机系统结构第一章 并行计算机模型第二章 程序划分与调度第三章 系统互连与通信第四章 可扩展性能原理第五章 并行存储器系统第六章 高速缓存与共享存储器第七章 指令级并行处理第八章 标量处理机与向量处理机第九章 并行模型、语言与编译器第十章 并行程序设计与开发第五章 并行存储器系统5.1 存储器系统的层次结构5.2 包含性、一致性和局部性5.3 存储器容量的规划5.4 虚拟存储器技术5.5 交叉访问的存储器 现代计算机系统都以存储器为现代计算机系统都以存储器为中心,在计算机运行过程

2、中,中心,在计算机运行过程中,存储器是各种信息存储和交存储器是各种信息存储和交换的中心。换的中心。5.1 存储器系统的层次结构CPU内的寄存器高速缓存主存储器磁盘存储器磁带机层0:M0层1:M1层2:M2层3:M3层4:M4容量和存取时间增加每位成本增加存储器系统的层次结构图五个参数:存取时间ti:从CPU到第i层存储器的往返时间存储器容量Si:第i层的字节或字的数量每字节成本Ci:第i层存储器的成本为CiSi传输带宽bi:相邻层之间传送信息的速率传输单位Xi:i和i+1层之间数据传送的粒度 对存储器系统中各层次存储器的特性,1993年的统计数据如下表:存储器层次特性第0层CPU寄存器第1层高

3、速缓存第2层主存储器第3层磁盘存储器第4层磁带存储器设备工艺存取时间容量(字节)成本(美分/KB)带宽(MB/S)传送单位分配管理ECLSRAMDRAM磁盘机磁带机10ns25-40ns60-100ns10-20ms2-20min512B128KB512MB60-228GB512G-2TB18000725.60.230.01400-800250-40080-1333-50.18-0.23字:4-8B块:32B页:0.5-1KB文件:5-512KB后援存储器编译器分配 硬件控制 操作系统操作系统/用户操作系统/用户第五章 并行存储器系统5.1 存储器系统的层次结构5.2 包含性、一致性和局部性5

4、.2.1 包含性5.2.2 一致性5.2.3 局部性5.3 存储器容量的规划5.4 虚拟存储器技术5.5 交叉访问的存储器5.2 包含性、一致性和局部性5.2.1 包含性(inclusion)1. 包含性的定义 初始时,所有信息项都存放在最外层Mn,在处理过程中,它的子集被复制到Mn-1,同样, Mn-1的子集被复制到Mn-2, 如果在Mi中找到一个信息字,那么同一个字的Copy在所有的高层Mi+1,Mi+2,Mn中都一定可以找到,即存在如下规律:M0 M1 M2 Mn2. 相邻层之间的数据传送单位CPU高速缓存:字高速缓存主存储器:块(每块32个字节(8个字)主存磁盘:页面(比如每页4K字节

5、,包含128块)磁盘磁带:段包含性可以用下面的图来说明:CPU寄存器baM1:高速缓存a,b为高速缓存块,32个字节页面AaM2:主存储器页面Bb页面AaM3:磁盘存储器页面Bb段F段G页面AaM4:磁带机后援存储器页面Bb段F段G字单位块单位页单位段单位5.2.2 一致性(coherence)1.一致性定义同一个信息项与后继存储器层次的副本是一致的。如果在高速缓存中的一个字被修改过,那么在所有更高层上该字的副本也必须立即或最后加以修改 。2.维护一致性的两种策略(1)写直达(write-through,WT),即如果在Mi(i=1,2,n-1)中修改了一个字,则在Mi+1中需要立即修改。 (

6、2)写回(write-back,WB),即在Mi+1 中的修改延迟到Mi中正在修改的字被替换时才进行。5.2.3 局部性(locality) Hennessy和Patterson(1990年)提出了一条90-10规则: 典型程序在10%的代码上可能要耗费其执行时间的90% 例如嵌套循环操作的最内层循环 时间局部性(temporal locality):最近的访问项(指令或数据)很可能在不久的将来再次被访问。即对最近使用区域的集中访问。空间局部性(spatial locality):一个进程访问的各项的地址彼此很近,例如,表操作或数组操作含对地址空间中某一区域的集中访问。顺序局部性(sequen

7、tial locality):在典型程序中,除转移指令产生不按次序的转移外,指令都是顺序执行的。 局部性原理指导我们去设计高速缓存、主存储器以及虚拟存储器组织。第五章 并行存储器系统5.1 存储器系统的层次结构5.2 包含性、一致性和局部性5.3 存储器容量的规划5.3.1 命中率5.3.2 有效存取时间5.4 虚拟存储器技术5.5 交叉访问的存储器5.3 存储器容量的规划存储器层次结构的性能是由层次结构的有效存取时间Teff决定的,它依赖于相继层次的命中率和访问频率。 在Mi中找到一个信息项时,称之为命中,反之称为缺失。 假定在层次结构中的存储器层次为Mi和Mi-1,其中i=1,2,n。则在

8、Mi层的命中率hi是信息项可在Mi中找到的概率。 它是表示两个相邻层Mi-1和Mi特性的函数。 在Mi中的缺失率定义为1-hi。5.3.1 命中率 相继层的命中率是存储器容量、管理策略和程序行为的函数,它是独立的随机变量,其值在0到1之间。 假设h0=0和hn=1,即CPU总是先访问M1,并且访问到最外层Mn时总是命中。则对Mi的访问频率为:iiihhhhf)1()1)(1(121即在较低层次有i-1次缺失而在Mi有一次命中时访问Mi成功的概率。111,1hffniinfff21通常情况下,有:对存储器内层的访问比对外层的访问要多。访问内存比访问外存要多。5.3.2 有效存取时间每当发生缺失时

9、,就要付出代价去访问较高层次的存储器。这种缺失在Cache中称为块缺失。在主存储器中称为缺页错(page fault),因为块和页面是这些层次之间传送信息的单位。缺页错付出的时间代价要比块缺失付出的更大:nnnniiieffthhhhthhthtfT)1()1)(1()1(1211221115.3.3 层次结构的优化 优化目标 使Teff接近于M1的t1, 总成本接近于Mn的Cn。 优化过程可以表达为:对一个线性规划求最小值问题:减到最小值。要将有效存取时间总价格的上限)时,对于niiieffniiitotaliitfTCSCCnitS101(, 2 , 1, 0, 0例1:存储器层次结构设计

10、存储器层次存取时间容量价格/K字节高速缓存主存储器磁盘阵列t1 = 25nst2 = 未知t3 = 4mss1=512K字节s2=32M字节s3 = 未知c1=1.25美元c2=0.2美元c3=0.0002美元要求:有效存取时间Teff=10.04s, 高速缓存命中率为h1=0.98, 主存储器命中率h2=0.9, 总成本上限为15000美元。解:nstthhhthhthTGByteSSCSCSCCeff90304.10)1)(1 ()1 (8 .391500023321221113332211代入可得代入有:如果在同样的预算限制条件下,要把主存储器容量提高64M字节,那么只好以减少磁盘容量为

11、代价,但是这一变化并不影响高速缓存的命中率。如果使用合适的页面替换算法,可能会增加主存储器的命中率,但Teff有所降低。练习:P168 习题4.11层次化存储器系统必须解决的问题:(1)数据块在较高层存储器中存放在哪个位置?即块和页的定位问题。如果一个块存放在某一上层存储器中,怎样确定并找到该块,即块的寻址问题。(2)不命中的将从下层存储器中访问,并将该块调入上层存储器中,但是如果上层存储器中已无空闲空间,则势必将上层存储器中的某一块调出,但应调出那一块,即替换问题。(3)在写访问时,写入上层存储器中的数据必须在适当的时候写入下层存储器,何时写?第五章 并行存储器系统5.1 存储器系统的层次结

12、构5.2 包含性、一致性和局部性5.3 存储器容量的规划5.4 虚拟存储器技术5.4.1 虚拟存储器原理 5.4.2 共享存储和分布存储5.4.3 DSM与SVM5.4.4 虚拟存储器的主要技术5.5 交叉访问的存储器5.4 虚拟存储器技术 19611961年英国曼彻斯特大学年英国曼彻斯特大学KilbrnKilbrn等人提出等人提出了了7070年代被广泛地应用于大中型计算机系年代被广泛地应用于大中型计算机系统中、目前许多微型机也广泛使用的统中、目前许多微型机也广泛使用的虚拟虚拟存储器。存储器。 虚拟存储器提供了几乎没有限制的存储器工作空间。 虚拟地址在编译时产生。 虚拟地址到物理地址的转换在运

13、行时进行,需要使用转换表和映象系统。 替换策略。5.4.1 5.4.1 虚拟存储器工作原理虚拟存储器工作原理 把主存储器、磁盘存储器和虚拟存储器都划分成固定大小的页,主存储器的页称为实页,虚拟存储器中的页称为虚页。 一个主存地址A由两部分组成,实页号p和页内偏移d 一个虚地址Av由三部分组成,用户号U、虚页号P和页内偏移D。用户号U虚页号P页内偏移D多用户虚拟地址Av的组成实页号p页内偏移d主存地址A的组成 内部地址变换:内部地址变换: 多用户虚拟地址多用户虚拟地址AvAv变换成主存实地址变换成主存实地址A A 多用户虚拟地址中的页内偏移多用户虚拟地址中的页内偏移D D直接作为直接作为主存实地

14、址中的页内偏移主存实地址中的页内偏移d d 主存实页号主存实页号p p与它的页内偏移与它的页内偏移d d直接拼接直接拼接起来就得到主存实地址起来就得到主存实地址A A 外部地址变换:外部地址变换: 首先查外页表得到磁盘存储器实地址首先查外页表得到磁盘存储器实地址 把磁盘存储器实地址和主存储器实页号送把磁盘存储器实地址和主存储器实页号送入输入入输入/输出处理机输出处理机 把要访问数据所在的一整页都从磁盘存储把要访问数据所在的一整页都从磁盘存储器调入到主存储器器调入到主存储器地址的映象与变换地址的映象与变换 三种地址空间:三种地址空间:虚拟地址空间,主存储虚拟地址空间,主存储器地址空间,辅存地址空

15、间器地址空间,辅存地址空间 地址映象:地址映象:把虚拟地址空间映象到主存地址空间把虚拟地址空间映象到主存地址空间 地址变换:地址变换:在程序运行时,把虚地址变在程序运行时,把虚地址变换成主存实地址换成主存实地址 因地址映象和变换方法不同,有因地址映象和变换方法不同,有三种虚三种虚拟存储器拟存储器:页式虚拟存储器、段式虚拟页式虚拟存储器、段式虚拟存储器、段页式虚拟存储器存储器、段页式虚拟存储器1 1、段式虚拟存储器、段式虚拟存储器 地址映象方法:地址映象方法:每个程序段都从每个程序段都从0 0地址地址开始编址,长度可长可短,可以在程序开始编址,长度可长可短,可以在程序执行过程中动态改变程序段的长

16、度。执行过程中动态改变程序段的长度。0段1k1段2段3段0500020002000段号 段长 起址01k8k1500 16k22009k3200 30k08k9k16k30k程序空间主存储器主程序主程序 地址变换方法:地址变换方法:由用户号找到基址寄存器由用户号找到基址寄存器从基址寄存器中读出段表的起始地址从基址寄存器中读出段表的起始地址把起始地址与多用户虚地址中段号相加得把起始地址与多用户虚地址中段号相加得到段表地址到段表地址把段表中给出的起始地址与段内偏移把段表中给出的起始地址与段内偏移D D相相加就能得到主存实地址加就能得到主存实地址0段表长度段表基址6As段名起始地址装入位段长访问方式

17、用户号U 段号S段内偏移D多用户虚地址主存实地址432101n-1As段表基址寄存器一个用户(一道作业)的段表段式虚拟存储器的主要优点:段式虚拟存储器的主要优点:(1) (1) 程序的模块化性能好程序的模块化性能好(2) (2) 便于程序和数据的共享便于程序和数据的共享(3) (3) 程序的动态链接和调度比较容易程序的动态链接和调度比较容易(4) (4) 便于实现信息保护便于实现信息保护段式虚拟存储器的主要缺点:段式虚拟存储器的主要缺点:(1) (1) 地址变换所花费的时间比较长,需地址变换所花费的时间比较长,需 要做两次加法运算要做两次加法运算(2) (2) 主存储器的利用率往往比较低主存储

18、器的利用率往往比较低(3) (3) 对辅存(磁盘存储器)的管理比较对辅存(磁盘存储器)的管理比较 困难困难2 2、页式虚拟存储器、页式虚拟存储器 页式虚拟存储器页式虚拟存储器把虚拟地址空间划分成一个个把虚拟地址空间划分成一个个固定大小的块固定大小的块, ,每块称为每块称为一页一页, ,把主存储器的地把主存储器的地址空间也按虚拟地址空间同样的大小划分为页。址空间也按虚拟地址空间同样的大小划分为页。 页是一种逻辑上的划分,它可以由系统软件任意指页是一种逻辑上的划分,它可以由系统软件任意指定。定。 虚拟地址空间中的页称为虚页,主存地址空间中虚拟地址空间中的页称为虚页,主存地址空间中的页称为实页。的页

19、称为实页。 每个用户使用一个每个用户使用一个基址寄存器基址寄存器(在(在CPUCPU内),通内),通过用户号过用户号U U可以直接找到与这个用户程序相对应可以直接找到与这个用户程序相对应的的基址寄存器基址寄存器,从这个基址寄存器中读出页表,从这个基址寄存器中读出页表起始地址。访问这个页表地址,把得到的主存起始地址。访问这个页表地址,把得到的主存页号页号p p与虚地址中的页内偏移直接拼接起来得到与虚地址中的页内偏移直接拼接起来得到主存实地址。主存实地址。 如图所示:如图所示:0页1页2页3页页号 主存页号0123用户程序主存储器页表页式虚拟存储器的地址映象Pa装入 修改 主存页号 标志用户号U虚

20、页号P页内偏移D页内偏移d2pPa页表基址页表实页号p 主要优点:主要优点:(1) (1) 主存储器的利用率比较高主存储器的利用率比较高(2) (2) 页表相对比较简单页表相对比较简单(3) (3) 地址变换的速度比较快地址变换的速度比较快(4) (4) 对磁盘的管理比较容易对磁盘的管理比较容易 主要缺点:主要缺点:(1) (1) 程序的模块化性能不好程序的模块化性能不好(2) (2) 页表很长,需要占用很大的存页表很长,需要占用很大的存储空间。例如:虚拟存储空间储空间。例如:虚拟存储空间4GB4GB,页大小页大小1KB1KB,则页表的容量为,则页表的容量为4M4M字,字,16MB16MB3

21、3、段页式虚拟存储器、段页式虚拟存储器 用户按照程序段来编写程序,每个程序用户按照程序段来编写程序,每个程序段分成几个固定大小的页。段分成几个固定大小的页。 地址变换方法:地址变换方法:(1) (1) 先查段表,得到该程序段的页表起先查段表,得到该程序段的页表起 始地址和页表长度始地址和页表长度(2) (2) 再查页表找到要访问的主存实页号再查页表找到要访问的主存实页号(3) (3) 最后把实页号最后把实页号p p与页内偏移与页内偏移d d拼接得拼接得 到主存的实地址到主存的实地址装入修改实页号标志用户号U 段号S页内偏移页内偏移0/11pA实页号p虚页号PAs装入1修改0/1页表地址ApAs

22、页面替换算法及其实现方法 页面替换发生时间:页面替换发生时间:当发生页面失效时,要从磁盘中调入一页到当发生页面失效时,要从磁盘中调入一页到主存。如果主存所有页面都已经被占用,必主存。如果主存所有页面都已经被占用,必须从主存储器中淘汰掉一个不常使用的页面,须从主存储器中淘汰掉一个不常使用的页面,以便腾出主存空间来存放新调入的页面。以便腾出主存空间来存放新调入的页面。 评价页面替换算法好坏的标准:评价页面替换算法好坏的标准:一是命中率要高一是命中率要高二是算法要容易实现二是算法要容易实现页面替换算法的使用:页面替换算法的使用:(1) (1) 虚拟存储器中,主存页面的替换,虚拟存储器中,主存页面的替

23、换,一般用软件实现一般用软件实现(2) Cache(2) Cache块替换一般用硬件实现块替换一般用硬件实现(3) (3) 虚拟存储器的快慢表中,快表存储虚拟存储器的快慢表中,快表存储字的替换,用硬件实现字的替换,用硬件实现(4) (4) 虚拟存储器中,用户基地址寄存器虚拟存储器中,用户基地址寄存器的替换,用硬件实现的替换,用硬件实现(5) (5) 在有些虚拟存储器中目录表的替换在有些虚拟存储器中目录表的替换1 1、页面替换算法、页面替换算法随机算法随机算法算法简单,容易实现;没有利用历史信息,没有反映程序的局部性,命中率低。(2) 先进先出算法 (FIFO)比较容易实现,利用了历史信息,没有

24、反映程序的局部性。最先调入主存的页面,很可能也是经常要使用的页面。(3) 近期最少使用算法 (LFU)既充分利用了历史信息,又反映了程序的局部性(1) 实现起来非常困难。(4)最近最少使用算法 (LRU) 把LRU算法中的“多”与“少”简化成“有”与“无” 实现起来比较容易。(5)最优替换算法 (OPT) 一种理想化的算法。 用来作为评价其它页面替换算法好坏的标准。 在虚拟存储器中,实际上有可能采用只有在虚拟存储器中,实际上有可能采用只有FIFOFIFO和和LRULRU两种算法。两种算法。例2:一个程序共有5个页面组成,程序执行过程中的页地址流如下: P1, P2, P1, P5, P5, P

25、1, P3, P4, P3, P4 假设分配给这个程序的主存储器共有3个页面。给出FIFO、LRU、OPT 三种页面替换算法对这3页主存的使用情况,包括调入、替换和命中等。例3:一个循环程序,依次使用P1,P2,P3,P4四个页面,分配给这个程序的主存页面数为3个。FIFO、LRU和OPT三种页面替换算法对主存页面的调度情况如下图所示。在FIFO和LRU算法中,总是发生下次就要使用的页面本次被替换出去的情况,这就是“颠簸”现象。练习P169 习题4.15提高主存命中率的方法影响主存命中率的主要因素:影响主存命中率的主要因素:(1) (1) 程序执行过程中的页地址流分布情况程序执行过程中的页地址

26、流分布情况(2) (2) 所采用的页面替换算法所采用的页面替换算法(3) (3) 页面大小页面大小(4) (4) 主存储器的容量主存储器的容量(5) (5) 所采用的页面调度算法所采用的页面调度算法 以下,对后三个因素进行分析以下,对后三个因素进行分析1、页面大小与命中率的关系、页面大小与命中率的关系 页面大小为某个值时,命中率达到最大。页面大小为某个值时,命中率达到最大。 页面大小与命中率关系的解释:页面大小与命中率关系的解释:假设假设A At t和和A At+1t+1是相邻两次访问主存的逻辑是相邻两次访问主存的逻辑地址,地址,d dA At tA At+1t+1。如果如果S Sp p(S(

27、Sp p为页面大小为页面大小) ),随着,随着S Sp p的增的增大,大,A At t和和A At+1t+1在同一页面的可能性增加,即在同一页面的可能性增加,即(命中率)随着(命中率)随着S Sp p的增大而提高。的增大而提高。如果如果S Sp p,A At t和和A At+1t+1一定不在同一个页一定不在同一个页面内。随着面内。随着S Sp p的增大,主存页面数减少,的增大,主存页面数减少,页面替换将更加频繁。随着页面替换将更加频繁。随着S Sp p的增大而的增大而降低。降低。 当Sp比较小的时候,前一种情况是主要的,随着Sp的增大而提高 当Sp达到某一个最大值之后,后一种情况成为主要的,随

28、着Sp的增大而降低 当页面大小增大时,造成的浪费也要增加 当页面大小减小时,页表和页面表在主存储器中所占的比例将增加。页面大小 SP命中率 H1S2S2、主存容量与命中率的关系、主存容量与命中率的关系 主存命中率H随着分配给该程序的主存容量S的增加而单调上升。 在S比较小的时候,H提高得非常快。随着S的逐渐增加,H提高的速度逐渐降低。当S增加到某一个值之后,H几乎不再提高。命中率 H主存容量S1.03、页面调度方式与命中率的关系、页面调度方式与命中率的关系 请求式:请求式:当使用到的时候,再调入主存当使用到的时候,再调入主存 预取式:预取式: 在程序重新开始运行之前,把上次程序在程序重新开始运

29、行之前,把上次程序停止运行前一段时间内用到的页面先调停止运行前一段时间内用到的页面先调入到主存储器,然后再开始运行程序入到主存储器,然后再开始运行程序 可以避免在程序开始运行时,频繁发生可以避免在程序开始运行时,频繁发生页面失效的情况页面失效的情况 如果调入的页面用不上,则即浪费了调如果调入的页面用不上,则即浪费了调入的时间,又占用了主存资源。入的时间,又占用了主存资源。5.4.2 共享存储和分布存储MIMD系统可以分为两种:(1)tightly coupled shared-Memory multiprocessors(2)loosely coupled distributed-Memory

30、 multiprocessors它们可以用图表示如下:P1P2PnICNSM1SMmshare-MemorymultiprocessorsPICNdistribued-MemorymultiprocessorsLMPLMPLM共享存储和分布存储的优缺点:共享存储器: 易于编程,是单机的自然延伸 程序员无数据划分的负担 多进程并发的开销小,效率高,易于进程迁移,任务动态分配简单 由于每个处理器都通过总线访问存储器,因而限制了处理器的个数,可扩展性差。分布存储器:系统结构灵活,可扩展性好 处理机数目可达成百上千,处理速度有巨大的发展潜力 算法设计、编程以及任务动态分配比较困难 很难在处理机之间传递

31、复杂的数据结构,难于进程迁移 不能支持需要存储空间的大规模数据处理要求。分布存储的两种编程方法:(1)message-passing,用send,receive原语实现通信,要求程序员在进程的整个运行期间对数据的移动都很清楚;(2)remote procedure call,语言一级传送控制与数据,可以看作是本地调用,但透明度有限。缺点: 这两种方法都是用来解决不同地址空间的问题,在节点间传递复杂数据结构时都比较困难,需要打包,传递指针也不可能实现。 由于个处理机拥有不同的地址空间,使得进程迁移时,该进程所分配到的操作系统资源也得一起移动(打开的文件、文件存取控制块等),这很费时间。5.4.3

32、 DSM与SVM1.DSM和SVM的提出 如何把共享和分布的优点结合起来,取长补短?共享分布存储器(Distributed Shared Memory,DSM)虚拟共享存储器(Shared Virtual Memory,SVM)基于分布存储器的多处理机上,实现物理上分布、但逻辑上共享的存储器系统。虚拟共享存储器的逻辑结构:CPU1虚拟共享存储器LM1CPU2LM2CPUnLMn地址映射部件地址映射部件地址映射部件MIMD机器存储系统的发展方向:共享存储器分布存储器共享分布存储器2.DSM系统的特点 在DSM系统中,每一台处理机都可以访问全局存储器的任一位置,用户可以把它当成全局共享存储器系统。

33、 优点:编程容易系统结构灵活可扩展性好系统价格低有较好的软件移植性 DSM系统编制的程序比用消息传递方式编制的程序效率高:(1)在DSM系统中,数据都是以块的方式进行传送,如果一个程序具有较高的局部性,则当把一个数据块传送到一个节点后,该节点对它的访问就成为本地访问,而消息传递方式的每次访问都需要通讯。(2)许多并行应用程序都是分阶段执行的,每次执行前,都有一个数据交换阶段,其时间受通讯限制。在DSM系统中,数据只有用到的时候才传送,取消了数据交换阶段,把通讯时间加以分散,提高了并行性。(3)DSM提供的虚存空间比单个节点的存储空间大得多,减少了换页操作。3.实现DSM的途径主要有三种:(1)

34、硬件实现:将传统的cache技术扩展应用到松耦合分布式存储多处理机。要增加专用部件以取得高效的实现。(2)操作系统和库实现:利用虚拟存储管理机制取得共享(sharing)和一致(coherence)(3)编译实现:自动将共享访问转换成同步和一致原语。用户需要显式控制全局数据,当传递大量数据时或试图进行进程迁移时极其复杂。4.主要技术结构(structure):指共享数据在存储器中的框架(如对象和语言的类型)粒度(granularity):指基本共享单位长度(如字节、字、页或复杂数据结构)。数据访问与一致性(access and cosistency)一致性语义(coherence semant

35、ics)可扩展性(scalability)异构性(heterogeneity)第五章 并行存储器系统5.1 存储器系统的层次结构5.2 包含性、一致性和局部性5.3 存储器容量的规划5.4 虚拟存储器技术5.5 交叉访问的存储器5.5.1 两种组织方式5.5.2 两种方式的比较5.3.3 带宽和容错5.5 交叉访问的存储器利用存储器交叉存取技术可以对存储器相邻单元进行流水线访问,因而能获得更宽的带宽。主存储器由多个模块构成。假设主存储器包含m=2a个存储器模块,每个模块包含w=2b个存储单元(字),则总存储容量为个字bawm25.5.1 两种组织方式交叉访问的存储器可以分为两种:(1)低位交叉方式(2)高位交叉方式1.低位交叉方式 低位交叉存取将邻接的存储单元沿横向放在m个模块中,存储器地址的低a位用来指明存储器模块,高b位是每个模块内的字地址。 同一个字的地址同时送给所有的存储模块,模块地址译码用来区分模块地址。低位m路交叉存取如下图:MAB0mm(w-1)MDBM0MAB1m+1m(w-1)+1MDBM1MABm-12m-1mw-1MDBMm-1WAB字模块地址ab数据总线存储器数据缓冲器模块地址缓冲器字地址缓冲器2.高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论