《计算机系统结构》复习指导_第1页
《计算机系统结构》复习指导_第2页
《计算机系统结构》复习指导_第3页
《计算机系统结构》复习指导_第4页
《计算机系统结构》复习指导_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机余统结构

(第1章~第4章复习)

主讲:郑纬民教授

1.基本概念

系统结构

计算机组成

计算机实现

透明性

模拟,仿真,虚拟机

SIMD,MIMD,CPI,

Amdahl定律,

MIPS,MFLOPS,

标准测试程序

2.计算题类型

①有效(平均)CPI计算

②Amdahl定律应用

①有效(平均)CPI

[例题]假设在一台40MHz处

理机上运行200,000条指令的

目标代彳归,程序主要由四种指

令组成。根据程序跟踪实验结

果,已知指令混合比和每种指

令所需的指令数如下。计算

在单处理机上用跟踪数据运

行程序的平均CPI,并根据所

得的CPI,计算相应的MIPS速

率。

指令类型CPI指令混合比

算术和逻辑160%

高速缓存命中的加载/存储218%

转移412%

高速存储缺失的存储器访问810%

[解]

CPI=1X60%+2x18%+4x12%+8X10%

=2.24

MIPS=f/(CPIx106)

二(40X106)/(2.24X106)

=17.86

②Amdahl定律应用

[例题]假定我们利用增加向

量处理模块来提高计算机的运

算速度。计算机处理向量的速

度比其通常的运算要快20倍。

我们将可用向量处理部分所花

费的时间占总时间的百分比

称为可向量化百分比。

A.求出加速比S和可向量化

百分比F之间的关系式。

B.当要得到加速比为2时的

可向量化百分比F为多少?

[解]

I)s=

(1-F)+F/2020-19xF

2)由上式,将S=2代入得:

F=10/19=0.53

第二章

指令系统

1.基本概念

数据结构

数据表示

寻址技术

RISC指令系统

CISC指令系统

2.计算题类型

①浮点数表示

②Huffman编码

第三幸

存储余统

1.基本概念

虚拟存储器

Cache存储器

命中率

替换算法

2.计算题类型

①层次存储系统命中率、

价格计算

②三种映射框图

③替换算法

[例题]设有一个两层的存

储器层次结构:Ml和M2。Ml

的命中率用h表示,并分别

令cl和c2为每千字节的成本,

si和s2为存储器容量,tl和

t2为存取时间。

a)在什么条件下,整个存储

器系统平均成本会接近于c2?

b)该层次结构的存储器有效

存取时间ta是多少?

c)令两层存储器的速度比r=t2/tl,

并令E二tl/ta为存储系统的存取

效率。试以r和命中率h来表示E。

d)试分别画出r=5、20和

100时,E和h的关系图。

e)如果r=100,为使E>0.95,

要求的命中率h是多少?

[解](a)整个存储系统的

平均成本为

JHC2

CQi+C7S7s9

山+“L+l

2

不难看出:当sl/s2非常小的

时候,上式的值约等于c2。

即s2»sl时,整个存储器系

统的平均成本会接近于c2

(b)ta=+(1-1)h2t2

因为h2等于L所以

ta=htj+(1-h)t2

(c)

h_G_1

———

taht]+(1—h)t2h+(1—h)r

(d)存储效率E和命中率h的关系

1.0000

0.9000

存0.8000

速度比r=5

储0.7000

效0.6000

速度比r=20

率0.5000

0.4000

E

速度比r=100

0.3000

A--

0.2000

0.1000

0.0000

0.10.30.50.70.9

命中率h

(e)将数值代入E和h的关系式

可以算得h>99.95%

[例题]假定计算机的主存储器

按64块组织,块大小为8个字。

高速缓存有8个块。试表示出从

主存储器编号的块到高速缓存

中块的映射关系。尽可能清楚

地画出所有的映射线。

a)直接映射及指定标记字段、

块号和字号的地址位。

b)全相联映射以及指定标记字

段和字号的地址位。

c)2路组相联映射以及指定标

记字段、组号和字号的地址

位。

[解](a)直接映射方式

存储器地址

标记(3位)块(3位)字(3位)主存储器

B7

b63

(b)全相联映射方式

存储器地址

(c)2路组相联映射方式

存储器地址

主存储器

标记(4位)组(2位)字(3位)

b6O

b61

b62

b63

第四章

输入输出余统

1.基本概念

数组多路通道

选择通道

字节多路通道

2.计算题

字节多路通道实际工作流量

通道最大流量和工作周期设计

[例题]一个字节多路通道连接

DI、D2、D3、D4、D5共5台,

这些设备分别每10即、30年、

30分、50即和75|ns向通道发

出一次数据传送的服务请求。

a)计算这个字节多路通道的

实际流量和工作周期

b)如果设计字节多路通道的

最大流量正好等于实际流

量,并假定对数据传输率

高的设备,通道响应它的

数据传送请求的优先级也

高。5台设备在0时刻同时

向通道发出第一次传送数

据的请求,并在以后的时

间里按照各自的数据传输

率连续工作。画出通道分

时为各台设备服务的时间

关系图,并计算这个字节

多路通道处理完各台设备

的第一次数据传送请求的

时刻。

c)从时间关系图上发现什么问题?

如何解决这个问题?

[解]

a)这个字节多路通道的实际流量为

fBYTR=(1/10+1/30+1/30+

1/50+1/75)=0.2(MB/s)

通道的工作周期为

t=1/f=5gs/B

包括通道选择设备的时间Ts

和为设备传送一个字节所用

的时间Td。

b)5台设备向通道请求传送

数据和通道为它们服务的时

间关系如图所示。向上的箭

头表示设备的数据传送请求,

有阴影的长方形表示通道响

应设备的请求并为设备服务

所用的时间间隔,包括通道

选择设备的时间和为设备传

送一个字节所用的时间,这

两部分时间之和为皿S。

在图中,5台设备在0时刻同

时向通道发出第一次传送数

据的请求,通道处理各个设

备第一次请求时间如下:

处理完设备D1的第一次请求的

时刻为5)LIS;处理完设备D2的

第一次请求的时刻为lOpis;处

理完设备D3的第一次请求的时

刻为20RS;处理完设备D4的第

一次请求的时刻为30那;

设备D5的第一次请求没有得

到响应,直到第85M通道才

开始响应设备D5的服务请求,

这时,设备已经发出了两个

传送数据的服务请求,因此,

第一次传送的数据有可能要

丢失。

通道分时为D1~D5各台设备服务的时间关系图

01020304050607080

c)当字节多路通道最大流量与

连接的设备数据流量之和非常

接近时,如果传输速度高的设

备频繁发出服务请求,并且优

先得到响应,那么某些低速设

备可能在很长的一段时间内得

不到响应。可采取以下几种方

法:

1)增加通道的最大流量

2)动态改变设备的优先级,

如在30〜70四之间临时

提高设备D5的优先级

3)增加一定数量的数据缓

冲器,特别是对优先级

比较低的设备。

第五幸

标量处理机与流水线

1.基本概念

流水线的原理、加速比、效率,

超标量处理机,

超流水线处理机,

超流水线超标量处理机。

2.计算题类型

①流水线的原理

②流水线的性能分析

①流水线的原理

[题]假设一条指令的执行过程分为“取指令”、“

分析”和“执行”三段,每一段的时间分别为At、

2At^3Ato在下各种情况下,分别写出连续执行n

条指令所需要的时间表达式。

(1)顺序执行方式。

⑵仅“取指令”和“执行”重叠。

⑶“取指令”、“分析”和“执行”重叠。

[解](1)顺序执行时每条指令用时

=At+2At+3At=6At,

因此n条指令所需要的时间=6n*At

(2)第一条指令完成需要时间

=At+2At+3At=6At,下一条指令的“取指令

”与上一条指令“执行”的最后一个At重叠

O因此,自从第一条指令完成后,每隔4At完

成一条指令。所以余下的n-1条指令用时(n-

1)*4Ato所以,n条指令所需要的时间

=6At+(n-1)*4At=2(2n+1)At。

(3)第一条指令完成需要时间

=At+2At+3At=6At,由于一条指令的

“取指令”和“分析”阶段和下一条

指令的“执行”阶段重叠,因此,此

后每3At完成一条指令,余下的n-1

条指令用时(n-1)*3At.

因此n条指令所需要的时间=6忒+6

1)*3At=3(n+1)Ato

②一动态多功能流

水线由6个功能

段组成,如下图:

其中:S1>S4、S5、S6组成

乘法流水线,S1、S2、S3、

S6组成加法流水线,各个功

能段时间均为50ns。假定该

流水线的输出结果可以直接

返回流水线输入端,而且设

置有足够的缓冲寄存器。

若按照最快的方式用该

流水线计算

(1)请画出其处理过程

的时空图。

(2)计算其实际吞吐率,

加速比和效率。

[答]

(1)乘法操作用到的流水段

有:S1、S4、S5、S6;加

法操作用到的流水段有:S1、

S2、S3、S6O以最快的方式

处理的流水线时空图如图所

示:

5

(2):A部分所处理的是%二!"!”?

Z=1

5

H。区

B部分所处理的是Z=1

5

C部分所处理的是f=£q

i=1

整个处理过程共需22个时

钟周期。而进行了14次不

同的运算,所以其实际吞

吐率为:

14

TP==127W/5

22x50x10-9

这些运算串行处理所需要的时

钟周期为56个时钟周期,所以

其加速比为:

=2.55

效率为:

-------=42.4%

22x6

第六章

向量处理机

1.基本概念

向量处理方式,链接技

术,向量处理机结构,

提高向量处理机性能的

技术。

2.计算题类型

链接技术

[题]以下四条向量指令序列链接在一

起执行一种复合的功能。

V0-存储器(取存储器)

V2-V0+V1(向量加)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论