计算机组成与结构课件

上传人：t*** IP属地：贵州上传时间：2022-12-12 格式：PPT 页数：468 大小：1.81MB 积分：30 举报 版权申诉

已阅读5页，还剩463页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

计算机组成与结构

计算机组成与结构1参考书《计算机组成与结构》王爱英清华大学出版社《计算机组成原理》（第四版）白中英科学出版社《计算机组成与系统结构》李亚民清华大学出版社《计算机组织与结构性能设计》WilliamStallings清华大学出版社《计算机系统体系结构》M．ＭorrisMano清华大学出版社参考书《计算机组成与结构》王爱英清华大学出版社2第一章计算机系统概论第一节计算机语言计算机语言与计算机执行程序之间的关系汇编语言指令的格式汇编语言程序例子第一章计算机系统概论第一节计算机语言3第一章计算机系统概论第二节计算机硬件计算机硬件的构成输入设备输出设备运算器控制器存储器第一章计算机系统概论第二节计算机硬件输入设备输出设备4第一章计算机系统概论1.计算机由五大部件组成3.指令和数据用二进制表示4.指令由操作码和地址码组成6.以运算器为中心2.指令和数据以同等地位存于存储器

可按地址寻访5.存储程序一、冯·诺依曼计算机的特点5.存储程序第一章计算机系统概论1.计算机由五大部件组成3.指令5第一章计算机系统概论第二节计算机硬件（三总线结构）CPU存储器输入/输出输入/输出••••数据总线地址总线控制总线第一章计算机系统概论第二节计算机硬件（三总线结构）C6第一章计算机系统概论PC机结构框图CPUCPUclock(2x--5xsystemclock)CPUtoPCIbridgePCItoISAbridgeAGPMemorycontrollerL2CacheIDEserialparallelKeyboardaudioFDC••••SuperI/OMemorySystembusPCIbusISAbusPCIslotAGPslot第一章计算机系统概论PC机结构框图CPUCPUclo7第一章计算机系统概论计算机应用：燕大计算机系主要研究方向：数据库及数据挖掘（分布式数据库，空间数据库，网格技术等）；机器人、计算机仿真、可视分析与可视化（河北省系统集成及计算机虚拟仿真重点实验室）；电子商务及环保、生物分析方向；并行计算；计算机网络方向（网络安全，网络数据库，入侵检测，移动网络等）；。第一章计算机系统概论计算机应用：燕大计算机系主要研究方向8图2.6全加器的功能表及逻辑图第二章计算机的逻辑部件图2.6全加器的功能表及逻辑图第二章计算机的逻辑部件9第二章计算机的逻辑部件加法器的构成:Fn=XnYnCn-1+XnYnCn-1+XnYnCn-1+XnYnCn-1Cn=XnYnCn-1+XnYnCn-1+XnYnCn-1+XnYnCn-1化简以后得：Fn=Xn异或Yn异或Cn-1Cn=XnYn+(Xn+Yn)Cn-1第二章计算机的逻辑部件加法器的构成:Fn=XnYnCn10第二章计算机的逻辑部件超前进位的原理C1=X1Y1+(X1+Y1)C0C2=X2Y2+(X2+Y2)C1C3=X3Y3+(X3+Y3)C2C4=X4Y4+(X4+Y4)C3令：Pi=Xi+YiGi=XiYi将P20公式2.16--2.19化简得2.22--2.25式，转换成与非式得2.26--2.29式。P21图2.8第二章计算机的逻辑部件超前进位的原理11第二章计算机的逻辑部件SN74181的工作原理（P22图2.9）M=1:执行逻辑运算M=0：执行算术运算门22，门24，门26，门28为G0，P0；G1，P1；G2，P2；G3，P3的求和门，既门22=G0异或P0异或C0。门13，门14，门15，门16，门19为C0，C1，C2，C3，C4。第二章计算机的逻辑部件SN74181的工作原理（P2212第二章计算机的逻辑部件16位超前进位加法器工作原理（P24图2.12）CnCnCnCn74181*4GPGPGPGPG0P0Gn+xG1P1Gn+yG2P2Gn+zG3P3CnCn74182第二章计算机的逻辑部件16位超前进位加法器工作原理（P213图2.13二输入四输出译码器计算机组成与结构课件14图2.15双四通道选一数据选择器图2.15双四通道选一数据选择器15图2.21四D寄存器图2.21四D寄存器16第三章运算方法和运算器第一节数据的表示方法和转换计算机中涉及到的数据有：数值数据；特殊符号数据；中文；英文。数值型数据的表示和转换（数制）1.二进制与十进制之间得转换2.二进制与八进制、十六进制之间得转换3.二进制小数与十进制小数之间得转换第三章运算方法和运算器第一节数据的表示方法和转换17第三章运算方法和运算器第一节数据的表示方法和转换数值型数据的编码和计算（有权码BCD码、无权码余3码、格雷码）BCD码：二进制表示的十进制数。运算调整规则：运算结果大于9或有进位时+6调整（加法）。运算结果大于9或有借位时—6调整（减法）。余3码、格雷码（P63表3.3）数字串在计算机中的表示。（用ASCII码表示数字、符号）第三章运算方法和运算器第一节数据的表示方法和转换18计算机组成与结构课件19计算机组成与结构课件20计算机组成与结构课件21计算机组成与结构课件22第三章运算方法和运算器第二节带符号数在计算机中的表示方法及加减运算原码、反码、补码的表示及计算。（图3.1解释）溢出的判断及解决方法。（1.符号原则：正+正=正，负+负=负2.双符号位原则，运算结果只能为00或11。3.溢出=最高符号位进位与最高数值位进位的异或。）计算机实现加减运算要解决的问题：溢出、多个寄存器、结果的移位、运算结果影响标志位。定点数和浮点数的概念。（单精度浮点数、双精度浮点数、临时浮点数。浮点数的隐藏位，浮点数的规格化）移码的概念第三章运算方法和运算器第二节带符号数在计算机中的表示23计算机组成与结构课件24计算机组成与结构课件25计算机组成与结构课件26第三章运算方法和运算器第三节二进制乘法运算定点原码一位乘（手工实现乘法与计算机实现乘法的区别？符号问题、乘数的存放及乘数最低位的判断、部分积的右移实现数位对齐、每次只能两个数据相加。P73图3.5的解释）原码一位乘：设X=0.1101,Y=0.1011，求X*Y=？第三章运算方法和运算器第三节二进制乘法运算27计算机组成与结构课件28第三章运算方法和运算器

部分积乘数说明0000001011初始乘数最低位为1，加被乘数+001101001101部分积和乘数共同右移一位00011011011移出部分丢失，此时乘数最低位为1，+被乘数

+001101010011部分积和乘数共同右移一位00100111101移出部分丢失，此时乘数最低位为0，+0+0000000010011110部分积和乘数共同右移一位0001001111移出部分丢失，此时乘数最低位为1，+被乘数

001101

0100011111部分积和乘数共同右移一位第三章运算方法和运算器部分积29P0=0 P1=(P0+XYn)2-1 P2=(P1+XYn-1)2-1 … Pi+1=(Pi+XYn-i)2-1 … Pn=(Pn-1+XY1)2-1 Pn为乘积。式中的2-1表示二进制数据右移一位，相当于乘以2-1。P0=030图3.6乘法运算的控制流程计算机组成与结构课件31补码一位乘将前述补码乘法公式进行变换，可得出另一公式，是由布斯(Booth)提出的，又称为“布斯公式”。［X·Y］补=［X］补·(-Y0+Yi·2-i) =［X］补·［-Y0+Y12-1+Y22-2+…+Yn·2-n］ =［X］补·［-Y0+(Y1-Y12-1)+(Y22-1-Y22-2)+… +(Yn2-(n-1)-Yn2-n)］ =［X］补［(Y1-Y0)+(Y2-Y1)2-1+…+(Yn-Yn-1)2-(n-1)+(0-Yn)2-n］ =［X］补(Yi+1-Yi)2-i (3.17)乘数的最低1位为Yn，在其后面再添加1位Yn+1,其值为0。补码一位乘将前述补码乘法公式进行变换，可得出另一公式，是由布32第三章运算方法和运算器定点补码一位乘（Booth方法）（续）[P0]补=0[P1]补={[P0]补+（Yn+1-Yn)[X]补}2-1[P2]补={[P1]补+（Yn-Yn-1)[X]补}2-1[P3]补={[P2]补+（Yn-1-Yn-2)[X]补}2-1[Pn]补={[Pn-1]补+（Y2-Y1)[X]补}2-1[Pn+1]补={[Pn]补+（Y1-Y0)[X]补}=[X*Y]补•••第三章运算方法和运算器定点补码一位乘（Booth方法）33第三章运算方法和运算器定点补码两位乘[Pi+1]补={[Pi]补+（Yn-i+1-Yn-i)[X]补}2-1

[Pi+2]补={[Pi+1]补+（Yn-i-Yn-i-1)[X]补}2-1将1式代入2式得：[Pi+2]补={[Pi]补+（Yn-i+1+Yn-I-2Yn-i-1)[X]补}2-2根据三位的组合得表3.5，进行补码两位乘。第三章运算方法和运算器定点补码两位乘34表3.5组合值Yn-i-1、Yn-i、Yn-i+1与［Pi+2］补的关系Yn-i-1Yn-iYn-i+1组合值［Pi+2］补0000｛［Pi］补+0｝×2-20011｛［Pi］补+［X］补｝×2-20101｛［Pi］补+［X］补｝×2-20112｛［Pi］补+2［X］补｝×2-2100-2｛［Pi］补+2［-X］补｝×2-2101-1｛［Pi］补+［-X］补｝×2-2110-1｛［Pi］补+［-X］补｝×2-21110｛［Pi］补+0｝×2-2表3.5组合值Yn-i-1、Yn-i、Yn-i+1与［Pi35硬件实现乘法-----阵列乘法器

硬件实现乘法-----阵列乘法器36第三章运算方法和运算器第四节二进制除法运算定点原码一位除法（手工实现除法与计算机实现除法的区别：够减不够减问题，是商0还是商1问题；被除数或余数的低位补进问题；商的位置问题；符号问题；商与被除数或余数的低位的存放问题。）恢复余数法：（P83例子）第三章运算方法和运算器第四节二进制除法运算37第三章运算方法和运算器不恢复余数法：在恢复余数法的除法中，第I-1次求商的余数为Ri-1,第I次求商的余数为Ri,则：Ri=2Ri-1-Y当余数〈0时，商0，同时余数+Y，左移一位（乘2）再减Y得Ri+1,既Ri+1=2（Ri+Y)-Y=2Ri+Y既余数小于0时+Y，余数大于0时-Y。第三章运算方法和运算器不恢复余数法：38计算机组成与结构课件39第三章运算方法和运算器第五节浮点数的运算方法浮点数的加减运算（对阶、尾数相加减、规格化、舍入、溢出检查）浮点数的乘除运算（阶码的加减运算、尾数的乘除运算、规格化、舍入、溢出判断）第三章运算方法和运算器第五节浮点数的运算方法40规格化规则规格化操作的规则是：①如果结果的两个符号位的值不同，表示加/减运算尾数结果溢出，此时将尾数结果右移1位，阶码E+1，称为“向右规格化”，简称“右规”。②如果结果的两个符号位的值相同，表示加/减运算尾数结果不溢出。但若最高数值位与符号位相同，此时尾数连续左移，直到最高数值位与符号位的值不同为止；同时从E中减去移位的位数，这称之为“向左规格化”，简称“左规”。规格化规则规格化操作的规则是：41浮点运算举例例3.45两浮点数相加，求X+Y。已知：X=2010*0.11011011,Y=2100*(-0.10101100)解：计算过程：①对阶操作阶差ΔE=［EX］补+［-EY］补=00010+11100=11110X阶码小，MX右移2位，保留阶码E=00100。［MX］补=000011011011下划线上的数是右移出去而保留的附加位。②尾数相加［MX］补+［MY］补=000011011011+1101010100=111000101011浮点运算举例例3.45两浮点数相加，求X+Y。42浮点运算举例③规格化操作左规，移1位，结果=110001010110;阶码-1，E=00011。④舍入附加位最高位为1，在所得结果的最低位+1，得新结果：［M］补=1100010110,M=-0.11101010。⑤判溢出阶码符号位为00，故不溢出，最终结果为：X+Y=2011·(-0.11101010)浮点运算举例③规格化操作43计算机组成与结构课件44第三章运算方法和运算器第六节数据校验奇偶校验奇校验：当数据位1的个数为偶数时，校验位为1，当数据位1的个数为奇数时，校验位为0。偶校验：当数据位1的个数为偶数时，校验位为0，当数据位1的个数为奇数时，校验位为1。（包括交叉校验,P96图3.10）第三章运算方法和运算器第六节数据校验45计算机组成与结构课件46第三章运算方法和运算器第六节数据校验（海明校验P99图3.11）原理：在被校验的数据中加入几个校验位，当某一位出错时，可同时在几个校验位上体现出来，这不但可以发现错误还可以指出哪一位出错，为纠正错误提供了依据。设校验位的个数为r，则它有2r种编码，除一种编码代表无错外，其余2r-1种编码可以代表错误发生在哪一位，再去掉r种校验位可能出错，剩下的k=2r-r-1种编码可以代表数据位出错。第三章运算方法和运算器第六节数据校验（海明校验P947第三章运算方法和运算器第六节数据校验（海明校验P99图3.11）发现两位错，并能纠正一位错须满足如下关系：2r-1>=k+r海明码编码规律：1)校验位放在2i-1的位置上，数据位依次从低到高排列。2)海明码的每一位Hi由多个校验位校验，被校验的每一位的位号要等于校验它的校验位的位号之和。例如：8个数据位，5个校验位的海明码：H13H12H11•••H3H2H1第三章运算方法和运算器第六节数据校验（海明校验P948表3.8数据位k与校验位r的对应关系

k值最小的r值1~445~11512~26627~57758~1208表3.8数据位k与校验位r的对应关系

k值最小的49海明编码规律若海明码的最高位号为m，最低位号为1，即HmHm-1…H2H1，则此海明码的编码规律通常是：(1)校验位与数据位之和为m，每个校验位Pi在海明码中被分在位号2i-1的位置，其余各位为数据位，并按从低向高逐位依次排列的关系分配各数据位。(2)海明码的每一位码Hi(包括数据位和校验位本身)由多个校验位校验，其关系是被校验的每一位位号要等于校验它的各校验位的位号之和。这样安排的目的，是希望校验的结果能正确反映出出错位的位号。海明编码规律若海明码的最高位号为m，最低位号为1，即HmHm50每个字节由8个二进制位组成，此处的k为8，按式(3.19)求出校验位的位数r应为5，故海明码的总位数为13，可表示为H13H12H11…H3H2H1

5个校验位P5~P1对应的海明码位号应分别为H13，H8，H4，H2和H1。P5只能放在H13一位上，它已经是海明码的最高位了，其他4位满足Pi的位号等于2i-1的关系。其余为数据位Di，则有如下排列关系：P5D8D7D6D5P4D4D3D2P3D1P2P1

按前面讲的，每个海明码的位号，要等于参与校验它的几个校验位的位号之和的关系，可以给出如表3.9所示的结果。每个字节由8个二进制位组成，此处的k为8，按式(3.19)求51表3.9出错的海明码位号和校验位位号的关系海明码位号数据位/校验位参与校验的校验位位号被校验位的海明码位号=校验位位号之和H1P111=1H2P222=2H3D11，23=1+2H4P344=4H5D21，45=1+4H6D32，46=2+4H7D41，2，47=1+2+4H8P488=8H9D51，89=1+8H10D62，810=2+8H11D71，2，811=1+2+8H12D84，812=4+8H13P51313=13表3.9出错的海明码位号和校验位位号的关系海明码位号数据位52第三章运算方法和运算器H=P5D8D7D6D5P4D4D3D2P3D1P2P1P5D8D7D6D5P4D4D3D2P3D1P2P1H13H12H11H10H9H8H7H6H5H4H3H2H1S51111111111111S40111110000000S30100001111000S20011001100110S10010101010101

第三章运算方法和运算器H=P5D8D7D6D5P4D4D53计算机组成与结构课件54计算机组成与结构课件55第三章运算方法和运算器循环冗余校验（CRC）:设被校验的数据信息代码M(X)是n位的二进制信息，将M(X)左移K位后被一个约定的生成多项式G(x)相除，生成多项式是K+1位的二进制数，相除后得到K位余数就是校验位。校验位拼接到原信息位的后面形成N+K位的循环冗余校验码——CRC码。CRC码能够被生成多项式整除，所以当校验信息位是否出错时，只需将CRC码用多项式相除，如果正好除尽，表明无信息出错，当不能除尽时，说明信息位出错。第三章运算方法和运算器循环冗余校验（CRC）:设被校验的56第三章运算方法和运算器校验位的计算——模2运算：模2加：0+0=0，0+1=1，1+1=0，1+0=1，模2减：0-0=0，0-1=1，1-0=1，1-1=0模2除：商的原则是当部分余数的首位是1时，商1，反之商0，然后按模2减求的余数，这个余数不记最高位。例：M(X)=1101,生成多项式G(x)=X3+X0=1001,求CRC=？解：因生成多项式是4位=K+1，所以K=3，将M(x)左移3位，成为1101000，除以生成多项式1001，得校验位100。第三章运算方法和运算器校验位的计算——模2运算：57第三章运算方法和运算器CRC校验：

1100100111010001001100010010010000001000000100——校验位CRC码=1101100第三章运算方法和运算器CRC校验：58CRC的译码与纠错

将收到的循环校验码用约定的生成多项式G(x)去除，如果码字无误则余数应为0，如有某一位出错，则余数不为0，不同位数出错余数不同。更换不同的待测码字可以证明：余数与出错位的对应关系是不变的，只与码制和生成多项式有关。因此表3.10给出的关系可作为(7，4)码的判别依据。对于其他码制或选用其他生成多项式，出错模式将发生变化。CRC的译码与纠错

将收到的循环校验码用约定的生成多项式G(59表3.10(7，4)循环码的出错模式(生成多项式G(x)=1011)A1A2A3A4A5A6A7余数出错位正确1100010000无错误11000110017110000001061100110100511010100114111001011031000010111201000101011表3.10(7，4)循环码的出错模式(生成多项式G(x)=60关于生成多项式并不是任何一个(r+1)位多项式都可以作为生成多项式的。从检错及纠错的要求出发，生成多项式应能满足下列要求：(1)任何一位发生错误都应使余数不为0。(2)不同位发生错误应当使余数不同。(3)对余数继续作模2除，应使余数循环。将这些要求反映为数学关系是比较复杂的，对一个(n,k)码来说，可将(xn-1)分解为若干质因子(注意是模2运算)，根据编码所要求的码距选取其中的因式或若干因式的乘积作为生成多项式。关于生成多项式并不是任何一个(r+1)位多项式都可以61表3.11生成多项式

nk码距dG(x)多项式G(x)二进制码743G1(x)=(x3+x+1)或(x3+x2+1)1011110134G2(x)=(x3+x+1)(x+1)或(x3+x2+1)(x+1)11101101111511735(x4+x+1)(x4+x+1)(x4+x3+x2+x+1)1001111101000131262135(x5+x2+1)(x5+x2+1)(x5+x4+x3+x2+1)1001011110110100163575135(x4+x+1)(x4+x+1)(x6+x4+x+1)1000011101000011010110411024(x16+x15+x2+1)11000000000000101表3.11生成多项式

nk码距dG(x)多项式G(x)二62习题3.27设某运算器只由一个加法器和A，B两个D型边沿寄存器组成，A，B均可接收加法器输出，A还可接收外部数据，如图。问：(1)外部数据如何才能传送到B?(2)如何实现A+B→A和A+B→B?(3)如何估算加法执行时间?(4)若A，B均为锁存器，实现A+B→A和A+B→B有何问题?习题3.27设某运算器只由一个加法器和A，B两个D型边沿寄63计算机组成与结构课件64习题3.28今有一串行加法器，计算两个n位数据之和，已知相加两数存放在A，B寄存器中，请画出能实现(A)+(B)→A的逻辑图。图中只准用一个一位加法器，逐位进行计算。3.29如果采用偶校验，下述两个数据的校验位的值是什么?(1)0101010(2)00110113.30设有16个信息位，如果采用海明校验，至少需要设置多少个校验位?应放在哪些位置上?3.31设有8位有效信息，试为之编制海明校验线路。说明编码方法，并分析所选方案具有怎样的检错与纠错能力。若8位信息为01101101，海明码是何值?习题3.28今有一串行加法器，计算两个n位数据之和，已知相65习题设有6位有效信息，试为之编制海明校验线路。说明编码方法，并分析所选方案具有怎样的检错与纠错能力。习题设有6位有效信息，试为之编制海明校验线路。说明编码方法，66第4章主存储器4.1主存储器处于全机中心地位4.2主存储器分类4.3主存储器的主要技术指标4.4主存储器的基本操作4.5读/写存储器(即随机存储器(RAM))第4章主存储器4.1主存储器处于全机中心地位67第4章主存储器4.6非易失性半导体存储器4.7DRAM的研制与开发4.8半导体存储器的组成与控制4.9多体交叉存储器习题第4章主存储器4.6非易失性半导体存储器68主存储器处于全机中心地位(1)当前计算机正在执行的程序和数据均存放在存储器中。CPU直接从存储器取指令或存取数据。(2)计算机系统中输入输出设备数量增多，数据传送速度加快，因此采用了直接存储器存取(DMA)技术和输入输出通道技术，在存储器与输入输出系统之间直接传送数据。主存储器处于全机中心地位(1)当前计算机正在执行的程序和数69主存储器处于全机中心地位(3)共享存储器的多处理机的出现，利用存储器存放共享数据，并实现处理机之间的通信，更加强了存储器作为全机中心的作用。主存储器处于全机中心地位(3)共享存储器的多处理机的出现，70第四章主存储器第一节主存储器在PC机中处的位置（以主存储器为中心、以CPU为中心、单总线结构）··········I/O设备1I/O设备nCPU主存储器••••第四章主存储器第一节主存储器在PC机中处的位置（以主71第四章主存储器第一节主存储器在PC机中处的位置（以主存储器为中心、以CPU为中心、单总线结构）I/O设备1I/O设备n主存储器CPU••••第四章主存储器第一节主存储器在PC机中处的位置（以主72第四章主存储器第一节主存储器在PC机中处的位置（以主存储器为中心、以CPU为中心、单总线结构）CPU主存储器磁盘打印机显示器单总线第四章主存储器第一节主存储器在PC机中处的位置（以主73第四章主存储器第二节主存储器的分类（按存储介质分为：半导体存储器、磁存储器、光存储器。按存取方式分为：随机存取存储器RAM、只读存储器ROM、顺序存取存储器SAM、直接存取存储器DAM。按信息的可保护性分类分为易失性（静态和动态RAM）和非易失性（ROM）。按所处的位置分为Cache、主存、辅存）随机存储器(randomaccessmemory，简称RAM)；ROM；PROM；EPROM；E2PROM。存储器的性能指标：存储容量、存取时间（存取周期）、价格。第四章主存储器第二节主存储器的分类（按存储介质分为：74第四章主存储器PC机的存储体系结构。（Cache—主存层次、主存—辅存层次）主存辅存辅助软硬设备CPUCACHE主存辅助硬件CPU第四章主存储器PC机的存储体系结构。（Cache—主存层75计算机组成与结构课件76第四章主存储器主存储器的基本操作：取指、读、写。（P107图4.1主存储器与CPU的联系）字选择线位线2位线1T4T3T6T2T1T5VSSVDDVGG•••静态存储单元工作原理第四章主存储器主存储器的基本操作：取指、读、写。字选择线77计算机组成与结构课件78计算机组成与结构课件79计算机组成与结构课件80计算机组成与结构课件81计算机组成与结构课件82第四章主存储器动态RAM的工作原理读出数据线写入选择线读出选择线写入数据线CT3T1T2读出时，读出数据线预充致高电位，然后读出选择线来高电位，使T3导通，若C上有电荷，则T2导通，读出数据线通过T2，T3接地，读出电压位地。若C上无电荷，则T2不导通，读出数据线的电压无变化。写入时，在写入数据线上加写入信号，在写入选择线上加高电位，则T1导通，C随写入信号而充电或放电。若T1截止，则C的电压保持不变。第四章主存储器动态RAM的工作原理读出数据线写入选择线读83第四章主存储器动态存储器单管存储单元工作原理•数据线（位线）字线CDCSVDDT第四章主存储器动态存储器单管存储单元工作原理•数据线（位84计算机组成与结构课件85计算机组成与结构课件86DRAM与SRAM的比较

DRAM有很多优点。首先，由于它使用简单的单管单元作为存储单元，因此，每片存储容量较大，约是SRAM的4倍；由于DRAM的地址是分批进入的，所以它的引脚数比SRAM要少很多，它的封装尺寸也可以比较小。这些特点使得在同一块电路板上，使用DRAM的存储容量要比用SRAM大4倍以上。其次，DRAM的价格比较便宜，大约只有SRAM的1/4。第三，由于使用动态元件，DRAM所需功率大约只有SRAM的1/6。DRAM与SRAM的比较

DRAM有很多优点。首先，由于它使87DRAM与SRAM的比较DRAM存在不少缺点。首先，也是由于使用动态元件，它的速度比SRAM要低。其次，DRAM需要再生，这不仅浪费了宝贵的时间，还需要有配套的再生电路，它也要用去一部分功率。SRAM一般用作容量不大的高速存储器。DRAM与SRAM的比较DRAM存在不少缺点。首先，也是由于88快擦除读写存储器(FlashMemory)

FlashMemory是在EPROM与E2PROM基础上发展起来的，它与EPROM一样，用单管来存储一位信息，它与E2PROM相同之处是用电来擦除。但是它只能擦除整个区或整个器件。快擦除读写存储器兼有ROM和RAM两者的性能，又有ROM，DRAM一样的高密度。目前价格已略低于DRAM，芯片容量已接近于DRAM，是唯一具有大存储量、非易失性、低价格、可在线改写和高速度(读)等特性的存储器。它是近年来发展很快很有前途的存储器。快擦除读写存储器(FlashMemory)

FlashM89表4.1列出几种存储器的主要应用

存储器应用SRAMcacheDRAM计算机主存储器ROM固定程序，微程序控制存储器PROM用户自编程序。用于工业控制机或电器中EPROM用户编写并可修改程序或产品试制阶段试编程序E2PROMIC卡上存储信息FlashMemory固态盘，IC卡表4.1列出几种存储器的主要应用

存储器应用SR90第四章主存储器第八节半导体存储器的组成与控制存储器的构成（位扩展、字扩展、字位扩展）位扩展例如：16K*4的芯片构成16K*8的存储器。（P120图4.18）地址线：14根A0-A13，数据线8位，每块芯片4位，控制线：只画出2根，片选和读写线。字扩展例如：16K*8的芯片构成64K*8的存储器。（P120图4.19）地址线：每块芯片需地址14根，覆盖16K的存储空间。共4组，所以还需要2根地址用于选择不同的芯片，共需16根地址。数据线8位，连到每一块芯片，控制线一根，读写控制。第四章主存储器第八节半导体存储器的组成与控制91计算机组成与结构课件92计算机组成与结构课件93计算机组成与结构课件94第四章主存储器字位扩展例如：用1K*4的芯片构成4K*8的存储器（P121图4.20）。地址线：每块芯片容量1K，所以需地址线10根，整个存储器分成4组，所以译码信号需2根，共需地址线12根。数据线：每块芯片数据位4位，每组两块芯片构成存储单元的8位。控制线：读写控制线和内存请求（其中内存请求用于译码器的控制端）。第四章主存储器字位扩展例如：用1K*4的芯片构成95刷新通常有两种刷新方式。(1)集中刷新集中式刷新指在一个刷新周期内，利用一段固定的时间，依次对存储器的所有行逐一再生，在此期间停止对存储器的读和写。例如，一个存储器有1024行，系统工作周期为200ns。RAM刷新周期为2ms。这样，在每个刷新周期内共有10000个工作周期，其中用于再生的为1024个工作周期，用于读和写的为8976个工作周期。集中刷新的缺点是在刷新期间不能访问存储器，有时会影响计算机系统的正确工作。刷新通常有两种刷新方式。96刷新(2)分布式刷新采取在2ms时间内分散地将1024行刷新一遍的方法，具体做法是将刷新周期除以行数，得到两次刷新操作之间的时间间隔t，利用逻辑电路每隔时间t产生一次刷新请求。动态MOS存储器的刷新要有硬件电路的支持，包括刷新计数器、刷新访存裁决，刷新控制逻辑等。这些线路可以集中在RAM存储控制器芯片中。例如Intel8203DRAM控制器是为了控制2117，2118和2164DRAM芯片而设计的。2117，2118是16K×1位的DRAM芯片，2164是64K×1位的DRAM芯片。图4.21是Intel8203逻辑框图。刷新(2)分布式刷新97计算机组成与结构课件98存储校验线路计算机在运行过程中，主存储器要和CPU、各种外围设备频繁地高速交换数据。由于结构、工艺和元件质量等种种原因，数据在存储过程中有可能出错，所以，一般在主存储器中设置差错校验线路。实现差错检测和差错校正的代价是信息冗余。信息代码在写入主存时，按一定规则附加若干位，称为校验位。在读出时，可根据校验位与信息位的对应关系，对读出代码进行校验，以确定是否出现差错，或可纠正错误代码。存储校验线路计算机在运行过程中，主存储器要和CPU、各种外围994.9多体交叉存储器

4.9.1编址方式

计算机中大容量的主存，可由多个存储体组成，每个体都具有自己的读写线路、地址寄存器和数据寄存器，称为“存储模块”。这种多模块存储器可以实现重叠与交叉存取。如果在M个模块上交叉编址(M=2m)，则称为模M交叉编址。通常采用的编址方式如图4.22(a)所示。设存储器包括M个模块，每个模块的容量为L，各存储模块进行低位交叉编址，连续的地址分布在相邻的模块中。第i个模块Mi的地址编号应按下式给出：Mj+i其中，j=0,1,2,…,L-1；i=0,1,2,…,M-14.9多体交叉存储器

4.9.1编址方式

计算机中100计算机组成与结构课件101表4.2地址的模四交叉编址

模体地址编址序列对应二进制地址最低二位M00,4,8,12,…,4j+0,…00M11,5,9,13,…,4j+1,…01M22,6,10,14,…,4j+2,…10M33,7,11,15,…,4j+3,…11表4.2地址的模四交叉编址

模体地址编址序列对应二进制地102第六章中央处理部件CPU指令执行工作过程：寄存器BX地址寄存器AR控制信号发生器指令译码器ID指令寄存器IR数据寄存器DR运算器程序计数器PC寄存器AX内存•••••••第六章中央处理部件CPU指令执行工作过程：寄存器BX地址103计算机组成与结构课件104计算机组成与结构课件105第六章中央处理部件CPUIntel80386的管脚连线（165图6.2）D0-D31：32位双向数据线。A0-A31：单向32位地址总线，在CPU内部，A0-A1转换为BE0#--BE3#，以确定所读范围：读一个字：A31--A2有效，同时BE0#--BE3#有效。读半个字：A31--A2有效，BE0#，BE1#有效，读低半字。A31--A2有效，BE2#，BE3#有效，读高半字。读字节：A31--A2有效，BE0#有效，读最低字节。以此类推。第六章中央处理部件CPUIntel80386的管脚连线（106第六章中央处理部件CPUW/R#，D/C#，M/IO#，LOCK#：总线周期定义信号W/R#D/C#M/IO#读周期011写周期111读指001IO读010IO写110第六章中央处理部件CPUW/R#，D/C#，M/IO#，107第六章中央处理部件CPUADS#，NA#，BS16#，READY#：总线控制信号ADS#：地址状态信号，输出低有效。NA#：输入低有效，当一个总线周期没有完成时，可以通知CPU开始下一个总线周期的操作。（地址和控制信号的输出）BS16#：输入低有效，表示被访问的存储器或IO是16位的数据宽度。即386即可以进行32位也可以进行16数据操作。READY#：输入低有效，表示存储器或IO已经完成CPU要求的操作，或达到CPU要求的状态进行下面的工作。第六章中央处理部件CPUADS#，NA#，BS16#，R108第六章中央处理部件CPUHOLD，HLDA总线仲裁信号：主设备、从设备的概念，当从设备要求使用总线进行数据传送时，必须向主设备提出请求即HOLD，主设备同意请求时，发出回答信号即HLDA。INTR,NMI可屏蔽中断和不可屏蔽中断信号PEREQ，BUSY#，ERROR协处理器接口信号：PEREQ：协处理器请求信号，要求CPU传送一个数据到FPU。BUSY#：协处理器忙信号。ERROR：协处理器出错信号。第六章中央处理部件CPUHOLD，HLDA总线仲裁109第六章中央处理部件CPU第二节控制器的组成控制器具有控制协调程序的执行，它具有的功能：取指、分析指令、执行指令、控制程序的输入、数据的输入、结果的输出、对异常情况和特殊要求的处理。控制器的组成：程序计数器PC，指令寄存器IR，指令译码器ID，脉冲源及启停电路，时序控制信号形成部件。（P169图6.3）第六章中央处理部件CPU第二节控制器的组成110计算机组成与结构课件111第六章中央处理部件CPU第二节控制器的组成-----指令执行过程指令格式：指令：ADDAX，disp[bx]执行过程：分为4个机器周期：取指、计算地址、取数、相加。(P170图6.6，6.7)MOVAX，DISP[BX]JMPSTARTJCLOOP2操作码Rs,rdImm(或disp)Rs1第六章中央处理部件CPU第二节控制器的组成----112计算机组成与结构课件113计算机组成与结构课件114计算机组成与结构课件115计算机组成与结构课件116第六章中央处理部件CPU第二节控制器的组成取指机器周期所用控制信号：PCAB,W/R#=0,M/IO#=1,DBIR,PC+1计算地址机器周期所用控制信号：rs1GR,(rs1)ALU,dispALU,“+”,ALUAR存储器取数机器周期所用控制信号：ARAB，W/R#=0，M/IO#=1，DBDR相加机器周期所用控制信号：rsGR,(rs)ALU,DRALU,“+”,rdGR,ALUrd,置状态标志N，Z，V，C。第六章中央处理部件CPU第二节控制器的组成117计算机组成与结构课件118第六章中央处理部件CPU第二节控制器的组成指令举例：ADDAX，BX它由两个机器周期构成：取指、相加。取指机器周期所用控制信号：

PCAB,W/R#=0,M/IO#=1,DBIR,PC+1相加机器周期所用控制信号：rsGR,(rs)ALU,rs1GR,(rs1)ALU,“+”,rdGR,ALUrd,置状态标志N，Z，V，C。

操作码Rs,rd（空）Rs1第六章中央处理部件CPU第二节控制器的组成操作码119第六章中央处理部件CPU第二节控制器的组成已知有如下指令，指出它们是由几个机器周期构成的：MOVAX，0066HMOVDISP[BX]，AXMOVAX，DISP[BX]JMPSTARTJCLOOP2第六章中央处理部件CPU第二节控制器的组成120第六章中央处理部件CPU第三节微程序控制计算机的工作原理名词介绍：微操作；微指令；微程序；控制存储器。表6.1的控制信号及图6.8。取指计算地址1002取数1003加法运算1000减法运算1000取数1006计算地址1005计算地址10001000100110021003微程序流程图第六章中央处理部件CPU第三节微程序控制计算机的工作121第六章中央处理部件CPU微程序控制器框图控制存储器指令译码地址码操作码下址控制字段IR形成本条指令的微程序入口CMμIR第六章中央处理部件CPU微程序控制器框图控制存储器指令译122第六章中央处理部件CPU时序信号及工作脉冲T2CLK2CLKCLKCP-T1T1CLK2CPCP1CLK2•CLKCLK2•CLK•T2CLK2•CLK•T1第六章中央处理部件CPU时序信号及工作脉冲T2CLK2C123第六章中央处理部件CPU第四节微程序设计技术微程序设计技术关心3个问题：如何缩短微指令的长度？如何减少微程序长度？如何提高微程序的执行速度？微指令编译法：直接控制法；字段直接编译法；字段间接编译法；常数字段；其它。微程序流的控制：1.以增量方式产生后继微地址2.增量和下址相结合产生后继微地址（P186，187图6.23,6.24）3.多路转移方式AM2910芯片介绍P189，190图625,6.26）4.微中断。第六章中央处理部件CPU第四节微程序设计技术124计算机组成与结构课件125计算机组成与结构课件126计算机组成与结构课件127计算机组成与结构课件128计算机组成与结构课件129计算机组成与结构课件130计算机组成与结构课件131计算机组成与结构课件132组合逻辑设计计算机设计原理组合逻辑设计计算机设计原理133硬布线实指令执行指令时序和节拍指令执行所需的控制信号微程序实指令执行指令时序和节拍指令执行所需的控制信号指令执行的两种模式指令时序和节拍指令执行所需的控制信号指令时序和节拍指令执134硬布线实现指令的执行时序与节拍：一条指令的实现可分成取指、计算地址、取数及执行等几个步骤。在微程序控制方式中，每一步由一条微指令实现，而在这里则由指令的操作码直接控制并产生实现上述各步骤所需的控制信号。在大部分情况下，每一步由一个机器周期实现，如何区分一条指令的四个机器周期呢?可以考虑用两位计数器的译码输出来表示当前所处的机器周期。硬布线实现指令的执行时序与节拍：一条指令的实现可分成取指、计135图6.31用计数器译码器形成机器周期信号计算机组成与结构课件136然而由于每条指令的功能不同，所以所需的机器周期数可能就不相同，因此某些指令可能缺少某个周期(例如转移指令)，而有些复杂指令的某个周期则需要延长(例如乘法指令的执行周期)，例如，执行A指令时需要四个机器周期，因此计数器的变化规律是00→01→10→11；而执行B指令时仅需要三个机器周期(例如不用计算地址)，则计数器的变化规律为00→10→11，据此可列出真值表(表6.3)。然而由于每条指令的功能不同，所以所需的机器周期数可能就不相同137表6.3计数器状态变化A指令B指令cyAcyBcyA′cyB′cyAcyBcyA′cyB′0001001001101011101111001100表6.3计数器状态变化A指令B指令cyAcyBcyA′c138表中cyA，cyB表示当前周期的计数器状态，cyA′，cyB′表示下一周期计数器状态。根据真值表列出表达式，对于A指令，其表达式为 cyA′＝cyAcyB+cyAcyB； cyB′＝cyAcyB+cyAcyB＝cyB。对于B指令，其表达式为 cyA′＝cyAcyB+cyAcyB＝cyB； cyB′＝cyAcyB。根据表达式得出逻辑图表中cyA，cyB表示当前周期的计数器状态，cyA′，cyB139图6.32时序计数器逻辑图计算机组成与结构课件140图6.32为仅有两条指令的逻辑图，实际机器有几十条～几百条指令，根据指令功能列出每条指令的机器周期变化规律，最后归纳出几种情况，将情况相同的指令归为一类，然后列出表达式，画出逻辑图。图6.32为仅有两条指令的逻辑图，实际机器有几十条～几百条指1416.5.2操作控制信号的产生1.操作码译码器指令由操作码与地址码两部分组成，其中操作码表示当前正在执行的是什么指令。各条指令所需实现的操作随指令而异。假如操作码有7位，则最多可表示128条指令，一般在机器内设置一个指令译码器，其输入为操作码(7位)，输出有128根线，在任何时候，有且仅有一根线为高电位，其余均为低电位(或反之，即一根线为低电位，其余为高电位)，每根输出线表示一条指令，因此译码器的输出可以反映出当前正在执行的指令。6.5.2操作控制信号的产生142由译码器的输出和机器周期状态cy1～cy4作为输入，使用逻辑电路产生操作控制信号，其框图如图6.33所示。实际上为了简化逻辑，译码器与组合逻辑是结合在一起设计的。由译码器的输出和机器周期状态cy1～cy4作为输入，使用逻辑143图6.33形成操作控制信号的逻辑框图计算机组成与结构课件1442.操作控制信号的产生这里我们主要讨论图6.33中的“组合逻辑电路”究竟是由什么组成的。仍以加法指令为例，如前所述，假设一条加法指令的功能是由四个机器周期cy1～cy4完成的，分别为取指、计算有效地址、取操作数、进行加法运算并送结果。机器逻辑图仍如图6.8所示，所以完成一条指令的操作所需的操作信号仍如前所示。参考图6.7的波形图，在取指周期要完成从存储器取出指令送指令寄存器以及将指令计数器加1，为取下一条指令作好准备。2.操作控制信号的产生145为访问存储器，需要将地址送往地址总线(PC→AB)，并发出启动存储器所需的信号ADS、M/IO及W/R，然后将取得的指令送往指令寄存器(DB→IR)。用逻辑式表示之 PC→AB＝加法指令·cy1 (6.6) ADS＝加法指令·cy1·T1 (6.7) M/IO＝加法指令·cy1 (6.8) W/R＝加法指令·cy1 (6.9) DB→IR＝加法指令·cy1 (6.10) PC+1＝加法指令·cy1 (6.11)为访问存储器，需要将地址送往地址总线(PC→AB)，并发出启146公式6.6～6.11存在一个问题，即在取指周期，当前这条指令尚未取出，在IR中保留的还是上一条指令内容，因此不可能用它来产生控制本条指令所需的信号，所以在取指周期只允许安排与指令类型无关的操作，因此应将这些公式中的“加法指令”取消，于是将式(6.6)改写为： PC→AB＝cy1 (6.12)6.7～6.11应同样修改，不再一一列出。公式6.6～6.11存在一个问题，即在取指周期，当前这条指令147同样，在计算地址周期cy2完成有效地址的计算((rs1)+Disp)，为此要将rs1的内容取出与IR中的位移量一起送ALU，发出rs1→GR(送通用寄存器地址)，(rs1)→ALU，Disp→ALU以及“+”命令，最后将运算结果送地址总线，发出ALU→AR信号。列出逻辑表达式 rs1→GR＝加法指令·cy2 (6.13) (rs1)→ALU＝加法指令·cy2 (6.14) … ALU→AR＝加法指令·cy2 (6.15)同样，在计算地址周期cy2完成有效地址的计算((rs1)+D148式(6.13)～式(6.15)的右边全部相同。逻辑图6.34只考虑了加法指令计算有效地址时的一种情况。然后按同样方法列出后面两个机器周期所需产生的控制信号的逻辑表达式。对每一条指令都进行同样的分析，得出逻辑表达式。对所有指令的全部表达式进行综合分析后可得出下述结论：(1)取指周期cy1所产生的信号，对所有指令都是相同的，即与当前执行的指令无关，逻辑式得到最简单的形式。式(6.13)～式(6.15)的右边全部相同。逻辑图6.34149图6.34实现rs1→GR，(rs1)→ALU的逻辑图计算机组成与结构课件150(2)通常，同一个控制信号在若干条指令的某些周期(或再加上一些条件)中都需要，为此需要把它们组合起来。例如，“+”命令在加法指令的cy2(计算有效地址)与cy4(操作数相加)时需要；在减法指令的cy2(计算有效地址)时需要；在转移指令的cy2(计算转移地址)时需要；……。用逻辑式表示如下： “+”＝加法指令(cy2+cy4)+减法指令·cy2+转移指令·cy2+…＝加法指令·cy2+加法指令·cy4+减法指令·cy2+转移指令·cy2+… (6.16)(2)通常，同一个控制信号在若干条指令的某些周期(或再加上151上式中的加法指令、减法指令等信号通常由操作码译码器输出，译码器实际上是由各操作码的二进制代码作为输入的一组“与门”。设某机有7位操作码(OP0～OP6)，已知加法指令的操作码为0001100，则形成加法指令信号的逻辑表达式为：加法指令＝OP0·OP1·OP2·OP3·OP4·OP5·OP6。 (6.17)从式(6.16)可以看出，利用两级门电路(第一级为与门，第二级为或门)可产生“+”命令，但有时受逻辑门输入端限制将修改逻辑式，此时就可能要增加逻辑电路。假如，信号所经过的级数也增加的话，还将增加延迟时间。上式中的加法指令、减法指令等信号通常由操作码译码器输出，译码152另外在实现时还有负载问题。(3)同种类型的指令所需的控制信号大部分是相同的，仅有少量区别。整个算术逻辑运算指令仅ALU的操作命令以及是否置状态位(N，Z，V，C)上有差别。不同类型的指令，其控制信号的差别就比较大。另外在实现时还有负载问题。153(4)在确定指令的操作码时(即对具体指令赋于二进制操作码)，为了便于逻辑表达式的化简以减少逻辑电路数量，往往给予特别关注。例如，某机有128条指令，7位操作码(OP0～OP6)，其中有十六条算术逻辑运算指令，那么可以令这些指令的三位操作码完全相等(例如OP0～OP2为001)，而OP3～OP6分别表示16条指令，设命令A是所有算术逻辑指令在cy2周期中都需产生的，则： A＝加法指令·cy2+减法指令·cy2+逻辑加指令·cy2+…＝(加法指令+减法指令+逻辑加指令+…)cy2＝OP0·OP1·OP2·cy2(4)在确定指令的操作码时(即对具体指令赋于二进制操作码)154从16项简化成1项，用一个与门即可实现。表6.4是Sun4工作站CPU(SPARC)部分指令的操作码。该机器的操作码有8位，表中仅列出7位操作码，对于表内所列指令，另一位操作码均为1，因此没有标出。从16项简化成1项，用一个与门即可实现。155第一讲流水线处理机的设计及问题的解决流水线的基本概念预约表和状态图流水线的调度策略流水线的数据相关流水线的转移相关和结构相关第一讲流水线处理机的设计及问题的解决流水线的基本概念156流水线的基本概念流水线（pipeline)是一种能够使多条指令重叠操作的处理机的实现技术。流水线处理机把一条指令的执行分成几个步骤（stages)（级）,每一级在一个时钟周期内完成，如果流水线有M级，那么可重叠执行的指令条数为M条，每条指令处在指令的不同执行阶段。流水线的基本概念流水线（pipeline)是一种能够使多条指157流水线的基本概念流水线的吞吐率：理想的情况每个时钟周期发射一条指令上流水线，每个周期有一条指令的结果从流水线流出，流水线的频率为时钟周期的倒数f=1/T，那么f即为流水线的最大吞吐率。流水线的最佳段数：大多数流水线是在功能级上分段的，段数的范围2<k<15,实际的计算机中极少有流水线设计成超过10段的。最佳段数K=((t*c)/(d*h))1/2,其中t：程序执行时间，c：所有逻辑段的价格，d：锁存器的延时，h：每个锁存器的价格。（引自P214黄凯书）流水线的基本概念流水线的吞吐率：理想的情况每个时钟周期发射一158流水线的分类和预约表流水线一般分为线性流水线（静态）和非线性流水线（动态），线性流水线实现确定的功能，而非线性流水线可以在不同的时间重新组合实现不同的功能。线性流水线：s1s2s3输入输出流水线的分类和预约表流水线一般分为线性流水线（静态）和非线性159流水线的分类和预约表非线性流水线：S1S2S3输入输出Y输出X流水线的分类和预约表非线性流水线：S1S2S3输入输出Y输出160流水线的分类和预约表X功能预约表：S1S2S312345678Y功能预约表：S1S2S3123456流水线的分类和预约表X功能预约表：S1S2S31161流水线的分类和预约表等待时间：流水线两次启动之间的时间单位称为等待时间。等待时间设计的不合理，将会造成资源冲突。X功能的执行时间为8T，如等待时间设计成超过8T，自然不会造成冲突，当启动时间小于8T时，对S1段禁止等待时间为5，7；对S2段禁止等待时间为2；对S3段禁止等待时间为2，4；所以，X功能禁止等待时间为：7、5、4、2，X功能允许等待时间为1、3、6。流水线的分类和预约表等待时间：流水线两次启动之间的时间单位称162流水线的调度策略设一条指令在流水线上执行由四个功能段完成：取指、译码、执行、回写。理想标量处理机执行情况：取指译码执行回写时间（周期）流水线的调度策略设一条指令在流水线上执行由四个功能段完成：取163流水线调度策略超标量处理机：（M=3的超标量计算机）时间（周期）流水线调度策略超标量处理机：（M=3的超标量计算机）时间（164流水线的调度策略超流水计算机：（M=3的超流水计算机）流水线的调度策略超流水计算机：（M=3的超流水计算机）165流水线的调度策略超长指令字计算机（M=3的VLIW计算机）流水线的调度策略超长指令字计算机（M=3的VLIW计算机）166流水线的调度策略已知程序：Loadr1,a/memory(a)r1/addr2,r1/(r1)+(r2)r2/addr3,r4/(r3)+(r4)r3/mulr4,r5/(r4)*(r5)r4/compr6/(r6)r6/mulr6,r7/(r6)*(r7)r6/流水线的调度策略已知程序：167流水线的调度策略M=2的超标量计算机功能模块：f1f2f3d3d2d1m1m2m3a1a2e2e1s2s1取指段译码段执行段写回段先行窗口乘法加法逻辑取数流水线的调度策略M=2的超标量计算机功能模块：f1f2f3d168流水线的调度策略按序发射按序完成：f1d1e2s1f1d2a1a2s2f1d1a1a2s1f2d2m3s2m2m1f1d1s2e1f2d2m3s2m2m1I1I2I3I4I5I6流水线的调度策略按序发射按序完成：f1d1e2s1f1d2a169流水线的调度策略按序发射无序完成：f1d1e2s1f2d2

s2a1a2f1d1

s1a1a2f2d2n1

s2n2n3f1d1e1s1f2d2

n3n1n2s2流水线的调度策略按序发射无序完成：f1d1e2s1f2d2170流水线的调度策略无序发射无序完成s2f1a1a2s1d1f2n1n2n3d2s2f3e1s1d3f1n1n2n3d1f2e2s2d2f1a1a2s1d1I3I4I5I6I1I2流水线的调度策略无序发射无序完成s2f1a1a2s1d1f2171流水线的数据相关数据相关的种类：流相关：前一条指令的结果被下一条指令使用。（I1与I2）反相关：下一条指令的结果修改了前一条指令的数据。（I3与I4）输出相关：两条指令的运算结果修改同一个寄存器内容。（I5与I6）流水线的数据相关数据相关的种类：172数据相关数据相关的解决办法：采用无序发射无须结束的指令执行方法，前提条件是检测出数据相关，并有适当的指令能提前执行。一般在没有适当的指令时，可用NOP指令来代替。设指令的格式为操作码rs,rd

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计算机组成与结构课件

文档简介

温馨提示

最新文档

评论

计算机组成与结构课件

文档简介

温馨提示

最新文档

评论

相关文档