版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
“组原”课程实验大作业总体框架FPGA实验板FPGA芯片处理器+CP0(五级流水线)超级终端总线存储器UART总线接口部件VGA图形输出第2、3章第4章第8章第5、6、7章第9章学生主要实现CPU,提供其他部分用于验证。PS-2USB课程实验大作业代表作品06级学生设计的MIPS32顶层结构图07级学生在此基础上又加入了PS2接口和VGA接口统一编址方式课程实验大作业代表作品06级学生设计的MIPS32处理器(除浮点和除法指令外的所有指令)精确中断、软件查询方式;延迟槽为1学生实验成果演示DE2-70实验板(DE2实验板)FPGA芯片处理器+CP0(五级流水线)超级终端总线存储器芯片UART总线接口部件VGA图形输出PS-2USBMIPS:俄罗斯方块游戏(加载在SSRAM芯片)ARM:跳球游戏(加载在SDRAM芯片)程序包括:自检、初始化后在LCD上显示一串字符;引导加载程序;转游戏程序执行;不同按键以不同“中断”类型区分,由相应中断服务程序处理。游戏程序用C实现,gcc编译后,用程序将elf转换为二进制文件。第一讲数据通路概述和MIPS指令系统第二讲单周期数据通路的设计第三讲单周期控制器的设计第四讲多周期处理器的设计第五讲微程序控制器设计与异常处理Ch5:CPU-DatapathandControl中央处理器:数据通路和控制器第一讲数据通路概述与MIPS指令系统CPU的功能及其与计算机性能的关系数据通路的位置数据通路设计概述数据通路的功能和实现操作元件(组合逻辑部件)状态/存储元件(时序逻辑部件)数据通路的定时总线型数据通路MIPS指令指令系统简介指令格式:R型、I型、J型通用寄存器组指令类型:ALU运算、访存、分支、跳转、调用和返回主要内容CPU功能及其与计算机性能的关系CPU执行指令的过程(回顾)取指令PC+“1”送PC指令译码进行主存地址运算取操作数进行算术/逻辑运算存结果以上每步都需检测“异常”若有异常,则自动切换到异常处理程序检测是否有“中断”请求,有则转中断处理CPU的实现与计算机性能的关系计算机性能(程序执行快慢)由三个关键因素决定(回顾)指令数目、CPI、时钟周期指令数目由编译器和ISA决定时钟周期和CPI主要由CPU的设计与实现决定因此,CPU的设计与实现非常重要!它直接影响计算机的性能。指令执行过程问题:“取指令”一定在最开始做吗?“PC+1”一定在译码前做吗?“译码”须在指令执行前做吗?你能说出哪几种“异常”事件?异常和中断的差别是什么?异常是在CPU内部发生的中断是由外部事件引起的取指阶段译码和执行阶段组成指令功能的四种基本操作每条指令的功能总是由以下四种基本操作的组合来实现:读取某一主存单元的内容,并将其装入某个寄存器(取指,取数)把一个数据从某个寄存器存入给定的主存单元中(存结果)把一个数据从某个寄存器送到另一个寄存器或者ALU(取数,存结果)进行算术或逻辑运算(PC+1,计算地址,运算)操作功能可形式化描述描述语言称为寄存器传送语言RTL(RegisterTransferLanguage)本章所用的RTL规定如下:(1)用R[r]表示寄存器r的内容;(2)用M[addr]表示主存单元addr的内容;(3)传送方向用“←”表示,传送源在右,传送目的在左;(4)程序计数器PC直接用PC表示其内容。例如,R[$8]←M[R[$9]+4]的含义是:将寄存器$9的内容加4得到的内存地址中的内容送寄存器$8中。CPU基本组成原理图执行部件控制部件CPU由执行部件和控制部件组成CPU包含数据通路(执行部件)
和控制器(控制部件)控制器由指令译码器和控制信号形成部件组成指令寄存器IR程序计数器PC数据通路的位置计算机的五大组成部分:什么是数据通路(DataPath)?指令执行过程中,数据所经过的路径,包括路径中的部件。它是指令的执行部件。控制器(Control)的功能是什么?对指令进行译码,生成指令对应的控制信号,控制数据通路的动作。能对执行部件发出控制信号,是指令的控制部件。ControlMemoryCPUInputOutputDatapathDatapath数据通路的基本结构数据通路由两类元件组成组合逻辑元件(也称操作元件)时序逻辑元件(也称状态元件,存储元件)元件间的连接方式总线连接方式分散连接方式数据通路如何构成?由“操作元件”和“存储元件”通过总线方式或分散方式连接而成数据通路的功能是什么?进行数据存储、处理、传送因此,数据通路是由操作元件和存储元件通过总线方式或分散方式连接而成的进行数据存储、处理、传送的路径。搬数据数据运算存数据操作元件:组合逻辑电路加法器(Adder)多路选择器(MUX)算逻部件(ALU)32AB32Y32SelectMUX3232AB32ResultZeroOPALU3232AB32SumCarryAdderCarryIn3Decoderout0out1out7out2译码器(Decoder)何时要用到adder,ALU,MUXorDecoder?控制信号组合逻辑元件的特点:其输出只取决于当前的输入。即:若输入一样,则其输出也一样定时:所有输入到达后,经过一定的逻辑门延时,输出端改变,并保持到下次改变,不需要时钟信号来定时加法器需要什么控制信号?状态元件:时序逻辑电路状态(存储)元件的特点:具有存储功能,在时钟控制下输入被写到电路中,直到下个时钟到达输入端状态由时钟决定何时被写入,输出端状态随时可以读出定时方式:规定信号何时写入状态元件或何时从状态元件读出边沿触发(edge-triggered)方式:状态单元中的值只在时钟边沿改变。每个时钟周期改变一次。上升沿(risingedge)触发:在时钟正跳变时进行读/写。下降沿(fallingedge)触发:在时钟负跳变时进行读/写。最简单的状态单元(回顾:数字逻辑电路课程内容):D触发器:一个时钟输入、一个状态输入、一个状态输出cycletimerisingedgefallingedge存储元件中何时状态被改变?切记:状态单元的输入信息总是在一个时钟边沿到达后的“Clk-to-Q”时才被写入到单元中,此时的输出才反映新的状态值数据通路中的状态元件有两种:寄存器(组)+存储器(LatchProp-锁存延迟)Q总是在clock-to-Q后跟着D变化这期间D的变化不影响Q存储元件:寄存器和寄存器组寄存器(Register)有一个写使能(WriteEnable-WE)信号 0:时钟边沿到来时,输出不变
1:时钟边沿到来时,输出开始变为输入若每个时钟边沿都写入,则不需WE信号寄存器组(RegisterFile)两个读口(组合逻辑操作):busA和busB分别由RA和RB给出地址。地址RA或RB有效后,经一个“取数时间(AccessTime)”,busA和busB有效。一个写口(时序逻辑操作):写使能为1的情况下,时钟边沿到来时,busW传来的值开始被写入RW指定的寄存器中。ClkDataInWrite
EnableNNDataOutClkbusWWrite
Enable3232busA32busB555RWRARB3232-bitRegisters寄存器组的内部结构busWCD031MUXMXURegister0Register1Register
30Register
31WriteEnableRW32-to-1DecoderRARBbusAbusBClkCDCDCD每个寄存器由32个触发器组成;输入数据来自busW,读出数据分别送busA和busB;WriteEnable信号控制是否写入新值。Backtoadd理想存储器(idealizedmemory
)DataOut:32位读出数据DataIn:
32位写入数据Address:读写公用一个32位地址读操作(组合逻辑操作):地址Address有效后,经一个“取数时间AccessTime”,DataOut上数据有效。写操作(时序逻辑操作):写使能为1的情况下,时钟Clk边沿到来时,DataIn传来的值开始被写入Address指定的存储单元中。存储元件:理想存储器ClkDataInWriteEnable3232DataOutAddress为简化数据通路操作说明,把存储器简化为带时钟信号Clk的理想模型。数据通路与时序控制同步系统(Synchronoussystem)所有动作有专门时序信号来定时由时序信号规定何时发出什么动作
例如,指令执行过程每一步都有控制信号控制,由定时信号确定控制信号何时发出、作用时间多长什么是时序信号?同步系统中用于进行同步控制的定时信号,如时钟信号什么叫指令周期?取并执行一条指令的时间每条指令的指令周期肯定一样吗?早期计算机的三级时序系统机器周期-节拍-脉冲指令周期可分为取指令、读操作数、执行并写结果等多个基本工作周期,称为机器周期。机器周期有取指令、存储器读、存储器写、中断响应等不同类型数据通路与时序控制(早期计算机的三级时序)现代计算机已不再采用三级时序系统,机器周期的概念已逐渐消失。整个数据通路中的定时信号就是时钟,一个时钟周期就是一个节拍。数据通路与时序控制假定采用下降沿触发(负跳变)方式(也可以是上升沿方式)所有状态单元在下降沿写入信息,经过LatchProp(clk-to-Q)后输出有效CycleTime=LatchProp+LongestDelayPath+Setup+ClockSkew约束条件:(LatchProp+ShortestDelayPath-ClockSkew)>HoldTimeClk寄存器的输入可变化SetupHold............SetupHold数据通路由“…+状态元件
+操作元件(组合电路)+状态元件
+…”组成只有状态元件能存储信息,所有操作元件都须从状态单元接收输入,并将输出写入状态单元中。其输入为前一时钟生成的数据,输出为当前时钟所用的数据现代计算机的时钟周期ClkClk早期累加器型指令系统数据通路最简单的数据通路结构
取指令数据路径为:
PC→MAR,ReadM,M→MBR→IBR→IR取操作数、运算、送结果的数据路径为:
操作数地址→MAR,ReadM,M→MBR→ALU输入端,AC→ALU输入端,ALU操作,ALU结果→AC,ALU结果
→MBR,WriteMIAS计算机是现代计算机的原型AC:累加器MQ:乘商寄存器PC、IR、ALU、IBR、MBR:?分散连接方式!theInstituteforAdvanceStudyatPrinceton单总线数据通路四种基本操作的时序在寄存器之间传送数据R0out,Yin完成算术、逻辑运算R1out,YinR2out,Add,ZinZout,R3in从主存取字R1out,MARinRead,WMFC
(等待MFC)MDRout,R2in写字到主存R1out,MARinR2out,MDRin,Write,
WMFCR[R2]←M[R[R1]]
M[R[R1]]←R[R2]CPU访存有两种通信方式早期:直接访问MM,“异步”方式,用MFC应答信号;现在:先Cache后MM,“同步”方式,无需应答信号。问题:时钟周期的宽度如何确定?以“Riout,OP,Zin”所花时间来确定还是以“Read/Write”所花时间来确定?以上四种操作各需要几个时钟周期?1Cycle?3Cycles?3Cycles?3Cycles?Read/Write时间更长,故以此为准!OP:Add、Sub、And、Or等通用寄存器总线连接方式内总线内总线外总线三总线数据通路单总线中一个时钟内只允许传一个数据,因而指令执行效率很低可采用多总线方式,同时在多个总线上传送不同数据,提高效率例如:三总线数据通路总线A、B分别传送两个源操作数,总线C传送结果单总线中的暂存器Y和Z在此可取消,Why?采用双口通用寄存器组如何实现:R[R3]←R[R1]opR[R2]R1outA,R2outB,op,R3inC只要一个时钟周期(节拍)即可!目前大都采用流水线方式执行指令,单总线或三总线的总线式数据通路很难实现指令流水执行。
ZY以下以MIPS指令系统为例介绍非总线式CPU的设计。三个总线各自传不同的数据,不会发生冲突,故无需Y和Z通用寄存器组MIPS指令中寄存器数据和存储器数据的指定寄存器数据指定: 31x32-bitGPRs(r0=0)寄存器编号占5bit32x32-bitFPregs(f0~f31,pairedDP) HI,LO,PC:专用特殊寄存器(无需编号)寄存器功能和2种汇编表示方式存储器数据指定32-bitmachine-->可访问空间:232bytesBigEndian(大端方式)只能通过Load/Store指令访问存储器数据数据地址通过一个32位寄存器内容加16位偏移量得到16位偏移量是带符号整数,故应符号扩展数据要求按边界对齐(地址是4的倍数)SKIPMIPS寄存器的功能定义和两种汇编表示
NamenumberUsageReservedoncall?zero0constantvalue=0(恒为0)n.a.at1reservedforassembler(为汇编程序保留)
n.a.v0~v12
~
3valuesforresults(过程调用返回值)noa0~a34
~
7Arguments(过程调用参数)yest0~t78
~
15Temporaries(临时变量)nos0~s716
~
23Saved(保存)yest8~t924
~
25moretemporaries(其他临时变量)nok0~k126
~
27reservedforkernel(为OS保留)n.a.gp28globalpointer(全局指针)yessp29stackpointer(栈指针)yesfp30framepointer(帧指针)yesra31returnaddress(过程调用返回地址)yeszerov0-v1a0-a3t0-t7s0-s7t8-t9gpspfpraat02-34-7815162324-2528293031k0-k1126-27Registersarereferencedeitherbynumber—$0,…$31,orbyname—$t0,$s1…$ra.BACKtolastBACKtoAssembleBACKtoProcedureMIPS指令格式有三种指令格式R-Type两个操作数和结果都在寄存器的运算指令。如:subrd,rs,rtI-Type运算指令:一个寄存器、一个立即数。如:orirt,rs,imm16LOAD和STORE指令。如:lwrt,rs,imm16条件分支指令。如:beqrs,rt,imm16J-Type无条件跳转指令。如:jtargetoprsrtrdshamtfunc0611162126316bits6bits5bits5
bits5bits5bitsR-Type指令oprsrtimmediate0162126316bits16bits5bits5bitsI-Type指令optargetaddress026316bits26
bitsJ-Type指令所有指令都是32位宽,须按字地址对齐
字地址为4的倍数!MIPS指令字段含义OP:操作码rs:第一个源操作数寄存器rt:第二个源操作数寄存器rd:结果寄存器shamt:移位指令 的位移量func:R-Type指令的OP字段是特定的“000000”,具体操作由func字段给定。例如:func=“100000”时,表示“加法”运算。immediate:立即数或load/store指令和分支指令的偏移地址targetaddress:无条件转移地址的低26位。将PC高4位拼上26位直接地址,最后添2个“0”就是32位目标地址。为何最后两位要添“0”?操作码的不同编码定义不同的含义,操作码相同时,再由功能码定义不同的含义!指令按字地址对齐,所以每条指令的地址都是4的倍数(最后两位为0)。oprsrtrdshamtfunc0611162126316bits6bits5bits5
bits5bits5bitsR-Type指令oprsrtimmediate0162126316bits16bits5bits5bitsI-Type指令optargetaddress026316bits26
bitsJ-Type指令OP字段的含义(MIPS指令的操作码编码/解码表)BACKtoAssembleBacktoLoad/Storeop=0:R型;op=2/3:J型;其余:I型R-型指令的解码(op=0时,func字段的编码/解码表)BACKtoCUadd指令的funct字段为100000B(32)div指令的funct字段为多少?011010B(26)!BACKtoAssembleMIPSAddressingModes(寻址方式)immedoprsrtregisterBase或index基址或变址+MemoryimmedoprsrtImmediateimmedoprsrtPC+4PC-relative相对寻址+MemoryI-format:oprsrtrdregisterRegisterfuncR-format:smt655565J-format:opaddr.MemoryPseudodirect伪直接寻址B/HW/WByte/HalfWord/Word有专门的寻址方式字段(Mod)吗?没有!由指令格式确定,指令格式由op确定!还记得如何确定的吗?为什么称伪直接?还记得如何得到最终地址的吗?最终地址=PC31~28||addr.||00位数:4+26+2=32OP=000000HOP=000010Hor000011H若从存储器取来一条指令为00AF8020H,则对应的汇编形式是什么?指令的前6位为000000,根据指令解码表知,是一条R-Type指令,按照R-Type指令的格式
得到:rs=00101,rt=01111,rd=10000,shamt=00000,funct=1000001.根据R-Type指令解码表,知是“add”操作(非移位操作)2.rs、rt、rd的十进制值分别为5、15、16,从MIPS寄存器功能表知:
rs、rt、rd分别为:$a1、$t7、$s0
故对应的汇编形式为:
add$s0,$a1,$t7Example:汇编形式与指令的对应oprsrtrdshamtfunc0611162126316
bits6bits5bits5bits5bits5bits00000000101011111000000000100000这个过程称为“反汇编”,可用来破解他人的二进制代码(可执行程序).32位指令代码:00000000101011111000000000100000
功能:R[$s0]←R[$a1]+R[$t7]Example:汇编形式与指令的对应若MIPSAssemblyInstruction:Add$t0,$s1,$s2则对应的指令机器代码是什么?oprsrtrd
funcsmt655565017188320655565Decimal
representaton:$s1$s2$t0R-TypeAddNoshiftBinary
representaton:00000010001100100100010000000000655565这个过程称为“汇编”,所有汇编源程序都必须汇编成二进制机器代码才能让机器直接执行!问题:如何知道是R型指令?汇编器?根据汇编指令中的操作码助记符查表能知道是什么格式!从助记符表中查到Add是R型指令,即:何为助记符?汇编语言中的指令和寄存器等的名称。02324020H02324020MIPSCircuitsforR-TypeInstructions问题:你能给出R-型指令在上述通路中的大致执行过程吗?R-type指令实现电路的执行过程装入指令寄存器(IR-InstructionRegister)以下相应字段送控制逻辑opfield(OP字段)funcfield(func字段)shmtfield(shmt字段)以下相应字段送寄存器堆第一操作数寄存器编号第二操作数寄存器编号存放结果的目标寄存器编号
寄存器号被送选择器对应选择器输出被激活
被选寄存器的输出送到数据线控制逻辑提供:
ALU操作码
写信号等结果被写回目标寄存器Phase1:Preparation(1:准备阶段)Phase2:Execution(2:执行阶段)这个过程描述仅是示意性的,实际上整个过程需要时钟信号的控制,并有其他部件参与。将在下一讲详细介绍。MIPSarithmeticandlogicinstructionsInstruction Example Meaning Commentsadd add$1,$2,$3 $1=$2+$3 3operands;exceptionpossiblesubtract sub$1,$2,$3 $1=$2–$3 3operands;exceptionpossibleaddimmediate addi$1,$2,100 $1=$2+100 +constant;exceptionpossiblemultiply mult$2,$3 Hi,Lo=$2×$3 64-bitsignedproductdivide div$2,$3 Lo=$2÷$3, Lo=quotient,Hi=remainder Hi=$2mod$3MovefromHi mfhi$1 $1=Hi getacopyofHiMovefromLo mflo$1 $1=LoInstruction Example Meaning Comment
and and$1,$2,$3 $1=$2&$3 LogicalANDor or$1,$2,$3 $1=$2|$3 LogicalORxor xor$1,$2,$3 $1=$2$3 LogicalXORnor nor$1,$2,$3 $1=~($2|$3) LogicalNOR这里没有全部列出,还有其他指令,如addu(不带溢出处理),addui等问题:x86没有分add还是addu,会不会有问题?不会。x86只产生各种标志,由软件根据标志信息来判断是否溢出。而MIPS是由硬件直接判溢出否。需判溢出,溢出时发生“异常”MIPSdatatransferinstructionsInstruction Comment
Meaning
SW$3,500($4) Storeword$3→($4+500)
SH$3,502($2) StorehalfLowHalfof$3→($2+502)
SB$2,41($3) Storebyte LQof$2→($3+41)
LW$1,-30($2) Loadword ($2-30)→$1LH$1,40($3) Loadhalf ($3+40)→LHof$1LB$1,40($3) Loadbyte($3+40)→LQ
of$1问题:为什么指令必须支持不同长度的操作数?因为高级语言中的数据类型有char,short,int,long,……等,故需要存取不同长度的操作数指令中操作数长度由什么决定?操作数长度的不同由不同的操作码指定。还记得IA-32的数据传送指令的格式吗?操作码:opcode;w:与机器模式(16/32位)一起确定寄存器位数(AL/AX/EAX);d:操作方向寻址方式:mod、r/m、reg/op三个字段与w字段和机器模式一起确定操作数所在的寄存器编号或有效地址计算方式SIB中基址B和变址I都可是8个GRS中任一个;SS给出比例因子位移量和立即数的长度可以是:1B(8位)、2B(16位)、4B(32位)回顾:IA-32机器指令格式MIPS的call/return/jump/branch和compare指令Instruction Example Meaning
jumpregister jr$31 goto$31
Forswitch,procedurereturn(对应过程返回)jumpandlink jal10000 $31=PC+4;goto10000
Forprocedurecall(对应过程或函数调用)jump j10000 goto10000
JumptotargetaddressPseudoinstructionblt,ble,bgt,bgenotimplementedbyhardware,butsynthesizedbyassemblersetonlessthan slt$1,$2,$3 if($2<$3)$1=1;else$1=0setlessthanimm.slti$1,$2,100 if($2<100)$1=1;else$1=0
branchonequal beq$1,$2,100 if($1==$2)gotoPC+4+25*4
branchonnoteq. bne$1,$2,100 if($1!=$2)gotoPC+4+25*4
call/return按补码比较大小汇编指令中给出的是相对单元数!问题:机器指令中立即数是多少?100=0064H问题:机器指令中立即数是多少?25=0019H伪指令:由若干指令(即指令序列)实现。分支指令的机器代码中给出的是相对于当前指令的指令条数!00010000001000100000000000011001MIPS程序和数据的存储器分配这就是每个进程的虚拟(逻辑)地址空间!每个用户程序都有相同的虚拟地址空间!问题:你知道一个程序在“编辑、编译、汇编、链接、装入”过程中的哪个环节确定了每条指令及其操作数的虚拟地址吗?链接时确定虚拟地址;装入时生成页表以建立虚拟地址与物理地址之间的映射!第二讲单周期数据通路的设计选择MIPS指令集的一个子集作为CPU的实现目标下条指令地址计算与取指令部件R型指令的数据通路访存指令的数据通路立即数运算指令的数据通路分支和跳转指令的数据通路综合所有指令的数据通路主要内容MIPS的三种指令类型ADDandSUBSTRACTaddrd,rs,rtsubrd,rs,rtORImmediate:orirt,rs,imm16LOADandSTORElwrt,rs,imm16swrt,rs,imm16BRANCH:beqrs,rt,imm16JUMP:jtargetoptarget
address026316
bits26bitsoprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsoprsrtimmediate0162126316bits16bits5bits5
bits这些指令具有代表性!有算术运算、逻辑运算;有RR型、RI型;有访存指令;有条件转移、无条件转移。本讲目标:实现以上7条指令对应的数据通路!教材中实现了11条指令,可将7条指令和11条指令的数据通路进行对比,以深入理解设计原理。R-Type、I-Type、J-Type设计处理器的步骤第一步:分析每条指令的功能,并用RTL(RegisterTransferLanguage)来表示。第二步:根据指令的功能给出所需的元件,并考虑如何将他们互连。第三步:确定每个元件所需控制信号的取值。第四步:汇总所有指令所涉及到的控制信号,生成一张反映指令与控制信 号之间关系的表。第五步:根据表得到每个控制信号的逻辑表达式,据此设计控制器电路。
处理器设计涉及到数据通路的设计和控制器的设计数据通路中有两种元件
操作元件:由组合逻辑电路实现存储(状态)元件:由时序逻辑电路实现ISA确定后,进行处理器设计的大致步骤RTL:TheADDInstruction(加法指令)add rd,rs,rtM[PC] 从PC所指的内存单元中取指令R[rd]←R[rs]+R[rt] 从rs、rt所指的寄存器中取数后相加。若结果不溢出,则将结果送rd所指的寄存器中;若结果溢出,则不送结果,并转到“溢出处理程序”执行。PC←PC+4PC加4,使PC指向下一条指令oprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsRTL:TheLoadInstruction(装入指令)lw rt,rs,imm16M[PC] (同加法指令)Addr←R[rs]+SignExt(imm16)计算数据地址(立即数要进行符号扩展)R[rt]←M[Addr] 从存储器中取出数据,装入到寄存器中PC←PC+4
(同加法指令)与R-type加法指令相比,更复杂!其他指令的分析与R-type和Load指令类似oprsrtimm160162126316bits16bits5bits5
bits取指令部件(InstructionFetchUnit)每条指令都有的公共操作:取指令:M[PC]更新PC:PC←PC+4转移(BranchandJump)时,PC内容再次被更新为“转移目标地址”32Instruction
WordAddressInstructionMemoryPCClkNext
AddrLogic顺序:先取指令,再改PC的值(具体实现时,可以并行)绝不能先改PC的值,再取指令下地址逻辑取指后,各指令功能不同,数据通路中信息流动过程也不同下面分别对每条指令进行相应数据通路的设计取指令部件加法和减法指令(R-type类型)实现目标(7条指令):ADDandsubtractaddrd,rs,rtsubrd,rs,rtORImmediate:orirt,rs,imm16LOADandSTORElwrt,rs,imm16swrt,rs,imm16BRANCH:beqrs,rt,imm16JUMP:jtarget首先考虑add和sub指令(R-Type指令的代表)oprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsoprsrtimmediate0162126316bits16bits5bits5
bitsoptarget
address026316
bits26bitsRR(R-type)型指令的数据通路功能:R[rd]←R[rs]opR[rt],如:addrd,rs,rt32ResultALUctrClkbusWRegWr3232busA32busB555RwRaRb3232-bitRegistersrsrtrdALU不考虑公共操作,仅R-Type指令执行阶段的数据通路如下:ALUctr,RegWr:指令译码后产生的控制信号Ra,Rb,Rw
分别对应指令的rs,rt,rd“addrd,rs,rt”控制信号?ALUctr=add,RegWr=1oprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bits溢出时,不写结果并需转异常处理程序溢出寄存器组结构ALU如何实现呢?例:实现某11条MIPS指令的ALU该ALU能实现哪些运算?add,sub,addu,subu,or,slt,sltulw/sw指令应是add/addu?beq指令应是sub/subu?定点整数ALU!ALUctr=add/sub时,OVctr=1ALUctr=其余运算时,OVctr=0addusubuALUctr=sub/subu/slt/sltu时,SUBctr=1,其余SUBctr=0ALUctr=slt,SIGctr=1ALUctr=sltu,SIGctr=0其余情况,任意SUBctr、OPctr等由ALUctr决定P.155图5.13ALUctr与ALU内部控制信号的关系SUBctr=ALUctr<2>OVctr=!ALUctr<1>&ALUctr<0>SIGctr=ALUctr<0>OPctr<1>=ALUctr<2>&ALUctr<1>OPctr<0>=!ALUctr<2>&
ALUctr<1>&!ALUctr<0>带立即数的逻辑指令(ori指令)实现目标(7条指令):ADDandsubtractaddrd,rs,rtsubrd,rs,rtORImmediate:orirt,rs,imm16LOADandSTORElwrt,rs,imm16swrt,rs,imm16BRANCH:beqrs,rt,imm16JUMP:jtarget2.考虑ori指令(I-Type指令和逻辑运算指令的代表)oprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsoprsrtimmediate0162126316bits16bits5bits5
bitsoptarget
address026316
bits26bitsRTL:TheORImmediateInstructionori rt,rs,imm16M[PC] 取指令(公共操作,取指部件完成)R[rt]←R[rs]orZeroExt(imm16)
立即数零扩展,并与rs内容做“或”运算PC←PC+4计算下地址(公共操作,取指部件完成)imm16016153116
bits16bits0000000000000000零扩展ZeroExt(imm16)思考:应在前面数据通路上加哪些元件和连线?用何控制信号?逻辑运算,立即数为逻辑数oprsrtimm160162126316bits16bits5bits5
bits带立即数的逻辑指令的数据通路R[rt]←R[rs]opZeroExt[imm16]] Example:orirt,rs,imm1632ResultALUctrClkbusWRegWr3232busA32busB555RwRaRb3232-bitRegistersRsDon’t
Care(Rt)ALUR-Type类型的结果写入RdR-Type的操作数来自busB应加兰色部分,为什么?Ori指令的控制信号:RegDst=1;RegWr=1;ALUSrc=1;ALUctr=orRtRdRegDstMux01ExtMux1632imm16ALUSrc01oprsrtimm160162126316bits16bits5bits5
bits各控制信号取何值?访存指令中的数据装入指令(lw)实现目标(7条指令):ADDandsubtractaddrd,rs,rtsubrd,rs,rtORImmediate:orirt,rs,imm16LOADandSTORElwrt,rs,imm16swrt,rs,imm16BRANCH:beqrs,rt,imm16JUMP:jtarget3.考虑lw指令(访存指令的代表)oprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsoprsrtimmediate0162126316bits16bits5bits5
bitsoptarget
address026316
bits26bitsRTL:TheLoadInstructionlw rt,rs,imm16M[PC] 取指令(公共操作,取指部件完成)Addr←R[rs]+SignExt(imm16)计算存储单元地址(符号扩展!)R[rt]←M[Addr] 装入数据到寄存器rt中PC←PC+4 计算下地址(公共操作,取指部件完成)immediate016153116
bits16
bits0000000000000000000161531immediate16
bits16
bits
11111111111111111符号扩展(为什么不是零扩展?):思考:应在原数据通路上加哪些元件和连线?用何控制信号?立即数用补码表示oprsrtimmediate0162126316bits16bits5bits5
bits装入(lw)指令的数据通路R[rt]←M[R[rs]+SignExt[imm16]] lwrt,rs,imm1632ALUctrClkbusWRegWr3232busA32busB555RwRaRb32
32-bitRegistersRsRtDon’t
Care(Rt)RdRegDstMuxMux3216imm16ALUSrcALU加兰色部分。为什么?01ExtExtOpMuxMemtoRegClkData
InWrEn32AdrDataMemory32MemWr01RegDst=1,RegWr=1,ALUctr=addu,ExtOp=1,ALUSrc=1,MemWr=0,MemtoReg=10:零扩展,1:符号扩展01oprsrtimm160162126316bits16bits5bits5
bits各控制信号取何值?访存指令中的存数指令(sw)实现目标(7条指令):ADDandsubtractaddrd,rs,rtsubrd,rs,rtORImmediate:orirt,rs,imm16LOADandSTORElwrt,rs,imm16swrt,rs,imm16BRANCH:beqrs,rt,imm16JUMP:jtarget4.考虑sw指令(访存指令的代表)oprsrtimmediate0162126316bits16bits5bits5
bitsoprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsoptarget
address026316
bits26bitsRTL:TheStoreInstructionsw rt,rs,imm16M[PC] 取指令(公共操作,取指部件完成)Addr←R[rs]+SignExt(imm16)计算存储单元地址(符号扩展!)Mem[Addr]←R[rt] 寄存器rt中的内容存到内存单元中PC←PC+4 计算下地址(公共操作,取指部件完成)
oprsrtimm160162126316bits16bits5bits5
bits思考:应在原数据通路上加哪些元件和连线?用何控制信号?存数(sw)指令的数据通路M[R[rs]+SignExt[imm16]←
R[rt]] Example:swrt,rs,imm1632ALUctrClkbusWRegWr3232busA32busB555RwRaRb32
32-bitRegistersRsRtRtRdRegDstExtMuxMux3216imm16ALUSrcExtOpMuxMemtoRegClkDataInWrEn32AdrDataMemory32MemWrALU0101加兰色部分。为什么?RegDst=x,RegWr=0,ALUctr=addu,ExtOp=1,ALUSrc=1,MemWr=1,MemtoReg=x01oprsrtimm160162126316bits16bits5bits5
bits各控制信号取何值?讲课前的几句话为什么要了解和学习处理器设计(现代微处理器可以称得上是人类创造的最复杂系统之一)从智力方面来说,处理器设计是非常有趣且益智的。理解处理器如何工作能帮助理解整个计算机系统是如何工作的。你可能会设计包含处理器的系统(车载系统、家电等)。你可能就要从事设计处理器的工作。学习处理器设计的机会难得。关于软件设计的资料多,门槛低,可自学;而关于处理器设计的资料少,门槛高,不易自学。CS2013、CE2016中规定的毕业要求。最重要的:国家急需从事计算机系统设计的人才!要学会合理安排时间学习和了解“时间管理”方面的技巧最典型的浪费时间的事:在A课程上做B课程的事情,两件都做不好关于PA、作业和考试ICS—ch7、ch8:PA4(不再布置作业)COA—ch3:选择题(非重点);ch5、ch6:各类题型(重点)评分:PA3、PA4(40%);开卷考试(60%)SKIP国家安全战略和民生工程等方面,面临挑战电站可被远程控制;公务车有处理器后门,可被监听或控制;…….举例:2012年伊朗核离心装置遭到“震网”病毒攻击,20%的离心机报废,监控录像被篡改,而遭攻击的电脑是物理隔离的基本现状:国家急需计算机系统方面的人才!!!天河2015年11月16日公布的全球超级计算机500强榜单,中国“天河二号”比第二名美国“泰坦”快近一倍,连续第6次获得冠军问题之一:实用性和效能难令人满意问题之二:美国限售Intel高性能处理器芯片龙芯从“北斗”卫星、防火墙等国家安全战略层面,到电子水表、机顶盒等民生项目都有应用,取得长足进步软硬件开发人员上万,2013年1.8万片,2014年达35万片“长板”与国际先进水平相差2-3年,“短板”相差10年以上。若有10万人基于龙芯开发基础软件,就能很好建立生态系统背景介绍BACK分支(条件转移)指令(相等转移:beq)实现目标(7条指令):ADDandsubtractaddrd,rs,rtsubrd,rs,rtORImmediate:orirt,rs,imm16LOADandSTORElwrt,rs,imm16swrt,rs,imm16BRANCH:beqrs,rt,imm16JUMP:jtarget5.考虑beq指令(条件转移指令的代表)oprsrtimmediate0162126316bits16bits5bits5
bitsoprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsoptarget
address026316
bits26bits回顾:RTL:TheStoreInstructionsw rt,rs,imm16M[PC] 取指令(公共操作,取指部件完成)Addr←R[rs]+SignExt(imm16)计算存储单元地址(符号扩展!)Mem[Addr]←R[rt] 寄存器rt中的内容存到内存单元中PC←PC+4 计算下地址(公共操作,取指部件完成)
oprsrtimm160162126316bits16bits5bits5
bits思考:应在原数据通路上加哪些元件和连线?用何控制信号?回顾:存数(sw)指令的数据通路M[R[rs]+SignExt[imm16]←
R[rt]] Example:swrt,rs,imm1632ALUctrClkbusWRegWr3232busA32busB555RwRaRb32
32-bitRegistersRsRtRtRdRegDstExtMuxMux3216imm16ALUSrcExtOpMuxMemtoRegClkDataInWrEn32AdrDataMemory32MemWrALU0101加兰色部分。为什么?RegDst=x,RegWr=0,ALUctr=addu,ExtOp=1,ALUSrc=1,MemWr=1,MemtoReg=x01oprsrtimm160162126316bits16bits5bits5
bits各控制信号取何值?RTL:TheBranchInstructionbeq rs,rt,imm16M[PC] 取指令(公共操作,取指部件完成)Cond←R[rs]-R[rt] 做减法比较rs和rt中的内容if(CONDeq0) 计算下地址(根据比较结果,修改PC)PC←PC+4+(SignExt(imm16)x4) elsePC←PC+4思考:立即数的含义是什么?是相对指令数还是相对单元数?应在原数据通路上加哪些元件和连线?用什么控制信号来控制?立即数用补码表示oprsrtimm160162126316bits16bits5bits5
bits条件转移指令的数据通路beqrs,rt,imm16 WeneedtocompareRsandRt!ALUctrClkbusWRegWr3232busA32busB555RwRaRb32
32-bitRegistersRsRtRtRdRegDstExtMuxMux3216imm16ALUSrcExtOpALUPCClkNext
AddrLogic16imm16BranchToInstructionMemoryZero思考:下址逻辑如何设计?各控制信号取何值?RegDst=x,RegWr=0,ALUctr=subu,ExtOp=x,ALUSrc=0,MemWr=0,MemtoReg=x,Branch=10101oprsrtimm160162126316bits16bits5bits5
bits下地址计算逻辑的设计PC是一个32位地址:顺序执行时:PC<31:0>=PC<31:0>+4转移执行时:PC<31:0>=PC<31:0>+4+SignExt[Imm16]×4MIPS按字节编址,每条指令为32位,占4个字节,故PC的值总是4的倍数,即后两位为00,因此,PC只需要30位即可。下地址计算逻辑简化为:
顺序执行时:PC<31:2>=PC<31:2>+1转移执行时:PC<31:2>=PC<31:2>+1+SignExt[Imm16]取指令时:
指令地址=PC<31:2>串接“00”PC采用30位后,其转移地址计算逻辑变得更加简单。采用32位PC时,可用左移2位实现“×4”操作,计算转移地址用2个加法器!可以用更简便的方式实现如下:下址逻辑设计Usinga30-bitPC:顺序执行时:PC<31:2>=PC<31:2>+1转移执行时:PC<31:2>=PC<31:2>+1+SignExt[Imm16]取指令时:
指令地址=PC<31:2>concat“00”3030SignExt3016imm16Mux01Adder“1”PCClkAdder3030BranchZeroAddr<31:2>InstructionMemoryAddr<1:0>“00”32Instruction<31:0>Instruction<15:0>30先根据当前PC取指令,计算的下条指令地址在下一个时钟到来后才能写入PC!
标志位ZF,由ALU产生!为什么这里没有用“ALU”而是用“Adder”?“ALU”和“Adder”有什么差别?无条件转移指令实现目标(7条指令):ADDandsubtractaddrd,rs,rtsubrd,rs,rtORImmediate:orirt,rs,imm16LOADandSTORElwrt,rs,imm16swrt,rs,imm16BRANCH:beqrs,rt,imm16JUMP:jtarget6.考虑Jump指令(无条件转移指令的代表)oprsrtimmediate0162126316bits16bits5bits5
bitsoprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsoptarget
address026316
bits26bitsRTL:TheJumpInstructionj targetM[PC] 取指令(公共操作,取指部件完成)PC<31:2>←PC<31:28>串接target<25:0>计算目标地址思考:应在原数据通路上加哪些元件和连线?用什么控制信号来控制?想一想:跳转指令的转移范围有多大?是当前指令后面的0x0000000~0xFFFFFFC处?不对!它不是相对寻址,而是绝对寻址FFFF
FFFFF000
0000EFFF
FFFFE000
0000AFFF
FFFFA000
00000FFF
FFFF0000
0000j
targetoptarget
address026316
bits26bitsInstructionFetchUnit:取指令部件3030SignExt3016imm16Mux01Adder“1”PCClkAdder3030BranchZero“00”Addr<31:2>InstructionMemoryAddr<1:0>32jtargetPC<31:2>←PC<31:28>concattarget<25:0>Instruction<15:0>Instruction<31:0>imm16、Target、…30264Mux10Target30JumpInstruc<25:0>这是“取指部件”的完整设计3个输入:jump,Branch,Zero1个输出:指令字PC的改变在下个Clk到达后发生!RegDst=ExtOp=ALUSrc=MemtoReg=ALUctr=x,
RegWr=0,
MemWr=0,Branch=0,Jump=1各控制信号取何值?TheMIPSSubset(考察实现以下指令的数据通路)ADDandsubtractaddrd,rs,rtsubrd,rs,rtORImmediate:orirt,rs,imm16LOADandSTORElwrt,rs,imm16swrt,rs,imm16BRANCH:beqrs,rt,imm16JUMP:jtarget所有指令的数据通路都已设计好,合起来的数据通路是什么样的?oprsrtimmediate0162126316bits16bits5bits5
bitsoprsrtrdshamtfunc0611162126316bits6bits5bits5bits5
bits5
bitsoptarget
address026316
bits26bitsPuttingitAllTogether:ASingleCycleDatapath32ALUctrClkbusWRegWr3232busA32busB555RwRaRb
3232
bitRegistersRsRtRtRdRegDstExtMuxMux3216imm16ALUSrcExtOpMuxMemtoRegClkDataInWrEn32AdrDataMemory32MemWrALUInstructionFetch
UnitClkZeroInstruction<31:0>JumpBranch010101<21:25><16:20><11:15><0:15>Imm16RdRtRs指令执行结果总是在下个时钟到来时开始保存在寄存器或存储器或
PC
中!下一讲考虑:如何产生控制信号!(控制器的设计内容)数据通路中的关键路径(Load操作)记住:寄存器组和理想存储器的定时方式写操作时,作为时序逻辑电路。即:时钟到达前,输入需setup;到达后经Clk-to-Q,写入数据到达输出端读操作时,作为组合逻辑电路。即:地址有效后经过“accesstime”,输出开始有效Clk5RwRaRb32
32-bitRegistersRdALUClkDataInDataOutDataAddressIdealDataMemoryInstructionbusInstruction
AddressIdealInstructionM
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 个人及多人共同担保协议范本2024版
- 临时司机雇佣协议(2024年新编)
- 不锈钢承包协议合同(2024版)
- 二零二五年度残疾人士护理护工服务协议书3篇
- 2024智慧城市建设项目保密协议
- 旅游包车协议
- 2025年度特殊用途围墙建设承包协议3篇
- 2024版两人合作办学协议书
- 2025年投标保证金合同范本撰写与风险防控3篇
- 2024版单位汽车维修协议书
- 四年级数学下册计算题(每日一练13份)
- 虚拟现实技术应用
- 项目风险记录及跟踪表
- 50以内加减法口算题卡(1000道打印版)每日100道
- 《生物发酵行业智能制造第2部分:生物反应器》
- GB/T 4008-2024锰硅合金
- 2024急性脑梗死溶栓规范诊治指南(附缺血性脑卒中急诊急救专家共识总结归纳表格)
- 个人替公司代付协议
- FZ∕T 73037-2019 针织运动袜行业标准
- 废旧纤维回收和再利用策略
- 生产计划应急预案
评论
0/150
提交评论