计算机系统结构(处理器设计):LEC100-复习_第1页
计算机系统结构(处理器设计):LEC100-复习_第2页
计算机系统结构(处理器设计):LEC100-复习_第3页
计算机系统结构(处理器设计):LEC100-复习_第4页
计算机系统结构(处理器设计):LEC100-复习_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机系统结构基础计算机的基本概念什么是计算机计算机的基本组成衡量计算机的因素影响计算机设计的主要因素及其发展趋势摩尔定律和工艺的发展计算机市场发展趋势多核结构的发展趋势计算机重要指标性能、成本、功耗我国计算机发展历史二进制与逻辑电路计算机中数的表示补码和原码CMOS门电路及工艺电路原理与延迟模型CMOS组合逻辑与时序逻辑逻辑表达式、真值表、卡诺图、逻辑图常见逻辑电路:译码器、选择器、ALU电路触发器原理:三个主要的时序指标CMOS电路延迟从Verilog到GDSIIVerilog代码的编写电路与版图其它“0”和“1”表示方法指令系统结构指令系统结构的设计原则硬件和软件的界面设计要求:兼容性、通用性、高效性、安全性影响指令系统结构的因素工艺、系统结构、操作系统、编译、应用等指令系统的分类堆栈型指令、累加器型指令、寄存器型指令指令系统的组成部分操作、操作数、编码RISC指令系统结构操作码:常用的十种操作占指令执行的96%操作数:load-store结构,简单寻址方式用得最多编码:定长RISC系统结构的简史CDC6600=>801,MIPS,RISC-2项目

不同RISC结构的比较MIPS,Solaris,HP-PA,PowerPCMIPS指令系统与操作系统的关系静态流水线一个简单的RISCCPU指令系统、数据通路、控制逻辑、时序、时序优化==>流水线指令流水线标准五级流水线:IF,ID,EX,MEM,WB指令相关与流水冲突数据相关:RAW、WAW、WAR控制相关:与PC有关的相关,通过阻塞、delayslot、猜测解决相关结构相关:资源冲突,通过增加资源解决结构相关流水线的前递技术缓解RAW相关引起流水线冲突例外与流水线把例外信息保存下来到WB阶段再处理多功能部件及多拍操作WAW相关、RAW相关更突出,没有WAR相关动态调度流水线影响流水线效率的因素PipelineCPI=IdealpipelineCPI+Structuralstalls+RAWstalls+WARstalls+WAWstalls+Controlstalls指令调度技术软件循环展开与重命名的例子动态调度技术:把译码分成发射和读操作数保留站的作用:有序进入、乱序发射名字依赖性与寄存器重命名:消除WAR和WARTomasulo算法IBM360/91动态流水线的精确例外处理增加提交流水级,修改机器状态ROB的作用:有序退出加法保留站浮点寄存器乘法保留站修改寄存器结果总线浮点加/减法部件浮点乘/除法部件指令队列ROB定点/访存部件Tomasulo算法多发射数据通路乱序执行的关键技术保留栈、重命名寄存器、重排序缓存有序进入、乱序执行、有序退出动态调度流水线数据通路保留站的组织寄存器与保留站的关系寄存器重命名方法常见处理器的数据通路多发射结构数据通路不仅要前后看,而且要左右看龙芯2号多发射结构简介常见处理器的数据通路常见处理器的数据通路CPU保留栈/队列/ROB寄存器运算部件龙芯2号In-flightwindow(64)Int.issuequeue(16)FPissuequeue(16)Int.regfile(644w8r)FPregfile(644w8r)arith./logic,shift/branchadd/logic,shift/mult/divload/storeFPmadd/div/sqrt/comp/media/FPmadd/ALPHA21264In-flightwindow(80)Int.issuequeue(20)FPissuequeue(15)2Int.regfile(804r6w)FPregfile(72,4r4w)arith./logic,shift/branch,mult.add/logic,shift/branch,MVI/PLZarith./logicload/storearith./logicload/storeFPadd,div,sqrtFPmult.MIPSR10000Integerqueue(16)Addressqueue(16)FPqueue(16)Int.regfile(647r3w)Cond.file(64x12r3w)FPregfile(645r3w)arith./logic,shift/brancharith./logic,mult/divFPadd,sub,comp,conversionFPmult,div,sqrtload/storeHPPA-8700ALUReorderBuffer(28)MemoryReorderBuffer(28)Int.arch.reg.(32,4w8r)Int.ren.reg.(56,4w9r)FParch.reg.(32,4w8r)FPren.reg.(56,4w9r)2arith./logicunits2shiftmergeunits2FPMACunits2FPdiv/sqrtunits2load/storeunitsULTRASPARC-IIIInstructionqueue(20)Missqueue(4)Intreg(1443w7r)FPregfile(32,5r4w)2arith.,logic,shiftbranchload/storeFPadder,graphicFPdiv/sqrt,mult,graphicPOWER4fixedpoint&load/store(4x9)floating-point(4x5)Branchexecution(1x12)CRlogical(2x5)inflightwin(200=20x5)GPRS(80)FPRS(72)CRS(32)Link/count(16)FPSCR(20)XER(24)2fixed-piont2floating-point2load/store1branch1CR转移预测转移指令条件/无条件、直接/间接、绝对/相对程序的转移行为很频繁、局部性、可预测性(重复性、相关性)软件方法解决控制相关循环展开、软流水硬件动态转移预测转移的重复性和偏向性:BHT、BTB转移指令的相关性问题:两层转移预测,Yeh和Patt分类分支别名干扰问题:Gshare等混合预测器:不同的分支预测只能对某类的分支行为有效常见处理器的转移猜测ALPHA处理器的转移猜测原理功能部件ALU设计先行进位加法器龙芯1号ALU设计ALU逻辑设计定点补码乘法器的设计Booth一位乘与二位乘算法Wallace树的结构高速缓存(Cache)存储层次的基本概念程序访问的局部性:时间局部性和空间局部性越小越简单的硬件越快,越快的硬件越昂贵Cache结构Cache的内容是主存储器内容的一个子集同时存储数据和地址需要考虑所需要的数据不在Cache中的情况Cache性能优化降低失效率(MissRate)降低失效延迟(MissPenalty)降低命中延迟(HitTime)提高Cache访问并行性常见处理器的存储层次运用之妙、存乎一心存储管理虚拟存储的基本原理TLB的原理和逻辑MIPS处理器对虚存系统的支持TLB、控制寄存器、专用指令、专用例外LINUX操作系统的存储管理TLB、页表和内存分配过程例:array=(int*)malloc(0x1000);for(i=0;i<1024;i++)array[i]=0;TLB的性能分析和优化提高TLB覆盖空间的大小(多页支持)提高TLB异常处理的效率(软TLB等缓存技术)多处理器消息传递与共享存储可伸缩性和通用性常见的共享存储系统SMP、CC-NUMA、NCC-NUMA、SVM共享存储系统的指令相关程序PRG的执行E(PRG)正确的充要条件是E(PRG)PO(PRG)无圈共享存储系统的访存事件次序任一访存操作u被分割成N个子操作,N为处理器个数存储一致性模型结

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论