计算机体系结构-l1ca基本概念_第1页
计算机体系结构-l1ca基本概念_第2页
计算机体系结构-l1ca基本概念_第3页
计算机体系结构-l1ca基本概念_第4页
计算机体系结构-l1ca基本概念_第5页
免费预览已结束,剩余336页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1郑计算机体系结 北理工计算机学 本章计算机系统的多级层次计算机体系结构、组成与软硬取舍与计算机系统的设计计算机设计的量化影响系统结构的系统结构中的并计算机系统计算机体系结 北理工计算机学 计算机系 (程序(程序和数据控输入/控数数据通计算机体系结 北理工计算机学 计算机系Desktop Laptop计算机体系结 北理工计算机学 第一台电子计算17468个电子60000个电阻10000个电容6000个开160平方1745000次加法/年 日,第一台通用可编程电子计算ENIAC由宾夕法尼亚大 电机学院研制成计算机体系结 北理工计算机学 EDSAC,UniversityofCambridge,UK,第一 程序的计算计算机体系结 北理工计算机学 现代的计算

SensorSet-topSensor

77计算机体系

北理工计算机

计算机技术的从器件发展电子管、继电 晶体管磁介集成电路大规模和超大规从计算机系统规模发展从结构发展单个CPU流水线机多处理机大规模的并行处理机计算机体系结 北理工计算机学 计算机技术的变址技术中断技术微程序技术缓冲技术共享重用技术虚拟技术串行标量处理流水处理并行分布式高性能并行计算智能计算机体系结 北理工计算机学 计算机技术的从编程语言发展由低机器语言汇编语言高级语言应用从性性能提升,价格下降,性能计算机体系结 北理工计算机学 计算机技术的器件技术的发展(决定性因素体系结构技技术技术进步:以稳定速度发展,主要指IC技创新设计:发展速度不稳定,有时快计算机体系结 北理工计算机学 微处理器性能计计算机体系结构重性能提高率的贡献超过技术进步贡献达15倍之多。 :25%/year1978toRISC+x86:52%/year1986toRISC+x86:18%/year2002to计算机体系结 北理工计算机学 计算机系统的计算机系统:软件+硬件,复杂 器和外计算机体系结 北理工计算机学 计算机系统的计算机体系结 北理工计算机学 计算机系统的计算机体系结 北理工计算机学 个人计算机系硬 电源导线和电扩展

扩展卡

计算机体系结 北理工计算机学 个人计算机系计算机体系结 北理工计算机学 个人计算机系4365217计算机体系结 北理工计算机学 计算机系统典 I/OI/O总总线控制器总线控制器总主网键鼠显计算机体系结 北理工计算机学 一个简单的嵌 公共计算机体系结 北理工计算机学不同应用,功能要不同应用,功能要求不同科学计算:高性能浮点商业:事务处理和十进制通用:对多种任务性能OS、编程性能:程序运行时价格:应用软件和系统软件能耗:峰值功率,以及每个操作所系统可靠性:计算机体系结 北理工计算机学 性能价格计算机设性能价格

经济经济计算机体系结 北理工计算机学 计算机设计者 实

不仅包括设计、实现,还包括测量和评 计算机体系结 北理工计算机学 计算机系计算机系统功能的实现涉及很多方逻辑电路,功能CPU,数据通路,存贮指令运行时系统(runtime编译器操作系统(operating(application)计算机体系结 北理工计算机学 计算机系计算机系统是一个复杂的 计算机体系结 北理工计算机学 计算机系多级层次结构:对计算机系统的抽计算机体系结 北理工计算机学 数字逻硬件/数字逻硬件/软微程序机器语操作系汇编语高级语应用语第6第5第4第2计算机体系

北理工计算机

第1第0计算机系易 可用、、;计算机体系结 北理工计算机学 计算机系计算机体系结 北理工计算机学 计算机系从学科领域来划分第0和第1级属于计算机组第2至第4级是系统第5级是应它们之间仍有交叉第1级涉及汇编语言程第2级与计算机系统结在特殊的计算机系统中,有些级别可计算机体系结 北理工计算机学 计算机系机和执行程序的算法和数据结构的虚拟机(器以软件为主这个计算机只对该级使用者实际由硬件或固件实现的计算机体系结 北理工计算机学 理工计算机数字逻理工计算机数字逻应用语言机器(应用语言高级语言机器高级语言机器(高级语言操作系统机器(操作系统机器(作业控制语言汇编语言机器(汇编语言实际机微程序机器(微微程序机器(微指令集传统机器(机器指令集

第4第1计算机体系结

第0多级层次结构的有利于理解软件、硬件、固件的地位理解各种语言的实 途探索虚拟机新的实现方法和新的系统理解计算机体系结构计算机体系结 北理工计算机学 机器级的实现Q1:各机器级是如何实现的呢实际上,只有二进制机器指令(即机器语言)可以直接被硬件识别和执行,其上面各层机器级所使用的语言都必须被翻译或解释为较低层机器级上语言,由翻译和解释或这两者的结合是各机器级计算机体系结 北理工计算机学 机器级的实现序不再被。

解释 计算机体系结 机器级的实现可以想象在使用机器指令的实际机器上出现实际机器实际机器(机器指令虚拟机器(汇编语言第2L2(机器指令)由机L4(汇编语言)程序先翻译成L2程序,而后由M1执计算机体系结 北理工计算机学 机器级的实现虚拟(汇编虚拟(汇编语言实际(机器指令虚拟(高级语言第2L5先翻译成L4或L2,之后再由M4或M2实计算机体系结 北理工计算机学 机器级的实现实际机器(微指令)实际机器(微指令)虚拟机(机器指令计算机体系结 北理工计算机学 机器级的实现例如BASICLISP语言计算机体系结 北理工计算机学 高级语言机器(高级高级语言机器(高级语言,虚拟机器传统机器(机器指令集,实际机器操作系统机器(作业传统机器(机器指令集,实际机器操作系统机器(作业控制语言,虚拟机器汇编语言机器(汇编语言,虚拟机器微程序微程序机器(微指令集,实际机器

第1数字第数字计算机体系结 北理工计算机学 机器级的实现Q2:硬件实现,还是软件实在逻辑功能上,软件和硬件是等效实现,硬件实现的功能也完全可以由模拟完计算机体系结 北理工计算机学 机器级的实现计算机系统由软件、硬件和固件固件(Firmware)是指那些在能永久计算机体系结 北理工计算机学 机器级的实现Q2:硬件实现,还是软件实在逻辑功能上,软件和硬件是等效实现,硬件实现的功能也完全可以由模拟完但软件和硬件的性能价格比是不等效计算机体系结 北理工计算机学 机器级的实现软件与硬件实现的硬件软件速度快、成占用速度占用内存多计算机体系结 北理工计算机学 机器级的实现计算机体系结 北理工计算机学 机器级的实现成本硬软成本硬软软 计算机体系结 北理工计算机学 机器级的实现计算机体系结 北理工计算机学 多级层次结构的有利于理解软件、硬件、固件的地位理解各种语言的实 途探索虚拟机新的实现方法和新的系统理解计算机体系结构计算机体系结 北理工计算机学 计算机体系计算机计算机系统结构、组成、实现的相互计算机体系结 北理工计算机学 1964年,在推出IBM360系统时,

被认为是有史以来最伟大的计算机设计师之1922年生 南达科他州1948年毕业于南达科他大学,获电气工程学 1952年又获威斯康星大学博 曾在IBM工作,是IBM704计算机的主要同时也是360系列计算机研制的技 人物之一360系列计算机不仅是第三代集成电路计算机而且还开创了计算机通用化、系列化和标准化的先例计算机体系结 北理工计算机学 G.M.AmdahlOriginalOriginalIBMTodescribetheattributesofasystemasseenbytheprogrammer,i.e.,theconceptualstructureandfunctionalbehavior,asdistinctfromtheorganizationofthedataflowandcontrols,thelogicaldesign,andthephysicalimplementation.计算机体系结 北理工计算机学 基于多级层次结构的定计算机体系结 北理工计算机学 因此Amdahl计算机体系结 北理工计算机学 操作操作系统机汇编语言机高级语应用语计算机属性≡界微程序传统机计算机体系结 北微程序传统机

第2第1计算机体系结 北理工计算机学 在 体系结构定义中计算机体系结 北理工计算机学 指指令集(instruction“指令集结构”就是软硬件之间的界面计算机体系结 北理工计算机学 指令集结构软硬件之间的界址方式、器结构等。计算机体系结 北理工计算机学 传统机器级的属性:概念IBM360系列计算机体系结 北理工计算机学 算术和逻辑处理单传统机器算术和逻辑处理单大容大容器通 控制单 设计算机体系结 北理工计算机学 传统机器级的属性:概念 PCI

器AGP器

器PCI器PCI设PCIPCI设PCI设ISA/USB总 I/OI/O设I/OPC概念性结计算机体系结 北理工计算机学 传统机器级的属性:功能特计算机体系结 北理工计算机学 传统机器级的属性:功能特 计算机体系结 北理工计算机学 传统机器级的属性:功能特输入输出系统:I/O连接方式、处理机计算机体系结 北理工计算机学 透明性透明性定计算机体系结 北理工计算机学 透明性计算机体系结 北理工计算机学 MadebyMadebyyticalFirstprogrammedFirstelectronicHowardMarkElectromagneticMauchley&ENIACVacuumtubes,computedartillerytablesJohnFirststoredprogramannKenOlsonPDP-1andPDP-Transistors,SeymourCDCFirstIntegratedcircuits,firstofFirst32-IBMalcomputerFirstcommercialRISCFirst64-al计算机体系结 北理工计算机学 计算机体系结每个机器级都有其自己的系统结这里要学习的计算机体系结计算机体系结 北理工计算机学 计算机Computer对系统结构的逻辑所解决的问题:优化性能/计算机体系结 北理工计算机学 设计内容包数据操作对部件功能部件的控制机构的缓冲和排队预估、预判可靠性技术计算机体系结 北理工计算机学 计算机设计内容包数据

价格、部件的使用频操作对部件功能部件的控制机构的缓冲和排队预估、预判可靠性技术计算机体系结 北理工计算机学 1.2.2计算机共享程度高:价格便设计内容包数据

但减低速操作对部件功能部件的控制机构的缓冲和排队预估、预判可靠性技术计算机体系结 北理工计算机学 1.2.2计算机设计内容包数据

顺序串操作对部件功能部件的控制机构的缓冲和排队预估、预判可靠性技术计算机体系结 北理工计算机学 1.2.2计算机设计内容包数据操作对部件的共功能部件的并行

硬联微程序控制单机/多机/功能分布处控制机构的缓冲和排队预估、预判可靠性技术计算机体系结 北理工计算机学 计算机设计内容包数据操作对部件的共享程缓冲器及容功能部;控制机构的缓冲和排队预估、预判可靠性技术

计算机体系结 北理工计算机学 计算机设计内容包数据操作对部件的共享程化性功能部件的并行度化性控制机构的缓冲和排队预估、预判可靠性技术计算机体系结 北理工计算机学 计算机设计内容包数据操作对部件的共享程功能部冗余、容错等,以提高可控制机构的组成方式缓冲和排队预估、预判可靠性技术计算机体系结 北理工计算机学 计算机部件数据操作对部件功能部件的控制机构的缓冲和排队预估、预判可靠性技术计算机体系结 北理工计算机学 计算机Computer对计算机组成的物理实现,处理机、主存等部件的物理器件的集成度和器件、模块、插件、底板的划分和器件信号传电源、冷却、微组装技术、整机装配技其中,器件技术在实现技术中起主导计算机体系结 北理工计算机学 体系结构、组 的关即互相联系,又互相影响不同体系结构使用不同组成相同体系结构可以采用不同一种组成可以有不同组成也会影响体系结计算机体系结 北理工计算机学 的关计算机体系结 北理工计算机学 的关相同体系结构可以采用不同的组数据总线宽度不计算机体系结 北理工计算机学 的关相同体系结构可以采用不同的组IBM370系列机字长、数的表示和数据通计算机体系结 北理工计算机学 的关组成也会影响体系结一种组成可以有不同的实例如双极型的/MOS大容量单片/小容量多计算机体系结 北理工计算机学 的关指令系统的确定属体具体电路、器件的设计及装配技术等计算机体系结 北理工计算机学 的关计算机体系结 北理工计算机学 的关采用何种逻辑结构例如是否采用多体交叉)计算机体系结 北理工计算机学 的关此外,一种机器的体系结构可能维持许多年,但机器的组成却会随着计算机技术的发展而不断变化,其价格和性能也例例如,有3台计算没有有单级CPU片外第三台计算机既有CPU片内Cache,又有计算机体系结 北理工计算机学 的关 组成要考虑体系结 组成与实现不 的,需折中权衡组成简单,实现复杂/组成复杂,实现简实现计算机体系结 北理工计算机学 计算机体系结包括系统结构和组成两部分计算机体系结 北理工计算机学 计算机体系结“计算机系统结构”分为两部分计算机体系结 北理工计算机学 LevelsofDesign }}计算计算机体系北理工计算机软硬取舍在逻辑功能上,软件和硬件是等效计算机体系结 北理工计算机学 软硬取舍优缺实速度快,占实计算机体系结 北理工计算机学 软硬件取3软硬件取舍原则软硬件取舍原则软硬件取舍原则计算机体系结 北理工计算机学 软硬件取舍原则在现有器件和技术条件下,系统要有高主要考实现费计算机体系结 北理工计算机学 软硬件取舍原则实现费用=设计费用(Ds+Dh)+重复生产费硬件设计费用(Dh软件设计费用(Ds*硬件重复生产费(Mh软件重复生产费(Ms*某功设计:1重复生产设计重复生产计算机体系结 北理工计算机学 软硬件取舍原则R=软件重复出现次数(占用内存、占用介质C=该功能在软件实现时需重V=生产数量(台数每台硬件实现费用Dh/V+每台软件实现费用C×Ds计算机体系结 北理工计算机学 软硬件取舍原则只有Dh/V+Mh<C*Ds/V+100Ds/V+100Ms<C*Ds/V106/V+100<104*C/V+计算机体系结 北理工计算机学 软硬件取舍原则结论1:当R(软件重复出现次数)很大时,即某功能被经常使用时,适宜用硬件实计算机体系结 北理工计算机学 软硬件取舍原则计算机体系结 北理工计算机学 软硬件取舍原则计算机体系结 北理工计算机学 软硬件取舍原则 计算机体系结 北理工计算机学 计算机系出发点:多级层次三种设计思由上往下(Top-由下往上(Bottom-由中间开始(Middle-计算机体系结 北理工计算机学 性和环境,然后逐级往下设计计算机体系结 北理工计算机学 由上运行效率高,软硬分配合适用 机的设缺点适应性差,周期长,解决方不专门设计,从已有选型计算机体系结 北理工计算机学 可设计通用缺点硬件无法改变,软件设 软、硬件脱某些性能指标是 此方法很少计算机体系结 北理工计算机学 硬联计算机体硬联

优点向上传统机操作系汇向上传统机操作系汇编语高级语应用语缩短了研制交互式设计缺点微程序对设计人员微程序应有有效的软件设计环境北理工计算机学 计算机体系不仅仅包括软硬件界面的定还包括性能

瓶和评

计算机体系结 北理工计算机学 在所有可能的设计方案中不对计算机系统的各个部分进行取舍折设分费用设分分较差的方案普通方计算机体系结 北理工计算机学 性能响应时间(执行时间或延迟从任务开始到结束之间的全部时吞吐率(Throughput或带宽):运算速度计算机体系结 北理工计算机学 响应时间)与等待时间(用于磁盘、存储器、I/O操作、操作系统开销等通过运行“真实程序计算机体系结 北理工计算机学 响应CPUCPU运行某程序时的工作时间,不包括等待时间和运行其它程序的CPU时间=用户CPU时间+系统CPU时间用户CPU时间:用户程序所花费的CPU时间计算机体系结 北理工计算机学 “快”(Fast)的含“X比Y快”的含义是:对于给定任的响应时间比Y少。“X比Y快n倍”是指响响应时间响应时间由于响应时间与性能成反比,又有11响应时间响应时间性能1性能性能性能计算机体系结 北理工计算机学 不同的量度应编程语数据通

每秒操作每秒百万条指令每秒百万次浮点操作每秒时钟数(时钟速率计算机体系结 北理工计算机学 吞吐MIPSMIPS指令条CPU时间主要缺点:依赖于机器(指令系统,硬件等适合衡量标量处理机计算机体系结 北理工计算机学 吞吐MillionsofFloatPointOperationsPer针对功能性指令 CPU时间106缺点 机器的整体性适于衡量向量处理机的1MFLOPS计算机体系结 北理工计算机学 吞吐率:其他它们之间的关系1MFLOPS=浮点运算X1GFLOPS=浮点运算X1TFLOPS=浮点运算X1PFLOPS=浮点运算X计算机体系结 北理工计算机学 CPU性能计算程序CPU时间的3主时钟频率fc(主频,单位为反映了计算机实现技术、生产工艺和计(InstructionCounter)反映了计算机指令级的结构和(CyclesperInstruction)反映了计算机实现技术、指令系统的结计算机体系结 北理工计算机学 1.4.2CPU性能程序的总序的总时钟CLKIC计算机体系结 北理工计算机学 1.4.2CPU性能fc和CPU时钟周期TfcTfc计算机体系结 北理工计算机学 1.4.2CPU性能周期执行的指IPC(InstructionsperCycle)表示。IPCIPC1计算机体系结 北理工计算机学 1.4.2CPU性能CPU性能CPU==xxTTICCPIICCPITTCLKCLKT计算机体系结 北理工计算机学 1.4.2CPU性能(ICiCPIinTi T(ICi(ICiCPIinTi T(ICiinCPIICin CPIICin in( CPIi1.4.2CPU性能MIPS与CPUMIPSMIPSTCPUICCPI1fc106IPCf106c计算机体系结 北理工计算机学 1.4.2CPU性能等效指令执行时等效指令执行时T(Winn等效指令速MIPSCPI(CPIinWi——第i种指令的CPIi——第i种指令的

Ti——第i种指令的执行时MIPSi——第i种指令的计算机体系结 北理工计算机学 1.4.2CPU性能、减法50%,乘法15%,除法5序控制15%,其他15计算机体系结 北理工计算机学 1.4.2CPU性能 若A机的CPU主频为8MHz,则A机CPU时钟周期为多少若B机的CPU主频为12MHz,B机的平均指计算机体系结 北理工计算机学 1.4.2CPU性能例1:解(1)A机CPUTCLK=1/8MHz0.125us(2)A机平均指令1/0.4MIPS2.5us(3)ACPI=2.5us/0.125us=B机的平均指令执行=主频0.6MIPS计算机体系结 北理工计算机学 1.4.2CPU性能计算机体系结 北理工计算机学 1.4.2CPU性能例2等效等效计算机体系结 北理工计算机学 1.4.2CPU性能计算机体系结 北理工计算机学 1.4.2CPU性能例3:0.80计算机体系结 北理工计算机学 1.4.2CPU性能例4:假其它指令比较两种方案哪个更①把浮点求平方根指令CPI降至②把所有浮点操作CPI降至2.5计算机体系结 北理工计算机学 1.4.2CPU性能例4:CPI原①:除浮点求平方根之外的浮点指令的=(4-(2/25)×20)/=CPI=(2.61×23%)+(2×2%)(1.33×75%)②:CPI=(2.5×25%)+计算机体系结 北理工计算机学 1.4.2CPU性能例5:某台计算机只有Load/Store指令能对 指令类指令所占算逻1Load指2Store2转移2计算机体系结 北理工计算机学 1.4.2CPU性能(1)求上述情况下的平均CPI,另一个必须在算逻指令执行前用Load指 种算逻指令,其特点是一个操作数取自寄存,另一个操作数取 器,即寄存器计算机体系结 北理工计算机学 1.4.2CPU性能例5:CPI=新算逻指令的比例指令类指令所占比21Load2Store指23新算逻指令的增加,减少了Load指令所占%计算机体系结 北理工计算机学 1.4.2CPU性能CPInew√×=√×CPInew12%×2+24%×3)计算机体系结 北理工计算机学 1.4.3计算机如:MIPS、3×500MHz=1500计算机体系结 北理工计算机学 1.4.3计算机8台机器组Cluster系统,每台机器是4个PentiumIII500组解峰值指令速500MHz843=即每秒480计算机体系结 北理工计算机学 1.4.3计算机算术平算术算术时间平均值Am1nnTi算术速率平均值Am1nn1nRinTi计算机体系结 北理工计算机学 1.4.3计算机调和平nnnnTi1Ri几何性能平Gmi1nR1R2计算机体系结 北理工计算机学 1.4.3计算机 n算术平ni1算术时间平均值Ami1i1i1i1i1nn

WRWiiii计算机体系结 北理工计算机学iiii1.4.3计算机iW调和平iWnn

Wnn几何nniGm(Ri计算机体系结 北理工计算机学 1.4.3计算机计算机体系结 北理工计算机学 1.4.3计算机例:比较下列哪些机器好计算机计算机计算机程序1程序总计权值权值权值程序程序总计算机体系结 北理工计算机学 1.4.3计算机例 算术平均ABC程序1程序算术平均执行时间计算机体系结 北理工计算机学 计算机ABCABCABC程序程序算术平均几何平均算算术平均值因参考机器不同而不几何平均值不随参考机器的变化而变计算机体系结 北理工计算机学 性能评测评测程序:如 arks等硬件:费用、延迟、面积、功率等多种级别的(Rulesof基本定律/原注意:所有的性能评测均是针对时间计算机体系结 北理工计算机学 把应用程把应用程序中用得最频繁的为评价计算机性能的标准程序,称为 ark)五种评测程序:评测的准确度依次修改程小型基准程序。如:Livermoreloops、计算机体系结 北理工计算机学 评测五种评测程序:评测的准确度依次修改程小型基准程综合基准程

例如:C编译器、字处CAD软件、图像处理程序计算机体系结 北理工计算机学 评测五种评测程序:评测的准确度依次修改小型综合计算机体系结 北理工计算机学 评测五种评测程序:评测的准确度依次修改程综合计算机体系结 北理工计算机学 评测五种评测程序:评测的准确度依次修改过的程程小型基准程综合基准程

计算机体系结 北理工计算机学 评测五种评测程序:评测的准确度依次修改过的程程小型基准程综合基准程

计算机体系结 北理工计算机学 评测整数测VAX- 为每 Dhrystones,即1VAXMIPS=1757计算机体系结 北理工计算机学 评测浮点测MFLOPS(MillionFloatingPointOperationsPerSecond或GFLOPS、计算机体系结 北理工计算机学 评测Whetstone基准测试组变址、条件转移、函数。evaluationCooperative) 计算机体系结 北理工计算机学 SPEC能够全面反SPEC能够全面反映机器的性能,具有很高的参考价值桌面计算

作为基数 SPECCPU2000:12个整数基准程序,14个浮点基准程SPECviewperfSPECapc:图像测试程服务SPECSPECSFS:测试NFS性SPECWeb:Webserver TPC-x:测量事务处理、排队系统、决策支持、数据库应嵌入式处EEMBC:EDN嵌入式微处理器测试程 发布的测计算机体系结 北理工计算机学 测试程序 Lang.Ref. CCFPGACircuitPlacementandCCProgrammingLanguageCCombinatorialCGamePlaying:CWordCPERLProgrammingCCObject-orientedC PlaceandRoute计计测试程序 Ref. Physics/QuantumShallowWaterParabolic/EllipticDifferentialC3-DGraphicsComputationalFluidCImageRecognition/NeuralCImageProcessing:FaceCComputationalNumberTheory/PrimalityHighEnergyPhysicsAcceleratorMeteorology:Pollutanttt 理工

CINTCCCCCCArtificialInligence:CSearchGeneCArtificialInligence:C CCompressionDiscreteEventXML计算机

北理工计算机

FluidFluidQuantumCPhysics:QuantumPhysics/GeneralFluidFiniteElementImageRay-StructuralComputationalQuantumCFluid482.i3 北c 定量设程序局部性时间局最近的未来要用到的信息可能就是当前正在使用的空间局部最近的未来要用到的信息可能就是当前信息的相邻计算机体系结 北理工计算机学 1.4.5定量设价格容量速度层速度

磁盘、磁带、光主存L2CacheL1寄存程序局部性原理的计算机体系结 北理工计算机学 定量设计算机体系结 北理工计算机学 定量设计原理:Amdahl计算机体系结 北理工计算机学 加速比系统加速比系统性能改进后总执行时间 总执行总执行时间总执行时间改进计算机体系结 北理工计算机学 系统加速比依赖于两个因可改进比例0≤Fe≤1。1Fe表示不可改进部部件加速比下,Se>1。计算机体系结 北理工计算机学 ToldToldSeSn1(1Fe)FeFeT1SeT12计算机体系结 北理工计算机学 性能递减进,则改进越多,系统获得的效果1/(1-Fe)(即Se→∞时)。计算机体系结 北理工计算机学 1014114

计算机体系结 北理工计算机学 可见,好”的计算机系“MaketheCommonCase计算机体系结 北理工计算机学 Sn(FPSQR)Sn(FPSQR)11Sn(FP)1(10.5)1 增加专门的FPSQR硬件,可提高速度10倍;另一计算机体系结 北理工计算机学 Amdahl定律解:由题意可知:Se=25,Sn=4Amdahl41(141(1Fe)计算机体系结 北理工计算机学 Amdahl定律请问程序的最大加速比可达多计算机体系结 北理工计算机学 11Sn1(1Fe)1(1Sn1(1Fe)1(110%)1010.90.1SSe10.90./

Sn

T0T'dT

1TdTe)T

T

(1FdFe)Fd 计算机体系结 北理工计算机学Amdahl定律计算机体系结 北理工计算机学 Amdahl定律加速比=增强前时间/增强后=1/((1-0.2-计算机体系结 北理工计算机学 Amdahl定律CISC,该RISC的加速比是多解:Sn

(1FdFe)Fd 1

11(10.940.01)0.945计算机体系结 北理工计算机学 影响系统要设计出好的计算机体系结必须掌握系统结构设计的方计算机体系结 北理工计算机学 体系结构在不提供支

进、催生技 新的应用影响重大的4种技集成半导体计算机体系结 北理工计算机学 体系结构在不1950sto(1970stomid–InstructionSet–especiallyISAappropriatefor–DesignofCPU,memorysystem,I/OMultiprocessors,–Non annarchitectures,DNAComputingQuantum(量子Computing计算机体系结 北理工计算机学 技术的重Newtechnologiesnotonlyprovidegreaterspeed,sizeandreliabilityatlowercost,butmoreimportantlythesedictatethekindsofstructuresthatcanbeconsideredandthuscometoshapeourwholeviewofwhatacomputeris.Bell&计算机体系结 北理工计算机学 技术是决定性IntegratedcircuitsVLSI(initially)Flashmemories,CoreMagneticLow计算机体系结 北理工计算机学 ButAspeoplewriteprogramsandusecomputers,ourunderstandingofprogrammingandprogrambehaviorThishasprofoundthoughslowerimpactoncomputerarchitectureModernarchitectscannotavoidattentiontosoftwareandcompilation计算机体系结 北理工计算机学 技 与体系结构设计算机体系结 北理工计算机学 问题的软件成本越软件产量和可靠性的重新研究合理的软、硬件功能积累了大量 软排错比编 、软件生产率不希解决:软件的可移植性计算机体系结 北理工计算机学 软件的可移软件不用修改或只需少量加工就能由一台机器搬到另一台机器上运行,即同一实现技术:3统一高级语采用系列机模拟计算机体系结 北理工计算机学 统一高采用统一的、不依赖于任何具体机器的通用高级语言编制应用程序,则应用软采用通用高级语言编写操作系统的全部或部分功能,则这部分系统软件也可以 计算机体系结 北理工计算机学 统一高问习惯的影响,不愿抛弃计算机体系结 北理工计算机学 统一高趋可以先统一成少数几局部范围内计算机体系结 北理工计算机学 采用系列统一汇编语言或机器语言,实现系统结系列机定有不同组成的一系列不同型号的普遍并成功计算机体系结 北理工计算机学 IBM兼容性问60年代初期,IBM有4→→小型通用计算→→每个系统拥有其自己I/O系统,辅存:磁带,磁鼓,磁汇编程序,编译市场 ,科学计算,实时计算机体系结 北理工计算机学 IBMS/360目标(部分1.用一个系列机替代已经成功、但不兼容的那些计2.提供“可以满足各种数据处理需求的可扩展3.提供“程序严格兼容”的处理机,以保证任何型号的器都能容易地满足用户不断扩展的需,发布了S/360系首次提供的产品包括、、、、计算机体系结 北理工计算机学 IBMS/360计算机体系结 北理工计算机学 IBMS/360相同的系统结构,不同的组成 相同的指令系统,分别采用顺序执、流水和并行处理方的宽度则分别为、、、位。计算机体系结 北理工计算机学 PC Pro、PentiumMMX;不同的不同的机器字长:8位(8088)/16(80286)/32位(80386)/64计算机体系结 北理工计算机学 PC计算时处理字主要I/O总空PC和PC16PC20PC位2480386位3280486位32Pentium3232PentiumIIPentium3232PentiumIIIPentium32PCI+AGP32Pentium4Pentium32PCI-X+AGP32计算机体系结 北理工计算机学 PCPCATI/OI/O器PCXT和PC计算机体系结 北理工计算机学 PC

处理器总线VL总 器 VL器VLISAI/OI/OPC80386计算机体系结 北理工计算机学 PC

总线控制器 总线控制器器PCI总总线总线控制器PCIISA/USBI/OI/O计算机体系结 北理工计算机学 PentiumPentium

总线控制器总线控制器器AGPPCI总AGP总线总线控制器PCIISA/USBI/OI/O计算机体系结 北理工计算机学 PentiumPentium

总线控制器 总线控制器器PCI/PCI_E总总线控总线控制器PCI设PCI_E设USBUSBUSB设计算机体系结 北理工计算机学 采用系列与“从中间开始”的设计方法相呼较好地解决了软件环境要求相对稳定与 各档机器的软件兼容,因为程序员看到计算机体系结 北理工计算机学 软件兼容定通过采用相同的系统结构实计算机体系结 北理工计算机学 向上(下)

机器按某档机器编制的软件,向上不加修改就能运行于比它兼容高(低)档的机器上。向前(后)兼 向

当前在按某个时期投入市场的该型号机器上编制的软件,不加修改就能运行于在它之前(后)投

兼 向 向兼 兼时计算机体系结 北理工计算机学 系列机软件兼系列机软件必须保证向后兼容,力争做系列机中各档机器的性能价格比计算机体系结 北理工计算机学 采用系列系列机方法的优点系列机之间软件兼容,可移插件、接口等相互兼便于实现机便于维修、培训有利于提高计算机体系结 北理工计算机学 采用系列系列机方法的主要缺点 计算机体系结 北理工计算机学 采用系列兼容机定不同厂家生产的具有相兼容机的 计算机体系结 北理工计算机学 模拟与问题的软件移植系列机相同系不同系统结构解决计算机体系结 北理工计算机学 模拟与模拟用一种机器(A)的机器语言解释实现另一种机器的指令系统,使具有的指令系统,从被模拟的——虚拟模拟用的——宿主解释程序——模拟程计算机体系结 北理工计算机学 3模拟与实际机(机器指令虚拟机器(操作系统虚拟机器(应用语言虚拟机器实际机(机器指令虚拟机器(操作系统虚拟机器(应用语言(高级语言虚虚拟机器(汇编语言虚拟机器(操作系统实际机器(机器指令B虚拟机器虚拟机器(操作系统实际机器(机器指令实际机器(微程序)图用实际机器(微程序)计算机

北理工计算机

A虚拟机器系

模拟与模拟内数据表示 系统,I/O系统等,形模拟程序很不能被硬件直接执行,速度较低、实时性计算机体系结 北理工计算机学 模拟与仿真用一种机器(A)的微程序直接解释实现另一种机器(B)的指令系统,从而实现软件移植被仿真的———目标进行仿真的——宿主解释微程序——仿真微计算机体系结 北理工计算机学 3模拟与实际机(微程序虚拟机器(操作系统虚拟机器(应用语言虚拟机器实际机(微程序虚拟机器(操作系统虚拟机器(应用语言(汇编语言虚拟机器(操作系统实际实际机器(机器指令实际机器(机器指令B虚拟机器系仿真方法实现软件

A虚拟机器植计算机体系结 北理工计算机学 模拟与仿真内数据表示、 系统、I/O系统等,形成优点被移植的软件运行速仿真程序更计算机体系结 北理工计算机学 模拟与仿真:使用微程序,解释程序在控存模拟:使用机器语言,解释程序在主模拟方法运行速度低,仿真仿真需要较多的硬件(包括控 器通常将模拟和仿真混计算机体系结 北理工计算机学 软件的可移植性(小结统一高级计算机体系结 北理工计算机学 软件的可移植性(小结系列计算机体系结 北理工计算机学 软件的可移植性(小结问题:结构差别大时,效率和速度急计算机体系结 北理工计算机学 软件的可移植性(小结速度损失小,可实现不同系统间的软件移需结计算机体系结 北理工计算机学 应用对系统的结构的发展有重要的影响。应用对系统结构提出广泛要求,其中一程序可移植高性能价格易于计算机体系结 北理工计算机学 1.5.240~50年代科学简单通用50年代中/时机60同时支持商业、事良性循计算机体系结 北理工计算机学 1.6.260年代70年代容错技70特高速应用,数据70高速阵列处理部数组处理8090知识处理,智能然语言理解计算机体系结 北理工计算机学 分器体系结构技软件技典型机第一电子管和继电程序计算机程序控制晶体管印刷电浮点数寻址技术、中断I/O高级语言和编译批处理系序先行处理、系列算多道程序和分操作系DECPDP-8向量处理、分式并行与分布处路指令级并行SMP、MPMPP可扩展并行与布处SGICrayT3EIBMxServerSunE10000计算机体系结 北理工计算机学 应用需求的程序及数据所使用器容量的不断增大:程序所需的器容量平均每年递程序的DRAM技术的发计算机体系结 北理工计算机学 应用需求的通用计PCs工作站/服务器,小型

嵌入式系计算机体系结 北理工计算机学 应用需求的微机系性能价$1000$10,000$100$1000处理器服务吞吐量(throughput可用性(availability)可扩展$10K$10M$200$2000处理器嵌入式系低价位低功耗实$10$100,000$0.20$200处理器计算机体系结 北理工计算机学 机器性能随时间动态增强,价格不断降处理性能和价格的两种途计算机体系结 北理工计算机学 1.5.2价)等性能

年性能、价格、时间计算机体系结 北理工计算机学 从系统结构的观点看,各档(型)计算机机器上,甚至照搬高档(型)的系统虚 器数据表示,I/O流水,并行;计算机体系结 北理工计算机学 计算机使用的基本器小规模计算机体系结 北理工计算机学 1.5.3晶体管密度每年以35%增长,4年翻2番尺寸每年增长使得每 上晶体管每年增长计算机体系结 北理工计算机学 计算机体系结 北理工计算机学 历史从4004世界上第一台微型电种器之计算机体系结 北理工计算机学历史从这里飞P4AP4A80586:AMDK5、Cyrix64位DEC:AlphaIBM、MotorolaSGIPENTIUMProPentium1997:PENTIUM PENTIUMIIIAMD计算机体系结 北理工计算机学

历史在这里使频率不断AMDThunderbirdVIAPENTIUMIV,超线程亿个晶体2MBL2,外频533MHz亿个晶体2计算机体系结 北理工计算机学

历史在这里使PentiumSunUltraSPARCIV.8MB缓存/核,2.4GB/s内存 :6 :6presler-PentiumD945,4MB

GA775 3计算机体系结 北理工计算机学 多核技术持续管管线晶

端计算机体系结 北理工计算机学 多核技术日趋2008,2008,45nm,原生四计算机体系结 北理工计算机学 多核技术日趋 AMDPhenomX38750,羿龙 程技术、SSE4.2,8MBL3(游戏、影 计算机体系结 北理工计算机学 集成电路逻辑计算机

北理工计算机

图Advancesin SPECInt95SPECInt9542XClockSpeed 2XIPC

81.3(projected)PentiumIV2.8GHz45.2(projected)PentiumIV1.7GHz Pentium

PPro(superscalar,out-of-

(superscalar,out-of- 80486DX266MHz

PentiumII(superscalar,out-of- 计算机体系结 北理工计算机学 Advancesin 计算机体系结 北理工计算机学 集成电路逻辑

微处理器晶体

Itanium®2

Pentium®IIIProcessor Pentium®4

Pentium®

Pentium®II

386™

486™DX

微处理器中可以集成的晶体管数目:20084.1CMOS技术提高情况:线宽每7年降低一半逻辑电路: 晶体管数以50%-80%/y的速率增长(密度和尺寸)计算机体系结 北理工计算机学 Moore(Moore’sOriginaldefinition(Moore,1965):Microprocessortransistorcountdoubleseveryyear.Thenchangedto“doublesevery2years”.Sincethen,othermeasureswereused,suchasprocessingpower,complexity,etc.anddoublingtimesettledat18计算机体系结 北理工计算机学 集成电路逻辑计算机体系结 北理工计算机学 器件发SizeSize半导体

1

41

256每3-4年增加4倍时间平10年减少

计算机体系结 北理工计算机学1.5.3器件发磁 技 时间过去10年缩短了网络技近年来带宽提高速度如以太网从10Mbps提高到100Mbps花了计算机体系结 北理工计算机学 1.5.3器件发容延迟逻2x42x42x32x10磁4x22x10Network(bandwidth10x5计算机体系结 北理工计算机学 器件发计算机已经发展了计算机体系结 北理工计算机学 1.5.3器件发6070年代非用微程70计算机体系结 北理工计算机学 1.5.3器件发第一第二

普林斯顿ISAENIAC、UnivacLARC、

SSI和MSI

流水线、Cache、多道程序

IBM360/370第四第五

多层印刷路、微LSI和VLSI高性能微

先行处理、列计算 量、超

分时操作统大规模、

CDC6600/7600DECVAX9000、Convax-(1991-

理器、高

水、SMP、MP、扩展并行

SP2、度电计算机体系

分布处北理工计算机

1.5.3器件发改变了逻辑设计的传统逻辑简化充分利用VLSI,获得更高的性缩短周期,提高效能,使用大批量生产的硬的逻辑设计微程序、微高级语言CAD等软的设计算机体系结 北理工计算机学 1.5.3器件发使系统结构“下移”的速度大型机的数据表示、指令系统、OS等很快多个CPU促进了算法、语言和软件的并行处理机/网络并行算法、并行语言、计算机体系结 北理工计算机学 1.5.3器件发总器件的发展是推动系统结构和组成前进系统结构设计者要密切了解器件的现状和发展趋势,关注和分析新器件的出现和集成度的提高会给系统结构的来什么样的新途径和新方计算机体系结 北理工计算机学 技 与体系结构设功“功耗墙”(Power“频率墙”(Frequency不能仅仅依靠提高处理器的主频来提高计算机体系结 北理工计算机学 技 与体系结构设10Processor10ProcessorMemory1MemoryCalendaryea

处理器性能 系统性能之间存在巨大差 墙Memory计算机体系结 北理工计算机学技 与体系结构设处理处理器I/O主频主频处理器的主频与I/O总线时钟频率之间存在巨大(I/O墙I/O计算机体系结 北理工计算机学 1.6系统结构开发并行性是提高系统性能的有效途并行性可以同时进行运算或操作的特性,包含同时性(simultaneity):并发性(concurrency):同一时间间隔内计算机体系结 北理工计算机学 系统结构同时t并发性:可以同时 或交错执t并行性从执行程序的角度看,分为五级(低→高指令内部:指令之间:线程级并行:任务或进程之间:多个任务或程序段的并行执行;作业或程序之间:多个作业或多道程序的并行执实现上述并行性的方法是不计算机体系结 北理工计算机学 并行性位串字串:一个字的一位,串行单处位并字串:一个字的全部位,并行单处理位串字并:许多字的同一位,并行处理领全并行:许多字的全部或部分字位计算机体系

北理工计算机

并行性从信息加工的步骤和阶段看,分为(低→高 (多体多字)并 计算机体系结 北理工计算机学 并行性从信息加工的步骤和阶段看,分为(低→高(续处理器操作并行:重复设置大量处理单元,在同一个控制器的控制下,对多个数据组同时操作指令、任务、作业并行:多个处理机同时对多条多处理机;计算机体系结 北理工计算机学 时资源资源计算机体系结 北理工计算机学 时计算机体系结 北理工计算机学 时取分取分执部执k执k分 k分kk取k取k 时 时 处理方计算机体系结 北理工计算机学资源引入空间因素,重复设置多套提高速度,同时提高可CU:控制单 PE:处理单图资源共享处理计算机体系结 北理工计算机学 资源计算机体系结 北理工计算机学 计算机体系结 北理工计算机学 计算机计算机体系结 北理工计算机学 计算机1960流水线单处1990年以享虚拟器的异构型计算机网计算机体系结 北理工计算机学 途径1:时 (主要途径基础:部件功 化把每一部分指定给一个专门的部件完 起来,使所有部件依次分工完成一组计算机体系结 北理工计算机学 (EX) 器部件(M)和写果部件计算机体系结 北理工计算机学 时IFIDEXMWBIFIDEXMWBIFIDEXMWB执指令 指令 指令IFIDEXMWB时 IFIDEXMWB执 IFIDEXMWB

指令计算机体系结 北理工计算机学形成了:指令流水线,操作流发展出了:向量处 计算机体系结 北理工计算机学 异构型(非对称型)多处理机计算机体系结 北理工计算机学 途径2:资源重复(已普遍使用基础:部件冗多操作部件, 发展出:并行处理机,相联进一步用处理机代替冗余部件,形成(对称型)多处理机计算机体系结 北理工计算机学 同构型(对称型)多处理机计算机体系结 北理工计算机学 途径3:资源共多道程序,分时多终端 终端,智能终计算机体系结 北理工计算机学 分布处理计算机体系结 北理工计算机学 并行处理计算机有四种基本流水线计主要通过时间,各处理机为非对称异构型处理阵列计主要通过资源重复,各处理机为对称同计算机体系结 北理工计算机学 并行处理计算机有四种基本结构(续):并行。根据是否共享内存,分为紧耦合、松耦数据不同于传统控制流机器采用的通过共享单元让数据在指令之间传递的方法,数据流计算机没有通常的共享变量的概念,数据是以表示某一操作数或参数已经准备就绪的数据令牌的计算机体系结 北理工计算机学 多机系统包多处多计计算机体系结 北理工计算机学 多处理机由多台处理机组成的单一计各处理机有自己的控制部件、局部器,由逻辑上统一的操作系统控制,处理机之计算机体系结 北理工计算机学 多计算机由多立的计算机组成的实现作业间计算机体系结 北理工计算机学 分为计算机体系结 北理工计算机学 最低耦各种脱机系除通过某种中间介质外,各计算机之间例如独立计算机系统由主机和计算带、磁盘、纸带等对主机输入/输出提供支计算机体系结 北理工计算机学 松散耦享某些如磁带、磁盘等设备,以较低频有以下两种计算机体系结 北理工计算机学 功能化的多台计算机通过通道与共享外数据集形式送到共享设备,供其他机器计算机体系结 北理工计算机学 各台计算机通过通信线路连成计机网络,计算机体系结 北理工计算机学 松散耦合(续特点:系统是非对称的,采用异步方优点:结构灵活,系统易于范围:非常适合于分计算机体系结 北理工计算机学 紧密耦合(或直接耦合可以实现数据集级、任务级、作业级 计算机体系结 北理工计算机学 功 处理机(松散耦合系统高级语言处理机、数据库处异构型多处计算机体系结 北理工计算机学 机间互可重构、容紧密同构型多处计算机体系结 北理工计算机学 网络互通信处理机 网局部分布计算机体系结 北理工计算机学 1.6.3计算机无论是单处理机还是多计算机系统,按不同技术途径,均朝着以下三个方向发同构型多处异构型多处分布式多处它们是三种不同而有代表性的计算机系计算机体系结 北理工计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论