版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2022-2-1612022-2-162现现 代代 计计 算算 机机 体体 系系 结结 构构2022-2-1632022-2-1642022-2-1652022-2-1662022-2-1672022-2-1682022-2-1692022-2-1610第一章第一章 现代计算机体系结构概述现代计算机体系结构概述2022-2-16112022-2-16122022-2-16132022-2-16142022-2-16152022-2-16162022-2-16172022-2-16182022-2-16192022-2-16202022-2-1621决定可靠性由假定正确仅考虑逻辑正确性,且iis
2、tprcocaspistipricoicaispiststrrrrrstrprrcorcarsprippiiiiiiiiii111)()(12022-2-16222022-2-16232022-2-16242022-2-16252022-2-16262022-2-16272022-2-1628iikjijiijijkjijinTtTnttt112022-2-1629knTti2022-2-16302022-2-1631ikjijijijitnfrt1)(2022-2-16322022-2-16332022-2-16342022-2-16352022-2-16362022-2-1637设计中存在
3、逻辑错误设计中没有逻辑错误01ic2022-2-1638iikjijikjijijirklrl1112022-2-16392022-2-1640minmax11ijpijpijpikjimpijpijpijissskmsrrsii2022-2-16412022-2-16422022-2-1643同级的模块为系统中所有与无关联影响有关联影响injjkjjiMnrjijirtbi101),(),(1112022-2-16442022-2-16452022-2-164611111eckcjijkcjkcjijijijeijijijcirrrrrrreiii2022-2-16472022-2-1648
4、1)(etbslieitbisiliirrrrertbrsrl rcsa2022-2-16492022-2-16502022-2-16512022-2-16522022-2-16532022-2-16542022-2-16552022-2-16562022-2-16572022-2-165811111olpkjkjijoijlpiirrorlprplpii2022-2-16592022-2-16602022-2-16612022-2-16622022-2-16632022-2-1664iikjijkjijijirlcrlc1112022-2-16652022-2-16662022-2-1667
5、 iiikiijniinikjoldijijinikjnewijijiimrrprrprrap111111112022-2-16682022-2-1669niprprpnikjoldijijnikjnewijijiii1111112022-2-16702022-2-16712022-2-16722022-2-16732022-2-16742022-2-16752022-2-16762022-2-16772022-2-16782022-2-16792022-2-16802022-2-16812022-2-16822022-2-16832022-2-16842022-2-16852022-2-16
6、862022-2-16872022-2-16881.1 现代计算机体系结构的演化现代在此书中指1974至今.VLSI(Very Large Scale Integration)的广泛使用为特点。几乎所有的高性能计算机都是由各类高档微处理机组成。很多先进的结构方案直接制作在微处理机中,并充分考虑多处理机应用的要求。 1.1.1 1.1.1 微处理机的发展微处理机的发展 1.1.2 1.1.2 微型计算机硬件结构的演化微型计算机硬件结构的演化 1.1.3 1.1.3 微型计算机软件的演化微型计算机软件的演化2022-2-16891.1.11.1.1 微处理机的发展微处理机的发展微处理机的发展历史主
7、要基于两条线索,一种是在小型机的体系结构基础上进行模仿,把当时比较优越的体系结构引入到微处理机中;另一种是采用全新的思路构造独特的体系结构。 1 1、仿照当时成熟的小型机中央处理机、仿照当时成熟的小型机中央处理机(CPUCPU): :如如MC6800(MC6800(仿仿NOVA).NOVA). 2 2、重新設计、重新設计: :如如INTELINTEL 2022-2-1690n4位机:4004,几乎无中断处理系统。n8位机:处理机中仅集成了基本的运算器和控制器I0控制方式除按程序控制方式程序控制方式外,巳具有强大的中断处理系统中断处理系统.2022-2-16912022-2-16922022-2
8、-16932022-2-16942022-2-16952022-2-16962022-2-169711011trtsps2022-2-16982022-2-1699minmin11011)min()(1tstnNitststrtntsppipp2022-2-161002022-2-161012022-2-16102)(11012ttnrtsppp2022-2-161032022-2-161042022-2-161052022-2-161062022-2-161072022-2-161082022-2-161092022-2-161102022-2-161112022-2-161122022-2
9、-161132022-2-161142022-2-161152022-2-161162022-2-161172022-2-161182022-2-161192022-2-161202022-2-161211.1.2 1.1.2 微型计算机硬件结构的演化微型计算机硬件结构的演化在构建计算机硬件体系时着重要考虑的是:处理机如何与存储器连接;如何与各种外部设备连接;如何与其他处理机连接等。对于一台以微处理机为基础的计算机,最能体现其硬件结构特征的是机器中所采用的总线结构。 一、系统总线结构的发展(单一、系统总线结构的发展(单CPU):系统总线:一组用于连接系统总线:一组用于连接CPU、内存、外设接口
10、的公用通信线、内存、外设接口的公用通信线路。路。ISAISA(工业标准体系结构)(工业标准体系结构) EISA PCI USBEISA PCI USB2022-2-161222022-2-161232022-2-161242022-2-161252022-2-161262022-2-161272022-2-161282022-2-161292022-2-161302022-2-161312022-2-161321.1.3 1.1.3 微型计算机软件的演化微型计算机软件的演化 按照微型计算机体系结构讨论的范畴,引起我们关注的微型计算机软件包括: (1)机器级的指令系统,是最底层的软件结构,与机器
11、级的指令系统,是最底层的软件结构,与硬件结合最紧密,就其特征来说,应属于硬件体系结构硬件结合最紧密,就其特征来说,应属于硬件体系结构的一部分;的一部分;(2)操作系统以及有关的编译程序等,是上层软件操作系统以及有关的编译程序等,是上层软件结构的基础,属于软件体系结构中的核心部分。结构的基础,属于软件体系结构中的核心部分。2022-2-161331. 指令系统的发展指令系统总是与硬件结构紧密相连的,以80 x86为例:第一阶段:强调功能的增强8086处理机是为单用户单任务设计的,所以其指令系统只是原8位机的扩展,除了由于采用了段结构而增加的增加的寻址方式寻址方式、提供8087浮点浮点协处理器及其
12、指令系统,并没有什么质的变化。主要针对功能的增强功能的增强。针对可靠性指标可靠性指标的提高,80286处理机增加了保护模式保护模式下的指令系统,为了保持和老机型的兼容兼容,提供实模式和保护模式间的转换,提高可扩展性指标可扩展性指标。2022-2-16134n第二阶段:强调性能/价格比的提高 80 x86系列的后续处理机,即Pentium系列,包括Pentium 4在内,对指令系统作了重大的改进。采用RISC设计思路设计思路,主要针对性能价格比性能价格比。 还特别设置了一些特权指令,将处理机的全部操作权力分为管态管态和目态目态,目的在于提高可靠性指标可靠性指标。于是处理机可以很好的支持多道作业。
13、 同时采用分页分页方法实现存储器管理存储器管理,支持系统的虚拟存储器,提高内存模块的容量指标容量指标。n从Pentium处理机起还增加了检查CPU ID的功能,且为了在多处理机情况下解决对总线争用的竞争,增设了APIC(高级可编程中断控制器),也增添了一些相应的指令。2022-2-161352. BIOS(操作系统的一个关键子模块)的发展使用计算机的人们在关心操作系统时,往往注重其与人的交互界面,于是有 DOS、Windows和Linux等的差别。但是作为体系结构研究者关心的是其最底层的内容,即直接控制硬件动作的部分,在微型计算机中就是BIOS(基本输入输出系统)(基本输入输出系统)。BIOS
14、出现的原因:主要针对提高系统可扩展性可扩展性。2022-2-16136n就目前操作系统的发展而言,BIOS并没有达到理想的状态,并不是所有针对硬件的服务程序都在BIOS中实现,有些操作系统为了自己提高硬件的操作效率,推出了自己的局部硬件局部硬件服务模块服务模块,例如DirectX。n这是一种可扩展指标可扩展指标与速度指标速度指标(或其它指标)之间的协调。n与最初的PC机相比,现代微型计算机的BIOS除了仍担当对各种I/O操作的基本控制外,还可以赋与升级的微代码标记微代码标记。2022-2-16137 所谓的升级包括两种情况,一种是一种是CPU升级,另一升级,另一种是多处理机的升级。种是多处理机
15、的升级。 前者是指同一型号的CPU,在不断修正其硬件错误中推出的不同版本,在BIOS中专门设置了2KB空间存入该版本的微代码。 后者则是当系统采用多处理机时,需要存入多个处理机的版本信息,即系统要对每一个处理机的版本有一个升级映射,在初始化时必须验证系统所有的处理机的存在情况。2022-2-161383.编译系统的发展传统编译系统:将高级语言编写的源程序翻译为CPU可以直接执行的目标代码,涉及到词法分析、语法分析、代码优化等必要的步骤。编译系统出现的原因:降低程序设计的难度,提高源程序的可读性,降低开发费用,使上层应用软件与硬件平台隔离,提高系统的可扩展性可扩展性。2022-2-16139n由
16、于并行计算体系结构的出现,编译系统的核心思想也随之发生变化,在语法分析和代码优化的阶段加入了并行计算的成分。n并行编译出现的原因:提高所有上层应用软件模块的并行执行程度,从而提高速度指标速度指标。n并行语言及其编译是多处理机系统中最重要的软件问题。在多处理机中应尽可能地使系统并行地执行任务,并且保证各进程之间的同步。2022-2-16140为解决这个问题,主要采取了三种途径为解决这个问题,主要采取了三种途径:n一、一、专门设计一些语言,使它们具有并行程序设计的特点。n重新设计编译系统,代价:编译系统的二次开二次开发费用发费用;优势优势:编译系统的二次开发费用二次开发费用较低;损失:牺牲原有应用
17、软件的可扩展性可扩展性或速度指速度指标标,或增加应用软件的二次开发费用二次开发费用。2022-2-16141n二、二、采用预编译处理,对传统的语言经过预先编译,使之扩展成为可并行的语言。n扩展原有的编译系统,代价:增加原有编译系统的复杂度,增加编译系统的二次开发费用二次开发费用;优势:保持原有应用软件的可扩展性可扩展性,并提高速度指标速度指标,应用软件不需要二次开发;损失:编译系统的二次开发费用较高。2022-2-16142n三、三、最近兴起的一种并行设计动向是在不修改语言也不设置预编译情况下,通过提供并行程序开发所需的函数库或类库,在编译生成代码时,将他们链结在一起。n这样用户在原来程序的基
18、础上,只要在需要的地方加入并行函数即可。n代价:编译系统与上层应用软件的二次开发费用;优势:总共的二次开发费用较低二次开发费用较低,提高应用软件的速度指标速度指标;损失:相对而言,应用软件损失少量可扩展性指标损失少量可扩展性指标。2022-2-161432022-2-161442022-2-161452022-2-161462022-2-161471.2 1.2 计算机性能评价计算机性能评价 1.2.1 CPU1.2.1 CPU性能性能 1.2.2 1.2.2 系统运行速度系统运行速度 1.2.3 1.2.3 加速比加速比 1.2.4 1.2.4 性能性能/ /价格比价格比2022-2-161
19、48 1.2.1 CPU1.2.1 CPU性能性能表征一个CPU性能的主要标志有两个,即该CPU的能力(间接指标)能力(间接指标)及及速度速度。2022-2-161491 1CPUCPU的能力的能力 硬件连接能力(主要是指速度指标)硬件连接能力(主要是指速度指标)CPU通过在引脚上设置数据、地址和控制总线实现与外部电路的连接,这种能力的强弱常用数据总线带宽,即单位时间内传输的数据量来表示。这是一个速度指标。地址总线的宽度可以衡量CPU支持的容量指标。控制总线的数量、性质可以衡量CPU的功能、可靠性、可扩展性等指标,但表达可能比较复杂。2022-2-16150n1)数据带宽nCPU引脚中数据总线
20、的宽度乘以总线传输速率得到数据带宽。(注意,由CPU、系统总线共同决定)n例如,数据总线的传输速率为266 MHz,总线的宽度为32位(4字节),那么该数据总线的带宽就达到2.1GB/s(266MHz4B)。n显然,数据总线带宽越宽,表明该处理机对其他部件的读写速度越快。 2022-2-16151n2)CPU与Cache连接方式n随着处理机工作速率的提高,采用Cache(高速缓冲存储器)是提高CPU工作效率的必备措施,而与与Cache的连接方式的连接方式也成为考察处理机连接能力的又一个重要方面。2022-2-16152n一级CACHE集成在CPU同一芯片内。n二级一般也在CPU同一芯片内(全速
21、CACHE),有的在芯片外,但与CPU 在同一专用板上且有专门通道与CPU相连。n有的CPU还提供专门通道连结第三级CACHE。2022-2-16153 管理能力(可靠性、速度、容量、可扩展性、性能管理能力(可靠性、速度、容量、可扩展性、性能价格比)价格比)由于现代微处理机上集成了许多过去只有在大型机的中央处理机中才有的特性,所以管理能力也成为一个引人注目的方面。其中对存储器的管理、对多道作业的管理、中断管理及对多处理机工作的管理能力尤其值得关注。可靠性:多道作业管理速度:Cache寻址,中断管理容量:虚拟存储器寻址可扩展性:中断管理性能价格比:操作系统中某些软件功能放在硬件中实现,提高系统整
22、体的性能价格比。2022-2-161542 2CPUCPU的速度(速度指标)的速度(速度指标) 主时钟主时钟习惯上总是以主时钟频率来表示一个CPU的速度。主频越高,芯片内的运行速度也越快。可比较的前提:两种CPU的指令系统完全一致,对应指令执行的时序过程完全一致,只有主时钟频率有差异。注意:这个速度指标不是由体系结构决定的,而是由元件的物元件的物理特性理特性决定的。2022-2-16155 平均指令执行周期平均指令执行周期CPICPI指令执行周期:指令执行周期:执行每一条指令所需的时钟周期数平均指令执行周期平均指令执行周期CPI(Cycle Per Instruction)执行程序所化费的总周
23、期数/程序全部指令数。 CPUCPU时钟周期数时钟周期数 = CPU= CPU时间时间/ /时钟周期时钟周期2022-2-16156 其中CPU时间是特指CPU执行指令时所化费的时间执行指令时所化费的时间,不包括输入/输出所需时间(输入输出时,线程或进程被挂起,这段等待时间不计算在内)。 由于CPU总是在操作系统控制下运行用户程序的,所以这里面又包含用户CPU时间和系统CPU时间两个部分。上式中所指的CPU时间是指用户用户CPU时间时间,即执行用户程序过程中所化的时间。(操作系统调度线/进程时花费的时间不计算在内) 2022-2-16157于是,CPI可以写成 (1-1)指令数时钟周期时间CP
24、UCPICPI指令数时钟周期时间CPU2022-2-16158 从式(1-1)可以看出,CPU执行所需时间与下述三个要素有关: 1、时钟周期时钟周期:时钟周期越短,主频越高,程序执行得越快。在微处理机中,这是由制作VLSI的工艺的工艺决定的。 2、平均时钟周期数平均时钟周期数CPI:平均每条指令执行所需的时钟周期越少,程序执行越快。这主要取决于CPU的体系结构体系结构,包括指指令系统的设计令系统的设计、指令时序过程的安排指令时序过程的安排等。 3、程序中所用指令条数程序中所用指令条数:在CPI一定的情况下,所用指令的条数直接影响CPU运行所化费的时间。这主要与CPU的体系结构中指令系统的设计指
25、令系统的设计有关,同时也与编译程序对机器指令的优编译程序对机器指令的优化程度化程度有关。2022-2-16159 (1-1)式中的CPU时间是可从某个程序执行某个程序执行中得到的,且指令数也与具体程序有关。显然,如果在同一个处理机上运行不同的程序不同的程序,所得的CPI也可能是不同的也可能是不同的。所以,作为衡量CPU运行速度的指标CPI,通常是一种概率统计的结果。 假定通过许多程序的统计,得知第i类指令的使用概率为Pi,而执行该类指令所需的时钟周期数为CPIi,而全部指令的类别数为n,该处理机的统计平均CPI就为: (1-2)niiiPCPICPI1)(2022-2-16160例1-1:假定
26、某CPU的主频为500MHz,据统计,其各类指令使用的概率和执行所需时钟数列出在下表中,请确定该处理机每条指令的平均执行时间。指令类型 出现概率(%)执行周期数加法、减法、移位 20 1取数、存数 40 2乘法、除法 5 3浮点加、浮点减 20 5中断 10 5输入、输出 5 102022-2-16161解:根据式(1-2)可知 CPI = 0.21 + 0.42 + 0.053 + 0.25 + 0.15 + 0.0510 = 3.15 每条指令平均执行时间T = 3.152ns = 6.3ns这种CPI计算方法的有效性前提:每种指令在程序设计中使用的概率必须尽量统计准确。思考:根据CPI指
27、标的计算,思考RISC设计思路。2022-2-16162n1.2.2 系统运行速度系统运行速度nCPI的含义:以的含义:以CPU为评估的模块,以指令系为评估的模块,以指令系统中各条指令被执行的概率(频度)为依据,统中各条指令被执行的概率(频度)为依据,以平均每条指令所花费的时钟周期数标尺,对以平均每条指令所花费的时钟周期数标尺,对CPU的速度进行评估。的速度进行评估。n但是如果以计算机系统整体作为一个被评估的但是如果以计算机系统整体作为一个被评估的模块,模块,CPI显然是不合适的。显然是不合适的。2022-2-161631 1MIPSMIPS和和MFLOPSMFLOPS MIPS(Millio
28、n Instruction Per Second),被称为每秒百万条指令 从定义式可以看出,系统的MIPS数值越大,表明其运行速度也越快。661010MIPSCPI时钟频率执行时间指令条数2022-2-161642022-2-161652022-2-161662022-2-16167 MFLOPS(Million Floating Point Operations Per Second),被称为每秒百万次浮点运算。一个系统的MFLOPS数值越大,意味着在单位时间内运行的浮点运算越多。这个指标把浮点运算理解为指令执行的主要功能。该指标和MIPS指标具有类似的缺陷,留在课后分析。610MFLOPS
29、运行时间程序中的浮点运算次数2022-2-161682022-2-161692 2基准测试程序基准测试程序针对MIPS、MFLOPS指标缺乏标准测试程序这一缺陷(原子操作理解错误引起),提出了基准测试程序的概念。基准测试程序通常用高级语言编写,由各系统自带的编译程序编译成适合在本机中运行的机器码,记下各程序运行所化费的时间,然后按一定的规则计算其执行时间。 基准测试程序通常可以分为两类:基准测试程序通常可以分为两类:(1)一类用于测试系统中所用的元部件,如CPU(针对指令系统测试)、硬盘(针对IO操作测试)等,(2)另一类则用来对全系统的性能进行测试(针对程序测试)。2022-2-16170
30、SPEC(Standard Performance Evaluation Corporation)是由若干个工作站生产商发起成立的标准性能评估联合体的简称,是基准程序测试方面影响最大的一个组织。SPEC基准测试程序对于测试结果的处理可以分为两个方面。1)一方面是对每个测试程序每个测试程序的运行结果给出一个衡量标准一个衡量标准,2)另一方面是对全部测量结果全部测量结果给出一个总体评价总体评价。2022-2-16171作为衡量单个测试程序运行结果的一种方法,早期是将一个基准程序在DEC公司的VAX 11/780(一种超级小型机)上运行所需时间定为SPEC参考时间。其他机器运行的时间与这个参考时间相
31、比运行的时间与这个参考时间相比,得到一个SPECSPEC速率速率,借以表现一个系统对该程序运行时的相对速度相对速度。例如,SPEC程序集中有一个gcc程序,他的SPEC参考时间为1482秒,如果另一个系统运行同样程序所化的时间为100秒,那么这个机器的SPEC速率就是14.82。2022-2-16172在考虑整个基准程序集的测试结果时,SPEC推荐使用几何平均值作为标准。即:式中表示,将n个测试程序所得的结果相乘,然后开n次方。这种做法的好处在于,在对各种机器性能进行比较而进行性能规格化规格化(即以某台机器性能作参考标准,其它机器性能除以该参考标准所得到的比值)过程中,不论取哪一台作参考机,几
32、何平均值均能保持比较结果的一致性保持比较结果的一致性.nnii1SPECSPEC速率数2022-2-161732022-2-16174 iCOMP(Intel Comparative Microprocessor Performance)是Intel公司在1993年为对自己生产的各种微处理机进行比较而设定的一个相对性能,其表现形式是一个简单的数字,称为iCOMP指数。在iCOMP测试方法中,设定了一个基准数,即以一个程序在486SX-25处理机上的运行得分为100。被测CPU在运行相应的相应的程序程序后,也得到一个分值一个分值,然后按一定的规定加权规定加权,从而计算出全部测试程序运行后所得的i
33、COMP指数。2022-2-16175计算公式如下:iCOMP = 100(Mark1 / Base-Mark1) P1 + + (Markn / Base-Markn) Pn 式中, Markn为被测CPU在运行第n个测试程序时的得分, 符号Base-Markn为第n个程序在486SX-25上运行时的得分, Pn为第n个测试程序在整个测试中的权重。2022-2-161762022-2-161772022-2-16178 1.2.3 1.2.3 加速比加速比 如果对系统中的某一个模块针对某种性能指标作了体系结构上的改进,那么该模块的性能相对于改进前提升了多大的比例? 整个系统又因此在性能上有了
34、多大的改变?这里以速度指标为例,以加速比这一指标来衡量改进前后指标提升的比例。2022-2-16179n加速比Sn可定义为:n Sn = T0 / Tnn式中,T0是在作为比较基准的运行条件下,计算机运行某个任务所需时间;Tn为改变了运行条件后完成同样任务所需的时间。n上式给出的是针对改进模块的局部加速比。2022-2-16180n在对一个系统进行设计或改进时,总希望通过对某部件的精心设计获得较高的加速比。n但是每一个部件对加速比的贡献并不相同,它完全取决于该部件在整个系统中地位的重要性。n最直接体现部件重要性部件重要性的衡量标准就是它在整整个处理工作中所占的时间比例个处理工作中所占的时间比例
35、。2022-2-16181n假定某部件的运行时间在全系统运行时间T0中所占的百分比为Fe,系统中其他部分运行时间所占百分比为1 - Fe。n再设该部件改进前后的运行时间之比为Se,也即该部件速度提高的倍数。于是对该部件改进后,全系统的运行时间应为:n nTn = T0 ( 1 Fe ) + T0 Fe / Se = T0 ( 1 Fe + Fe / Se )n其中:其中:Se = Tn / T02022-2-16182 将上式代入加速比的定义式中,可得:(1-3) 上式为某个模块改进偶系统整体的加速比系统整体的加速比,T0和Tn的解释是 针对整个系统的。eeennSFFTTS/)1 (1020
36、22-2-16183n由于该部件运行时间所占百分比总是满足0 Fe 1,而Se1,故Sn1。n由(1-3)式可见,加速比的大小与Fe和Se两个因素有关。n如果Se大于1,系统加速比Sn就一定大于1,即只要对系统中某部件进行了改进,总会对全系统的性能提升有好处。(前提:这种改进限于模块内部,没有改变该模块与其它模块任何关联)n同时,Fe也是影响加速比的重要因素,显然Fe越大,所得的Sn也越大,极而言之,当Fe1时,Sn = Se,即系统所得到的加速比等于该部件的加速比。2022-2-16184例1-2:设改进后的某部件运行速度是原速度的10倍,而该部件原运行时间占全系统运行时间的比例为40%,那
37、么此项改进会使全系统的性能得到多少提升?解:按照Amdahl定律,系统性能的提升可以用加速比表示。据题意:Fe = 0.4;Se = 10,直接使用式(1-3),可得:利用对加速比的计算,可以决定提高全系统性能的努力应该从何处入手,即花较小的代价,获取较大的效益。56. 110/4 . 04 . 011nS2022-2-16185例1-3:在测试计算机浮点运算性能的基准测试程序中,浮点运算指令FP操作时间占全部时间的60%,其中求浮点平方根的指令FPSQR占全部运行时间的20%。为了提高全系统的性能,可以考虑两种改进方案。一是采用FPSQR硬件,将FPSQR运算速度提高10倍;另一个是加快全部
38、浮点运算速度,使FP指令的执行速度提高2倍。试比较这两种方案的优劣。 解:分别计算两种方案所能得到的加速比 显然,提高整个浮点运算速度对全系统的性能提高更好些。22.110/2 .0)2 .01 (1FPSQRS43.12/6 .0)6 .01 (1FPS2022-2-16186例1-4:一个专门用以对CPU的多媒体处理性能进行测试的基准程序,其中用于对多媒体信息运算的时间占全部运算时间的70%。由于处理机对多媒体的处理能力不强,特别对一些实时信息的处理更是不能容忍。请寻求提高处理机多媒体处理能力的方案,并进行评估和比较。解:首先分析一下多媒体信息处理的特点。多媒体信息处理中,大量的是对数组的
39、运算,即同样的运算要对许多数据反复进行操作。按照传统的流水线方法必须使用许多次的循环,浪费掉大量的CPU时间。2022-2-16187需要改进的模块:CPU中的多媒体处理模块多媒体处理模块模块的原子操作 :多媒体处理模块所执行的多多媒体指令媒体指令现在分析下面的三种改进方案,并进行评价。2022-2-16188一、一、 提高提高CPU的时钟频率,即减小的时钟频率,即减小CPI。 这是最直接能想到的方案,但在实现上比较困难。要求早期的CPU能实时地处理多媒体信息,在速度上的差距实在太大了。即使如Pentium/166这样的处理机,至少也要提高10倍左右才能基本满足要求。而一个处理机在推出时适用的
40、主频决没有这样大的富余度。所以这个方法是不现实的。2022-2-16189n实用的考虑:体系结构设计者所作的工作不是进行元件级别的设计,但是可以选择元件,如果市面上没有所要求的元件或者价格太贵,则应考虑放弃这种方案;n除非有实现元件级别改进的配套设备,否则不应该考虑开发新的元件。2022-2-16190二、二、 将将CPU的流水线条数增加为的流水线条数增加为n条,在理想情况下其运行条,在理想情况下其运行速度可以提高速度可以提高n倍。倍。与上面同样的理由,因为速度相差太大,需要增加的流水线数目也相当大。一方面会给工艺上带来极大的困难,甚至达到不可能制作的地步(体系结构受到元件发展的限制)。另一方
41、面如果流水线条数太多,指令的分配和调度也会带来许多困难,使实际效果大打折扣(得不偿失)。2022-2-16191 三、设计专门的多媒体指令及处理硬件,大幅度提高同一条指三、设计专门的多媒体指令及处理硬件,大幅度提高同一条指令处理大量数据的能力。令处理大量数据的能力。 使多媒体指令全部由这个特定的部件处理,其余指令仍由原流水线处理。两个部件处于并行方式下运行,程序在该CPU上的运算时间由两个部件中较慢的那个部件决定。 如果多媒体部件对多媒体信息的处理能力提高了10倍,系统的加速比应为: 从式中可以看出,加了一个多媒体部件后系统加速比的大小与多媒体指令所占的比例有关,所占比例越高,系统加速比越大。
42、3 . 33 . 0/110/ )7 . 0( , 3 . 0max0000TTTTTSnn2022-2-161922022-2-161931.2.4 1.2.4 性能性能/ /价格比价格比 作为系统设计者,对性能/价格比的理解是: 在满足性能要求的前提下,尽量降低成本。在满足性能要求的前提下,尽量降低成本。 为了合理的降低成本,向系统开发者提出一些建议。2022-2-161941对于生产批量不很大的系统,应尽量采用成熟的通用元器件n考虑元件的性能/价格比,每种元件的选择都达到较高的性能/价格比。n2充分利用成熟技术,采用标准化设计n选用成熟的元件构成系统,降低体系结构的复杂程度,从而降低开发
43、难度,最终降低成本。2022-2-16195n 3必须考虑系统的继承性n提高可扩展性,降低二次开发费用,使系统的性能/价格比能够维持更长的时间,同时延长系统的生命期。n4设计合理的系统结构。2022-2-161961.3 1.3 计算机系统的层次结构计算机系统的层次结构 1.3.1 1.3.1 层次结构层次结构 1.3.2 1.3.2 冯冯诺依曼结构诺依曼结构 1.3.3 1.3.3 现代计算机体系结构的研究对象现代计算机体系结构的研究对象 1.3.4 1.3.4 计算机体系结构的分类计算机体系结构的分类2022-2-161971.3.1 1.3.1 层次结构层次结构 计算机是由硬件和软件组成
44、的,如果以硬件为核心,可以用图1-1(a)的形式形象地表示他们之间的关系。 图1-1(b)和(c)是进一步将硬件和软件分成若干不同层次的示意图。2022-2-16198硬 件软 件微处理机核心微型计算机机器语言系统结构设计 者机器语言程序员结构与接口设计者逻辑与工艺设计者应用程序高级语言汇编语言操作系统系统操作员汇编语言程序员高级语言程序员用户 ( a ) 软硬件层次结构 ( b ) 硬件层次结构 ( c ) 软件层次结构 图1-1 计算机系统的层次结构2022-2-16199在各不同软件层次上使用计算机的人,看到的不是实际的物理计算机,而是一个通过该层的语言使用的计算机。将这种由软件实现的计
45、算机称为虚拟机器,图1-2抽象地表示了一个虚拟机器的结构。解释、编译器广义语言观察者目标对象 图1-2 广义虚拟机器构成2022-2-162002022-2-162011.3.2 1.3.2 冯冯诺依曼结构诺依曼结构 输入设备 控制器 运算器 (ALU) 存储器 输出设备图1-3 冯诺依曼体系结构计算机的基本组成2022-2-16202n1冯冯诺依曼计算机的特点诺依曼计算机的特点n n 存储程序存储程序、执行程序执行程序是冯诺依曼计算机的基本思想基本思想。nCPU与内存是计算机的核心部件;时间(速度)与空间(容量)是需要评估的重要指标;完整的计算机系统一定是硬件与软件的结合。n后面的特点并不是
46、冯.诺依曼计算机的核心思想,而是老式冯.诺依曼计算机的特点:2022-2-16203n 计算机的运行以运算器为中心运算器为中心,所有部件间的数据传送都必须经由运算器。n运算器是否真的是系统的核心?人为的错误设计导致错误的结构。n 存储器采用一维线性编址,程序按地址顺序存放,数据与程序混合存放数据与程序混合存放。2022-2-16204n 硬件与软件分开硬件与软件分开,硬件采用固定逻辑结构,通过软件改变机器的功能适应不同的应用需要。(逻辑上属于第一条,是冯.诺依曼计算机的基本特点)n软硬件分离、配合的必要性:n1)由硬件构成的机器离不开人的操作,把重复性的人为操作程序化,用软件实现,节省了大量人
47、力。n2)使硬件系统成为可编程的系统,使同一个系统运行不同的程序可以满足不同的应用需求,提高了系统的可重用率,降低了应用系统设计的复杂度、降低了系统整体的成本。n3)对同一应用需求,可以提出软硬件结合的方案,通过调整软硬件各自的比例来达到优越的性能/价格比。2022-2-16205n 采用低级的机器语言编制程序机器语言编制程序并运行机器运行机器。2022-2-16206n2常见的系统结构改进措施常见的系统结构改进措施n 将以运算器为中心的计算机改进为以存储器为中心(速度)。n 程序的执行次序由串行改为并行(速度)。n 分别设置程序和数据存储器,将程序与数据分开存放(速度)。n 采用交叉存储器结
48、构,提高存储器访问效率(速度)。2022-2-16207n 提高处理机运行效率一直是系统结构追求的目标,采用RISC结构是其中一个重大的转折(性能/价格比)。n 计算机的运行由程序驱动改为由数据驱动,采用数据流计算机(速度)。n 智能化计算机发展方向是针对着固定的硬件结构而言,这种计算机通过软硬件结合的方法,随所面临的问题类型动态地改变指令系统和系统结构,使计算机始终能处于较高运行效率的状态(可扩展性)。2022-2-162081.3.3 1.3.3 现代计算机体系结构的研究对象现代计算机体系结构的研究对象1 1计算机体系结构计算机体系结构Amdahl当时提出体系结构时,指的是“程序设计者(机
49、器语言使用者)所看到的计算机属性”,也就是指一个概念性的结构及其在功能上所表现的特性。作为一个通常意义上的体系结构设计者,主要任务就是界定机器硬件与软件的界面硬件与软件的界面:指令系统指令系统,数据类型数据类型,中断系统中断系统,I/O系系统统,机器安全机器安全,信息保护信息保护,也就是说规定系统硬件所能提供的各种功能。2022-2-162092 2计算机组成与实现计算机组成与实现根据体系结构所制订的功能性计算机,从逻辑上完成计算机的设计是计算机组成计算机组成的任务。这里包括各部件的逻辑实现,部件之间的互相连接等逻辑设计。计算机实现计算机实现是指计算机的物理实现。其中包括各部件的物理结构、器件
50、的选用、印刷板的设计和制作、机箱和接插件的设计或选用、散热装置安装等。2022-2-16210n1.3.4 计算机体系结构的分类计算机体系结构的分类n1Flynn分类法分类法n 这是1966年由Michael. J. Flynn提出的一种分类方法。他首先定义了三个重要概念:n1)模型中的重要概念n指令流(Instruction Stream):机器执行的指令序列指令序列;n数据流(Data stream):由指令处理的数据序列数据序列;n多倍性(Multiplicity):在系统最窄的部件上,处于同一执行阶段的指令和数据的最大可能个数同一执行阶段的指令和数据的最大可能个数。2022-2-162
51、112022-2-16212n3)按照指令流和数据流的多寡,Flynn将计算机体系结构分成4种类型:n 单指令流单数据流(SISDSingle Instruction Single Datastream)CUPUMMISISDS( a ) SISD图1-4 Flynn分类法各类结构的概念性框图CU:控制部件; PU:处理部件; MM:存储器模块; IS:指令流; DS:数据流2022-2-162132022-2-162142022-2-16215n 单指令流多数据流(SIMDSingle Instruction Multiple Datastream)DS1DS2DSn PU1 PU2 PUn
52、CUISIS MMn MM2 MM1( b ) SIMD图1-4 Flynn分类法各类结构的概念性框图CU:控制部件; PU:处理部件; MM:存储器模块; IS:指令流; DS:数据流2022-2-162162022-2-162172022-2-16218n 多指令流单数据流(MISDMultiple Instruction Single Datastream) MMn MM2 MM1 IS2 CU2 IS2 PU2 IS1 CU1 IS1 PU1 DS ISn CUn ISn PUn DS( c ) MISD图1-4 Flynn分类法各类结构的概念性框图CU:控制部件; PU:处理部件;
53、MM:存储器模块; IS:指令流; DS:数据流2022-2-162192022-2-162202022-2-162212022-2-162222022-2-162232022-2-16224n 多指令流多数据流(MIMDMultiple Instruction Multiple Datastream) MMn MM2 MM1IS2 IS1ISn CUn ISn PUn DSn CU1 IS1 DS1 PU1 CU2 IS2 PU2 DS2( d ) MIMD图1-4 Flynn分类法各类结构的概念性框图CU:控制部件; PU:处理部件; MM:存储器模块; IS:指令流; DS:数据流2022-2-162252022-2-16226n2冯氏分类法冯氏分类法n1972年,美藉华人冯泽云提出以最大并行度作为系统结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度苏州离婚协议书模板:婚前财产及婚后债务处理3篇
- 上海市标准劳动合同范本
- 二零二五年度离婚协议书范本修订与风险评估合同3篇
- 活动赞助合同(2篇)
- 二零二五版停薪留职员工协议书编制与执行要点
- 二零二五年度美容卡消费联盟合作协议
- 二零二五年度生态农业土地流转与保护合同
- 二零二五年度木材产业园区入驻及运营管理合同
- 6 狼牙山五壮士 说课稿-2024-2025学年六年级语文上册统编版
- 2023七年级道德与法治上册 第一单元 成长的节拍 第三课 发现自己 第2框 做更好的自己说课稿 新人教版
- 2025-2030年中国清真食品行业运行状况及投资发展前景预测报告
- 广东省茂名市电白区2024-2025学年七年级上学期期末质量监测生物学试卷(含答案)
- 《教育强国建设规划纲要(2024-2035年)》全文
- 山东省滨州市2024-2025学年高二上学期期末地理试题( 含答案)
- 2025年河南洛阳市孟津区引进研究生学历人才50人历年高频重点提升(共500题)附带答案详解
- 2025年度军人军事秘密保护保密协议与信息安全风险评估合同3篇
- 蛋鸡生产饲养养殖培训课件
- 数字化转型中的职业能力重构
- 运用PDCA降低住院患者跌倒-坠床发生率
- 2025届高中数学一轮复习专练:椭圆(含解析)
- 立春气象与生活影响模板
评论
0/150
提交评论