




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机系统结构随书课件计算机系统结构随书课件编写出能够在机器上正确运行的程序所必须了解到的计算机的属性。软硬件功能分配及分界面的确定学习目的建立计算机系统的完整概念学习计算机系统的分析方法和设计方法掌握新型计算机系统的基本结构及其工作原理编写出能够在机器上正确运行的程序所必须了解到的计算机的属性。学科方向一级学科:计算机科学与技术二级学科:计算机系统结构、计算机软件 计算机应用技术与其他课程的交叉主要包括:计算机组成原理、计算机操作系统、汇编语言、数据结构、微机原理、高级语言等新内容:超标量处理机、超流水线处理机、向量处理机、并行处理机、多处理机等交叉点内容:提高,建立完整概念学科方向教材计算
2、机系统结构,清华大学出版社,郑玮民,汤志忠编著,2001年第二版主要参考书1 Advanced Computer Architecture and Parallel processingHesham EL-Rewini, 2李学干,苏东庄,计算机系统结构,西安电子科技大学出版社。教材计算机系统结构第一章 基本概念第二章 指令系统第三章 存储系统第四章 输入输出系统第五章 标量处理机第六章 向量处理机第七章 互连网络第八章 并行处理机第九章 多处理机计算机系统结构第一章 基本概念第六章 向量处理机第一章基本概念1.1 计算机系统结构的定义1.2 计算机系统的评价标准1.3 计算机系统的设计方法1
3、.4 计算机系统结构的发展1.5 计算机系统的分类第一章基本概念1.1 计算机系统结构的定义1.1 计算机系统结构的定义1.1.1 两种定义1. 定义一Amdahl于1964年在推出IBM360系列计算机时提出:程序员所看到的计算机系统的属性,即概念性结构和功能特性程序员:汇编语言、机器语言、编译程序、操作系统看到的:编写出能够在机器上正确运行的程序所必须了解到的1.1 计算机系统结构的定义主存储器主存控制器CPUIOP打印机卡片机终端IOP磁盘机 磁带机概念结构主存储器主存控制器CPUIOP打印机卡片机终端IOP磁盘机功能特性:指令系统及其执行模式数据表示:硬件能够直接辩认和处理的数据类型和
4、格式;寻址方式:最小寻址单位、寻址方式的种类和地址运算等;寄存器组织:操作数寄存器、变址寄存器、控制寄存器及专用寄存器的定义、数量和使用规则等;指令系统:机器指令的操作类型、格式,指令间的排序和控制机制等;功能特性:指令系统及其执行模式中断系统:中断类型、中断级别和中断响应方式等;存储系统:最小编址单位、编址方式、主存容量、最大寻址空间等;处理机工作状态:定义和切换方式,如管态和目态等;输入输出系统:连接方式、数据交换方式、数据交换过程的控制等;信息保护:包括信息保护方式和硬件对信息保护的支持等。中断系统:中断类型、中断级别和中断响应方式等;2. 透明性概念本来存在的事物或属性,从某种角度看似
5、乎不存在例如:浮点数表示、乘法指令对高级语言程序员、应用程序员透明对汇编语言程序员、机器语言程序员 不透明例如:数据总线宽度、微程序对汇编语言程序员、机器语言程序员 透明对硬件设计者、计算机维修人员不透明2. 透明性概念3. 定义二:计算机系统结构主要研究软硬件功能分配和对软硬件界面的确定计算机系统由软件、硬件和固件组成,它们在功能上是同等的。同一种功能可以用硬件实现,也可以用软件或固件实现。不同的组成只是性能和价格不同。3. 定义二:计算机系统结构主要研究软硬件功能分配和对软硬件1.1.2 计算机组成计算机组成是指计算机系统结构的逻辑实现,主要包括:确定数据通路的宽度确定各种操作对功能部件的
6、共享程度确定专用的功能部件确定功能部件的并行度设计缓冲和排队策略1.1.2 计算机组成设计控制机构确定采用何种可靠性技术1.1.3 计算机系统的实现计算机实现是指计算机组成的物理实现,包括:处理机、主存储器等部件的物理结构器件的集成度和速度专用器件的设计设计控制机构器件、模块、插件、底版的划分与连接信号传输技术电源、冷却及装配技术,相关制造工艺及技术等计算机系统结构、计算机组成和计算机实现是三个不同的概念,但随着技术、器件和应用的发展,三者之间的界限越来越模糊。器件、模块、插件、底版的划分与连接计算机系统结构、计算机组成1.1. 4 计算机系统的层次结构1. 虚拟机概念从不同角度所看到的计算机
7、系统的属性是不同的,包括:高级语言程序员、汇编语言程序员、系统管理员、硬件设计者大部分人对计算机的认识只需要在某一个层次上1.1. 4 计算机系统的层次结构广义语言解释或编译虚拟计算机观察者作用对象广义语言解释或编译虚拟计算机观察者作用对象2. 层次结构(接下页)中央处理机第2级 机器语言机器语言程序员指令系统目标程序硬联逻辑第0级 硬联逻辑硬件设计员操作时序逻辑电路微程序控制第1级 微程序控制逻辑设计员指令时序寄存器逻辑2. 层次结构(接下页)中央处理机第2级 机器语言机器语言指(接下页)汇编程序第4级 汇编程序汇编语言程序员汇编语言可执行程序操作系统第3级 操作系统系统操作员系统原语键盘命
8、令系统资源(续上页)(接下页)汇编程序第4级 汇编程序汇编语言汇编语言可执行程序应用程序第6级 应用程序用户应用语言信息处理系统高级语言第5级 高级语言高级语言程序员解释程序编译程序可执行程序(续上页)应用程序第6级 应用程序用户应用语言信息处理系统高级语言第52. 层次结构第0级由硬件实现第1级由微程序实现第2级至第6级由软件实现由软件实现的机器称为:虚拟机第2级是传统指令系统(机器语言)机器第3级是操作系统机器操作系统是运行在第级上的解释程序第4级是汇编语言机器2. 层次结构第5级是高级语言机器第6级是应用语言机器从学科领域来划分第0和第1级属于计算机组成与系统结构第3至第5级是系统软件第
9、6级是应用软件第5级是高级语言机器它们之间仍有交叉第0级要求一定的数字逻辑基础第2级涉及汇编语言程序设计的内容第3级与计算机系统结构密切相关。在特殊的计算机系统中,有些级别可能不存在。它们之间仍有交叉第一章基本概念1.1 计算机系统结构的定义1.2 计算机系统的评价标准1.3 计算机系统的设计方法1.4 计算机系统结构的发展1.5 计算机系统的分类第一章基本概念1.1 计算机系统结构的定义1.2 计算机系统的评价标准:性能和价格1.2.1 性能评测的常用方法:运算速度1. 时钟频率(主频):用于同类处理机之间 如:Pentium/450 比 Pentium/300快50,2. 指令执行速度 一
10、种很经典的表示方法MIPS (Million Instructions Per Second), KIPS, GIPS, TIPS1.2 计算机系统的评价标准:性能和价格其中,Fz为处理机的工作主频;CPI (Cycles Per Instruction)为每条指令所需的平均时钟周期数;IPC (Instruction Per Cycle)为每个时钟周期平均执行的指令条数例1:计算Pentium II 450处理机的运算速度。解:由于PentiumII 450处理机的IPC2 (或CPI0.5), Fz450MHz,因此,MIPSPentium II 450FzIPC4502900(MIPS)
11、其中,Fz为处理机的工作主频;CPI (Cycles Per主要缺点:(1)不同指令的速度差别很大(2)指令使用频度差别很大(3)有相当多的非功能性指令计算机系统结构随书课件3. 等效指令速度:吉普森(Gibson)法其中,Wi:指令使用频度,i:指令种类静态指令使用频度:在程序中直接统计3. 等效指令速度:吉普森(Gibson)法动态指令使用频度:在程序执行过程中统计在计算机发展的早期,用加法指令的运算速度来衡量计算机的速度。通常:加、减法50,乘法15,除法5,程序控制15,其他15例2:我国最早研制的小型计算机DJS-130,定点16位,加法每秒50万次,但没有硬件乘法和除法指令,用软件
12、实现乘法和除法,速度低100倍左右。求等效速度。动态指令使用频度:在程序执行过程中统计解:定点等效速度为:即每秒2万次,由于乘法和除法用软件实现,等效速度降低了25倍。例3:假设在程序中浮点开平方操作FPSQR的比例为2,它的CPI为100;其他浮点操作FP的比例为23,它的CPI 4.0;解:其余75指令的CPI1.33,计算该处理机的等效CPI。如果FPSQR操作的CPI也为4.0,重新计算等效CPI。解:由于改进了仅占2的FPSQR操作的CPI,使等效速度提高了近一倍。等效CPI110024231.33753.92等效CPI24251.33752.00其余75指令的CPI1.33,计算该
13、处理机的等效CPI。4. 核心程序法把应用程序中用得最频繁的那部分核心程序作为评价计算机性能的标准程序。称为基准程序 (benchmark)整数测试程序:Dhrystone用C语言编写,100条语句。包括:各种赋值语句,各种数据类型和数据区,各种控制语句,过程调用和参数传送,整数运算和逻辑操作。VAX-11/780的测试结果为每秒1757个4. 核心程序法Dhrystones,即:1VAX MIPS1757 Dhrystones/Second浮点测试程序:Linpack用FORTRAN语言编写,主要是浮点加法和浮点乘法操作。用 MFLOPS(Million Floating Point Ope
14、rations Per Second)表示;GFLOPS、TFLOPSWhetstone基准测试程序用FORTRAN语言编写的综合性测试程序,Dhrystones,即:1VAX MIPS1757 D主要包括:浮点运算、整数算术运算、功能调用、数组变址、条件转移、超越函数。测试结果用Kwips表示。SPEC基准测试程序 (System performance evaluation Cooperative)由30个左右世界知名计算机大厂商所支持的非盈利的合作组织,包括:IBM、AT&T、BULL、Compaq、CDC、DG、DEC、Fujitsu、HP、Intel、MIPS、Motolola、SG
15、I、SUN、Unisys等;主要包括:浮点运算、整数算术运算、功能调用、数组变址、条件转SPEC能够全面反映机器的性能,具有很高的参考价值;以VAX-11/780的测试结果作为基数;SPEC1.0 1989年10月宣布,程序量超过15万行,包含10个测试程序, 4个定点程序,6个浮点程序;测试结果用SPECint89和SPECfp89表示。1992年,又增加10个测试程序,共有6个定点程序和14个浮点程序,测试结果用SPECint92和SPECfp92表示。1995年,推出SPECint95和SPECfp95SPEC能够全面反映机器的性能,具有很高的参考价值;SPEC处理机SPECint95S
16、PECfp95PentiumII 40018.513.3PentiumII 45018.713.7PentiumIII 50020.614.7PientiumIII 55022.315.6Celeron 300A12.09.66Celeron 33313.110.20Celeron 36614.110.70Celeron 40015.111.20Celeron 43316.111.60Celeron 46617.012.00处理机SPECint95SPECfp95TPC基准程序Transaction Processing Council(事务处理委员会)成立于1988年,已有40多个成员;用于
17、评测计算机的事务处理、数据库处理、企业管理与决策支持等方面的性能。1989年10月、1990年8月和1992年7月发表了TPC-A、TPC-B和TPC-C。TPC基准程序5、峰值速度峰值指令速度MIPS、GIPS、TIPSPentium III 500有3条指令流水线,则其峰值指令速度为:3500MHz1500 (MIPS)即每秒15亿次例3:一个由8台机器组成的Cluster系统,每台机器是4个PentiumIII 500组成的SMP系统;计算这个Cluster系统的指令峰值速度。5、峰值速度解:峰值指令速度:500MHz 48(GIPS)即每秒480亿次。峰值指令速度MIPS、GIPS、T
18、IPS1.2. 2 其他方面的性能1. 存储能力寻址空间大小,216、224、232、264、解:存储容量,速度,编址单位,编址方式,寻址方式存储系统:Lookahead Cache Main Memory Online Storage Off-line Storage2. 字长 1几百位关键问题:程序与数据共用同一个主存储器早期:由指令字长决定当前:由数据字长决定,8的倍数,如:32位、64位等可变字长:任意组合存储容量,速度,编址单位,编址方式,寻址方式3. 数据类型目前常用:定点、浮点、逻辑已有类型:向量、串、栈、树发展方向:自定义4. 指令系统CISC:复杂指令集计算机RISC:精简指
19、令集计算机VLIW:超长指令字3. 数据类型5. 输入输出能力输入输出方式中断系统输入输出接口6. 兼容性共分12级:011,0级为完全不兼容,11级为自身7. 保护和诊断能力程序与数据的保护5. 输入输出能力诊断能力:检错、纠错、冗余、自诊断能力可靠性:RAS技术,可靠性R、可用性A、可维护性1.2. 3 其他方面的性能比较1. 价格与性能的关系根据摩尔定理:性能每10年提高100倍,但价格基本不变用同样的价格,五年之后能买到性能高十倍的机器诊断能力:检错、纠错、冗余、自诊断能力2. 硬件与软件的价格比例硬件的比例下降,软件的比例上升目前软件价格已经超过硬件价格2. 硬件与软件的价格比例1.
20、2. 4 计算机性能的比较算术平均值:用速度表示为调和平均:注意:两个公式等价1.2. 4 计算机性能的比较算术平均值:加权执行时间加权算术平均值:加权调和平均速度:加权执行时间加权算术平均值:几何平均速度其中,ETR(execution time ratio),n 指不同的程序几何平均速度与机器无关,与程序的执行时间无关。几何平均速度其中,ETR(execution time ra第一章基本概念1.1 计算机系统结构的定义1.2 计算机系统的评价标准1.3 计算机系统的设计方法1.4 计算机系统结构的发展1.5 计算机系统的分类第一章基本概念1.1 计算机系统结构的定义1.3 计算机系统的设
21、计方法1.3.1 软硬件取舍1.3.2 软件兼容性设计方法1.3.3 计算机系统设计过程1.3 计算机系统的设计方法1.3.1 软硬件取舍1.3 计算机系统的设计技术1.3.1 软硬件取舍1. 软硬件的关系理论上,有两种极端实现方法全硬件机器,包括操作系统、高级语言、应用程序等硬件只有1位加法和分支操作,其他都用软件实现1.3 计算机系统的设计技术关键问题:性能与价格的关系,软硬件实现在功能上等效计算机系统结构设计者的主要任务就是要确定软硬件的分界;软件、硬件和固件的功能分配软件与硬件实现的特点硬件实现:速度快、成本高;灵活性差、占用内存少软件实现:速度低、复制费用低;灵活性好、占用内存多发展
22、趋势硬件实现的比例越来越高,硬件所占的成本越来越高关键问题:性能与价格的关系,软硬件实现在功能上等效计算机系发展不可编程目前计算机最少硬件软件硬件软硬件比例发展不可编程目前计算机最少硬件软件硬件软七十年代硬件软件成本年代七十年代硬件软件成本年代2. 从改进性能考虑软硬件的取舍基本方法:加快经常性事件的执行速度Make the common case fast例如加法运算中的溢出和不溢出;中断处理中的常规性保护现场和特殊性保护现场;指令切换中的“公操作”是提高计算机速度的瓶颈之一;3. Amdahl定律如何确定经常性事件?或者说应该确定加快处理速度对整个性能的影响如何?2. 从改进性能考虑软硬件
23、的取舍Amdahl定律:系统中某一部件由于采用某种更快的执行方式后整个系统性能的提高与这种执行方式的使用频率或占总执行时间的比例有关。 在Amdahl定律中,加速比与两个因素有关:Amdahl定律:系统中某一部件由于采用某种更快的执行方式后改进后整个任务的执行时间为:其中0为改进前的整个任务的执行时间。改进后整个系统的加速比为:其中(1-Fe)表示不可改进部分。改进后整个任务的执行时间为:例5:假设将某一部件的处理速度加快到10倍,该部件的原处理时间仅为整个运行时间的40%,则采用加快措施后能使整个系统的性能提高多少?解:由题意可知:Fe=0.4, Se=10,根据Amdahl定律,加速比为:
24、例5:例6:假设某测试程序中FP指令占50%,FPSQR指令占20%,用改进FP指令速度为原来的2倍和改进FPSQR指令速度为原来的10倍,两种方法中的哪种更好?解:第一种方法:Fe=0.5, Se=2,根据Amdahl定律,加速比为:第一种方法:Fe=0.2, Se=10,根据Amdahl定律,加速比为:例6:4. 改进性能的主要途径面向目标代码改进:用一条指令代替一串指令方法:统计某条指令、某类指令或某个指令串的使用频度包括动态使用频度和静态使用频度例如:例1中,增加硬件乘法和除法指令使等效指令速度提高25倍. 例2中,改进FPSQR指令使等效CPI提高近1倍4. 改进性能的主要途径面向高
25、级语言改进:方法:统计某些语句的使用频度例如:一般程序中赋值语句占30%以上,为此,许多处理机中设置了寄存器与寄存器、寄存器与存储器、存储器与存储器之间的成组传送指令。例如:在do循环中,循环体只有一、二条的占60%左右,造成循环控制部分所占的比例很大,因此,增加循环控制指令。面向高级语言改进:方法:统计某些语句的使用频度例如:一般又例如:条件码对高级语言几乎无用。面向操作系统改进:方法:系统结构设计要规整,消除例外情况,寄存器定义要统一、操作要均匀、所有存储部件要对称又例如:条件码对高级语言几乎无用。1.3.2 软件兼容性设计方法原因:1.软件相对于硬件的成本越来越贵;2.已积累了大量成熟的
26、系统软件和应用软件。兼容种类向后兼容在某一时间生产的机器上运行的目标软件能够直接运行于更晚生产的机器上。向前兼容向上兼容在低档机器上运行的目标软件能够直接运行于高档机器上。1.3.2 软件兼容性设计方法向下兼容其中向后兼容最重要,必须做到向上兼容尽量做到向前兼容和向下兼容,可以不考虑方法1:系列机方法系列机定义:具有相同的系统结构,不同组成和实现的一系列计算机系统实现方法:在系统结构基本不变的基础上,根据不同性能的要求和当时的器件发展情况,设计出各种性能、价格不同的计向下兼容算机系统。一种系统结构可以有多种组成,一种组成可以有多种物理实现。如IBM370系列机:370/115、125、135、
27、145、158、168等各种型号。相同的系统结构,不同的组成和实现技术,不同的性能和价格。相同的指令系统,分别采用顺序执行、重迭、流水和并行处理方式。相同的32位字长,数据通道的宽度分别为8位、16位、32位、64位。算机系统。一种系统结构可以有多种组成,一种组成可以有多种物PC系列机:8088、8086、80186、80286、80386、80484、Pentium、PentiumII、PentiumIII PentiumIV 不同工作主频;不同扩展功能:Pentium、Pentium Pro、Pentium MMX不同的Cache:PentiumII、Celeron、Xeon不同的字长:8
28、位(8088)、16位(80286)、32位、64位。PC系列机:8088、8086、80186、80286、8采用系列机方法的主要优点:系列机之间软件兼容,可移植性好;插件、接口等相互兼容;便于实现机间通信;便于维修、培训;有利于提高产量、降低成本采用系列机方法的主要缺点:限制了计算机系统结构的发展方法2:模拟与仿真 Simulation Emulation定义:在一台现有的计算机上实现另一台计算机的指令系统。采用系列机方法的主要优点:系列机之间软件兼容,可移植性好;全部用软件实现的叫模拟用硬件、固件或软件、硬件、固件混合实现的叫仿真模拟的实现方法:在A计算机上通过解释方法实现B计算机的指令
29、系统,即B机器的每一条指令用一段A机器的程序进行解释执行。A机器称为宿主机,B机器称为虚拟机。仿真的实现方法:直接用A机器的一段微程序解释执行B机器的每条指令。A机器称为宿主机,B机称为目标机。全部用软件实现的叫模拟用硬件、固件或软件、硬件、固件混合优缺点比较模拟方法速度低,仿真方法速度高仿真需要较多的硬件(包括控制存储器)系统结构差别大的机器难于完全用仿真方法来实现除了指令系统之外,还有存储系统、I/O系统、中断系统、控制台的操作等除了解释方法之外,也可以通过编译方法实现模拟方法用于计算机系统的设计过程在一台已有的机器上用模拟方法实现另优缺点比较模拟方法速度低,仿真方法速度高仿真需要较多的硬外一台正在设计中的机器的指令系统等。具体过程如下:方法3:统一高级语言方法:采用同一种不依赖于任何具体机器的高级语言编写系统软件和应用软件。困难:至今还没有这样一种高级语言。短期内很难实现。C、Ada、Java、设计方案
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论