计算机组织与系统结构-GAOQS-IHA_第1页
计算机组织与系统结构-GAOQS-IHA_第2页
计算机组织与系统结构-GAOQS-IHA_第3页
计算机组织与系统结构-GAOQS-IHA_第4页
计算机组织与系统结构-GAOQS-IHA_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机组织与系统结构

AA

成本和性能

CostandPerformance

(第三讲)

程旭

2009.3.2

北京大学计算机科学技术系北京大学微处理器研究中心

本讲进度安排

■上讲内容复习

■集成电路的成本

■性能的定义和测度(Measures)

■总结

北京大学计算机科学技术系北京大学微处理器研究中心

计算机硬件和软件层次结构简图

北京大学计算机科学技术系北京大学微处理器研究中心

计算机系统的分解示例

ApplicationsSystems

北京大学计算机科学技术系北京大学微处理器研究中心

如何理解“计算机系统结构〃

Application

Operating

A-System

CompilerFirmware

InstructionSet

Architecture

Instr.SetProc.I/Osystem

Datapath&Control

DigitalDesign

ICircuitDaLignI

--------Layout----------

Coordinationofmanylevelsofabstraction

Underarapidlychangingsetofforces

北京大学D计e算s机i神g挚n皴,术M系easurement,andEvaluatio北n京

表示(Representation)的不同级别

temp=v[k];

高级语言程序v[k]=v[k+1];

v[k+1]=temp;

编译器Iw$15,0($2)

Iw$16,4($2)

sw$16,0($2)

sw$15,4($2)

00001001110001101010111101011000

10101111010110000000100111000110

11000110101011110101100000001001

01011000000010011100011010101111

北京大学计算机科学技术系北京大学微处理器研究中心

计算机组织的级别

AA

SPARCstation20

Computer

SPARCMemoryDevices

Processor

ControlInput

DatapathOutput

北京大学计算机科学技术系北京大学微处理器研究中心

数字逻辑基础回顾

■同步时序电路

■有穷状态自动机FSM

■数据通路+控制=数字系统

北京大学计算机科学技术系北京大学微处理器研究中心

冯诺依曼结构-存储程序的概念

VonNeumanndescribedhowacomputercomprisesfiveunits-input,output,

arithmeticprocessor,controlunit,andmemory-andhowtatthediscretionof

thecontrolunit,theinstructionscanbestoredinthesameinternalmemoryunit

asdataandbeprocessedinthesamewayasdatabythearithmeticunit.

CentralprocessingunitMemory

InputProgram

OutputData

北京大学计算机科学技术系北京大学微处理器研究中心

存储程序的概念

・计算机由运算器、控制器、存储器和输

入设备、输.出设备五大部件组成

•指令和数据以同等的地位存放于存储器

中,并按地址访存

•指令和数据都用二进制数表示

•指令由操作码和地址码组成,操作码用

来表示操作的性质,地址码用来表示操

作数存在存储器中的位置

•指令是顺序存放、顺序执行的,并可根

据运算结果或设定的条件改变执行顺序

-w—

北京大学计算机科学技术系北京大学微处理器研究中心

计算机的简单模型IAS中央处理踹

■程序计数器:

•ProgramCounter(PC)

AA

■累加器

•ACC

■存储地址寄存器

•MAR

■存储数据寄存器

•MDR/MBR

■指令寄存器

•IR

北京大学计算机科学技术系北京大学微处理器研究中心

集成电路

年代计算机使用的工艺相对性能/元件成本

1951真空电子管1

1965分离晶体管35

1975集成电路900

1995超大规模集成电路2,400,000

北京大学计算机科学技术系北京大学微处理器研究中心

DRAM发展规律(摩尔定律)

每三年,容量增长四倍

Yearofintroduction

北京大学计算机科学技术系北京大学微处理器研究中心

芯片制作流程

SiliconingotBlankwafers

20to30processingsteps

TestedIndividualdies

Patternedwafers

dies(onewafer)

133

国QI展・3HQB

Bonddieto

3B□□□Dicer

packageaaL,

r

I4A

PackageddiesTestedpackageddies

PartShiptocustomers

tester

北京大学计算机科学技术系北京大学微处理器研究中心

■■■■■■■■■■■A

|患患||患I,

DieArea:91mm2

直径8inch(200mm)的

Wafer最多可做196个Die

«3,300,000Transistors

Cache:MMTransistors

296Pins

北京大学微处理器研究中心

PentlumPro芯片内的主要功能块

•DieArea:306mm2

•直径8inch(200mm)的

Wafer最多可做78个Die

•«5,500,000Transistors

•Cache:»1MTransistors

•ExternalCache:

31MTransistors

PentiumProPackage=

PentiumPro+ExternalCache

387Pins

北京大学计算机科学技术系北京大学微处理器研究中心

考虑Wafer的边界问题(等价于"Squarepegsina

roundhole55probelm)后:

2

八.「兀义{Wafer_diameter/2)兀xWaferdiameter

Diesperwafer=------------;------------------/.一—

——DieareaA/2xDiearea

北京大学计算机科学技术系北京大学微处理器研究中心

集成电路的成本

〜.八ec.八(DefectsperunitareaxDiearea、

Die_yield=Wafer_yieldx1+-------—-----------------

a_a<a>

Defects_j)erjunit_areaisameasureoftherandomand

manufacturingdefectsthatoccur.In1995,thesevaluestypically

rangebetween0.6to1.2persquarecentimeter,dependingonthe

maturityoftheprocess.

CCisaparameterthatcorrespondsroughlytothenumberof

maskinglevels^ameasureofmanufacturingcomplexity^critical

todieyield.Fortoday'smultilevelmetalCMOSprocesses,agood

estimateisa=3.0!

Inthefollowing,weassumethewaferyieldis100%,

北京大学计算机科学技术系北京大学微处理器研究中心

集成电路的成本

c.Wafercost

Die_cost=-----------------=--------------------

Dies_per_waferxDie_yield

AA

八._^Wafer_area

Dies_per_wafer=---------------

Die_area

(

Defects_per_unit_areaxDie_area)”

Die_yield=7+

aj

c.Wafer_cost

Die_cost=------------------7-----------------=--------------------------------

Wafer_area[1

Die_area(+Defects_per_areaxDie_areaIa》)

Wafer_costxDie_areax(/+Defects_per_areaxDie_area/

Wafer_area

=f((Die_area)a+1)

北京大学计算机科学技术系■*'北京大学微处理器研究中心

集成电路的成本

Die_8st=------------Wafers-----------

Dies_per_waferxDie_yield

AA

~『nX(Wafer_diameter/2)2/rxWaferdiameter

Dies_per_wajer=------;----------------/一一

——Die_areayj2xDie_area

、—CL

Die_yield=Wafer__

J

若a=2,晶模成本大致以晶模大小的立方增长

DieCostisgoesroughlywiththecubeofthearea.

北京大学计算机科学技术系■北京大学微处理器研究中心

真实示例

ChipMetalLineWaferDefectAreaDies/YieldDieCost

layerswidthcost/cm2mm2wafer

AA

386DX20.90$9001.04336071%$4

486DX230.80$12001.08118154%$12

PowerPC60140.80$17001.312111528%$53

HPPA710030.80$13001.01966627%$73

DECAlpha30.70$15001.22345319%$149

SuperSPARC30.70$17001.62564813%$272

Pentium30.80$15001.5296409%$417

From“EstimatingICManufacturingCosts,byLinleyGwennap,Microprocessor

Report,August2,1993,p.15

北京大学计算机科学技术系北京大学微处理器研究中心

其他成本

ICoost=Diecost+T回ngcost+Packagingcod

Finaltestyield

封装成本:取决于管脚数量和散热要求

ChipDiePackageTest&Total

costpinstypecostAssembly

386DX$4132QFP$1$4$9

486DX2$12168PGA$11$12$35

PowerPC601$53304QFP$3$21$77

HPPA7100$73504PGA$35$16$124

DECAlpha$149431PGA$30$23$202

SuperSPARC$272293PGA$20$34$326

Pentium$417273PGA$19$37$473

北京大学计算机科学技术系北京大学微处理器研究中心

Eos改进情况

北京大学计算机科学技术系北京大学微处理器研究中心

工艺的发展趋势

容量速度

AA

逻辑电路

(Logic)2xin3years2xin3years

DRAM4xin3years1.4xin10years

磁盘

(disk)4xin3years1.4xin10years

北京大学计算机科学技术系北京大学微处理器研究中心

处理器性能

120

IBMPower2/590,七

P

e100AA

r

PECAXF

f8093000

o

r60

.9000/750

m1.54X/yr

a40

n

c20"---"片MlRS-M200lKS6600/5401.35X/yr

.一仃

e§肝4/2所IflfhS-M7T2D

0

1987198819891990199119921993

Year

北京大学计算机科学技术系北京大学微处理器研究中心

如何定义计算机系统的“生育巨?

学计算机科学技术素大学微处理器研究中心

如何定义计算机系统的“生》巨?

Thegoalofperformanceevaluationin

thischapterisiobeabletocompare,for

example,

•differentarchitectures

•differentimplementationsofanarchitecture

•differentcompilersforagivenarchitecture

Generalsense:

howwellthecomputerperforms

北京大学计算机科学技术系■"北京大学微处理器研究中心

为什么需要了解影响机器性能的要素?

为了了解

•程序的执行情况

•指令系统的不同实现情况

•一些硬件特征对性能的影响

北京大学计算机科学技术系北京大学微处理器研究中心

商业客机

巡航距离巡航速度吞吐率

飞机载客量(miles)(m.p.h.)载客量*巡航速度

Boeing7773754630610228,750

Boeing7474704150610286,700

BAC/SudConcorde13240001350178,200

DouglasDC-8-50146872054479,424

北京大学计算机科学技术系北京大学微处理器研究中心

性能(和成本)

Performance(andcost)

飞机华盛顿・巴黎速度乘客数量吞吐率(pmph)

Boeing7476.5小时610mph470286,700

BAD/Sud

3小时1350mph132178,200

Concodre

•完成任务的时间(执行时间)

•执行时间(executiontime),响应时间(responsetime),延迟(latency)

•单位时间(每天、小时、星期、秒、纳秒…等等)内完成的任务数量(性能)

•吞吐率(throughput),带宽(bandwidth)

北京大学计算机科学技术系北京大学微处理器研究中心

吞吐率与响应时间与?

计算机系统发生如下变化,对吞吐率和相应时

间分别有如何影响?

•更换成更快的处理器

•增加处理器数量,对不同任务分别使用不

同的处理器

减少响应时间总是可以改进吞吐率

对于每个任务(不可在并行处理),增加处理器从理

论上看,对响应时间没有改进。

实际系统中,通常,任务需要排队等待响应处理,因

而,执行时间和吞吐率常常相互影响。

北京大学计算机科学技术系北京大学微处理器研究中心

性能(和成本)

Performance(andcost)

a_a]

Performace(X)=----------------

ExTime(X)

“X比Y快n倍”(“XisntimesfasterthanY")

是指

ExTime(Y)Performance(X)

ExTime(X)Performance(Y)

北京大学计算机科学技术系北京大学微处理器研究中心

性能的计量(Metricsofperformance)

每月的响应

应用程序每秒的操作

编程语言

编译器

(millions)ofInstructionspersecond-MIPS

IISAI(millions)of(F.P.)operationspersecond-MFLOP/s

数据通路

控制Megabytespersecond

功能部件

晶体管导线bCyclespersecond(clockrate)

北京大学计算机科学技术系北京大学微处理器研究中心

TheNatureofTime

AA

real(i.e.walFclock)time

=UserTime:timespentexecutinginstructionsintheuser

process

=SystemTime:timespentexecutinginstructionsinthe

kernelonbehalfoftheuserprocess

=allothertime(eitheridleorelseexecutinginstructions

unrelatedtotheuserprocess)

++II=real(wallclock)time

Unlessotherwisespecified,atimenoftenrefersto“usertime”.

北京大学计算机科学技术系北京大学微处理器研究中心

ExecutionTime

ElapsedTime

・countseverything(diskandmemoryaccesses,I/O,

etc.)

・ausefulnumber,butoftennotgoodforcomparison

purposes

CPUtime

•doesn'tcountI/Oortimespentrunningotherprograms

•canbebrokenupintosystemtime,andusertime

Ourfocus:userCPUtime

•timespentexecutingthelinesofcodethatare''in''our

program

北京大学计益机科学技术系北京大学微处理器研究中心

时间

Wall-clocktime,responsetime,orelapsed

time:thetot却timetocompleteatask,

includingdiskaccesses,memoryaccesses,

input/outputactivities,operatingsystem

overhead-everything!

CPUexecutingtimeorCPUtime:thetime

theCPUspendscomputingforthistaskand

doesnotincludetimespentwaitingforI/Oor

runningotherprograms.

北京大学计算机科学技术系北京大学微处理器研究中心

时间

CPUtime=userCPUtime+systemCPUtime

AA

Unixtimecommand:

90.7u12.9s2:3965%

90.7+12.9

=0.65

2x60+39

Systemperformancereferstoelapsedtimeon

anunloadedsystem

CPUperformancereferstouserCPUtime

北京大学计算机科学技术系■"北京大学微处理器研究中心

ClockCycles

♦Insteadofreportingexecutiontimeinseconds,weoftenuse

cycles

secondscyclesseconds

—X

programprogramcycle

ClockTicksindicatewhentostartactivities(one

abstraction)

time

cycletime=timebetweenticks=secondspercycle

clockrate(frequency)=cyclespersecond(1Hz.=1

cycle/sec)

—^-io9=5nanoseconds

A200Mhz.clockhasacycletime200x1()6.

北京大学计算机科学技术系北京大学微处理器研究中心

Howmanycyclesarerequiredforaprogram?

Couldassumethat#ofcycles=#of

instructions

JZ-C-C

-I—,-I—•-I—•

寸99

time

Thisassumptionisincorrect,

differentinstructionstakedifferentamountsoftimeondifferentmachines.

Why?

hint:rememberthatthesearemachineinstructions,notlinesofCcode

北京大学计算机科学技术系北京大学微处理器研究中心

不同指令的指令周期也不同

IIIIIII"me

•Multiplicationtakesmoretimethanaddition

•Floatingpointoperationstakelongerthanintegerones

•Accessingmemorytakesmoretimethanaccessingregisters

•Importantpoint:changingthecycletimeoftenchangesthenumberof

cyclesrequiredforvariousinstructions(morelater)

北京大学计算机科学技术系北京大学微处理器研究中心

相关的处理器性能计量

CPUExTime=CPUclockcycles/pgmxclockcycletime

或者CPUExTime3CPUclockcycles/pgm+clockrate

CPUclockcycles/pgm=Instructions/pgmxavg.clockcycles

perinstr.

或者CPI=CPUclockcycles/pgm+Instructions/pgm

■CPI可以揭示一些有关

指令系统体系结构(InstructionSetArchitecture)

该系统结构的实现(theImplementationofthat

architecture)

以及,被评测的程序(theprogrammeasured)

的情况

北京大学计算机科学技术系北京大学微处理器研究中心

改进性能

某程序在A机器上执行时间为10秒,时钟频率:400Mhz

希望设计的B机器通过改进时钟频率(将导致机器周期

增加1.2倍),用6秒执行完该程序

B机器的时钟频率应该怎样?

CPU_ClockCyclesA=CPU_TimexClockRateA

6CyCleS6

二10sx400x10=4000x10cycles

second

1.2x4000xlO6cycles

==800MHz

ClcokRateB6seconds

北京大学计算机科学技术系北京大学微处理器研究中心

CPU性能的几个方面

CPUm寸间秒数指令数二时钟数二秒数

程序程序八指令八周期

指令总数CPI时钟频率

程序X

编译器体系结构研究

|恻:删跚/的重点

指令系统体系结构(X)

组成mm*

X

工艺技术

北京大学计算机科学技术系北京大学微处理器研究中心

组织上的权衡

•Howtoimproveperformance

应用程序•increasesinclockrate

(withoutadverseCPI

编程语言affects)

・improvementsinprocessor

organizationthatlowerCPI

•compilerenhancements

指令分布thatlowerCPIand/or

IISAIInstructionMixinstructioncount

数据通路CPI

控制

功能部件

晶体管导线管脚"时钟时间

北京大学计算机科学技术系北京大学微处理器研究中心

CPI

CPU时间X时钟频率每条指令的平均周期数

CPI(Averagecyclesperinstruction)

指令总数

时钟周期数一

指令总数

CPU时间=时钟周期时间xfcPIjXlj

j=i

n

CPI=fCPIjXFj这里F二—L------

j=iJ指令总数

“指令频率”

("instructionfrequency95)

哪是瓶颈(时间不婚用)就对

北京大学计算机科题里的资源增加投资L…器研…

示例

基本机器(寄存器/寄存器)

Op频度周期CPI(i)%时间

ALU50%1.533%

Load20%2,427%

Store10%2.213%

Branch20%2,427%

/

1.5

典型指令频度

北京大学计算机科学技术系北京大学微处理器研究中心

『旬]ACompilerdesigneristryingtodecide

betweentwocodesequencesforaparticula?^5M

machine

Thehardwaredesignerssupplies:

InstructionclassCPIforthisinstructionset

A1

B2

C3

ForaparticularHigh-Level-Languagestatement:

Instructioncountsforinstruction

Codeclass

SequenceABC

1212

2411

北京大学计算机科学技术系北京大学微处理器研究中心

示例

Sequence1executes:2+1+2=5

AA

Sequence2executes:4+1+1=6

n

CPU_clock_cycles=Z(CPIjxI.)

j=i

CPU_clock_cycles]=(2x7)+(7x2)+(2x3)

=2+2+6=10cycles

CPU_clock_cycles2=(4x7)+Qx2)+Qx3)

=4+2+3=9cycles

109

CPI,=—=2CPI=-=L5

15226

北京大学计算机科学技术系北京大学微处理器研究中心

Hardware-independentmetricspredictperformance

InstructionsCodesizeinCodesize

Timeexecutedinstructionsinbits

0-

U。

E

E

①七

d

北京大学计算机科学技术系北京大学微处理器研究中心

Performanceexpressedasarate

Ratesareperformancemeasuresexpressedin

unitsofworkpbrunittime.

Examples:

•millionsofinstructions/sec(MIPS)

•millionsoffloatingpointinstructions/sec(MFLOPS)

・millionsofbytes/sec(MBytes/sec)

・millionsofbits/sec(Mbits/sec)

・images/sec

・samples/sec

•transactions/sec(TPS)

北京大学计算机科学技术系北京大学微处理器研究中心

行销计量(MarketingMetrics)

指令总数〉;10-6

MIPS二

时间

:时钟频率X10一6

-CTIX

•具有不同指令系统的机器?

•具有不同指令频度的程序?

•指令的动态频度

・与性能没有直接相关关系

浮点操作总数总数

MFLOPS=x106

•与机器有关

•通常,没能揭示最费时的操作

北京大学计算机科学技术系北京大学微处理器研究中心

MIPS

InstructionclassCPIforthisinstructionset

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论