




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计算机组织与系统结构
AA
成本和性能
CostandPerformance
(第三讲)
程旭
2009.3.2
北京大学计算机科学技术系北京大学微处理器研究中心
本讲进度安排
■上讲内容复习
■集成电路的成本
■性能的定义和测度(Measures)
■总结
北京大学计算机科学技术系北京大学微处理器研究中心
计算机硬件和软件层次结构简图
北京大学计算机科学技术系北京大学微处理器研究中心
计算机系统的分解示例
ApplicationsSystems
北京大学计算机科学技术系北京大学微处理器研究中心
如何理解“计算机系统结构〃
Application
Operating
A-System
CompilerFirmware
InstructionSet
Architecture
Instr.SetProc.I/Osystem
Datapath&Control
DigitalDesign
ICircuitDaLignI
--------Layout----------
Coordinationofmanylevelsofabstraction
Underarapidlychangingsetofforces
北京大学D计e算s机i神g挚n皴,术M系easurement,andEvaluatio北n京
表示(Representation)的不同级别
temp=v[k];
高级语言程序v[k]=v[k+1];
v[k+1]=temp;
编译器Iw$15,0($2)
Iw$16,4($2)
sw$16,0($2)
sw$15,4($2)
00001001110001101010111101011000
10101111010110000000100111000110
11000110101011110101100000001001
01011000000010011100011010101111
北京大学计算机科学技术系北京大学微处理器研究中心
计算机组织的级别
AA
SPARCstation20
Computer
SPARCMemoryDevices
Processor
ControlInput
DatapathOutput
北京大学计算机科学技术系北京大学微处理器研究中心
数字逻辑基础回顾
■同步时序电路
■有穷状态自动机FSM
■数据通路+控制=数字系统
北京大学计算机科学技术系北京大学微处理器研究中心
冯诺依曼结构-存储程序的概念
VonNeumanndescribedhowacomputercomprisesfiveunits-input,output,
arithmeticprocessor,controlunit,andmemory-andhowtatthediscretionof
thecontrolunit,theinstructionscanbestoredinthesameinternalmemoryunit
asdataandbeprocessedinthesamewayasdatabythearithmeticunit.
CentralprocessingunitMemory
InputProgram
OutputData
北京大学计算机科学技术系北京大学微处理器研究中心
存储程序的概念
・计算机由运算器、控制器、存储器和输
入设备、输.出设备五大部件组成
•指令和数据以同等的地位存放于存储器
中,并按地址访存
•指令和数据都用二进制数表示
•指令由操作码和地址码组成,操作码用
来表示操作的性质,地址码用来表示操
作数存在存储器中的位置
•指令是顺序存放、顺序执行的,并可根
据运算结果或设定的条件改变执行顺序
-w—
北京大学计算机科学技术系北京大学微处理器研究中心
计算机的简单模型IAS中央处理踹
■程序计数器:
•ProgramCounter(PC)
AA
■累加器
•ACC
■存储地址寄存器
•MAR
■存储数据寄存器
•MDR/MBR
■指令寄存器
•IR
北京大学计算机科学技术系北京大学微处理器研究中心
集成电路
年代计算机使用的工艺相对性能/元件成本
1951真空电子管1
1965分离晶体管35
1975集成电路900
1995超大规模集成电路2,400,000
北京大学计算机科学技术系北京大学微处理器研究中心
DRAM发展规律(摩尔定律)
每三年,容量增长四倍
Yearofintroduction
北京大学计算机科学技术系北京大学微处理器研究中心
芯片制作流程
SiliconingotBlankwafers
20to30processingsteps
TestedIndividualdies
Patternedwafers
dies(onewafer)
133
国QI展・3HQB
Bonddieto
3B□□□Dicer
packageaaL,
r
I4A
PackageddiesTestedpackageddies
PartShiptocustomers
tester
北京大学计算机科学技术系北京大学微处理器研究中心
■■■■■■■■■■■A
|患患||患I,
DieArea:91mm2
直径8inch(200mm)的
Wafer最多可做196个Die
«3,300,000Transistors
Cache:MMTransistors
296Pins
北京大学微处理器研究中心
PentlumPro芯片内的主要功能块
•DieArea:306mm2
•直径8inch(200mm)的
Wafer最多可做78个Die
•«5,500,000Transistors
•Cache:»1MTransistors
•ExternalCache:
31MTransistors
PentiumProPackage=
PentiumPro+ExternalCache
387Pins
北京大学计算机科学技术系北京大学微处理器研究中心
考虑Wafer的边界问题(等价于"Squarepegsina
roundhole55probelm)后:
2
八.「兀义{Wafer_diameter/2)兀xWaferdiameter
Diesperwafer=------------;------------------/.一—
——DieareaA/2xDiearea
北京大学计算机科学技术系北京大学微处理器研究中心
集成电路的成本
〜.八ec.八(DefectsperunitareaxDiearea、
Die_yield=Wafer_yieldx1+-------—-----------------
a_a<a>
Defects_j)erjunit_areaisameasureoftherandomand
manufacturingdefectsthatoccur.In1995,thesevaluestypically
rangebetween0.6to1.2persquarecentimeter,dependingonthe
maturityoftheprocess.
CCisaparameterthatcorrespondsroughlytothenumberof
maskinglevels^ameasureofmanufacturingcomplexity^critical
todieyield.Fortoday'smultilevelmetalCMOSprocesses,agood
estimateisa=3.0!
Inthefollowing,weassumethewaferyieldis100%,
北京大学计算机科学技术系北京大学微处理器研究中心
集成电路的成本
c.Wafercost
Die_cost=-----------------=--------------------
Dies_per_waferxDie_yield
AA
八._^Wafer_area
Dies_per_wafer=---------------
Die_area
(
Defects_per_unit_areaxDie_area)”
Die_yield=7+
aj
c.Wafer_cost
Die_cost=------------------7-----------------=--------------------------------
Wafer_area[1
Die_area(+Defects_per_areaxDie_areaIa》)
Wafer_costxDie_areax(/+Defects_per_areaxDie_area/
Wafer_area
=f((Die_area)a+1)
北京大学计算机科学技术系■*'北京大学微处理器研究中心
集成电路的成本
Die_8st=------------Wafers-----------
Dies_per_waferxDie_yield
AA
~『nX(Wafer_diameter/2)2/rxWaferdiameter
Dies_per_wajer=------;----------------/一一
——Die_areayj2xDie_area
、—CL
Die_yield=Wafer__
J
若a=2,晶模成本大致以晶模大小的立方增长
DieCostisgoesroughlywiththecubeofthearea.
北京大学计算机科学技术系■北京大学微处理器研究中心
真实示例
ChipMetalLineWaferDefectAreaDies/YieldDieCost
layerswidthcost/cm2mm2wafer
AA
386DX20.90$9001.04336071%$4
486DX230.80$12001.08118154%$12
PowerPC60140.80$17001.312111528%$53
HPPA710030.80$13001.01966627%$73
DECAlpha30.70$15001.22345319%$149
SuperSPARC30.70$17001.62564813%$272
Pentium30.80$15001.5296409%$417
From“EstimatingICManufacturingCosts,byLinleyGwennap,Microprocessor
Report,August2,1993,p.15
北京大学计算机科学技术系北京大学微处理器研究中心
其他成本
ICoost=Diecost+T回ngcost+Packagingcod
Finaltestyield
封装成本:取决于管脚数量和散热要求
ChipDiePackageTest&Total
costpinstypecostAssembly
386DX$4132QFP$1$4$9
486DX2$12168PGA$11$12$35
PowerPC601$53304QFP$3$21$77
HPPA7100$73504PGA$35$16$124
DECAlpha$149431PGA$30$23$202
SuperSPARC$272293PGA$20$34$326
Pentium$417273PGA$19$37$473
北京大学计算机科学技术系北京大学微处理器研究中心
Eos改进情况
北京大学计算机科学技术系北京大学微处理器研究中心
工艺的发展趋势
容量速度
AA
逻辑电路
(Logic)2xin3years2xin3years
DRAM4xin3years1.4xin10years
磁盘
(disk)4xin3years1.4xin10years
北京大学计算机科学技术系北京大学微处理器研究中心
处理器性能
120
IBMPower2/590,七
P
e100AA
r
PECAXF
f8093000
o
r60
.9000/750
m1.54X/yr
a40
n
c20"---"片MlRS-M200lKS6600/5401.35X/yr
.一仃
e§肝4/2所IflfhS-M7T2D
0
1987198819891990199119921993
Year
北京大学计算机科学技术系北京大学微处理器研究中心
如何定义计算机系统的“生育巨?
学计算机科学技术素大学微处理器研究中心
如何定义计算机系统的“生》巨?
Thegoalofperformanceevaluationin
thischapterisiobeabletocompare,for
example,
•differentarchitectures
•differentimplementationsofanarchitecture
•differentcompilersforagivenarchitecture
Generalsense:
howwellthecomputerperforms
北京大学计算机科学技术系■"北京大学微处理器研究中心
为什么需要了解影响机器性能的要素?
为了了解
•程序的执行情况
•指令系统的不同实现情况
•一些硬件特征对性能的影响
北京大学计算机科学技术系北京大学微处理器研究中心
商业客机
巡航距离巡航速度吞吐率
飞机载客量(miles)(m.p.h.)载客量*巡航速度
Boeing7773754630610228,750
Boeing7474704150610286,700
BAC/SudConcorde13240001350178,200
DouglasDC-8-50146872054479,424
北京大学计算机科学技术系北京大学微处理器研究中心
性能(和成本)
Performance(andcost)
飞机华盛顿・巴黎速度乘客数量吞吐率(pmph)
Boeing7476.5小时610mph470286,700
BAD/Sud
3小时1350mph132178,200
Concodre
•完成任务的时间(执行时间)
•执行时间(executiontime),响应时间(responsetime),延迟(latency)
•单位时间(每天、小时、星期、秒、纳秒…等等)内完成的任务数量(性能)
•吞吐率(throughput),带宽(bandwidth)
北京大学计算机科学技术系北京大学微处理器研究中心
吞吐率与响应时间与?
计算机系统发生如下变化,对吞吐率和相应时
间分别有如何影响?
•更换成更快的处理器
•增加处理器数量,对不同任务分别使用不
同的处理器
减少响应时间总是可以改进吞吐率
对于每个任务(不可在并行处理),增加处理器从理
论上看,对响应时间没有改进。
实际系统中,通常,任务需要排队等待响应处理,因
而,执行时间和吞吐率常常相互影响。
北京大学计算机科学技术系北京大学微处理器研究中心
性能(和成本)
Performance(andcost)
a_a]
Performace(X)=----------------
ExTime(X)
“X比Y快n倍”(“XisntimesfasterthanY")
是指
ExTime(Y)Performance(X)
ExTime(X)Performance(Y)
北京大学计算机科学技术系北京大学微处理器研究中心
性能的计量(Metricsofperformance)
每月的响应
应用程序每秒的操作
编程语言
编译器
(millions)ofInstructionspersecond-MIPS
IISAI(millions)of(F.P.)operationspersecond-MFLOP/s
数据通路
控制Megabytespersecond
功能部件
晶体管导线bCyclespersecond(clockrate)
北京大学计算机科学技术系北京大学微处理器研究中心
TheNatureofTime
AA
real(i.e.walFclock)time
=UserTime:timespentexecutinginstructionsintheuser
process
=SystemTime:timespentexecutinginstructionsinthe
kernelonbehalfoftheuserprocess
=allothertime(eitheridleorelseexecutinginstructions
unrelatedtotheuserprocess)
++II=real(wallclock)time
Unlessotherwisespecified,atimenoftenrefersto“usertime”.
北京大学计算机科学技术系北京大学微处理器研究中心
ExecutionTime
ElapsedTime
・countseverything(diskandmemoryaccesses,I/O,
etc.)
・ausefulnumber,butoftennotgoodforcomparison
purposes
CPUtime
•doesn'tcountI/Oortimespentrunningotherprograms
•canbebrokenupintosystemtime,andusertime
Ourfocus:userCPUtime
•timespentexecutingthelinesofcodethatare''in''our
program
北京大学计益机科学技术系北京大学微处理器研究中心
时间
Wall-clocktime,responsetime,orelapsed
time:thetot却timetocompleteatask,
includingdiskaccesses,memoryaccesses,
input/outputactivities,operatingsystem
overhead-everything!
CPUexecutingtimeorCPUtime:thetime
theCPUspendscomputingforthistaskand
doesnotincludetimespentwaitingforI/Oor
runningotherprograms.
北京大学计算机科学技术系北京大学微处理器研究中心
时间
CPUtime=userCPUtime+systemCPUtime
AA
Unixtimecommand:
90.7u12.9s2:3965%
90.7+12.9
=0.65
2x60+39
Systemperformancereferstoelapsedtimeon
anunloadedsystem
CPUperformancereferstouserCPUtime
北京大学计算机科学技术系■"北京大学微处理器研究中心
ClockCycles
♦Insteadofreportingexecutiontimeinseconds,weoftenuse
cycles
secondscyclesseconds
—X
programprogramcycle
ClockTicksindicatewhentostartactivities(one
abstraction)
time
cycletime=timebetweenticks=secondspercycle
clockrate(frequency)=cyclespersecond(1Hz.=1
cycle/sec)
—^-io9=5nanoseconds
A200Mhz.clockhasacycletime200x1()6.
北京大学计算机科学技术系北京大学微处理器研究中心
Howmanycyclesarerequiredforaprogram?
Couldassumethat#ofcycles=#of
instructions
JZ-C-C
-I—,-I—•-I—•
寸99
time
Thisassumptionisincorrect,
differentinstructionstakedifferentamountsoftimeondifferentmachines.
Why?
hint:rememberthatthesearemachineinstructions,notlinesofCcode
北京大学计算机科学技术系北京大学微处理器研究中心
不同指令的指令周期也不同
IIIIIII"me
•Multiplicationtakesmoretimethanaddition
•Floatingpointoperationstakelongerthanintegerones
•Accessingmemorytakesmoretimethanaccessingregisters
•Importantpoint:changingthecycletimeoftenchangesthenumberof
cyclesrequiredforvariousinstructions(morelater)
北京大学计算机科学技术系北京大学微处理器研究中心
相关的处理器性能计量
CPUExTime=CPUclockcycles/pgmxclockcycletime
或者CPUExTime3CPUclockcycles/pgm+clockrate
CPUclockcycles/pgm=Instructions/pgmxavg.clockcycles
perinstr.
或者CPI=CPUclockcycles/pgm+Instructions/pgm
■CPI可以揭示一些有关
指令系统体系结构(InstructionSetArchitecture)
该系统结构的实现(theImplementationofthat
architecture)
以及,被评测的程序(theprogrammeasured)
的情况
北京大学计算机科学技术系北京大学微处理器研究中心
改进性能
某程序在A机器上执行时间为10秒,时钟频率:400Mhz
希望设计的B机器通过改进时钟频率(将导致机器周期
增加1.2倍),用6秒执行完该程序
B机器的时钟频率应该怎样?
CPU_ClockCyclesA=CPU_TimexClockRateA
6CyCleS6
二10sx400x10=4000x10cycles
second
1.2x4000xlO6cycles
==800MHz
ClcokRateB6seconds
北京大学计算机科学技术系北京大学微处理器研究中心
CPU性能的几个方面
CPUm寸间秒数指令数二时钟数二秒数
程序程序八指令八周期
指令总数CPI时钟频率
程序X
编译器体系结构研究
|恻:删跚/的重点
指令系统体系结构(X)
组成mm*
X
工艺技术
北京大学计算机科学技术系北京大学微处理器研究中心
组织上的权衡
•Howtoimproveperformance
应用程序•increasesinclockrate
(withoutadverseCPI
编程语言affects)
・improvementsinprocessor
organizationthatlowerCPI
•compilerenhancements
指令分布thatlowerCPIand/or
IISAIInstructionMixinstructioncount
数据通路CPI
控制
功能部件
晶体管导线管脚"时钟时间
北京大学计算机科学技术系北京大学微处理器研究中心
CPI
CPU时间X时钟频率每条指令的平均周期数
CPI(Averagecyclesperinstruction)
指令总数
时钟周期数一
指令总数
CPU时间=时钟周期时间xfcPIjXlj
j=i
n
CPI=fCPIjXFj这里F二—L------
j=iJ指令总数
“指令频率”
("instructionfrequency95)
哪是瓶颈(时间不婚用)就对
北京大学计算机科题里的资源增加投资L…器研…
示例
基本机器(寄存器/寄存器)
Op频度周期CPI(i)%时间
ALU50%1.533%
Load20%2,427%
Store10%2.213%
Branch20%2,427%
/
1.5
典型指令频度
北京大学计算机科学技术系北京大学微处理器研究中心
『旬]ACompilerdesigneristryingtodecide
betweentwocodesequencesforaparticula?^5M
machine
Thehardwaredesignerssupplies:
—
InstructionclassCPIforthisinstructionset
A1
B2
C3
ForaparticularHigh-Level-Languagestatement:
Instructioncountsforinstruction
Codeclass
SequenceABC
1212
2411
北京大学计算机科学技术系北京大学微处理器研究中心
示例
Sequence1executes:2+1+2=5
AA
Sequence2executes:4+1+1=6
n
CPU_clock_cycles=Z(CPIjxI.)
j=i
CPU_clock_cycles]=(2x7)+(7x2)+(2x3)
=2+2+6=10cycles
CPU_clock_cycles2=(4x7)+Qx2)+Qx3)
=4+2+3=9cycles
109
CPI,=—=2CPI=-=L5
15226
北京大学计算机科学技术系北京大学微处理器研究中心
Hardware-independentmetricspredictperformance
InstructionsCodesizeinCodesize
Timeexecutedinstructionsinbits
0-
追
①
U。
E
E
一
。
①七
d
北京大学计算机科学技术系北京大学微处理器研究中心
Performanceexpressedasarate
Ratesareperformancemeasuresexpressedin
unitsofworkpbrunittime.
Examples:
•millionsofinstructions/sec(MIPS)
•millionsoffloatingpointinstructions/sec(MFLOPS)
・millionsofbytes/sec(MBytes/sec)
・millionsofbits/sec(Mbits/sec)
・images/sec
・samples/sec
•transactions/sec(TPS)
北京大学计算机科学技术系北京大学微处理器研究中心
行销计量(MarketingMetrics)
指令总数〉;10-6
MIPS二
时间
:时钟频率X10一6
-CTIX
•具有不同指令系统的机器?
•具有不同指令频度的程序?
•指令的动态频度
・与性能没有直接相关关系
浮点操作总数总数
MFLOPS=x106
•与机器有关
•通常,没能揭示最费时的操作
北京大学计算机科学技术系北京大学微处理器研究中心
MIPS
InstructionclassCPIforthisinstructionset
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国红外光控开关箱市场调查研究报告
- 展馆装修合同终止协议书
- 产品视频拍摄制作合同范本
- 资源置换合作合同范本
- 楼房外墙清洗玻璃服务合同范本
- 展会用车调度运输合同
- 二零二五年度保健中心食堂餐饮服务标准合同
- 建筑工程施工安全合同范文
- 汽车零部件授权经销合同
- 个人劳动合同范本规范
- 小学四年级英语教学反思3篇
- DB1509T 0025-2024 肉牛舍设计与建筑技术规范
- 上海室内装饰施工合同示范文本2024年
- 2024版2024年《汽车文化》全套教案
- 房地产 -中建科工五大类型项目成本指标库
- 2024小红书保健品行业营销通案
- 未来网络支撑下的数字身份体系:产业和技术发展趋势(2024年)定稿版本
- 新《卷烟营销》理论知识考试题库(附答案)
- 中考英语688高频词大纲词频表
- 知识产权保护与跨境执法合作
- 肉类食品配送服务投标方案(技术方案)
评论
0/150
提交评论