计算机组成与体系结构 课件 14计算机性能量化评价方法_第1页
计算机组成与体系结构 课件 14计算机性能量化评价方法_第2页
计算机组成与体系结构 课件 14计算机性能量化评价方法_第3页
计算机组成与体系结构 课件 14计算机性能量化评价方法_第4页
计算机组成与体系结构 课件 14计算机性能量化评价方法_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机性能量化评价方法计算机组成与体系结构性能指标、模型及定律如何评价计算机的性能?计算机用户程序运行时间响应时间管理员吞吐量(throughput)单位时间内所能完成的工作量宏观评价指标响应时间服务时间等待时间传输时间吞吐量:单位时间内完成事务/任务的数量功耗动态功耗Consumedbyactivityinacircuit静态功耗ConsumedwhenpoweredonbutidleActivePower

Capacitance~chipareaVoltagefrequencyActivityfactorStaticPowerVoltageLeakage基本性能指标机器字长存储容量内存外存处理器评价指标MIPS(MillionInstructionPerSecond)FLOPS(FloatingPointOperationPerSecond)CPI(CyclePerInstruction)TOPS(TeraOperationsperSecond)MIPS程序的执行时间为:MIPS的缺陷MIPS依赖于指令集,所以用MIPS来比较指令集不同的机器的性能的好坏是很不准确的在同一台机器上,MIPS因程序而异,有时变化是很大的MIPS可能与性能相反MFLOPSMillionFloatingPointOperationsPerSecond基于操作而不是基于指令的,所以它可以用来比较两种不同的机器MFLOPS的局限性MFLOPS取决于机器和程序两个方面只能用来衡量机器浮点运算操作的性能,而不能体现机器的整体性能不同机器上浮点运算集不同,另外MFLOPS还依赖于操作类型CPI和CPU执行时间每条计算机指令执行所需的时钟周期,有时简称为指令的平均周期数。主频,即CPU内核工作的时钟频率(CPUClockSpeed)CPU执行时间:表示CPU执行一段程序所占用的CPU时间

加速比&效率加速比S(n):由单处理器求解一个给定任务实例所需时间与由n个处理器组成的并行系统求解同一实例所需时间的比值。效率E(n)

:加速比与处理器数n的比值,即E(n)=S(n)/n。效率是对每个处理器可获得加速的度量,可用来衡量多个处理器的利用率。E(n)的取值在0与1之间。理想性能模型E(n)=1不考虑通信开销,全部程序都可通过并行执行加速考虑通信开销的模型若tc

<<ts,则加速比近似等于n;若tc

>>ts,则加速比近似等于ts/tc<<1;若tc

=ts,则加速比为

,当n>>1时,近似为1。具有串行部分的模型-无通信开销具有串行部分的模型-有通信开销Amdahl定律突破Amdahl定律GrowthinprocessorperformanceGrowthinclockrateRulesofThumbAmdahl/CaseRule:Abalancedcomputersystemneedsabout1MBofmainmemorycapacityand1megabitpersecondofI/ObandwidthperMIPSofCPUperformance.90/10LocalityRule:Aprogramexecutesabout90%ofitsinstructionsin10%ofitscode.BandwidthRule:Bandwidthgrowsbyatleastthesquareoftheimprovementinlatency.2:1CacheRule:Themissrateofadirect-mappedcacheofsizeNisaboutthesameasatwo-waysetassociativecacheofsizeN/2.DependabilityRule:Designwithnosinglepointoffailure.Watt-YearRule:ThefullyburdenedcostofaWattperyearinaWarehouseScaleComputerinNorthAmericain2011,includingthecostofamortizingthepowerandcoolinginfrastructure,isabout$2.ComputerArchitectureFormulasComputerArchitectureFormulas基准性能测试基准测试程序基准测试程序(benchmark)集是指使用一组专门设计的整数或浮点数程序,去测试待测计算机系统性能的不同方面四种来源实际的应用程序核心程序:实际程序中抽取少量关键循环程序段玩具基准测试程序:通常只有10-100行而且运行结果是可以预知的综合基准测试程序:它类似于核心程序,但它考虑了各种操作和各种程序的比例常用的基准测试程序Linpack(Linearsystempackage):用IEEE754双精度64位字长的子程序求解100阶线性方程组的速度,测试结果以Mflops或Gflops为单位给出LAPACK(LinearAlgebraPACKage)ScaLAPACK(ScalableLAPACK)Linpack(1)Linpack是线性系统软件包(Linearsystempackage)的缩写20世纪70年代中期开始,国际上曾开发过一批基于FORTRAN语言的求解线性代数方程组的子程序,并于1979年正式发布了Linpack包Linpack测试的基准是用IEEE754双精度64位字长的子程序求解100阶线性方程组的速度,测试结果以Mflops或Gflops为单位给出Linpack也被广泛的应用于实际计算中,用来分析和求解线性方程组和线性最小二乘法问题Linpack测试包括三类,Linpack100、Linpack1000和HPL(HighPerformanceLinpack)Linpack(2)目前,TOP500仍以执行Linpack测试的峰值运算速度作为排名依据使用Linpack基准测试一般需要和收集的信息包括:Rpeak:它是系统的最大理论峰值性能,按Gflops表示;Nmax:给出有最高Gflops值的矩阵规模或问题规模;Rmax:在Nmax规定的问题规模下,达到的最大Gflops。综合基准测试集——SPECStandardPerformanceEvaluationCorporation是一个非营利性组织,于1988年成立SPEC的基准测试程序全部选自实际的应用程序,提供标准、公正并可在各种硬件结构间进行高强度计算性能比较的方法它所发布的测试结果已经成为世界公认的计算机性能评价标准之一与Linpack有所不同,SPEC是一个合成(综合)的基准测试程序集,既包括浮点数运算测试,也包括整数运算测试/SPEC92SPEC92由两套测试程序组成:CINT92和CFP92CINT92由6个测试整数性能的C程序组成,而CFP92则由14个测试浮点性能的C和FORTRAN程序组成在SPEC92中,SPECratio代表实际执行指定程序时间和预先确定的参照时间(通常取VAX11/780的执行时间)两者的比值SPEC92整数程序(CINT92)程序描述compress压缩/解压缩工具espresso化简布尔函数的程序gccGNU编译器eqntott逻辑设计程序sc电子表格程序liLisp解释器SPEC92浮点程序(CFP92)程序描述/领域alvinn神经网络/机器人doduce核反应堆模拟/物理学ear耳朵模拟/医学fpppp电子积分/化学hydro2d喷气计算/天体物理mdljdp2运动方程/化学(双精度)mdljsp2运动方程/化学(单精度)nasa7浮点内核ora光线跟踪/光学spice电路模拟器/电路设计su2cor粒子质量/量子物理学swm256水方程求解器/模拟tomcatv网格生成程序wave5麦克斯韦方程式求解器SPECbenchmarks高性能计算术语高性能计算(HPC/HEC):没有一个严格的定义HPC:HighPerformanceComputing,高性能计算HEC:HighEndComputing,高端计算并行计算:ParallelComputing彼此关系高性能计算=并行计算高性能计算机=并行计算机不很严格,但得到了广泛的认可需要高性能计算技术?时间复杂度n=10n=30n=60n0.01毫秒0.03毫秒0.06毫秒n20.1毫秒0.9毫秒3.6毫秒n50.1秒24.3秒13.0分钟2n1.0毫秒17.9分钟366.0世纪3n0.06毫秒6.5年1.3×1013世纪人类对计算能力的需求永无止境时间代价表(每秒处理1,000,000次基本操作的PC机)高性能计算的三类需求计算密集(computeintensive)如大型科学工程计算、数值模拟等数据密集(dataintensive)数字图书馆、数据仓库、数据挖掘等网络密集(networkintensive)协同工作、遥控、远程医疗等高性能计算技术的重要性许多高精尖应用领域对计算能力的极大需求,使高性能计算技术成为了决定军事、经济和科技领先地位的关键因素构造高性能计算机就成为该技术的核心内容高性能计算机更是国家综合国力的象征各国政府都不惜投入巨资开发自己的高性能计算机研究背景高性能计算机的开发具有极为浓厚的政治军事背景美国政府担心其它核武器拥有国对美国国防形成核威胁,试图全面限制核试验,但禁止核试验和限制核武器的发展,使美国把核技术作为决定性武器来发展的传统战略陷入困境美国能源部推出了ASCI计划,以摆脱核武器发展面临的困境ASCI计划的目的,是利用高技术创造核武器试验的虚拟空间,并在这个空间中开展虚拟试验(VirtualTesting),高性能计算机的研制是ASCI计划的重要组成部分美国ASCI计划(1)全称为AcceleratedStrategicComputingInitiative,加速战略计算创新1996年6月由美国能源部联合三大核武器实验室(圣地亚哥、洛斯·阿拉莫斯、劳伦斯·利弗莫尔国家实验室)共同提出ASCI计划的目的在2010年之前开发出高性能、全系统、全物理现象的预测程序以支持核武器的性能评定、更新过程分析、偶发事件的分析及确认刺激美国计算机工业的发展。ASCI项目的最终目标是研制出100万亿次的超级计算机系统及相应的软件和算法美国ASCI计划(2)该计划分五个阶段完成该计划分五个阶段完成,分别研制1万亿次、3万亿次、10万亿次、30万亿次和100万亿次的系统截止到2000年6月,第一、二和三阶段的开发任务已完成,分别称为红色(Red)、蓝色(Blue)和白色(White)取得的成果为:英特尔研制的“ASCIRed”超级计算机;SGI和IBM分别研制的“蓝山”和“蓝色太平洋”超级计算机;IBM研制出了“ASCIWhite”超级计算机美国ASCI计划(3)在第一阶段,Intel研制出了“ASCIRed”超级计算机,安装在桑迪亚国家实验室;在第二阶段,SGI和IBM分别研制出了“蓝山(ASCIBlueMountain)”和“蓝色太平洋(ASCIBluePacific)”超级计算机,分别安装于洛斯·阿拉莫斯和劳伦斯·利弗莫尔国家实验室;在第三阶段,IBM研制出了“ASCIWhite”超级计算机,并在2001年年底安装于劳伦斯·利弗莫尔国家实验室,正式投入使用.美国ASCI计划(4)1997年,ASCI针对第四、第五阶段出台了“PathForward”子计划,研究超级计算所需的关键技术,如网间互联、编程环境、负载均衡、单一系统映像、资源管理和海量存储等技术

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论