计算机系统结构(2012年春)-基本概念CPI阿姆达尔定律_第1页
计算机系统结构(2012年春)-基本概念CPI阿姆达尔定律_第2页
计算机系统结构(2012年春)-基本概念CPI阿姆达尔定律_第3页
计算机系统结构(2012年春)-基本概念CPI阿姆达尔定律_第4页
计算机系统结构(2012年春)-基本概念CPI阿姆达尔定律_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机系统结构(2012年春)-基本概念:CPI/阿姆达尔定律山东大学计算机学院 戴鸿君 计算机设计专题CPI阿姆达尔定律Li-p11至Li-p132022/8/2CPU的性能将程序执行的时间进行分解计算机工作的时钟频率计算机系统中与实现技术和工艺有关的因素。单位是MHz(f)。 总时钟周期数 程序执行的cpu时间 :CPU时间 = 总时钟周期数 / 时钟频率2022/8/3CPI指令时钟数 (Cycles Per Instruction)一个与计算机体系结构有关的参数CPI = 总时钟周期数 / ICIC:程序执行过程中所处理的指令数。总CPU时间 = CPI IC / 时钟频率时钟频率:反

2、映了计算机实现技术、生产工艺和计算机组织。CPI:反映了计算机实现技术、计算机指令集的结构和计算机组织。IC:反映了计算机指令集的结构和编译技术。2022/8/4CPU时间CPI = 总时钟周期数 /指令数总CPU时间 = CPI 指令数/ 时钟频率总CPU时间 = (CPIi Ii) / 时钟频率Ii :在程序中第i种指令出现的次数CPI = (CPIi Ii) /指令数2022/8/5定量指标反映程序的运行速度MIPS(Million Instructions Per Second,每秒百万条指令数)MFLOPS(Million Floating Point Operations Per

3、Second,每秒百万次浮点运算)计算机系统定量设计原理三条基本原则和方法哈夫曼(Huffman)压缩定理对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。这是计算机设计中最重要也最广泛采用的设计准则。使经常性事件的处理速度加快能明显提高整个系统的性能。Amdahl定律加快某部件执行速度所获得的系统性能加速比,受限于可使用这种较快执行方式的时间所占的比例。Amdahl定律加速比系统加速比= =系统加速比依赖于两个因素: 可改进比例fnew:可改进部分在原系统计算时间中所占的比例,它总是小于等于的。例如: 一个需运行60秒的程序中有20秒的运算可以加速,那么该

4、比例就是20/60。Amdahl定律部件加速比new:可改进部分改进以后的性能提高,一般情况下它是大于 。例如: 系统改进后执行程序,其中可改进部分花费2秒的时间,而改进前该部分需花费5秒,则性能提高为5/2。 总执行时间改进后 = 不可改进部分的执行时间 + 可改进部分改进后的执行时间Amdahl定律总执行时间改进后=(1-可改进比例fnew)总执行时间改进前+ = (1-可改进比例fnew) + 总执行时间改进前 Amdahl定律系统加速比为改进前与改进后总执行时间之比:系统加速比Sp = = Amdahl定律2022/8/12Amdahl定律Amdahl定律:性能递减规则如果仅仅对计算机

5、中的一部分做性能改进,则改进越多,系统获得的效果越小。 推论:如果只针对整个任务的一部分进行优化,那么所获得的加速比不大于1/(1-fnew)。一个“好”的计算机系统具有高性价比的计算机系统是一个带宽平衡的系统,而不是看它使用的某些部件的性能 。计算机系统定量设计原理三条基本原则和方法程序的局部性原理程序在执行时所访问地址的分布不是随机的,而是相对地簇聚;这种簇聚包括指令和数据两部分。程序的时间局部性:程序即将用到的信息很可能就是目前正在使用的信息。程序的空间局部性:程序即将用到的信息很可能与目前正在使用的信息在空间上相邻或者临近。存储器体系的构成就是以访问的局部性原理为基础的问题假设我们考虑

6、条件分支指令的两种不同设计方法如下:(1) CPU1:通过比较指令设置条件码,然后测试条件码进行分支;(2)CPU2:在分支指令中包括比较过程。在两种CPU中,条件分支指令都占用2个时钟周期而所有其它指令占用1个时钟周期,对于CPU1,执行的指令中分支指令占20%;由于每个分支指令之前都需要有比较指令,因此比较指令也占20%。由于CPU1在分支时不需要比较,因此假设它的时钟周期时间比CPU2快1.25倍。哪一个CPU更快?如果CPU1的时钟周期时间仅仅比CPU2快1.1倍,哪一个CPU更快呢? 问题用一台40MHZ处理机执行标准测试程序,它含的混合指令数和相应所需的时钟周期数如下:求有效CPI

7、、MIPS速率和程序的执行时间。指令类型指令数时钟周期数整数运算450001数据传送320002浮点150002控制传送80002问题如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33;FPSQR操作的比例为2%, FPSQR的CPI为20。FPSQL操作属于FP操作的一部分。假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。问题假设将某系统的某一部件的处理速度加快到10倍,但该部件的原处理时间仅为整个运行时间的40%,采用加快措施后能

8、使整个系统的性能提高多少?问题2005年11月考试题目在计算机系统中,某一功能的处理时间为整个系统运行时间的50%,若使该功能的处理速度加快10倍,根据Amdahl定律,这样做可以使整个系统的性能提高_(43)_倍。若要使整个系统的性能提高1.5倍,则该功能的处理速度应加快_(44)_倍。(43)A. 1.6 B. 1.7 C. 1.8 D. 1.9(44)A. 3 B. 5 C. 7 D. 8问题如果某一计算任务用向量方式求解比用标量方式求解要快20倍,称可用标量方式求解部分所花费时间占总的时间的百分比为可向量化百分比请画出加速比与可向量化比例两者之间关系的曲线为获得采用向量方式最大加速比的

9、半值(即10)时,所需可向量化的百分比为多少?某程序可向量化部分70%。向量处理速度加倍(即40)和向量工作方式的百分比增大多少使性能得到同样提高?问题某台计算机只有Load/Store 指令能对存储器进行读/写操作,其它指令只对寄存器进行操作。根据程序跟踪实验结果,已知每种指令所占的比例及CPI数如下:指令类型 指令所占比例 CPI 算逻指令 43 1 Load指令 21 2 Store指令 12 2 转移指令 24 2 (1) 求上述情况下的平均CPI。(2) 假设程序有M条指令组成。算逻运算中25%的指令的两个操作数中的一个已在寄存器中,另一个必须在算逻指令执行前用Load指令从存储器取

10、到寄存器。因此有人建议增加另一种算逻指令,其特点是一个操作数取自寄存器,另一个操作数取自存储器,即寄存器存储器类型,假设这种指令的CPI等于2。同时,转移指令的CPI变为3。求新指令系统的平均CPI。问题假设在一台40MHZ处理机上运行200,000条指令的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数如下:指令类型 CPI 指令混合比算术和逻辑 1 60%高速缓存命中的加载/存储 2 18%转移 4 12%高速存储缺失的存储器访问 8 10% (a)计算在单处理机上用上述跟踪数据运行程序的平均CPI。(b)根据(a)所得的CPI,计算相应的MIPS速率。(c)求20000条代码的运行时间。2022/8/23 采用哪种实现技术来求浮点数平方根的操作对系统的性能影响较大。一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍,假设FPSQR操作占整个测试程序执行时间的20%。另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。请比较这两种设计方案。问题开放式问答题搜索目前最新的一款PC上使用的CPU的性能参数,以体系结构的视角进行描述从摩尔定律、阿姆达定律出发,讨论此款CPU相对于以往CPU性能提升的原因。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论