



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、.1. 将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,则采用此增强功能方法后,能使整个系统的性能提高多少? 根据Amdahl定律可知: 系统加速比 由题可知: 可改进比例 = 40% = 0.4部件加速比 = 10 系统加速比 = 1.56 采用此增强功能方法后,能使整个系统的性能提高1.56倍。2. 假设一台计算机的I/O处理占10,当其CPU性能改进到原来的10倍时,而I/O性能仅改进为原来的两倍时,系统总体性能会有什么改进?加速比1/(10%/2+90%/10)=7.14本题反映了Amdahl定律,要改进一个系统的性能要对各方面性能都进行改进
2、,不然系统中最慢的地方就成为新系统的瓶颈。3. 双输入端的加、乘双功能静态流水线有1、2、3、4四个子部件,延时分别为t, t, 2t, t,“加”由124组成,“乘”由134组成,输出可直接返回输入或锁存。现执行 (1) 画出流水时空图,标出流水线输入端数据变化情况。(2) 求运算全部完成所需的时间和流水线效率。(3) 找出瓶颈子过程并将其细分,重新画出时空图并计算流水时间和效率。(1) 部件 结果输入a1 a2 a3 a4 a1+b1 a2+b2 a3+b3 a4+b4 b1 b2 b3 b4 c1 c2 c3 c4 t4321(2)由上图可知,全部运算完的时间是23t。 (3) 43-2
3、3-1 2 1输入a1 a2 a3 a4 a1+b1 a2+b2 a3+b3 a4+b4 b1 b2 b3 b4 c1 c2 c3 c4 结果t部件 由上图可知,流水时间为20t。 4. 有一条流水线如下所示。(1) 求连续输入5指令,该流水线的实际吞吐率和效率; (2) 该流水线的瓶颈在哪一段?请采取两种不同的措施消除此“瓶颈”。对于你所给出的新流水线,计算连续输入5条指令时,其实际吞吐率和效率。5. 假设我们考虑条件分支指令的两种不同设计方法如下: (a)CPUA:通过比较指令设置条件码,然后测试条件码进行分支; (b)CPUB:在分支指令中包括比较过程。在两种CPU中,条件分支指令都占用
4、2个时钟周期而所有其它指令占用1个时钟周期,对于CPUA,执行的指令中分支指令占30%;由于每个分支指令之前都需要有比较指令,因此比较指令也占30%。由于CPUA在分支时不需要比较,因此假设它的时钟周期时间比CPUB的快1.4倍。哪一个CPU更快?如果CPUA的时钟周期时间仅仅比CPUB的快1.15倍,哪一个CPU更快呢?我们不考虑所有系统问题,所以可以用CPU性能公式。占用2个时钟周期的分支指令占总指令的30%,剩下的指令占用1个时钟周期。所以 CPIA = 0.3 2 + 0.70 1 = 1.3则CPU性能为:总CPU时间A = IC 1.3 时钟周期A根据假设,有:时钟周期B = 1.
5、4 时钟周期A 在CPUB中没有独立的比较指令,所以CPUB的程序量为CPUA的70%,分支指令的比例为: 30%/70% = 42.8% 这些分支指令占用2个时钟周期,而剩下的57.2%的指令占用1个时钟周期,因此:CPIB = 0.428 2 + 0.572 1 = 1.428 因为CPUB不执行比较,故: ICB = 0.7 ICA 因此CPUB性能为: 总CPU时间B = ICB CPIB 时钟周期B = 0.7 ICA 1.428 (1.4 时钟周期A) = 1.44 ICA 时钟周期A 在这些假设之下,尽管CPUB执行指令条数较少,CPUA因为有着更短的时钟周期,所以比CPUB快。
6、如果CPUA的时钟周期时间仅仅比CPUB的快1.15倍,则时钟周期B = 1.15 时钟周期ACPUB的性能为:总CPU时间B = ICB CPIB 时钟周期B = 0.7 ICA 1.428 (1.15 时钟周期A) = 1.18 ICA 时钟周期A 因此CPUB由于执行更少指令条数,比CPUA运行更快。6. 假设Cache失效开销为70个时钟周期,当不考虑存储器停顿时,所有指令的执行时间都是2.0个时钟周期,访问Cache失效率为2%,平均每条指令访存1.2次。试分析考虑Cache的失效后,Cache对性能的影响。若不采用Cache,性能会怎样?考虑Cache的失效后,性能为 CPU时间有
7、cacheIC(2.0(1.22 %70)时钟周期时间IC3.68时钟周期时间 当考虑了Cache的失效影响后,CPI就会增大。本例中CPI从理想计算机的2.0增加到3.68,是原来的1.84倍。 若不采用Cache,CPI将增加为2.0701.286,即超过原来的40倍。7. 我们考虑某一个机器。假设Cache读失效开销为30个时钟周期,写失效开销为60个时钟周期,当不考虑存储器停顿时,所有指令的执行时间都是2个时钟周期, Cache的读失效率和写失效率均为5%,平均每条指令读存储器0.8次,写存储器0.5次。试分析考虑Cache的失效后,Cache对性能的影响。平均每条指令存储器停顿时钟周期数“读”的次数读失效率读失效开销 “写”的次数写失效率写失效开销 0.85%300.55%602.7 CPU时间=IC*(CPI执行+存储器停顿周期数/指令数)*时钟周期时间考虑Cache的失效后,性能为 CPU时间有CacheIC(2.02.7)时钟周期时间IC4.7时钟周期时间当考虑了Cache的失效影响后,CPI从理想计算机的2.0增加到4.7,是原来的2.35倍。8. 假设在一台40MHZ处理机上运行200,000条指令的目标代码,程序主要由四种指令组成。根据程序跟踪实验结果,已知指令混合比和每种指令所需的指令数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《世界古代建筑欣赏:大二艺术史教学教案》
- 《太阳系八大行星的特点:四年级地理教学教案》
- 新员工入职流程及操作系统使用指南
- 产品分销与代理业务合作协议内容
- 《走进物理世界:高一物理实验课程教案》
- 乡村旅游农业开发方案
- 年度市场活动策划与执行报告
- 公司采购协议附件书
- 采购居间合同例文
- 工作汇报与沟通渠道使用情况表
- 2024年国网电网金属技术监督专业知识题库(典型题)
- SG-CIM模型建设及实践
- 【零售超市促销策略研究的文献综述及理论基础4500字】
- 人教版二年级下册数学《图形的运动(解决问题)》说课稿
- 2024年中华人民共和国企业所得税年度纳税申报表(带公式)20240301更新
- 2024年江苏省扬州市中考数学真题(解析版)
- 中医养生保健知识讲座完整版
- 托福听力课件
- 泰康集团线上测评真题
- 运动损伤的预防与处理预防和处理舞蹈运动损伤
- 物流无人机项目企业运营实施方案
评论
0/150
提交评论