实验三:处理器结构实验一_第1页
实验三:处理器结构实验一_第2页
实验三:处理器结构实验一_第3页
实验三:处理器结构实验一_第4页
实验三:处理器结构实验一_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、深圳大学学生实验报告用纸深圳大学实验报告课程名称:实验项目名称:学院:专业:指导教师:计算机系统(3)处理器结构实验一个个个个个个个个*1*1*1*1*1*1*1*1*1*1*1*1*1*1*1*1*1个个个个个个个个个个个个个个个个个个*1*1*1*1*1*1个个个个个个报告人:*1*1*1*1*1*1个个个个个个学号:*1*1*1*1*1*1*1*1*1*1*1个个个个个个个个个个个班级:*实验时间:2017年11月19日星期日实验报告提交时间:2017年11月30日星期四教务处制一、实验目标了解MIPS的五级流水线,和在运行过程中的所产生的各种不同的流水线冒险通过指令顺序调整,或旁路与预

2、测技术来提高流水线效率更加了解流水线细节和其指令的改善方法更加熟悉MIPS指令的使用二、实验内容观察一段代码并运行,观察其中的流水线冒险,并记录统计统计信息。对所给的代码进行指令序列的调整,以期避免数据相关,并记录统计信息。启动forward功能,以获得性能提升,并且记录统计信息。(选做:用perf记录x86中的数据相关于指令序列调整后的时间统计、调整指令,以避免连续乘法间的阻塞。)三、实验环境.硬件:桌面PC.软件:Windows,WinMIPS64仿真器四、实验步骤及说明首先,我们给出一段C代码,该段代码实现的是两个矩阵相加。设有4*4矩阵A和4*4矩阵B相加,得到4*4矩阵C:for(i

3、nti=0;i4;i+)For(intj=0;jfll如rlMMH上面的指令运行,在Cycle窗口结果如下(程序运行前请将configure-architecture-divisionlatency改为10):小田I2al4*2*Sil404/41Hi比即1IIMr141cWlrlMiriC-iHl4fMriC-Mm”-WQSimi在Statistics窗口的结果如下:通过观察,我们可以发现,两个连续的除法产生了明显的结构相关,第二个除法为了等待上一个除法指令在执行阶段所占用的资源,阻塞了9个周期。显然,这样的连续的除法所导致的结构相关极大的降低了流水线效率,为了消除结构相关,我们需要做的是调

4、整指令序列,将其他无关的指令塞入两条连续的除法指令中。给出指令序列的调整方案并给出流水线工作状态的截图,做出解释。四、提交报告记录实验过程,保存实验截图,给出分析结果,形成实验报告。初始代码准备(10分),后面每个优化方法各30分。五、实验结果1.初始代码准备将初始代码存为testmes如下图所示:1-dataL.2a:.wordLlJ,ia,乙乙3-3,勾九且/小乂3b:.word4c:.word30,00J0,九0,0,0,乱30,0.3九。5len:.word46control:.word320K100007data:.wo-rd320K10008testme.sin-dex.htmlx

5、SignUtils,java8.textstart:daddi17/d0daddir21?adaddir22Jr0JbTOC o 1-5 h z13daddi14Idrl6,len(r0)15laopl:sitr*rl7,F1616beqr8,rQexitl17|18daddi1950,019loop2;sitr8,rl9rl626beqr8,r0Jexit221|22dsllr8,rl7,223曲ddr8,r8jrl924dsllrSjrSj32526daddr9TrSjr2127daddr-2228daddp11j*p2329|39IdrQ.QfrQ)31Idrl&etrie)将testm

6、e.s文件load到WINMIPS64中1.1没有调整指令序列和启用forwarding的结果,共产生了220个RAWStallsWlSteitisticsFa|S|E3Exeuirc1on09Cyc.lea2OInstruet-L&T13J.955CyclesFer-工nm匚fllulJ.nm3OCyc.1ea5Znst:ructions1.ISCTyclesR口匚Ixia-teu.ctio-nfCPIStallsRAKSuaZZaowawstallsOWARStallsS3Stmc.tu.itaZStallsBe1an.allTaJcEn.StallsClBraricJh.H工npuucl

7、i匚ti口ciStallsCodesis-e!曰VEQ白通过观察cycle窗口,可以观察到差别(红框标出)即通过启用forwarding,两个地方从两个RAW相关减少到一个,而中在调整指令序列后,原先还有一个RAW相关,如今也全都没有了。3调整的主要为r20,r21,r22,r23和r24的装载以及加法。之所以不调整r16,r17和r18,r19,是因为后面的出发会用到r16,为避免结构相关,故保留两条指令,其余的塞到两个除法中间,使得两个除法因结构相关产生的阻塞降到最低。调整后的代码如下:stair:Id.rlfi,a(r0Id.HILE比口Id.二三Id.rl9fd(r0)-ddivrl6

8、frl6rrl7Id.rzO,e(rO)-Id.z21fffrO).Id.fsfrO).Id.“与乂工白Id.r24fifrO).da.dd.1r2C/fr2C/fLda.dd.1r21fr21fLdaddir22fr22,1:da.dd.1r23fr23f_:da.dd.1一dd.lvrl-Sfrl-SrxlSrialt卜面四张截图中,头两张为未调整指令序列的,最后两张为调整了指令序列后的。|口cO-一国5间HnG.iWHrWtHrfL&rf;BfW:如FEnllfif胤料H包即:BiS:rt:HIM哂盛圆1MirSlCl.i地位过MifilrSi械痛刷1Mr.FinL用六、实验总结与体会虽然一开始对流水线的概念不是很清楚,但是通过这个实验,我了解了MIPS的五级流水线,和在运行过程中的所产生的各种不同的流水线冒险并且学会了通过指令顺序调整,或旁路与预测技术来提高流水

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论