版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机系统结构实验报告3.1流水线中的相关一、实验目的1.掌握WinDL戏拟器的操作和使用,熟悉DLX旨令集结构及其特点;2 .加深对计算机流水线根本概念的理解;3 .进一步了解DLX1本流水线各段的功能以及根本操作;4 .加深对数据相关、结构相关的理解,了解这两类相关对CPUS能的影响;5 .了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停.二、实验平台WinDL戏拟器.三、实验内容、步骤及实验结果1.用WinDL拟器执行以下三个程序:求阶乘程序fact.s求最大公倍数程序gcm.s求素数程序prim.s分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情
2、况,观察CP加存放器和存储器白内容.熟练掌握WinDL的操作和使用.结果总结:三种方式:步进的方式是按快捷键F减者选择菜单栏Execute中的SingleCycle;连续的方式是按快捷键F5或者选择Execute中的Run;设置断点是通过选择window菜单栏中的code,然后在菜单栏中多出一项code项,选中你想要插入的指令,在多出来的code项中找到setbreakpoint,即可插入断点,然后按F5a行即可.以fact.s为例Pipeline图指出了每个功能段所进行的具体指令,点击指令还可以看到指令的具体相关的其他方面的内容.时空图更加直观的形式显示出了在某个时间周期某个功能段所执行的具
3、体的指令.inlEXIbui3.QM0|r2)inpdtLoopMEMInstiuctions/Cyclesaddirlj0,0x1000ialInpUUnsignedmovi2fpflOjlswSaveR2(iO)j2swSaveR3(rOLi3swSarveR4(iO)j4Int-Sfegestmez而jnputFni的ftiODOOOl7cIFIDI-IImulEX工givEXabortedIFIDIintEXIhlEl/WBIinputLoopChOQQOOI%faddEXxzz“qii5j3.0b«>CM)OaiO170kClockCycleDiarras口WINDL
4、X-RegisterIFileVVFnciQwMerri©ryFC-工MRR二TR-A=AHI-B=BHI-BTA=ATJU-&LUHIDMAR=SDR-SDEHII.DR-1LDEHIKO-00000014c0it00000148OmOOOODOOOyrOODODOODOmOOOODOOOnOOOOQODn000000000xDonagiios=OmOOOOOOOOwDDDOaiODaOmO0000000ODiDDa=OmOOOOOiOOO :K口口口口.口.口=OnOOOODOOO 3cQOQOQiODaRL口村口0口口1口口口R3=R8二R1O=DicDOOClDOOU
5、O?eO00001000DjcOOOOQOOOOstOOOOOOOOOjtOOOOOiOODstOOOOO'OOOooiLioooooooxoooodoaoOicOOOClOOOlO二一二二=二二=一=二二二二-O12345_67B9012345670904S6789111111111122222222223FFFFFFFFFFFFFFFFFFFFFFFFFFFoon-on-onononoDOUODo_uo_un-on-on-ORegister图指出了各个存放器和存储器的值,如执行完了第一条加法指令之后,R1=OX000010O0Total:6Cdelsexecuted.IDexecu
6、tedby4Instructiorufs),4ln&truction(scurrentIpinPipeline.HairdwereoonfIguHmtion:Memorysize:327S8BytesfaddEX-5lages.1,requiredCycles:2JmUlEX-Stages;1requiredCycles:5Fdiv£X-S(ages:111rrequiredCycles:19Fotfardingenabled.StailIs;RAWstalls:0(0.00ofallCycles-thereof:LDstalls:0(0.00ofRAWstalls)Brri
7、Pch/Jumpstalls:0(0,00ofRAW牟WilsJFloatingpointstalls:0(00OofRAWstaill5WAWstalls:00.00or811CyclesStructuralstalls-0.OOSfofallCyclesControlstalls:11G.G7SofallCyicles)Trapstalls'(O.OOXofallCycles)Total;1StalH)(16,675;ofallCycles)ConditxoelaIBra.nches).Totail:0(0.00otallInsJUuctions),thereof:taken:D(
8、QD5fofallcQnd.Brafiche-sJnottaken:0(0.00ofq】ccrud.Branches)Statistics指出了指令的相关分析数据,例如,执行了6个cycles,4条指令在流水线中等相关的总结信息.Total:IQZCyeleltJftwcUMIDewKLtedby67lnSnWiofi|$l2Insinxlioti'ilcuretilyriPpeirteDLSStandard-1/0An.i&tegeir口813日>1.6Factorial-720S-axdv-axe-canEiguzQtiodMeiray签7/叼色IMi菱X国制网1.K
9、MMedCdMrt:2ImJEA-StagK.rwr.-r-KlCjkIas:5Idi4用lag":LicquiedCyct£19Stalls:RAW100雕ofAiliwZLD3次皿ofRIW曲|囱ancWJuTp£党:ZfilOIKdRAWslaklFbgcunidaisH闻00dRAWaIs)WW世&贯0Q.MKM$CA*JStucKr.alsials:IO0Q*kaICpchslCwftdsljls:10molriCpdeijTw$i4t$1之1而武出丁加1325城同31.37HdU1曲上)Condit101141TdUtBIllJlnAudkFi
10、slLflttMALakjm:2|25DO"olUumd由am判词2i&a6?苒脆M温wrxJa执行结果图gcm.s、prim.s类似,所以只给出运行的结果图髓WJNDLX-ClockDigramFileWindoxExecuteMcmoiryCanfigurationClockCycleDigrdMlruHiw,匚2"卜ME14i人1149115g/151.5,153,154,1旺,何,bhMd3/1GifrrtaIF|R.Sidiir-iD"MEMT-E|DLX'tanI/q名山i2j2j1igcrn.Loopsubi
11、1j1j2seqi3/1jZbnesi3jResdtsgtr3j1.r2bneziSIGieateisub22川|IF|D-T'-E:|MEMIV/B|FirstNujiber.4.5SecondHu凯ber:13gcH=SIF|IF|ID-rr.E:|MEM|WB|IF|aboitedsubi111j2igQm.LoopswPrhtlValuB|rOLi1seqr3ji1j2bnezi3JR日加50rS.rl.riaPtHIValuclrOMlgcm.s结果图Prim.s结果图2.用WinDLX云行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相关的部件
12、;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的百分比;论述资源相关对CPU生能的影响,讨论解决资源相关的方法.目ClockCycleDiacraaIresJjudianE/CgEfewldl0.0M(Xi2)IdI4.0mD|i3)adddfO.lOJ4addd氾加J2;-30-29.-23-27,-2S,-252,-23-22,-21-2D,-19,-18-17.-16-15,-14-131111111111i1111n叔irtedaddr2.i2.0x8.addr3j3.0x8subi5j4,i2bneziS.looptrapOwO站里图资源相关的指令:adddf
13、0,f0,f4adddf2,f0,f2发生先写后读的数据相关导致消除了资源相关由图可知是由于只有一个faddEX的运算部件,而它需要两个时钟周期,当第一条addd指令执行EX段时,第二条指令势必要等一个周期等faddEX部件空闲了才能够使用.但是,同时由于这两条指令存在先写后读数据相关,暂停一个周期之后没有了资源相关adddFO.H3.M:|IF|I0希rf-1J,|MEMIWgT|adddr2.rO.l2:|IF|SWII|I-闫1PladdEK1j泥EIWB|InforMationaboutadddf2,f叽f2adddf2J(M2IFIDAdr.:loop+OxcCode:0x04021
14、004Terminated$uccessfulyFirstCpde:26Ld$tCycle:-19TotalCycles:3Cycles26(2)TerminatedsuccessfullyIIMAR<PC(=loop+0xc)IR<-MemIMAR(=0x04021004PCcPC+4卜俯中+0*101Stal()becauseofstructuralHazard!Cycles:-24(2)Terminatedsucces4必(=9)B<-D2=72)1Stall(s)becauseofRAW-HazrdwithadddKUDJ4faddEX(l)MEMWBCycles:*
15、22(2)TerminatedsuccessJulyALU<A+B(=90)(A=1UB=72)NoStallsrequiredForwardingapplicated:A<-DxO(adddQfO.f町AHI<-Ok40320000(adddfOJOJ4)Scle工-201)TerminatedsuccessfullyNothingtodaNoStallsrequired.Cycles:-19(1JIerminatedsuccessfullyD2<ALU(=90)NoStallsrequired.单条指令的详细资源冲突图由于Statistics图中的分析数据没有看见s
16、tructuralstall,但是根据图知道这个存在adddf2,f0,f2时的资源冲突,大概循环了6次,总共时钟周期是139个,所以资源相关引起的暂停的时钟周期的个数是6个,暂停时钟周期数占总执行周期数的百分比为6/139=4.3%WIIMOLX-File;-W/in<dovtf,C.<3rrfigLjrt-iQnsticsTD>I0上.133iCyj匚lulls:HMUfulucLIDuxuuutudti5J曰6IriTkructicn(-x:).Nlnj.krui=tian(£)curreritlyinPipcineHmrTB4nr&unn1£
17、;-i-g11i:t?n.tGon,Meoiorjutsjize-iRjptesfaddEX-Stooesr1.requiredCycles:之froulEX-Staoes:1.reauirediC$*cle:5fdkvEX-Stoes:1irrequiredCycles:1日Forafdinaeri-blexi.自七.工工H:HAWstalls.'JLJ(ZTutallthuru口I:l_d51ah:IO33.33口rRAW9白1匕|DramcKAJumpstalls:!.XofHAW土上Flc-atingpaintat凸II土:I0(33.33£cfRAA/st.alls
18、WAWstalls-(A门门注piniCycles)Striucfuralstnlli?'O(H口口备ofallC1日心旬Controlstalls:947本ofallTrpstalls-3(2.165EofaflliC5#cle)Total:42Stm肛法30.22ofaMCjpcleelCo>rxclat-ioti-c*.±Hj?y工20;11J:1ot-al.1U(-11.63ofcalllnitiuidions:)thereoLt-skcn:"33O.DD5iol-allcond.Br-5nch«)nottak.e-n:11.OOofallc
19、ond.Br-andhe-sJT.r-iAd一J三生0=0-Tns-taru.citions:Tct3卜尸门P:N?G.rrfIrt£lTLiul>inkwLthrcsretcbf-Loacfe-20(100口0ofLoad/StoreInstructionsJStores:00.口口慈erfLosd-/Store-lnstnucfiords:)Floait-ingisoi三七m0日instmetione:TolaL20123.NS宅ofallln«<iuictior-i$)?tKereuli;Addituri.201考olFlu-dlirimp口irit
20、65;1口in¥LIMLHltiph匚目ti口in±1U|,U.(JCliind卜II口与iLhtiqpoint注1口q=in7L|Orvisiom:.O.N.口FFlo-atingponnl:Tt-sgeimLJ"THdpm:Tr-aps:1(NII口F凸11IInstrud-ions:)Statistics数据分析图资源相关降低CP帆能,并行运算的速度降低,解决资源相关的方法有停顿几个时钟周期法针对访存冲突和设备资源冲突轮流单个使用或者是增加硬件设备解决设备资源冲突.3.在不采用定向技术的情况下去掉Configuration菜单中EnableForwardin
21、g选项前的勾选符,用WinDLX!行程序data_d.s.记录数据相关引起的暂停时钟周期数以及程序执行的总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比.在采用定向技术的情况下勾选EnableForwarding,用WinDLX再次运行程序data_d.s重复上述3中的工作,并计算采用定向技术后性能提升的倍数.1、不定向技术:总时钟周期=202数据相关引起的暂停时钟周期=104暂停时钟周期数占总执行周期数的百分比=51.48%St&Hardwareconfiguzration二MemoirSissi327G6BtesfiddEX-Stages:LrequiredCycles:2f
22、mulEX-Stages:1HrequiredCycles;5fdivEX-Stages:1,requiredCycles:13Forwardingdisabled.JLCXiclesAWAWstalls0(0.00otallCycles)Sbucluil£l«lh:0(000ofallCycles)Controltrails:9(446彳ofMlCycles)Trapstall?;3(1.43ofalCycles)Total:116StaKW(57.42fectalCycles)CcnditicnalBranches);Total;10(1176ofallInstruct
23、ionsLthereof:taken:9(90.00ofallcord.BrarchesJnott5kenc1(10.00ofallcondBlanches)Load-toreIustructions:Total:30(3.23%of11Instructions),thereof:L-±.rmmoor0工!三一卜=1m-七2、定向技术:总时钟周期=128数据相关引起的暂停时钟周期=30暂停时钟周期数占总执行周期数的百分比=23.44%Tnsnuetien(sJ.2Instruction仁currentlyinPipeline.Hardwacreconfigu3?aitiooi:Mem
24、orysize:32768BtesfaddEX-Stage5:1RrequiredCycles:2fmulEX-S(ages:1HrequiredCycles:5rdr/t?:-Siages:1,requiredCycles:19Forwardingenabled.axz£Laikmn泛ofal匚uc:后止.由日E川:1BranchZJunpitalk:ID33,33ofRAWstalls)Fhaiingpointstalls:0(0.口0君ofRAWstalls)W直Wstalls:0(O.aOStof4IICelesStructuralstalls:0(0.00ofallCycl
25、esControlstalls:9(7.03cfalCvclesTrapstake3(2.34老ofalCyclesTotal:42Stall(sJ(32.ofMCycles)Condi11ona1Branches):Total:10口1r76霁ofallInstructions),thereof:taken:9(90.00ofalleandBranchesncittaken:1(10.00ofallcond.Branches)定向技术的加速比=202/128=1.578四、心得体会通过使用WinDlX对指令模拟与分析,我们对流水线的执行过程更加熟悉,也对执行时进一步加深了使我们对流出现的问题
26、,如资源相关,数据相关等产生原因有了清楚的熟悉,水线的理解.3.2循环展开及指令调度一、实验目的1,加深对循环级并行性、指令调度技术、循环展开技术以及存放器换名技术的理解;2,熟悉用指令调度技术来解决流水线中的数据相关的方法;3,了解循环展开、指令调度等技术对CPIB能的改良.二、实验平台WinDLX模拟器.三、实验内容、步骤及实验结果1.用指令调度技术解决流水线中的结构相关与数据相关(1)用DLX汇编语言编写代码文件*.s,程序中应包括数据相关与结构相关(假设:加法、乘法、除法部件各有2个,延迟时间都是3个时钟周期)(2)通过Configuratio读单中的Floatingpointstag
27、e?s选项,把加法、乘法、除法部件的个数设置为2个,把延迟都设置为3个时钟周期;(3)用WinDLX运行程序.记录程序执行过程中各种相关发生的次数、发生相关的指令组合,以及程序执行的总时钟周期数;(4)采用指令调度技术对程序进行指令调度,消除相关;(5)用WinDLX运行调度后的程序,观察程序在流水线中的执行情况,记录程序执行的总时钟周期数;(6)根据记录结果,比拟调度前和调度后的性能.论述指令调度对于提升CPU性能的意义.1)代码:divff2,f5,f6divff1,f2,f6divff3,f1,f5divff0,f4,f7addff14,f0,f6addff15,f5,f7multff2
28、0,f4,f6multff21,f5,f72设置运算部件个数以及运算时钟周期数FloatingPointStageConfigura.以下为出现的数据相关IDCycles:.电司TerminatedsuccessfulA<-F2-132B<-F5=12司2Stall(s)becauseofRAW4Hazardwithdivf即5脂先写后读相关Pipeline图Cycles:*11(3)TerminatadsuccessfullyCounl:Delay:AdditionUnits:MulliplicationUnits:DivisionUnits:&32323MEMIWB1f
29、divE>:|1)|ID口卜山B<-F6-1282StalikbecauseofRAWHazard而thdivf(0/4J7IFIID|R-Stail由于只有两个除法部件,所以出现了功能部件的冲突总的执行周期是38指令调度后代码:将无关指令放在一起执行,相关指令分开尽量防止数据相关divff2,f5,f6multff20,f4,f6multff21,f5,f7divff1,f2,f6addff15,f5,f7divff3,f1,f5divff0,f4,f7addff14,f0,f6腼由皿I巷I.刘I-I右|小|包|刘I伯|代|M|直IIL4|IfTiDMTTMniwi2lpfl1j
30、2E21fHIfIGIZiWid2lpH1,j2EK编THrwpWIZJ5J53H割.H节md»I21,J517ifcfFUWBTdf15f5J7thfUFIB2lnstruictions|currentlyinPipeline.Pipeline图Hardwareconfigua?ation:Memorysiize:22768日yte台f-addEX-Slagei:2,inquiredCydesi3fmulEX-Stapgear之requiredCycles;2fdivEX-Slages.:2,requid巴dCycles.:3ForwardingenabledStalIs:RAW占
31、WIL:2|(S.57Sof吕IICycles),thereof:LDstalls:0(0.DOXofRAWstaRs)Branch/Jump占tails:00,00SiofRAW就司令Ftoalingpointstalls:3(100.00ofHAWstallsWAWstalk:0(,ofallCyclesSlructural号向版01(0.00ofallCjieleJContrclstaHs;0(D,QQ%ofallCcl$Trapstalls:720.00ofdlCyclelTotalWStdKs)2857S川国I匚皿司Conditions1Biranches);Total:00.00o
32、fallImstructionsthereof:taken:(0.00ofallcond.Branches)nottaken:0(.OOSrofallcond.BranchesStatistics图总执行时钟周期为35个.(6)指令调度后,前的时钟周期数为数据相关减少了,总时钟周期数减少了,效能提升了.调度38,调度后的时钟周期数减少为35,加速比=38/35=1.082,用循环展开、存放器换名以及指令调度提升性能(1)用DLX汇编语言编写代码文件*.s,程序中包含一个循环次数为4的整数倍的简单循环;(2)用WinDLX运行该程序.记录执行过程中各种相关发生的次数以及程序执行的总时钟周期数;(
33、3)将循环展开3次,将4个循环体组成的代码代替原来的循环体,并对程序做相应的修改.然后对新的循环体进行存放器换名和指令调度;(4)用WinDLX运行修改后的程序,记录执行过程中各种相关发生的次数以及程序执行的总时钟周期数;(5)根据记录结果,比拟循环展开、指令调度前后的性能.带循环指令代码:求四个1相加的和,结果存在r2中,text,globalmainmain:addir1,r0,#4addir2,r0,#0Loop:sgtr3,r1,r0bnezr3,Sub1trap0Sub1:addir2,r2,#1subir1,r1,#1jLoop结果:总时钟周期是42个,5rawstalls,循环了
34、4次,结果r2=4旧ClockCycleDiagram272BB29,3),113233,34.35,3G3711111111363940功1131jOIbrwzrXEiJbll国QkQ«3dd2/2,OwlLoop饰即112rlitjOIbrezrXSdblIrv0:hQaddIF|ID|i:匚MEM|WnIF|d3型|巾_I|MEM|WB|Stiatklii-sTot&l:42Cjc*a($|e»ecdtBdIDCMCCuledby251rl到rudE汕ZIWiucMri闵cutie曲hFlpebne.R3-OkOOOOODOOR4=OxOQOOQOODR5
35、171;DhOOOOOOOOPC=DxQOOOOllBIK1R=03C00000114IR-0x20420001a=OxQOQOOOOOAHDDxOOOOOOOOB-0x00000000BHI®DuDIDDOaOODBTA-000000000A1(J-DxOOOOOOOOdilUHI=DwDOOOODODFPSR-DOOOOOOODDHAR=0x000000005DR=DyQODOOOODSDRHI-OiiOOOOOiOOOLDR=DxOOQOOOOQLDRHI-OxOOOODODDR0*DxOOOOOOODRL二QkQQQQQQUQR?=UUUUUU4Herdvaxeeonfigu
36、r*tionM日mry也H327ES即*口ddEXXSt占ges:LcequredCycles:2frrMEX-Siade:lriequhedC%les5dh£X-St.ages-:1.requiredErdeis:19ForvuwdngStalls:RAW里日帕5(1190ofalCidesLfchweol:LDfialk0口叩,dRAW就&到Bianch/Jumps;tails:51Q0.OIKGAA>WwtK同二.l-il.cre川k-u'i循环展开:代码:.text.globalmainmain:addir1,r0,#4addir2,r0,#0addir
37、2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1addir2,r2,#1subir1,r1,#1trap0结果:执行了4次,结果r2=4总时钟周期是15个,0rawstalls,国ClockCycleDiagramiln$ixuciioni/卬cfej_addr2rrD.OifO“A1UFI巾T-IMEIMIIWBI.加add建立口收ifLIDL!MEMIWBItUbid.f1.Ok13ddi2启0内siibidljlXkclirepOxQStadstk5Total:15Cpdh(s|ewcdtedIDexe
38、cuiedM11Innxiioritsl2lrHtiu£tiah«curiendyrkRpeine.H*rdvareoonEiguratisnMemorysize:327tByiw'r口ddEX&dQts.1.requrcdCydst:2fimJEX-Siagestiequ«edCcte?5fdivEXStag6LreqWedGd的19For附3rlingenabledStalls:RAW驮&卜:U(000S&ofdlQtleslUhcreol:LD$闻上.以MR;dRAW,肉*Bianch/Junrps:taiIs:0(0.00%
39、ofRAW就d国1-!:-:l.l口L口Sn/By-4G.J-鼻.、IF|10慌EXMEM|WB|IIFI口1xlm'-StallIHAKhUKUUUUUlCJIR=0»0000000010x000000001-AHI*QxOQQQQQOO1B=OkODOQODOO1BHI-0x000000001BTA-QxQQOQQQOO1ALU=OkODOOOOOD1ALUHI-OkODOOOOOO1FPSR=口1DMAR=OxOonoQQoo1SDR-OkO'DOOOOOO1SDRHI-OkOQOQQOOO1LDR=OkOOOOOOOO1LDRHI-OkOOOOOOOO1R0=
40、OkQDODODOO1Rl=0x00000000JR2-OkOODOOOQ4R3=OkQDODODODR4-OkOOOOOOOO1IOxQOOOOQOQ1IF旧|HEXIMEM|丽口口I0O原因比照:是由于LOOP旨令执行完后会有一个nop指令的延迟.addr2/2f0«1IFPMEM|飞丽"subir1j1,0x1IFI口MEM|WEILoopnopIFaborted四、实验总结a指令调度技术可以明显的优化指令执行的效率,通过指令调度使得功能部件被尽可能的充分使用,从而进一步增强指令执行的效率;b循环在执行时会出现不同循环次数的执行过程中出现相关,导致数量增加,通过寄存器
41、换名等方法,使得这种相关性数量下降.3.3Cache性能分析、实验目的1 ,加深对Cache勺根本概念、根本组织结构以及根本工作原理的理解;2 ,了解Cache勺容量、相联度、块大小对Cache生能的影响;3 .掌握降低Cach既效率的各种方法,以及这些方法对Cache生能提升的好处;4 .理解Cach缺效的产生原因以及Cache勺三种失效;5 .理解LRU与随机法的根本思想,及它们对Cache生能的影响;、实验平台SimpleScala校拟器.三、实验内容及步骤1.在根本配置情况下运行程序请指明所选的测试程序,统计Cache总失效次数、三种不同种类的失效次数;配置好了环境之后,用hello.
42、c生成的a.out文件来进行模拟演示.rootlocalhostrootftcdsimplescalarrootClocalhostsimplescalar#./simplesim-3.O/sim-cachea.outill.accesses4207其totalnumberofaccessesill.hits3749#totalnumberofhitsill,misses458#totalnumberofmissesdll.replacements202#totalnumberofreplacementsdll.writebacks193#totalnumberofwritebacksill.
43、invalidations0#totalnumberofinvalidationsdll.miss_rate0.1089#missrate(ie,misses/ref)dll.repl_rate0,0480#replacementrate(iFe.,repls/ref)dll.wb_rate0,0459#writebackrate(i¥e.Twrbks/ref)dll.inv_rate0.0000invalidationrate(i.e.rinvs/ref)由图可知:Cache勺总失效次数为458,容量失效和冲突失效都发生了替换总共为202,那么强制性冲突就为256.2.改变Cach
44、es量*2,*4,*8,*64,运行程序指明所选的测试程序,统计各种失效的次数,并分析Cach断量对Cache性能的影响;测试程序为test-math.Cachel设定举例:-cache:dl1dll:2:32:4:r第一个参数为集合数,第二个参数为块的大小,第三个参数为相联度,最后一个参数为策略.改变集合数,设定块大小为32B,相联度为4路,采取LRU策略,来考虑容量对cache性能的影响.replacementrate(i.e.,repls/tef)writebackrate(i.e.,wrbks/ref)invalidationrate(i.e.,invs/ref)*2:设定容量为2*3
45、2*4B时,结果如下:dll,accesses57466#totalnuinberofaccessesdll.hits50201#totalnumberofhitsdll7265#totalnumberofmissesdll.replacements7257#totalnumberofreplacementsdll,writebacks4598#totalnumberofwritebacksdll.invalidations0#totalnumberofinvalidationsdll.miss_rate0.1264#missrate(i.e.pmisses/ref)0.12630.080D0
46、.0000存善群dll.repl_tatedll.wb_ratedll.inv_rate*4:设定容量为4*32*4B时,结果如下:dll,accesses57466#totalnumberofaccessesdll.hitsS3189#totalnumberofhitsdll.misses4277#totalmijtibei'ofmissesdll.replacements4261尊totalnumberofreplacementsdll.writebacks2692#totalnumberofwritebacksdll.invalidations0#totalnumberfinva
47、lidationsdll.Ttiiss_rate0.0744#missrate(i.e.,misses/ref)dll.repl_rate0.0741ftTeplacetnent】(i,e.,repls/ref)dll.wb_rate0.0468#writebackrate(i.e.,wrbks/ref)dll、inv_rat&0.0000#invalidationrate(i.e.tinvs/ref)_1n*8:设定容量为8*32*4B时,rcrrcq结果如下dll.accesses57466尊totalnumberofaccessesdll.hits55280#totalnumbe
48、rofhitsdll.fflisses2186#totalnumberofmissesdll-replacements2154尊totalnumberofreplacementsdll.writebacks1493#totalnumberfwritebacksdll.invalidations.#totalnumberofinvalidationsdll.miss_rate0,0380尊missrate(i.e.rmisses/ref)dll.repl_rate0,0375#replacementTate(i,e-repls/ref)dll.wb_rate0.0260善writebackrat
49、e(i.e.,wrbks/ref)dll.inv_raTe0,0000带invalidationrate总、,invs/ref)*64:设定容量为64*32*4B时,结果如下:dll.accesses57466#totalnumberofaccessesdll.hitsS6891善totainumberofhitsdll.misses575#totalnumberofmissesdll.replacetnents319totalnumberofreplaeerLEfUtsdll+writebacks307#totalnumberofwritebacksdll.InvalidatiGns0tot
50、alnumberofinvalidationsdllhjniss_rate0.0100#missrte(i,栏-*misses/ref)dll,repl_rateO.OOS6并replacementrate!(i.e.,repls/ref)dll.wb_rate0.0053#writebackrate(ie.*wrbks/rof)dll.inv_rate0.0000invalidationrate(i.e.,invs/ref)从上面的数据中提取出有用的数据信息,制作下面的表.容量人小总失效率总失效数容量失效和冲突失效数强制性失效数*20.1264726572578*40.07444277426
51、116*80.03802180215426*640.0100575319256结论:随着cache容量的增大,总失效率减小,总失效数也减少,容量失效和冲突失效数也减小,但是强制性失效数反而升高.3 .改变Cache勺相联度1路,2路,4路,8路,64路,运行程序指明所选的测试程序,统计各种失效的次数,并分析相联度对Cache生能的影响;固定其他的参数,只测试程序为test-printf.参数dl1:2:32:12,4,8,64:l,改变相联度的参数,观察相联度对cache性能的影响.1路:dll,accesses531424dll.hits300140dllHisses223284dll,re
52、placements223282dll.writebacks83743dll-invalidations0dll.misE_rate0.4202dll,repl_rate0.4202dll,wb_rate0.157日dll*inv_rate0.0000#totalnumberofaccesses#totalnumberofhits#totalnumberofmisses#totalnumberofreplacements#totalnumberofwritebacks#totalnumberofinvalidations# missrate(i.e.,misses/ref)ffreplacem
53、entrate(i.e.,repls/ref)# writebackrate(i.e*>wrbks/ref)# invalidationrate(i.erinvs/ref)2路:dll.accessesdll.hitsdll.missesdll.replacementsdll.writebacksdll,invalidations.rnss_yfitedll,repl_ratedll.wb_ratedll.inv_rate531424totalnumberofaccesses395208#totalnumberofhits136216totalnumberofmisses136212#totalnumberofreplacements62B80totalnumberofwritebacks0善totalnumberofinvalidations0,2563#missrate(i.,e.,misses/ref)0.25630.11S30.0000m1GHiaifreplacementrate(ie.repls/ref)writebackrate(i.e.,wrbks/ref)invalidationrate(i.e,tinvs/ref)i
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度车辆使用安全责任追究与赔偿协议4篇
- 2025年度交通基础设施建设拆迁合同样本4篇
- 2025年度重点工程项目测绘数据使用保密协议4篇
- 2025年度办公楼楼梯口拆除重建合同样本4篇
- 2025年度建筑节能玻璃幕墙工程分包合同3篇
- 二零二五版房地产项目财务顾问及投资回报分析合同3篇
- 二零二四年互联网医疗合作合伙协议书3篇
- 石家庄2025年度物流运输合同范本2篇
- 2025年度苹果种植园土地流转合作合同4篇
- 二零二五版汽车合伙购买合同2篇
- 乳腺癌的综合治疗及进展
- 【大学课件】基于BGP协议的IP黑名单分发系统
- 2025年八省联考高考语文试题真题解读及答案详解课件
- 信息安全意识培训课件
- 2024安全员知识考试题(全优)
- 知识库管理规范大全
- 弘扬教育家精神争做四有好老师心得10篇
- 采油厂联合站的安全管理对策
- 苗医行业现状分析
- 中国移动各省公司组织架构
- 昆明手绘版旅游攻略
评论
0/150
提交评论