系统结构试验_第1页
系统结构试验_第2页
系统结构试验_第3页
系统结构试验_第4页
系统结构试验_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、系统结构实验报告11070113 臧琦11070230 曾凯目录实验一 流水线中的相关 31、实验目的 32、实验平台 33、实验要求 34、实验结果 44.1 用 WinDLX 模拟器执行下列三个程序 44.1.1 用 WinDLX 模拟器执行阶乘程序 fact.s的结果如下所示 44.1.2 用 WinDLX 模拟器执行阶乘程序gcm.s 的结果如下所示 54.1.3 用 WinDLX 模拟器执行阶乘程序prim .s 的结果如下所示 74.2 用 WinDLX 模拟运行器程序structure_d.s ,进行相关实验 84.3 比较定向与不定向技术,用WinDLX 模拟运行器程序data

2、_d.s ,进行相关实验 114.3.1 采用不定向技术,用 WinDLX 模拟运行器程序 data_d.s ,进行相关实验 . 114.3.2 采用定向技术,用 WinDLX 模拟运行器程序 data_d.s ,进行相关实验 115、总结与体会 12实验二 循环展开及指令调度 131、实验目的 132、实验平台 133、实验要求 134、实验结果 144.1 用指令调度技术解决流水线中的结构相关与数据相关 144.1.1 原指令执行的相关结果 144.1.2 调整指令顺序指令执行的结果 164.2 用循环展开、寄存器换名以及指令调度提高性能 174.2.1 原循环程序运行的结果 174.2.

3、2 将循环程序展开运行的结果 184.2.3 将程序循环展开、指令调度后运行的结果 195、总计与体会 21实验三 cache 性能分析 211、实验目的 212、实验平台 213、实验要求 214、实验结果 224.1.基本配置情况下运行程序 224.2改变 Cache 容量对 Cache 性能的影响 224.3改变 Cache的相联度对 Cache性能的影响 254.4改变 Cache块大小对 Cache性能的影响 274.5不同的替换算法对 Cache性能的影响 294.5.1 不同容量下,不同的替换算法对 Cache 性能的影响 305 、总计与体会 36实验一 流水线中的相关1、实验

4、目的1. 熟练掌握 WinDLX 模拟器的操作和使用,熟悉 DLX 指令集结构及其特点;2. 加深对计算机流水线基本概念的理解;3. 进一步了解 DLX 基本流水线各段的功能以及基本操作;4. 加深对数据相关、结构相关的理解,了解这两类相关对 CPU 性能的影响;5. 了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停2、实验平台用 WinDLX 模拟器模拟流水线。3、实验要求1. 用WinDLX 模拟器执行下列三个程序:求阶乘程序 fact.s求最大公倍数程序 gcm.s求素数程序 prim.s分别以步进、连续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察CP

5、U 中寄存器和存储器的内容。熟练掌握 WinDLX 的操作和使用。2. 用WinDLX 运行程序 structure_d.s ,通过模拟找出存在资源相关的指令对以及导致资源 相关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周 期数的百分比;论述资源相关对 CPU 性能的影响,讨论解决资源相关的方法。3. 在不采用定向技术的情况下(去掉 Configuration 菜单中 Enable Forwarding 选项前 的勾选符) ,用WinDLX 运行程序 data_d.s 。记录数据相关引起的暂停时钟周期数以及程 序执行的总时钟周期数,计算暂停时钟周期数占总执行周期数的

6、百分比。在采用定向技 术的情况下 (勾选 Enable Forwarding ),用 WinDLX 再次运行程序 data_d.s。重复上述 3 中 的工作,并计算采用定向技术后性能提高的倍数。4、实验结果4.1 用 WinDLX 模拟器执行下列三个程序4.1.1 用 WinDLX 模拟器执行阶乘程序 fact.s 的结果如下所示步进方式运行程序结果如下所示图 1 以步进方式进行的过程连续方式运行程序结果如下所示4图 2 连续方式,程序无间断的进行设置断点方式运行程序结果如下所示图 3 通过设置不同的断点来控制程序的执行4.1.2 用 WinDLX 模拟器执行阶乘程序 gcm.s 的结果如下所

7、示步进方式运行程序结果如下所示5图4 以步进方式进行的过程,经过有限的步骤将程序的结果运行出来连续方式运行程序结果如下所示图 5 连续方式,程序无间断的进行,直到程序结束 设置断点方式运行程序结果如下所示6图 6通过设置不同的断点来控制程序的执行4.1.3 用 WinDLX 模拟器执行阶乘程序 prim .s 的结果如下所示步进方式运行程序结果如下所示图 7 以步进方式进行的过程7连续方式运行程序结果如下所示图 8 连续方式,程序无间断的进行,直到程序结束 设置断点方式运行程序结果如下所示图 9通过设置不同的断点来控制程序的执行4.2 用 WinDLX 模拟运行器程序 structure_d.

8、s ,进行相关实验8图 10 structure_d.s 程序运行的流水线图资源相关的指令对指令 ADDD F2, F0, F2 在译码阶段 ID停滞 1 周期(1)ADDD F0, F0, F4ADDD F2, F0, F2 ;导致资源相关的部件: ALU;(2)ADDD F2, F0, F2ADDIR2, R2, #8导致资源相关的部件: ALU; 指令ADDI R2, R2, #8 在执行阶段 intEX停滞1周期3)ADDDF2, F0, F2ADDIR2, R2, #8 ;ADDIR3, R3, #8 ;SUBR5, R4, R2;mem部件相关) mem部件相关) ( mem部件相

9、关)由资源相关引起的暂停时钟周期数图 11 程序执行总的周期数以及延迟的周期数由资源相关引起的暂停周期数为: 30总执行周期数为: 139暂停周期数占总执行周期数的百分比: 30/139=21.58%分析及解决办法 分析:资源相关使相关指令在流水线上停滞,降低了执行效率,使 cpu 的性能下 降。解决方法: 在合理的指令调度范围内, 尽量避免执行重复的指令。 尽量避免同一 寄存器的频繁使用,若无法避免,则使用寄存器换名的方法。104.3 比较定向与不定向技术,用 WinDLX 模拟运行器程序 data_d.s ,进行相关实验4.3.1采用不定向技术,用 WinDLX 模拟运行器程序 data_

10、d.s ,进行相关实验图 12 采用非定向技术运行的结果图 由数据相关引起的暂停时钟周期数为: 104 总执行周期数为: 202暂停周期数占总执行周期数的百分比: 104/202=51.48%4.3.2采用定向技术,用 WinDLX 模拟运行器程序 data_d.s ,进行相关实验在采用定向技术的情况下(勾选 Enable Forwarding),用 WinDLX再次运行程序 data_d.s。重复上述 3 中的工作,并计算采用定向技术后性能提高的倍数。11图 13 定向技术相关结果的截图由数据相关引起的暂停时钟周期数为: 30总执行周期数为: 128暂停周期数占总执行周期数的百分比: 30/

11、128=23.44%总结 : 采用定向技术性能提高的倍数:202/128=1.58 倍5、总结与体会这次实验让我很好的学习了 windlx 的用法,对其中的各种操作以及性质有了更好的认 识与应用, 为之后的学习以及发展带来了极大的便利。同个对几个 .s 程序的运行, 让我对流 水线的过程有了更加清楚的认识, 将课堂上学到的理论知识运用到了实际中去。 同时, 对数 据相关、 资源相关等有了更好的认识与了解, 对程序的简化运行有了更加清楚的认识, 为以 后清楚的快捷的运行提供了思想的基础。 最后,对定向技术以及其性能有了更加清楚的了解, 充分认识了定向技术的优点, 在以后的开发应用中, 要多采用定

12、向技术, 可以减少程序的运 行周期,提高程序的运行效率。12实验二 循环展开及指令调度1、实验目的1. 加深对循环级并行性、指令调度技术、循环展开技术以及寄存器换名技术的理解;2. 熟悉用指令调度技术来解决流水线中的数据相关的方法;3. 了解循环展开、指令调度等技术对 CPU 性能的改进。2、实验平台用 WinDLX 模拟器模拟流水线。3、实验要求1用指令调度技术解决流水线中的结构相关与数据相关(1)用 DLX 汇编语言编写代码文件 *.s,程序中应包括数据相关与结构相关(假设:加 法乘法除法部件各有 2 个,延迟时间都是 3 个时钟周期)( 2)通过 Configuration 菜单中的“

13、Floating point stages ” 选项,把加法乘法除法 部件的个数设置为 2 个,把延迟都设置为 3 个时钟周期;(3)用 WinDLX 运行程序。记录程序执行过程中各种相关发生的次数、发生相关的指 令组合,以及程序执行的总时钟周期数;(4)采用指令调度技术对程序进行指令调度,消除相关;(5)用 WinDLX 运行调度后的程序,观察程序在流水线中的执行情况,记录程序执行 的总时钟周期数;(6)根据记录结果,比较调度前和调度后的性能。论述指令调度对于提高CPU 性能的意义。2. 用循环展开、寄存器换名以及指令调度提高性能(1)用 DLX 汇编语言编写代码文件 *.s,程序中包含一个

14、循环次数为 4 的整数倍的简单 循环;(2)用 WinDLX 运行该程序。记录执行过程中各种相关发生的次数以及程序执行的总 时钟周期数;(3)将循环展开 3 次,将 4 个循环体组成的代码代替原来的循环体,并对程序做相应的 修改。然后对新的循环体进行寄存器换名和指令调度;(4)用 WinDLX 运行修改后的程序,记录执行过程中各种相关发生的次数以及程序执134、实验结果4.1 用指令调度技术解决流水线中的结构相关与数据相关4.1.1 原指令执行的相关结果DLX 汇编语言编写代码文件 *.s 的内容如下所示:addf f0,f0,f1addf f1,f3,f4addf f2,f0,f2multf

15、 f6,f2,f0addf f0,f0,f1multf f1,f6,f0subf f3,f7,f8subf f7,f3,f1 trap 0通过 Configuration 菜单中的“ Floating point stages ” 选项,把加法乘法除法部件 的个数设置为 2 个,把延迟都设置为 3 个时钟周期图 2-1 加法器、乘法器、除法器的设置 程序运行的流水线图14图 2-2 程序执行时的流水线图指令执行结果的统计图 2-3 指令执行结果的统计从上图中,我们可以看到指令执行的总周期是22,发生相关的次数是 4,总的延迟周期是14,各种相关指令的组合如下所示:1、 addf f0,f0,f

16、1addf f1,f3,f4对 f0 的数据相关addf f2,f0,f22、addf f2,f0,f2multf f6,f2,f0对 f2 的数据相关3、addf f0,f0,f1multf f1,f6,f0对 f1 的数据相关4、 subf f3,f7,f8subf f7,f3,f1对 f3 的数据相关154.1.2 调整指令顺序指令执行的结果调整指令后的顺序如下所示addf f0,f0,f1addf f1,f3,f4subf f3,f7,f8addf f2,f0,f2 multf f6,f2,f0 subf f7,f3,f1 addf f0,f0,f1 multf f1,f6,f0 tr

17、ap 0指令执行的流水线结果如下所示图 2-4 指令执行的流水线图 周期统计图图 2-5 执行结果统计图16从上图中,我们可以看到指令执行的总周期是20,发生相关的次数是 2,总的延迟周期是12指令调度后的加速比是 22/20=1.1 ,通过指令调度,可以充分利用 cpu部件利用率,减少数据 相关和资源相关引起的暂停。4.2 用循环展开、寄存器换名以及指令调度提高性能4.2.1 原循环程序运行的结果运行的程序如下所示.dataA: .word 1B: .word 4.text.global main main:lf f0,Alf f1,BLoop:eqf f1,f2bfpt Finish ad

18、df f2,f2,f0 subf f4,f3,f7 addf f5,f4,f8 multf f6,f3,f9 subf f7,f6,f3 j LoopFinish: trap 0程序运行的流水线图如下图所示图 2-6程序运行的统计结果图如下图所示17图 2-7总计执行周期: 70总计时延: 32 个周期4.2.2 将循环程序展开运行的结果运行的程序如下所示subf f4,f3,f7addf f5,f4,f8 multf f6,f3,f9 subf f7,f6,f3subf f4,f3,f7addf f5,f4,f8 multf f6,f3,f9 subf f7,f6,f3 subf f4,f3

19、,f7addf f5,f4,f8 multf f6,f3,f9 subf f7,f6,f3 subf f4,f3,f7addf f5,f4,f8 multf f6,f3,f9 subf f7,f6,f3 trap 0 程序运行的流水线图如下图所示18图 2-8程序运行的统计结果图如下图所示图 2-9总计执行周期: 47总计时延: 31 个周期从上面的结果可以看出,循环展开后的加速比为 70/47=1.49 ;由此可见循环展开可以极 大的提高 cpu 的效率。4.2.3 将程序循环展开、指令调度后运行的结果运行的程序如下所示.dataA: .word 1B: .word 4.text.globa

20、l mainmain: lf f0,Alf f1,B19subf f4,f3,f7 multf f6,f3,f9 addf f5,f4,f8 subf f7,f6,f3 subf f4,f3,f7 multf f6,f3,f9 addf f5,f4,f8 subf f7,f6,f3 subf f4,f3,f7 multf f6,f3,f9 addf f5,f4,f8 subf f7,f6,f3 subf f4,f3,f7 multf f6,f3,f9 addf f5,f4,f8 subf f7,f6,f3 trap 0程序运行的流水线图如下图所示图 2-10程序运行的统计结果图如下图所示20图

21、 2-9总计执行周期: 39总计时延: 22 个周期 从上面的结果可以看出,循环展开后的加速比为 70/39=1.79 ;由此可见循环展开、指令 调度可以极大的提高 cpu 的效率。5、总计与体会这次实验让我对指令的调度有了很好的理解, 通过指令调度执行时间的计算, 更好的看 出了指令调度可以极大的提高 cpu 的运行效率。 同时,循环展开也可以很好的提高 cpu 的运 行效率,将两者结合起来,可以极大的提高运行的效率, 为程序的运行带来极大的便利,在 今后的程序设置以及程序的运行中, 我们可以很好的利用这一特性, 来提高我们程序运行的 效率,节省时间。实验三 cache性能分析1、实验目的1

22、 加深对 Cache的基本概念、基本组织结构以及基本工作原理的理解;2 了解 Cache的容量、相联度、块大小对 Cache性能的影响;3 掌握降低 Cache失效率的各种方法,以及这些方法对 Cache性能提高的好处;4 理解 Cache失效的产生原因以及 Cache的三种失效;5 理解 LRU与随机法的基本思想,及它们对 Cache性能的影响;2、实验平台SimpleScalar模拟器3、实验要求1在基本配置情况下运行程序(请指明所选的测试程序),统计 Cache总失效次数、三种不同种类的失效次数;2改变 Cache容量( *2,*4 ,*8, *64 ),运行程序(指明所选的测试程序)

23、,统计各种 失效的次数,并分析 Cache容量对 Cache性能的影响;3改变 Cache的相联度( 1路, 2路, 4路, 8路, 64路),运行程序(指明所选的测试程21序),统计各种失效的次数,并分析相联度对Cache性能的影响;4改变 Cache块大小( *2,*4,*8 ,*64),运行程序(指明所选的测试程序) ,统计各 种失效的次数,并分析 Cache块大小对 Cache性能的影响;5分别采用 LRU 与随机法,在不同的 Cache容量、不同的相联度下,运行程序(指明所 选的测试程序) 统计 Cache总失效次数, 计算失效率。 分析不同的替换算法对 Cache性能的影 响。测试

24、程序:用于实验的测试程序可以使用现有的,即benchmark目录下的所有程序;也可以自己用C 语言直接生成各类典型程序比如:数学运算类、输入输出类等,通过本环境提供的特定 C 编译器,编译生成对应的 xxx.out (默认是 a.out)测试程序用于实验。 每个测试程序所需时间大概是 10分钟, 选择测试程序时注意从不同组中选择, 以便使得出的 结果不会因为对单项有所侧重而有失偏颇。每个人从中选出46 个测试程序进行测试。4、实验结果4.1.基本配置情况下运行程序默认参数如下所示:-cache:dl1 dl1:256:32:1:l-cache:dl2 ul2:1024:64:4:l-cache

25、:il1 il1:256:32:1:l对于测试程序 benchmarkbin.littletest-math 测试结果如下所示il1.misses (指令 cache )23761 # total number of missesdl1.misses (数据 cache )804 # total number of missesul2.misses1203 # total number of misses对于测试程序il1.missesbenchmarkbin.littletest-lswlr 测试结果如下所示547 # total number of missesil1.miss_rate0

26、.0627 # miss rate (i.e., misses/ref)dl1.misses459 # total number of missesdl1.miss_rate0.0971 # miss rate (i.e., misses/ref)ul2.misses477 # total number of misses4.2改变 Cache容量对 Cache 性能的影响实验具体要求 :改变 Cache容量(*2,*4,*8,*64),运行程序 (指明所选的测试程序) , 统计各种失效的次数,并分析 Cache容量对 Cache 性能的影响; 由于测试程序中指令项较多,因此在 cache 改

27、变的实验中皆改变 icache 通过下面的命令,将 cache 的由原来的 256 组变为 512 组rootlocalhost simplescalar# cd22/root/simplescalar/simplesim-3.0/tests-pisa/bin.littlerootlocalhostbin.little# /root/simplescalar/simplesim-3.0/sim-cache-cache:il1 il1:512:32:1:l test-math512 # total number of misses231、测试程序为 benchmarkbin.littletest

28、-printf-cache:il1il1:256:32:1:lil1.misses112488 # total number of missesil1.miss_rate0.0620 # miss rate (i.e., misses/ref)-cache:il1il1:512:32:1:lil1.misses60016 # total number of missesil1.miss_rate0.0331 # miss rate (i.e., misses/ref)-cache:il1il1:1024:32:1:lil1.misses23335 # total number of misse

29、sil1.miss_rate0.0129 # miss rate (i.e., misses/ref)-cache:il1il1:2048:32:1:lil1.misses8578 # total number of missesil1.miss_rate0.0047 # miss rate (i.e., misses/ref)-cache:il1il1.missesil1:16384:32:1:l1515 # total number of missesil1.miss_rate0.0008 # miss rate (i.e., misses/ref)2、测试程序为 benchmarkbin

30、.littletest-llong-cache:il1il1:256:32:1:lil1.misses1130 # total number of missesil1.miss_rate0.0383 # miss rate (i.e., misses/ref)-cache:il1il1:512:32:1:lil1.misses936 # total number of missesil1.miss_rate0.0317 # miss rate (i.e., misses/ref)-cache:il1il1:1024:32:1:lil1.misses634 # total number of m

31、issesil1.miss_rate0.0215 # miss rate (i.e., misses/ref)-cache:il1il1:2048:32:1:lil1.misses594 # total number of missesil1.miss_rate-cache:il10.0201 # miss rate (i.e., misses/ref) il1:16384:32:1:lil1.misses534 # total number of missesil1.miss_rate0.0181 # miss rate (i.e., misses/ref)-cache:il1il1:256

32、:32:1:lil1.misses577 # total number of missesil1.miss_rate0.0758 # miss rate (i.e., misses/ref)-cache:il1il1:512:32:1:l3、测试程序为 benchmarkbin.littleanagramil1.missesil1.miss_rate0.0672 # miss rate (i.e., misses/ref)-cache:il1il1.misses il1.miss_rate-cache:il1il1.missesil1:1024:32:1:l502 # total number

33、 of misses0.0659 # miss rate (i.e., misses/ref) il1:2048:32:1:l477 # total number of missesil1.miss_rate0.0626 # miss rate (i.e., misses/ref)-cache:il1il1:16384:32:1:lil1.misses477 # total number of missesil1.miss_rate0.0626 # miss rate (i.e., misses/ref)4、测试程序为benchmarkbin.littletest-fmath-cache:il

34、1 il1.misses il1.miss_rate-cache:il1 il1.misses il1.miss_rate -cache:il1 il1.misses il1.miss_rate -cache:il1 il1.misses il1.miss_rate -cache:il1 il1.misses il1.miss_rateil1:256:32:1:l6093 # total number of misses0.1143 # miss rate (i.e., misses/ref) il1:512:32:1:l4100 # total number of misses0.0769

35、# miss rate (i.e., misses/ref) il1:1024:32:1:l2231 # total number of misses0.0418 # miss rate (i.e., misses/ref) il1:2048:32:1:l1360 # total number of misses0.0255 # miss rate (i.e., misses/ref) il1:16384:32:1:l1032 # total number of misses0.0194 # miss rate (i.e., misses/ref)改变cache容量时的变化曲线图率效失545.

36、4 0 .30012345坐标轴标题10.test-fmath anagram test-llong test-printf图一 改变 cache 容量时,失效次数的变化24分析:从上图中, 我们可以清楚的看到不同的测试程序随着 cache 容量的增加失效率都 会下降。 意味着为了提高命中率, 我们可以增加 cache 的容量, 但是实际中由于 cache 各种消耗等,其容量不可以无限的增加。4.3改变 Cache的相联度对 Cache性能的影响实验具体要求: 改变 Cache 的相联度( 1 路,2 路,4 路, 8 路,64 路),运行程序(指 明所选的测试程序) ,统计各种失效的次数,

37、并分析相联度对 Cache 性能 的影 响;1、测试程序为 benchmarkbin.littletest-fmath-cache:il1 il1:256:32:1:lil1.misses 6093 # total number of missesil1.miss_rate 0.1143 # miss rate (i.e., misses/ref)-cache:il1 il1:256:32:2:lil1.misses 3136 # total number of missesil1.miss_rate 0.0588 # miss rate (i.e., misses/ref)-cache:il

38、1 il1:256:32:4:lil1.misses1412 # total number of missesil1.miss_rate0.0265 # miss rate (i.e., misses/ref)-cache:il1 il1:256:32:8:lil1.misses 1032 # total number of missesil1.miss_rate0.0194 # miss rate (i.e., misses/ref)-cache:il1 il1:256:32:64:lil1.misses 1032 # total number of missesil1.miss_rate0

39、.0194 # miss rate (i.e., misses/ref)2、测试程序为 benchmarkbin.littletest-printf -cache:il1 il1:256:32:1:l-cache:il1 il1:256:32:2:l25il1:256:32:4:lil1:256:32:8:l-cache:il1-cache:il1il1:256:32:64:l-cache:il13、测试程序为 benchmarkbin.littletest-math?-cache:il1il1:256:32:1:lil1.misses23761 # total number of misse

40、sil1.miss_rate0.1113 # miss rate (i.e., misses/ref)?-cache:il1il1:256:32:2:lil1.misses13479 # total number of missesil1.miss_rate0.0631 # miss rate (i.e., misses/ref)?-cache:il1il1:256:32:4:lil1.misses4889 # total number of missesil1.miss_rate0.0229 # miss rate (i.e., misses/ref)?-cache:il1il1:256:3

41、2:8:lil1.misses1640 # total number of missesil1.miss_rate0.0077 # miss rate (i.e., misses/ref)?-cache:il1il1:256:32:64:lil1.misses1636 # total number of missesil1.miss_rate0.0077 # miss rate (i.e., misses/ref)4、测试程序为 benchmarksuppliedvortex.ss-cache:il1 il1:256:32:1:lil1.missesil1.miss_rate5122 # to

42、tal number of misses0.1223 # miss rate (i.e., misses/ref)26?-cache:il1il1:256:32:2:lil1.misses2575 # total number of missesil1.miss_rate0.0615 # miss rate (i.e., misses/ref)?-cache:il1il1:256:32:4:lil1.misses619 # total number of missesil1.miss_rate0.0148 # miss rate (i.e., misses/ref)?-cache:il1il1

43、:256:32:8:lil1.misses590 # total number of missesil1.miss_rate0.0141 # miss rate (i.e., misses/ref)?-cache:il1il1:256:32:64:lil1.misses590 # total number of missesil1.miss_rate0.0141 # miss rate (i.e., misses/ref)改变cache相联度时的变化曲线图率效失545.4 0 .30012345坐标轴标题5251.2 0. .1 0.00vortex.sstest-fmathtest-math

44、test-printf图二 改变 cache 相联度时,失效率的变化情况 分析:从上图中,我们可以看到随着相联度的增加, cache 的匹配性越好, 失效率越低。 但是,当相联度达到一定的程度时,失效率不会再变化。因此,在实际中,我们 要选择合适的相联度,达到最优的目标。4.4改变 Cache块大小对 Cache性能的影响实验具体要求: 改变Cache 块大小( *2 ,*4 ,*8 ,*64 ),运行程序 (指明所选的测试程序) , 统计各种失效的次数,并分析 Cache 块大小对 Cache 性能的影响; 即将命令中的 -cache:dl1 dl1:256:32 :4:l 进行变化,分别*

45、2 ,*4 ,*8 , *64 ,下为实验结果。实验结果:1、 测试程序为 benchmarkbin.littletest-math? -cache:il1 il1:256:32:1:lil1.misses23761 # total number of missesil1.miss_rate0.1113 # miss rate (i.e., misses/ref)-cache:il1il1:256:64:1:l27il1.missesil1.miss_rate10531 # total number of misses0.0493 # miss rate (i.e., misses/ref)-cache:il1il1:256:128:1:lil1.misses1 # total number of missesil1.miss_rate1.0000 # miss rate (i.e., misses

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论