用于结构层动态热量管理的快速热仿真_第1页
用于结构层动态热量管理的快速热仿真_第2页
用于结构层动态热量管理的快速热仿真_第3页
用于结构层动态热量管理的快速热仿真_第4页
用于结构层动态热量管理的快速热仿真_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用于结构层助意热量管理的恢速热仿専摘要:由于功耗密度呈指数增长,采用动态热量管理的工作温度的实时调节成为必须。本文 提出了一种新颖的用于高效动态热量管理的芯片结构层热量分析方法。我们的新方法是基于 以下观测资料:微处理器在标准工作负载下运行时的结构层模型的功耗呈现很强的自然周期 性。可以利用这一特征用频域谱分析来计算稳态响应。采用了数字稳态瞬态匹配算法以得到 由初始条件和恒定功率输入引起的瞬态温度变化。总的瞬态响应是两次仿真结果之和。采用 快速热量分析算法相比传统的综合基础瞬态分析速度提高了 10倍一100倍而仅仅有少量的 精度损失。1.简介随着当今ic技术进入纳米时代,非常高的封装密度和工作

2、频率将会导致功率密度的急剧 增长。指数级的功率密度增长则相应地导致平均片上温度快速升高。此外,局部的热点处, 有着比平均水平高的多的功率密度,造成了更高的局部温度。高温对于芯片的性能和可靠性有着明显的不利影响。过高的片上温度会导致传输速度降 低、漏电流功耗增大、互连电阻增大,并且可靠性降低。有理市相信如今的髙性能微处理器 和嵌入式系统非常需要由动态热量管理(dtm)来即时地调节片上温度,参考文献3,12。dtm的基本思路是通过一系列方法,诸如活跃点转移、局部挂起、动态电压频率缩放, 参考文献3,12,來动态地降低芯片中一些过热单元的温度。热量模型和dtm仿真的一个关 键问题是通过芯片结构级的d

3、tm技术來高效地计算由于功耗不同引起的温度变化。先前许多研允工作把注意力集中到电路级或者门级的热量模型和仿真。由于电路级或门 级大量的热量器件和功耗源,提出了不同的方案来提高热量电路仿真的效率,主要可以分为 两类:笫一种方法是基于离散差分算子(偏微分方法)或者the field quality(限定变量方法)。参 考文献16,15所示,整个芯片被离散化,差分方程表示的热量传输方程用偏微分或限定变量 法解出。这些方法的主要困难是由大量网络造成的数量巨大热量电流的结果。还提出了一些 不同的技术来解决如此巨大数量的的热量电流,例如参考文献16中的adi,和参考文献15 中的模型规则简化。第二种方法是

4、基于格林函数的方法,参考文献14,17,和上面的方法相 比由于简化了热量问题的双空间模型,这一方法提供了一种快速的降低精度的热量仿真。尽管己经提出了很多电路级或门级热量分析的有效算法,但是还是很少有人关注芯片结 构级的热量模型和仿真。在设计时结构级的热行为无法在电路级或门级看到,因为不同的负 载会产生不同的热量效果。在结构级釆用dtm的好处时由于它可以捕捉程序运行时的状态, 并且快速地在程序内部或者跨程序适应不同的特征。此外,最近的研究表明结构级的热量管理在最坏的情况下,参考文献12,13,5,可以仅 以微小的性能降低为代价而显著减少封装的代价。一种名为hotspot的结构级热量建模和仿 真工

5、具被开发来给标准版图程序开拓和研究调节微处理器运行温度的不同的dtm技术。 hotspot提供了一种精确的结构级热量模型,它基于与微结构块和封装各个基本方面相关的 热电阻和电容的等效热电流。各个部分温度由功率仿真产生的功耗得到。然而,hotspot评估不同dtm技术的功效依赖于整个程序运行过程中瞬态热量仿真执行 的时间。hotspot对热量行为建模所依靠的等效热量电路由热电阻和电容组成。它在每个运 行时间片使用常规的积分基础瞬态仿真进行计算以获得全部的温度概况。当一个程序导入到 hotspot时,它的初始的功耗由常规间隔得出。然后,由最后时间片和前儿个时间片的温度 计算每个吋|'可片的

6、温度。为了得到任意一个确定吋间下的该程序温度,都必须所有之前吋间 点的温度值,因为每一个时间点都依赖于它前面的时间点。由于现在的版图程序一般都有上百亿甚至上千亿的语句,这个算法需要很氏的仿真时间(数周)。因此,需要一个更快并且 精确的瞬态仿真技术来有效地设计和优化芯片结构级温度测量。在本文中,我们为动态热量管理提出了一种在结构级的快速暂态热量仿真算法。我们是 从近來关于程序长时间运行行为的发现得到启发。大多数程序的行为并不是随机的,实际上 rti于循环和块的存在而表现出很强的周期性,参考文献9, 11, 10。许多程序在不同的时 间执行不同的块,这一系列块表现岀特定程序特征,每一个可能与其他块

7、完全不同,而各自 乂有非常相似的周期性表现。这也同样反映了各个运算单元输出功耗的周期特性。【图1】 的快照是spec cpu 2000芯片组内部寄存器运行lucas程序14个周期内的典型的功率曲线。 每个周期包括了20万个指令周期内得到的20个功率值。这条曲线是由3ghz处理器仿真得到 的,因此,每个周期等于0.26ms,整个曲线代表程序运行的3.6ms。我们可以看出,即便在 这么短的时间内也有非常强的周期性。?-lucas程序中的整型寄存器周期性功耗曲线图1: lucas程序中的整型寄存器周期性功耗曲线本文研究了许多结构级热量模型的周期性功率曲线来加快暂态热量仿真速度。举例来 说,大多数的版

8、图屮,整数寄存器通常是最热的模块13。我们所提出的新算法是基于以下 事实:线性热量系统的瞬时值是零输入自由响应和零状态强迫响应之和。我们采用了两种有 效的算法来计算这两种响应:(1)对于周期性的输入,采用频域谱分析来计算稳态响应;(2)对于暂态的温度变化,考虑初始状态和开始时的直流输入值,采用瞬态匹配技术。市 于分析完全是在频率域下进行的,系统暂态响应的计算结果是用时域闭式表达式,因此运行 的时i'可得到重大改善。本文接下來的内容包括:第二节主要论述参考文献13中的结构级建模,以及我们针对 其建模所进行的修正。第三节,阐述了我们的新算法的基础概念,包括上文所述两部分,然 后是关于时间效

9、率的理论分析。在第四节中概述了一下实验结果并和spice类仿真器作出比 较来验证我们的方法。第五节是结论和今后的工作。2.结构级热量建模一般而言,热传导现象由下面的差分方程表示4:其中t(k)是温度,p(kg/n?)是物质的密度,cp(j/n?k)是特殊热度,k(w/mk)是热导 率,g(w/m3)是热能生成率。由这个差分方程描述的热流与电流有着类似的形式,它们两者 z间有着众所周知的对偶性。流过一个热电阻的热流等效于流过它的电流,而温度差则相当 于电势差。而热量被吸收的地方则相当于一个热电容。在此观测结果的基础上,在处理热流 的吋候可以得到并求解等效的热量阻容电路。在电路级的热阻容电路模型屮

10、,大量网格结构被用来分解整个电路结构,用偏微分或者 限定变量法来分解方程(1)。得到的阻容电路结果通常都很庞大。然而,在结构级,由于有 限数量的图纸设计器件和未知物理特性,相应的阻容模型就十分简单,而准确地获取热电阻 和热电容对于热量分析来说则十分关键。iiilmaptotqlljifhl问illintaluii-ai.u2fpqldstorrafpfegi-fpregiofpaddifltalusi«a1.u4ihukmbelfkacbelixacbe:曲心l)cacbe4kmttesikacbc5kmtu6dcacbe6dcacbe?图2: compaq alpha 21364改

11、进结构图3:最新芯片封装结构和等效的阻容电路模型在本文中,我们对参看文献5中的结构级热量使用了热量模型的方法,从设计图纸信 息建立的等效阻容模型,并由其他商业工具保证具有相当高的精度。对于图3所示的采用 cbga封装的新型芯片的散热器和冷却系统,其中存在两条主要的热传导路径:硅流片区产 生的热量可以散发到周围流动空气,或者传导到印刷线路板。主要的阻容电路处于硅流片区, 设计图纸信息用來提供等效的热电阻和热电容。我们用的设计图纸实例如图2所示。我们所米用的设计图和参考文献13屮所米用的设计图的区别在于,我们把一些关键的运算部件一 诸如整数寄存器(intreg)和浮点寄存器(fdreg)划分成更具

12、体块,这样在运用dtm 时就能从这些重要的热部件得到更精确的温度变化量。如图2所示,两个相邻的模块间的热 电阻取决于它们之间公共边的长度。如参考文献7中所说,杂散电阻也耍被考虑在内。每 个单元对热量地之间都有一个热电容,其大小由各个元件自身的面积决定,同时还需要引入 比例缩放因子来折算这个集中式的电容和分布式电容z间的区别。除了主要的流片区,它的 下面另外还有附加的两个导热层和散热层。模型中有一些与这两层相关的组成元件,但是没 有和流片层相同的有效功耗源。最后,为了模拟芯片封装同空气的接触表面,设定了一个等效的对流电阻rconvection,并 且在热量地(坏境空气温度)与芯片封装的底部之间加

13、上了一个恒定的功率源。为了提供一 个可与其他商业化工具比较的收敛性结果以及更好地匹配最后实验结果屮的版图功能,如参 考文献13中对结果模型作了校准。热电流的网表以矩阵形式表示,并由第三节讨论的电路 仿真模块处理。3 用于快速暂态热量仿真的新算法我们从前述的结构级等效热电路模型出发。31算法准备对于一般的动态系统松 ar+ bu ,(2)其中a是系统参数矩阵b是输入位置矩阵。x和11分别是状态值和输入值向量。系统全响 应是等式(3)屮所示从t()时刻起的零输入响应和零状态响应z和。(八 a(t- t0) i j a(t- t )bu(t )drao- e无0十 0 幺。(3)zo等式右边第一项是

14、和初始条件有关的零输入响应,等式右边第二项是只和输入源11有 关的零状态响应。整数寄存器输入源的功率谱功率谱(w(og)-1-2° a 0o ooqco°o00.5115225335445频率(mhz)x io4图4: lucas程序中整数寄存器的功率谱我们对许多结构级模型的典型电源波形的频谱分析表明,大多数能量都集屮在直流部 分,如图4所示(y轴以指数形式表示)。这样,我们把电源波形u(t)分解成in和i>2(t)两部分。 111是电源输入的直流成分,而u2(t)是输入电源的周期性成分,其中w2(r+ t)= u2 (z) ,(4)而t是电源输入周期性变化的周期。在

15、这里我们要强调实际电源波形在很长的时间内并 不是严格的周期性的。但是通常在一个给定的阶段内,不同周期之间的变化非常小,忽略这 -变化把他看作是周期输入不会引起显著的误差。这样,等式(3)可以写成:x(t)= ea(l-to)x 螂加+ 1)dr。(5)现在等式右边的前两项就只是初始状态和电源曲线直流部分的作用。电路的第三个响应 则是由周期性的电源输入激励产生。这项工作的主要思路就是,通过高效地用瞬态匹配法计算前两项响应,用快速频谱分析 法在频率域计算第三项周期性的响应,来利用电源输入的周期特性。在下面的两小节中,我 们将介绍这两种算法。32考虑初始状态和直流输入的瞬态匹配对于具有热电阻电容和输

16、入电源的等效热电路,我们可以采用改进的节点分析法来表 示:gr+ c站 ba、,(6)这里我们只考虑电源波形5的直流部分。c和g是电容和电导的电路矩阵,x是节点温度向 量,u是独立电源向量,b是输入选通矩阵。在频率域中,等式(6)的拉普拉斯变换可以写成gx(s)+ scx(s)- x(0) = -bu.(7)s在传统的慕于awe的瞬态匹配算法屮,参考文献8,需要计算指定电源点或者接口z 间的传递函数。结杲就必须计算n个输入电源在每个节点的n个瞬态值,因为每个电源在每个 节点都产生一个瞬态值。而在我们的课题中,只需要计算每个节点上直接关系到瞬态匹配计 算的由初始状态和恒定直流电源输入产生的一个瞬

17、态值。这样,这个方法的运算量就与电源 数量无关。特别地,令散则上述等式变为g 散 $)+ scs) = scx(o)+ b 叫(8)然后我们在s=0处把散s)展开成泰勒积数,得到g(加°+ "2s+ m2s + k)+ sc("%+ s + m2s + k)=scx(o)+ bu然后我们可以得到如下的递归状态计算方程:mo= g xbuxm = - g'c(叫.x(0) m2= - g xcmxmmiq= - g xcmlq_,总之状态参数可以计算出来,每个节点的响应可以写成x(5)= 一叫 + sm2 + s2mi + k + s2q' + k

18、(11)s等式右边第一项在时域中是阶跃响应而其他的部分则可以通过pade逼近来进行合理的近似。为了进行q阶padc逼近,需要前2q个状态参数。然后我们得到了2q个状态匹配式:伙+ £ + l + 心)=m0 - %(0)-(盘+怒+ l +佥)=耳(12)pi pi pqm其中卩和a是节点朋勺部分分式响应序列中第i个极点和留数xk(5)=-叫 + + + k(13)s s- /?! s p2首先用下一小节参考文献6所述的多节点瞬态匹配算法计算极点。然后用式(12)中的q 个方程,解出所有的留数©吋域的响应通常由不何进行拉普拉斯反变化得到。还要注意的 是,由于暂态响应从初始状

19、态出发,因此状态必须像在式(12)的第一个等式中那样计算初始 状态。由于大多数的功率源是直流输入的,因此由暂态匹配计算出的响应可能接近于某个确切 的响应,而且我们试验发现,频谱分析的解通常只是在节点温度上增加一些小的瞬态变化。 33多节点瞬态匹配用于极点的数值稳态估计直接瞬态兀配存在一个问题就是高阶的瞬态值精度会比较低,因为高阶瞬态值是极点的 指数函数,如式(所示。高阶极点信息在数字上会很快丢失。为了解决这个问题,我们采 用了多节点瞬态匹配(mmm)法来获得系统节点稳定的数字估计。mmm算法的主要思路是用不同节点或者不同输入激励的瞬态信息来估算极点,而不是 像传统的瞬态匹配算法那样只是从单一的

20、节点单一的激励来讣算,参考文献8。这个方法 的原理是不同节点和输入激励的极点是相同的。通过采用mmm,计算同样数量的极点我们 只需要少量的阶数的瞬态值。例如,用多节点单输入的瞬态值,我们可以仅用p+1个瞬态值 得到p个极点。如果有k个输入,我们就可以用每个输入的p/k+1个瞬态值来计算p个极点, 总的计算量也大致相当。由于极点信息在低阶瞬态分量中数值精度上得到了更好保留,等式 (12)所示,因此我们可以得到极点更稳定的数字估计。尽管我们计算的是直接频域响应x(s)而不是传递函数,mmm算法仍然可以使用。因为初始条件和直流输入不会给响应增加极点。特别地,我们假设需要确圧一个简化的q阶系统我们选择

21、q节点以及和它相关的瞬态值组成瞬态向量观,函,帀2,,蔦+i,根据式(10) 我们得到凤,问,码卜也观一班°),%码,,码j(aq“ =帀,用2,,码九一丘(0),冈,弘,,冈j(15)其屮丘(0)是所选的q个节点的初始状态向量。而4网的特征值就是等式(6)川原系统的q个主 极点倒数。注意只需要q+1个瞬态值来计算q个主极点。34频谱分析在这小节中,我们讨论热电路中周期性输入功率的周期性零状态响应的频谱分析方法。 基木思想是用离散傅立叶变换(dft)把输入信号变化到频率域然后计算响应的基波傅立叶 系数或谐波系数。然后把响应的傅立叶系数转化到时域得到稳态时域响应。在离散傅立叶变换中,在

22、时域进行k点采样,频域中得到k次谐波。然后我们如下所示计 算各次谐波在热电路中的响应:a )x(ej = p)(16)a(0)x(0)= p(02)其中,i=l.k是谐波次数,a(q)是q频率下标示热器件特征的mna矩阵,x(q)是 频率下各个器件温度的向量,p(co)是从dft计算得到的输入功率向量的谐波。通过这种转换,可以显著减少运算量尤其是对于长周期的仿真。因为我们只要计算一个 周期的稳态值,mna等式的数量就只取决于采样点数的多少。如果需要更快的仿真速度, 我们可以降低采样频率以损失精度为代价来提高运算速度。最后我们用离散傅立叶反变换把 频域响应转换成吋域响应。注意,最后稳态温度是我们

23、从频谱分析计算得到的温度和我们的等效热电路屮作为地电 压处理的环境温度。实际的温度响应是零输入响应和零状态响应之和。由于频域谱分析得到的是稳态解,这就意味着是无限时间后系统响应趋于稳定时的解, 它对于t=0时的响应并不准确。但是和直流成分相比周期性的能量数入通常都很小造成的误 差也很小。这从我们的实验结果上可以看出来。35在动态热量管理中的应用我们的方法对于在结构级进行动态热量管理有非常大的好处。例如,对一个周期性的程 序段加一个初始的热量设置,我们的技术可以预测电流是否会达到临界温度,如果会,多久 会达到。这样,在达到这个临界温度之前,有效的动态热量管理诸如动态电压/频率缩放, 局部锁定,动

24、态转移等方法就可以用来冷却即将发热的模块,防止他们进入临界温度阶段。 用我们的两步算法这将是很容易计算的。在有些情况下,直流部件的周期性纹波能量只是在 总的瞬态温度上造成笑的扰动。瞬态匹配响应法就可以用来做出非常精确时间估计。dtm的另一个重要的问题是一个程序在长吋间的周期性工作后是否会达到临界温度, 也就是说,热稳态是什么。如果稳态温度远远低于温度极限,那么只要维持同样的周期运行, 就没有必要执行动态热量管理。我们的瞬态匹配算法可以在周期一开始的时候就直接计算稳 态逼近值,做出快速精确的预测。另一方而,如果稳态值如果非常接近临界温度,只需要用 频谱分析来找出在稳态温度附近的起伏。这样的话,只

25、是在温度脉动超过极限的时候需要 dtmo如果输入能量中有多项,我们可以用上述方法分别计算每项的响应,然后把它们加起來 得出温度趋势。36时间复杂性分析对有n个节点的热电路,如果只需要少量瞬态值(qd川),那么时间瞬态匹配算法的 时间复杂度接近0(/?5),其中,严是一次稀疏矩阵g的lu分解近似代价。因为需要求解k次频 域方程组,频谱分析的时间复杂度大约是o伙卅汎 其屮k是等式(16)屮的采样点数。但是由 于采样是在一个周期内进行的,所以k与时间段长短无关。要注意的是两种分析法的时间复杂度都和基于传统综合法的瞬态仿真中用到的时间段 或者时间步数无关,这就是相对与传统方法的主要优势和提速。4.试验

26、结果我们在matlab中模拟所提出的算法。我们采用了图2中改进的compaq alpha 21364微结 构來产生能量曲线以及类似参考文献13中的等效热电路模型。为了做出公平的对比,我们 也在matlab中模拟了 hotspot采用的基于传统综合法的瞬态仿真來比较两种方法的的精确度 和速度差异。我们用spec cpu 2000系列的版图评估了我们的结果。我们选择了 3个程序 art,lucas,wupwise运行了 100以条指令并且仿真了周期性的部分。由于最热的单元是整数寄 存器,我们计算了一个典型整数寄存器的温度变化作为例证。表1:运行spec cpu2000程序的cpu占用时间对照pro

27、cram#11#scpu (hotspot)cpu (tmmspectruin)lucas2000018183.740.78lucas3000018219.430.77ari1000061472.2315.67art30000614242.4915.55wupwise100002466.31llwupwise3000024515.021()表1总结了三个程序和试验参数的统计结果。#11栏是是指令时间,大约10“s, #s栏是频 谱分析用到的采样点数。cpu (hotspot)栏和cpu (tmmspectrum).分别是hotspot用的传统 仿真方法和我们所提出的方法的cpu占用时间。cpu

28、占用时间是以秒为单位。仿真的热电路 包括大约166个节点。尽管这个热电路比较小,加很长时间的输入能量曲线(数十亿的指令周 期),hotspot的仿真吋间将如表1所示那么长。在测试情况下,我们用多节点瞬态兀配法计 算6个极点來得出瞬态响应。我们发现6个极点通常可以给出相当好的结果。75:><y-c:ee701iiiiiiiii00.020.040.060.0tim© (sgconds)图5: lucas程序运行温度变化对照图5所示是lucas程序的暂态温度变化对比,约20000个仿真点,每个点3.3“$。图6所示 是art程序的

29、暂态温度变化对比,约10000个仿真点。图7所示是wupwise程序的暂态温度变 化对比。可以看出我们的新算法的结果与hotspot仿真的结果相当吻合,但是从表1可以看出 占用的cpu时间却短了 10倍。可以注意到,增加仿真时间间隔,速度将会更显著地增加,因 为这个新方法和仿真的时间间隔数无关。120transient temperature changes in on© integer register for art program10»31(oj anj«一 adeal0.010.02 0.cg 0.040.c60.080.070.080,c«0.

30、1tim© (seconds)图6: art程序运行温度变化对照我们还注意到,当温度随着时间而增加,用我们提出的方法计算的温度与hotspot计算的将 会有明显的区别。主要的原因是随着时间推移周期性的能量输入也会轻微地变化。结果,如 图5所示直流分量就会偏移我们用于瞬态匹配t=0时候的值。为了解决这个问题,我们可以把 仿真的时间间隔分成儿个段,侮段都根据自己的起止时间依次仿真。这样做的目的就是确保 周期性能量轨迹屮的直流分量便宜足够小而使瞬态匹配算法足够精确。分段仿真可以用很小 的计算代价就变得更加精确。1101o5otransient tempelature changes in

31、on© integer register forwupvzis program 1350.010.020.030.040.050.060.070.080.(®tim© (seconds)30!5«2 24 a q) eube 览 wai图7: wupwise程序运行温度变化对照transient temperature changes in on© integer register for art program87.40.01550.0160.01660.0170.01750.0180.01850.0190.01950.02time (sec

32、onds)卫®0»»s»8 疗 疗 g!5ea»dea*l图8: art程序周期性温度变化精细对照为了显示由周期性能量轨迹引起的精细波形,如图8所示我们放大了图6。图中显示温度 确实随时间作周期性的变化。hotspot与我们提出的新算法结果相当一致。5结论以及今后的工作在本文屮,我们提出了一种有效的用于结构级动态热量管理的热量分析技术。这个新方 法利用了微处理器和嵌入式高性能系统结构级模熨功耗的周期性特征。我们提出用频域谱分 析的方法来计算温度的周期性响应,用考虑了初始条件和直流功率输入的数值稳定瞬态兀配 算法來计算暂态温度变化。总的暂态响应是

33、两个仿真值之和。结果,这个快速热量分析算法 使得运算速度比基于传统综合法spice类的h otspot提高了至少10倍而仅仅损失了极小的精 度。今后,我们将如3.5节所述,把我们的热仿真方法与dtm优化器整合,来完成结构级的dtm框架。6 参考文献1 http://cpu2000/cfp2000/.2 "international technology roadmap for scmiconductors(itrs), 2004 update/ 2001, .3 d. brooks and m martonosi, “dynamic thermal manag

34、ement for high-performance microprocessors;' in proc, of inti. symp. on high-perfonnance comp. architecture. 2001, pp. 171-182.4 yk cheng, c.-h. tsai, c.-c. teng, and s.-m. kang, electrothermal analysis of vlsi systems. kluwer academic publishers, 2000.5 w. huang, m. stan, k. skadron, k. sankara

35、narayanan, s ghosh, and s vclusamy, "compact thermal modeling for temperature-aware design/' in proc. design automation conf. (dac), 2004, pp. 878-883.6 y. ismail, "efficient model order reduction via multi-node moment matching,' in proc. bit. conf, on computer aideddesign (iccad),

36、 nov. 2002, pp. 767-774.7 s lee, s. song, v. au, and k. moran, uconstricting»zsprcading resistance model for electronics packaging," in proc. asme/jsme thermal engineering conference. mar. 1995, pp. 199-206.8 l. t. pillage and r. a. rohrer, "asymptotic waveform evaluation for timing a

37、nalysis/' ieee trans, on computer-aided design of integrated circuits and systems, pp. 352-366, april 1990.9 t. shenvood, e. perelman, and b. calder, "basic block distribution analysis to find periodic behavior and simulation points in applications/' in the international conference on p

38、arallel architectures and compilation techniques (pact2001), 2001, pp. 3-1410 t. sherwood, e. perelman, g. hamerly, s sair, and b. calder, discovering and exploiting program phases,” inieee micro: micro's top picks from computer architecture conferences, 2003, pp. 8493.11 t. sherwood、s sair, and b. calder, "phase tracking and prediction, in proc. ieee international symposium oncomputer architecture (isca), 2003, pp. 45-57.12 k

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论