已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国科学技术大学 硕士学位论 三维片上网络热分析方法和热均 衡设计研究 作者姓名 学科专业 7 导师姓名 完成时间 谢门旺 微电子学与固体电子学 李矗副教授 二O 一二年五月 U n i v e r s i t yo fS c i e n c e a n dT e c h n o l o g yo fC h i n a Adi s s e r t a t i o nf o rm a s t e r Sd e g r e e R e s e a r c ho fT h e r m a lA n a l y s i s M e t h o da n dT h e r m a IB a l a n c e D e signf orT h r e e Dime n s i on a l N e t w o r k s o n C hi p A u t h o r SN a m e s p e c i a l i t y S u p e r v i s o r F i n i s h e dt i m e M e n w a n g X i e M i c r o e l e c t r o n i c sa n dSo l i dE l e c t r o n i c s P r o f Y a oL i M a y 2 0 1 2 中国科学技术大学学位论文原创性声明 本人声明所呈交的学位论文 是本人在导师指导下进行研究工作所取得的成 果 除已特别加以标注和致谢的地方外 论文中不包含任何他人已经发表或撰写 过的研究成果 与我一同工作的同志对本研究所做的贡献均已在论文中作了明确 的说明 作者签名 签字日期 中国科学技术大学学位论文授权使用声明 作为申请学位的条件之一 学位论文著作权拥有者授权中国科学技术大学拥 有学位论文的部分使用权 即 学校有权按有关规定向国家有关部门或机构送交 论文的复印件和电子版 允许论文被查阅和借阅 可以将学位论文编入 中国学 位论文全文数据库 等有关数据库进行检索 可以采用影印 缩印或扫描等复制 手段保存 汇编学位论文 本人提交的电子文档的内容和纸质论文的内容相一致 保密的学位论文在解密后也遵守此规定 口公开口保密 年 作者签名 签字日期 导师签名 签字日期 摘要 摘要 多处理器片上系统对通信带宽的要求与日俱增 结合三维集成电路和片上网 络的优点 三维片上网络被提出以满足高性能 多功能 缩小芯片面积等设计要 求 但是 由多层高功耗密度的电路堆叠而成的结构造成了系统温度过高的问题 这样的热问题成为三维片上网络系统设计中新的挑战 本文首先介绍了对于三维片上网络温度特性和热均衡设计的研究现状 阐述 了针对三维片上网络热问题的研究意义 然后通过对传统的热建模方法和温度计 算方法的介绍 提出本文的研究工作中所采用的热模型和温度计算方法 为了对 三维片上网络结构进行温度分析 设计了 个周期精确的三维片上网络系统性能 仿真器 结合功耗模型和温度分析软件 从而建立一个热分析环境 并通过实验 说明了该热分析环境的有用性 接着 通过对三维M e s h 片上网络结构上同一层核和不同层核之间的热关联 进行分析 得出三维M e s h 片上网络结构的热特性 根据这些热特性结论 本文 提出了针对三维M e s h 片上网络结构的热均衡路由算法和路由器设计 并使用建 立好的热分析环境对该热均衡路由算法进行评估实验 实验结果表明 我们提出的热均衡e d g e 路由算法和传统的x y z 路由算法相 比 能有效的降低系统的平均温度和最高温度 这说明e d g e 路由算法不仅使系 统的温度分布更均衡 还使系统的整体散热效率得到了提高 关键字 三维集成电路片上网络热特性热均衡路由算法 原书空白页 不缺内容 A b s t r a c t A B S T R A C T A sc o m m u n i c a t i o nb a n d w i d t hd e m a n do f m u l t i p r o c e s s o r ss y s t e mg r o w s t h r e e d i m e n s i o n a ln e t w o r k o n c h i p 3 DN o C w i t ha d v a n t a g ec o m b i n a t i o no f3 DI C a n dN o Ci sm o t i v a t e dt oa c h i e v eb e t t e rp e r f o r m a n c e f u n c t i o n a l i t y a n dp a c k a g i n g d e n s i t y H o w e v e r s t a c k e dh i g hp o w e rd e n s i t ya r c h i t e c t u r er e s u l t si nh i 曲t e m p e r a t u r e o f s y s t e m s t h e r m a li s s u e sa r es i g n i f i c a n tc h a l l e n g e sf o r d e s i g n o f3 DN o C a r c h i t e c t u r a ls y s t e m s I nt h i sp a p e r t h er e s e a r c hs t a t u so ft h r e e d i m e n s i o n a ln e t w o r k o n c h i pt h e r m a l c h a r a c t e r i s t i c sa n a l y s i sa n dt h e r m a l a w a r e d e s i g na r ei n t r o d u c e df i r s t a l s ot h e r e s e a r c h s i g n i f i c a n c e o ft h r e e d i m e n s i o n a l n e t w o r k o n c h i p t h e r m a li s s u e si s p r e s e n t e d A f t e ri n t r o d u c i n gt h et r a d i t i o n a lt h e r m a lm o d e l i n ga n dt e m p e r a t u r e c a l c u l a t i o nm e t h o d s t h et h e r m a lm o d e la n d t e m p e r a t u r ec a l c u l a t i o nm e t h o df o ro u r r e s e a r c ha r e p r o p o s e d Ac y c l e a c c u r a t et h r e e d i m e n s i o n a l n e t w o r k o n c h i p p e r f o r m a n c es i m u l a t o ri sd e s i g n e df o rt e m p e r a t u r ea n a l y s i s B yi n t e g r a t i n gp o w e r m o d e la n dt e m p e r a t u r ec a l c u l a t i o n t o o l O u rs i m u l a t o ri sd e v e l o p e dt ob ea t e m p e r a t u r ea n a l y s i se n v i r o n m e n t a n dt h i st e m p e r a t u r ea n a l y s i se n v i r o n m e n ti s e v a l u a t e db ye x p e r i m e n t s T h e n t h et h e r m a l c h a r a c t e r i s t i c s o f t h r e e d i m e n s i o n a lM e s h b a s e d n e t w o r k o n c h i pa r ec o n c l u d e db ya n a l y s i so ft h e r m a lc o u p l i n gf o rc o r e sw i t h i ns a m e l a y e ra n dc o r e sb e t w e e nl a y e r s A c c o r d i n gt ot h e s et h e r m a lc h a r a c t e r i s t i c sc o n c l u s i o n s t h e r m a l a w a r er o u t i n ga l g o r i t h ma n dr o u t e rd e s i g nf o rt h r e e d i m e n s i o n a lM e s h b a s e d n e t w o r k o n c h i pa r ep r o p o s e d T h i st h e r m a l a w a r er o u t i n ga l g o r i t h mi se v a l u a t e db y t h et e m p e r a t u r ea n a l y s i se n v i r o n m e n tW em e n t i o n e db e f o r e T h ee x p e r i m e n t a lr e s u l t ss h o wt h a tt h ep r o p o s e de d g er o u t i n ga l g o r i t h mc a n r e d u c et h ea v e r a g et e m p e r a t u r ea n dm a x i m u mt e m p e r a t u r eo fs y s t e me f f i c i e n t l yb y b e i n gc o m p a r e d 矶t hx y zr o u t i n ga l g o r i t h m T h u s t h ee d g er o u t i n ga l g o r i t h mn o to n l y b a l a n c e st h et e m p e r a t u r ed i s t r i b u t i o no fs y s t e m b u ta l s ol e a d st oh i g h e rc o o l i n g e f f i c i e n c yo fs y s t e m K e y w o r d s t h r e e d i m e n s i o n a lI C n e t w o r k o n c h i p t h e r m a lc h a r a c t e r i s t i c t h e r m a l b a l a n c e r o u t i n ga l g o r i t h m 原书空白页 不缺内容 目录 目录 第一章绪论 l 1 1引言 l 1 2 三维片上网络温度特性和热均衡设计的研究现状 3 1 2 1 研究背景 3 1 2 2 三维片上网络温度特性研究现状 4 1 2 3 三维片上网络热均衡研究现状 5 1 3 本文的研究内容 7 第二章三维片上网络热分析方法 8 2 1 热建模方法 8 2 2 温度计算方法 l O 2 3 三维片上网络系统性能仿真器设计 1 1 2 3 1 三维片上网络系统性能仿真器介绍 1 1 2 3 2 硬件模块设计 1 3 2 4 热分析环境的建立 1 5 2 5 热分析环境实验 1 5 2 5 1 M e s h i m 仿真器实验结果 1 5 2 5 2 热分析环境实验结果 1 9 第三章三维片上网络温度特性分析 2 4 3 1同一层上各个核之间的温度特性分析 2 5 3 2 不同层上各个核之间的温度特性分析 2 6 3 3 三维片上网络结构温度特性总结 2 8 第四章三维片上网络热均衡设计 2 9 4 1 热均衡路由算法设计 2 9 4 1 1 路由算法原理 3 0 4 1 2 路由算法实现 3 3 4 2 热均衡路由器设计 3 5 V 目录 4 2 1 虚拟通道的应用 3 5 4 2 2 路由器实现 3 6 4 3 热均衡路由算法性能实验 3 7 4 3 1 实验设置 3 7 4 3 2 实验结果 3 8 第五章总结和展望 5 1 0 1 本文的主要工作 5 1 5 2 下一步工作展望 5 1 参考文献 5 2 致谢 5 6 攻读硕士期间发表的学术论文 5 7 第一章绪论 1 1 引言 第一章绪论 集成电路作为现代电子技术中最具代表性的高科技产物 具有体积小 寿命 长 可靠性高 功能强大等特点 几千万门电路集成在一块指甲大小的硅片上 发挥着强大的电路功能 根据摩尔定律 每隔1 8 个月集成电路上能容纳的晶体 管数目就会增加一倍 随着这股趋势 集成电路设计对于体积小 功能强大 运 算速度快等要求愈来愈高 随着集成电路上门的数量越来越多 芯片的面积 功 耗变得越来越大 芯片中全局导线的长度变得越来越长 限制了工作频率的提升 空间 传统的二维集成电路产生的这些问题使人们开始思索新的电路设计思路 最后导致了三维集成电路 3 DI C 的诞生 三维集成工艺技术是面向深亚微米S o C 的无缝集成技术 采用S O l 包括激 光和电子束再结晶 横向固相外延生长 横向外延过生长和金属诱导横向结晶等 技术 而近年来出现的晶圆级健合和粘结技术渐渐成为主流 成为很有前途的 3 D 集成工艺技术 三维集成技术作为一种系统级集成结构 通过将多层平面器 件堆叠起来实现高密度 低功耗 多功能等要求 但是 从9 0 纳米开始 半导 体制造工艺已经达到纳米水平 现在的4 5 纳米技术已经相当成熟 在这个阶段 硅基芯片的漏电流已经达到了动态开关电流的数量级 三维集成电路芯片虽然减短了导线的长度 降低了功耗 可是堆叠方式造成 的高功耗密度使产生的热量不易从芯片内部散热出去 因此 三维集成电路芯片 具有很高的温度 这影响了芯片的性能 特别是芯片出现的局部温度升高的热点 H o tS p o t 该处的漏电流也会迅速增加导致温度进一步升高 如果没有及时的 温度控制机制 这将最终导致芯片的损坏 如图1 1 所示 为苹果新i P a d 和i P a d 2 运行时的温度比较 明显新i P a d 的温度要更高 而造成这一现象的主要原因是新i P a d 中搭载的全新A 5 X 芯片 如图1 2 所 示 A 5 X 芯片中集成的四核G P U 产生了更多热量 从这一现象可以说明 芯片 的温度影响将会分布到整个电路系统甚至整个电子设备 而高集成度的芯片所产 生的热量会更多 第一章绪论 图1 1 苹果新i P a d 和i P a d 2 运行时的温度比较 图1 2 集成四核G P U 的A 5 X 芯片 因此 对于三维片上网络 3 DN o C 这一结合片上网络和三维集成电路技术而 成的高集成度电路系统 温度特性的研究以及基于温度分布考虑的电路设计显得 尤为重要 本文主要针对三维片上网络结构 建立了该结构的热分析环境 进行 2 第一章绪论 了热特性分析 并基于热特性的分析结果提出了考虑热均衡的路由算法和路由器 设计方法 实验证明 提出的三维片上网络路由算法和路由器设计能够有效的减 少热点降低系统温度 1 2 三维片上网络温度特性和热均衡设计的研究现状 1 2 1 研究背景 随着集成电路的规模越来越大 片上系统的设计变得越来越复杂 片上的互 联结构成了整个系统性能的瓶颈 1 2 片上网络作为一种多核互联结构 由于可 扩展性好 通信带宽高等优点 跟传统的总线互联相比 具有更好的性能 但是 二维的片上网络结构随着核数的增加 通信性能并不能成比例的提升 因而限制 了整个系统性能 3 最近 三维集成电路设计方法被提出 这种含有多层的芯片结构 由于层间 互联的通孔 T S V 具有极短的垂直通信距离而提升了整个系统的通信性能 同时 由于较短的通信距离而使功耗减少 结合片上网络和三维集成电路的设计方法 三维片上网络结构被提出 这种新的片上系统互联结构具有低延迟 低功耗 高 集成度等特点 4 图1 3 给出了一个典型的基于M e s h 结构的三维片上网络的示 意图 C o o r d i n a t e 触e s 箧爹 I PB I o c kS w i t c h I n t e r c o n n e c t 图1 3 基于M e s h 结构的三维片上网络 三维集成电路技术在本世纪初获得迅速发展 目前已逐步成熟 相对于二维 集成电路技术 其优势主要在于 一方面可以减少全局互连线的数目与长度 从 而增加性能 降低功耗 节省面积 另一方面可以将C M O S 电路与其他工艺的 器件集成到一块芯片上 如非硅器件 微 电子 机械器件 M E M S 等 国内 第一章绪论 清华大学 东南大学 苏州大学 江苏大学等已在3 DI C 布局E D A 算法 器件 模型 封装模型等方面开展了研究工作 5 一1 0 三维集成电路技术技术与片上网络的融合 一方面为多核的发展带来新的机 遇 国际上 包括瑞典皇家工学院 意大利博洛尼亚大学 加州理工 斯坦福大 学 日本的K e i oU n i v e r s i t y 加拿大的不列颠哥伦比亚大学等 以及I n t e l T o s h i b a 等大公司在内的研究机构纷纷开展了三维集成电路方面的研究 1 1 1 9 在国内 南京大学也获得国家自然科学基金资助 开展了3 DN o C 的研究工作 另一方面 3 D 技术与N o C 的融合带来更多的挑战 热问题就是关键之一 需要从热模型 体系结构及通讯机制 以及动态热管理方法等方面开展研究工作 1 2 2 三维片上网络温度特性研究现状 对于三维片上网络的温度特性研究 必须先确定热建模和温度计算方法 文 献 2 0 1 提出T Z 维芯片的热解析模型 用热矩阵表示三维热阻模型以替代二维热 阻模型 主要考虑了芯片中各层次相互之间的热影响 从而提高了三维芯片的热 模型精度 文献 2 1 1 也提出了一种解析模型 并且将热模型计算出的结果用于动 态电压 频率调节 D y n a m i cV o l t a g e F r e q u e n c yS c a l i n g D V F S 达到了热优化的 目的 但在某些时刻会出现超出芯片温度阈值的情况 文献 2 2 N 进一步研究了 3 DI C 中引入冷却通道下热模型建模和分析方法 上述工作均没有专门针对3 D N o C 的热特性进行建模研究 文献 2 3 中针对三维片上多核结构进行热建模 并进行该系统的热特性分析 最后通过分析结果提出了相应的热管理方法 图1 4 为文献 2 3 中所用的热模型 通过等价R C 回路的方法 将热流等价于电流 温度等价于电压 热容等价于电 容 如表1 1 所示 有了这些等效电路 通过电路的计算方法就可以进行系统温 度的计算 而通过对三维片上多核结构的热特性进行分析之后得到的结论有 1 垂直方向核之间的热关联比水平方向核之间的要紧密 2 越远离热沉 H e a tS i n k 的核散热越差温度越高 表1 1 热电等价关系 T h e r m a lq u a n t i t yl U l l tE l e c t r i c a lq u a n t i t yU n t t P H e a tf l o v F p o w e r l C u r r e n tt t O W A T T e m p e r a t u r ed i f f e r e n c e K V V o l t a g e 矿 冗t T h e r m a lr e s i s t a n c eK W R E l e c t r i c a lr e s i s t a n c e Q V A q h T h e r m a lm a s s c a p a c i t a n c eJ K C E l e c t r i c a lc a p a c i t a n c eF A V 凡 R 协 瓯h T h e r m a lR Cc o n s t a n t S 下 R C E l e c t r i c a lR Cc o n s t a n t S 4 第一章绪论 图1 4 三维片上多核结构热模型 P K 文献 2 1 N 样使用等价R C 回路的方法对三维片上网络的路由器和互联导线 进行了热特性分析 并根据建立的热模型对系统进行热优化 提出了热优化和热 管理方法 1 2 3 三维片上网络热均衡研究现状 热均衡设计是指在电路的设计阶段考虑三维片上网络结构的热问题 在设计 中考虑如何能够使得三维片上网络系统的温度分布更加均衡 消除热点 降低系 统的总体温度 对于资源布局方面 考虑层间散热效率不均匀性 可有效提高资源布局的热 均衡效果 文献 2 4 提出了一种称为 热群 t h e r m a lh e r d i n g 的设计方法 将系 统整体按微结构单元分解 并将其中活动相对频繁 发热率高 的功能单元靠近 热沉放置 取得了良好的热均衡效果 文献 2 5 中基于路由器在三维片上网络系统中由于较小的面积和较高的功 耗往往成为热点的现象 提出了将路由器放置在三维片上网络结构的底层 使得 路由器靠近热沉从而提高散热效率的方法 其提出的新的三维片上网络结构如图 1 5 所示 第一章绪论 图1 5 新型三维片上网络结构 P E P r o c e s s i n g e l e m e n t RR o u t e r In t e r c o nn e c t o fr o u t e r s 另一方面 结合任务映射的要求来优化芯片资源布局 也是改善三维片上网 络的热均衡问题的有效途径 文献 2 6 以热均衡为优化目标之一 采用遗传算法 优化3 DN o C 布局 与随机布局相比 减小了通讯量并降低了峰值温度 文献 2 7 分析了3 D 多核处理器中存储资源分布对性能 功耗和发热的影响 文献 2 8 贝I J 从成本优化的角度 研究了不同工艺下3 D 多核处理器的结构布局问题 此外 3 DI C 中的通孔布局对热均衡也有明显影响 已成为E D A 研究的热 点方向之一 例如 文献 2 9 1 的研究结果表明 通过在芯片中建立热通孔来提高 芯片的散热效率可以使芯片温度最高降低4 7 1 对于3 DN o C 通讯方面 由于通讯组件 路由器和物理链路 的功率密度相 对于处理器结点要小得多 因此已有文献主要为面向通讯性能的路由器 r o u t e r 设计和路由算法研究 如文献 3 0 提出了一种3 D 空间分解的N o C 路由器结构 在输入端 把数据包划分到三个空间方向X Y Z 放入相应的队列 从而把 数据流分离到三个独立的r o u t e r 子模块中 取得较好的性能 文献 3 1 提出一种适用于3 DM e s h T r e e 的自适应路由算法 提高了通讯性能 尽管如此 考虑到核间通讯对任务同步 负载均衡 访存效率均有影响 且通讯 功耗在一些设计中已占据整体功耗相当大比重 如何发挥片上网络通讯在热均衡 过程中的作用值得研究 6 第一章绪论 1 3 本文的研究内容 本文同样采用等价R C 回路的方法来建立三维片上网络的热模型 并在建立 好的模型上进行三维片上网络结构的热特性分析 并基于对于三维片上网络结构 的热特性分析结论 提出能够实现热均衡和提高系统散热效率的路由算法和路由 器设计方法 本文的具体内容安排如下 第一章 绪论 介绍了三维片上网络结构的热分析方法和热均衡设计的研究 背景 研究现状以及本文的研究内容 第二章 三维片上网络热分析方法 介绍了三维片上网络热模型和温度计算 方法 并提出自己的热分析方法 以及建立满足要求的热分析环境 最后介绍热 分析环境的实验结果 第三章 三维片上网络温度特性分析 在建立好的热分析环境中进行三维片 上网络结构的温度特性分析 第四章 三维片上网络热均衡设计 基于得出的三维片上网络结构的温度特 性分析结论 提出能够实现热均衡和提高系统散热效率的路由算法和路由器设计 方法 第五章 总结和展望 总结了论文中的主要工作和文中的创新点 并指出工 作中出现的不足 以及对三维片上网络热分析方法和热均衡设计的研究工作进行 了展望 第二章三维片上网络热分析方法 第二章三维片上网络热分析方法 在本章中将会对三维片上网络的热分析方法做一个说明 从以往文献 3 2 中 采用的热模型和温度计算方法 到针对三维片上网络结构所建立的自己的热分析 环境 最后通过实验验证所建立的热分析环境 2 1 热建模方法 针对三维片上多核结构进行的热建模在前面章节中已经进行了简单介绍 在 本节中 将对等价R C 回路的热建模做一个具体的介绍 为了准确快速的进行系统的热特性分析 针对系统建立一个热模型来表征温 度的时间空间特征是必须的 根据等价R C 回路的方法 在热导中传输的热量可 以比作电流 而温度可以比作电压 热导则可以用于计算系统在达到稳态前的瞬 态温度 而热阻热容构成的热R C 时间常数就类似于电路中的R C 时间常数 在 热学领域中 这些类比的电学元件所构成的电路就称为c o m p a c t m o d e l s 而包含 了热容之后的电路就称为d y n a m i cc o m p a c tm o d e l s 将这样的等效电路应用于热建模中 把芯片分成有限个的热单元 将每个热 单元看作一个结点 分成的热单元个越多 所建立的热模型就越精确 但在温度 的计算中计算量就越大 于是存在颗粒划分的问题 包括通过对基于功能单元的 不规则粗颗粒划分和均匀细颗粒划分两种方式建模 这里将针对粗颗粒划分的结 构级建模方法进行介绍 细颗粒的建模方法类似 只是热单元更多 现在芯片典型的封装结构都是核心片 d i e 靠在一块均热片 s p r e a d e rp l a t e 上 均热片一般由铝 铜等高导热材料制成 具有良好的导热效率 芯片外盒再靠 在热沉 h e a ts i n k 上 热沉同样由高导热材料制成 最后再通过风扇来冷却热沉 来达到更好的散热效果 如图2 1 所示 第二章三维片上网络热分析方法 ii i 翁 一 蜕i 1 1 j 纛k 甏雾黝一 兰曼 l ii l 囊囊蚕 銎辨I C 嗲p a c k a g 鼬ep 8 蠹一 一一 i 蠹嚣篓i 2 搿3 r i 器 并 攀 睁黼黼睁 挚豳 图2 1 芯片典型的封装结构 针对上述的芯片的封装结构 如图2 2 所示 芯片在垂直方向由三个部分构 成 核芯片 均热片和热沉 核芯片由若干个不同功能的模块组成 针对芯片结 构可以按不同功能模块或是温度分布不同的划分方式来建立热模型 如图2 3 中 核心片只分成了三个结点 在现实应用中根据不同划分方式分成更多的结点 均 热片被分成了五个模块 其中一个为核心片正下方同等面积的部分 其余四个模 块为围绕着中心这块的四个梯形部分 根据类似的方法 热沉也分成五个模块 一个为均热片正下方同等面积的部分 其余四个模块为围绕着中心这块的四个梯 形部分 从整个封装套件到空间的被看成一个独立的热阻 空气被假设具有固定 的温度 通常设定为4 5 摄氏度 当然这不是指一般的室温 而是机盒里的温度 图2 2 芯片热模型示例 9 第二章三维片上网络热分析方法 t oh e a ts p r e a d e r t a t e r a r e s i s t a n c e t oh e a ts p r e a d e r I a 协陷Ir e s i s t a n c e t oh e a ts p r e a d e r v e r t i c a lr e s i s t a n c e 图2 3 核一心片热模型示例 整个等效电路模型由垂直模型和水平模型两部分组成 对于垂直模型 热流 从核心片通过层与层之间导热 穿过均热片和热沉散到空气中 对于水平模型 热流在核心片的各个模块之间传输 并通过核心片和均热片的边缘散到均热片中 最终通过均热片和热沉的边缘散到空气中 2 2 温度计算方法 有了等效电路的热模型 温度便可以通过电学公式计算得出 首先是如何计 算热阻R 和热容C 的值 热阻R 和材料的厚度成正比 和热传导的接触面积成 反比 R t kXA 2 1 其中t 为材料的厚度 A 为热传导的接触面积 k 为材料的热导系数 在8 5 摄氏度时硅的热导系数为1 0 0W m K 铜的热导系数为4 0 0W m K 热容C 则跟材料的厚度以及热传导的接触面积成正比 C C t A 2 2 其中C 为单位体积的热容 硅的单位体积热容为1 7 6 1 0 6j m 3 k 铜的单位 体积热容3 5 5 1 0 6J m 3 k 确定了热阻R 和热容C 的计算方法后 个二维片上网络的热特性可以用 以下的方程表示 第二章三维片上网络热分析方法 c 掣 胛 P u 亡 2 3 假设这个二维片上网络由N 个核构成 则根据2 1 1 介绍的粗颗粒热建模方 法 每个核看作是一个热单元 则方程中C 为对角线是N 个热单元热容值的N N 矩阵 T 为代表N 个热单元温度的长度为N 的数组 t 为时间 A 为包含所 有相邻核之间热阻值的N X N 矩阵 P 为代表N 个热单元功耗的长度为N 的数 组 在这个方程中C A P 是已知的 只要求出T 就可以得到所有核的温度 以上是瞬态温度的计算方法 有时在温度计算时我们只需要得到系统稳定之 后的温度 即稳态温度 这时方程2 3 可以化简成以下形式 T P A 1 2 4 方程2 3 和2 4 是基于二维片上网络热模型的温度计算方法 三维片上网络 的建模方法a n 维的类似 只不过是有多层结构 但是同样是分成有限个热单元 进行分析 然后利用等效电路进行计算 在建立三维片上网络的热分析环境时 我们采用H o t S p o t 软件进行温度计算 H o t S p o t 软件的热建模和温度计算方法如 上所述 但在进行计算的过程中用的是细颗粒的建模方法来增加计算结果的准确 率 2 3三维片上网络系统性能仿真器设计 为了进行三维片上网络的热特性分析 一个满足仿真速度精度等要求的热分 析环境是必需的 在硬件系统仿真方面 我们基于S y s t e m C 语言建立了一个周期 精确的全系统仿真器M e s h i m 利用该仿真器能够进行三维片上网络系统的各项 性能仿真 并且采用顶层建模的方法 伎该仿真器能够满足高速仿真的要求 2 3 1三维片上网络系统性能仿真器介绍 由于三维片上网络系统的庞大和复杂性 传统的仿真手段往往会花费大量的 仿真时间 为了在设计初期通过快速的仿真得到系统的性能结果 设计一个系统 级的性能仿真器显得尤为重要 3 3 我们基于S y s t e m C 环境设计的三维片上网络仿真器 具有周期精确 可配置 仿真速度快等特点 通过该仿真器 能够在系统设计初期通过仿真器仿真进行系 第二章三维片上网络热分析方法 统的互联结构 路由算法 程序运行性能等方面的探索 一个完整的系统级片上网络仿真器包括硬件建模和软件支持两大部分 如图 2 4 所示 应用规格 IlIJ l 拓扑结构I P 映射方 应用程序任务分配 规格案 I 一 3 DN o C 二二进制映 像文件 模块库 I 配鼹生成的 片U i 5 络系统 i 性能仿真 图2 4 应用开发流程 硬件建模主要是对系统的各个组成模块进行设计 基于S y s t e m C 环境对各个 模块进行描述组成一个可配置模块的模块库 模块库所包含的模块有处理器模块 存储器模块 路由器模块和网络接口模块 利用这个模块库可以进行目标系统的 配置 通过输入拓扑互联结构和I P 映射等信息 建立完整的三维片上网络硬件 系统 传统的M e s h 拓扑结构在二维片上网络中应用广泛 3 4 我们建立的三维片 上网络仿真器将基于二维M e s h 拓扑结构 采用M e s h 结构拓展成的三维形式作 为网络拓扑结构 如图2 5 所示 每一个处理单元 P E 通过网络接口 N I 转换传 输协议后连接上路由器 R 并通过路由器访问网络中的各个结点 3 5 3 8 第二章三维片上网络热分析方法 图2 5 仿真器采刷f l 勺 维片上网络结构 软件支持是指在建立好的系统模型上运行应用程序 通过交叉编译器将编写 好的应用程序编译链接成二进制映像文件 然后再将该二进制映像文件上载到存 储器模块中 每一个处理器都有一个对应的私有存储器 在系统开始运行后 处 理器将从自己对应的私有存储器中读取程序运行 所以在对每个处理器编写程序 时将进行任务分配 包括计算任务和通信任务 然后在上载阶段将各个程序上载 到对应存储器 建立硬件系统和上载应用程序后 可以运行仿真器对建立好的系统进行仿真 提取运行性能结果 对于三维片上网络系统 仿真器可以得到每个核的执行周期 平均延迟 最大延迟 平均吞吐量 以及仿真器运行时间等数据 这些仿真结果 将有助于在系统设计初期对系统的互联结构 路由算法 I P 映射和任务分配等 设计方案的探索 2 3 2 硬件模块设计 以下对硬件建模中的处理器模块 存储器模块 路由器模块和网络接E l 模块 进行详细介绍 处理器模块是一个用C 语言进行描述的A R M 7 指令集模拟器 开源代码 在S y s t e m C 环境中进行封装之后成为一个带有标准A H B 总线接口的完整模块 如图2 6 所示 该A R M 7 指令集模拟器包含处理器内核 一级高速缓冲存储器 串口 定时器和中断控制器 由一个本地总线负责这些部件之间的通信 第二章三维片上网络热分析方法 图2 6 处理器结构 系统采用两层存储器机制 包括直接被处理器访问的C a c h e 和内存 C a c h e 被包含在处理器模块 分成指令C a c h e 和数据C a c h e 内存包括两种存储器 私 有存储器和共享存储器 每一个处理器拥有一个私有存储器 只能由对应的单一 处理器访问 而共享存储器可以被所有的处理器的访问 这两种存储器共同构成 一个存储器模块 作为片上网络中的一个核 路由器主要负责在网络通信中传递由处理单元和其它路由器发送来的数据 包 在三维M e s h 网络结构中每个路由器有7 个双向端口 路由器负责将这些端 口传递来的数据包进行缓冲 路由和仲裁 最后选择正确的端口将数据包发送出 去 如图2 7 所示 在系统中路由器采用虫孔交换协议 X Y Z 路由算法和轮转优 先级仲裁机制 缓存深度默认为8 个数据包 但在仿真器中可以对这些参数进行 配置 L o c a l N O r t h E a s t S o u t b W e s t U p D o w n R o u t i n g A r b i t e r F I O WC o n t r o l 1 l B U e r L t7 V B u f f e r N B u 仃b r E 八 B u f 托r SyC r o s s b a r 旷 B u f 艳r W B u f f e rU B u l l e r D L o c a l N o r t h E a s t S o u t h W e s t U P D o w n 图2 7 路由器结构 网络接口负责处理单元和路由器之间的协议转换 在系统中主要是将处理器 1 4 第二章三维片上嘲络热分析方法 的A H B 接口或存储器接口传输的数据打包后传递给路由器 和将路由器发送过 来的数据包解包后转换成相应协议形式后传给处理器或存储器 2 4 热分析环境的建立 有了性能仿真器后 结合路由器功耗仿真器O r i o n 3 9 署1 1 温度计算软件 H o t S p o t 3 2 建立三维片上网路的热分析环境 将O r i o n 的功耗模型集成到 M e s h i m 中 能够将M e s h i m 仿真器输出的性能结果计算成功耗 然后把功耗结 果和版图参数传给H o t S p o t 进行温度计算 使用M e s h i m 仿真器 可以对系统的运行状态和各项性能就行监控和记录 其中包括路由器的利用率以及网络的延迟 吞吐率等 将O r i o n 功耗模型集成到 M e s h i m 中 使用路由器的利用率结果便可得到路由器的功耗 处理器和存储器 等处理单元的功耗参考文献 4 0 中的功耗模型 结合温度计算软件H o t S p o t 将特定的版图信息和各个模块的功耗输入 H o t S p o t 中便可以得到三维片上网络系统各个模块的温度结果 2 5 热分析环境实验 本节将对我们建立的三维片上网络仿真器M e s h i m 和结合O r i o n 功耗模型 H o t S p o t 温度计算软件的热分析环境进行实验 2 5 1M e s h i m 仿真器实验结果 首先是M e s h i m 仿真器的实验 该仿真器可以在系统设计初期对系统的互联 结构 路由算法 I P 映射和任务分配等设计方案的探索 下面以路由算法和互 联结构的探索为例 使用仿真器进行系统性能的仿真 对于路由算法的探索 实验建 立包含不同路由器的4 4 的二维片上网络 采用转置矩阵 T r a n s p o s e 数据传输模式 结点 i j 只和结点 j i 进行通信 以 注入率 P i t 为单位对系统注入数据来进行x y 路由 w e s t f i r s t 路由 n o r t h l a s t 路 由和o d d e v e n 路由的性能比较 结果如图2 8 所示 可以看出对于一个4 4 的 二维片上网络 在转置矩阵数据传输模式下 采用o d d e v e n 路由算法将能实现 较好的网络通信性能 第二章三维片上l 叫络热分析方法 图 毅 霹 睁 0 0 0 5 0 0 1 0 0 1 5 0 0 2 0 0 2 5 0 0 30 0 3 50 0 40 0 4 50 0 5 注入率 图2 8 路由算法的通信性能比较 对于互联结构的探索 实验进行相同核数下三维片上网络和二维片上网络结 构的性能比较 如图2 9 所示为建立好的三维片上网络结构和I P 映射 分为两 层 每层有九个核 上面一层放置处理器 下面一层放置存储器 且每个处理器 的对应私有存储器被放置在正下方位置的存储器模块里 二维片上网络结构和I P 映射如图2 1 0 所示 处理器和存储器交替分布在同一层 且处理器对应的私有 存储器被放置在右边的存储器模块里 这两个系统的配置参数如表2 1 所示 图2 9 三维片上网络映射方案 第二章三维片上网络热分析方法 P R M 毓N I lp t N I P 矧N IP 烈N I Ml 汴i f f i 带南忏言讣 图2 1 0 二二维片上网络映射方案 表2 1 配置参数 结构类型 2 D N O C3 D N o C 处理器数目 9 数据C a c h e 容量 4 K B y t e 指令C a c h e 容量 8 K B y t e 存储器数目 9 私有存储器容量 1 2 M B y t e 共享存储器容量 M B y t e 路由算法 X Y r o u t i n g X Y Z r o u t i n g B u f f e r 容量 4p a c k e t s 仲裁算法 R o u n d R o b i n 实验采用快速傅里叶变换 F F T 和矩阵乘法运算 M M 作为系统应用程序 对 于快速傅里叶变换 在上述两个不同的结构中分别进行6 4 点 1 2 8 点 2 5 6 点 5 1 2 点的F F T 运算 将每一阶段的运算任务平均的分配给8 个处理器 然后将空 闲的处理器对应的存储器模块作为共享存储器 每一阶段运算结束后进行运算的 8 个处理器将交换运算结果后进行第二阶段的运算直到所有运算结束 对于矩阵 乘法运算 将进行8 8 至2 0 2 0 的矩阵乘法运算 每个处理器等待上一个处理 器的运算结果 将该结果和自身对应的私有存储器上的矩阵数值进行乘法运算 然后再将运算结果传递给下一个处理器 快速傅里叶变换的实验结果如图2 1 1 和图2 1 2 所示 两个系统的执行时间 第二章三维片上网络热分析方法 和平均延迟都随着运算量的增加而增加 但三维片上网络结构比二维结构消耗更 少的执行时间并具有较小平均延迟 这是由于三维结构具有较短的垂直传输距离 所以在相同的工作量下表现出更好的性能 3 5 3 0 2 5 三2 0 o 苦1 5 1 0 5 O 6 41 2 82 5 65 1 2 W o r k l o a d s 圈2 DM e s hN o C 一3 DM e s hN o C 图2 1 1 快速傅里叶变换程序下系统的执行时间 6 41 2 82 5 65 1 2 W o r k l o a d s 图2 DM e s hN o C 3 DM e s hN o C 图2 1 2 快速傅里叶变换程序下系统的平均延迟 矩阵乘法运算的实验结果如图2 1 3 和图2 1 4 所示 两个系统的执行时间性 能趋势和F F T 运算类似 但平均延迟并没有随着运算量的增加而增加 这是因 为矩阵运算在片上网络中的通信量比F F T 运算要小得多 随着运算量的增加也 没有达到网络通信饱和值 但矩阵运算实验中三维片上网络结构的执行时间和平 均延迟都比二维结构表现出更好的性能 充分体现了三维结构在通信性能的优越 性 O O O O O O 0 0 O 0 0 O O 0 O O 0 O 0 O 0 O 0 O O 0 O O O O O O O O 0 O O O 0 O O o H o 淞Q v m目州一ao州p譬o 两oII p对rT 鼬 8 净 第二章三维片上网络热分析方法 3 5 3 0 82 0 豳2 DM e s hN o C 一3 DM e s hN o C 图2 1 3 矩阵乘法运算私序下系统的执行时间 三2 0 o 台1 5 l O 5 0 81 21 62 0 W o r k l o a d s 圈2 DM e s hN o C 一3 DM e s hN o C 图2 1 4 矩阵乘法运算程序下系统的平均延迟 2 5 2 热分析环境实验结果 然后是热分析环境的实验 我们假设一个4 X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论