GPU加速的SPICE仿真提升了模拟IC设计_第1页
GPU加速的SPICE仿真提升了模拟IC设计_第2页
GPU加速的SPICE仿真提升了模拟IC设计_第3页
GPU加速的SPICE仿真提升了模拟IC设计_第4页
GPU加速的SPICE仿真提升了模拟IC设计_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

GPU加速的SPICE仿真提升了模拟IC设计电路发明取得的进步使智能手机和上网本等设备的生产成为可能。然而,业内专家坚信,需要更多突破才能满足处理更大电路、更高精度和更快周转时间的需求。他们认为这是电路制造未来的前进方向。自1970年代初推出以来,具有集成电路重点的仿真程序(SPICE)已成为晶体管级电路仿真不可或缺的工具。多年来,已经推出了许多SPICE模拟器,并且它们的功能得到了很大的提高。然而,随着对更深亚微米设计的改进和电路尺寸的增加,当前SPICE仿真器的能力被认为是不够的。给定一个描述电路拓扑的网表,SPICE仿真作业由几个主要任务组成。网表解析和建库通常是按顺序进行的。然后模拟器可以使用并行处理技术,例如多核和多线程,来加速计算直流(DC)工作点和瞬态分析的任务。模型评估是另一项可以轻松并行化的任务,尽管它通常只占总仿真时间的一小部分。所有现代SPICE模拟器都使用并行处理来加速,但它们使用的技术不同,并且可能导致容量和性能大不相同。EmpyreanALPS™,全称AccurateLarge-capacityParallelSpice,是一款并行SPICE仿真器,采用先进的分区和突破性技术进行矩阵求解,与市场上其他SPICE仿真器相比,具有最佳的容量和性能。九霄软件EmpyreanALPS™EmpyreanALPS™使用的主要技术解释如下。对于给定的电路,ALPS首先使用超图划分方法将其划分为重叠块。然后,使用BDF(后向微分公式)方法对微分代数方程组进行离散化。对于每个块,内部矩阵通常非常稀疏,其中LU分解是一种非常有效的解决方法,也适合应用并行化技术。块耦合节点的矩阵通常是密集的,其中广义最小残差法(GMRES)是最有效的方法。然而,GMRES方法的一个主要缺陷是它需要一个有效的前置条件矩阵。否则它将非常缓慢地收敛或根本无法收敛。选择一个好的前置条件矩阵并不容易,即使有一个好的前置条件矩阵,也往往需要多次迭代才能成功求解方程。ALPS的一个突破是我们开发了新技术,不仅可以得到一个有效的前置条件矩阵,而且在大多数情况下可以使GMRES快速收敛,从而大大减少了求解方程的时间。算法:GMRES–带有(右)预处理ALPS的容量和性能使其适用于模拟大型布局后电路。对于此类电路,与其他真正的SPICE仿真器相比,ALPS通常会获得2-3倍的加速。迄今为止,ALPS在全球拥有数百名付费客户。EmpyreanALPS-GT™除了使用多个中央处理器(CPU)内核来加速电路仿真之外,使用图形处理器(GPU)是通过硬件加速进一步加速仿真的另一种方式。对于矩阵求解等任务,这通常是整个仿真过程中的瓶颈,如果我们能够使用多个GPU有效地完成它,可以获得非常显着的加速。然而,GPU上的矩阵求解是一项具有挑战性的任务,许多SPICE模拟器都尝试过但都失败了。以Gilbert-Peierls左视算法为例,它需要将稀疏向量缩放为密集向量,因此需要大缓存。LU分解求解器也需要大缓存。但通常GPU上的缓存大小比CPU上的小得多,因此我们需要特殊的技术来在GPU上执行这些任务,而不受缓存大小和数据传输开销的限制。EmpyreanSoftware开发了许多创新技术,通过使用多个GPU来加速ALPS,并且该公司在2019DAC中发布了EmpyreanALPS-GT™。下图说明了一种结合左视和右视算法以加快矩阵求解的技术。图1:U矩阵拓扑排序的依赖树生成下三角替换作业笔记:下一级的工作必须等到上一级的工作完成级别1和级别2都有四个并行作业可以从极稀疏的矩阵中生成大量的左视作业使用左视方法处理大量并行作业第3级到第7级只有一个可执行作业矩阵将相对密集,模式节点被消除由于依赖树,大多数左查找作业将连续执行使用右查找方法为近乎密集的矩阵生成更多并行可执行作业基准EmpyreanALPS-GT™已被一些顶级SoC设计公司采用,并显示出显着的加速效果,尤其是在16/7/5nm工艺技术中的深亚微米模拟设计。在Nvidia的工程团队[1]最近进行的比较中,正在使用具有2*IntelXeonE5-2698V420核CPU和8*NvidiaTeslaV100GPU的NvidiaDGX-1服务器。

模拟器中央处理器图形处理器加速配置EmpyreanALPS™XeonE5-2698V4双20核IntelXeon

8个CPUEmpyreanALPS-GT™XeonE5-2698V4双20核IntelXeon英伟达特斯拉V1008个CPU+8个GPU

表1:模拟器数据在硬件平台上使用ALPS和ALPS-GT模拟了几个布局后设计块。下面显示的是代表整体比较的两个块的结果。图2:性能比较案例1图3:性能比较案例2结论EmpyreanALPS-GT™是第一款由GPU驱动的商用SPICE模拟器。当瞬态分析和矩阵求解时间占总运行时间时,它可以大大提高仿真性能,这通常是许多大型和布局后电路的情

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论