版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、复用器重重构降低低FPGGA成本本 摘 要: 本文文介绍了了一种新新的复用用器重构构算法,能够降降低FPPGA实实际设计计20的成本本。该算算法通过过减少复复用器所所需查找找表(LLUT)的数量量来实现现。算法法以效率率更高的的4:11复用器器替代22:1复复用器树树。算法法性能的的关键在在于寻找找总线上上出现的的复用器器数量。新的优优化方法法占用一一定的逻逻辑,这这些逻辑辑由总线线进行分分担,从从而减少少了总线线上每个个比特位位所需的的逻辑。 (本本站编者者:该算算法已经经集成在在QuaartuusIII4.22软件中中,使用用QuaartuusIii进行综综合HDDL语言言时会自自动调用用
2、该算法法进行综综合,本本文介绍绍该算法法的详情情,本文文适合希希望深入入了解算算法的用用户阅读读) 关键词: FPPGA;复用器器;重构构;重新新编码;总线;逻辑优优化;综综合 1. 引引言 - 复用器器是数据据通道常常用的构构建模块块,被广广泛应用用在处理理器11、处处理器总总线、网网络交换换,甚至至是资源源共享的的DSPP设计中中。据估估计,复复用器一一般要占占用一个个FPGGA设计计2 255%以上上的面积积。因此此,优化化FPGGA设计计的关键键在于怎怎样优化化复用器器。 - 本文介介绍了一一种新的的复用器器重构算算法,该该算法减减小了复复用器在在基于44输入查查找表(4-LLUT)F
3、PGGA体系系结构中中所占用用的面积积。基准准测试结结果表明明复用器器平均减减少了117%,在一些些设计中中,4-LUTT整体减减少200%。 - 2.11节阐述述了复用用器是如如何由行行为级VVHDLL4或Veerillog5代代码产生生的,22.2和和2.33节阐述述复用器器树和复复用器总总线在设设计中是是怎样生生成的。2.44节说明明这些结结构怎样样由4-LUTT实现,阐述如如何采用用两个44-LUUT有效效实现一一个4:1二进进制复用用器。- 第3节节介绍了了一种叫叫做压缩缩的新技技术,该该技术附附加一些些控制逻逻辑,将将多个22:1复复用器重重新组合合为有效效的4:1复用用器,从从而
4、减少少了为总总线上每每一个比比特位实实现复用用器所需需要的44-LUUT数量量,所附附加的控控制逻辑辑代价由由整个总总线来分分担。优优化复用用器总线线是复用用器重构构算法的的核心。 - 4.11节阐述述复用器器重构算算法如何何构建设设计中的的复用器器树总线线。4.2节的的重构方方法用于于执行44.3节节中定义义的均衡衡算法。均衡增增加了由由压缩生生成的有有效4:1复用用器的数数量。 - 第5节节总结了了在Allterra QQuarrtuss III集成综综合中运运行的整整个算法法。第66节列出出了来自自1200个Allterra真实实用户设设计实例例的基准准测试结结果,测测试表明明面积减减少
5、超过过20%,平均均节省了了4.22%。 2. 背背景知识识 - 2.11 复用用器在设设计中是是怎样实实现的 - 行为级级HDLL设计中中的任何何条件代代码通常常会综合合为复用用器。本本节阐述述两个最最常用的的复用器器生成代代码实例例。 - 图1是是VHDDL的ccasee声明及及其2:1复用用器树的的实现。采用VVeriilogg caase声声明的“parralllel casse”指指令55可产产生相似似的结果果。 图1 - 注意,并不是是所有的的casse声明明都能将将可能的的事件描描述清楚楚,需要要依靠“deffaullt”或或者“ootheers”条件来来进一步步说明。在这些些情
6、况下下,可以以继续将将casse声明明表征为为2:11复用器器树,但但是这种种树结构构可能达达不到平平衡。- 图2显显示了“if-theen-eelsee”声明明是怎样样产生一一个2:1复用用器链的的。Veerillog的的“?:”和非非平行ccasees可同同样产生生相似的的结构。注意,复用器器链确保保如果第第一个iif条件件为“真真”,将将选择“a”数数据输入入,而复复用器其其他部分分将被忽忽略。 - 本文阐阐述的复复用器重重构算法法应用于于2:11复用器器。综合合工具由由行为级级代码开开始通常常会生成成较大的的复用器器。较大大的复用用器总是是被分解解为2:1复用用器树,如何实实现这种种分
7、解已已经超出出本文讨讨论范围围。 图2 iif-tthenn-ellse声声明生成成的逻辑辑 图33 HDDL生成成的复用用器材 图4 生成复复用器总总线 - 2.22 复用用器树 - 设计中中复用器器之间的的馈入是是常见的的现象。例如,在一段段HDLL代码中中,如下下面的图图3所示示,iff-thhen-elsse声明明中含有有casse声明明就会产产生这种种现象。 - 在在复用器器重构算算法中,识别出出较大的的复用器器树对于于尽可能能减少面面积是非非常重要要的。 - 2.33 复用用器总线线 - VHDDL信号号或Veerillog线线宽通常常会超过过一个比比特位。当采用用if-theen
8、-eelsee和caase声声明时,将会生生成大量量具有不不同数据据输入的的相同复复用器树树,图44是一个个实例。一组具具有相同同结构的的复用器器称为复复用器树树总线。 - 本文阐阐述的复复用器重重构技术术采用了了新的对对整个复复用器总总线进行行优化的的方法,它通过过由4.1节中中进一步步阐述的的总线识识别和形形成技术术来实现现。 - 2.44 复用用器代价价 - 在许多多情况下下,每个个2:11复用器器都需要要一个单单独的44-LUUT。这这样,图图1和图图2中的的复用器器结构都都需要三三个4-LUTT。尽管管这些结结构控制制编码不不同,但但是它们们都具有有4个不不同的数数据输入入,因此此可
9、以当当作4:1复用用器。本本节阐述述如何实实现只需需要两个个4-LLUT的的4:11复用器器。 - 图5是是控制输输入S00低电平平时,一一个有效效的4:1复用用器是如如何工作作的。44:1复复用器由由两个链链接在一一起的44-LUUT(阴阴影框所所示)构构成。每每个4-LUTT被设置置为含有有阴影框框中的逻逻辑功能能。如白白框所示示,复用用器含有有四个输输入a、bb、c和和d,以以及两个个控制输输入S0和和S1。图5 - S0低低电平时时,低位位控制比比特S11在输入入c和dd中进行行选择,其结果果通过第第二个44-LUUT,将将a或者者b输入入旁路。图6 - 图6是是控制输输入S00高电平
10、平时,一一个有效效的4:1复用用器是如如何工作作的。低低位控制制比特SS1旁路路c和dd输入,直接进进入第二二个4-LUTT,对aa或者bb输入进进行选择择,其结结果成为为第二个个4-LLUT的的输出。 - 第3节节描述的的压缩算算法采用用这种有有效的44:1复复用器,重新实实现复用用器结构构,达到到了减小小面积的的目的。 3. 压压缩 - 压缩是是将低效效的4:1复用用器实现现转换为为高效实实现的过过程。复复用器重重构算法法的面积积节省由由压缩实实现。但但是,在在不同的的复用器器表征中中进行转转换,通通常需要要附加控控制逻辑辑。实际际上,由由于附加加逻辑结结构抵消消了使用用高效复复用器结结构
11、的优优势,这这种转换换很少能能够产生生真正的的面积节节省。而而复用器器重构算算法采用用新颖的的将整个个复用器器总线进进行转换换的方法法,这样样,总线线上的多多个复用用器可以以共享控控制逻辑辑,因此此,改善善后的复复用器结结构优势势可通过过总线上上的每个个复用器器来实现现。 图7- 图7显显示了如如何将三三个2:1复用用器组成成的优先先级链转转换为一一个4:1二进进制复用用器。假假设控制制输入由由不相关关的逻辑辑馈入,那么这这种转换换至多需需要两个个额外的的4-LLUT控控制逻辑辑。如果果最初的的复用器器至少占占用三个个4-LLUT,而4:1复用用器只需需要两个个即可实实现,那那么这种种转换将将
12、节省33宽度或或者更宽宽总线的的面积。 图8- 图8显显示了如如何将一一组排列列成树的的2:11复用器器转换为为一个44:1复复用器。在这种种情况下下,通过过仔细为为4:11复用器器选择编编码方式式,使SS0在(A、BB)和(C、DD)之间间进行选选择,限限制附加加控制逻逻辑,只只加入最最多一个个4-LLUT。此时,这种转转换将节节省2宽宽度或者者更宽总总线的面面积。 - 一般来来讲,任任何的三三个2:1复用用器组都都可以通通过图77或图88的方式式转换为为一个44:1复复用器。但是,这两种种转换必必须在宽宽度大于于2的复复用器总总线上进进行,以以减小所所需4-LUTT的数量量,实际际上,如如
13、果这两两种转换换不在总总线上进进行,将将没有意意义。 - 总线上上2:11复用器器三联重重新编码码是复用用器重构构算法的的核心。 第44节将阐阐述形成成数量最最多三联联的新方方法。 4. 复用器器总线4.1 “库”的构造造 - 压缩减减小了其其所编码码的每一一个2:1复用用器三联联面积,因此,压缩应应用在较较大的复复用器树树上最有有效。本本节阐述述大型复复用器树树是如何何构建的的。设计计中所有有的总线线都将被被存储在在一种称称为“库库”的数数据结构构中。 - 复用器器树采用用下面的的方法构构建。设设计中所所有2:1复用用器以反反向深度度顺序排排列。这这意味着着那些离离寄存器器或者输输出引脚脚最
14、近的的复用器器将排在在列表前前面。然然后从头头至尾扫扫描列表表,寻找找每一个个2:11复用器器,如果果其输出出仅与另另一个22:1复复用器相相连,则则将该复复用器和和与其相相连的复复用器一一起加到到复用器器树中。否则,将此22:1复复用器作作为一个个新复用用器树的的首复用用器。以以此方式式来构建建的复用用器树含含有最大大数量的的复用器器。 - 如果复复用器树树中复用用器的所所有数据据输入均均不是由由同一个个树中其其他的22:1复复用器馈馈入,则则称此复复用器为为初级输输入(对对整个树树而言)。 - 一旦所所有的复复用器树树已经形形成,则则将其合合并成总总线。如如果两个个复用器器树要并并入同一一
15、个总线线,它们们必须具具有相同同的结构构,即22:1复复用器的的排列相相同,并并且都有有完全一一致的控控制输入入。这可可以通过过根据复复用器结结构,对对所有复复用器树树列表排排序来实实现,在在列表中中将结构构相同的的树靠近近排列。总线可可直接由由结构相相同的树树构成。 - 通过规规则选取取来实现现总线宽宽度最大大化。宽宽总线可可以将由由压缩引引入的控控制逻辑辑开销降降低到最最小。- 4.22 重构构 - 4.33节描述述均衡方方法,该该方法能能够使压压缩得到到的面积积减小最最大化。均衡建建立在重重构的基基础上,其概念念由本节节给出。 - 通过22:1复复用器所所馈入的的一个22:1复复用器,重
16、构移移动该复复用器及及其一个个输入。图9显显示了阴阴影复用用器与其其“f”输入的的重构。为保持持原始复复用器总总线的功功能,需需要附加加一些控控制逻辑辑。这些些控制逻逻辑同样样可以由由总线上上的每一一个复用用器树来来分担。 图9- 图9中中,重新新编码逻逻辑(cc6 AAND (NOOT cc3)必须确确保当cc1、cc3为“假”而而c6为为“真”时,选选择输入入“f”(与转转换前的的情况一一致)。同样,当c11、c33、c66为“假假”时,选择输输入“gg”,即即(c66 ANND (NOTT c33)也也是“假假”。 - 重构构转换将将选中的的复用器器进一步步向复用用器树顶顶端移动动。因此
17、此,不断断重复重重构转换换,可以以将任意意位置的的复用器器向顶端端移动。- 4.33 均衡衡 - 压缩通通过转换换2:11复用器器三联,能够减减少实现现复用器器总线所所需的44-LUUT数量量。但是是,如果果不进行行复用器器树重构构,有些些结构是是不可能能得到最最佳三联联分组的的。例如如,无法法将图110中所所有的22:1复复用器进进行分组组,这是是因为每每一种可可能的分分组都将将会剩余余一个22:1复复用器而而无法处处理。 - 均衡的的目的在在于通过过最少的的重构得得到最佳佳的压缩缩。对于于图100的例子子,可以以采用图图11所所示的方方法,得得到两组组2:11复用器器三联。- 均衡算算法由
18、图图12的的递归定定义。由由首复用用器开始始,算法法首先均均衡复用用器树左左面和右右面数据据输入。均衡返返回还没没有连接接为三联联的2:1复用用器的数数量。均均衡确保保形成尽尽可能多多的三联联,这样样只会剩剩余一个个或者两两个2:1复用用器,甚甚至没有有剩余。- 均衡中中的任何何阶段,都需要要对15个22:1复复用器进进行均衡衡(从左左侧分支支开始最最多两个个,从右右侧分支支开始为为两个,还要算算上当前前的2:1复用用器本身身)。11或2个个复用器器不会形形成更多多的三联联,而33个复用用器总是是能够形形成三联联。4或或5个复复用器则则需要进进行重构构,以免免剩余无无法处理理的复用用器,这这种
19、重构构方法在在图133和图114中示示出。 图10 复用器器树次优优压缩的的例子 图111 由均均衡未完完善压缩缩 图112 均均衡算法法 图 13重重构4个个复用器器实现均均衡 图图14 重构55个复用用器实现现均衡 5. 算算法总结结 - 本文引引入了复复用器树树总线概概念,描描述了可可用来提提高压缩缩性能的的均衡方方法,压压缩以效效率更高高的4:1复用用器来替替代2:1复用用器三联联。图115显示示了全部部复用器器重构算算法。 - 复用器器重构算算法性能能依赖于于对较大大复用器器树总线线的识别别。由于于复用器器重构算算法在整整个总线线上分担担控制逻逻辑,因因此,总总线越宽宽,压缩缩的效果
20、果就越明明显。优优化会减减小复用用器树间间的相似似性,从从而减小小所寻找找的总线线宽度,因此在在复用器器重构之之前,应应尽量避避免优化化。- 复用器器重构以以分解大大的复用用器为22:1复复用器开开始。设设计中所所有2:1复用用器都用用于形成成4.11节所描描述的复复用器树树。结构构相似的的复用器器树然后后合并形形成4.1节中中的总线线结构。- 算法的的主要部部分依次次优化每每一个总总线。均均衡将22:1复复用器重重新排列列为三联联,这样样在压缩缩阶段,每个三三联能够够重新编编码为效效率更高高的4:1复用用器。 图16 复用器器重构基基准测试试结果 6. 结结果 - 本文所所阐述的的算法已已经
21、集成成到Allterra QQuarrtuss III 4.2综合合软件中中。图116显示示1200个真实实用户设设计中,Altteraa基准测测试的面面积减小小结果。 - 结果表表明,一一小部分分设计所所需的LLUT数数量减小小了200%,超超过四成成的设计计面积减减小了55%以上上。所有有设计面面积平均均减小了了4.22%。 - 据估算算,面积积减少平平均4.2%意意味着复复用器平平均减少少了177%。 - 复用器器重构主主要集中中在减小小面积上上(例如如,减少少所需44-LUUT的数数量),而且对对电路速速率影响响不大,电路平平均速率率仅降低低1%。 7. 结结论 - 本文阐阐述了复复用
22、器重重构算法法,该算算法能够够将设计计中实现现复用器器所需的的4-LLUT数数量平均均减少117%。 - 复用器器重构算算法的关关键在于于优化复复用器总总线。即即使附加加了控制制逻辑,新优化化算法仍仍能够减减小总线线上每个个比特位位的面积积。这是是由于控控制逻辑辑可以由由总线共共享,其其面积代代价可以以抵消。 - 压缩将将2:11复用器器三联转转换为有有效的44:1复复用器。尽管可可能需要要附加LLUT对对4:11复用器器控制线线进行重重新编码码,这种种代价可可以通过过采用复复用器总总线整体体压缩方方法来抵抵消。此此外,通通过构建建最大的的复用器器树,可可对大量量的2:1复用用器三联联进行转转换。- 本文还还引入了了能够提提高压缩缩算法效效率的均均衡方法法。本文文描述了了面向基基于4-LUTT的FPPGA算算法,例例如Allterra SStraatixx I和和Cycclonne器件件。新的的FPGGA体系系结构可可使用不不同大小小的查找找表(如如Strratiix III体系系结构能能够采用用4、55、6输输入LUUT)。可采用用本文阐阐述的方方法来进进一步减减小这些些体系结结构的面面积。 参考文献献 1 A Higgh PPerfformmancce 332-bbit AL
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年电子图书txt下载销售授权合同2篇
- 英语教研活动方案(4篇)
- 员工房屋租赁合同
- 办公用房屋租赁合同
- 上海市商业房屋出租合同
- 杂志媒体广告刊登合同
- 电视节目片头插播广告协议
- 2025-2030全球便携式动力空气净化呼吸器行业调研及趋势分析报告
- 2025-2030全球UPS和数据中心塑壳断路器 (MCCB)行业调研及趋势分析报告
- 2025年全球及中国360º沉浸式投影系统行业头部企业市场占有率及排名调研报告
- 工程建设行业标准内置保温现浇混凝土复合剪力墙技术规程
- 北师大版物理九年级全一册课件
- 2024年第三师图木舒克市市场监督管理局招录2人《行政职业能力测验》高频考点、难点(含详细答案)
- RFJ 006-2021 RFP型人防过滤吸收器制造与验收规范(暂行)
- 盆腔炎教学查房课件
- 屋面细石混凝土保护层施工方案及方法
- 新概念英语课件NCE3-lesson15(共34张)
- GB/T 3683-2023橡胶软管及软管组合件油基或水基流体适用的钢丝编织增强液压型规范
- 电视剧《琅琊榜》特色分析
- 5A+Chapter+1+Changes+at+home+课件(新思维小学英语)
- 安徽省2023年中考数学试卷(附答案)
评论
0/150
提交评论