



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、探究FPGA的峰值浮点运算性能由于DSP、GPU和FPGA具有性能和成效优势,一般用作CPU的加速器。考虑到计算体系构造的多样性,设计人员需要一种统一的方法来比照性能和成效。通用的方法是测量每秒浮点运算次数FLOP,按照IEEE 754标准,FLOP被定义为单精度32位或者双精度64位加法或者乘法。所有常用函数和运算功能如快速傅里叶变换FFT和矩阵运算等都需要加法器和乘法器,所有这些体系构造中加法器和乘法器之比一般都是1:1。FPGA浮点运算性能表现强劲业内一般采用峰值FLOPS来比照DSP、GPU和FPGA的性能。在最大工作频率下,可通过加法器和乘法器求和积来确定峰值FLOPS比。这代表了计
2、算的理论极限,虽然在实际中很难获得,但这确是实用性的比照指标。从以上可以看出,具有不同体系构造的器件的峰值浮点计算的才能是不同的。确定FPGA浮点运算性能面临挑战采用FPGA逻辑资源来实现浮点功能,可实现任意精度,不会受到业界标准单精度和双精度的限制,Altera可提供几种不同级别的浮点精度。但是,并不太容易确定使用了FPGA可编程逻辑的峰值浮点性能。Altera FPGA的峰值浮点速率只是基于硬核浮点引擎的性能,假设浮点功能并没有使用可编程逻辑资源,而是其他的设计功能使用了可编程逻辑资源,例如I/O接口、存储器接口以及其他功能等。某些因素导致很难准确计算出FPGA的浮点性能。虽然通过查询FP
3、GA供应商浮点知识产权IP用户指南可以确定构建一个单精度浮点乘法器和加法器所需的逻辑量,但用户指南并没有提供关键信息,而这是布线资源所需要的。实现浮点运算时需要大规模循环移位存放器,它会占用非常多的可编程逻辑互联资源。而所有FPGA支持逻辑的互联数是一定的,与典型定点FPGA设计应用有关。然而,与大部分定点运算相比,浮点运算并不需要这么多的互联。当建立一个浮点函数的实例化时,会占用逻辑单元中公共区域的布线资源。但是,大量的密集浮点运算会导致布线拥塞,导致设计时钟速率和逻辑利用率大幅度下降。Altera对此开发了一种专用综合技术,即“交融数据通路,在一定程度上减轻了这种影响,能支持在逻辑架构中实
4、现大规模的浮点设计,单精度采用定点27×27乘法器,双精度采用54×54乘法器。此外,FPGA的逻辑资源并不能被完全使用到浮点运算中。在某一设计占用了大部分逻辑资源的情形下,时钟速率即fMAX可以实现的时序收敛范围就缩小了,最终有可能根本实现不了时序收敛。通常来说,70%90%的逻辑资源可以被使用,在浮点运算密集型应用情况下应只占用最低比例的逻辑资源。应构建基准测试浮点运算出于以上原因,几乎不可能计算出FPGA实际的浮点运算性能。绝佳方法是构建基准测试浮点运算,这包括时序收敛。抑或FPGA供应商提供这类设计,以对估算FPGA的性能提供帮助。Altera提供28nm FPGA
5、基准测试设计,覆盖了根本以及复杂浮点设计。公开的结果显示,采用28nmFPGA,FFT等简单算法可以实现数百GFLOP,QR和Cholesky分解等复杂算法那么到达100 GFLOP以上。第三方技术分析公司Berkeley设计技术在Altera的28nm FPGA上进展了复杂高性能浮点DsP设计独立分析。使用OpenCL在Altera 28nmStratix V FPGA可实现很多浮点基准测试设计,通过申请即可获得这些设计。这些设计目前正在移植到Arria 10FPGA上,由于采用了硬核浮点DSP模块体系构造,因此可以极大地进步性能。对于缺少硬核浮点DSP的FPGA,使用供应商计算的理论GFL
6、OP数据是不太可靠的。基于逻辑实现的FPGA浮点性能假设声称高于500 GFLOP,都应该对其保持高度疑心。供应商应提供具有逻辑、存储器以及其他资源和时钟速率的FPGA编译报告。更进一步,任何公司声称实现了某种性能,都应提供编译后的设计文件,以支持结果重现。不恰当的GFLOP值不应被认可强调一下,虽然可采用FPGA的可编程逻辑资源实现浮点功能,但实际性能和吞吐量的不确定性导致了一些不实的市场宣传,在选择FPGA时,不能只看厂商自己给出的GFLOP值。在大部分计算机体系构造中,浮点乘法器和加法器采用1:1是有原因的。使用乘法器的应用包括矩阵乘法、FFT、高阶数学函数,例如平方根、三角函数等,以及
7、所有需要进展大量线性代数运算的设计。任何实用的浮点应用都需要大量的浮点乘法器,这也是为何计算机体系构造提供同样数量的乘法器和加法器的实际原因。虽然只使用浮点加法器没有乘法器也能声称实现较高的比率,但这类设计并没有实际意义。有经历的FPGA设计人员都知道,随着所使用的逻辑资源百分比的增加,设计fMAX会下降。一般而言,使用80%以上的逻辑会导致时序收敛的时钟速率大幅度下降。而且,其他功能还需要很多逻辑,这进一步减少了浮点计算可以使用的逻辑资源。此外,对FPGA系列的不同选择也会产生很大影响。假设所选择的FPGA器件本钱高昂,一般会用于ASIC原型开发应用。其时钟速率和触发率都较低,因较高的时钟速率和触发率会极大地增加功耗,超出了器件的VCC电流和功耗才能。而使用针对DSP应用进展优化的FPGA系列那么可以极大地减少GFLOP值。简而言之,含有诸多假设条件的浮点运算测试并不是业界认可的基准测试方法,因此不应使用这一方法获得的数据来比照其他半导体供应商产品所
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学生作文我的梦想征文
- 云南省怒江傈僳族自治州福贡县联考2024-2025学年高一上学期1月期末生物学试题(含答案)
- 国际贸易实务中的结算方式知识考点
- 个人自助图书馆借阅服务合同
- 现代服务业服务质量评价标准知识考点
- 互联网产品策划题
- 办公空间能源消耗表格:能耗统计、节能减排
- 金融投资行业市场波动风险免责声明
- 医学知识视频培训课件
- 工作计划完成情况统计表格
- 2023年版-肿瘤内科临床路径
- 新生儿呼吸窘迫综合征的治疗和医疗护理培训课件
- 产品品质检验流程标准规范模板()
- 五金公司KPI绩效考核全套
- DB12-595-2015医院安全防范系统技术规范
- 五年级下册英语课件-Unit 2 My favourite season B Let's learn 人教PEP版(共15张PPT)
- GB∕T 7260.40-2020 不间断电源系统 UPS 第4部分:环境 要求及报告
- 中学生心理健康诊断测验-MHT量表
- 高边坡施工危险源辨识及分析
- 【李建西医案鉴赏系列】三当归四逆汤治疗颈肿案
- 安全文明施工管理(EHS)方案(24页)
评论
0/150
提交评论