(通信与信息系统专业论文)基于fpga的高速fft处理器的研究.pdf_第1页
(通信与信息系统专业论文)基于fpga的高速fft处理器的研究.pdf_第2页
(通信与信息系统专业论文)基于fpga的高速fft处理器的研究.pdf_第3页
(通信与信息系统专业论文)基于fpga的高速fft处理器的研究.pdf_第4页
(通信与信息系统专业论文)基于fpga的高速fft处理器的研究.pdf_第5页
已阅读5页,还剩82页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

n a n j i n gu n i v e r s i t yo f a e r o n a u t i c sa n d a s t r o n a u t i c s t h eg r a d u a t es c h o o l c o l l e g e o fi n f o r m a t i o ns c i e n c e t e c h n o l o g y r e s e a r c ho nah i g hs p e e df f t p r o c e s s o r w i t hf p g a a t h e s i si n c o m m u n i c a t i o na n di n f o r m a t i o ns y s t e m b y x i ec h o n g a d v i s e d b y p r o fz h e n gb u s h e n s u b m i t t e di np a n i a lf u l f i l l m e n t o ft h er e q u i r e m e n t s f o r t h ed e g r e eo f m a s t e ro fe n g i n e e r i n g d e c e m b e r , 2 0 0 9 、k 一 承诺书 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立 进行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容 外,本学位论文的研究成果不包含任何他人享有著作权的内容。对本 论文所涉及的研究工作做出贡献的其他个人和集体,均己在文中以明 确方式标明。 本人授权南京航空航天大学可以有权保留送交论文的复印件,允 许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的学位论文在解密后适用本承诺书) 作者签名: 日期: , i , k 基于f p g a 的高速f f t 处理器的研究 a b s t r a c t d i g i t a ls i g n a lp r o c e s s i n gi so n eo ft h es u b j e c t se x p a n d i n gr a p i d l yi nt h ef i e l do fi n f o r m a t i o n s c i e n c ed u r i n gt h ep a s ts e v e r a ld e c a d e s a tp r e s e n t ,i th a sa p p l i e de x t e n s i v e l yi nm a n ys u b j e c t ss u c h a sc o m m u n i c a t i o n s ,r a d a r ,s o n a r ,s p e e c ha n di m a g ep r o c e s s i n ga l g o r i t h m s ,p r o g r a m m i n gd s pf o r g e n e r a lp u r p o s e ,a s i ca n dd s pc h i p s e tw i t hi n v a r i a b l ef u n c t i o nf o rs p e c i a lp u r p o s e ,f p g at h a tc a n b ep r o g r a m m e db yu s e r w i t ht h ed e v e l o p m e n to fm i c r o - e l e c t r o n i c st e c h n o l o g y , r e a l i z i n gd i g i t a l s i g n a lp r o c e s s i n gw i t hf p g ad e v e l o p sr a p i d l y , m o r ea n dm o r e ,f p g ai su s e di nt h ea r i t h m e t i co f f f o n t - e n dd i g i t a ls i g n a lp r o c e s s i n gi np l a c eo f a s i ca n dd s p t h et h e o r yo f 同f 1 ra l g o r i t h mh a sb e i n gm a t u r e t i m i n gc o n t r o li sa d i f f i c u l t ya n dk e yt o i m p l e m e n tt h eh 叮,w h i c hs h o u l dm a k et h ew h o l es y s t e mw o r kc o o r d i n a t e l y ,a l s om u s ta c c o r dw i t t l s p e e d f f ti pc o r eh a sb e e nd e v e l o p e da n dm a n u f a c t u r e db yi n t e r n a t i o n a lf a m o u sf p g as u p p l i e r w h i c hh a se x c e l l e n tp e r f o r m a n c eb u ti t sp r i c ei sh i g h i no u rc o u n 打y ,m a n yc o m p a n i e sa n d a c a d e m ya l s oc o n c e n t r a t eo nt h er e s e a r c ha n dd e v e l o p m e n tb a s e do nf p g a ,g a ps t i l le x i s t sc o m p a r i n g t h ep e r f o r m a n c ea n ds p e e da l t h o u g hp r o g r e s sa n dd e v e l o p m e n th a sb e e nm a d e t h i ss u b j e c ti s r e q u e s t e dt ou s ex i l i n xf p g at od e s i g nah i g h - s p e e df f tp r o c e s s o rf o ras a re c h os i g n a ls i m u l a t o r f i r s t ,t h ep a p e re l a b o r a t e st h et h e o r e t i c a lf o u n d a t i o no fd i g i t a ls i g n a lp r o c e s s i n ga n dp r i n c i p l eo f f f t t h e ni tc o m p a r e st h ed i f f e r e n c ea m o n gt h ed i f f e r e n ta l g o r i t h ma n ds e l e c t st h ed i tr a d i x - 4 a l g o r i t h mt od e s i g nt h ef f rp r o c e s s o r o nt h i sb a s i s ,c o m b i n a t i o no fb u t t e r f l yf l o wd i a g r a m ,i t d i s c u s s e ss e v e r a ld i f f e r e n th a r d w a r ea r c h i t e c t u r eo f t h ef f t p r o c e s s o r :s e q u e n c es t r u c t u r e 。p i p e l i n e d s t r u c t u r e ,p a r a l l e la r c h i t e c t u r e ,a r r a ys t r u c t u r e ,c a s c a d es t r u c t u r e i td e s i g n sa ni m p r o v e dc a s c a d e s t r u c t u r et o i n t e g r a t es y s t e mp e r f o r m a n c ea n dh a r d w a r er e s o u r c e s t h ec o m p l e xm u l t i p l i e ri n t r a d i t i o n a lf f rp r o c e s s o ri ss u b s t i t u t e db yt h ex t r e m e d s ps l i c eo fv i r t e x - 4 t h i sm o d u l ew o r k sa t 5 0 0m h z f r e q u e n c y i tc a nc a l t yo nt h eh i g hs p e e dm u l t i p l i c a t i o nc o m p u t a t i o n t h er a d i x - 4b u t t e r f l y u n i ta d o p t s3l e v e l sp i p e l i n es t r u c t u r ea n d4p a r a l l e ld a t aa r eu s e di nf 丌p r o c e s s o r t h ee n t i r ec o r e m o d u l ea p p l i e st h ec o m b i n a t i o no fp i p e l i n ea n dp a r a l l e la r c h i t e c t u r e b e t w e e no n es t e pt oa n o t h e r , t h er e c e i v e rb l o c ka p p l i e st h es t r u c t u r eo fp i n g p a n gr a m t h ec o n t r o l l e ri sd e s i g n e dw i t hv e r i l o g b a s e do nf s m ( f i n i t es t a t em a c h i n e ) ,w h i c hc o n t r o l se f f e c t i v e l ym e m o r i e s ,b u t t e r f l y - c a l c u l a t i o n a n dr o m f i n a l l y ,t h e2 5 6 - p o i n tf f ti ss i m u l a t e d s i m u l a t i o ns h o w st h ec a l c u l a t i o ns p e e da n dt h e r e s u l t sb a s i c a l l yr e a c ht h er e q u i r e m e n t so ft h es y s t e m k e y w o r d s :f p g a ;f f t :x t r e m e d s ps l i c e ;r a d i x - 4 :p i p e l i n e i i i 1 2 相关技术的发展和研究现状3 1 2 1f f t 算法的研究现状3 1 2 2f f t 处理器的研究现状3 1 3 论文工作5 1 4 论文的组织结构5 第二章可编程逻辑器件基础6 2 1 可编程逻辑器件概述6 2 1 1 可编程器件简述6 2 1 2p l d 开发工具7 2 2f p g a 芯片的结构7 2 2 1f p g a 的工作原理7 2 2 2 芯片结构9 2 3f p g a 的开发流程1 2 2 4x i l i n x 公司器件v i t c x - 4 1 3 2 5 硬件描述语言1 4 第三章快速傅立叶变换1 7 3 1 离散傅立叶变换原理17 3 2 离散傅里叶变换算法分析1 8 3 2 1 基2f f t 算法1 8 3 2 2 基4f f t 算法1 9 3 2 3 基8f f t 算法2 1 3 2 4 库利图基( c o o l e y - t u k e y ) 混合基算法2 1 3 2 5 分裂基算法2 2 3 2 6 其他f f t 算法2 4 3 3f f t 算法的比较与选择2 4 3 4f f t 运算中的数据表示与溢出控制2 7 第四章f f t 处理器电路设计2 9 4 1f f t 处理器的基本结构2 9 4 1 1 顺序处理递归结构2 9 4 1 2 并行迭代结构。3 0 4 1 3 阵列结构3 l 4 1 4 级联结构3 2 4 2f f t 处理器的硬件电路设计3 3 4 3f f t 处理器的各模块实现3 4 4 3 1r a m 存储器设计3 4 基于f p g a 的高速f f t 处理器的研究 4 3 2 乒乓存储单元3 7 4 3 3 旋转因子存储单元3 8 4 3 4 蝶形运算处理单元4 2 4 3 4 1x t r e m e d s p 模块4 2 4 3 4 2 全流水线型1 6 x1 6 高速乘法器的设计4 3 4 3 4 3 蝶形单元结构4 5 4 3 5 地址发生器设计4 6 4 3 5 1r a m 地址发生器设计4 7 4 3 5 2r o m 地址发生器设计5 0 4 3 6 控制器的设计5 1 第五章f f t 的f p g a 实现与仿真5 4 5 1 蝶形运算单元的实现与仿真5 4 5 2f f t 处理器的仿真结果和分析6 2 5 - 3f f t 处理器性能分析6 5 第六章结束语6 7 6 1 本文的工作总结6 7 6 2 展望6 7 参考文献6 9 致谢7 2 在学期间的研究成果及发表的学术论文7 3 南京航空航天大学硕士学位论文 图、表清单 图2 1 可编程器件的分类一7 图2 24 输入与门8 图2 3f p g a 芯片的内部结构9 图2 4 典型的i o b 内部结构示意图1 0 图2 5 典型的c l b 结构示意图1 1 图2 6 典型的4 输入s l i c e 结构示意图1 l 图2 7f p g a 开发的一般流程1 3 图3 1 蝶形运算单元18 图3 28 点运算流图1 9 图3 3 基4 蝶形单元运算流图2 0 图3 41 6 点基4 流图2 0 图3 5 分裂基f 1 可算法的第一级流图一2 3 图3 6 分裂基f f t 算法的一个基本蝶形运算一2 3 图3 7 分裂基的结构2 3 图4 1 递归结构2 9 图4 2 单内存型3 0 图4 3 双内存型3 0 图4 4 并行结构3 l 图4 5 阵列结构3 2 图4 6 级联结构3 2 图4 7f f t 处理器的结构3 4 图4 8r a mi p 核配置图3 6 图4 9r a m 模块图3 6 图4 1 0r a m 模块仿真图3 7 图4 1 l 乒乓存储结构图3 7 图4 1 2 乒乓r a m 模块图3 8 图4 1 3 内部结构图3 8 图4 1 4 乒乓存储器仿真图3 8 图4 1 5m a t l a b 程序4 0 图4 1 6m a t l a b 计算结果4 0 图4 1 7 生成的旋转因子4 0 图4 18r o m 配置第一步4 1 图4 1 9r o m 配置最后一步4 l 图4 2 0r o m 模块仿真波形图4 2 图4 2 1d s p 4 8s l i c e 结构4 3 图4 2 2 由两个d s p 4 8s l i c e 组成的d s p4 8 t i l e 4 4 图4 2 31 6 x 1 6 乘法器虚部计算结构4 5 v 基于f p g a 的高速f f t 处理器的研究 图4 2 41 6 x 1 6 乘法器实部计算结构4 5 图4 2 5 蝶形单元结构4 6 图4 2 6 蝶形单元处理器结构4 6 图4 2 7 第一级r a m 地址发生器4 8 图4 2 8 第二级r a m 地址发生器4 9 图4 2 9 第三级r a m 地址发生器4 9 图4 3 0 第四级r a m 地址发生器。4 9 图4 3l 输出级r a m 地址发生器5 0 图4 3 2m o o r e 型有限状态机5 2 图4 3 3m e a l y 型有限状态机5 2 图5 1d s p 4 8 模块5 4 图5 2 实部输出模块5 8 图5 3 虚部输出模块5 9 图5 4 实部总体结构图5 9 图5 5 虚部总体结构图5 9 图5 6 实部仿真图6 0 图5 7 虚部仿真图6 0 图5 8 蝶形单元r t l 级电路图6 1 图5 9 蝶形单元仿真图6 1 图5 1 0f f t 整体模块图6 2 图5 1 1m 棚,a b 输入程序6 3 图5 1 2m a t l a b 计算结果6 3 图5 1 3 输入数据x 6 3 图5 1 4 经过f f t 变换的虚部输出6 3 图5 1 5 经过f f t 变换的实部输出6 4 图5 1 6f f t 变换仿真波形“ 表1 1f p g a 与d s p 处理器运算速度的比较2 表2 1 实际逻辑电路与l u t 的比较8 表2 2v i r t e x - - 4 系列f p g a 主要技术特征1 4 表3 1 运算量与变换点数n 的关系2 5 表3 2 各算法的实数乘法和实数加法次数2 5 表3 3 数的表示。2 8 表4 1 第一级r a m 顺序4 8 表4 22 5 6 点旋转因子变化规律5 0 表5 1d s p 4 8 s i i c e 端口列表和定义5 5 表5 2f f t 处理器输出值与m a t l a b 计算值的比较6 4 表5 3 一个蝶形运算单元的消耗6 5 表5 4 整个系统的消耗6 6 表5 5x i l i n xh 可口核性能指标6 6 文 f f t f i r f p g a f p l a g a l h d l i o b l u t p f a p l d p r o m r a m r o m s a r s o c s o p c s r a m f a s tf o u r i e rt r a n s f o r m f i n i t ei m p u l s er e s p o n s e f i e l dp r o g r a m m a b l eg a t ea r r a y f i e l dp r o g r a m m a b l el o g i ca r r a y g e n e r i ca r r a y l o g i c h a r d w a r ed e s c r i p t i o nl a n g u a g e i n p u to u t p u tb l o c k l o o k u p t a b l e p r i m ef a c t o ra l g o r i t h m p r o g r a m m a b l el o g i cd e v i c e p r o g r a m m a b l er e a do n l ym e m o r y r a n d o ma c c e s sm e m o r y r e a do n l ym e m o r y s y n t h e t i ca p e r t u r er a d a r s y s t e mo nc h i p s y s t e m o np r o g r a m m a b l ec h i p s t a t i cr a n d o ma c c e s sm e m o r y 专用集成电路 可配置逻辑块 互补性氧化金属半导体 坐标旋转数字计算机 复杂可编程逻辑器件 离散傅里叶变换 频域抽取算法 时域抽取算法 数字信号处理器 电子设计自动化 可擦除的可编程逻辑器件 快速傅立叶变换 有限冲激响应 现场可编程门阵列 现场可编程逻辑阵列 通用阵列逻辑 硬件描述语言 输入输出块 查找表 素因子 可编程逻辑器件 编程只读存储器 随机存取存储器 只读存储器 合成孔径雷达 片上系统 片上可编程系统 静态存储器 南京航空航天大学硕士学位论文 1 1 研究背景 第一章绪论 在现代科学技术领域里,电子信息系统的应用范围极为广泛,主要有通信、导航、雷达、 声纳、地震勘探、医学仪器和射电天文等等。在短短几十年的时间里,这些系统几经更新换代, 发展极其迅速。系统的发展过程常常和信息的利用程度分不开,而信息的利用程度又和信号与 信息处理技术的发展紧密相连。2 0 世纪6 0 年代以来,微电子集成电路技术、工艺迅猛发展, 为复杂信号处理的实现提供了可能,从而将信号处理的发展推向高潮。从此,信号处理的研究 不仅限于一般理论和方法的探讨,更多侧重于实现方面,新的实现方法与算法的成果层出不穷。 在此基础上发展起来的新一代系统,其优化和自适应性能大大提高,早期系统已无法与其相提 并论。现代信号处理研究的一个特色是理论与实用研究同步进行,既重视基础理论的研究,又 1 1 重视实际实现和应用的研究”。 随着数字技术与计算机技术的发展,数字信号处理技术已深入到各个学科领域,其应用又 是多种多样的,但数字信号处理基本上从两方面来解决信号的处理问题:一个是时域方法,即 数字滤波;另一个是频域方法,即频谱分析。处理的任务大致分为三类: 卷积:用于各种滤波器,对给定频率范围的原始信号进行加工( 通过或滤除) 来提高信噪 比: 相关:用于信号比较,去除随机事件而放大重复的信号: 变换:用于分析信号的频率内容,寻找特征“指纹”。 其中,d f t ( 离散傅立叶变换) 和卷积是信号处理中两个最基本也是最常用的运算,它们 涉及到信号与系统的分析与综合这一广泛的信号处理领域。由数字信号处理的基本理论可知, 卷积可以转化为d f t 来实现;此外,各种系统的分析、设计和实现中都会涉及到d f t 的计算 问题。所以,d f t 在各种数字信号处理中起着核心作用,而d f t 的快速算法f f t ( 快速傅立叶 f 1 变换) 就成为数字信号处理的最基本技术之一,对f f t 及其实现方式方法的研究是很有意义的。 目前,f f t 已广泛应用在频谱分析、匹配滤波、数字通信、图像处理、语音识别、雷达处 理、遥感遥测、地质勘探和无线保密通讯等众多领域。在不同应用场合,需要不同性能要求的 f f t 处理器。在很多应用领域都要求f f t 处理器具有高速度、高精度、大容量和实时处理的性 r 2 能1 。因此,如何更快速、更灵活地实现f f t 变得越来越重要。 在过去很长一段时间,d s p 处理器是d s p 应用系统核心器件的唯一选择。尽管d p s 处理 器具有通过软件设计能适用于实现不同功能的灵活性,但面对当今速度变化的d s p 应用市场, 特别是面对现代通信技术的发展,d s p 处理器在处理速度上早已力不从心。面向d s p 的各类专 基于f p g a 的高速f f l r 处理器的研究 用集成电路( a p p l i c a t i o ns p e c i f i ci n t e g r a t e dc i r c u i t ,a s i c ) 芯片虽然可以解决并行性和速度的 问题,但其高昂的开发费用、耗时的设计周期和不灵活的纯硬件结构,使得d s p 的a s i c 解决 方案日益失去其实用性”。 近几年,随着现场可编程门阵列f p g a ( f i e l dp r o g r a m m a b l eg a t e a r r a y ) 技术的迅速发展, 采用f p g a 芯片来实现f f t 已成为必然趋势p 1 。与d s p 相比,f p g a 实现数字信号处理的主要 优越性有: ( 1 ) f p g a 的高度并行处理能力。f p g a 相对d s p 芯片的最大优势是其内在的并行机制, 即利用并行架构实现数字信号处理的功能。这一并行机制使得f p g a 特别适合于完成滤波这样 重复性的d s p 任务。对于高度并行的数字信号处理任务来说,f p g a 性能远超通用d s p 处理器 的串行执行架构r 。 下面以完成乘累加速度最快的t i 的c 6 x 和c 5 5 x 系列【7 】【8 】处理器以及f p g a 完成同一算法 ( 8 位2 8 8 阶f i r 滤波器) 进行比较。结果见表1 1 。 器件选择 t m $ 3 2 0 c 5 5 0 9t m $ 3 2 0 c 6 4l6a l r e r ae p 2 s 6 0 阶数 2 8 82 8 8 2 8 8 乘累加器数 18 2 8 8 内部时钟速度( m h z ) 2 0 06 0 02 5 0 所需时钟周期数 2 8 83 61 所需时问( 岬) 1 4 40 0 6 0 0 0 4 每秒乘加( m a c s ) 0 24 8 7 2 由表1 1 可见,e p 2 s 6 0 型的f p g a 的乘累加速度最快【9 1 ,每秒为7 2 千兆个乘加( m a c ) 操作,是t m s 3 2 0 c 6 4 1 6 的1 5 倍,t m s 3 2 0 c 5 5 0 9 的3 6 0 倍。而f p g a 中采用的内部时钟速度 还不到t m s 3 2 0 c 6 4 1 6 的l 2 。此外f p g a 中有数以万计的逻辑宏单元可供随意组合成各种类型 的硬件电路功能模块,能够完成单片c 6 x 几乎无法完成的运算任务。 ( 2 ) f p g a 具有重配置能力。d s p 处理器可以通过加载不同的软件来实现不同的功能,但 这相对于a s i c 系统十分灵活的功能并没有实用价值。因为仅仅通过对d s p 处理器加载不同的 程序代码,并不能有效地改变d s p 系统的诸如吞吐量、数据总线宽度、d s p 加速模块的数量与 功能。这是因为这一切必须靠改变硬件结构、硬件功能才能实现。 由于不同的配置文件下载到f p g a 后,能获得不同的硬件结构和硬件功能,因此基于f p g a 的系统具有良好的系统结构可重配置特性。 ( 3 ) 在高速、高性能要求的应用场合,使用f p g a 方案的系统成本、功耗、集成度比使 用d s p 方案更优越。由于c p u 的灵活性,对于低速、低吞吐量和大量复杂运算的情况,d s p 处理器方案的系统成本要比f p g a 系统低很多,而且此方案具有不可替代性。然而在高端应用 领域,大多数的情况中不但需要尽可能高速、高性能的d s p 处理器,而且多片d s p 连用的情 2 南京航空航天大学硕士学位论文 况也十分普遍。在多片d s p 系统中,每一片d s p 处理器都必须配置完整的辅助器件才能正常 工作,如数据r a m 、程序r a m 和r o m 、f i f o 、双口r a m 、f p g a c p l d 辅助接口器件等等。 该系统的成本将成倍提高,功耗、集成度与可靠性等性能指标也都将不同程度地下降,但是如 果使用f p g a 来构成d s p 系统,在d s p 处理器系统中存在的问题将迎刃而解。目前拥有大规 模逻辑资源的f p g a 完全能容纳必须由多片d s p 处理器构成的系统,从而使得单片f p g a 构成 的系统在各项技术指标大幄度提高的前提下,成本和功耗大幅度下降,集成度与可靠性则大幅 度提高。 1 2 相关技术的发展和研究现状 1 2 1f f t 算法的研究现状 离散傅立叶变换( 简称d f t ) 可以使数字信号处理在频域采样按数字运算的方法进行。快 速傅立叶变换( 简称f f t ) 则通过将长序列的d f t 计算分解成短序列的d f t 计算,使运算量 得到明显减少。f f t 算法从出现到现在已有四十多年的历史,其理论已经趋于成熟了。一般将 f f t 的算法归为两类: 一类是将d f t 转变为卷积,利用卷积的快速算法计算d f t ,其代表是线性调频z 变换算 法、素数d f t 算法,前者可将n 点d f t 转换成线性卷积,然后借助于快速卷积算法来计算d f t , 而后者在n 为素数时,可将n 点的d f t 转换成n l 点的循环卷积。 另一类算法是快速递归型算法,将一维的d f t 分解为容易计算的二维或多维d f t ,此过程 不断重复最终将d f t 分解为简单的几个点之间的交叉运算。1 9 6 5 年库利( j w c o o l e y ) 和图基 ( j w t u k e y ) 提出f f t 快速算法以来,f f t 算法已有了很大的发展【1 0 卜【1 2 1 。 从算法理论上看,f f t 算法主要有两个方向【13 1 : ( 1 ) 组合数算法,变换点数n 一般为2 的整数次幂。典型算法有基2 算法,基4 算法, 基8 算法,实数因子算法,分裂基算法,以及混合基算法。这类算法是利用系数的周期性和对 称性,使长序列的d f t 分解成更小点数的d f t ,从而大大减少运算工作量。 ( 2 ) 以w i n o g r a d 为代表的一类傅立叶交换算法( w i n o g r a d f o u r i e r t r a n s f o r m a l g o r i t h m , 简 称w f t a 算法,p r i m ef a c t o r a l g o r i t h m ,简称p f t a 算法) 。此类算法以数论以及近世代数知识 进行下标映射,去掉级间旋转因子,从而减少运算量。 从运算量上看,第二类算法乘加次数较少。但控制复杂,且不具有规则性,不易于流水线 实现。第一类算法中的分裂基算法由于其特殊性,综合了基2 基4 算法的优点,具有相对较少 的乘加次数。但其数据流向不规则,也不易于流水线实现和同址运算。因此在工程应用中的专 用f f t 处理器的实现上,以基2 ,基4 算法的居多p 。 1 2 2f f t 处理器的研究现状 3 基于f p g a 的高速f f r 处理器的研究 f f t 处理器是f f t 算法的硬件实现,针对其硬件实现方案,主要有三种途径”: ( 1 ) 利用通用数字信号处理芯片来实现( d s p 处理器) ; ( 2 ) 利用专用f f t 芯片或用户定制的专用集成电路来实现( a s i c ) ; ( 3 ) 利用可编程逻辑器件来实现( 以f p g a 为代表) 。 现在,以f p g a 芯片生产厂商为主的公司在基于f p g a 设计f f f 的综合研究方面处于领先 地位,而且由于f p g a 芯片生产厂商对本厂生产芯片性能上的了解,设计的f f r 处理器可以最 大限度的发挥芯片的性能。f p g a 厂商x i l i n x 公司和a l t e r a 公司都研制了f f ti p ( i n t e l l e c t u a lp r o p e r t y ) 核,性能非常优越。比如:a l t e r a 公司推出新的f f ti p 核,全面支 持a l t e r a 公司的最新器件,使用此f f t 口核计算1 6 位1 0 2 4 点数据,在3 3 4 m h z 外频时钟 下仅需要1 0 2 p s 。f f t 口核通常专为要求高可靠性的应用场合而设计,如雷达、地面和高空通 信、声学、石油和医疗信号处理等,且价格十分昂贵,难以在基层应用领域普及。 国内外学者在用f p g a 实现f f t 处理器方面做了大量的工作,并取得了良好的效益。我国 的f p g a 技术起步较晚,但是进入2 1 世纪后,发展非常迅速。目前不少大学及研究所都使用 f p g a 芯片设计开发具有自主知识产权的f f r ,但是由于起步较晚,基础薄弱,所设计的f f 叩 无论是速度,还是可扩展性上都与国外有一定差距。 2 0 0 2 年罗雪苟、詹阳详细的分析了f f t 使用f p g a 实现的几种方法,并对于各种方法的优 劣进行了讨论【1 5 1 。2 0 0 3 年连冰 1 6 1 在论文里也对此作了详细的阐述。 1 9 9 9 年徐公权等把f f t 蝶形设计和c o r d i c 算法联系起来,在c o r d i c 算法的基础上完 成单个蝶形单元,对于固定n ,都可预先设计制造好印刷电路板,只要把一批c o r d i c 蝶形芯 片安装上即可,建立在c o r d i c 算法基础上的蝶形运算器,并在此基础上构成的f f r 阵列式计 算,实现了f f t 算法的潜在平行性”。2 0 0 4 年李成诗等也利用c o r d i c 算法上实现实时定点 的f f t ,设计基于基4 时序抽取算法,采用双端口内置r a m 和流水线串行工作方式,设计针 对2 5 6 点2 4 位长数据进行运算,完成一次运算约为1 2 p s 1 e l 。 1 9 9 9 年刘朝晖、韩月秋以及2 0 0 2 年党向东、孙阳、韩泽耀等也对使用f p g a 实现h 吓进 行了研究。他们都是使用按时间抽取的基4 算法,部分单元或者全部单元采用流水方式保证系 统的速度,使存取数据、计算旋转因子和蝶形运算等操作协调一致【1 9 卜【2 2 1 。其中党向东设计的 f f t 处理器完成2 5 6 点f f t 计算需要2 6 p s i 2 0 l ,孙阳以及韩泽耀设计的f f t 处理器完成1 0 2 4 点f f t 计算均需要1 2 8 j l s 2 1 2 2 。 2 0 0 3 年韩颖等采用x l i n x 公司的f p g a 设计了f f t 处理器。采用流水方式对复数数据实现 了加窗、f 兀、求模平方三种运算。整个设计使用双基2 蝶形运算单元,采用流水线方式尽量 避免瓶颈的出现,提高了系统时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论