dsp器件的结构和应用

上传人：1*** IP属地：广东上传时间：2023-10-26 格式：DOCX 页数：5 大小：42.39KB 积分：12 举报 版权申诉

全文预览已结束

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

dsp器件的结构和应用

数字处理器（ps）和数字信号处理器（pd）的缩写是pd，其内涵是不同的。数字信号处理侧重于理论、算法及软件实现,有一些典型算法,如快速傅立叶变换(FFT),已经成为衡量DSP器件运算速度的一个指标。要实现这些算法,特别是要实时地完成某些算法就需要特殊的硬件支持,这就是数字信号处理器。DSP技术能够得到广泛的普及和应用,在很大程度上得益于DSP器件性能的提高和价格的下降,而DSP技术的应用又对DSP器件的性能的进一步改进起促进作用。1dsp器件的发展世界上第一颗DSP芯片是美国德州器(Ti)公司于1982年推出的第一代产品:TMS32010。经过十几年的发展,DSP器件在高速度、可编程、小型化、低功耗等方面都有了长足的发展,单片DSP芯片最快每秒可完成16亿次(1600MIPS,每秒1600兆次指令)的运算,生产DSP器件的公司也不断壮大,目前,市场占有率前四名依次为:TexasInstruments、Lucent、AnalogDevice、Motorola,涉足这一领域的公司还有AT&T、Fujitsu、Harris、IDT、INMOS、NEC、OKI、Samsung。由于各DSP厂家的竞争及生产工艺的不断提高,使得DSP器件的价格不断下降,且性能不断提高,这些年来基本上按照这样一种规律发展:约每18个月性能提高一倍,而价格下降一半。DSP器件应用面从起初的局限于军工,航空航天等领域,扩展到今天的诸多电子行业及消费类电子产品中。本文以Ti公司的产品为例,向读者介绍一下DSP器件的结构和应用。图1给出了Ti公司DSP产品的发展概貌。′C1X、′C2X、′C2XX、′C5X、′C54X、′C62X等系列是定点运算指令系统的DSPs;′C3X、′C4X、′C67X等系列是浮点运算指令系统的DSPs;′C8X等系列是多DSPs集成系统;′AV7100、′AV7110等系列是用于视频、音频领域的专用数字压缩产品。TMS320C25是业内人士熟悉的一颗芯片,国内于1984年引进消化,1985年就研制出收稿日期∶1999−03−26¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯了相应的开发系统。TMS320C2XX系列:TM320C2XX是Ti公司继TMS320C2X和TMS320C5X之后推出的一种低价格、高性能16位定点运算DSP。其CPU接近于TMS320C25,但时种速率提高了、指令集更为丰富和优化、片内外设向TMS320C5X靠拢,可以将其视为TMS320C5X的精简版。TMS320C2XX的性价比很高,目前已成为高档单片机的理想替代芯片,源码向下兼容TMS320C25指令,向上兼容TMS320C5X指令;1995年开发成功,速度为20～40MIPS,Ti已将其作为未来低成本定点运算指令芯片的核。其中,′C24X系列内CPU允许使用较高级算法,从而提高系统性能,减少系统元件数,在变频控制等领域具有广泛的应用前景。TMS320C3X系列:32位浮点运算DSP,速度为30～60MFLOPS(millionfloating-pointoperationspersecond,每秒多少兆次浮点操作),16.67～30MIPS,支持高效C编译器,并行指令集。TMS320C4X系列:高效并行处理器,高达488MB/S的数据吞吐量,速度为40～80MLOP,20～40MIPS,源码向下兼容′C3X指令。TMS320C5X系列:高性能定点运算DSP,速度为20～50MIPS,源码向下兼容?′C1X、′C2X、′C2XX指令,具有灵活的电源管理结构,有低电压工作芯片。其中,′C54X系列,成本低、性能高、速度达66MIPS,可以工作于3.OV,3.3V,or5.OV,特殊的结构满足了移动通信和户外无线应用等场合。TMS320C6X系列:速度高达1600MIPS(每秒16亿次操作),满足极高性能要求场合,其中,′C62X是定点运算系列,′C67X是浮点运算系列。TMS320C6X系列:集成了多达四个32位高性能的DSP和一个32位RISC(精简指令集)、可以完成100MFLOPS的浮点处理器。具有一个可以胜任400MB/S传输数率的传输控制器、50K的在片RAM、两个帧计数器。TMS320AVXXX系列:高速、专业应用数字压缩产品,用于音、视频压缩和回放等领域,例如视频会议、数字广播、高清晰度电视、图形工作站,以及其他支持国际压缩标准的产品。2sd工具的内部结构和性能DSP器件的生命力主要取决于它在体系结构上不同于MCU的特点。以浮点运算指令系统′C30系列芯片为例,图2给出了DSP的体系结构。2.1dsp的基本原理微控制器MCU一直存在两种基本结构:冯诺伊曼(VonMeumann)结构和哈佛(Harvard)结构,冯诺伊曼结构具有单一总线,PRAM或DRAM都映射到同一地址空间,总线宽度与CPU类匹配,其取指令,取数据都是通过一条总线完成的。因此必须分时进行,在高速运算时,往往在传输通道上会出现瓶颈效应。哈佛结构具有独立的程序总线和数据总线,DSP内部一般采用的是哈佛(Harvard)体系结构,它在片内至少有四套总线:程序的数据总线,程序的地址总线,数据的数据总线和地址的数据总线。这种分离的程序总线和数据总线,可允许同时获取指令字(来自程序存贮器)和操作数(来自数据存贮器),而互不干扰,这意味着在一个机器周期内可以同时准备好指令和操作数,有的DSP芯片内部还包括有其它总线,如DMA总线等,可实现单周期内完成更多的工作。对DSP来说,内部总线本身就是个资源,总线越多,可以完成的功能就越复杂。2.2dsp的连续式组合DSP内部一般都集成多个处理单元,如硬件乘法器(MUL)、累加器(ACC)、算术逻辑单元(ALU)、辅助算术单元(ARAU)以及DMA控制器等。它们都可以在一单独的指令周期内执行完计算任务,并且这种运算往往是同时完成的,例如,当完成一个乘法和累加的同时,辅助算术单元已经完成了下一个地址的寻址工作,为下一次的运算做好了充分的准备。因为DSP可以完成连续的乘加运算,而每一次的运算都是单周期的,这种结构特别适用于滤波器的设计,如IIR和FIR。DSP的这种多处理单元见结构还表现在将一些特殊算法作成硬件,以提高速度,典型的有FFT的位反转寻址,语音的A律、μ律算法等。2.3减少指令周期的时间要执行一条DSP指令,需要完成取指令、解码、取操作数和执行等几个阶段:DSP的流水线结构是指它的这几个阶段在程序执行过程中是重叠的,即在执行本条指令的同时,下面的三条指令已依次完成了取操作数、解码、取指令的操作,这样就将指令周期的时间降低到最小值。正是利用这种流水线机制,保证DSP的乘法、加法以及乘加运算可以在一单周期内完成,这对提高DSP的运算速度具有重要意义,特别是当设计的算法需要连续的乘加运算,这种结构的优越性就得到了充分的发挥。也正是这种结构,决定了DSP的指令基本上都是单周期指令,衡量一个DSP的速度也基本上是以单周期指令时间为标准,其倒数就是MIPS。2.4硬件骑法器可以说几乎所有的DSP内部都有硬件乘法器,硬件乘法器的功能是在单周期内完成一次乘法运算,是DSP实现快速运算的重要保障。2.5j项目接口的开发随着DSP芯片速度的提高,传统的并行仿真方式已越来越显得困难。1991年IEE1149.1(即JTAG接口)标准的公布满足了IC制造商的措施需求,也给ASIC、MCU、DSP、PLD、FPGA等的用户带来方便。十万门以上的IC一般都集成JTAG接口,1993年IEEE1149.5对JTAG接口标准作了修正,为5线接口。在片JTAG接口为用户对DSP的仿真提供了更捷的串行工作方式。2.6dsp器件的选用引导加载是指器件复位时执行一段引导程序,一般用于从端口(异步串口、I/O口或HPI主机接口)或EPROM/FLASH等非易失性存储器中加载程序至高速RAM中运行。人们所以要采用DSP,主要目的是选用其高速运算能力,然而,目前市场上通用的非易失性存储器速度都比较慢,少数高速器件则容量有限、价格昂贵;与此同时,高速、大容量静态RAM的价格已下降很多。因此,针对高速DSP来讲,将存放在慢速非易失性存储器中的程序加载到高速静态RAM中运行的工作方式已是制造商必须提供的一种资源。具备了以上特点,这颗芯片就具有了高速运算的能力,我们可以认为它就是一个DSP器件了。目前,DSP器件很多,选择时需要综合考虑性能、价格、开发周期及定货期等多方面。3dsp与mpu、rtos的结合微控制器MCU,通俗的称呼是单片机,它与微处理器MPU是微机技术的两大分支。DSP是MCU的一种特殊变形。MPU的发展动力是人类对无止境的海量数值运算的需求,速度越来越快。MCU的发展是为了满足被控制对象的要求,向高可靠性、低功耗、低成本发展。DSP以处理速度快见长,且主要解决数字信号处理方面的算法的实现问题,因此独立于MCU之外而得到迅速发展。1)DSP的普及为系统设计人员提供了一种很好的选则。就目前的技术现状,将DSP与MCU结合起来设计系统是一种好的办法:将DSP设计成一个高速部件,完成专门算法,而MCU负责管理外围并协调DSP工作。2)MPU适宜于相同管理、以条件判断为主的应用及以软件管理的操作系统为核心的产品,MPU的设计侧重于不妨碍程序的流程,以保证操作系统支持的功能及转移预测功能等,而DSP的设计侧重于保证数据的顺利通行,结构尽量简单。3)DSP与实时操作系统(RTOS)的结合:DSP系统设计一般走两个极端,一种是单一的DSP系统设计,用于Modem、移动电话或变频空调等。另一种是高性能的多处理器DSP系统设计,用于大批输入流的实时处理。对于多DSP系统设计,有四个可能影响性能的主要因素:①通过系统的数据流(流水线或星形);②主系统总线(VME或PCI总线);③RTOS的性能,在多DSP系统中,RTOS在每个DSP上运行于嵌入式模式,RTOS提供系统所需要的数据流和处理性能,同时又允计主处理器继续在其固有模式(Win98/NT/Solaris)中操纵整个系统;④处理来自A/D阵列的输入流的接口设计,最好使用A/D转换子系统与系统其余部分有效隔离。4sd工具的应用和开发1其他工业控制系统a.经典算法:FFT、FIR/IIR、相关等;b.现代算法:AR、ARMA、卡尔曼滤波、自适应滤波等;c.快速处理:实时控制、机器人视觉、电机控制(如变频空调)等;d.图形图像处理:三维动画、图像传输、图像压缩、电话会议、多媒体、图像识别等;e.语音处理:语音压缩编码、语音识别、语音信箱等;f.仪器、仪表:医疗、数字滤波、谱分析等;g.通信:Modem、程控交换机、可视电话、蜂窝站、ATM、移动电话(如手机)等;h.民用:数字音响、数字电视、多媒体等;i.军用:雷达、声纳、通信等。2dsp的应用测量DSP作为今后世界数字化技术发展的核心部件,将对许多行业包括人们的日常生活起到巨大的影响,反过来,人们的应用需求又促进DSP的进一步发展。并行芯片ss/dsp分析DSP的出现就是为了追求速度,目前它仍然保持这种发展态势,这里值得一提的是两个典型的DSP器件,Ti公司在90年代中后期推出的TMS320C6X系列,这类芯片包括定点运算′C62X和浮点运算′C67X两种,其中首先推出是定点产品:TMS320C6201,这颗芯片片内有8个并行的处理单元,分为相同的两组,由于采用甚长指令字(VLIW)方式,芯片最高可以完成每秒16亿次的定点运算,执行一次1024点的FFT运算约为66微秒。这一芯片的推出,尤其是后续推出的廉价的类似功能的芯片,将在通信、雷达信号处理、医疗成象等领域获得广泛的应用。另一个是AD公司推出的超级哈佛结构(称为SHARCHARVARD)的DSP,其典型产品为ADSP2106X系列,这类产品不仅仅是对DSP的内部结构作了改进,使DSP在单一周期内完成更多的工作,而且它扩展了I/O能力,可以很容易地实现多个芯片的并行运算。这类芯片1024点FFT时间约为90微秒。这两类DSP都是对现有的结构进行了改进,极大地提高了速度,可以说这些结构上的变化代表了高速DSP的

人人文库> 全部分类> 专业文献 > 学术论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

dsp器件的结构和应用

文档简介

温馨提示

最新文档

评论

dsp器件的结构和应用

文档简介

温馨提示

最新文档

评论

相关文档