DSP芯片特点及选择_第1页
DSP芯片特点及选择_第2页
DSP芯片特点及选择_第3页
DSP芯片特点及选择_第4页
DSP芯片特点及选择_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、6 DSP 芯片特点及选择DSP(Digital Signal Proceccing) 芯片也称为数字信号处理器 , 它是仿真系统硬件构成的核心器件 , 它的性能对仿真功能的实现非常 重要。只有选定3DSP芯片,才能设计其外围电路及系统的其它电路。 总的来说,DSP芯片的选择应根据仿真系统的规模,运算速度、存贮 容量而定,但一般来说,选择 DSP芯片时应考虑到如下因素2(1)DSP芯片的运算速度。运算速度是 DSP芯片的一个最重要的 性能指标,也是选择DSP芯片时所需要考虑的一个主要因素。DSP芯 片的运算速度可以用以下几种性能指标来衡量:a. 指令周期(执行一条指令所需的时间) 。b. MA

2、C寸间(一次乘法加上一次加法的时间)。c. FFT执行时间(运行一个N点FFT程序所需的时间)。d. MIPS(每秒执行百万条指令)。e. MOP(S 每秒执行百万次操作) 。f. MFLOPTS每秒执行百万次浮点操作)。g. BOPS(每秒执行十亿次操作)。(2)DSP芯片的价格。(3)DSP芯片的硬件资源。(4)DSP芯片的运算精度。(5)DSP芯片的开发工具。(6)DSP芯片的功耗。般而言,定点DSP芯片的价格较便宜,功耗较低,但运算精度稍低。而浮点DSP芯片的优点是运称精度高,用C语言编程方便,开发周期短,但价格和功耗相对较高。6.1 DSP芯片的特点和种类DSP芯片是一种特别适合于进

3、行数字信号处理运算的微处理器, 其主要应用是实时快速地实现各种数字信号处理算法,一般具有如下 主要特点2:(1)在一个指令周期内可完成一次乘法和一次加法;(2)程序和数据空间分开,可以同时访问指令和数据;(3)片内具有快速RAM通常可通过独立的数据总线在两块中同时访问;(4)具有低开销或无开销循环及跳转的硬件支持;(5)快速的中断处理和硬件I/O支持;(6)具有在单周期内操作的多个硬件地址产生器;(7)可以并行执行多个操作;(8)支持流水线操作,使取指、译码和执行等操作可以重叠执行。从1978年出现的第一个单片DSP以来,DSP芯片在这20几年来得 到了高速发展,DSP芯片的应用也越来越广泛,

4、根据其用途可分为通 用型DSP芯片和专用型DSP芯片;按基础特性分为静态DSP芯片和一 致性DSP芯片;按数据格式分为定点 DSP芯片和浮点DSP芯片。美国德州仪器公司(Texas Instruments,简称TI)推出的TMS系列DSP芯片已经成为当今世界上最有影响的 DSP芯片2 , TI公 司在1982年推出第一代 DSP芯片TMS320K > TMS320C1系列,随 后推出第二代 DSP芯片TMS320*、TMS320C2系列,第三代DSP芯 片TMS320C3系列,第四代DSP芯片TMS320C4系列,第五代DSP芯 片 TMS320C5系列,第六代 DSP芯片 TMS320

5、C6系列。6.2 TMS320系列DSR芯片可编程DSP芯片是一种具有特殊结构的微处理器,为了达到快速进行数字信号处理的目的,DSP芯片一般都具有程序和数据分开的总 线结构、流水线操作功能、单周期完成乘法的硬件乘法器以及一套适 合数字信号处理的指令集。6.2.1 TMS320系列DSP芯片的基本结构。TM320系列DSP芯片基本结构包括:(1)哈佛结构;(2)流水线 操作;(3)专用的硬件乘法器;(4)特殊的DSP指令;(5)快速的指 令周期。这些特点使得TMS32C系列DSP芯片可以实现快速的DSP运算,并使大部分运算(例如乘法)能够在一个指令周期内完成。由于TMS320 系列DSP芯片是软

6、件可编程器件,因此具有通用微处理器具有的方便 灵活的特点。(1)哈佛结构哈佛结构是不同于传统的冯诺曼(VonNeuman结构的并行体系结构,其主要特点是将程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编 址,独立访问。与两个存储器相对应的是系统中设置了程序总线和数 据总线两条总线,从而使数据的吞吐率提高了一倍。为了进一步提高运行速度和灵活性,TMS320系列DSP芯片在基 本哈佛结构的基础上作了改进,一是允许数据存放在程序存储器中, 并被算术运算指令直接使用, 增强了芯片的灵活性; 二是指令存储在 高速缓冲器(Cache)中,当执行此指令时,不

7、需要再从存储器中读 取指令,节约了一个指令周期的时间。( 2)流水线与哈佛结构相关,DSP芯片广泛采用流水线以减少指令执行时间,从而增强了处理器的处理能力。TMS320系列处理器的流水线深度从 26级不等。也就是说,处理器可以并行处理 26条指令,每条指令 处于流水线上的不同阶段。( 3)专用的硬件乘法器TMS32C系列DSP芯片中具有一个专用的硬件乘法器,用 14条 指令就能完成一次乘法和一次加法运算, 因此,在一个指令周期内可 完成乘法运算, 而在通用的微处器中, 乘法指令是靠一系列加法来实 现的,因此,TMS32(系列DSP乘法速度远远高于通用微处理器。(4)特别的DSP指令利用DSP的

8、特殊指令可以将多条指令才能完成的功能用一条指 令来完成,这样可大大提高运算速度。( 5)快速的指令周期哈佛结构、流水线操作、专用的硬件乘法器、特殊的DSF指令再 加上集成电路的优化设计,可使 DSP芯片的指令周期在200ms以下。6.2.2 几种TMS32C系列DSP芯片的比较(1) 第一代TMS32C系列DSP芯片TMS320C1是定点DSP芯片,采用二级流水线,其主要特点如下:指令周期:160 ns/200ns/280ns片内 RAM 144 字/256 字(TMS320C15/E15/C17/E17片内 ROM 1.5K 字/4K 字(TMS320C15/C17* 4K字片内程序 EPR

9、OMTMS320E15/E17.4K字外部全速存储器扩展*并行乘法器:乘积为32位.桶形移位器:将数据从存储器移到 ALU*并行移位器允许文本交换的4X 12位堆栈.两个间接寻址的辅助寄存器* 双通道串行口( TMS32011 TMS320C17/E1)* 片内压扩硬件(TMS32011 TMS320C17/E1)* 协处理器接口( TMS320C17/E1)器件封装:40脚双列直插(DIP) /44脚塑封(PLCC(2) 第二代TMS32C系列DSP芯片TMS320C2系列是定点 DSP芯片, 采用三级流水线,其主要特点如下:* 指令周期:100ns/120ns/80ns*片内掩膜ROM 4

10、K字片内RAM 544字,分B0、B1和B2三块*程序和数据空间均为64K字具有8级硬件堆栈、8个辅助寄存器.具有全静态双缓冲串行口,可与许多串行器件直接接口*与低速片外存储器通信的等待状态插入采用HOLD操作的DMA.FFT变换用的比特反转寻址«扩展精度算术和自适应滤波支持从外部存储器全速执行的 MAC/MAC指令具有在多处理器之间进行同步的能力,支持多处理器共享存储器 1-8umCMO工艺,68 脚 PGA或 PLCC封装(3) 第三代TMS320系列DSP芯片TMS320C3)系列芯片是浮点 DSP芯片,采用四级流水线。其主要特点如表 6-1表6-1三种TMS320C3芯片的比

11、较特征TMS320C30TMS320C31TMS320C32指令周期50/60/74ns33/40/50/60/74ns33/40/50ns数据/程序总线主总线STRB 32位数据,24位地址扩展总线IOSTRB 32位数据,13位地址STRB 32位数据,24位地址STRB0 8/16/32 位STRB 1 8/16/32 位 IOSTRB 32 们内部RAM2K字2K字512字串行I/O 口2个串行口1个串行口1个串行口用户程序、数据ROM4K字/16K字节无无DMA空制器单通道单通道双通道程序和数据存储器 宽度32位32位程序16/32位可选数据8/16/32位可选外部中断触发电平触发电

12、平触发电平/边沿可选中断矢量表地址固定固定用户可重定位程序引导无用户可选用户可选40/32浮点/整数有有有乘法器整数/浮点算术逻辑单元ALU有有有两个辅助寄存器算 术单元(ARAU(和ARAU1有有有(4)第四代TMS320系列DSP芯片TMS320C4)系列芯片是浮点 DSP芯片,采用五级流水线,其主要特点如下:.具有6个用于处理器间高速通信的通信口,每个口的最大数 据吞吐量达20Mbyte/s的异步传输速率。 6个DMA通道实现了 I/O操作与CPL操作的并行化。 CPL处理能力达275MOP,S数据吞吐量为320Mbyte/s,指令周 期时间为40ns/50ns。.两条分开的外部数据、地

13、址总线支持共享存储器系统和高速 数据速率、单周期传输。片内分析模块支持高效的并行处理调试。片内程序高速缓冲存储器(Cache)和双向存取/单周期RAM 提高了存储器访问的性能。-分开的内部程序、数据和 DMA总线使程序和数据的I/O操作 咼度并行化,最大限度地保证了 CPL的性能。(5)第五代TMS320系列 DSP芯片TMS320C5)系列芯片是定点 DSP芯片,采用四级流水线,其主要特点如下: 25/35/50ns 的指令周期(2040MIPS 224KX 16位最大可寻址外部存储空间(64K程序、64K数据、64KI/O、32K全局)算术逻辑单元(ALU, 32位累加器(ACC以及32位

14、加法器的缓冲器(ACCB并行逻辑单元(PLU*结果具有32位的16X 16位并行乘法器.单周期乘累加指令.具有一个专用算术单元的8个辅助寄存器,可用于间接寻址 8级硬件堆栈* 016位数据左移和右移.两个间接寻址的循环缓冲器,用于循环寻址程序代码的单指令重复和程序块重复.全双工同步串行口,用于完成 TMS320C5与其他串行器件之间的直接直接通信时分多址访问(TDM串行口-内部定时器,可用软件控制-64K并行I/O 口,其中16个有存储器映像.可软件编程的等待状态发生器.扩展保持操作,用于并发外部 DMA.四级流水线操作,用于延迟跳转、调用、返回指令*比特反转寻址方式,用于FFT运算-JTAG

15、扫描仿真接口( IEEE标准,P1149.1)(6)第六代TMS32C系列DSP芯片TMS320C6系列芯是一种新型定点DSP芯片,该芯片的内部结构与以前的 DSP芯片不同,内部集成了 多个功能单元,可同时执行 8条指令,运算能力达1600MIPS其主 要特点有:运行速度快。指令周期为5ns,运算能力为1600MIPS*内部结构不同于一般DSP芯片。内部同时集成了 2个乘法器和 6个算术运算单元,且它们之间是高度正交的,使得在一个指令 周期内最大能支持8条32bit的指令;指令集不同。为充分发挥其内部集成的各执行单元的独立运行 能力,TI公司使用了 VelociTT超长指令字(VLIW)结构。

16、它在 一条指令中组合了几个执行单元,结合其独特的内部结构,可在 一个时钟周期内并行执行几个指令;.大容量的片内存储器和大范围的寻址能力。片内集成了512K字程序存储器和512K字数据存储器,并拥有32bit的外部存储 器界面;-智能外设。内部集成了 4个DMA接口,2个多通道缓存串口,2个32bit计时器;低廉的使用成本。根据上述比较,结合仿真系统的特点,考虑DSP的功能和性能比,选择了 TI公司第三代产品TMS320C31-4C浮点DSP芯片。6.3 TMS320C31-40 DSP 芯片TMS320C312-4C为主频40MH才旨令周期为50ns的浮点DSP芯片, 它是TMS320C3的简

17、化和改进型,它去掉了扩展总线,一个半行口和 内部的4K字ROM增加了程序的引导功能,其内部包含了 2KX 32位的快速RAM块。分开的程序总线、数据总线和 DMA总线使得取指、读写数据和DMA操作可并行进行,64X 32位的指令Cache用来存储经 常使用的代码块,这可大大减少片外访问的次数,从而提高程序运行 速度,一般来讲,其运算速度为 20MIPS或40MFLOP,S采用132脚的 PQFP封装,其内部结构框图为图6-1。外设总线.外631 中央处理单元CPU中央处理单元CPU是 DSP芯片的核心组成部件,其性能直接决定了 DSP的运算速度,图6-2是CPU的内部结构图。CPU内有一个40

18、/32位的浮点/定点法器和一个浮点/整数算术逻辑单兀,使DSP在单周期内完成乘法和一个加法运算,大大提咼了DSP勺运算速度。CPU内还有一组寄存器,CPU寄存器组有28个内部 寄存器,他们可以由乘法器和算术逻辑单元进行操作, 此寄存器组包 括: 8个扩展精度寄存器(R7-Ro) 8个辅助寄存器(AR-AR。) 2个指针寄存器(IR。、IRi).1个块大小寄存器(BK-1个数据页面寄存器(DP-1个堆栈寄存器(SR 1个状态寄存器(ST) 1个CPU/DM中断使能寄存器(IE) 1个CPU中断标记寄存器(IF) 1个I/O标记寄存器(IOF) 1个重复计数器(RC和2个块重复(RS RE寄存器

19、1个程序计数器(PC632内部存储器64 X 32位的指令缓存器极大提高了重复运算的指令使用效率,减 少了片外寻址(等待)的次数,它由 CPU犬态寄存器中的3位(bit ) 块定清除、使能或冻结Cache的状态。6.3.3 片内 DMA片内DM/主要由地址生存器和控制寄存器组成。6.3.4 外设1 个串行口,支持 8/16/24/32 位。2 个 32 位定时器。6.3.5 TMS320C31-40 的软件资源(1) 丰富的指令系统TMS320C31-40的汇编语言指令集特别适合于数字信号处理。所有 指令占一个机器字长, 大部分指令是单周器的。 指令集共有 113 条指 令,可以分为六类:数据

20、传送类、二操作数算术 / 逻辑类、三操作数 算术/逻辑类、程序控制类、互锁操作类及并行操作类。12 条数据传送指令可从存储器中读一个字装入寄存器, 将一个字从寄存器中存入 存储器中及进行堆栈操作。二操作数指令有 35条,提供整数、浮点、 逻辑运算及多精度算术操作。 17 条三操作数指令可以在一个指令周 期内完成具有三个操作数的运算, 其中两个是源操作数, 另一个是目 的操作数。程序控制指令共 16 条,它们影响程序的流向,其中有块 重复指令RPT厨口单指令重复指令RPTS除了有标准跳转指令外,还 有延迟跳转指令,有些指令具有条件运算功能。 5 条互锁操作指令主 要用来进行多处理器之间的通信。剩

21、下的 28 条指令都是并行操作指 令,每条并行指令由两条指令用符号“H”连接,并行操作指令可使“II”前后的两条指令并行完成。需要注意的是,并不是任意两条指 令都可构成并行指令。(2)灵活的程序控制TMS320C31-4C提供相当灵活的程序流控制。软件的程序控制包 括重复、跳转、调用、陷阱及返回等。重复方式可以实现无开销循环。块重复指令RPTB可以使一块代 码重复执行指定的次数,而单指令重复指令 RPTS使 一条指令重复执 行指定的次数,由于 RPTS取指次数只有一次,因此减少了总线冲突 的机会。但RPTS指令禁止中断。因此在需要中断的场合,一般用RPTB 指令代替RPTS指令。跳转指令分为标

22、准跳转和延迟跳转。标准跳转首先将流水线清 空然后执行跳转, 这需 4 个周期才能执行完毕。 延迟跳转并不将流水 线清空,而是保证在程序跳转之前执行它下面的 3 条指令, 这样使得 跳转指令本身仅需 1 个指令周期。(3)流水线操作流水线操作是TMS320C31-4具有高性能的特性之一。5个功能 单元控制TMS320C31-4的操作:取指(F)、译码(D)、读操作数(R)、 执行(E)和DMA流水线操作就是一个基本指令的取指、译码、读 操作数和执行的并行操作。尽管DMA勺优先级最低,但由于DMA空制 器具有自己的数据和地址总线,因此,通过合适的数据结构,DMA与CPU的冲突可以减少甚至消除。流水线冲突可以分为下列三大类:跳转冲突、寄存器冲突和存储器冲突(4) 寻址方式多样TMS320C31-4C支持5组寻址模式和6种寻址方式。5组寻址模 式为通用寻址方式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论