数字信号处理器:第1讲 概述_第1页
数字信号处理器:第1讲 概述_第2页
数字信号处理器:第1讲 概述_第3页
数字信号处理器:第1讲 概述_第4页
数字信号处理器:第1讲 概述_第5页
已阅读5页,还剩264页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西安电子科技大学电子工程学院1教学计划安排第1章概述第2章TS系列DSP内核结构第3章TS系列DSP储存器和程序控制器第4章TS系列DSPIO资源第5章TS系列DSP指令系统第6章TS系列DSP程序设计与开发第7章TS系列DSP接口技术第8章TS系列DSP系统设计技术第9章TS系列DSP系统设计实例西安电子科技大学电子工程学院2第1章:概述西安电子科技大学电子工程学院3内容提示1.1数字信号处理器的基本概念和特点1.2数字信号处理器的应用领域1.3ADI公司的DSP系列简介1.4TigerSHARC系列DSP的特点西安电子科技大学电子工程学院41.1数字信号处理器的概念和特点

数字信号处理器(DigitalSignalProcessor,简称DSP)是一种专门用来实现各种信号处理算法的微处理器。根据使用方法的不同,DSP可以分成:专用的DSP:专用的DSP用来实现某些特定的信号处理功能,如数字滤波、FFT等。它不需要编程,使用方便、处理速度快,但是缺乏灵活性。通用的DSP:通用DSP则有完整的指令系统,通过编程来实现各种信号处理功能。西安电子科技大学电子工程学院5

应用需求DSP的产生主要是为了满足通信、雷达、数字电视、软件无线电等领域对数字信号处理的需要。

DSP的特点数学计算密集应用:如典型的数字信号处理算法包括FFT、数字滤波等,其特点就是数学计算密集。DSP在其体系结构上采取了一系列措施,使其在数学计算方面具有优越的性能。实时计算:在通信领域的调制和解调、雷达中的信号检测中,必须在若干微秒至毫秒内完成数据处理,并且给出运算结果,这就是所谓实时处理。西安电子科技大学电子工程学院6数字信号处理器的特点

数字信号处理相对于模拟信号处理有很大的优越性,表现在精度高、灵活性大、可靠性好、易于大规模集成等方面。数字信号处理有别于普通的科学计算与分析,它强调运算处理的实时性,因此DSP除了具备普通微处理器所强调的高速运算和控制功能外,针对实时数字信号处理,在处理器结构、指令系统、指令流程上具有许多新的特征,其特点如下:

西安电子科技大学电子工程学院7(1)运算单元具有硬件乘法器和多功能运算单元:硬件乘法器可以在单个指令周期内完成乘法操作,这是DSP区别于通用的微处理器的一个重要标志多功能运算单元可以完成加减、逻辑、移位、数据传送等操作新一代的DSP内部甚至还包含多个并行的运算单元。以提高其处理能力。运算单元的特点:针对滤波、相关、矩阵运算等需要大量乘和累加运算的特点,DSP的算术单元的乘法器和加法器,可以在一个时钟周期内可以完成相乘、累加两个运算。近年出现的大多数DSP可以同时进行乘、加、减运算,大大加快了FFT的蝶形运算速度。西安电子科技大学电子工程学院8(2)总线结构

传统的通用处理器结构采用统一的程序和数据空间、共享的程序和数据总线结构,即所谓的冯·诺依曼结构。

DSP结构普遍采用了数据总线和程序总线分离的哈佛结构或者改进的哈佛结构,极大的提高了指令执行速度。片内的多套总线可以同时进行取指令和多个数据存取操作,许多DSP带有DMA通道控制器,配合片内多总线结构,数据块传送速度大大提高。如TI公司的C6000系列的DSP采用改进的哈佛结构,内部有一套256位的程序总线、两套32位的数据总线和一套32位的DMA总线。ADI公司的TigerSHARC系列DSP采用超级哈佛结构(SuperHarvaredArchitectureComputer),内部集成了三套总线,即程序存储器总线、数据存储器总线和输入输出总线。西安电子科技大学电子工程学院9(3)专用寻址单元DSP面向数据密集型应用,伴随着频繁的数据访问,数据地址的计算也需要大量时间。DSP内部配置了专用的寻址单元,用于地址的修改和更新,它们可以在寻址访问前或访问后自动修改内容,以指向下一个要访问的地址。地址的修改和更新与算术单元并行工作,不需要额外的时间。

DSP的地址产生器支持直接寻址、间接寻址操作,大部分DSP还支持位反转寻址(用于FFT算法)和循环寻址(用于数字滤波算法)。西安电子科技大学电子工程学院10(4)片内存储器针对数字信号处理的数据密集运算的需要,DSP对程序和数据访问的时间要求很高,为了减小指令和数据的传输时间,其内部集成有程序存储器和数据存储器,以提高程序和数据的访问速度。如TI公司的C6000系列的DSP内部集成有1M~7M位的程序和数据RAM;ADI公司的SHARC系列DSP内部集成有0.5M~2M位的程序和数据RAM,TigerSHARC系列DSP内部集成有6M~24位的程序和数据RAM。西安电子科技大学电子工程学院11(5)流水处理技术

DSP大多采用流水技术,即将一条指令的执行过程分解成取指、译码、取数、执行等若干个阶段,每个阶段称为一级流水。每条指令都由片内多个功能单元分别完成取指、译码、取数、执行等操作,从而在不提高时钟频率的条件下减少了每条指令的执行时间。西安电子科技大学电子工程学院12(6)定点和浮点DSP的特点DSP处理器有定点处理和浮点处理两大类,适用于不同场合定点处理DSP早期的定点处理DSP可以胜任大多数数字信号处理应用,但其可处理的数据的动态范围有限,如16bit定点DSP动态范围仅96dB。在某些数据的动态范围很大的场合,按定点处理可能会发生数据溢出,在编程时需要使用移位定标措施或者用定点指令模拟浮点运算,使程序执行速度大大降低。浮点处理器浮点处理器的出现解决了这些问题,它拓展了数据动态范围。浮点DSP的综合性能优于定点DSP,在相同的指令周期内,它既可以完成32位定点运算,也可以完成浮点运算。而且其汇编源程序容易编写、可读性好、调试方便。西安电子科技大学电子工程学院13(7)DSP的处理能力随着集成电路技术的进步,DSP处理器的运算能力不断提高早期的5MIPS(百万条指令/秒)目前已经发展到达1GFLOPS(千兆次浮点运算/秒)以上如TI公司的TMS320C6201和TMS320C6701处理能力达到1GFLOPSADI公司的ADSPTDS101到达2GFLOPS。某些信号处理应用要求的处理能力达到每秒几百亿、上千亿次运算。这可以通过提高DSP主频或者通过并行处理来满足,提高主频所遇到的难度和付出的成本越来越大,单处理器性能的提高受到许多因素的限制。DSP处理器具有多处理器扩展接口,可以方便的实现多处理器并行处理结构,如TI公司的TMS320C4X,ADI公司的ADS-21060等新型DSP内部引入了并行处理技术,以满足处理速度的要求如TI公司的TMS320C6201和TMS320C6701ADI公司的ADSPTDS101等。西安电子科技大学电子工程学院141.2数字信号处理器的应用领域

随着DSP性能的迅速提高和成本价格的大幅度下降,DSP的应用范围不断扩大,成为当前产量和销售量增长最快的电子产品之一。DSP应用几乎遍及整个电子领域,常见的典型应用有:1.通用数字信号处理

数字滤波、卷积、相关、FFT、希尔伯特变换、自适应滤波、窗函数、波形发生等。2.通信高速调制解调器、编/译码器、自适应均衡器、传真、程控交换机、蜂房移动电话、数字基站、数字留言机、回音消除、噪声抑制、电视会议、保密通信、卫星通信、TDMA/FDMA/CDMA等各种通信制式。随着互联网络的迅猛发展,DSP又在网络管理/服务、信息转发、IP电话等新领域扮演着重要角色,而软件无线电的提出和发展进一步增强了DSP在无线通信领域的作用。

西安电子科技大学电子工程学院15数字信号处理器的应用领域(续)3.语音处理

语音识别、合成、矢量编码、语音信箱。4.图形/图像处理三维图像变换、模式识别、图像增强、动画、电子出版、电子地图等。5.自动控制

磁盘、光盘、打印机伺服控制、发动机控制、电机驱动等。6.仪器仪表

测量数据谱分析、自动监测及分析、暂态分析、勘探、模拟试验。

7.医学电子助听器、CT扫描、超声波、心脑电图、核磁共振、医疗监护等。西安电子科技大学电子工程学院16数字信号处理器的应用领域(续)8.军事与尖端科技雷达和声纳信号处理、雷达成像、自适应波束合成、阵列天线信号处理、导弹制导、火控系统、战场C3I系统、导航、全球定位GPS、目标搜索跟踪、尖端武器试验、航空航天试验、宇宙飞船、侦察卫星。9.计算机与工作站

阵列处理机、计算加速卡、图形加速卡、多媒体计算机。

10.消费电子数字电视、高清晰度电视、图像/声音压缩解压器、VCD/DVDCD播放机、电子玩具、游戏机、数字留言/应答机、汽车电子装置、音响合成、住宅电子安全系统、家电电脑控制装置。

西安电子科技大学电子工程学院171.3ADI公司的DSP系列简介ADI公司提供了完整DSP系列,适合于各种信号处理的需要。16位的定点DSP产品ADSP-21xx系列BlackfinDSP系列32位的浮点DSP产品SHARC系列TigerSHARC系列混合信号处理DSP产品ADSP-2199X系列嵌入式电机控制DSP系列ADMC系列等西安电子科技大学电子工程学院18ADI的高性能DSP/嵌入式处理器CROSSCORE VisualDSP++集成调试、可视化工具.Blackfin多媒体和网络汽车通信生物检测安全和监视信息应用家庭影院宽带网关工业应用TigerSHARC®高性能示波器测试设备超声、核磁共振(MRI)、CT雷达和通信移动基站和天线SHARC®低成本浮点处理高端家用音频专业音频车载音频汽车控制GPS电话医疗仪器工业控制l西安电子科技大学电子工程学院19Blackfin的特征BLACKfins是高性能、16位、双MAC(乘累加)的嵌入式处理器,具有DSP和控制处理特征DSP特征400-750MHz内核,1.5GMACs(@750Mhz)支持8/16/32位定点运算高速设备接口和DMA控制器

并行接口

(PPI):具有

0-65MHz并行数据口,适用于视频或者高速转换器SPORTS、

SPI、

外部口、

SDRAM、

UART(IrDA)等EthernetMAC、

CAN、TW、

PWM等控制处理特征32位架构存储器管理:超级和用户模式,存储器保护、cache等WatchdogTimer,Real-timeClockRISC-like指令集多媒体处理特征扩展的多媒体指令,适用于高效视频、图像和音频处理西安电子科技大学电子工程学院20Blackfin的特征低功耗设计使得Blackfin特别适合电池供电或者其它电源要求高的应用低功耗设计0.15mW/MAC,52mW@200MHz90mW@300MHz280mW@600MHz软件可控制的片内整流器和时钟

PLL低成本应用

ADSP-BF531@400Mhz/800MMACs=$4.95@10KADSP-BF533@600Mhz/1200MMACs=$12.95@10K系列化:不同的存储器容量和性能引脚兼容西安电子科技大学电子工程学院21Whatdoes Enable?Micro-ProcessingImageProcessingDigitalSignalProcessingWirelessConnectivityBluetoothGSM3rdGenerationDigitalImagingCODECsMPEGJPEGH.263H.264SystemControl/ApplicationsSoftwareWiredConnectivityUSBTCP/IPMOSTNetworkH.323/MEGACOHumanInterfaceSpeechRecognitionTextToSpeechHandwritingAudioOperatingSystems/RTOSDesignedforHighLevelLanguage西安电子科技大学电子工程学院22ADSP-BF531/532/533

(低成本起点

:$4.95)Performance400

MHzto756

MHz16/32-bitCore(2.4Gb/sBandwidth)Power@1.2V@1.0V265mW,600

MHz<100mW,300

MHzAddressRange132MBytesOn-ChipRAM52Kto148KBytesPeripherals2SPORTSUART&SPI3TimersParallelPeripheralInterface/GPIOBandwidth266MbpsI/O266MbpsDMA266MbpsMemoryDMAVoltage0.8Vto1.4V(INT)

2.25to3.6V(EXT)TemperatureRange-40Cto+85CAmbient-40Cto+105CAmbientPackage160MiniBGA169Lead-FreePBGA176LQFP(’531/’532)KeyFeaturesCodecompatible&pincompatiblefamily52Kbytesto148Kbytesofon-boardmemoryParallelPortInterfaceDynamicPowerManagementvariesfrequencyandvoltageInterfacestoExternalFLASHandSDRAMBlackfinCoreUpto756MHzSystemInterfaceUnitL116-bitExternalBusInterfaceEmulator&Test

ControlVoltageRegulatorEventControllerWatchdogTimerMemoryDMASystemControlBlocksSPORT0PeripheralBlocksRealTimeClockPLLSRAM/CacheTo80KBInst.To64KBDataSPORT1PPI0/GPIOUARTIrDASPI0TIMERS(3)HighSpeedI/O西安电子科技大学电子工程学院23Blackfin:ADSP-BF561(高性能双核)

KeyFeaturesHighperformancedual-core328Kbytesofon-chipmemoryThreeindependentDMAsystemsDynamicPowerManagementvariesfrequencyandvoltageInterfacestoExternalFLASHandSDRAMPerformance500MHzto756MHz2x500-756MHz16/32-bitCore(2.4Gb/sBandwidtPower@1.2V400mW,500MHzAddressRange768MBytesOn-ChipSRAMOn-ChipL1SRAMOnChipL2SRAM328Kbytes100KBpercore(200KBtotal)Shared128KbytesPeripherals2SPORTSUARTSPI12Timers2PPIsBandwidth532MbpsI/O532MbpsDMA532MbpsMemoryDMAVoltage0.8Vto1.4V(INT)2.25Vto3.6V(EXT)TemperatureRange0Cto+70CAmbient-40Cto+85CAmbientPackage256Lead-FreeMBGA297PBGA–Pb-freeindevelopmentBlackfinCoreUpto756MHzBlackfinCoreUpto756MHzSystemInterfaceUnitL1L2HighSpeedI/O32-bitExternalBusInterfaceEmulator&Test

ControlVoltageRegulatorEventControllersWatchdogTimersMemoryDMASystemControlBlocks128KBSRAMSPORT0PeripheralBlocksPLLSRAM/Cache32KBInst.64KBDataSPORT1PPI0/GPIOPPI1/GPIOSRAM/Cache32KBInst.64KBDataUARTIrDASPI0TIMERS(12)GPIO西安电子科技大学电子工程学院24ADSP-BF536/7

(EmbeddedNetwork)KeyFeaturesEmbedded10/100EthernetMACEmbeddedCAN8timers&48GPIOsDynamicPowerManagementvariesfrequencyandvoltageInterfacestoExternalFLASHandSDRAMPerformance300

MHzto600MHz

16/32-bitCore(2.4Gb/sBandwidth)Power@1.2V@1.0V265mW,600

MHz<100mW,300

MHzAddressRange132MBytesOn-ChipRAM100Kto132KBytesPeripherals10/100EthernetMACCAN2.0BTWI(I2C)2SPORTS2UARTSSPI8TimersParallelPeripheralInterface/GPIOBandwidth266MbpsI/O266MbpsDMA266MbpsMemoryDMAVoltage0.8Vto1.2V(INT)

2.25to3.6V(EXT)ProductDifferencesADSP-BF536Offers:

100KBL1300MHz,400MHz

(-40Cto+85CAmbient)ADSP-BF537Offers:

132KBL1400MHz,500MHz(-40Cto+85CAmbient)600MHz(0Cto+70CAmbient)Package182MiniBGA208SparseMiniBGATestControlEmulationControlEventControllerWatchdogTimerMemoryDMASystemControlBlocksPeripheralBlocksPLLProcessorCoreSystemInterfaceUnitL1ScratchPad4KBSRAM

SRAM/Cache

48KB16KB48KB16KBUpto64KBInst.16-bitExternalMemory10/100EthernetMAC/16GPIOUpto64KBDataMIIRMIIRTC32GPIOSPORT1,UART0-1,SPI0,Timer0-7,PPI*SPORT0/TWI/CAN*SRAM

SRAM/Cache

16KB16KB32KB32KB

西安电子科技大学电子工程学院25ADSP-BF534(汽车和工业)KeyFeaturesEmbeddedCAN8timers&48GPIOsIndustrialandAutomotivetemperaturerangeDynamicPowerManagementvariesfrequencyandvoltageInterfacestoExternalFLASHandSDRAMPerformance400MHzto500MHz16/32-bitCore(2.4Gb/sBandwidth)Power@1.2V@1.0V<265mW,600MHz<100mW,300MHz

AddressRange132MBytesOn-ChipRAM132KBytesPeripheralsCAN2.0BTWI(I2C)2SPORTS2UARTSSPI8TimersParallelPeripheralInterface/GPIOBandwidth266MbpsI/O266MbpsDMA266MbpsMemoryDMAVoltage0.8Vto1.2V(INT)

2.25to3.6V(EXT)TemperatureRange-40Cto+85CAmbient-40Cto+105CAmbientPackage182MiniBGA208SparseMiniBGATestControlEmulationControlEventControllerWatchdogTimerMemoryDMASystemControlBlocksPeripheralBlocksPLLProcessorCoreSystemInterfaceUnitL1ScratchPad4KB64KBInst.16-bitExternalMemory16GPIO64KBDataRTC32GPIOSPORT1,UART0-1,SPI0,Timer0-7,PPI*SPORT0/TWI/CAN*SRAMSRAM/Cache32KB32KBSRAMSRAM/Cache48KB16KB*PeripheralsAvailableinVariousCombinations;NOTallsimultaneously西安电子科技大学电子工程学院26SHARC系列DSPSHARC®低成本浮点处理高端家用音频专业音频车载音频汽车控制GPS电话医疗仪器工业控制西安电子科技大学电子工程学院27SHARC系列特征低成本、高性能400MHzSIMD(单指令多数据)浮点内核2.4GFLOPS800浮点MMACS定点和浮点支持每个周期6个32/40位浮点操作每个周期6个32定点操作大容量片内双端口存储器ADSP-2126x:2MbitsL1SRAM,4MbitsL1ROMADSP-21361/2/3/4/5/6:3MbitsL1SRAM,4MbitsL1ROMADSP-21367/8/9;3MbitsL1SRAM6MbitsL1ROMI/O处理器I/O处理器处理片内外高速数据流与双端口SRAM连接,避免了与内核的冲突接口6个SPI——支持I2S、TDM、和标准模式8通道硬件SRC(sample-rateconversion)S/PDIF(SONY/PHILIPSDIGITALINTERFACE)发送和接收时钟发生器定时器输入数据口(8additionalI2Sports)信号互连指派单元(SignalRoutingUnit)软件定义引脚关系西安电子科技大学电子工程学院28ADSP-21367/21368/21369框图SharedMemorySupportJTAGandControl32-BitExternalMemory/SDRAM

/16PWMsGPIO/Flags/IRQTimers(3)SPI(2)TWIUARTs(2)DigitalPeripheralInterfaceFeatureonlyavailableonADSP-21368/9400MHz@1.35VSIMDSHARCCoreOn-ChipL1

Memory2MbitsSRAM6MbitsROMI/OProcessorWith32Zero-OverheadDMAChannelsSports(8)S/PDIFTx/RxInterrupts(10)PrecisionClockGenerators(4)8-ChannelSampleRateConversion(-140dB)InputDataPort/PDAPGPIO(20)DigitalAppInterface西安电子科技大学电子工程学院29第3代SHARCsSHARCADSP-2126xSHARCADSP-2136xKEYFEATURESADSP-21261ADSP-21262ADSP-21266ADSP-21267ADSP-21363ADSP-21364ADSP-21365ADSP-21366RAM/ROM(Mbits)1/32/42/41/33/43/43/43/4MaxFrequency(MHz)150200150/200150333333333333AudioDecodersinROMNoNoYesYesNoNoYesYesDTCPNoNoNoNoNoNoYesNoS/PDIFNoNoNoNoNoYesYesYesEZ-LiteDevelopmentKit2126221262212622126221364213642136421364SRCPerformance(dB)NoSRCNoSRCNoSRCNoSRCNoSRC140128128BGA(Balls)136136136136136136136136LQFP(leads)144144144144144144144144Availability:RTPRTPRTPRTPX-GradeX-GradeX-GradeX-GradeOperatingTempGrades(Amb)C

=

0°Cto+70°CI

=

-40°Cto+85°CA

=

-40°Cto+105°C*CI--bgaonlyCI--bgaonlyCI--bgaonlyCI--bgaonlyCIACIACIACIA*-40°Cto+105°C,upto200MHzonly西安电子科技大学电子工程学院30ADSP-21367/8/9汇集On-ChipROM6Mbits6MbitsADSP-21367ADSP-21368Performance400MHz,800MMACs400MHz,800MMACsOn-ChipRAM2Mbits2MbitsPackage208LeadMQFP256BallSBGA256BallSBGASampleRateConverters8-Ch,128dB8-Ch,140dBMemorySharingSupportNoYesADSP-21369400MHz,800MMACs2Mbits6MbitsYesNo256BallSBGA西安电子科技大学电子工程学院31TigerSHARC处理器TigerSHARC®高性能多处理器应用高性能示波器测试设备超声、核磁共振(MRI)、CT雷达和通信移动基站和天线西安电子科技大学电子工程学院32TigerSHARC特征高性能600MHz内核支持定点和浮点应用每个周期8个16位定点操作,每个周期6个32/40位浮点操作大容量片内EDRAM片内存储器带宽:38.4GBytes/SecTS201–24MBitsTS202–12MBitsTS203–4Mbits高I/O带宽4个LVDS链路口:1GByte/Sec64位外部存储器接口:1GByte/Sec支持多处理器无缝连接不需要附加逻辑,支持8个处理器互连业界最号的低功耗性能~1500MFLOPS/W@500MHz~720MFLOPS/W@600MHz西安电子科技大学电子工程学院33TigerSHARC技术特点指令并行性和SIMD操作

TS系列处理器内核在单个指令行中能够同时执行1~4条32位的指令码。TS系列处理器还通过并行使用两个运算模块以及SIMD专用计算而拥有了对单指令、多数据SIMD运算提供支持的能力。独立和并行运算模块

TS系列处理器具有两个运算模块,这两个模块可以独立操作、并行操作整数ALU

TS系列处理器具有两个整数ALU(IALU),它们提供了强大的地址产生能力,并执行各种通用的整数运算。每个IALU具有一个多端口32字寄存器文件。作为地址生成器,这些IALU可执行直接或间接(提前和滞后修改)寻址。每个IALU都可指定从存储器进行单、双或四字存取。TS系列处理器IALU支持循环寻址操作的循环缓冲器,循环寻址方式为数字信号处理中经常出现的如滤波、相关、卷积、FFT等提供了高效的编程手段。IALU能够自动处理地址指针回绕,因而减少了开销、提高了性能并简化了编程过程。

西安电子科技大学电子工程学院34TigerSHARC技术特点程序控制器

TS系列处理器的程序控制器通过向存储器提供地址的方法来管理程序结构和程序流程。程序控制器的其他功能包括:根据诸如JUMP、CALL、RTI和RTS等指令来决定流程、递减循环计数器、处理硬件中断,并采用分支预测和128入口的分支目标缓冲器(BTB)来缩短分支延时,以有效实现条件和无条件跳转指令的有效执行。DMA控制器具有14个DMA通道的TS处理器片上DMA控制器可在无需处理器内核干预的情况下实现零开销数据传输。DMA控制器能单独工作,且不为DSP内核所察觉,从而使得DMA操作能够在内核继续执行程序指令的同时正常进行。西安电子科技大学电子工程学院35TigerSHARC技术特点链路口

ADSP-TS20XS具有4个全双工链路口,每个采用低电压差分信号(LVDS)技术来提供4位接收和4位发送I/O功能。由于具备了在500MHz的双倍数据速率条件下进行操作的能力,因此每个链路能够在每个方向上支持高达500Mbps的传输速率,组合的最大吞吐量为4Gbps。外部端口

TS系列处理器上的外部端口为64位宽,工作频率高达125MHz。利用该外部端口即可在无需使用任何外部逻辑器件的情况下共用多达8个TS处理器、一个主机和全局存储器。这是TS系列DSP除了链路口之外提供的第二种支持多处理器系统的方法。SDRAM和SBSRAM控制器提供了一种与这些类型的存储器进行连接的无缝接口。该外部端口还支持一种Flyby模式,该模式允许主机对一个全局共用存储器进行存取。西安电子科技大学电子工程学院36TS系列DSP主要技术参数

[l1]型号TS101STS201STS202STS203S时钟频率(MHz)250/300500/600500/600500/600指令周期(ns)4/3.32/1.672/1.672/1.67运算能力(millionMACs/s)[l1]

600120012001200数据传输能力(Gbyte/s)1.8222字宽(位)32/4032/4032/4032/40数据类型浮点浮点浮点浮点片内RAM(Mbits)624124内部数据总线宽度(位)128128128128外数据总线宽度(位)64646464外地址总线宽度(位)32323232外地址数据总线结构独立独立独立独立

[l1]西安电子科技大学电子工程学院37TS系列DSP主要技术参数处理器结构内核双双双双运算方式SIMDSIMDSIMDSIMD接口外部口

是是是是链路口数目4444位数82×42×42×4电平LVTTLLVDSLVDSLVDSDMA通道14141414外部中断4444Flags4444定时器2222SRAM是是是是SDRAM是是是是多处理器是是是是HOST是是是是西安电子科技大学电子工程学院38TS系列DSP主要技术参数时钟倍频(倍)2/2.5/3/3.5/4/564/5/6/7/8/10/124/5/6/7/8/10/124/5/6/7/8/10/12程序加载方式外部存储器是是是是内部存储器是是是是EPROM是是是是LINK是是是是HOST是是是是电源供电内核(V)1.21.05/1.21.051.05IO(V)2.5核电流(A)2.9工作温度(C)-40~85-40~85/-40~105-40~85-40~85封装PBGA484/625576576576西安电子科技大学电子工程学院39ADI公司的主要DSP完成常用的各种数字信号处理算法的时间西安电子科技大学电子工程学院40ADSP-21XX系列西安电子科技大学电子工程学院41Blackfin系列西安电子科技大学电子工程学院42SHARC系列西安电子科技大学电子工程学院43TigerSHARC系列西安电子科技大学电子工程学院44第2讲TS系列DSP内核结构

主讲秦国栋西安电子科技大学电子工程学院45第2讲内容提示2.1概述2.2运算模块2.3IALU

2.4TS101程序控制器2.5TS20x程序控制器西安电子科技大学电子工程学院462.1概述TigerSHARC系列TS101的内核结构计算块寄存器ALU程序控制器:指令对齐缓冲(IAB),分支目标缓冲(BTB)三套128位总线西安电子科技大学电子工程学院47ADSPTS101原理框图西安电子科技大学电子工程学院48TS101的内核结构M0M1M2Sequencer128-entryBTB128bJ-RFJALU031128b128bK-RFKALU031128bProcElYRF031ALUMultShiftALUProcElXRF031ALUMultShiftExternalPortDMAPeripherals两个计算模块程序控制器内部储存器3套内部总线2个IALU西安电子科技大学电子工程学院49ADSPTS201原理框图西安电子科技大学电子工程学院50TS201S与TS101S内核结构区别时钟频率:TS201S达到600MHz,指令周期为1.67ns;而TS101S的最高内核时钟频率是300MHz,相应的指令周期为3.33ns。内部存储器容量:TS201S为24Mbits,存储器类型为EDRAM(嵌入式DRAM);而TS101S6Mbits,存储器类型为SRAM。TS201S的内部存储器被划分为6个存储块,每个块4Mbits;TS101S的内部存储器被划分为3个存储块,每个块2Mbits。TS201S内部有4套相互独立的128位宽度的数据总线,每条总线分别连接六个4Mbit内部存储器块(Bank)中的一个,提供4字的数据、指令及I/O访问和33.6GB/s的内部存储器带宽。而TS101S的内部只有3套128位宽度的总线。数据总线:TS201S内部有4套相互独立的128位宽度的数据总线,每条总线分别连接六个4Mbit内部存储器块(Bank)中的一个,提供4字的数据、指令及I/O访问和33.6GB/s的内部存储器带宽。而TS101S的内部只有3套128位宽度的总线。西安电子科技大学电子工程学院51CLU

:TS201S内核中改进和增强了通信逻辑处理单元(CLU)功能,支持Viterbi和Turbo解码、CDMA通信中的复数相关应用等。TS201S的CLU成为运算模块中与ALU、乘法器和移位器并列的专门处理单元。指令流水:TS201S的指令流水增加了2级,为10级指令流水。在TS101S的8级指令流水的基础上,指令预取由3级变为4级,又增加了1级指令预译码级流水,共同构成了10级指令流水。链路口:TS201S的链路口的接口标准改为了LVDS标准电平,提高了数据传输率和可靠性,当单个链路口工作在500MHz时,数据传输率为每秒1000MB。TS101S的链路口的接口标准为LVTTL标准电平,其数据传输率低于TS201S,当单个链路口工作在125MHz时,数据传输率为每秒250MB。2.2处理器运算模块西安电子科技大学电子工程学院532.2.1核寄存器

计算块

–3种运算单元核处理器

寄存器组计算块

寄存器存储器映射寄存器非储存器映射的寄存器数据类型&数据大小操作数大小寄存器命名

指令语法

西安电子科技大学电子工程学院54核处理器

三种运算单元

MultALUShifterCtrl&DependencyCheckUnitRegisterFile32x32DABInternalBuses128x36464128128ALU、乘法器、移位器西安电子科技大学电子工程学院55ComputationblockXRegFile031ALUMultShiftUnmapped存储器映射-通用寄存器组(RF).32x32

可以被以下访问: -处理器核

-外部总线设备非储存器映射寄存器

–对于全局状态(XSTAT/YSTAT)专门用于:-ALU-乘法器-移位器

CompblockXALUMultShiftRegFile计算块

寄存器计算块X&Y都包含两种类型的寄存器:存储器映射的寄存器非储存器映射的寄存器西安电子科技大学电子工程学院56XR31XR0Xcomputationblock....YR31YR0Ycomputationblock....存储器映射寄存器寄存器组特征:32个寄存器,每个32位宽硬件互锁可以被所有的转移指令访问访问寄存器组

用于正常字,长字,或者四字。32-bits32-bits西安电子科技大学电子工程学院57ALUComputationblockXRegisterFile0STATUSALUMultShiftPRMRBFOTMP32非储存器映射寄存器非储存器映射寄存器是:全局状态寄存器(XSTAT/YSTAT)ALU(PRx)寄存器乘法器(MRx)寄存器移位器(BFOTMP)寄存器西安电子科技大学电子工程学院58数据类型和数据字长

处理器支持的数据格式:定点/浮点整数/小数有符号数/无符号数复数处理器支持的数据字长:8位

字节16位

–短字32位

正常字64位

长字,

双字,四字

西安电子科技大学电子工程学院59数据字宽/操作数长度

处理器的基本单位是32位(寄存器宽度)少于32-位的数据类型打包成一个32位进入寄存器多个寄存器组合到一起支持大于32位的数据类型举例:-64位输出(双寄存器)-操作把数据看作4个16位的操作数-结果是4个16位的值。

短字指令6304个16位的操作数4个16位的操作数4个16位结果630操作数字长

+/-+/-+/-+/-西安电子科技大学电子工程学院60寄存器

寄存器名称使用规则通用寄存器命名约定{X|Y|XY}[letter][#]或者{X|Y|XY}[letter][#]:[#]单寄存器R1 XR14 YR23双寄存器(两个寄存器中标号最小的标号能被2整除)R1:0XR13:12XYR25:24四寄存器(四个寄存器中标号最小的标号能被4整除)R3:0YR19:16R31:28西安电子科技大学电子工程学院61操作数字长在指令中定点数据(操作数大小)可以按照下面的方法表示:8位数据(字节)-用B表示 BR1,BR1:0,BR3:016位数据(短字)–用S表示 SR1,SR1:0,SR3:032位数据(正常字)-(无字母)R0R1:0,R3:064位数据(长字)–用L表示 LR1:0浮点数据32位数据–用F表示 FR340位数据–用F表示 FR1:0西安电子科技大学电子工程学院6231242316158703116150310计算块X中的寄存器–8位数据计算块X中的寄存器–16位数据计算块X中的寄存器–32位数据XBR3

(B=Byte)XSR3(S=Short=16bit)XR3(Noletter=Normal=32-bit)8-bits8-bits8-bits8-bits16-bits16-bits32-bits寄存器

名称与字长举例

(I)西安电子科技大学电子工程学院63寄存器

名称与字长举例

(II)63565548474039323124231615870寄存器R3寄存器R28-bits8-bits8-bits8-bits8-bits8-bits8-bits8-bitsXBR3:263484732311615016-bits16-bits16-bits16-bits633231032-bits63064-bitsXSR3:2XR3:2XLR3:232-bits西安电子科技大学电子工程学院64寄存器

指令语法举例:定点ALU指令:{L|S|B}Rsd=Rmd+|-Rnd{({S|SU})}s,mn是寄存器的个数d表示双寄存器R1:0=R3:2+R5:4;; /*数据被看作2个32-位的值*/BR1:0=R3:2+R5:4;; /*数据被看作8个8-位的值*/xBR1:0=R3:2+R5:4;; /*与上面相同的指令,只在CBX中执 行*/xySR1:0=R3:2+R5:4;; /*数据被看作4个16-位的值*/yLR1:0=R3:2+R5:4;; /*数据被看作1个64-位的值*/西安电子科技大学电子工程学院652.2.2处理器核-寄存器组有8个寄存器组:计算块数据和状态寄存器整数ALU寄存器DMA寄存器控制寄存器链路口寄存器中断和程序控制寄存器调试逻辑寄存器分支目标缓冲寄存器(BTB)2.3ALU概述定点指令浮点指令特殊指令-PR寄存器特殊指令-VMAX和VMIN指令选项状态标志和条件条件指令西安电子科技大学电子工程学院67CompblockXALUMultShiftRegFileALU–

概述(I)计算块的ALU单元支持:逻辑运算(AND,OR,XOR,NOT)算术运算(加,减,递增,递减,sideways加法)MIN,MAX,比较VMIN/VMAX数据转换

*扩展

*压缩

*合并西安电子科技大学电子工程学院68CompblockXALUShiftALU–

概述

(II)ALU执行:定点数和浮点数的算术操作

定点数的逻辑操作ALU定点指令支持的操作:8-位(字节)输入操作数

16-位(短字)输入操作数

32-位(正常字)输入操作数

64-位(长字)输入操作数

128-位(四字)输入操作数

输出32-,64-,或者128-位结果.ALU浮点指令支持的操作:32-或者40-位浮点操作数

输出32-或者40-位结果.西安电子科技大学电子工程学院69ALU指令举例LR5:4=R11:10+R1:0;; //64-位加,在CBX和CBY中执行ySR1:0=R31:30+R25:24;;//四个短字操作数同时相加,存储 //到两个寄存器对中,仅在CBY中 //执行 xR3=R5ANDR7;; //CBX中的逻辑AND操作yR4=SUMSR3:2;; //R4中短字与yR3:2中的内容相加

//把和放到R4中R9=R4+R8,R2=R4-R8;; //同时加/减, //在CBX和CBY中执行西安电子科技大学电子工程学院70ALU–

指令选项

(I)大部分ALU指令都有选项选项修改了指令的执行细节选项是针对一组指令有效(不是所有的选项都适用于所有的指令)西安电子科技大学电子工程学院71ALU–

指令选项

(II)定点选项-符号有下面的意义:X,Y,YX 作为前缀–在X,Y或者两个计算块中执行B,S,L 作为前缀–字节,短字(16)长字(64)

作为前缀

隐含一个正常(32-bit)字X 扩展的范围(仅ABS指令中使用)S 饱和U 无符号T 截断Z 返回零(仅在MIN/MAX指令中使用)I 整型数例如:YBR9=R2+R8(S);; 西安电子科技大学电子工程学院72ALU–

特殊指令-PR(I)ALU寄存器PR0和PR1用于特殊的ALU指令:SUMABSVMAX/VMIN若访问PR0和PR1寄存器,必须使用下面的指令:PR1:0=RmdRsd=PR1:0注意:即使你只想使用PR0或者PR1,这些指令也必须在双寄存器中操作。西安电子科技大学电子工程学院73R5PR0output3103109=ALU–

特殊指令-PR(II)PR0+=SUMSRmd SUMsideways求和

SR16位短字

d

双寄存器->64位这条指令执行四个16位的加操作,并把结果与PR0寄存器当前的内容相加。PR0+=SUMSR5:4;;

R40504AssumingthatpreviousvalueofPR0is0西安电子科技大学电子工程学院74SR1:0PR0result3103103107-352SR3:23103105679ABS(5-7)ABS(6-(-3))ABS(7-5)ABS(9-2)++150150150150+ALU–

特殊指令-PR(III)PR0+=ABS(SRmd-SRnd)(U)xPR0+=ABS(SR3:2-SR1:0);;20AssumingthatpreviousvalueofPR0is0西安电子科技大学电子工程学院75ALU–

特殊指令-VMAX/VMINVMAX和VMIN指令执行Viterbi运算法则时使用4条指令8或者16位操作数选择步骤取两个寄存器对的最大值或者最小值-4种可能性:SRsd=VMAX(Rmd,Rnd);;SRsd=VMIN(Rmd,Rnd);;BRsd=VMAX(Rmd,Rnd);;BRsd=VMIN(Rmd,Rnd);;西安电子科技大学电子工程学院76R1:0

3103107865R3:213103109223SR9:83103109865864X16bitcomparators0x8000310310PR1:0BitsshiftedintoPR1:0fromtheMSBALU–

特殊指令-VMAX/VMINSRsd=VMAX(Rmd,Rnd);;SR9:8=VMAX(R3:2,R1:0);;950x00000x00000x0000AssumingthatpreviousvalueofPR0is0西安电子科技大学电子工程学院77310310PR1:01111从MSB移位下一个VMAX/VMIN将使这些4位右移4位。如果指令循环执行,这些位将继续移到PR1:0寄存器中

第一个字的结果比较ALU–

特殊指令-VMAX/VMIN在执行完SRsd=VMAX指令后,

如果RmRn,则PR1:0→1;否则PR1:0→0;PR1:0寄存器将保持:西安电子科技大学电子工程学院78ALU–

状态标志位和条件与ALU有关的有9个状态标志位5常规标志4sticky标志非映射寄存器XSTAT和YSTAT中的状态标志位状态标志位控制指令条件的执行在指令执行完时设置状态标志位Sticky位保持置位状态,直到被清零西安电子科技大学电子工程学院79在一个并行指令中,状态标志是所有操作结果的或。

Ex:假设YR0=0x00050003和YR1=0x00040008,

执行完指令ySR2=R0-R1;;之后,结果是:

由于两个数的减法产生了负值,设置yAN标志位。

YR131048YR031053YR23101-5ALU–

并行指令中的状态标志位西安电子科技大学电子工程学院80常规状态标志位

通过以下更新AZ Fxd为0,FP下溢

所有的ALU操作AN 负数

所有的ALU操作AV 溢出

所有的算术操作AC 进位

仅定点操作AI FP无效操作

浮点数操作Sticky状态标志AUS StickyFP下溢

仅浮点(FP)操作AVS StickyFP溢出

仅浮点(FP)操作AOS StickyFxdP下溢

仅定点操作AIS StickyFP无效操作

仅浮点(FP)操作

ALU–

状态标志位西安电子科技大学电子工程学院81ALU–

条件ALU条件是:

条件

描述

设置标志AEQ ALU等于零 AZALT ALU小于零 ANandAZALE ALU小于或者等于零 ANorAZNAEQ NOT(ALU等于零) AZ NALT NOT(ALU小于零) ANandAZ NALE NOT(ALU小于或者等于零) ANorAZ西安电子科技大学电子工程学院82ALU–

条件指令(单个计算块)IFcond;DO<instruction>;;IFxALT;DO,R3=R1+R2;;//CBX和CBY都以xALT为条件执行。IFyAEQ;do,xR0=R1+R2;;//CBX指令以yAEQ为条件执行。IFxALE,jumplabel;;//根据xALE条转。西安电子科技大学电子工程学院83ALU–

条件指令(SIMD)IFALE;do,R0=R1+R2;;//如果CBX中的条件为真,执行CBX中的加操作,//如果CBY中的条件为真,执行CBY加操作。IFALE;do,xR0=R1+R2;; //CBX中的指令根据xALE的值执行。IFALE,jumplabel;; //xALE和yALE或的结果决定是否条转。IFALE;do,R0=[j0+j1];; //xALE和yALE的逻辑或决定是否加载。

西安电子科技大学电子工程学院84Rs=SUMS|BRmRs=SUMS|BRmdRs=ONESRm|RmdRsd=BFOINCRmdPR0|PR1+=ABS(SRmd-SRnd)PR0|PR1+=ABS(BRmd-BRnd)PR0|PR1+=SUMSRmPR0|PR1+=SUMSRmdPR0|PR1+=SUMBRmPR0|PR1+=SUMBRmdRsd=PR1:0PR1:0=Rsd注意X,Y,和XY对于所有的指令都是有效的选项ALU–

定点指令

(I)Rsd=EXPANDSRm+|-SRnRsq=EXPANDSRmd+|-SRndSRsd=EXPANDBRm+|-BRnSRsq=EXPANDBRmd+|-BRndRsd=EXPANDSRmRsq=EXPANDSRmdSRsd=EXPANDBRmSRsq=EXPANDBRmdSRs=COMPACTRmd+|-RndBRs=COMPACTSRmd+|-SRndSRs=COMPACTRmdBRs=COMPACTSRmdBRsd=MERGERm,RnBRsq=MERGER

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论