版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1DSP原理与应用课程基础模拟和数字电路基础单片机原理或微型计算机原理数字信号处理基础理论专业知识(电子,通信)课程特点DSP简单说就是高性能信号处理器,本课程的特点:理论性——只需对DSP算法作一般了解,主要熟悉数字信号处理系统的构成;学习目的——会用,会构建基于DSP的软硬件系统;学习方法——以实验实践为主,边动手边学习。课程目标数字信号处理课程,主要讲授有关理论和算法,基本上不讨论实现技术;DSP芯片厂家的技术手册则只介绍产品的功能和性能。两者比较脱节,都不大利于工程应用。我们开设这门课程的目标,就是希望将两者有机地结合起来,通过授课、实验缩短学习与开发DSP系统的时间,培养学习者的工程素养和创新能力。课程基本要求会找:充分利用网络资源,提高查找资料能力;会看:教材或datasheets(*.pdf文件);会做:软硬件设计,实践出真知,积累设计技能;会问:同学讨论,教师指点,是捷径;最好的教师是自己:自己动手才有收获,特别是工程应用课程!软件开发环境:熟悉仿真软件Matlab、CCS等;课程教学内容DSP课程=理论教学+实验理论教学以TMS320C5509为例,学习数字信号处理的方法(硬件结构、指令系统、开发平台)实验基本实验综合实验科研实验课程参考«TMS320C55xDSP原理及应用»汪春梅孙洪波编著«DSP原理及应用»李利等编写«数字信号处理原理、结构及应用基础》«TMS320F28x»刘和平等编著ICETEK-F2812-A实验指导书ICETEK-VC5509-A实验指导书课程体系结构TMS320C55xDSP芯片工作原理:CPU;存储器;I/O;中断;寻址方式;指令系统;片上外设(PLL,Timer,EMIF,EHPI,McBSP,GPIO,DMA,I2C,MMC,USB,ADC,RTC,UART)TMS320C55xDSP应用开发系统:集成开发环境CCS,仿真工具,硬件结构与设计,程序设计,算法研究实践实践“DSP原理与应用”章节安排第1章数字信号处理和DSP系统第2章TMS320C55x的硬件结构第3章TMS320C55x的指令系统第4章C55x处理器的软件设计第5章TMS320C55x的片内集成外设开发及测试第6章DSP集成开发环境CCS第7章TMS320C55x硬件设计实例第8章TMS320C55x软件设计实例2023年2月1日TMS320C55xDSP原理及应用10第1章数字信号处理和DSP系统
1.1数字信号处理及应用概述1.2实时数字信号处理技术的实现方法1.3数字信号处理器的特点
1.4德州仪器公司的DSP产品1.5DSP芯片的选择
1.6定点运算及定点DSP2023年2月1日TMS320C55xDSP原理及应用11第1章数字信号处理和DSP系统
1.1数字信号处理及应用概述数字信号处理理论和实现技术发展之初,没有人预料到它能给世界带来如此大的变化。其应用的广度还是深度方面,都在快速向前发展。我们身边越来越多的数码产品运用了数字信号处理的方法。
数字信号处理器是一种特别适合于进行数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理算法。数字信号处理是利用计算机或专用处理设备,以数字的形式对信号进行分析、采集、合成、变换、滤波、估算、压缩、识别等加工处理,以便提取有用的信息并进行有效的传输与应用。2023年2月1日TMS320C55xDSP原理及应用12第1章数字信号处理和DSP系统
20世纪60年代以来,随着信息技术的不断进步,数字信号处理技术应运而生并得到迅速发展。80年代以前,数字信号处理技术处于理论研究阶段,还得不到广泛的应用。在此阶段,人们利用“大型计算机”进行算法的研究,以及数字信号处理系统的模拟和仿真。而将数字信号处理技术推向广泛应用的则是实时数字信号处理技术的高速发展。这是DSP器件和理论相互促进、协调发展的结果。
近年来,数字信号处理的理论和方法得到了迅速的发展,诸如:语音与图像的压缩编码、识别与鉴别,信号的调制与解调、加密和解密,信道的辨识与均衡,智能天线,频谱分析等各种快速算法都成为研究的热点、并取得了长足的进步,为各种实时处理的应用提供了算法基础。2023年2月1日TMS320C55xDSP原理及应用13第1章数字信号处理和DSP系统
实时数字信号处理对数字信号处理系统的处理能力提出了严格的要求,所有运算、处理都必须小于系统可接受的最大时延。
典型数字信号处理系统2023年2月1日TMS320C55xDSP原理及应用15典型实时数字信号处理系统的基本部件包括:抗混叠滤波器(Anti-aliasingfilter)、模/数转换器(Analog-to-DigitalConverter,ADC)、数字信号处理、数/模转换器(Digital-to-AnalogConverter,DAC)和抗镜像滤波器(Anti-imagefilter)。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用16第1章数字信号处理和DSP系统
其中,抗混叠滤波器将输入的模拟信号中高于奈奎斯特频率的频率成分滤掉;ADC将模拟信号转换成DSP可以处理的并行或串行的数字比特流;数字信号处理部分完成数字号信处理算法;经过处理的数字信号经DAC转换成为模拟样值之后,再由低通滤波器完成模拟信号波形的重建。2023年2月1日TMS320C55xDSP原理及应用17数字信号处理器的应用(1)基本信号处理:数字滤波器、自适应滤波、FFT、相关运算、谱分析、卷积运算、模式匹配、窗函数、波形产生和变换等。
(2)通信:调制解调、自适应均衡、数据加密、数据压缩、回波抵消、多路复用、传真、扩频通信、纠错编码等。(3)语音:语音编码、语音合成、语音识别、语音增强、说话人的辨认和确认、语音邮件、语音储存等。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用18
如果DSP芯片在某时钟频率范围内的任何频率上都能正常工作,除计算速度有变化外,没有性能的下降,这类DSP芯片一般称之为静态DSP芯片。
例如,TI公司的TMS320系列芯片、日本OKI电气公司的DSP芯片都属于这一类芯片。
(4)图形图像:二维和三维的图形处理和图像的压缩、传输与增强、特征提取、机器人视觉等。(5)军事:保密通信、雷达信号处理、声呐信号处理、导航、导弹制导等。(6)仪器仪表:频谱分析、函数发生、锁相环、地震信号处理等。(7)控制:电机控制、声控、自动驾驶、机器人控制、磁盘控制等。(8)电力:太阳能、风能发电控制、智能电源、电网谐波分析与补偿等。(9)医疗:助听、超声设备、诊断工具、患者监护等。(10)家用电器:音响设备、智能玩具与游戏、数字电话、数字电视,MP3,MP4等。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用19
1.利用X86处理器完成实时数字信号处理
随着CPU技术的不断进步,X86处理器的处理能力不断发展,基于X86处理器的处理系统已经不仅局限于以往的模拟和仿真,也能满足部分数字信号的实时处理要求,而各种便携式或工业标准的推出,如PC104、PC104Plus结构,以及CPCI总线标准的应用,这些都改善了X86系统的抗恶劣环境的性能,扩展了X86系统的应用范围。
第1章数字信号处理和DSP系统
1.2实时数字信号处理技术的实现方法2023年2月1日TMS320C55xDSP原理及应用20(1)处理器选择范围较宽:X86处理器涵盖了从386到奔腾系列,处理速度从100MHz到几GHz,而为了满足工控等各种应用,X86厂商也推出了多款低功耗处理器,其功耗远远小于商用处理器。(2)主板及外设资源丰富:无论是普通结构,还是基于PC104和PC104Plus结构,以及CPCI总线标准,都有多种主板及扩展子板可供选择,节省了用户的大量硬件开发时间。(3)有多种操作系统可供选择:这些操作系统包括Windows、Linux、WinCE等,而针对特殊应用,还可根据需要对操作系统进行剪裁,以适应实时数字信号处理要求。(4)开发、调试较为方便:X86的开发、调试工具十分成熟,使用者不需要很深的硬件基础,只要能够熟练使用VC、C-Build等开发工具即可进行开发。第1章数字信号处理和DSP系统
利用X86系统进行实时数字信号处理有下列优点:
2023年2月1日TMS320C55xDSP原理及应用21
X86进行实时信号处理的缺点:第1章数字信号处理和DSP系统
(1)数字信号处理能力不强:X86系列处理器没有为数字信号处理提供专用乘法器等资源,寻址方式也没有为数字信号处理进行优化设计,实时信号处理对中断的响应延迟时间要求十分严格,通用操作系统并不能满足这一要求;(2)硬件组成较为复杂:即使是采用最小系统,X86数字信号处理系统也要包括主板(包括CPU、总线控制、内存等)、非易失存储器(硬盘或电子硬盘、SD卡或CF卡)和信号输入/输出部分(这部分通常为AD扩展卡和DA扩展卡),如果再包括显示、键盘等设备,系统将更为复杂;(3)系统体积、重量较大,功耗较高:即使采用紧凑的PC104结构,其尺寸也达到96mm×90mm,而采用各种降低功耗的措施,X86主板的峰值功耗仍不小于5W,高功耗则对供电提出较高要求,则需要便携系统提供容量较大的电池,进一步增大了系统的重量;(4)抗环境影响能力较弱:便携系统往往要工作于自然环境当中,温度、湿度、振动、电磁干扰等都会给系统正常工作带来影响,而为了克服这些影响,X86系统所需付出的代价将是十分巨大的。2023年2月1日TMS320C55xDSP原理及应用22
2.利用通用微处理器完成实时数字信号处理
通用微处理器的种类多,包括51系列及其扩展系列,德州仪器公司的MSP430系列,ARM公司的ARM7、ARM9、ARM11、ARMCortex-M0,-M3,-A8,-A9系列,等等,利用通用微处理器进行信号处理的优点如下:
(1)可选范围广:通用微处理器种类多,使用者可从速度、片内存储器容量、片内外设资源等各种角度进行选择,许多处理器还为执行数字信号处理专门提供了乘法器等资源。(2)硬件组成简单:只需要非易失存储器,A/D、D/A即可组成最小系统,这类处理器一般都包括各种串行、并行接口,可以方便地与各种A/D、D/A转换器进行连接。(3)系统功耗低,适应环境能力强。
第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用23利用通用微处理器进行信号处理的缺点如下:(1)信号处理的效率较低:以一个两个数值乘法为例,处理器需要先用两条指令从存储器当中取值到寄存器中,用一条指令完成两个寄存器的值相乘,再用一条指令将结果存到存储器中,这样,完成一次乘法就花费了4条指令,使信号处理的效率难以提高。(2)内部DMA通道较少:数字信号处理需要对大量的数据进行搬移,如果这些数据搬移全部通过CPU进行,将极大的浪费CPU资源,但通用处理器往往DMA通道数量较少,甚至没有DMA通道,这也将影响信号处理的效率。8051做16位乘加的速度比TMS320C55x慢数千倍。(1)位宽,(2)寄存器,(3)传输通道,(4)指令,(5)主频第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用24每条指令可通过片内多功能单元完成取指、译码、取操作数和执行等多个步骤,实现多条指令的并行执行,从而在不提高系统时钟频率的条件下减少每条指令的执行时间。其过程如图1.2.3所示。第1章数字信号处理和DSP系统
针对这些缺点,当前的发展趋势是在通用处理器中内嵌硬件数字信号处理单元,如很多视频处理器产品都是在ARM9处理器中嵌入H.264、MPEG4等硬件视频处理模块,从而取得了较好的处理效果;而另一条路径是在单片中集成ARM处理器和DSP处理器,类似的产品如德州仪器的OMAP处理器及达芬奇视频处理器,它们就是在一个芯片中集成了一个ARM9处理器和一个C55x处理器或一个C64x处理器。2023年2月1日TMS320C55xDSP原理及应用253.利用可编程逻辑阵列(FPGA)进行实时数字信号处理随着微电子技术的快速发展,FPGA的制作工艺已经进入到45nm时期,这意味在一片集成电路当中可以集成更多的晶体管,芯片运行更快,功耗更低。其主要优点如下。(1)适合高速信号处理:FPGA采用硬件实现数字信号处理,更加适合实现高速数字信号处理,对于采样率大于100MHz的信号,采用专用芯片或FPGA是适当的选择。(2)具有专用数字信号处理结构:纵观当前最先进的FPGA,如ALTERA公司的StratixⅡ、Ⅲ系列、CycloneⅡ、Ⅲ、IV系列,Xilinx公司的Virtex-4、Virtex-5系列都为数字信号处理提供了专用的数字信号处理单元,这些单元由专用的乘法累加器组成,所提供的乘法累加器不仅减少了逻辑资源的使用,其结构也更加适合实现数字滤波器、FFT等数字信号处理算法。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用26使用FPGA的缺点如下:(1)开发需要较深的硬件基础:无论用VHDL还是VerilogHDL语言实现数字信号处理功能都需要较多的数字电路知识,硬件实现的思想与软件编程有着很大区别,从软件算法转移到FPGA硬件实现存在着很多需要克服的困难。(2)调试困难:对FPGA进行调试与软件调试存在很大区别,输出的信号需要通过示波器、逻辑分析仪进行分析,或者利用JTAG端口记录波形文件,而很多处理的中间信号量甚至无法引出进行观察,因此FPGA的更多工作是通过软件仿真来进行验证的,这就需要编写全面的测试文件,FPGA的软件测试工作是十分艰巨的。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用274.利用数字信号处理器实时实现数字信号处理
数字信号处理器(DigitalSignalProcessor,DSP)是一种专门为实时、快速实现各种数字信号处理算法而设计的具有特殊结构的微处理器。20世纪80年代初,世界上第一片可编程DSP芯片的诞生为数字信号处理理论的实际应用开辟了道路;随着低成本数字信号处理器的不断推出,更加促进了这一进程。90年代以后,DSP芯片的发展突飞猛进。其功能日益强大,性能价格比不断上升,开发手段不断改进,使DSP芯片迅速成为众多电子产品的核心器件,DSP系统也被广泛地应用于当今技术革命的各个领域——通信电子、信号处理、自动控制、雷达、军事、航空航天、医疗、家用电器、电力电子,而且新的应用领域还在不断地被发现、拓展。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用29利用数字信号处理器实时实现数字信号处理的优缺点:优点:大规模集成性、稳定性好精度高 可编程性 高速性能 可嵌入性 接口和集成方便缺点:成本较单片机高,甚至高于PC机DSP技术更新速度快,开发和调试工具需要不断完善,不如PC机编程和修改方便。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用305.专用器件形式
用ASIC芯片实现。随着专用集成电路ASIC(ApplicationSpecificIntegrated
Circuit)的广泛使用,可以将DSP的功能集成到ASlC中。这种芯片可采用通用DSP器件中经过裁剪的CPU核,再配上所需的存储器及接口部件,固化专用程序组成用户的ASIC,也可以配上专用算法的硬件。集成程度高,简化系统结构。功能单一,一般用于大批量消费电子。
第1章数字信号处理和DSP系统
设计者要根据系统的嵌入式、便携性、功耗、速度、成本、批量、可靠性、使用环境、开发周期等情况选择实现方式。2023年2月1日TMS320C55xDSP原理及应用31
1.3.1存储器及总线结构第1章数字信号处理和DSP系统
微处理器的存储器结构分为两大类:冯·诺伊曼结构和哈佛结构。由于成本的原因,GPP广泛使用冯·诺伊曼存储器结构。典型冯·诺伊曼结构的特点是只有一个存储器空间、一套地址总线和一套数据总线;指令、数据都存放在这个存储器空间中,统一分配地址,所以处理器必须分时访问程序和数据空间。通常,做一次乘法会发生4次存储器访问,用掉至少4个指令周期。为了提高指令执行速度,DSP采用了程序存储器空间和数据存储器空间分开的哈佛结构和多套地址、数据总线。哈佛结构是并行体系结构,程序和数据存于不同的存储器空间,每个存储器空间独立编址、独立访问。因此,DSP可以同时取指令(来自程序存储器)和取操作数(来自数据存储器);而且,还允许在程序空间和数据空间之间相互传送数据。哈佛读/写结构使DSP很容易实现单周期乘法运算。GPP(GeneralPurposeProcessors,通用处理器)
1.3数字信号处理器的特点GPP的Von.Neumann结构取指译码读数执行取指译码
•••2023年2月1日TMS320C55xDSP原理及应用外部I/O数据总线外部I/O地址总线数据总线数据地址总线程序数据总线程序地址总线CPUI/O口ROM串行接口RAM并行接口外部存储器接口哈佛结构外部I/O数据总线外部I/O地址总线数据总线数据地址总线程序数据总线程序地址总线第1章数字信号处理和DSP系统
取指译码读数执行取指译码读数执行取指译码读数执行取指译码读数执取指译码读取指译
2023年2月1日TMS320C55xDSP原理及应用341.3.2流水线
流水线结构将指令的执行分解为取指、译码、取操作数和执行等几个阶段。在程序运行过程中,不同指令的不同阶段在时间上是重叠的,流水线结构提高了指令执行的整体速度,有助于保证数字信号处理的实时性。因此,所有DSP均采用一定级数的流水线,如TMS320C54xDSP采用6级流水线,而TMS320C6xxxDSP采用8级流水线。TMS320C55xDSP的流水线则被分为指令流水线和执行流水线两部分,指令流水线完成访问地址产生、等待存储器回应、取指令包、预解码等工作;执行流水线完成译码、读取/修改寄存器、读操作数和输出结果等工作。
第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用351.3.3硬件乘法累加单元第1章数字信号处理和DSP系统
由于DSP任务包含大量的乘法—累加操作,所以DSP处理器使用专门的硬件来实现单周期乘法,并使用累加器寄存器来处理多个乘积的累加;而且几乎所有DSP指令集都包含有MAC指令。一般在一个时钟周期内完成。有些DSP有多个硬件乘法累加单元并行处理数据。而GPP通常使用微程序实现乘法。
DSP常用算法中的乘法与累加常用算法卷积相关变换级数算法分析当用有限N项之和近似代替无穷求和时,DSP常用算法可归纳为:针对这类N项双操作数相乘后乘积求和的通用形式,DSP中从硬件结构上采用了多种先进技术,最终实现了N项乘积和主运算仅需要N个指令周期。2023年2月1日TMS320C55xDSP原理及应用381.3.4具有低开销或零开销循环及跳转的硬件支持
第1章数字信号处理和DSP系统
DSP算法的特点之一是主要的处理时间用在程序中的循环结构中,因此多数DSP都有专门支持循环结构的硬件。所谓“零开销”(zerooverhead)是指循环计数、条件转移等循环机制由专门硬件控制,而处理器不用花费任何时间。通常GPP的循环控制是用软件来实现的。例如:RPTCSR;下一条指令执行CSR+1次MACM*AR3+,*AR4+,AC1
;AC1=AC1+(AR3)*(AR4);AR3=AR3+1,AR4=AR4+12023年2月1日TMS320C55xDSP原理及应用391.3.5特殊的寻址方式第1章数字信号处理和DSP系统
具有在单周期内操作的多个硬件地址产生器,为下个指令准备好数据地址。例如:*(ARn+T1)*ARn+*-ARnDSP还支持一些特殊的寻址方式。例如为了降低卷积、自相关算法和FFT算法的地址计算开销,多数DSP支持循环寻址和位倒序寻址。而GPP一般不支持这些寻址方式。2023年2月1日TMS320C55xDSP原理及应用401.3.6高效的特殊指令
第1章数字信号处理和DSP系统
DSP指令集设计了一些特殊的DSP指令用于专门的数字信号处理操作。这些指令充分利用了DSP的结构特点,提高了指令执行的并行度,从而大大加快了完成这些操作的速度。例如TMS320C55xx中的FIRSADD指令和LMS指令,分别用于对称结构FIR滤波算法和LMS算法。2023年2月1日TMS320C55xDSP原理及应用411.3.7丰富的运算类指令第1章数字信号处理和DSP系统
DSP指令系统中的算术运算类指令的比例很大,明显高于GPP,对于某一算术运算可明显减少程序中的指令条数。完成同样运算功能所需指令少。减少运算前准备指令和运算后处理指令。例如:MACM*AR3+,*AR4+,AC12023年2月1日TMS320C55xDSP原理及应用421.3.8零开销移位第1章数字信号处理和DSP系统
TMS320C55xx的CPU中包含快速移位器,指令系统中很多指令有附加移位操作。定点运算的移位操作非常多。例如:ADDAC0<<T0,AC1;AC1=AC1+(AC0<<T0)2023年2月1日TMS320C55xDSP原理及应用431.3.9丰富的片内外设第1章数字信号处理和DSP系统
例如TMS320C55xx中的DARAM支持一个时钟周期存取两次数据。DSP片内集成了众多类型的硬件设备:CPU;存储器(SARAM&DARAM、ROM);PLL,Timer,EMIF,EHPI,McBSP,GPIO,DMA,I2C,MMC,USB,ADC,RTC,UART等等。2023年2月1日TMS320C55xDSP原理及应用441.4德州仪器公司的DSP产品按照应用领域的要求,DSP器件可以分为三类:
工业控制领域,这方面的应用要求DSP工作稳定、可靠、集成度高、成本低,这类芯片一般都在内部集成了CAN总线、PWM模块等适合于工业控制的专用外设;
低成本嵌入式应用系统,如手机、磁盘驱动器、MP3播放器等,在这些应用中,成本、集成度和功耗是最重要的因素;
需要用复杂算法对大量数据进行处理的应用,如声呐探测、视频处理和地震探测等,该类设备批量小、算法复杂、对性能要求苛刻,而对成本和功耗并不是特别关注。
第1章数字信号处理和DSP系统
在选择DSP处理器时,要根据目标系统不同要求,综合考虑性能、成本、集成度、开发的难易程度及功耗等因素。
2023年2月1日TMS320C55xDSP原理及应用45德州仪器公司的DSP产品现已发展三代:
第一代是以TMS320C10为代表的数字信号处理器产品;
第二代数字信号处理器以C2x、C3x和C4x系列为代表,其中C2x为16位定点信号处理器,C3x和C4x为32位浮点信号处理器。
第三代包括主要用于控制领域的C24x和C28x系列、用于便携消费电子产品的低功耗16位定点数字信号处理器C54x、C55x系列、用于高速信号处理和图像处理的高性能16位定点数字信号处理器C62x、C64x系列、用于浮点信号处理的32位浮点信号处理器C67x和TMS320C33。
第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用461.4.1C24x系列和C28x系列C24x系列主要用于电机控制领域,它可为交流感应电机、直流永磁体电机和开关激励式电机等提供高效控制,为无刷电机的变速控制提供了廉价且高可靠性的解决方案。C24x系列处理器采用TMS320C2XX内核,该内核具有一个32位算术逻辑单元,一个32位累加器,一个16位×16位乘法器,为了配合算术逻辑单元工作还提供了输入和输出数据移位器,为8个辅助寄存器和一个辅助寄存器算术单元提供了数据地址产生电路,还有专用的程序地址产生电路。它们内部集成了DSP内核和微控制器片上外设,为用户提供了一种方便的单片解决方案。C24x内部集成了DARAM、Flash(或EEPROM)存储器、16位定时器、脉宽调制器、A/D转换器、看门狗模块及CAN总线接口模块、SPI(SerialPeripheralInterface)和SCI(SerialCommunicationsInterface)等通信接口。
第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用47
C28x系列处理器是德州仪器公司为控制领域的高端应用而开发的系列产品。首先内核由C24x系列的16位提升为32位,DSP内核提供了2个16位×16位乘法累加器,可以进行16位×16位、32位×32位乘法累加运算。该系列芯片采用了先进芯片制造技术,速度升高到60~150MHz,Flash存储器的容量最高提升到512KB。C28x系列又分为三个小系列,即C280x、C281x和C2833x,而C2833x系列又为用户提供了浮点处理能力C280x系列为低价格数字信号控制器,速度从60MHz到100MHz
。
C281x系列的速度提高到150MHz,Flash存储器的容量扩展到128KB和256KB,AD转换器的速度提高到12.5MSPS,C2810、C2811还具有代码兼容和引脚兼容的特点。
第1章数字信号处理和DSP系统
C2833x系列在C281x的基础上还集成了一个单精度浮点运算单元,外部具有了32/16位EMIF接口,为了便于同外设进行通信还提供了1个6通道DMA控制器,Flash存储器的容量扩展到128KB、256KB和512KB。2023年2月1日TMS320C55xDSP原理及应用481.4.2C62x系列和C64x系列
C62x系列是德州仪器公司第一个采用超长指令字的DSP产品,它的内部包含6个算术逻辑单元和两个16位×16位乘法器,这样C6000系列可以在一个循环中完成8次操作。C62x系列处理器的推出具有里程碑式的意义,它为高性能DSP树立了标准。
C64x系列采用了C64x内核,采用了增强型超长指令字结构,改进了流水线结构,支持32位或64位宽度存储器访问,最高处理能力已经达到9.6GIPS。
第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用491.4.3C67x系列和C33
C67x和C33是德州仪器公司的浮点数字信号处理器系列,C67x除了兼容C62x指令集之外,还支持浮点操作,单精度浮点运算可达1GFLOPS,对于双精度运算可达250MFLOPS。其内核包括4个浮点/定点算术逻辑单元,两个定点算术逻辑单元和两个浮点/定点乘法器,支持单精度和双精度浮点运算。浮点:数的范围大于定点,不易溢出;浮点处理器的编程简单,32位,影响功耗和速度,成本高
第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用50
1.4.4C54x系列和C55x系列
C54x和C55x系列是德州仪器公司为便携电子产品推出的低功耗16位定点数字信号处理器
;
C54x系列针对低功耗应用采用了一系列措施,在确保性能的同时保证了DSP的低功耗;
C55x是在C54x基础上开发的新型低功耗、高性能数字信号处理器,它兼容C54x代码集,乘法器变成两个,而采用最新芯片制造技术大幅度提升了DSP的主频,从而提高了C55x系列处理器的处理能力。第1章数字信号处理和DSP系统
TMS320VC5509-200PGE(S-PQFP-G144)1.4.5DSP发展趋势独立的DSP发展主频速度、特殊功能、并行能力、特定的外设
DSP作为辅助技术协处理器(或特殊的计算单元)综合发展与其他处理器形成混合核,兼顾两者的优点‘C1x‘C2x‘C2xx‘C5x‘C54xx‘C55xxFuture‘C62xx‘C64xx定点DSP‘C3x‘C4x‘C67xFuture浮点DSP‘C8xOMAP‘C57xFuture多处理器其它公司的DSP芯片AD公司的DSP芯片
AT&T公司的DSP芯片
Motorola/Freescale公司的DSP芯片Microchip公司的dsPIC系列DSP芯片
CPU:双核ARM®Cortex™A57(最高2GHz)和四核A53内核,支持64位GPU:Adreno430GPUDSP:HexagonV56DSP(最高800MHz),可让多种应用程序以超低功耗运行,如音乐播放程序、增强的音频效果应用程序、计算机视觉处理应用程序以及静止和视频图像增强应用程序手机芯片中的DSP内核(以高通骁龙808处理器为例)DSP应用系统的开发工具开发工具的优劣对代码的长度、代码的执行速度有着关键的作用,开发工具的功能是否齐全,使用是否方便,在很大程度上将影响DSP系统的开发周期以及产品上市时间。由于不同厂商、不同系列的DSP都有自己的开发工具,因此开发工具的选择也是重要的一环。DSP的开发工具代码产生工具对用户开发的高级语言或汇编语言源代码进行编译,生成可以在目标DSP上运行的可执行代码。代码调试工具根据调试者的命令观察DSP的状态,控制DSP代码的执行,进行结果显示,对用户的代码进行调试或性能测试。TI公司的开发工具TMS320有一系列调试工具用代替或协助目标系统进行软件评价和开发。现有产品:DSK初学者开发套件(DSPStarterKit)EVM评估模块(EvaluationModule)XDS100/XDS560硬件仿真器集成开发平台CCS(CodeComposerStudio)DSP开发流程确定系统性能指标核心算法模拟和验证选择DSP芯片及其他系统组件软件设计和调试硬件设计和调试系统测试、集成2023年2月1日TMS320C55xDSP原理及应用631.5DSP芯片的选择1.5.1运算速度
DSP芯片是否符合应用要求,运算速度是非常关键的。常见的运算速度指标有如下几种:(1)指令周期:执行一条指令所需的最短时间,数值等于主频的倒数;指令周期通常以ns(纳秒)为单位。例如,运行在200MHz的TMS320VC5510的指令周期为5ns(2)MIPS:每秒百万条指令数。(3)MOPS:每秒百万次操作数。(4)MFLOPS:每秒百万次浮点操作数(5)BOPS:每秒十亿次操作数。(6)MAC时间:一次乘法累加操作花费的时间。大部分DSP芯片可在一个指令周期内完成MAC操作。(7)FFT执行时间:完成N点FFT所需的时间。FFT运算是数字信号处理中的典型算法而且应用很广,因此该指标常用于衡量DSP芯片的运算能力。第1章数字信号处理和DSP系统
单周期执行时间=1/时钟频率
◎
MIPS(MillionInstructionPerSecond)TMS320C5402$6/100MIPS60mwTMS320C5416$39/160MIPS90mwTMS320C55x0.9v0.05mw/MIPS800MHz◎MFLOPS(MillionFloatingPointOperationSecond)TMS320C6701$210/1GFLOPS◎MBPS(MillionBitPerSecond)(主要用来衡量DSP数据传输能力,是对总线和I/O口数据吞吐率的度量,也就是总线和I/O口的带宽)
例:‘C6000200MHz时钟32--bit总线则总线数据吞吐率为800Mbyte/s或6400MBPS◎MACS(Multiply---AccumulatesPerScond)
2023年2月1日TMS320C55xDSP原理及应用661.5.2算法格式和数据宽度
DSP算法格式主要分为定点算法和浮点算法两种。一般而言,定点DSP芯片价格较便宜,功耗较低,但运算精度稍低;浮点DSP芯片的优点是运算精度高,但价格稍贵,功耗也较大。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用671.5.3存储器
DSP的内部存储器通常包括Flash存储器、RAM存储器等。Flash存储器通常用来存储程序及重要的数据,Flash存储器是一种非易失存储器,当系统掉电后还能够保留所存储的信息,Flash存储器的缺点是读/写速度较慢,而向Flash存储器写入数据的过程比较烦琐。DSP中最重要的存储器是RAM存储器,例如在TMS320VC5510处理器中就集成了320KB的RAM存储器。有的DSP片内集成了多存取存储器,允许在一个指令周期内对存储器进行多次访问;也有的DSP片内集成了指令缓存,允许从缓存读取指令,从而将存储器空闲出来进行数据读取。DSP外部总线可以扩展多种存储器,其中既有EPROM、Flash等非易失存储器,又有SRAM、FIFO等可快速访问的存储器,还可以连接SDRAM、DDRSDRAM等大容量存储器,而外部总线的数据宽度也从16位向32位和64位发展。这些特点也是选择DSP时可以参考的依据。第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用681.5.4功耗
由于DSP器件越来越多地应用在便携式产品中,因此功耗是一个重要的考虑因素。下面是一些常见的降低系统功耗的技术。(1)低工作电压。目前DSP的工作电压有5V,3.3V(LVTTL标准),2.5V(SSTL2标准),1.8V等多种。
(2)“休眠”或“空闲”模式。大多数处理器具有关断处理器部分时钟的功能以降低功耗。第1章数字信号处理和DSP系统
(3)可编程时钟分频器。有的DSP可以在运行时动态编程改变处理器时钟频率以降低功耗。
(4)外围控制。一些DSP器件允许程序中止系统暂时不使用的外围电路功能。2023年2月1日TMS320C55xDSP原理及应用691.5.5开发工具选择DSP芯片时,必须注意其开发工具的支持情况(包括软件开发工具、硬件开发工具)。软件开发工具包括编译器、汇编器、链接器、调试器、代码模拟器、代码库及实时操作系统(RealTimeOperationSystem,RTOS)等,而硬件工具包括评估板和仿真器等。
第1章数字信号处理和DSP系统
2023年2月1日TMS320C55xDSP原理及应用701.6定点运算及定点DSP第1章数字信号处理和DSP系统
1、数据格式2、运算方法3、定点DSP芯片1、数据格式
在定点DSP芯片中,机器指令采用定点数进行数值运算。不能直接计算浮点数。如果要快速计算,变量要采用整型数来表示(int、long型)。
DSP芯片存储的数以2的补码形式表示。-32768,32767(8000h,7FFFh)-1(FFFFh),0+-
-128,127(80h,7Fh)
-1(FFh),0+-0000000000000100采用Q0表示法,2000H为8192采用Q15表示法,2000H为0.25如:Q表示法16进制数2000H小数点的位置0000000000000100小数点的位置符号位CPU不认为它们有区别,都是2000H,编程者要记住每个变量的Q值。数的定标:一般用Q表示法。浮点数与定点数的转换关系
浮点数转换为定点数定点数转换为浮点数浮点数x=0.5,定标Q=15,则定点数=0.5*32768=16384=4000H第1章数字信号处理和DSP系统
浮点数的表示指数部分又称为阶码,阶码用偏移码表示。例如:数125.5,二进制原码为:1111101.1B,亦可表示为:1.1111011*26,6为阶码,6+127=133=10000101B,因此125.5用单精度浮点数可表示为:
01000010
111110110000000000000000
高字节低字节
Q表示S表示十进制数表示范围Q15S0.15-1≤X≤0.9999695Q14S1.14-2≤X≤1.9999390..................Q1S14.1-16384≤X≤16383.5Q0S15.0-32768≤X≤32767第1章数字信号处理和DSP系统
定点数的表示范围:数据类型位宽字节数数值范围char81-128~+127unsignedchar810~255short162-32768~+32767unsignedshort1620~65535int162-32768~+32767unsignedint1620~65535long324-2147483648~+2147483647unsignedlong3240~4294967295float324±1.175494E-38~±3.402823E+38(数符加尾数占24位,指数符加指数占8位)double648±1.175494E-38~±3.402823E+38(数符加尾数占48位,指数符加指数占16位)加法/减法运算的C语言定点模拟floatx,y,z;z=x+y;两个操作数的定标值一样如果加法/减法的结果超出16位的表示范围,则必须保留32位结果,以保证运算的精度z=x+y==定点加法描述:
intx,y,z;longtemp; /*临时变量*/temp=y<<(Qx-Qy);temp=x+temp;z=(int)(temp>>(Qx-Qz)),若Qx≥Qzz=(int)(temp<<(Qz-Qx)),若Qx≤Qz例子:设x=0.5,y=3.1,则浮点运算结果为z=x+y=0.5+3.1=3.6;Qx=15,Qy=13,Qz=13,则定点加法为:
x=4000H=16384;y=6333H=25395;temp=25395<<2=101580;temp=x+temp=16384+101580=117964;z=(int)(117964L>>2)=29491;验算:z=29491/8192=3.6定点加法定点减法
设x=3.0,y=3.1,则浮点运算结果为z=x-y=3.0-3.1=-0.1;Qx=13,Qy=13,Qz=15,则定点减法为:
x=3.0*213=24576;y=3.1*213=25395;
temp=25395;temp=x-temp=24576-25395=-819;因为Qx<Qz,故z=(int)(-819<<2)=-3276。验算:由于z的Q值为15,所以定点值z=-3276即为浮点值z=-3276/32768-0.1结果超过16位表示范围
设x的Q值为Qx,y的Q值为Qy,且Qx>Qy,加法结果z的定标值为Qz,则定点加法为:intx,y;
longtemp,z;
temp=y<<(Qx-Qy);
temp=x+temp;z=temp>>(Qx-Qz),若Qx≥Qzz=temp<<(Qz-Qx),若Qx≤Qz
例子:设x=15000,y=20000,则浮点运算结果为z=x+y=15000+20000=35000,显然z>32767;Qx=1,Qy=0,Qz=0,则定点加法为:
x=15000*21=30000;y=2000*20=20000;temp=20000<<1=40000;temp=temp+x=40000+30000=70000;z=70000L>>1=35000;结果超过16位的定点加法
乘法运算的C语言定点模拟
z=xy;intx,y,z;longtemp;temp=(long)x;z=(temp×y)>>(Qx+Qy-Qz);z=xy=
=定点乘法
设x=18.4,y=36.8,则浮点运算值为z=18.4×36.8=677.12;Qx=10,Qy=9,Qz=5,所以x=18841;y=18841;
temp=18841L;z=(18841L*18841)>>(10+9-5)=354983281L>>14=21666;因为z的定标值为5,故定点z=21666即为浮点的z=21666/32=677.08除法运算的C语言定点模拟
z=x/y;intx,y,z;longtemp;temp=(long)x;z=(temp<<(Qz-Qx+Qy))/y;
z=x/y
=
定点除法
设x=18.4,y=36.8,浮点运算值为z=x/y=18.4/36.8=0.5;Qx=10,Qy=9,Qz=15;所以有x=18841,y=18841;temp=(long)18841;z=(18841L<<(15-10+9))/18841=308690944L/18841=16384;因为商z的定标值为15,所以定点z=16384即为浮点z=16384/32768=0.5程序变量的Q值确定确定变量的Q值实际上就是确定变量的动态范围。设变量的绝对值的最大值为|max|,取整数n,使其满足如果某变量的值在-1至+1之间,即<1,因此n=0,Q=15-n=15
确定变量的绝对值的最大值理论分析法(三角函数、汉明窗、FIR卷积、自相关线性预测编码等)统计分析法(依据足够多的采样值)2、运算方法
通常的是全部以Q15格式表示的小数或以Q0格式表示的整数来工作定点乘法定点加法定点除法定点乘法
小数乘小数Q15×Q15=Q300.5*0.5=0.250.100000000000000 ;Q15×0.100000000000000 ;Q15 00.010000000000000000000000000000=0.25;Q30LT OP1 ;OP1=4000H(0.5/Q15)MPY OP2 ;OP2=4000H(0.5/Q15)PACSACH ANS,1 ;(ANS)=2000H(0.25/Q15)
定点乘法(续)整数乘整数Q0×Q0=Q017×(-5)=-850000000000010001=17×11111111111
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南名校教育联盟2025届高三12月大联考历史试卷(含答案解析)
- 联合办学协议书争议处理办法
- 合同数量减少补充协议
- 合同识别对比解决方案
- 课件音频教学课件
- 望岳教学课件
- 校园安全教育课件教学
- 《客房服务课件》课件
- 《保温杯市场调查》课件
- 玩转文献检索高效管理文献(一)医学信息检索基础知识
- 研发部绩效考核方案课件
- 数字化医院建设方案的信息系统整合与优化
- 冬季运动安全快乐冰天雪地以安全为先
- 中国脑卒中康复治疗指南课件
- 未来医疗2024年的AR手术眼镜
- 海南省2022-2023学年高一上学期期末学业水平诊断(一)数学试题
- 可爱的四川七年级上册期末质检及复习资料
- 最美教师的事迹演讲课件
- 人工智能概论(第二版)即问即答题目及答案 郭福春
- 《系统解剖学》课程考试复习题库大全-5骨骼部分
- 双T板吊装施工专项方案
评论
0/150
提交评论