数字信号处理概述_第1页
数字信号处理概述_第2页
数字信号处理概述_第3页
数字信号处理概述_第4页
数字信号处理概述_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、DSP应用技术(一)应用技术(一)韩红彪韩红彪133633872876课程安排课程安排DSP概述TMS320C2000处理器TMS320C2000软件环境DSP系统设计理理论论30学时参考教材参考教材TMS320C2000系列DSP原理及应用技术 何苏勤 王忠勇 电子工业出版社DSP基础与应用系统设计 王念旭 北京航天航空大学出版社DSP芯片的原理与开发应用 张雄伟 陈亮 徐光辉 电子工业出版社DSP集成开发环境CCS开发指南 尹勇 欧光军 关荣锋 北京航天航空大学出版社Blackfin系列DSP原理与系统设计 陈峰 电子工业出版社DSP接口电路设计与编程 苏涛 蔡建隆 何学辉 西安电子科技大

2、学出版社参考教材参考教材 实时信号处理信号处理系统设计与实现 李玉柏 杨乐 李征 译 电子工业出版社 DSP应用系统设计 朱铭锆 赵勇 甘泉 电子工业出版社 高速数字系统设计 伍微 等译 机械工业出版社 TMS320C20 x Users Guide Texas Instruments Incorporated TMS320F/C24x DSP Controllers Reference Guide Texas Instruments Incorporated一 数字信号处理概述1.1 DSP技术概念1.2 数字信号处理优势1.3 DSP实际应用1.4 实时数字信号处理概念1.5 实时处理系统

3、组成1.6 通用DSPs芯片介绍1.7 DSPs芯片特点1.8 DSPs实现高速运算的途径1.9 DSP芯片性能指标以及选型依据1.1 DSP技术概念DSP:Digital Signal Processing: 数字信号处理理论和方法Digital Signal Processor: 可编程的用于数字信号处理的微处理器DSP/ARM/单片机的区别:DSP:适合于数字信号处理,例如FFT、数字滤波算法、加密算法和复杂控制算法等。 DSP根据名字就知道他是干嘛的了,一般用来作为专门处理数字信号。ARM:具有强大的事务处理功能,可以配合嵌入式操作系统使用。单片机:适用于简单的测控系统,功能相对简单,

4、价格较低 ARM是通用处理器,和x86一样,可以在上面跑各种操作系统。 单片机的工作ARM和dsp都能作,只是它便宜(而且有些单片机可靠性比arm和dsp都要强,比如工业控制用的单片机),主要当作简单的控制器来使用,比如工业中的温度控制等。DSP技术:技术: 将通用的或专用的DSP处理器用于完成数字信号处理的方法和技术。3D Stereo,MP3 Encoder/Decoder,Noise Reduction,VoIPPosition Control,Speed Control,RMS Signal MeasureV.17/V.21/V.29 Transmit/ReceiveHDLC Tran

5、smit/Receive,TCP/IP Protocol Stacks3-DES,AES,DES,DM5JPEG,MPEG Encode/DecodeDSP处理器主要性能的发展以及对将来的影响处理器主要性能的发展以及对将来的影响典型DSP处理器性能1980199020002010工艺水平(nm)300080010020速度(MIPS)540500020000RAM(Byte)2562K32K1M功耗(mW/MIPS)25001价格($)1501550.15MIPS:百万指令每秒1.2 数字信号处理优势 可控性强 稳定性高 精度高 抗干扰性能强 实现自适应性 数据压缩 大规模

6、集成可控性强可控性强 通过改变程序使微处理器实现不同的功能数字滤波器通过改变程序中的系数来实现低通、高通、带通等不同的滤波任务以及性能软件无线电技术在一个统一的以高性能DSP处理器为核心的硬件平台上,加载不同的程序来实现不同工作模式的电台通信虚拟仪器技术是以在同一硬件平台上获取外部采样信号,编写不同的软件来实现传统仪器的测量任务,甚至更为复杂的信号运算、信号产生等功能稳定性好稳定性好 较模拟系统,数字系统受时间和环境的影响小的多; 数字制造采用大规模集成电路,其故障率远比采用分立元件构成的模拟系统的低。精度高精度高 电阻精度:E961% 电容精度:D0.5% AD:16bit105抗干扰性能强

7、抗干扰性能强3.3v2.4v2.0v1.5v0.8v0.4v0vVccVOHVIHVTVILVOLGND3.3V TTL实现自适应算法实现自适应算法 强调系统的自我学习能力: 神经网络 遗传算法数据压缩数据压缩 目的:减小传输带宽 模拟信号:带限滤波,失真 数字信号:压缩数据,几乎无失真大规模集成大规模集成系统的一致性、可靠性显著提高系统功耗、体积日益减小模拟信号处理不可替代模拟信号处理不可替代 自然界的信号绝大多数都是模拟信号 模拟信号处理系统从根本上说是实时的 射频(RF)信号的处理要由模拟系统来完成调调理理AD01100010010001001.3 数字信号处理技术应用GPS导航CT成像

8、1.4 实时数字信号处理概念 实时指的是系统必须在有限的时间内完成外部输入信号的指定处理,即信号处理速度必须大于等于输入信号更新的速度,而且从信号输入到处理后输出的延迟必须足够的小。实时取决因素运算量数据率算法复杂度芯片速度常见信号的典型数据率音频信号音频信号: 采样时钟44.1KHz,字长16bit,则数据率88.2KBps 实时处理速度至少为88.2KBps视频信号:视频信号: 一帧画面512512点阵,每个像素点用16个色阶表示,当传输速率为30帧/秒时,则数据率15MBps 实时处理速度至少为15MBps结论:结论: 对实时信号处理速度的要求与原始模拟信号带宽以及数据格式(字长、维数)

9、、算法复杂程度等因素是密切相关的。目前单片DSPs的处理能力:TMS320C6455:主频1.2GHz, 9600MIPS(每秒96亿条指令)TMS320C6727:主频350MHz,2100MFLOPS(每秒21亿次浮点操作)ADSPTS201:主频600MHz,3600MFLOPS(每秒36亿次浮点操作)高性能的DSP使实时信号处理的应用空间越来越广阔。1.5 实时DSP系统组成 实时DSP系统实现框图 DSP子系统的实现方式 通用DSPs构成的子系统 DSP系统典型数据处理方式实时实时 DSP系统实现框图系统实现框图DSP子系统AD子系统DA子系统NL模拟信号模拟信号DSP子系统是整个系

10、统的核心DSP子系统实现方式子系统实现方式 通用微计算机 利用统一的平台,编写软件,实现不同的功能。这种方法缺点是速度太慢,不能用于实时系统,只能用于仿真研究。加速处理模块 在通用微机内部加入专用的加速处理模块,微机作为系统控制使用。缺点是不适合嵌入式应用。DSP子系统实现方式子系统实现方式单片机(MCS51) 单片机采用的是冯诺依曼总线结构,用它构成的系统比较复杂,尤其是乘法运算速度慢,在运算量大的实时控制系统中很难有所作为。专用DSP芯片 专用DSP芯片可用于FFT、FIR、卷积、相关等高速运算。一般速度较快,但是灵活性较差,而且开发工具不完善。可编程FPGA器件 利用VHDL或是Veri

11、logHDL硬件开发语言,通过软件编程来改变FPGA内部门阵列结构,最终用硬件实现特定数字信号处理算法。这种实现方法具有通用性、并行性,一般作为DSP芯片的协处理器。通用可编程DSP芯片 通用可编程DSP芯片有着更适合于数字信号处理的硬件特点和指令系统,而且其性价比随着微电子的发展不断提高,非常适合实现性要求高的应用领域。通用通用DSPs构成的子系统构成的子系统输入信号输出信号前向通道后向通道DSP芯片存储器数字I/O通讯以及人机接口DSP系统译码以及时序控制总线DSP典型系统框图前向通道示意图后向通道示意图物理信号传感器幅值调理及抗混叠滤波抽取A/D或V/f输出信号放大滤波平滑滤波信号转换D

12、/ADSP系统典型数据处理方式系统典型数据处理方式 数据流处理(Stream Processing) 数据是在一个输入样本到达后,就立即开始进行与该样本有关的运算,并在下一个样本到达之前完成。这种在下一个样本输入之前完成上一个样本处理的方法称为数据流处理方式。例如数字FIR滤波。 TxTc输入输出TcTx特点:每接收一个样本,就做一次新的运算。输入样本周期与输出样本周期保持一致。优点:其结果是随时更新的。输出样本和其影响的输出结果之间的时延达到理论的最小值。缺点:要求处理器的速度必须足够高,能在下一个样本到达之前完成所有计算。块处理(Block Processing) 首先将输入样本存放到存储

13、器中,当L个输入样本都到达以后,才开始处理。这种同时处理多个样本的方法称为块处理技术,也叫帧处理(Frame Processing)。 在块处理技术中,输入样本按组存储,当有足够多的样本到达后,开始处理这个样本块。主要应用在输出采样率小于输入采样率(采用间隔T)的场合,其计算时间限制在LT以内。 譬如傅里叶变换运算。 优点:减少频繁读写存储器所带来的额外开销,获得较高处理效率;可以使用较低速度的处理器。 缺点:时延以及足够的存储空间。存储块m存储块m1存储块m2处理块m处理块m1处理块m2存储块m3输入输出LTxTcTcLTx 矢量处理(Vector Processing) 同时处理多路输入/

14、输出信号的方法,称为矢量处理技术。 通常情况下,矢量处理用来计算两个信号之间的相关程度。矢量处理技术软件无线电数学模型1.6 通用DSPs芯片概述发展历程及现状DSP分类发展历程发展历程 第一代20世纪70年代末80年代初 特点:采用了哈佛结构,内部设置硬件乘法器。 第二代20世纪80年代中期 特点:与第一代相比,在功能、速度及内存容量方面有了很大突破,强化完善了指令功能及寻址方式。 第三代20世纪80年代末 特点:高速、多功能、大内存,并能进行32位浮点运算。第四代20世纪90年代末 特点:(1)支持片内多核或多片并行工作(2)片内海量的存储器,包括Cache(3)增强的DMA控制器(4)丰

15、富的外设及片内资源(5)低功耗,小尺寸如今:(1)强大高效的指令(2)支持高速的数据互联(3)日益丰富的片上资源(4)高效的开发工具http:/ controllerOn chip flash memory150MIPSTMS320F240 x:On chip flash memory20-40MIPS$ 2.00德州仪器TI公司DSP产品分类http:/ 数字多媒体芯片美国模拟器件(ADI)公司DSP产品分类http:/ Processor RoadmapSHARC Processor RoadmapTigerSHARC Processor Roadmap定点与浮点定点与浮点DSP芯片芯片D

16、SP芯片定点DSP芯片浮点DSP芯片结构较简单,MAC速度较快,运算精度低,动态范围小结构较复杂,主频较低,功耗较高,但运算精度高,动态范围大定点数据格式(定点数据格式(Fixed-Point)SBit15Bit0Bit15Bit0定点无符号数格式:数值范围02161补码数据格式:数值范围2152151整数的定点格式表示方法:整数的定点格式表示方法:例如:16 bit定点格式数据0 xF62A无符号数:有符号数:63018-2518小数的定点数据表示方法:小数的定点数据表示方法:数的定标确定定点格式数据中小数点的位置SBit15Bit0Q15 -1,0.9999695Q12-8,7.99975

17、59Q3-4096,4095.875Q0-32768,32767r 不同的Q值,表示数的范围不同r 不同的Q值,表示数的精度不同r 定点格式中,数的范围与精度是一对矛盾结论:转换关系:小数Xf转换为定点数Xd:Xdint(Xf2Q)定点数Xd转换为小数Xf:Xffloat(Xd2Q)例如:0.25的Q15表示法0.2521581920 x200081.546的Q4表示法0 xF809的Q4表示小数0 x4623的Q15表示小数179552150.54794381.546241304.7360 x0518203924127.4375数据格式(数据格式(Floating-Point)IEEE单精度

18、浮点格式:数据字长32bitSefbit31bit30bit23bit22bit0S 数符:1bit,表示数据正负e 阶码:8bit,无符号数,表示指数f 尾数:23bit,表示小数-0.75-(0.11)2-(1.1)2-1(-1)1(1.1)2(126-127) 浮点数(-1)S2(e-127)1.f0.75的IEEE单精度浮点格式数为:(BF400000)H1.7 DSPs芯片特点 算术单元 总线结构 流水技术 专用寻址单元 片内存储器 丰富的外设1. 算术单元算术单元n 硬件乘法器 硬件乘法器大大减少了乘法指令的运算时间,提高了DSP芯片在完成数字信号算法的运算性能。 硬件乘法器是DS

19、Ps区别早期通用微处理器的一个重要标志。 DSP芯片内部设置了多个并行操作的功能单元(ALU,乘法器和地址生成器),为进一步提高运算速度 。 多功能单元使DSP在单位时间内完成更多的操作,提高了程序执行速度。n 多功能单元2. 总线结构总线结构通用微处理器CPU冯诺依曼总线结构数字信号处理芯片DSP哈佛总线结构冯诺依曼总线结构哈佛总线结构改进的哈佛总线结构3. 流水技术流水技术定义:流水技术是将各指令的各个步骤重叠起来执行,即使得若干条指令的不同执行阶段可以处于同一时刻并行处理,这样每一个阶段称作一个流水。取指取数译码执行取指取数译码执行第n条指令第n1条指令指令周期12345678非流水指令

20、执行取指取数译码执行取指取数译码执行第n条指令第n1条指令指令周期123456流水指令执行取指取数译码执行第n2条指令可见,流水技术是提高DSPs程序执行效率的另一个主要手段。TMS320C62x/64x系列DSP流水线结构PG:程序地址产生PS:程序地址发送PW:程序访问等待PR:程序取指包接收DP:指令分配DC:指令译码E1E5:执行级的5个节拍4. 专用寻址单元专用寻址单元DSPs通常都有支持地址计算的算术单元地址产生器。地址产生器与ALU并行工作,地址的计算不再额外占用CPU时间。DSPs的地址产生器一般都支持直接寻址、间接寻址,完成地址的加减运算,而且有些DSPs还能够支持位反转寻址

21、(用于FFT计算)和循环寻址(用于FIR计算)。5. 片内存储器片内存储器DSP芯片片内存储器片内程序存储器ROMFlash片内数据存储器片内Cache程序Cache数据Cache6. 丰富的外设丰富的外设 时钟发生器(振荡器与锁相环PLL) 定时器(Timer),看门狗(watchdog) 软件可编程等待状态发生器 同步串口(SSP)、异步串口(ASP) 、主机接口(HPI) JTAG边界扫描逻辑电路(IEEE 1149.1标准) CAN总线、PCI总线、I2C接口 DMA控制器 ADC USB,USB OTG,MMC/SD EMIF(DDR2) Serial RapidIO ,EMAC,T

22、CP/IP1.8 DSP处理器实现高速运算途径 硬件乘法器及乘加单元 高效的存储器访问 数据格式 零循环开销 多个执行单元 数据流的线性I/O 专门的指令集1. 硬件乘法器及乘加单元硬件乘法器及乘加单元支持单周期的乘法指令单周期的乘加操作(MAC)2. 多个执行单元多个执行单元片内多个独立单元并行执行如TMS320C62x/67x片内8个功能单元,指令执行速度最高可8倍于主频3. 高效的存储器访问高效的存储器访问高效的存储访问存储带宽大,支持多操作数访问特殊寻址模式,地址修改灵活4. 数据格式数据格式DSP数据定点芯片浮点芯片5. 零开销循环零开销循环 支持高效的循环操作,在无须花费任何时钟周

23、期的情况下,实现FORNEXT循环。往往将这种特性称为“零开销循环”。6. 数据流的线性数据流的线性I/O 为了达到高性能低成本的输入和输出,大多数DSP处理器都有一个或多个专门的串口或并口,并采用线性的处理机制,例如低开销的中断和DMA,使得数据的传输不影响或尽可能少地影响处理器计算单元的工作。7. 专门的指令集专门的指令集DSP指令集设计目的最大限度使用处理器内部基本硬件,提高性能程序所占存储空间最小1.9 DSP芯片性能指标及选型依据 DSP评价方法 选型依据1. DSP评价方法评价方法传统性能评价完整应用评价核心算法评价 传统性能评价:传统性能评价:MIPS Millions of I

24、nstructions per Second 百万指令每秒MOPSMillions of Operations per Second 百万操作每秒MFLOPSMillions of Float Operations per Second 百万浮点操作每秒MACSMultiply-Accumulates per Second 乘加次数每秒误导:误导: 不同处理器的指令所完成的工作是不同的 完成同一项算法 所需的指令数是不同的 存储器的误导 能耗的误导 芯片数据吞吐量的误导完整应用评价:完整应用评价: 可以完整的评估不同系列DSP芯片完成某一特定应用任务的详细性能指标,包括执行时间、存储器使用、功

25、耗等指标。 真实的环境难以模拟,评价难以做到公平 难以确保不同DSP应用软件的最优 评价更依赖于系统而非DSP本身 评价系统成本过高核心算法评价:核心算法评价:BDTI (Berkeley Design Technology, Inc.) 提出了一种使用核心算法和应用测试的方法。它是介于过于简单的MIPS类指标和过于复杂的完全基于应用的指标之间的方法。核心算法是构成大多数信号处理系统的基本模块,其中包括FFT、滤波器等。BDTI核心算法函数描述应用举例复数块FIR复数块有限冲击响应滤波调制解调器的信道均衡实数块FIR样本块数据的FIR计算语音处理(G.728语音编码)单样本FIR实数的单样本F

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论