版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Good is good, but better carries it.精益求精,善益求善。Ti公司DSP技术发展历程和现状及其应用实例分析-DSP应用技术论文学院:信息学院姓名:xxxxxx班级:电科0802学号:2008483602xxTi公司DSP技术发展历程、现状及其应用实例分析一、发展历程1、TI公司简介德州仪器(TexasInstruments),简称TI,是全球领先的半导体公司,为现实世界的信号处理提供创新的数字信号处理(DSP)及模拟器件技术。除半导体业务外,还提供包括传感与控制、教育产品和数字光源处理解决方案。TI总部位于美国得克萨斯州的达拉斯,并在25多个国家设有制造、设计
2、或销售机构。TI公司在1982年成功推出其第一代DSP芯片TMS32010及其系列产品TMS32011、TMS320C10/C14/C15/C16/C17等,之后相继推出了第二代DSP芯片TMS32020、TMS320C25/C26/C28,第三代DSP芯片TMS320C30/C31/C32,第四代DSP芯片TMS320C40/C44,第五代DSP芯片TMS320C5X/C54X,第二代DSP芯片的改进型TMS320C2XX,集多片DSP芯片于一体的高性能DSP芯片TMS320C8X以及目前速度最快的第六代DSP芯片TMS320C62X/C67X等。TI将常用的DSP芯片归纳为三大系列,即:T
3、MS320C2000系列、TMS320C5000系列、TMS320C6000系列。2、TI革新史1954年生产首枚商用晶体管;1958年TI工程师JackKilby发明首块集成电路(IC);1967年发明手持式电子计算器;1971年发明单芯片微型计算机;1973年获得单芯片微处理器专利;1978年推出首个单芯片语言合成器,首次实现低成本语言合成技术;1982年推出单芯片商用数字信号处理器(DSP);1990年推出用于成像设备的数字微镜器件,为数字家庭影院带来曙光;1992年推出microSPARC单芯片处理器,集成工程工作站所需的全部系统逻辑;1995年启用OnlineDSPLabTM电子实验
4、室,实现因特网上TIDSP应用的监测;1996年宣布推出0.18微米工艺的Timeline技术,可在单芯片上集成1.25亿个晶体管;1997年推出每秒执行16亿条指令的TMS320C6xDSP,以全新架构创造DSP性能记录;2000年推出每秒执行近90亿个指令的TMS320C64xHYPERLINK/view/822198.htmDSP芯片,刷新DSP性能记录,推出业界上HYPERLINK/view/720038.htm功耗最低的芯片TMS320C55xDSP,推进DSP的便携式应用;2003年推出业界首款ADSL片上调制解调器AR7;3、获得荣誉推出业界速度最快的720MHzDSP,同时演示
5、1GHzDSP;向市场提供的0.13微米产品超过1亿件;采用0.09微米工艺开发新型OMAP处理器。TI为全球众多的最终用户提供完整的解决方案:TI在DSP市场排名第一;TI在混合信号/模拟产品市场排名第一;1999年售出的数字蜂窝电话中,超过半数使用的是TI的DSP解决方案。其中,诺基亚、爱立信、摩托罗拉、索尼等世界主要手机生产厂商均采用TI的DSP芯片;全球每年投入使用的调制解调器中,有三分之一使用TI的DSP。TI是世界上发展最快的调制解调器芯片组供应商;全球超过70%的DSP软件是为TI的DSP解决方案而编写;TI占有北美图形计算器市场80%以上的份额;TI在世界范围内拥有6000项专
6、利。二、现状TMS320C5000系列DSP芯片目前包括了TMS320C54x和TMS320C55x两大类。这两类芯片软件完全兼容,所不同的是TMS320C55x具有更低的功耗和更高的性能。C54x是16为定点DSP芯片,适应远程通信等实时嵌入式应用的需要。C54x具有高度的操作灵活性和运行速度。其结构采用改进的哈佛结构,具有专用硬件逻辑的CPU,片内存储器,片内外设,以及一个效率很高的指令集。另外,使用C54x的CPU核和用户制定的片内存储器及外设所做成的派生器件,也得到了广泛的应用。C55x是C5000系列DSP中的子系列,C54x发展起来的,并与之原代兼容,以便保护用户在C54x软件上的
7、投资。C55x工作在0.9V时,功耗低至0.005mW/MIPS。工作在400MHz钟频时,可达800MIPS。和120MHz的C54x相比,其性能提高了5倍,功耗为C54系列的1/6。C55x的核具有双MAC以及相应的并行指令,还增加了累加器、ALU和数据寄存器。其指令集是C54x指令集的超集,以便和扩展了的总线结构和新增加的硬件执行单元相适应。TMS320C6000系列是TI公司从1997年开始推出的最新的DSP系列。该系列的第一款芯片C6201,在200MHz钟频时,达到1600MIPS。而2000年以后推出的C64x,在钟频1.1GHz时,可以达到8800MIPS以上,即每秒执行近90
8、亿条指令。C64x的片内DMA引擎和64个独立的通道,使其I/O带宽可达到2GB/s。C6000所采用的类似于RISC的指令集,以及流水技术的书用,可以使许多指令得以并行运行。C6000系列现在已经推出了C62x/C67x/C64x等3个子系列。C62x是一种新型定点DSP芯片。该芯片的内部结构与以前的DSP不同,内部集成了多个功能单元,可同时执行8条指令,其运算能力可达2400MIPS。C67x是继C62x系列后的一种新型浮点DSP芯片。该芯片的内部结构在C62x的基础上加以改进,内部结构大体一致。同时执行8条指令,其运算能力可达1GFLOPS。C64x是C6000系列中最新的高性能定点DS
9、P芯片,其软件与C62x完全兼容。C64x采用VelociTI1.2结构的DSP核,增强的并行机制可以在单个周期内完成4个1616位或8个88位的乘积加操作。采用两级缓冲机制,第一级中程序和数据各有16KB,而第二级中程序和数据共用128KB。增强的32通道DMA控制器具有高效的数据传输引擎,可以提供超过2GB/s的持续带宽。与C62x相比,C64x的总性能提高了10倍。实例分析需求分析随着网络和多媒体技术的发展,视觉通信的重要性和需求急剧增加,如桌面视频会议、移动终端、基于因特网的视频通信等。这些视觉信息内涵丰富,但数据量大,必须压缩数据。但采用多种方法压缩图像数据,其数据量仍然巨大,这就对
10、计算机处理速度、传输介质、传输方法和存储介质提出较高要求。因此,数据压缩作为数据图像处理的关键技术之一,对研究图像压缩编码技术具有重要价值。嵌入式微处理器中,DSP具有灵活、高速、便于嵌入式应用等优点,特别适合复杂算法处理的应用。数字视频图像压缩系统利用DSP作为其嵌入式平台,充分发挥其性能优势,较好地提高编码效率,满足图像实时处理需要。因此,这里介绍一种基于HYPERLINK/stock_TMS/TMS320VC5509A.htmlTMS320VC5509A型DSP的视频压缩系统。JPEG(JointPhotographicExpertsHYPERLINK/stock-ic/GROUP.ht
11、mlGroup)是由国际标准化组织(ISO)提出面向静止图像编码的标准,其处理方法依次使用离散余弦变换、量化、Z行扫描、游程编码和不变字长编码。JPEG算法定义了以下4种运行模式:(1)基于DCT顺序型模式按照从左到右、从上到下的顺序对图像进行扫描和编码,称为基本系统。(2)基于DCT递增模式按照从粗到细的顺序对一幅图像进行编码,适用于传输时间长、用户喜欢图像从粗糙到清晰的场合。(3)无失真编码模式保证重建图像与原始图像完全相同。(4)分层编码采用各种分辨率对图像进行编码。该系统采用基本系统模式。图1是JPEG的编码框图。硬件系统设计该视频压缩系统直接与PAL制摄像头的输出端相连,来采集、预处
12、理和压缩现场图像,再以USB或HYPERLINK/icstock/970/RS232.htmlRS232方式将处理后的图像数据传给上位机。图2为视频压缩系统硬件结构图。该系统硬件设计以TI公司的TMS320VC5509A型数字信号处理器为核心,包括视频采集电路、FPGA预处理电路、HYPERLINK/product/searchfile/310.html存储器扩展、系统电源和看门狗电路等。系统中TMS320VC5509A为中央处理器;HYPERLINK/icstock/613/SDRAM.htmlSDRAM为DSP外扩数据存储器;HYPERLINK/stock-ic/FLASH.htmlFla
13、sh为程序存储器,用于系统上电自举;模拟摄像头与视频ADHYPERLINK/product/searchfile/2619.html转换器负责视频图像采集;FPGA用于地址译码、隔行运算,控制两片HYPERLINK/icstock/221/SRAM.htmlSRAM用于缓存视频AD转换器转换后的数字图像。从系统设计成本考虑,这里选用HYPERLINK/icstock/131/ALTERA.htmlAltera公司的可编程逻辑器件HYPERLINK/icstock/866/EPIC6Q240C8.htmlEPIC6Q240C8型FPGA。该器件是Cyclone系列器件中一款BGA封装的可用IO引
14、脚最多的FPGA。31视频采集电路该系统选用的视频解码器为HYPERLINK/stock-ic/PHILIP.htmlPhilip公司的高性能视频AD转换器HYPERLINK/icstock/603/SAA7111.htmlSAA7111。该器件是一款广泛应用于桌面视频、多媒体、数字电视、图像处理、视频电话的高性能视频输入处理器件。该器件采用33V的CMOS电路,高度集成模拟前端和数字HYPERLINK/product/searchfile/2451.html视频编码器;包括2路模拟视频处理通道,1个时钟产生电路,1个自动箝位和自动增益控制电路,1个多制式数字解码器,1个亮度对比度饱和度控制电
15、路,以及色彩空间矩阵。HYPERLINK/stock-ic/SAA711.htmlSAA7111输出为16位VPO总线,支持不同位宽的数据输出格式。SAA7111支持的输出格式包括:12位YUV411,16位YUV4:2:2,8位CCIR-656、16位565RGB以及24位的888RGB。图3为视频采集电路。32存储器选型选择存储器应从以下方面考虑:首先图像压缩算法中间数据量大,要求处理器的片上内存尽可能大,尽量避免对外部存储器读写操作。VC5509A的片上存储器包括32Kx16位DARAM,96Kx16位SARAM,共128K位的存储空间。其中DARAM为双地址,在每个周期内可以对其进行两
16、次操作(2次读,两次写,一次读和一次写),这样大大增加片上存储器的利用率;其次,VC5509A片上资源丰富,包括I2C总线(多主从接口),3个McBSPs(1个与多媒体卡数字加密卡MMC/SD串行接口复用引脚)。利用FC总线对SAA7111的片内控制寄存器进行读写操作,非常方便实时控制SAA7111的工作状态;利用McBSP配合DMA,软件编程实现UART功能,无需专门的硬件UART,从而节省电路板空间:VC5509A采用144引脚HYPERLINK/stock-ic/LQFP.htmlLQFP封装,便于安装、调试;VC5509A功耗小,工作在200MHz主频下,功耗仅100mW,非常适合嵌入
17、式应用。33DSP供电电源电路DSP基本系统由独立的电源系统供电,而硬件平台的其他器件共用另一套电源供电系统。为了降低系统功耗,DSP一般采用低电压供电并且采用IO和CPU内核分开供电方式。VC5509A不同的工作频率要求不同的核电压,200MHz为16V,144MHz为135V,108MHz为12V。DSP的IO电压为33V。DSP供电电源电路如图4所示。选用TI公司的两款LDO电源器件HYPERLINK/stock-ic/TPS76801.htmlTPS76801和HYPERLINK/icstock/298/TPS75833.htmlTPS75833分别为DSP提供内核电压和IO电压。TP
18、S76801能给CPU内核提供最大1A的电流,电压在123V范围内可调。调整TPS76801的输入HYPERLINK/product/searchfile/294.html电阻值得到16V,135V,12V的核电压,DSP相应工作在200MHz,144MHz,108MHz的频率下。而TPS75833能提供最高3A的IO电流,对于低功耗的TMS320VC5509A,这已足够保证其工作在最大负荷状态。系统软件设计该系统软件设计的主要功能是实时采样现场的视频信号,然后对网像数据编码压缩并通过USB总线或RS232串口将图像数据传送给主机。系统主程序流程如图5所示,该系统软件设计可分为系统初始化、图像
19、采集、压缩编码和数据传输4个主要模块。系统上电后,DSP首先初始化,初始化主要包括:通过I2C总线初始化SAA7111,设置其工作模式;空间分配,HYPERLINK/icstock/260/EMIF.htmlEMIF的配置以保证外部存储器的正常访问;配置USB模块;设定DMA通道以及设定外部中断。然后DSP等待FPGA的中断。当DSP接收到FPGA的中断后,DSP设定标志寄存器,启动DMA读取数据,并进行编码。当编码结束后,DSP把数据交付USB模块,通过USB总线传送至上位机,同时DSP向FPGA发送空闲信号,通知FPGA继续发送下一帧。5JPEG优化JPEG算法在DSP上实现需要解决编码速
20、度问题。片上内存资源的有限性使得大部分的程序代码和数据不得不放在片外,大量的图像数据在慢速的SDRAM存储器中,对其访问和算术运算是影响系统性能的关键因素之一。因此,应从内存分配和代码优化两个方面来优化程序,提高编码效率。51数据内存优化由于VC5509A的片上存储器包括32Kx16位DARAM,96Kx16位SARAM,共128K位的存储空间。其中DARAM为双访问内存,即在一个周期内可完成两次数据访问,SARAM为单访问内存,即在一个周期内只能完成一次数据访问,片外内存为扩展的SDRAM,访问其需要额外的等待时间,执行效率比较低。因此在算法设计中应合理安排内存分配,尽量将访问频繁的程序代码
21、和数据放在片内内存中,特别是DARAM中,可以提高编码效率。52C代码优化在JPEG的编码中,根据VC5509A结构特点及结合图像数据量大的特点,提高编码效率,考虑程序编写和优化如下:(1)利用编译器优化,开启编译器的优化选项,包括基本优化、文件级优化和程序级优化。(2)使用本征(intrinsics)函数,C55x提供了一种特殊函数一本征函数,可迅速优化C代码。本征甬数前有个下划线“一”,调用方法和普通函数相同。(3)使用图像库,TI提供基于C55x的图像库IMGLIB,库中都是图像处理常用的函数,而且可以用C语言调用,汇编优化好,执行效率高,因此尽量用库函数。在JPEG编码中比较关键的是D
22、CT变换可调用库函数中的IMG_sw_fdct_8x8(HYPERLINK/icstock/293/SHORT.htmlshort*fdct_data,short,*inter_buffer),该函数完成一次DCT变换需用1078个时钟周期。大大提高JPEG的编码效率。(4)高效使用MAC硬件,C55x有专门的硬件高效执行MAC运算。一个周期中可以执行一个单乘加或一个双乘加(dual-MAC)运算。(5)使用特殊数据类型(register类型、volatile类型、const类型),对于需要多次重复访问的变量,如for循环中的变量值,一般可设置为register型变量。声明变量为register型能提高效率,但必须小心使用。在某些编译器
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024材料供应合同模板
- 2024年度咨询服务合同标的:企业管理咨询
- 2024年度城市轨道交通设备销售合同
- 2024年度企业广告发布合同具体条款
- 2024年品牌经理合作协议
- 2024年双层隔音门窗制作安装合同
- 2024年城市供水供电设施建设与运营合同
- 2024年度垃圾清运服务合同
- 2024年度智能工厂设计与建造合同
- 2024年度八宝山殡仪馆鲜花制品供应商资质审核与评估合同
- ISO20000认证-ISO20000差距分析报告
- GB/T 42195-2022老年人能力评估规范
- 第三章 信息系统的网络组建- 复习课件 2021-2022学年粤教版(2019)高中信息技术必修2
- GB/T 4909.4-2009裸电线试验方法第4部分:扭转试验
- 佛七精进念佛容易着魔请看祖师开示及个人感悟
- 中小学教师信息技术培训
- 幼儿园中班科学活动教案《奇妙的感官》
- 环境保护相关知识培训专题培训课件
- 复变函数与积分变换全套课件
- 儿科常用药物与急救药物-换算方法课件
- 压花制作(观赏植物学)课件
评论
0/150
提交评论