(计算机应用技术专业论文)基于dsp的多路语音记录仪的设计与实现.pdf_第1页
(计算机应用技术专业论文)基于dsp的多路语音记录仪的设计与实现.pdf_第2页
(计算机应用技术专业论文)基于dsp的多路语音记录仪的设计与实现.pdf_第3页
(计算机应用技术专业论文)基于dsp的多路语音记录仪的设计与实现.pdf_第4页
(计算机应用技术专业论文)基于dsp的多路语音记录仪的设计与实现.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕士学位论文 摘要 大容量的语音记录设备在交通、电力、公安、航空、军队、通信等领域有着广泛的 应用。目前普遍使用的有磁带录音机,录音电话,p c 机控制的磁盘等。前两类设备存 储量小,数据保存寿命短,而且模拟记录技术正在被数字的所取代;基于p c 机的则通 常有功能强大,系统复杂,设备笨重,成本较高,压缩率偏低,占用存储空间过大等特 点。随着数字语音信号处理技术,嵌入式技术和大容量半导体存储技术的迅速发展,研 究开发便携的数字式大容量多路语音记录设备具有重要的现实意义和推广价值。 本文开发的多路语音记录仪就是针对用户的实际需求而研制的。该记录仪采用t l 的 t m s 3 2 0 v c 5 5 0 9 为核心处理器,i t u 的g 7 2 9 a 作为语音编解码算法。本文的三个主要 工作是依据核心处理器特点和用户需求设计共实现硬件系统,移植且c o s - 】i 操作系统、 定制f a t l 6 文件系统和开发设备驱动程序,在该软硬件系统上优化g 7 2 9 a 算法并实现 多路语音编解码功能。如何充分利用软硬件资源,结合g 7 2 9 a 算法的特点对其进行有 针对性的和有效的优化是本文的重点和难点。首先,将g 7 2 9 a 算法移植到目标平台上, 然后,有效的利用处理器的硬件宏指令,双乘加单元,双累加器单元,零开销循环和跳 转等资源,结合g 7 2 9 a 算法的特点,采取算法级,c 语言级,编译器级和特定函数级 等4 个级别的不同优化措旌对它进行优化。最终将该算法从最初的5 3 6 个m i p s 优化到 1 8 个m i p s ,性能提升了近3 0 倍。在此基础上,使用x d a i s t m 技术和d s p b i o s t m 技 术,实时实现了多路语音编解码功能。本系统还增加了语音识别功能。 本文首先简要介绍了课题背景及相关技术。其次,简要介绍了系统的整体设计方案。 再次,详细介绍了硬件系统的设计与实现。硬件系统以t m s 3 2 0 v c 5 5 0 9 为核心,包括 s d r a m ,f l a s h ,电源模块,音频数据采集回放单元,m m c s d 卡,u s b 接口,r s 2 3 2 接口,l c d 显示器和键盘等外围电路。接下来,介绍y 肛c o s i i 的移植,f a t l 6 的定 制,以及驱动程序的开发等工作内容。最后,详细介绍了如何优化g 7 2 9 a 算法,实现 多路语音编解码功能和语音识别功能。 论文最后对全文做了总结,并对多路语音记录仪的应用前景和其它应用做了展望。 关键词:数字信号处理器;g 7 2 9 a ;x d a i s :# c o s li ;f a t l 6 朱杰:基于d s p 的多路语音记录仪的设计与实现 d e s i g na n di m p l e m e n t a t i no fm u l t i c h a n n e ls p e e c hr e c o r d e r b a s e do n d s p a b s t r a c t l a r g ec a p a c i t ys p e e c hr e c o r d e ri sv e r yu s e f u li nt h ef i e l do ft r a f f i c ,e l e c t r o n i cs y s t e m , p u b l i cs e c u r i t y ,a v i a t i o n ,m i l i t a r ya n dc o m m u n i c a t i o n ,e t c t a p er e c o r d e r ,p h o n er e c o r d e ra n d h a r d d i s kc o n t r o l l e db yp ca r eo f t e nu s e dn o w t h ec h a r a c t e r i s t i c so ft h ef i r s tt w od e v i c e sa r e l o wc a p a c i t y ,s h o r td a t al i f e ,a n da n a l o gi sb e i n gr e p l a c e db yd i g i t a l ;t h o s eo ft h el a s to n ea r e s t r o n g ,c o m p l e x ,h e a v y ,h i 曲c o s t ,l o wc o m p r e s s i n gr a t e ,h i g hs t o r a g em e m o r yc o m m a n d ,e t c w i t ht h ef a s td e v e l o p m e n to fd i g i t a ls i g n a lp r o c e s s i n g ,e m b e d d e ds y t e ma n dm a s ss t o r a g e ,i t s m e a n i n g f u la n dp r a c t i c a lt od e v e l o pd i g i t a lp o r t a b l el a r g ec a p a c i t ys p e e c hr e c o r d e r t h em u l t i c h a n n e ls p e e c hr e c o r d e ri sd e v e l o p e da c c o r d i n gt ou s e r sr e q u i r e m e n t s t h i s r e c o r d e rt a k e st m s 3 2 0 v c 5 5 0 9a sc o r ep r o c e s s o ra n dg 7 2 9 aa sc o d e c d e s i g n sa n d i m p l e m e n t sh a r d w a r es y s t e m ,t r a n s p l a n t sp c o s i ir t o s ,c u s t o m i z e sf a t l 6f i l es y s t e m , d e v e l o p sd e v i c ed r i v e r s ,a n do p t i m i z e sg 7 2 9 aa l g o r i t h ma tt h i ss p e c i f i cp l a t f o r m ,t h e s ea r e3 m a i n l yw o r k si nt h i sp a p e r h o wt of u l lu s eo fr e s o u r c ea n dc o m b i n eg 7 2 9 a sc h a r a c t e r i s t i c t o o p t i m i z eg 7 2 9 ae f f e c t i v e l y a r et h ei m p o r t a n c ea n dd i f f i c u l t yi nt h i s p a p e r f i r s t , t r a n s p l a n t sg 7 2 9 at ot a r g e t ,t h e n ,u s e sh 盯d w a r em a y oi n s t r u c t i o n ,d u a lm a cc e l l s ,d u a la c e l l s ,z e r oc o s tl o o pa n dj u m p ,c o m b i n e sg 7 2 9 aa l g o r i t h m ,t a k e st h el e v e lo fa l g o r i t h m ,c l a n g u a g e ,c o m p i l e ra n ds p e c i f i cf u n c t i o ns c h e m et oo p t i m i z eg 7 2 9 a a f t e ro p t i m i z a t i o n ,t h e c o m p l e x i t yd e c r e a s ef r o m5 3 6 m p st o1 8 m i p s ,t h ep e r f o r m a c ew a se n h a n c e da b o u t3 0 t i m e s o nt h i sb a s i s ,u s e sx d a i s t ma n dd s p b i o s t mt oi m p l e m e n tm u l t i c h a n n e lc o d e c i ta l s o a d d ss p e e c hr e c o g n i t i o nt ot h i sr e c o r d e r f i r s t l y ,t h i sp a p e r i n t r o d u c e sp r o j e c tb a c k g r o u n da n dr e l e v a n tt e c h n o l o 百e s b d e f l y s e c o n d l y ,i ti n t r o d u c e st h ew h o l ea r c h i t e c t u r eo ft h i sr e c o r d e r t h i r d l y ,i ti n t r o d u c e sd e s i g n a n di m p l e m e n to fh a r d w a r es y s t e m ,w h i c hi n c l u d i n gs d r a m ,f l a s h ,p o w e rm o d u l e ,t h e i n t e r f a c eo fa u d i oi o ,m m c s dc a r d ,u s b ,r s 2 3 2 ,l e dm o n i t o r a n dk e y b o a r d ,e t c f o u r t h l y ,i ti n t r o d u c e sh o wt ot r a n s p l a n tp c o s i i ,c u s t o m i z ef a t l 6f i l es y s t e m ,a n d d e v e l o p d e v i c e d r i v e r s f i n a l l y ,i t i n t r o d u c e sh o wt o o p t i m i z eg 7 2 9 a , i m p l e m e n t m u l t i c h a n n e lg 7 2 9 ac o d e ca n ds p e e c hr e c o g n i t i o ni nt h i sp a p e r i nt h ee n d ,t h ep a p e rs u m m a r i z e sa l lt h ew o r k ,i n c l u d i n go fa p p l i c a t i o na n dd e v e l o p m e n t o fm u l t i c h a n n e ld i g i t a lr e c o r d e ri nt h ef u t u r e k e yw o r d s :d s p ;g 7 2 9 a ;x d a i s ;t z c o s i i ;f a t l 6 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均己在论文中做了明确的说明并表示了谢意。 大连理工大学硕士学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名: 导师签名: 装j 参 大连理工大学硕士学位论文 1 绪论 1 1 课题背景及国内现状 ( 1 ) 语音记录仪的应用场合 语音是人类进行交流时使用最多、最自然、最基本也是最重要的信息载体之一。人 们在交谈或者发表言论的同时,有时往往也希望能将说过的话记录下来。 电话是人们日常生活和工作中非常重要的联系方式之一,人们在享受电话方便快捷 的同时也为电话内容无法记录而烦恼。有些事情事后说不清,容易造成不必要的麻烦。 为了能够再现谈话的内容,就要求将相应的语音记录下来,尤其是商业电话录音,供电、 供水、生产调度录音,投拆电话、热线电话、电话订购各类企事业单位热线服务电话录 音,关键岗位电话录音,传呼台录音,金融证券录音,公安报警录音,安全部门的监昕 电话,航空、铁路、交通运输调度录音及各行业的生产调度录音等,对语音内容的精确 记录显得尤其重要。 例如,当基于法律需求或责任认定等原因,需要保留通话过程的录音时,配备一套 完善的语音录音系统便显得极为重要。在电力系统中,在发电厂的调度室内需要对调度 员发出的调度指令进行语音记录,在变电站的设备操作室内对操作员的操作指令进行语 音记录,一旦出现意外,可以用该语音记录设备作为事故调查依据。在商业上,记录有 价值的商业资料,便于将来决策,并能提供必要的法律证据。飞机上的黑盒子也是如此, 它可以自动将机组人员的通话和驾驶舱内的声音记录在磁带上。一旦飞机出现事故,它 能帮助事故检查人员快捷准确的找到事故的原因。关于语音记录系统的重要应用场合很 多,不一一列举。 如上论述可知,如何准确无误的保留通话录音是一个很重要的课题。企事业单位或 者个人的这种需求就推动了语音记录技术的发展。那么,目前语音记录设备的现状如何 呢? ( 2 ) 语音记录仪现状 目前,在电力、铁路、工厂等系统调度部门仍普遍使用单片机控制的磁带录音机, 录音电话或p c 机控制的磁盘或磁带机监控系统。前两类语音监控系统的设备自动化程 度差、存储量小、存储介质易损坏、丢失,数据保存寿命短,监控信息管理操作不便, 而且模拟语音记录技术正在被数字的所取代,相应设备也将退出这个市场,目前的语音 记录技术大多是基于数字技术的;而基于p c 机的数字录音系统通常是较为复杂的多路 朱杰:基于d s p 的多路语音记录仪的设计与实现 话音监控系统,成本较高,语音信号压缩率偏低,空间利用率较低,导致占用存储空间 过大、记录时间较短等旧j 。 通过调查,也了解了不少国内厂商的语音记录产品。例如,天津允能日新科技发展 有限公司开发的t f - 2 0 0 0 数字式通讯记录仪,它将语音信号通过d s p 压缩后存储在计 算机的硬盘中,并使用工控c p u 卡、d o s 操作系统,可以提供4 1 6 路语音输入接口。 南京铁路通信信号工程有限责任公司开发的d r 一9 9 0 0 和c r 一1 0 0 a 、b 型数字式语音时间 记录仪都是基因p c 机的,便携式的语音记录设备很少见。北京易卡软件公司的 m d r 3 0 0 0 4 0 0 0 9 0 0 0 9 5 0 0 录音系统和m d r 机场金融行业电力公安部门专用录音系 统,北京润普科技的r p r l l ,2 3 4 5 0 0 0 ,深圳市灵创通科技有限公司的通用型录音系统 呼叫中心录音系统u s b 便携录音系统电脑话务员系统的电话录音系统,都是基于p c 机的,压缩率偏低,2 0 g 的硬盘空间可记录7 0 0 至3 5 0 0 个小时,这些录音系统大多可 同时处理8 至1 2 8 路电话语音,有较强的查寻、管理和控制等功能。上海纽顿兰信息科 技有限公司的产品除具有上述特点外,压缩率相对较高,4 0 g 的硬盘最多可以保存1 5 0 0 0 多个小时。 ( 3 ) 用户的实际需求 录音仪的用户主要分为两类,即企事业单位和个人用户。前者对语音记录系统的容 量、记录时间、功能要求很高,并且要求提供相应的管理软件对语音数据进行查询管理 等操作。而个人用户则更侧重便携性、实用性和语音效果,这部分市场同样巨大。m p 3 解码器在个人用户群中的广泛普及,使得相应的开发商和制造商获得丰厚的回报,经过 调查研究,我认为语音记录是一个很有潜力的市场,出于某种目的,人们往往喜欢将说 话的内容或者发表的言论记录下来,这样就会培育出这个巨大的市场。 大连安特电力有限公司在作了相关的市场调查后,综合用户的需求,委托我们实验 室开发便携式数字语音记录设各,目前的客户主要是针对电力系统的,该录音设备将会 用在电力防误系统中,用于记录调度员下达的调度指令和现场操作人员的操作指令。为 了有更好的竞争力,公司除要求该设备除具有高压缩率、良好的录音效果外,还要求其 具有便携性,以方便用户在移动中使用。将来,准备将该产品提供给个人用户,这个市 场更大,但是个人用户的需求是多种多样的,要想满足他们的要求需要做更多的努力。 ( 4 ) 便携式多路语音记录仪的技术可行性分析 随着数字语音信号处理技术,嵌入式技术和半导体技术的发展,使得利用高压缩率 的语音压缩算法,强处理能力的数字信号处理器,大容量的半导体存储设备开发高压缩 率的超长记录时间的多路便携式语音记录设备成为了可能。 大连理二t :大学硕士学位论文 目前数字信号处理的实现大都采用通用的数字信号处理器即d s p 芯片实现。目前的 d s p 市场中,t i ( 德州仪器) 占有的市场份额最大,产品线也最全,相应的开发资料工 具也很完备。t i 的d s p 产品目前分为3 大类,t m s 2 0 0 0 系列,t m s 5 0 0 0 系列和t m s 6 0 0 0 系列。c 2 0 0 0 系列面向量大面广的工业控制产品,在保证高性能的情况下尽量保持低价, 其中,u 堙4 0 6 的性能可达4 0 m i p s ,f 2 8 1 2 可达1 5 0 m i p s ;c 5 0 0 0 系列定位于通信类应 用,在保证高性能的情况下,尽量降低芯片的功耗,从而有利于便携式通信产品及其它 便携式仪器的推出,其中,v c 5 4 0 9 的性能为1 6 0 m i p s ,v c 5 5 0 9 的性能为2 8 8 m i p s , v c 5 5 1 0 为4 0 0 m i p s ,v c 5 5 0 2 可达6 0 0 m i p s ;c 6 0 0 0 系列定位于高档次的应用,如多 媒体、图像及其它超高速信号处理的场合,6 2 0 1 为1 6 0 0 m i p s ,6 2 0 3 为2 4 0 0 m i p s ,6 4 1 1 为2 4 0 0 m i p s ,6 4 1 5 6 可达5 7 0 0 m i p s 。d s p 芯片的处理能力大体就是这样一种情况,同 时它也在不断发展,几乎每隔几个月就会有更强的新产品出现。 目前常用的语音编解码算法有a 。l a w ,u 1 a w ,g 7 1 1 ,g 7 2 1 ,g 7 2 3 1 ,g 7 2 6 ,g 7 2 8 , g 7 2 9 等算法,其中a - l a w ,u l a w 和g 7 1 1 复杂度很小,不到1 m i p s ,g 7 2 3 1 为1 6 m i p s , 编码率为6 4 k b p s ;g 7 2 8 为3 3 m i p s ,编码率为1 6 k b p s ;g 7 2 9 为2 0 m i p s ,编码率为8 k b p s ; g 7 2 9 a 为1 0 5 m 口s ,编码率为8 k b p s 。 目前,在具有通信质量的中、低码率语音编码中,1 6 k b p s 和8 k b p s 编码的技术已经 标准化和产品化;4 - - 8 k b p s 编码是标准化制定和实用产品竞争的热点,主流仍为c e l p 技术;码率在4 k b p s 以下的编码,将成为今后研究的焦点。 经过这番分析,可以知道,以前的多通道语音记录系统,受处理器运算能力和价格 的限制,一般采用a - l a w 、1 a w 或a d p c m 等作为压缩语音的算法,这些算法运算量 小,压缩率低,占用存储空间大。近年来随着数字语音信号处理技术,嵌入式技术和半 导体存储技术的迅速发展,各种数字语音压缩技术不断完善,d s p 性价比不断提高,这 使得性能更好的语音压缩算法可用在语音记录设备上。由此可以得出结论,只要选用合 适的d s p 芯片和语音压缩算法,完全可实现便携式的大容量的超长记录时间的语音记 录仪。 文中多路语音记录仪是一种便携式录音设备,它采用t m s 3 2 0 v c 5 5 0 9 作为核心处 理器,g 7 2 9 a 标准算法为语音编码方案,移植嵌入式实时操作系统u c o s i i 管理系统 软硬件资源,同时采用f a t l 6 文件系统组织语音编码数据,在这样的软硬件平台上, 充分利用软硬件资源,结合g 7 2 9 a 算法特点,对其进行优化,使得算法的计算复杂度 从最初的8 3 6 m i p s 降为1 8 m i p s ,进一步利用x d a i s t m 技术和d s p b i o s t m 技术实时实 现多路语音编解码算法。该录音仪可以通过软件管理语音的采集、存储、查询和回放, 另外还设置了相关通讯控制端口,方便录音系统与外界进行信息交互。 朱杰:基于d s p 的多路语音记录仪的设计与实现 涉及的相关技术和多路语音记录仪的设计与实现会在下文中给出具体阐述。 1 2 数字语音信号处理相关技术简介 n ) 数字信号处理技术 数字信号处理是一门涉及许多学科雨又广泛应用于众多领域的学科。它利用计算机 或专用处理设备,以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别 等处理,以得到符合人们需要的信号形式。数字信号处理的实现方法一般有以下几种1 3 1 : 在通用的p c 机上用软件实现,速度较慢,一般用于d s p 算法的模拟; 用通用的单片机实现,这种方法可用于一些不太复杂的数字信号处理; 用通用的可编程d s p 芯片实现。与单片机相比,d s p 芯片具有更加适合于数字 信号处理的软件和硬件资源,可用于复杂的数字信号处理算法,应用广泛; 用专用的d s p 芯片实现。在一些特殊的场合,要求信号处理速度极高,用通用 d s p 芯片很难实现,例如专用于h 丌、数字滤波、卷积、相关等算法的d s p 芯片,它 将相应的算法用硬件实现,无需进行编程,专用性很强,但应用受限。 化) 数字信号处理器 数字信号处理器,是一种特别适合进行数字信号处理运算的微处理器,主要用于实 时快速的实现各种数字信号处理算法。 根据数字信号处理的要求,d s p 芯片一般具有哈佛结构,多总线结构,流水线结构, 多处理单元和特殊的d s p 指令等主要特点【4 】。当然,与通用微处理器相比,d s p 芯片的 其它通用功能相对较弱。衡量d s p 芯片的性能指标主要有处理器主频,计算精度,片 上硬件资源和芯片的功耗等。 目前市场上的d s p 芯片制造商主要有t i 公司,m o t o r o l a 公司,a d 公司等,其中 占的市场份额最大,产品线也最全。 1 1 公司是目前世界上最大的d s p 芯片供应商,占全世界d s p 市场份额的5 0 左右。 t i 目前主推的d s p 芯片有c 2 0 0 0 系列、c 5 0 0 0 系列和c 6 0 0 0 系列。其中,c 2 0 0 0 系列 面向量大面广的工业控制产品,在保证高性能的情况下尽量保持低价;c 5 0 0 0 系列定位 于通信类应用,在保证高性能的情况下,尽量降低芯片的功耗,从而有利于便携式通信 产品及其它便携式仪器的推出;c 6 0 0 0 系列定位于高档次的应用,如多媒体、图像及其 它超高速信号处理的场合。 ( 3 1 语音信号处理技术 语音是人类进行交流时使用最多、最自然、最基本也是最重要的信息载体。科研人 员对语音信号的研究主要集中在语音编码、语音识别、说话入识别和语音合成等技术领 大连理:c 大学硕士学位论文 域,这些技术都是基于对语音信号特征的认识,都是要利用数字信号处理技术来分析和 处理数字语音信号,而更深层次的发展涉及人的发音和听觉机理,与生理学、语言学甚 至心理学相关。本文涉及语音识别和语音编码两部分,下面加以简单介绍。 语音识别技术简介。 语音识别就是在声学模型的基础上,提取对识别有用的特征信息,利用适当的判决 方法进行决策。语音识别核心技术有声学模型、特征提取算法和搜索算法等睁j 。 建立声学模型是一切工作的前提。目前的声学模型还不是很完善,大家比较认可的 是由激励源模型、声道模型和辐射模型复合而成的语音信号模型。 特征提取算法的目的是对信号进行分析,提取对研究目的有用的语音特征。语音识 别系统一般侧重提取反映语义的特征参数即激励源模型参数,尽量去除说话人的个人信 息;而说话人识别系统则恰恰相反。选取的特征应尽量满足以下条件:能有效的代表语 音特征,具有很好的区分度;各阶参数之间有良好的独立性;特征参数计算方便。 常用的特征参数有平均能量,过零率,l p c 预测系数,l p c c 倒谱系数,m e l 倒谱 系数、共振峰和基音厨期等。 搜索算法,即特征匹配算法,是在选取特征的基础上,将当前的特征参数与系统库 中的模板进行比较,给出判定结果的过程。 语音识别所应用的特征匹配算法主要有:欧氏距离法、矢量量化( v q ) 、动态时i 曰规 熬技术( d t w ) 、隐马尔可夫模型( h m m ) 年u 人工神经网络模型( a n n ) 等方法。 语音压缩编码技术简介。 语音编码系统由编码端和解码端两部分组成。编码端具有信息压缩功能,它首先将 原始语音信号经过滤波和a d 转换变成数字语音信号,然后对其进行分析处理,最后经 过量化,产生二进制比特流,送入信道传输或存储;而解码端的作用是解压缩,是编码 端的逆过程,它先将得到的二迸制数字序列经过解码恢复成数字语音信号,然后经d a 转换和滤波,得到可懂的重建语音信号。图1 1 描述了一个基本的语音编码系统。 辅 碌始 语音 。一 垂习1 ,团咂至圈一( 三卜一二:盖 输出重建 语音 囱窗 f = = = 习r l 存储 传输 舟质信道 、。l _ j j 垂 , 三) - - 臣亘至卜回一l l,r 图1 1 语音编解码框图 f i g 1 1c o d ea n dd e c o d ea r c h i t e c t u r e 朱杰:基于d s p 的多路语音记录仪的设计与实现 语音编码技术是数字语音信号处理最重要的一种应用,它的目的在于用尽可能低的 比特率来获得尽可能高的合成语音质量。降低编码率的理论依据是语音信号本身的冗余 和人耳听觉的掩蔽特性。目前主要有波形编码、参数编码和混合编码三种编码技术1 6 j 。 波形编码:它直接对信号波形编码,技术简单,适应能力强,重建语音质量好,但 是编码率较高。如脉冲编码调制佃c m ) 、自适应差分编码( a d p c m ) 和自适应增量调制 ( a d m ) 等属于语音波形编码,一般能在1 6 3 2 k b i t s 的速率上给出较高的编码质量,但速 率降低时,其性能会下降较快。 参数编码:它对信号特征参数进行提取和编码,在解码端,力图重建原始语音信号, 压缩率较高,效率较高。但算法复杂度较大,合成语音的自然度不好,抗背景噪声能力 较差。典型的参数编码器有共振峰声码器、同态编码及应用较广的线性预测声码器( i j p c ) 等。 混合编码:该算法最大限度的克服了原有算法的缺点,而综合了它们的优点。例如 码本激励线性预测编码( c e l p ) ,多脉冲激励线性预测编码( m p l p c ) 等混合编码,它们 都能在4 1 6k b i t p 中低编码速率上得到高质量合成语音。 1 3 嵌入式系统简介 当今世界,以计算机技术、芯片技术和软件技术为核心的嵌入式技术取得了迅猛发 展,广泛渗透到工业控制、家电、娱乐、艺术等各个领域。现代控制技术、多媒体技术 与i n t e m e t 的应用与普及,促使消费电子、计算机、通信一体化趋势步伐加快,使得嵌 入式技术成为一个新的研究热点吼 现在,嵌入式系统在各行各业有着广泛的应用,但它的定义还没有公认的标准。一 般来说,嵌入式系统被定义为:以应用为中心、以计算机技术为基础、软件硬件可裁剪 以适应应用系统对功能、可靠性、成本、体积、功耗严格要求的专用计算机系统l “。 嵌入式系统一般指非p c 系统,通常由硬件和软件两部分组成。硬件包括微处理器、 存储器及外设器件和加端口、图形控制器等。软件包括系统软件和应用软件。嵌入系 统有三个明显的特征:专用性、实时性、可靠性。专用性是指嵌入式计算机系统用于特 定设备完成特定任务。实时性是指与实际事件的发生频率相比,嵌入式系统能够在可预 知的极短时间内对事件或用户的干预做出响应。可靠性是指嵌入式计算机嵌入到系统或 设备中,用户一般不直接接触控制,因此一旦工作就要求它可靠运行【“。 嵌入式系统作为专用计算机系统与通用计算机相比有许多典型特征: ( 1 ) 嵌入式系统是在特定领域内完成特定功能的专用计算机系统。 大连理下大学硕士学位论文 ( 2 ) 嵌入式系统的硬件和软件都必须高效率地设计,力争在同样的硅片面积上实现 更高的性能,相对于通用计算机而言,嵌入式系统的资源是有限的。 ( 3 ) 嵌入式系统一般是实时系统,而且软件要求固化存储,以提高速度。 ( 4 ) 嵌入式系统是高可靠的独立运行系统。嵌入式系统一般不与人交互,独立运行, 所以系统稳定性要好,并有自动纠错能力。 ( 5 ) 嵌入式系统开发采用独特的宿主机一目标机交叉开发模式,在这个环境下调试 好目标机的硬件和软件,才能使目标机( 最终的嵌入式系统) 脱离开发环境,独立运行。 嵌入式系统中的核心部分是处理器,常用的有以下几类:微控制器o 讧i c r oc o n t r o l l e r u n i t ,m c u ) ,d s p 处理器( d i g i t a ls i g n a lp r o c e s s o r ,d s p l ,微处理器( m i c r op r o c e s s o ru n i t , m p u ) ,片上系统( s y s t e mo nc h i p ,s o c ) 等。常见的嵌入式c p u 有8 0 5 1 系列,x 8 6 , p o w e r p c ,6 8 k ,a r m ,d s p 等。 嵌入式软件,严格来说应该由系统软件和应用软件组成,应用软件的编写取决于具 体的应用,系统软件一般指嵌入式实时操作系统限e a lt i m eo p e r a t i n gs y s t e m ,r t o s ) 。 r t o s 大体分为商用型和免费型两种。商用型的r t o s 功能稳定、可靠,有完善的技术 支持和售后服务,但往往价格昂贵,目前主要有v x w o r k s 、w i n d o w se m b e d d e d 、p a l mo s 和q n x 等。免费型的r t o s 在价格方面有优势,目前主要有l i n u x 和肛c o s 两种。 1 4 本文工作与内容组织结构 本文的主要工作如下: ( 1 ) 研究学习d s p 芯片的相关开发技术,设计并实现了以t m s 3 2 0 v c 5 5 0 9 为核心 处理器的硬件系统。 ( 2 ) 研究学习数字语音信号处理相关技术,设计并实现了特定人、小词汇量、孤立 词的语音识别系统。 ( 3 ) 研究学习g 7 2 9 a 语音编解码的算法原理,侧重研究了编码原理中的自适应码 本参数和固定码本参数求解过程,掌握了g 7 2 9 a 算法的特点。在此基础上,在 t m s 3 2 0 v c 5 5 0 9 硬件平台上,对g 7 2 9 a 实现算法进行优化。并先后在p c 机和d s p 上 进行优化测试,测试结果显示,通过优化,大大的降低了算法复杂度,使之可以在d s p 上实时实现多路语音编解码。 ( 4 ) 完成移揖, c o s i i 操作系统内核,定制f a t l 6 文件系统,实现g 7 2 9 a 的 x d a i s 算法,开发系统的设备驱动程序等工作。 本文的组织结构如下: 朱杰:基于d s p 的多路语音记录仪的设计与实现 第一章绪论,简要的介绍了课题的产生背景,数字语音信号处理和嵌入式系统相 关技术,以及本文的工作和组织结构。 第二章系统整体功能设计,简要的论述了系统的整体功能,系统中的单元模块和 后续工作的重点。 第三章硬件系统的设计与实现,首先简要介绍了处理器的选型原则和 t m c 3 2 0 v c 5 5 0 9 芯片的特点,然后详细介绍了系统硬件平台设计方案,包括s d r a m , f l a s h ,电源模块,晶振模块,音频数据i o 接口,m m c s d 卡接口,u s b 接口,r s 2 3 2 接口,l c d 显示器接口,键盘接口和扩展槽接口等外围电路的设计。 第四章软件系统的开发,主要涉及至峨c o s h 操作系统的移植,f a t l 6 文件系统 的开发,设备驱动程序的开发几个部分。 第五章g 7 2 9 a 在d s p 上的优化与语音识别功能的实现,详细介绍了g 7 2 9 a 算法 在t m s 3 2 0 v c 5 5 0 9d s p 硬件平台上的优化过程,并给出了优化后的测试结果说明,以 及如何实现多路g 7 2 9 a 语音编解码功能和语音识别功能等几部分。 最后,在结论部分总结了论文中讨论的内容并对多路录音系统在其它方面的应用和 发展前景作了展望。 大连理 = :大学硕士学位论文 2 系统整体功能设计 近年来随着各种数字语音压缩技术不断完善,d s p 芯片性能不断提高,这使得性能 更好的语音压缩算法可用于语音记录系统,开发便携式数字语音录音系统成为可能。 文中录音仪是一种便携式录音设备,它采用t m s 3 2 0 v c 5 5 0 9 作为核心处理器 g 7 2 9 a 标准算法为语音编码方案,移植嵌入式实时操作系统u c o s i i 管理系统硬件资 源和软件资源,同时采用f a t l 6 文件系统组织语音编码数据。该录音仪可以通过软件 管理语音的采集、存储、查询和回放,另外还设置了相关通讯控制端口,方便录音系统 与外界进行信息交互。图2 1 所示为语音记录仪的总体结构框图。 图2 1 多路语音记录仪的系统总体结构框图 f i g 2 1s y s t e ms t r u c t u r ef r a mo fm u l t i c h a n n l es p e e c hr e c o r d e r 多路语音记录仪以t m s 3 2 0 v c 5 5 0 9 为核心:以连接在m c b s p 0 上的t l v 3 2 0 a i c 2 3 为音频数据的采集回放单元;对应的存储介质包括连接在存储c e 0 空间的s d r a m - - 朱杰:基于d s p 的多路语音记录仪的设计与实现 m t 4 8 l c 4 m 1 6 a 2 t g ,连接在存储c e l 空间的f 1 a s h 一2 9 l v 8 0 0 r i t a 和连接在m c b s p 2 上 的m m c s d 卡;以连接在u s b 接口上的u s b 设备和连接在m c b s p l 上的r s 2 3 2 接口 为本系统的通讯接口;以连接在g p i o 上的l c d 显示器和键盘作为人机交互界面;后 台支撑软件主要是嵌入式实时操作系统c ,o s i i ,f a t l 6 文件系统和相应的设备驱动程 序;应用程序主要包括基于g 7 2 9 a 的语音编解码算法和语音识别功能。 按照系统的硬件平台后,按照先系统软件后应用软件的顺序编写系统所需要的软件 功能。软件开发的工作主要有移植“c o s i i ,开发f a t l 6 文件系统,编写设备驱动,在 t m s 3 2 0 v c 5 5 0 9 上优化g 7 2 9 a 算法,实时实现多路语音编解码算法和实现语音识别功 能上。 具体的工作在下文中会有详细介绍。 1 0 大连理工大学硕士学位论文 3 硬件系统的设计与实现 3 1 核心处理器选型 由上文论述可知,数字信号处理一般是采用通用d s p 芯片实现,语音信号的处理 对实时性要求很高,所以选择一款合适的d s p 芯片是本系统首先要解决的问题。 本课题属于嵌入式系统开发范畴,对d s p 芯片的要求有以下几点:第一,处理器 运算能力可以保证算法的实时实现和精度;第二,尽量降低成本和功耗:第三,便于开 发使用。除了考虑上文中提到的指标外,还要考虑d s p 芯片的开发工具,相关技术资 料,技术支持,芯片的供货情况、质量标准、生命周期和封装形式等因素。 综合考虑,因为t m s 3 2 0 v c 5 5 0 9 具有较高的性价比,方便快捷的开发工具,丰富 的配套开发资源等优势,最后选择了1 1 公司的t m s 3 2 0 v c 5 5 0 9 这款d s p 处理器。 c 5 0 0 0 是t i1 6 b i t 定点d s p 系列,包括c 5 4 x 和c 5 5 x 两大子类。c 5 5 x 是在c 5 4 x 的基础上发展起来的,与c 5 4 x 兼容,比c 5 4 x 具有更高的性能和更低的功耗。这些特 点使之在无线通信和便携式个人数字系统中得到了广泛的应用。1 m s 3 2 0 v c 5 5 0 9 是 c 5 5 x 系列产品中的一款,主要特点如下【7 9 l 。 ( 1 ) 结构特点和片内外设 图3 1 为t m s 3 2 0 v c 5 5 0 9 ( 以下简称5 5 0 9 ) 的结构框图,主要特点有: 最高主频1 4 4 m i - i z ,单指令周期内可运行1 2 条指令,性能可达2 8 8 m i p s ; 包含两个m a c 单元,在单周期内可完成两个1 7 1 7 位的m a c 运算;包含两 个u u ,分别在a 和d 单元中; 共有1 2 组总线:1 条3 2 b i t 的读程序总线,5 条1 6 b i t 的数据总线,6 条2 4 b i t 的 程序和数据地址总线,可使c p u 在一个周期内完成1 个3 2 b i t 程序代码的读、3 个1 6 b i t 数据的读和2 个1 6 b i t 数据的写; 6 4 k b y t ed a r a m ( d u a l a c c e s sr a m 、和1 9 2 k b y t es a r a m ( s i n g l e - a c c e s s r a m ) ,6 4 k b y t er o m ,最大可支持8 m 字的s d r a m 扩展;外部存储器接口e m i f 可 以和异步s r a m 、异步e p r o m 和同步s d r a m 无缝连接; 设置了用户可控的低功率i d l e 域,包括c p u 、d m a 、外设、外部存储器接口、 指令队列、以及时钟发生电路等; 片内外设:2 个2 0 b i t 的定时器,1 个看门狗定时器,6 路d m a 控制器,3 路 m c b s p ,2 个m m c s d 卡接口,可编程的数字锁相环,通用输入输出接口( g p i o ) ,全 速u s b 接口,1 2 c 接口,实时时钟,1 0 b i t a d c ,j t a g 边界扫描逻辑接口等。 朱杰:基于d s p 的多路语音记录仪的设计与实现 围溺l 薹弱一hs 。a 。i 。l a m e h p l 然卜* 燃鬻。 翼 g p i o a 劁黝燃黔叫。互莨划 u s b协 a 乒 。z 谢剿撼。”_ _ l 嚣蒜。o r 卜, 瓣l 一 ;1 s i g n a l “1 麴l c m g 麓谶蕊篮谴l j 副i : 。 瀚器。o r 卜* s i g n a l 彳产 s d r a m g p i o 嘲 弋7 a db 一 f ” p i? a n n 1 fl o w 翻a d d r e s sd a t af l o w d a tac o m p u t a t i o n “ 善i n ! e r l u p cc o n l r o 】 t i m erk n i t ( p u :j iu n i l ( a l du n i t c d u ) “ t i m e rk 十。e m u l a t i m c o m w a t c h “o g卜 p = ;= j u n i t ( i u “女:。” f i g 3 i5 5 0 9s t r u c t u r ef r a m e ( 2 1 存储空间结构 5 5 0 9 的存储空间为统一编址,包括程序、数据和i o 空间,寻址空间为1 6 m b 。当 c p u 从程序空间读取程序代码时,使用2 4 b i t 地址。当访问数据空间时,使用2 3 b i t 地 址,实际上将2 3 b i t 地址左移一位,并将地址总线上的最低有效位( l s b ) 置0 ,使得对数 据或者程序空间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论