(电路与系统专业论文)mpeg2+aac音频解码算法分析及模块的硬件实现.pdf_第1页
(电路与系统专业论文)mpeg2+aac音频解码算法分析及模块的硬件实现.pdf_第2页
(电路与系统专业论文)mpeg2+aac音频解码算法分析及模块的硬件实现.pdf_第3页
(电路与系统专业论文)mpeg2+aac音频解码算法分析及模块的硬件实现.pdf_第4页
(电路与系统专业论文)mpeg2+aac音频解码算法分析及模块的硬件实现.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(电路与系统专业论文)mpeg2+aac音频解码算法分析及模块的硬件实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

牵霞群学援寒大学硕圭擘位论文 摘要 本文研究了m p e g 一2a a c ( a d v a n c e da u d i oc o d i n g ) 解码器在定点d s p ( d i g i t a ls i g n a lp r o c e s s o r ) 上的实现以及在f i e l dp r o g r a m m a b l eg a t ea r r a y ( f p g a ) 上的部分实现。 作为新一代最有效的高保真数字音频编码手段,m p e g 2a a c 具有压缩比 高,重建音频质萋好,编鬃码过程模块纯,声道配置灵活等特点,并且不霜的 层次具有不同的算法复杂度,因而m p e g 一2a a c 在数字声音存储、i n t e m e t 上 的多媒体传输、数字音频广援( d a b ) 等领域正获褥嗣益广泛的应震。随整数 字多媒体技术在我国的飞速发展,对研究和实现m p e g 。2a a c 硬件解码系统具 有重要意义。漱子m p e g 2a a c 解码算法的复杂性,要实时实现其硬件解码器 有一定的难度,目前国外已经有研究机构和厢数字信号处理器( d s p ) 开发出 a a c 音频解码器,而国内关于此方面的研究却刚刚起步。 本文的主要工作: 本文首先研究了声膏信号的胍缩原理及发展现状;然后研究了m p e g 2 a a c 音频编码标准及其中弓l 入的些薪技术;在此基础上,本文对a a c 标准 建议的解码算法在不降低解码器质量的前提下进行了运算复杂度方面的优化, 其中的一些主要改进有:1 ) 对于h u f f m a n 解码采用比较算法而非传统的二叉树 遍历搜索算法;2 ) 焉带线性插德函数的反繁化表代替全局反量化表;3 ) 对 i m d c t 模块采用了基于i i r 滤波器结构的构架进行运算,该方法特别适合于并 行运算。这些饶纯方法大大菠低ta a c 鼹璃冀法的运算复杂度,为实眩实现其 解粥器创造了很好的条件;接着,本文利用t i 公司提供的d s p 开发板实时实 现了a a c 主框架音频熊娼器,涯隳其算法优化在节省存储空闯和提窝运算速度 上怒卓有成效的;最后,本文研究了m p e g 一2 a a c 解码器的v l s i 实现,给出 了h u f f m a n 解码模块,反量化模块以及i m d c t 模块在f p g a 上蜜现的硬件维 构框图,并用v h d l 语言编写了代码,给出了仿真波形,为最终实现单片a a c 解码芯片打下了基础。 本文静主要特色: 1 ) 由于m p e g - 2 a a c 解码算法的复杂性以及d s p 的有限寻址能力,如果 要实对实现解码算法,必须在不影噙音质的条件下改进程序结构,箍化搂块的 中国科学技术大学硕士学位论文 运算。为此,本文以a a c 标准中建议的解码算法为依托,针对a a c 解码器中 运算量大,耗费存储空间多的模块进行了算法优化,这些优化措施有效的提高 了运算速度,节省了存储空间,从而最终在d s p 芯片上实时实现了a a c 主框 架解码器,具有一定的实用价值;2 ) 作为下一代的音频编码标准,到目前为止, 国内外还没有专用的a a c 解码芯片,为此,本文研究了a a c 解码器的v l s i 实现,根据a a c 解码流程具有按模块划分的特点,本文研究了h u f f m a n 解码 模块,反量化模块以及i m d c t 模块的硬件结构,这些模块的实现均采用了优 化后的算法结构,用v h d l 语言进行硬件描述,给出了仿真波形,最终可以将 这些模块进行系统集成,从而实现单片a a c 解码芯片。 关键词:m p e g 2 a a cd s ph u f f m a n 解码反量化i m d c tf p g a 中国科学技术大学硕士攀使论文 a 辩s t r a c t t h i st h e s i sp r e s e n t st h em p e g - 2a a cd e c o d i n ga l g o r i t h mr e a l i z a t i o no na f i x e d - p o i n td s p ( d i g i t a ls i g n a lp r o c e s s o r ) a n dp a r t i a li m p l e m e n t a t i o no fi to na 瓢o l 程p r o g r a m m a b l eg a t ea r m y ( f p g a ) a san e wa n dh i g h l y - e f f i c i e n th i f ia u d i oc o d i n gm e t h o d ,m p e g - 2a a ch a s m a n yf e a t u r e s ,s u c h a sh i g hc o m p r e s s i o nr a t e ,e x c e l l e n tq u a l i t yo fr e c o n s t r u c t e d a u d i o ,m o d u l es t r u c t u r eo fe n c o d i n ga n dd e c o d i n gp r o c e d u r ea n df l e x i b l ec h a n n e l c o n f i g u r a t i o n a sw e l la sd i f f e r e n t a l g o r i t h mc o m p l e x i t y f o rd i f f e r e n t p r o f i l e s 。 t h e r e f o r e ,i ti sg a i n i n gw i d e ra n dw i d e ra p p l i c a t i o n s o n d i g i t a l s o u n d s t o r a g e , m u l t i m e d i ad a t at r a n s m i s s i o na n d d i g i t a la u d i ob r o a d c a s t i n g w i t ht h ed e v e l o p m e n t o fm u l t i m e d i at e c h n o l o g yi no u rc o u n t r y ,i ti ss i g n i f i c a n tt os t u d ya n dd e s i g nr e a l t i m em p e g - 2a a ce o d e c s y s t e m 。 + 强om a i nw o r k so f t h i st h e s i s : t h et h e s i sf i r s ti n t r o d u c e dt h e c o m p r e s s i o np r i n c i p l e o fs o u n d s i g n a l a n d r e l e v a n th i g ha c h i e v e m e n t s ;t h e n ,i tp r e s e n t e dt h em p e g - 2a a c c o d i n gs t a n d a r d a n ds o m en e wt e c h n o l o g i e sa d o p t e db yi t ;b a s i n go nt h e s e ,t h ea u t h o rd i ds o m e w o r k st od e c r e a s et h ec o m p u t a t i o nc o m p l e x i t i e s ,i n c l u d i n g :1 ) u s i n gc o m p a r i s o n a l g o r i t h mt od e c o d eh u f f m a nm o d u l e ;2 ) u s i n g l o o ku pt a b l ew i t ha d i r e c t l yl i n e a r i n t e r p o l a t i o nt od e c o d ei n v e r s eq u a n t i z a f i o nm o d u l e ;3 ) u s i n gi i r f i l t e rs t r u c t u r et o d e c o d e | m d e 零m o d u l e ,t h e p r o p o s e dr e g u l a rs t r u c t u r ew a sp a r t i c u l a r l ys u i t a b l ef o r p a r a l l e lv l s i r e a l i z a t i o n 。a l lo ft h e s em e t h o d sh a d g r e a t l yr e d u c e d t h ec o m p l e x i t i e s o f d e c o d e ra n dm a k et h er e a lt i m ei m p l e m e n t a t i o n p o s s i b l e ;a tl a s t ,t h et h e s i sp r e s e n t t h er e a l i z a t i o no fa a cd e c o d e ro nt i 鞠镰$ 3 2 0 v c 5 钓2 d s k 。t h ew o r kd e m o n s t r a t e d t h e h j i g hp e r f o r m a n c e o f t h em o d i f i e dm e t h o d s ;a l s o ,t h et h e s i ss h o w e dt h eh a r d w a r e a r c h i t e c t u r eo f h u f f m a n d e c o d i n g m o d u l e 、i n v e r s e q u a n t i z a t i o n m o d u l ea n dl 醚d g 薯 m o d u l ei no r d e rt or e a l i z et h ea a cd e c o d e ro n a s i n g l ec h i p 零蠢ec h a r a c t e r i s t i e so f t h i st h e s i s : 1 ) b e c a u s eo ft h ed e c o d i n gc o m p l e x i t i e s o ft h em p e g 一2a a ca n dt h e a d d r e s s i n gl i m i t a t i o no fd s p , i f w ew a n tt od e c o d et h ea a cf i l ei nr e a l - t i m e ,w e 3 孛国奉莘学技本大学硕士学绽谂文 m u s tm o d i f yt h ep r o g r a ma r c h i t e c t u r ea n ds i m p l i f yt h ec o m p u t a t i o no fm o d u l e s w i t h o u t l o s i n gt h ea u d i oq u a l i t y s o ,i nt h i st h e s i s ,t h ea u t h o ro p t i m i z e d t h em o d u l e s , w h i c hc o s tt o om u c h c o m p u t a t i o n s a n dm e m o r i e sb a s e do nt h ea a cs t a n d a r d ,t h e s e m e t h o d sc a r l g r e a t l y i n c r e a s et h ec o m p u t a t i o ns p e e da n ds a v et h em e m o r ys p a c e f i n a l l y , t h ea u t h o rs u c c e s s f u l l yd e c o d e d t h ea a cf i l eo nd s pi nr e a l - t i m e ;2 ) a st h e s e c o n dg e n e r a t i o na u d i oc o d i n gs t a n d a r d ,t h e r ei sn oa s i c c h i po f m p e g - 2a a c d e c o d e ru pt on o w s o ,t h et h e s i sd i ds o m er e s e a r c hw o r k so nh o wt or e a l i z et h e d e c o d e ro nas i n g l ec h i p ,i ta l s os h o w e dt h eh a r d w a r ea r c h i t e c t u r eo fs o m eb a s i c m o d u l e so ft h ed e c o d e u s i n gv 珏矜毛t od e s c r i b et h eb e h a v i o ro ft h e s em o d u l e s ,t h e s i m u l a t i o nr e s u l t sa r ea l s og i v e n ,t h em o d u l e sc a nb ei n t e g r a t e dt oas y s t e mt o r e a l i z et h ea a cd e c o d e ro n a c h i p 。 k e y w o r d s :m p e g 一2 a a cd s ph u f f m a n d e c o d i n g i n v e r s e q u a n t i z a t i o n i m d c tf p g a 4 - 中国辩学技术大学硕士学位论文 1 1 数字声音信号 第一章绪论 随着计算机技术和通信技术的发展,人类开始追求真正意义上的多媒体信 息的处理和交互。自然界中的各种信息,包括文字、声音和图像,都成为处理 的对象。僵楚,这些媒体信息都是模拟的,只有对其数字化后才能由计算机平 台进行各种处理和综合。而各种媒体数字化厢的信息数据量十分庞大,对于存 储嚣的容量,计算机实时处理戳及网络逶讯线路麓簧输带宽都提瘵了菲鬻苛剡 的要求。实践证明,如果对多媒体信息数据进行压缩,可以明显增大存储量或 减少传送时阗。 在人类的几种感觉器官中,听觉和视觉接受的外界信息最多,与之相适应, 这两种器官接受的声音与图像成为了多媒体的主要媒体数据,也怒信号处理领 域重要的研究对象。在这里,本章主要研究声音信号的惩缩和编解码。 根据所处理的声音信号特征的不同,可以将声音信号分为如下两类: 1 。语音信号 目前常见的话音通信系统,如长途通信、移动通信和卫星通信,主要面向 这种信号,其信号频带限于0 3 3 。4 1 d - i z ,数字镤:时采样频率多取8 k h z 。在毅兴 的通信系统,如视频会议和i s d n 话音服务中,音频信号的频带可加宽到 5 0 h z 7 k h z 。 2 ,音频信号 一般认为人耳的听觉范围为2 0 h z - 2 0 k h z ,这正是我们所需处理的音频信号 鳇频带。遵就是说,如果我爨驻够宠整的傈躲下该频繁凌的所有声音售患,就 意昧着不失真的保存了所需音频。在实际应用中,这种信号还可分为: 1 ) 电视和无线广播质量音频:信号频带从4 0 或5 0 h z 到7 k h z ( 调幅或 1 5 k h z ( 调频) ,广泛用于收音机和电视伴音。 2 ) c d 质量音频:频带2 0 h z 2 0 k h z ,主要用于传输绒存储高品质音乐信号, 数字化时采样频率可取4 4 1 k h z 或4 8 k h z 。 3 ) 高质量h i f i 音频:和c d 音频相比,频带更宽,量化更纲。这种质量 声音使醑众具有现场感,薛狁懿置搿于音乐厅中,恧置多采用多声遵漉效输盘, 中国科学技术大学硕士学位论文 形成环绕,并提供低音增强等功能。数字化时采样频率最高达9 6 k h z 。 最常用的数字声音存储方式是p c m ( p u l s ec o d em o d u l a t i o n ) 技术。p c m 简单的将模拟声音信号用固定的抽样频率与固定的最大量化比特数进行量化。 p c m 技术是1 9 3 7 年由a h r e e r e s 最先发明的。p c m 声音可以用各种量化比特 数与采样率进行量化,但对最常见的c d 质量的音频信号,一般都用4 4 1 k h z 与1 6 比特进行量化。根据n y q u i s t 准则,4 4 1 k h z 的采样率可以重建带宽小于 2 2 0 5 k h z 的信号,比人耳通常能感知的频带略宽,多余的一点带宽可以用来修 正滤波器的一些失真。使用n 比特进行量化就有2 ”个量化阶。量化可以用等步 长量化,也可以采用变步长量化技术。在等步长量化的情况下,每个量化比特 将量化信噪比( s n r ) 增加6 d b ,1 6 个量化比特使量化信噪比增加至9 6d b 。 变步长的量化方案有很多,但它们都是基于对信号分布的概率密度和或人耳对 信号的听觉特性有所了解的前提。变步长的量化算法都比等步长量化要复杂。 数字音频作为一种存储、处理和传输h i f i 声音的方法在数字音频广播 ( d a b ) 、网络音频( i n t e m e ta u d i o ) 、多媒体通信等许多领域中得到广泛的应 用。然而,要存储和传输原始音频数据需要很高的比特率。以c d 为例,每声 道比特率高达7 0 6 k b p s ,一张6 5 0 m b 容量的光盘只能存储一小时的立体声,如 果直接传输需占用一个t 1 或e l 的1 2 个话路,极不经济。在现有声道的传输 能力限制下,为了能从广播、电视获得c d 音质的音乐,并使存储介质的单位 成本更小,人们想到了压缩码率,力求在保证声音质量的前提下使其占用的存 储空间更小、传输速率更低,这就是音频压缩编码的产生原因。从上世纪8 0 年 代c d 问世之日起,高效率的数字音频压缩编码的研究工作几乎同时开展。 1 2 数字音频压缩的基本理论依据 人耳的听觉系统是一个相当复杂的生理系统。首先,人耳的听觉有它自身 的生理极限,它一般只能感知频率在2 0 2 0 k h z 的声音。在这个频段内的声音 通过神经传输到大脑皮层,然后由大脑将声音转化成不同的感知信号。在这个 过程中,有以下几点对于我们构造音频压缩算法尤其重要: 1 响度( l o u d n e s s ) 两个幅度一样的声音,如果频率不同,它们会有不同的响度。产生这个现 中国科学技术大学硕士学位论文 象的原因是人耳对声音响度的感知会随着声音信号频率的变化而变化。实验证 明,人耳对1 0 0 0 h z 5 0 0 0 h z 的声音最为敏感。 2 动态范围( d y n a m i cr a n g e ) 人耳能感知的最低声压大约为2 0 m p a s c a l ,将这个声压作为参考值,来衡量 其他声音的强度。普通谈话的声强大约是5 0 6 0 d b ,而汽车发动机噪声的声强 大约为1 3 0 d b 。入耳能忍受的最大声强为1 3 0 d b ,因此人听觉的动态范围为 0 1 3 0 d b 。 3 听觉掩蔽效应( a u d i t o r m a s k i n g ) 掩蔽效应是一种常见的心理声学现象。它是指,在一个较强的声音附近, 弱的声音将不被人耳所察觉,即被“掩蔽”掉。这时,较强的声音称为掩蔽声, 弱的声音称为被掩蔽声。不可闻的被掩蔽声的最大声压级称为掩蔽门限。由于 掩蔽声的存在,被掩蔽声( 通常指单频声) 的闻阈必须提高的分贝数称为掩蔽 量( 也称为掩蔽值、阈值) 。掩蔽效应分为频域掩蔽( 或同时掩蔽) 和时域掩蔽 ( 或异时掩蔽) 两大类。 1 ) 频域掩蔽:频域掩蔽现象发生在掩蔽声与被掩蔽声同时出现的时候,也 称为同掩蔽。举例来说,如果在1 0 0 0 h z 处有一个强音,而在1 1 0 0 h z 出有一个 强度低了2 0 d b 的声音,1 1 0 0 h z 处的声音就会被1 0 0 0 h z 处的强音掩蔽,无法 听到。由于掩蔽效应,幅度较大的音调( 掩蔽音调) 使靠近自己的相对幅度较 小的音调变得听不见。一般来说,强音能掩蔽较弱的声音,而且两个声音的频 率越接近,掩蔽效应越明显。 2 ) 时域掩蔽:时域掩蔽现象发生在掩蔽声与被掩蔽声不同时出现的时候, 也称为异时掩蔽。被掩蔽声作用于掩蔽声之前,即一个声音影响了时间上先于 它的声音的听觉能力,这称为前掩蔽。当掩蔽声作用在前,被掩蔽声作用在后, 即当一个声音已经结束,它对另一个声音在听觉上还会产生影响,这称为后掩 蔽。图1 1 给出了频域和时域掩蔽效应的特性曲线。前掩蔽的作用范围大约是 2 0 m s ,而后掩蔽的作用范围长达2 0 0 m s 。前掩蔽和听觉疲劳有些相似。在实践 中,后掩蔽更为重要。当被掩蔽声在时间上越接近于掩蔽声,阈值就越高。掩 蔽声和被掩蔽声时间上相距很近时,后掩蔽作用大于前掩蔽作用。 中国科学技术大学硕士攀位论文 馥掩粕 厨 j、 一一,盘一- 盎f 一弼氏一 蠹l l 4 牦界频带 当缎致缝分孝斤入茸楚如何进行频谱分析时,簸界频带的概念被弓l 入了。研 究发现,使频转换( f r e q u e n c y t o p l a c et r a n s f o r m ) 发生在人的内耳e 带毒备囊 独立的毒孛经感知系统的入耳的骂蜗不阉位置对应了不同蛉临界频繁。在实际废 翔中,临界频带可以大致定义兔主观感知发生突交的颓率带宽。一个缒音可以 被以它为中心频率,而且具有一定带宽的适续噪声所掩蔽,如果程这一频带内 噪声功率等予该缝音熬功率,这时该缝音处于刚好就被嘶剿的蠛界状态,即称 遮一带宽为 瓷器带宽,攀链隽b a r k 。 晒器带宽有许多近似表示,教在低予5 0 0 h z 的频带态,临界帮宽约筠 l o o h z ,在赢予5 0 0 h z 时,临界带疯约为中心频率的2 0 。姨界频带的位鬟不 圈定,以任俺频率力中心,都鸯个临界频带。连续的临爨频带序号记为临界 频率带,它与耳蜗中本底膜船长度璧线性关系,蔼与声音频率呈近似对数关系。 在实际的音频编解码系统中,常常采用离散的带通滤波器来模拟临界频带。 5 。入耳麴声像定位姆陡 经过磷究,普遍认菇入珲露声音麓定位梳理,是赉予瞬者蠢器的头部稀躯 干对入射声波的衍射作嗣,戳致声波刹达双群对形成了声级差p 辩时闻羞 t ,毯们都是声源的方位韵频率的函数表示。研究表明,在中低频( f 小予 1 5 0 0 h z ) ,双耳t 是定位的主要因素;中频时( f 为1 5 0 0 h z 至i 4 k h z ) ,t 秽 a p 共阕起作鼷;雨赢频时( f 约大予4 k h z ) ,受i a p 跫圭簧因素。高频对方傻 的决定取决于信号包络猩内耳延时以及入耳所能感受到的信号频率。包络变化 缀快蛉对域声音继号,在定位对俸罔大,露包络比较乎稳麴声音傣号,对予 孛国辩学技术大学硕士学位论文 耳的定位影响很小。 目前的音频压缩编码算法主要分为两类:波形编码和感知编褥。波形编码 以声音波形为基础,使熏建声音波形尽可能接近原始波形,这类信号压缩编码 器的设计可以认为与倍源无关。感知编码并不要求重建声音波形与原始波形完 全一样,而是要保证对于人耳来讲,重建声膏听起来与原始声音一样。感知编 码算法利用对人听觉心毽鲍先验知识,丢弃了募始声音中人耳无法感知的部分。 通常,感知编码算法将时域信号转换成频域信号,再将频域信号分裂到各个子 带上,然后利用人耳感知特性除去人耳听不到的部分。相比波形编码,感知编 码能获得更黼的压缩比。 现在绝大多数的高质量音频压缩编解码算法都是熬予感知编码的。同时, 它们又剩月了信息论中的熵缡码糠理,极大豹消除了豢始信息中鳃统计冗余, 获得了较高的压缩比和较好的重建音质。 1 3 音频编褥技术的发展现状 彝从p c 支持多媒体以来,宥几种音频编码标准得到了广泛戆应是,下面 对这些标准做一些简单介绍。 1 m p e g 1 音频编码标准 自扶1 9 8 8 年良来,m p e g 小组承担了橇频和音频愿缩技术韵标准纯工作。 这个小组制定的音频编码标准是数字音频压缩领域中的第一个国际标准。1 9 8 9 年,m p e g 小组在爱求? 1 4 释裔频编玛方案蜃,蕺矮礁定了2 穗:一种是 m u s i c a m ( m a s k i n g p a t t e ma d a p t e du n i v e r s a ls u bb a n di n t e g r a t e dc o d i n ga n d m u l t i p l e x i n g ,自适应掩蔽模式通廷子带综合编码与多路复用) ,另一种是 a s p e c ( a d a p t i v es p e c t r a lp e r c e p t u a le n t r o p yc o d i n g ,自适应频谱感知熵编码) 。 基于这两种算法于1 9 9 2 年制定了m p e g 1 标准。m p e g 1 按照算法的复杂度和 噩缩比分为l 、l i 、i i l 三个层次。第1 层的复杂度最低,楚m u s i c a m 方案的简 化形式,以每声道1 9 2 k b p s 的速率提供高质量的声音,在不强调低码率的情况 下应用。第l l 瀑具有中等复杂度,它使用篦第l 层更荛糖密的量佬,毒m u s i c a m 方案几乎完全相同,可猩1 2 8 k b p s 的码率下提供近乎c d 质量的声音。第1 i i 层 结含了m u s i c a m 和a s p e c 的优点,复杂度最高,编码效果也最好,可程低 中国辩学技术大学预学彼论文 予每声道1 2 8 k b p s 的诵率下获得极离晶质的案频。第联l 层使用了心理学模型i l 、 霹切换熬混合滤波器缝、比特浊缓冲技术、先进静羰圈声控制、毫荽均匀量纯翻 熵编璐技术。 m p e g - 1 等级嫩在商业上获褥了巨大的成功,这就蔑我稍熟悉簸m p 3 。 m p 3 魁目前流传最广的一种音乐压缩格式,其c d 般的音质、离愿缩比、开放 性鞠易使用性僮之深受好浮,尤其在i n t e m e t 网终上广为流行,缎多硬件厂鬻还 擢滋了播放m p 3 韵硬件设备。 2 。m p e g 。2b c 署瑟m p e g 2l s f 钳对m p e g 1 只麓避行单声遵或双声邀编鹤熬局鼹性,1 9 9 4 年1 i 胃m p e g 小组制定了多声邀扩鼹的誊频编码标准m p e g - 2b c ,它能够与跫有的m p e g - 1 系统向下兼容。与此同时,m p e g 小组还制定了一个在较低采样频率( 6 k h z , 2 2 5 k h z ,2 4 k h z ) 时效率高于m p e g ,2 的音频编码标准m p e g 2l s f 。1 9 9 4 年1 l 舅,m p e g 宠成了m p e g - 2b c 帮m p e g - 2l s f 静制定。对五个全带宽声 i 篷,m p e g - 2b c 在数据率为6 4 0 8 9 6 k b p s 的情况下提供了离晶质的音频。 m p e g 2b c 定义了m p e g - 1 的多声道扩展,传统酌双声邋声音格式的替代者 是3 2 + 1 多通道系统。m p e g 一2b c 采用m p e g 一1 绽鹳器,也蠢三个瀑次鲶多 通邀扩展。层次l l l 是最灵涎鲍系统,馋为个主要的特点,m p e g 一2b c 层次 i i 允许使潮数目灵活的扩震逶道。m p e g - 2 b c 除了籍商兼容多声遂编码之外, 还提供了对多个附加声道传输的支持。利用这毖附加声道可以支持多语言编码。 在m p e g - 2l s f 鹜后熬基本思想是,提高舆鸯较寓频率分瓣率豹滤波器组蕊绽 鹤增益。l s f 瀚辩一个优煮是提商了主要信息对附带信息之比。对于那些需要 根低码率的音频斑用场合,l s f 层次礅成为优选方案。 3 。d o l b y a c - 3 美因杜比( d o l b y ) 实验室从1 9 8 0 年开始对数字声频技术进行研究,蕊点 怒酶低阮特率技术。它筑瑶研蒂 了a c l ( a u d i oc o d i n g - 1 ) 、a c - 2 和a c 一3 技 术。目前a c 。3 在多种音频处理系统中得到广泛的应用,美国现在己经把杜比 a c 。3 糠准传为寒涛嶷度电视( h d t v ) 和数字有线电褫豹音频缝磷格式。 a c 3 楚一种海效率编码标准,它采用鑫遗瘟变换编码,具有穰多优点。它 更好蟪模拟了入耳的呀懿特性。a c 3 滤波器组豹频率选择性非常接近人耳的掩 中国科学授零大学预士学谯论文 蔽效应。时频变换采用了基于时域混叠抵消( t d a c ) 的m d c t 。a c 3 也采用 了密处理,输入时闻蔷号在变换到频域之蓠先瓣其进行鸯嚣密处理,髓且密蜀长 度悬可变的。囱子音频信号的时变特性,为了同时满足时间分辨率和频率分辨 率的要求,在编妈中采髑了自适应分块技术以便有效地控制预凰声的发生。 a c 3 编码器还采用了耦合技术和组合技术。耦合技术利用入耳对高频信号不熊 分辨出两个频率非常接近的信号的方向的特性,在编码器中将多个声道信号的 高频部分耦合到一个公共声道中。誊信道传输码率穰低,单独对各个声道进行 处理仍然达不到信道要求的码率时,就采用耦合技术。 绽羁藏据不阕的声道爝不同的魄特数表示数据。根据传输玛率翻频率分辨 率的要求采用三种模式进行编码,三种模式的分辨率不同。 a c 3 技术包含着灵活性,它可以重现一到五个声道的各秭播放配置,再加 上一个任选的低频增强声道,a c - 3 方案可使用3 2 k b p s 到6 4 0 k b p s 之间的可调 整数据率,可配置成通道裳排的各种组合。a c 3 数据格式用于在已经采用了高 度误褥校正的睇境中应用。 4 d t s d t s ,数字影院系统,d i g i t a l t h e a t e rs y s t e m 鳇缩写,是在社比数字繇绕声 出现后的又一种数字环绕声系统。目前美国使用d t s 作为其电影原声带数字音 频编码方式的电影公司,融经超过了采用枉比数字系统的电影公司。 d t s 之所以受到如此青睐,是由予其对高采样率、蕊量化精度的数字信号 采用了灵活、先进的相干声学( c o h e r e n t a c o u s t i c s ) 编码技术。其最初的目标 是要使音乐重敖达至l 试瞬室豹塞平,郯“音质离予c d ”,蔼多声道格式是要襞 得家庭影院的声音重放质蹩在保真魔及声像准确度方面得到全面的提高:第二 个主要曩标是其蘧缩算法应是广泛适用恧且灵活酶。多媒体应用限铡了数据带 宽,因此需要工作在3 8 4 k b p s 或更低的5 1 声道模式。而专业音乐应用要有更 高的采样频率、更长的量亿数及多路分立音频通道,并且更需要无损压缩,d t s 相干声学包括了所有这些特性;最瑟一个重要的目标就憝确保所有的解码器弊 法相对简单而且向前兼容。 d t s 裙子声学本质上是一释惑箱优铯差分子繁编码。其编璃过程的关键组 成是自适应预测编码,或称a d p c m ,它可以有选择地独立工作在每一音频通 孛垦科学技零大学醭士学便论文 遂欧所有3 2 个予带上。遴过结合差分编码和趱步嗓声掩蔽阕值,可汉提高晓特 率缀低对黪编码效率,从藤降低了达爨主溉透骥度要浆熬阮特率。对音频多鼹 通道的编码是在固定比特攀或可变比特率上用分配比特的方法进行的。一个多 粳滤波器缱把每一个独立声道的p c m 源信号分戈3 2 个带宽相等的予带,并铡 用高理论编码增益及较强的止带衰减功能,使其具有较低的计算复杂性。对每 一予带进行差分编码,司以去除音频中大部分客观冗余信号。阍时,对未编码 的倍母进行声学同步处理和瞬态分析以感翔相关信息,从而修正每一子带信号 的主要差分缡码循环。在多声道格式中,沈特分配捧臻予掰畜编码遥遂,并随 时瓣、频率及声遒嚣改变以优优裔频质量。 根据实际应用,d t s 具有单声道、双声道歪8 声道可供选用,分离式的5 1 声道w 以滠音成为“矩阵式两声邀”。d t s 每声道的采样频率最低为8 k h z ,最 高为1 9 2 k h z ;激化精度范围为1 6 2 4 b i t :压缩率范围为1 :1 - 4 0 :l ;总数据 率范阉为3 2 4 0 5 6 k b p s 。另外相干声学算法还可 = 美实现商达1 3 8 d b 的动态范围。 d t s 作为稀新型的数字环绕声技术,不德能胜任a v 的重托,更能提高 c d 音乐的音质,完全可以和杜比数字制式在家庭视瞬方覆想抗衡。 5 m p e g - 碡音频缡褐标准 m p e g 目前正在发展最新的m p e g 4 标准,目标是提供未来的交互式多媒 体应阕。m p e g - 4 将制定嬲与以往不同的、具有高度灵活性和可扩展性的毅一 代国际标准。较之以前的音频编码标准,m p e g - - 4 增加了许多新的必于合成内 容及场景描述等领域的工作,增加了诸如可分缀性( s c a l a b i l i t y ) 、音调( p i t c h ) 变仡、可编辑性及延迟等新功能。m p e g 4 将以前发耀良好但榴甄分离的离质 基音频缡码、计算枧音乐及合成语尝等第一次融合在一起,在诸多领域走给予 了高度的灵活性。m p e g - 4 的重要特赢就是亮度酶灵活挫期霹扩震性。 m p e g 4 关于音频信号编码集中在:传统的音频编码即所谓的“自然音频” 帮耨颗的“结构音频”以及“合成自然混合编码”。爨然膏频编碣将码率规定 为每声道2 k b p s 歪6 4 k b p s ,相应地定义t - - 种编码工具:参数编码、线性预测 编码和时间频率编码。当每声道6 4 k b p s 时,就是m p e g - 2a a c 编码标准。 因此a a c 方案已经成为m p e g - 4 音频编码的核心。 嗣蘸,m p e g - 4 正在制定发展之中,作炎零孛基标定位予未来的、全熊麓、 中国辩学技术大学硕j :学位论文 开放的多媒体方案,将伴随着未采不断出现憋耨技术、新思路、新方法,褥到 更深、更广的发展,成为领导未来多媒体世界的国际标准。 l 。4 论文黪主要工作及组织结构 本文的主要工作是对m p e g - 2a a c 音频编码标准的各个模块进行算法研 究,优纯瓣碣簿法,实时实现萁硬件解鹃器,为最终实现专用的m p e g 2a a c 解码芯片打下基础。 全文共分五章:第一章是绪论,篱要阚述了音频编码技术酶概猛,研究了 除m p e g 2a a c 以外其他几种淌前主要的音频编码标准;第二章研究了 m p e g 2 a a c 啬频编码标准,对其中的算法横块进行研究分析;第三章分柝了 a a c 编码的音频文件格式,在浮点算法的基础上,实现了m p e g 2a a c 在t i 定 点d s p 上的解码;第四章详细研究了m p e g 2a a c 解码器关键模块的硬件结 梭,研究了其在f p g a 上的实瑷,为惩码器酶a s i c 实现打下了基磊窭;第五意 对幽前工作进行了总结,对未来工作进行了展望。 5 本章小结 本章是全文的绪论部分,介缀了数字声音信号的表现方式帮一燕基本特 逶。 由于多媒体技术的飞速发展,其数字化后信息量异常庞大,因此要对这些数据 进行压缩。本章介绍了对声音信号压缩的理论依据,从而为实践打下了基础, 同时也介绍了发展比较成熟的几种音频压缩标准。 串国蚕幸学技术夫学磁圭学曛论文 2 。l 弓l 言 第二章m p e g 一2a a c 算法模块分析 关于高质蛰低码率数字音频编码标准的制定,具有代表性和开创性的工作 多蹙巍m p e g 组织带来的。i s o 和c c i t t 予1 9 8 8 年成立“运动黼像专家组 ( m p e g ) ”,研究餍予数字存储媒介中运动图像及其伴音的编码表示。 m p e g - 2 a a c 是m p e g 在以b o s i 、b r a n d e n b u r g 、j o h n s t o n 等为酋的音频编 码磷究组织予1 9 9 7 年提出的,它总结了m p e g 1 、m p e g 。2 和a c 3 等鲍长处, 在m p e g 系统上进一步改进并加入了很多新的功能,大大增强了编码的灵活度, 在保诞音质的同时更大限度地压缩了码率;同时,m p e g 2a a c 已经成戈最新 的m p e g - 4 标准中高质量音频编码的核心,是下代音频压缩标准。 2 2m p e g - 2a a c 豹配避 m p e g 2a a c 系统最多支持4 8 条音频通道,常震的配置为荦声道、双声 遂( 立俸声) 秘5 。1 声道( 左中右三个主声遂、左右环绕声道黔趣一个低频增 强声邋l f e ) ,阉对,在编码器中还可以灵活定义多种可编程的配置。 必了允许在瓷频质鳖、存储器巍处理能力需求之间进行辑中,m p e g - 2 a a c 系统提供了以下三层框架( p r o f i l e ) : t 主框架( m a i np r o f i l e ) :在这缓框架中,a a c 系统能对任何给定的数据 率提供质量鼹好的重建音频。除了增益控制模块以外,a a c 系统包含了其他所 有模块,傻其对予存镶器和c p u 处理麓力的要求是三静糕架中最赢的。同时, 主框絮a a c 解褥器畿够对采属低复祭度框架懿褥流进行熊码。 2 。低复杂度框架( l o wc o m p l e x i 移。l cp r o f i l e ) :在这屡框架中,系统不包 撬时域预测和增蕴控制( 颈处理) 模块,并且稔s 的除数也受到限制。低复杂 度框架在音频质爨很高时,对存储器和c p u 处理能力的要求比主框架小。 3 。可分级采样频率框架( s c a l e a b l es a m p l i n gr a t e - s s rp r o f i l e ) :在这鼷框 架中,增益控制模块是必需的,同时没有预测模块,并且t n s 的阶数和信号带 宽受限。该框絮的复杂度眈蠡前矫述的两个框架都要低,丽且它髓产生一个频 率虿分级酶信号。 中国科学技术大学硕士学位论文 m p e g 2a a c 解码器应能正确解出由相同框架编码器所编码的、通道配置 在解码器容量以内的码流。不同框架的编解码器之间的互操作性如表2 1 所示: 编码器框架 解码器框架主框架低复杂度框架可分级采样率框架 主框架可以解出可以解出不可以解出 低复杂度框架不可以解出可以解出不可以解出 可分级采样率框架不可以解出不可以解出可以解出 2 3m p e g 2a a c 的解码模块 表2 1 m p e g 2a a c 采用了很多最新的音频编码技术来提高音频质量,如更高的 频率分辨率、预测、改进的霍夫曼编码和时域噪声整形等,a a c 的解码流程如 图2 1 所示。在本节中,我们将结合解码过程,对m p e g 一2a a c 的各个功能模 块进行详细介绍。 刊一一_ 翱蝴q t 憎l 甘 量 4s 一胁舯i 1 黼i 薹 l 洲j ! 叫跏赫 7 i 懈l r 1 确螺赫l ”l 舢。l = 嘲 1 无噪声编码 图2 1 敷嚣 控删 中国科学技术文学礤士学位论文 无嗓声编码主要潮于减少每个声遥的比侧谶子和壁纯器酌数据冗余,实繇上 就怒霍夫曼编码,它对被量他的谱系数、比例因子和方向髅息进行编码,以1 0 2 4 为组,将量化的频谱分为数段,分段过程是动态的,并且随着区块变化,所以 髑来表示量纯频谱系数的毖特数可以降到最低。溺予频谱资辩豹共有1 1 个鬣夫鬟 硝本,而有种码本是用在尺度因子编码,另外,还有一种单一为“零”的编码 碣本,用来表示没有椽拣因子及频谱资料被传输。丽对予强度立体声缡码,有蹰 种褥本,羽来播出是个剃声道还是双声道靛部谂。 2 + 反璧纯 在编码邋程中使翊嚣均匀量戳对频谱系数进_ 行量化,因就解粥器墩必须在比 例因子謦b 频谱系数霍夫曼解码后做出相应的反量化。 爱量讫表达式躲下掰示: xi n v q u a n t = s i g n ( x _ q u a n t ) x _ q u a n t 1 4 箕孛绝对掇幅x 一, q u a n t 戆允许最丈篷为8 1 9 1 。 用c 实现的代码如下: 允f ( g = 0 ;g 搬m w i 懿酾聃乙罄。呻s ;g - 呻) f o r ( s f b = o ;s f b m a x _ s f b ;s f b + + ) w i d t h = ( s w b _ o f f s e t g s f b + 1 一s w b _ o f f s e t g s f b ) ; f o r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论