




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、研究生多媒体通信技术课程报告题 目:一种新型的广播音频编码技术 学 号 m201471787 姓 名 邹 勇 院(系、所) 电子信息与通信学院 二零一五年一月摘 要 广播音频编码技术在近几十年里去的了长足的发展,各国学者提出的各项新技术令音频编码技术达到了一个前所未有的高度,也为用户提供了越来越高质量,越多样化的服务。本文首先介绍了广播音频编码技术现在的发展背景;其次利用较大篇幅详细介绍了音频编码技术的发展历史,尤其着重介绍了相关标准制定的发展历程,同时也对最新的一些编码技术进行了简要介绍。之后,本文详细介绍了一种最新的音频编码技术空间音频对象编码,详述了其技术背景、实现方式、应用场景和一次实
2、际应用效果。与之相似的,在之后详细介绍了扩展高效先进音频编码技术,详述了其技术背景、主要实现方式、实验测试及结果、和标准化过程。最后,对全文进行了简单总结,并对未来的工作进行了展望。关键词: 广播,音频编码,空间音频对象编码,扩展高效先进音频编码abstractin the last decades there have been major advances in broadcasting technologies as well as a change in consumer behavior and demands. the quality and variety of service
3、is becoming better and better.this paper will give a short overview of the history of broadcast audio coding and development history of audio coding standardizing, then point out which codecs are currently used in the major broadcasting systems,after that, this paper will introduce two new audio cod
4、ing technologies, spatial audio object coding and extended he-aac, in technology background, implementation model, and testing result.at last summarize this paper and look forward to the future work.key word: broadcasting,audio coding,saoc,extended he-acc目 录摘 要iabstractii目 录iii一、文章背景1二、广播音频编码介绍2三、空间
5、音频对象编码43.1 对话放大技术43.2 温布尔登实验4四、扩展高效先进音频编码64.1 相关背景64.2统一语音音频编码64.3相关测试与结果64.4 itu 广播标准提案8五、总结9六、参考文献10ii一、 文章背景过去几十年里,无论是广播播放技术还是广播听众的需求都发生了很大的变化。但由于广播内容容量的限制,尤其是无线带宽的限制,如何更高效的对广播内容进行编码越来越成为一个热门话题。广播产业正在不断的发展变化中,越来越多的新技术和新平台也应运而生,无论是内容生产、内容传还是内容播放都在朝着数字化的方向发展,在提高效率的同时也能更好的满足听众的需求。尤其是对于内容传播而言,提高了传输的频
6、谱效率,就意味着能提高广播质量,甚至可同时为同一节目提供不同语言和版本。想要建立起一套新的广播系统,对于广播系统、流媒体和文件格式的标准化都是必不可少的。本文将要介绍几种较新的广播音频编码技术,其一是空间音频对象编码器(saoc),它允许听众在接收端与发送者进行互动,如对不同声道的音量进行调节。另外,扩展高效先进音频编码器(xhe-aac)是一种混合语音与图像的编码法方式,本文也将进行相关的介绍。二、 广播音频编码介绍音频编码的历史可以追溯到上世界80年代,为了利用电话线路传输音乐,欧洲的一些科学家开始研究如何压缩声音与图像信号,并于1987年开启了标准化数字广播系统的计划。与此同时,国际标准
7、化组织(iso)和动态图像专家组(mpeg)也开始了音频标准化的工作,并最终由musicam和aspec建立了三种音频编码方式mpeg-1 layer 13。图1中显示了musicam和aspec中的各家公司,及其与mpeg-1中各层的关系。图1. 创制mpeg-1的相关公司 其中layer 1,编码器最为简单,主要应用于录音磁带;layer 2:编码器中的算法较为复杂,主要应用于数字音频广播、数字电视、vcd 和 dvd 等因,其较低的算法复杂度被选为欧洲数字音频广播的标准;layer 3:编码器算法最为复杂,主要用于高质量音频在网络上的传输,其在音频编码过程中使用了心理声学模型、非均匀的量
8、化算法和无噪声的音频编码等先进技术。这些先进技术使得音频信号在低码率的编码过程中保持了较好的音质。因此,在商业上很快取得了成功,被广泛流传于互联网上,目前有很多支持 mp3 格式的播放器。mpeg-2 标准制定于 1994 年。它是在 mpeg-1 标准基础上推出的,设计目标是为了满足更高的图像质量和传输率的要求,主要针对 hdtv(高清数字电视)的音频和视频编码压缩的需要。mpeg-2 标准的音频部分增加了对采样率为16khz,22.5khz 和 24khz 的支持,且支持对多声道音频信号的编码。然而,mpeg-2标准保持了对 mpeg-1 标准的兼容性,这样就限制 了mpeg-2 音频编码
9、技术的进一步提高。于是,在 1997 年 12 月推出了 mpeg-2advanced audio coding(简称为mpeg-2 aac)音频编码标准,它放弃了对 mpeg-1 音频的兼容性,aac 制定了三种编码框架模型,分别是主框架模型、低复杂度框架模型和采样率可变框架模型。这三种编码框架模型适用于不同的场合,灵活性较高。mpeg-2aac 能够实现在更低的码率下达到 vcd 的音质。实验结果也证明了这一方案的编码效率明显优于mp3 音频编码算法。mpeg-2 标准主要应用于音视频资料的保存、卫星传输、电视节目的播出等领域。mpeg-4 标准发布于 1998 年 11 月,是一种甚低码
10、率的音视频压缩编码标准,被看作是下一代多媒体的技术标准。mpeg-4 在多媒体系统上具有可操作性和交互性,支持各种各样的多媒体应用,数据压缩比高。mpeg-4 音频标准提供了可交互性的多媒体应用,具有很好的可扩展性和高度的灵活性。与以往 mpeg 制定的音频标准不同的是,mpeg-4 音频部分增加了许多在合成内容和场景描述等领域的新工作,增添了音调变化、可分级性以及可编辑性等功能。mpeg-4 aac 标准仍然沿用了 mpeg-2aac 音频编码的结构,仅在编码过程中加入了可以选择的感知噪声替换(perceptual noise substitution,pns)技术和长时期预测(long t
11、erm prediction,简称为 ltp)技术,用于适应低码率的情况。因此在解码器端并不能实现其向前兼容。mpeg-4 标准主要用于移动网络通信和网络公共电话,还可支持视频电话、可视邮件、邮件报纸等应用。近些年来,基于内容的音/视频数据的检索成为了多媒体领域的又一个新的研究热点。为此,mpeg 组织又制定了 mpeg-7 标准,被称之为“多媒体信息内容描述接口”。mpeg-7 标准并没有制定新的编码压缩算法,只是 mpeg-4 标准的补充,其任务是对各种不同的多媒体信息格式进行标准化的描述,并将该描述与所描述的信息存储内容相联系,以便于用户能够快速地搜索出所需要的不同类型的多媒体信息。mp
12、eg-7 应用于不同的领域中,如音视频数据库的检索、商标的检索、个人化视频服务、远程购物、远程教学、保安监控等领域。1994年,世界知名音频和多媒体技术研究机构fraunhofer iis与相关产业合作伙伴及标准化组织紧密合作,开启了下一代音频编码的工作。以先进音频编码(aac)开始,开发出了一系列新的音频编码技术,其中包括mpeg环绕声(mps),空间音频对象编码(saoc)和统一语音视频编码(usac)。先进音频编码技术(advanced audio coding,简称为 aac)是 mpeg-2 编码标准规范中的一部分,是由 fraunhofer iis、dolby 实验室、索尼、诺基亚
13、等诸多公司共同研发,目标是为了代替 mp3格式。在 mpeg-4 标准产生以后,aac 又重新集成了其特性,加入了感知噪声替换技术和长时期预测技术,为了与 mpeg-2aac 音频编码进行区别又称之为 mpeg-4 aac。在dvb标准体系中,定义了四中音频编码方式:mpeg-1,mpeg-2,ac-3和dts,用于卫星电视,线缆电视和无线电视传输。ac-3标准长久以来都用于卫星或线缆传输电视的5.1环绕声。现代的传输中,如下一代传输系统dvb-t2,包含了mpeg-4 he-aac音频编码,而he-aacv2则用于移动电视、移动手机等用户电子设备。三、 空间音频对象编码空间音频编码(spat
14、ial audio coding,sac),是用于在有效压缩多声道音频信号的同时,维持与现有立体声音频系统的兼容性的技术。在mpeg中,sac 技术自2002年起被标准化,并命名为环绕mpeg(surround mpeg)。sac 是基于传送的下混(downmix)信号和附加的空 间 参 数(spatial parameters)来 重 构 多 个 声 道 信 号的,其 中 空 间 参 数 表 示 音 频 信 号 的 人 类 知 觉 特 性。典型的空间参数包括用于表示音频信号的功率增益信息的声道电平差(cld )、音频信号之间的声道间电平差(icld);用于表示视音频信号相位信息的声道间时间差
15、(ictd);用于表示音频信号之间的相关信息的声道间相关(icc );音频信号之间的虚拟源位置信息。不同于基于信道的mpeg环绕编码方式,空间音频对象编码是一种基于对象的编码方式,它允许传播者同时传输不同的音频对象。接受者可根据自身需要,对接收到的对象进行重新渲染,甚至可以对音频信息进行修改(如在卡拉ok或不同音频混合上)。3.1 对话放大技术对话放大是空间音频对象编码在广播环境中的一项重要应用,它允许终端用户根据自身需要或当前环境(环境嘈杂、利用耳机收听或在家中等),调整各部分声音的大小。对象编码器获取并分析信源信号,对各声音信号的混合关系进行分析后得出各个相关参数,以供后期分析处理,然后利
16、用音频编码器,如mpeg-4、aac或者he-aac进行编码,而参数信息则是随着编码后的音频比特流一同传输。另一方面,接收端对音频比特流进行解码,然后将混合音频信号导入saoc解码器中,以利用参数比特流汇总的描述性数据开始对音频信源进行调整。用户可以分别对每个信源的音量进行调节,比如可以调高体育比赛中的解说生音。saoc的对话方法技术完全匹配现有的传输与录放设备,接受者不用像现在这样只能使用默认的混音。3.2 温布尔登实验2011年saoc技术在温布尔登网球公开赛中试验成功,听众可以利用专有设备与相关网络广播频道,对赛场解说音按需调节,音量可在正负12db间调节,且用户的调节情况利用相关仪器进
17、行了记录。该设备的结构如下:该设备需要两个音频源,一个是来自球场的声音,另外一个是比赛中的解说音,其中球场的声音是由裁判椅上的同步双麦克风手机。两个音源独立的输入saoc编码其中,两个输入混合成一个信号后,再输入aac编码器中。从收集到的用户调节情况中可以看出,听众对于新技术有很积极的反响,用户乐于自己修改各声音的大小,使得听众用户体验得到明显改善。从调查结果中看,超过8成听众选择了与默认设置不同的调节方式,其中有两个用户群里值得关注。其一是选择稍小的解说音量,以获取更身临其境的感受;另外一部分选择放大解说声音以更好的理解比赛。四、 扩展高效先进音频编码4.1 相关背景传统的感知音频编码有一定
18、的局限性。例如,对已有较高性能的 aac来说,想进一步提高压缩率是很困难的。若要进一步降低比特率,将可用比特分配到全频带,则可能使各频率的量化误差都超过掩蔽阈值,使音质变差。spectral band replication (sbr)是一项新颖的音频频谱恢复技术,它能够极大的提高感知音频编码的压缩效率,已经成为 mpeg4 的音频频谱扩展标准。作为一项附加增强技术,sbr 与现有的 mpeg 标准 aac结合的 heaac 是新一代的 mpeg4 压缩标准。在 heaac 音频压缩标准中,对人耳较为敏感的低频成分进行 aac 感知编码,对于人耳不很敏感的高频成分采用 sbr 参数编码技术完成
19、。解码端通过感知与参数的联合解码来恢复全频带频谱,进而降低了对比特率的要求,同时又提供了高品质的音频。由于采用了更加先进的参数编码技术,heaac 解码器的复杂程度比 aac 解码器提高近一倍。但良好的音质与压缩效率,使其更适用于带宽受限的流媒体应用。前面提到的传统的基于块传输的通用音频编码器,如mp3、ac-3、mpeg-4及he-aac等,在比特率较低的情况下,用户感知到的质量下降速度要明显高于其他信号模型。这也导致了这些编码方式的可接受最低比特率是由已编码语音的质量决定的,因此一些数字播放系统针对人类语音指定了特定的高效编码方式作为变通方法。基于相应的信号模型,这些编码器只能处理好纯语音
20、信号,而不能处理音乐和噪音,甚至不能处理被音乐和背景噪音覆盖的语音。除了纯语音信号外,其他信号很要利用一种单独的编码模式完成高质量的编码,且语音编码器很难达到非常高的传输质量。因此,2007年iso和mpeg两大组织提出了联合语音与其他音频声音的联合编码,既所谓的统一语音音频编码(usac)。4.2统一语音音频编码通过不懈的努力,2012年iso/iec 23003-3标准的达到了上述需求的要求,其算法基于he-accv2算法。usac将语音编码与普通音频编码融合为一体,成为了一种先进的单一编码模式。在能够将人类语音表现的同其他任何音频信号一样高质量的同事,该算法避免了将普通音频信号编码与语音
21、编码分离的缺点。因其与aac编码方式的紧密关系,这种新的编码器可视为he-aacv2的升级版本。mpeg也相应提出了一种新的音频编码文件格式,称为扩展高效先进音频编码,支持全部现有的基于aac的文件。扩展高效先进音频编码不仅可以用于低比特率的情况,在需要极高传输的质量的情况下,也可支持更高的比特率。4.3相关测试与结果为了测试低比特率时he-aac能在多大程度上改善音频质量,我们设计了两个测试。首先测试了在8kbps条件下,xhe-aac和 drm30 编码器单声道状态下的不同;其次测试了16kbps和24kbps条件下,xhe-aac和xhe-aacv2在立体声状态下的区别。图2. 单声道调
22、节下 lp-anchor、xhe-aac、drm acc、celp、hvxc测试结果图3. 立体声调节下 lp-anchor、xhe-aac24kbps、drm acc24kbps、xhe-aac16kbps、drm acc16.5kbps测试结果在测试中,每项测试都有15人参与收听,测试材料为9段长度由7.8秒到16.5秒不等的语音片段组成。语音片段分为三类:音乐片段、纯语音片段和带有背景噪音的语音片段。实验结果中能够看出,在每种情况下,xhe-aac都比其他编码算法拥有更高的语音质量。在立体声的测试中,在两种比特率的状态下,xhe-aac始终要比drm he-aac表现出更好的性能,在语音
23、测试中这种改善更为明显。4.4 itu 广播标准提案 因其在现代数字广播系统中的适应性,he-aac编码已包含在itu的最新提案 itu-r bs.1196-3(audio coding for digital broadcasting)中。itu-r bs.1548-4,数字广播音频编码系统的用户需求中,更进一步确认了xhe-aac满足了所需的传输质量。又因为xhe-aac兼容了aac-lc和he-aac,其也适应多信道音频程序的高质量传输。技术层面上,扩展高效先进音频编码在低比特率的情况下满足音乐与语音的质量要求,而itu-r也确定其为标准,可以预见在不远的未来该技术将会被广泛利用于广播系
24、统中。五、 总结广播音频编码经历了长达30年的发展、测试与标准化的历程,多家企业、研究机构的标准化组织一直为其发展不懈努力。随着社会的发展。用户对于广播服务的需求也越来越高,希望提供的服务也越来越多样化,这也推动了相关技术的发展。高清电视的普及一定程度上也推动了利用数字广播技术传输环绕立体声的发展,但真正有较好的收听条件的用户数量有限,因此提出新的传输与接收的观念是很有必要的。针对对象的传输,而不仅仅是针对频道的传输,让用户有条件根据自己的需求,调整不同音轨的音量大小,以达到更好的收听效果。空间音频对象编码将需传输的信息分成音频与参数信息两部分,通过同一段数据流传给收听者。在2011年的温布尔
25、登网球公开赛中,该技术得到的很好的验证,用户可以根据自己的喜好分别调节现场音和解说音的大小。尤其是对于有一定听觉障碍或处于嘈杂环境中的用户而言,这项技术提供了极佳的用户体验,也适应了更多的收听环境。而作为音频核心编码技术,扩展高效先进音频编码对在8kbps左右的低比特率条件下的音频编码质量取得了极大的提升。现在的音频制作者们必须在集中编码方式的效率、质量和系统复杂度之间寻找一个平衡,而利用该编码方式则可以有效缓解这方面的矛盾。六、 参考文献1 刘倩如. heaac解码器的软硬件协同设计与实现. 上海:上海交通大学 20072 刘红甫. 基于mpeg_4aac的音频编码算法研究. 武汉:武汉工业学院 20123 焦慧颖,安建平,卜祥元. 数字广播
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 挖掘机平整地面施工方案
- 锚固桩施工方案
- 惠州市润根电器有限公司 AC 电源线及插头的生产建设项目环评报告表
- 初中半期考答案数学试卷
- 仿玉石楼梯扶手施工方案
- 小学校园内管网施工方案
- 房建地下连续梁施工方案
- 别墅的专项施工方案
- 农田排水降水施工方案
- 黄桃高产栽培技术的高效应用及科学推广措施分析
- 人教版2025三下英语单词表
- 职业病卫生监督培训课件
- 2024年张家界市市直事业单位选调工作人员考试真题
- 2025年四川省对口招生(旅游类)考试复习题(附答案)
- 私募股权投资基金基础知识-《私募股权投资基金基础知识》高分通关卷5
- 校园春季传染病预防
- 医院危险化学品安全管理
- 2024年劳动合同(30篇)
- 燃气公司安全生产实施方案
- 全国职业院校技能大赛高职组(生产事故应急救援赛项)选拔赛考试题库500题(含答案)
- 2024年安全员理论考试题库附答案解析
评论
0/150
提交评论