四川大学计算机学院多媒体基础MPEG声音1_第1页
四川大学计算机学院多媒体基础MPEG声音1_第2页
四川大学计算机学院多媒体基础MPEG声音1_第3页
四川大学计算机学院多媒体基础MPEG声音1_第4页
四川大学计算机学院多媒体基础MPEG声音1_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多媒体技术根底MPEG声音一、 MPEG-1 Audio 二、 MPEG-2 Audio三、 MPEG-2 ACC四、 MPEG-4 AudioMPEG-1 Audio 、MPEG-2 Audio、MPEG-2 ACC声音数据紧缩编码感知声音编码(perceptual audio coding) 利用人的听觉系统的感知特性来到达紧缩声音数据的目的不同于与波形声音紧缩编码(如ADPCM)和参数编码(如LPC) :根据波形本身的相关性和模拟人的发音器官的特性MPEG声音对响度的感知 “听阈频率曲线 MPEG声音对音高的感知 “音高频率曲线MPEG声音掩蔽效应一种频率的声音妨碍听觉系统感受另一种频率

2、的声音的景象 频域掩蔽一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽 时域掩蔽在时间上相邻的声音之间的掩蔽景象。两种时阈掩蔽:超前掩蔽和滞后掩蔽MPEG声音心思声学模型(psychoacoustic model) 听觉阈值电平听觉阈值的大小随声音频率的改动而改动,各个人的听觉阈值也不同。大多数人2 kHz5 kHz一个人能否能听到声音取决于声音的频率,以及声音的幅度能否高于这种频率下的听觉阈值。听觉粉饰特性听觉阈值电平是自顺应的,即听觉阈值电平会随听到的不同频率的声音而发生变化。 MPEG声音MPEG Audio 采用的两种感知编码:感知子带编码(perceptu

3、al sub-band coding)思想是首先把时域中的声音数据变换到频域,对频域内的子带分量分别进展量化和编码,然后根据心思声学模型确定样本的精度,从而到达紧缩数据量的目的。不局限于只对话音进展编码,也不局限于哪一种声源。Dolby AC-3编码MPEG声音感知子带编码紧缩算法框图 MPEG-1 AudioDolby AC-3紧缩编码算法框图MPEG-1 AudioMPEG声音编码器构造图MPEG-1 AudioMPEG声音解码器构造图MPEG-1 AudioISO/MPEG audio层1和层2编码器和解码器的构造MPEG-1 AudioISO/MPEG audio层3编码器和解码器的构

4、造MPEG-1 AudioMPEG-1和-2的声音数据规格参数称号Linear PCM Dolby AC-3 MPEG-2 AudioMPEG-1 Audio采用频率48/96 kHz 32/44.1/48 kHz16/22.05/24/ 32/44.1/48 kHz32/44.1/48 kHz样本精度(每个样本的比特数)16/20/24 紧缩(16 bits)紧缩(16 bits)16最大数据传输率 6.144 Mb/s 448 kb/s 8640 kb/s32448 kb/s最大声道数8 5.1 5.1/7.1 2MPEG-2 AudioMPEG-2 AAC Advanced audio

5、coding编码思想:主要运用听觉系统的掩蔽特性来减少声音的数据量,并且经过把量化噪声分散到各个子带中,用全局信号把噪声掩蔽掉。与MPEG-1声音格式不兼容 适用范围:AAC支持的采用频率可从8 kHz到96 kHzAAC编码器的音源可以是单声道的、立体声的和多声道的声音。AAC规范可支持48个主声道、16个低频音效加强通道LFE (low frequency effects)、16个配音声道(overdub channel)或者叫做多言语声道(multilingual channel)和16个数据流。MPEG-2 AACMPEG-2 AAC Advanced audio coding紧缩率:

6、MPEG-2 AAC紧缩比为11:1即每个声道的数据率为(44.116 )/11=64 kb/s。在5个声道的总数据率为320 kb/s的情况下,很难区分复原后的声音与原始声音之间的差别。与MPEG的层2相比,MPEG-2 AAC的紧缩率可提高1倍,而且质量更高;与MPEG的层3相比,在质量一样的条件下数据率是它的70。MPEG-2 AAC MPEG-2 AAC的配置开发MPEG-2 AAC规范采用模块化的方法:把整个AAC系统分解成一系列模块,用规范化的AAC工具(advanced audio coding tools)对模块进展定义 MPEG Audio规范是对整个系统进展规范化AAC规范

7、定义了三种配置:根本配置低复杂性配置可变采样率配置MPEG-2 AACMPEG-2 AACMPEG-2 AAC编码器框图 MPEG-2 AAC解码器框图MPEG-2 AACMPEG-4 Audio规范:集成从话音高质量的多通道声音;从自然声音合成声音编码方法:参数编码(parametric coding)码鼓励线性预测(code excited linear predictive,CELP)编码时间/频率T/F(time/frequency)编码构造化声音SA(structured audio)编码合成声音:MIDI;TTSMPEG-4 Audio自然声音 (natural audio)MPE

8、G-4声音编码器支持数据率2 kb/s64 kb/s之间的自然声音。三种类型声音编码器: MPEG-4 Audio1、参数编码器参数编码提供了两种编码工具:HVXC和HILN。 谐音矢量鼓励编码 HVXCHarmonic Vector Xcitation Coding)编码工具允许对言语信号在2kbit/s和4kbit/s之间进展可分级性编码。谐音和独立线性加性噪声HILNHarmonic and Individual LineplusNoise编码工具允许对非言语信号,例如音乐以4kbit/s和更高的码率进展编码。HILN支持在速度、音调、码率和复杂度上的可分级性。可以将HVXC和HILN结

9、合起来运用以获得更宽范围内的信号和码率。可以在两者编码器的输出之间动态地切换或混合。MPEG-4 Audio2、CELP编码器 CELP的解码器包括一个鼓励源、一个合成滤波器和一个需求时添加的后置滤波器。鼓励源拥有两种分量,一是由自顺应码书产生的周期分量,另一个是由一个或多个固定码书产生的随机分量。在解码器中,运用码书索引和增益索引来重建鼓励信号。鼓励信号接着经过线性预测合成滤波器,最后,为了获得加强的言语质量,可以运用后置滤波器。CELP支持两种采样率:8kHz和16kHz输出数据率624 kb/sMPEG-4 Audio3、T/F编码器(时间-频率(time-to-frequency,T/

10、F)技术)当码率为每声道64kbit/s时就是MPEG2AAC编码规范,此时可以获得极好的音频质量。 比特分片算述编码BSACthebit-slicedarithmeticcoding,作为一种无噪声编码它能提供从16kbit/s至64kbit/s之间以1kbit/s的步率实现码率的分可级性。变换域加权插入矢量量化TwinVQ作为一种无噪声编码和量化工具也是一种选择,它运用线性预测编码LPC模型来定义量化器步阶,对插入和量化的频谱系数进展矢量量化,特别适用于需求码率可分级性和强纠错的系统中。 MPEG-4 AudioMPEG-4 Audio编码方框图MPEG-4 Audio文-语转换 TTS(text-to

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论