




已阅读5页,还剩25页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
话音编码多媒体技术第三章主要内容v话音的形成原理v脉冲编码调制( PCM)v增量调制与自适应增量调制v自适应差分脉冲编码调制( ADPCM)v子带编码v其他编码话音的形成原理: 肺中的空气受到挤压形成气流,气流通过声门(声带)沿着声道(由咽、喉、口腔等组成)释放出去,就形成了话音。话音的分类:浊音、清音、爆破音三种话音编译码器: 波形编译码器( waveform coder) ;音源编译码器( Source coder) ;混合编译码器( Hybrid coder) 。话音技术的研究热点v话音压缩编码( Speech Coding)v基于内容的音频检索技术 (Content-based Audio Retrieval )v话音识别( Speech Recognition)v文本话音转换( Text To Speech)声音质量的度量v声音的质量与声音的带宽有关,一般来说频率范围越宽,声音质量也就越高。声音类型 带 宽电话语音 200Hz 3.4kHz调幅广播 50Hz 7kHz调频广播 20Hz 15kHzCD 20Hz 20kHz 信噪比( SNR)、 主观平均判分法( MOS)。衡量话音编码器的因素v音频质量v数据率v编 /解码延时v算法复杂度v价格因素语音质量等级划分v 广播质量:带宽为 7000Hz的高质量话音v 长途电话质量:带宽为 3400Hz, 信噪比为 30db,有失真v 通信质量:完全可以听懂,但和长途电话质量相比有明显的失真。v 合成质量: 80 90的可懂度,听起来象机器讲话,失去了讲话者的特征脉冲编码调制( PCM)vPulse Code ModulationvPulse Code ModulationY: 样本值; X:原始值E = Y X: 量化误差或量化噪声PCM的量化方式均匀量化与非均匀量化非均匀量化v对小信号采用小的量化间隔,对大信号采用大的量化间隔,这样可以用较少的位数编码。v对大信号来说,虽然绝对量化误差较大,但是因为:( 1)大信号出现的机会不多,( 2)信噪比(相对误差)与小信号是一致的,所以对总的话音质量影响不大。v非均匀量化也是一种压缩技术。律压扩与 A律压扩v在非线性量化中,采样输入信号幅度和量化输出数据之间定义了某种特定的对应关系。两种对应关系v 律压扩v A律压扩律压扩与 A律压扩vm 律 (m -Law)压扩 (G.711)主要用在北美和日本等地区的数字电话通信中。x为输入信号,规格化为 1= x =1 为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取 100 = = 500。律压扩与 A律压扩0 = |x| = 1/A1/A = |x| = 1A律 (A-Law)压扩 (G.711)主要用在欧洲和中国大陆等地区的数字电话通信中x为输入信号,规格化为 1= x =1A为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比。A律压扩前一部分是线性关系,其余部分是对数关系CCITT的 G.711标准对于采样频率为 8 kHz, 样本精度为 13位、14位或者 16位的输入信号,使用 律压扩编码或者使用 A律压扩编码,经过 PCM编码器之后每个样本的精度为 8位,输出的数据率为64 kb/s。 这个数据就是 CCITT推荐的 G.711标准 话音频率脉冲编码调制 。PCM与时分多路复用( TDM)增量调制 ( M)增量调制 (delta modulation, DM) 是一种预测编码技术, 是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“ 0” 和 “ 1” 这两种可能的取值之一 。如果实际的采样信号与预测的采样信号之差的极性为 “ 正 ” ,则用 “ 1” 表示;相反则用“ 0” 表示。 DM编码系统又称为 “ 1位系统 ” 。增量调制 ( M)vXi = 1: Yi+1 = Yi + vXi = 0: Yi+1 = Yi - 自适应增量调制 (ADM)v根据输入信号斜率的变化自动调整量化阶 的大小vCVSD( 连续可变斜率增量调制):如果编码器的输出连续出现三个相同的值,量化阶就加上一个大的增量;反之,就加一个小的增量。自适应脉冲编码调制( APCM)vAPCM是一种根据输入信号幅度大小自动改变量化阶大小的一种波形编码技术。差分脉冲编码调制( DPCM)vDPCM是利用相邻样本之间冗余信息来进行编码的一种数据压缩技术。差分脉冲编码调制是根据过去的样本去估算下一个样本信号的幅度大小,这个值成为预测值,然后对实际信号值与预测值之差进行量化编码,从而减少了表示每个样本的位数。DPCM是对差值进行量化编码,存储或传送的是差值,而不是幅度绝对值差分脉冲编码调制( DPCM)自适应差分脉冲调制( ADPCM) ADPCM综合了 APCM的自适应特性和 DPCM系统的差分特性。 思想:利用自适应改变量化阶大小;用过去的样本估算下一个输入样本的预测值,使实际值与预测值之间的差值尽量小自适应差分脉冲编码调制v ADPCM是利用样本与样本之间的高度相关性和量化阶自适应来压缩数据的一种波形编码技术,CCITT为此制定了 G.721推荐标准,这个标准叫做32 kb/s ADPCM。 在此基础上还制定了 G.721的扩充推荐标准 G.723,使用该标准的编码器的数据率可降低到 40 kb/s和 24 kb/s。v G.721 的输入信号是 G.711 PCM代码,它的数据率为 64 kb/s。而 G.721 ADPCM的输出是用 4位表示的差分信号,它的采样率仍然是 8 kHz, 它的数据率为 32 kb/s, 这样就获得了 21的数据压缩。子带编码子带编码主要过程:1、使用一组带通滤波器把输入音频信号分成若干个连续的频段2、对每个子带的音频信号采用单独的编码方案编码3、在信道上传送时,将每个子带的代码复合起来。4、接收端译码时,每个子带单独译码子带编码的优点v G.722是 CCITT推荐的音频信号编码译码标准。v G.722标准的数据率为 64 kb/s, 采样频率由8 kHz提高到 16 kHz,是 G.711 PCM采样率的2倍,因而要被编码的信号频率由原来的 3.4 kHz扩展到 7 kHz。 这就使音频信号的质量有很大改善,由数字电话的话音质量提高到调幅 (AM)无线电广播的质量。子带自适应差分脉冲编码调制各标准比较压缩 算法 采 样 率 样 本精度 数据率G.711 PCM 8KHZ 8位 64KbpsG.721 ADPCM 8KHZ 4位 32KbpsG.722 SB-ADPCM 16KHZ 4位 64Kbps其它语音编码方法v线性预测声码器( LPC 10, LPC 10e)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工会知识培训
- 腹腔镜子宫切除护理配合
- 九年级化学上册 第五单元 定量研究化学反应 第二节 化学反应的表示教学设计 鲁教版
- 餐巾折花培训方案
- 2024中国航天科工集团有限公司档案馆招聘3人笔试参考题库附带答案详解
- 六年级上册心理健康教育教案-5插上创造的翅膀|辽大版
- 船舶预防火灾培训
- 动火作业安全培训课件
- 人教版历史与社会八年级上册第二单元第一课《西欧封建国家与基督教文明》 教学设计1
- 双重预防体系练习试卷附答案(一)
- 2024年广东公需课《百县千镇万村高质量发展工程与城乡区域协调发展》试题及答案
- 工商企业管理毕业论文19904
- 防极端天气安全教育主题班会
- 2025湖北随州国资本投资运营集团限公司人员招聘27人易考易错模拟试题(共500题)试卷后附参考答案
- 2024年四川烟草商业系统招聘考试真题
- 2025年许昌电气职业学院单招职业技能测试题库附答案
- 工厂能源知识培训课件
- 患者隐私保护培训课件
- 2025年洛阳科技职业学院单招职业倾向性测试题库及答案(历年真题)
- (一模)2025年深圳市高三年级第一次调研考试 政治试卷(含答案)
- 2025年成都港汇人力资源管理限公司面向社会公开招聘国企业工作人员高频重点模拟试卷提升(共500题附带答案详解)
评论
0/150
提交评论