语音处理3-语音波形数字编码_第1页
语音处理3-语音波形数字编码_第2页
语音处理3-语音波形数字编码_第3页
语音处理3-语音波形数字编码_第4页
语音处理3-语音波形数字编码_第5页
已阅读5页,还剩106页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第三章第三章 语音波形的数字编码语音波形的数字编码Yi Wang本章主要内容 引言 3.1脉冲编码调制PCM 3.2差分脉冲编码调制DPCM 3.3增量调制DM 3.4波形编码中的自适应技术 3.5压缩比特率的其他方法2Yi Wang本章主要内容 引言 3.1脉冲编码调制PCM 3.2差分脉冲编码调制DPCM 3.3增量调制DM 3.4波形编码中的自适应技术 3.5压缩比特率的其他方法3Yi Wang引言1 语音编码:一种在数字信道高效传输语音的表示方法42 编码目标l高质量语音l高可理解语音l低比特率(带宽)l低复杂度l低时延l低传输误差Yi Wang3 编码分类 波形编码采样 量化表示量

2、化值以重建语音波形为目的,力图使重建波形接近原信号波形。有适应能力强,重建质量好等优点,但码率较高,即压缩效率较低。例如:DPCM(ADPCM)、M等都是属于此类。 参数表示数字模型为基础模型参数(如:激励源信道)不忠实波形,只尽可能好地提供相同效果的信号5Yi Wang4 语音编码的评价 主观评价 客观评价6组织一定数量的调查用户,各自组织一定数量的调查用户,各自按照按照 0-5 分对接收到的语音质量分对接收到的语音质量进行进行 评分(评分(5 表示最好,表示最好,0 表示最表示最差),然后进行统计差),然后进行统计 分析得到最分析得到最终的终的 MOS 分值分值最著名的最著名的MOSMOS

3、Yi WangMOS=4,电话语音质量的标准。MOS=4或更高,比较好的语音质量,和原始语音听不出区别MOS=3.54,通信质量,适于电话通信MOS3.6,则大部分接听者不能满意这个语音质量。 MOS缺点:在现实中,让一组人接听语音和评价语音的质量实现起来是非常困难和昂贵的7Yi Wang各编码标准的MOS值8Yi Wang 客观的测量方法:SQM /PSQM+感知通话质量测量PESQ感知评估通话质量测量PAMS(英国电信)感知分析测量 MOS是广泛认同的语音质量标准,因此,无论采用何种方法所有测量方法都必须对应它们的结果对应到最终的平均主观值MOS,以上各方法均最终以MOS值表示。 9Yi

4、Wang客观评价SNR 优点:容易计算 缺点:评价不十分符合听觉特性 其他:Segmental SNR10Yi Wang本章主要内容 3.1脉冲编码调制PCM 3.2差分脉冲编码调制DPCM 3.3增量调制DM 3.4波形编码中的自适应技术 3.5压缩比特率的其他方法11Yi Wang3.1脉冲编码调制PCM12Yi Wang3.1.13.1.1取样时间离散化取样时间离散化 采样过程13TSTSTSTSl奈奎斯特取样定律Yi Wang采样频率的选择 例如 一电话信号频带为3003.4kHz,fm=3.4kHz,则抽样频率fs23.4k=6.8kHz。 因此, 按6.8kHz的频率抽样,可不失真

5、地还原成原话音信号,话音信号的抽样频率通常取8kHz。 精确:保留10k内信号,采样率20k 可懂:保留3.4k内信号,采样率8k14Yi Wang抗混叠失真滤波器1511 )e (Hj0cst211 :c:st通带截止频率通带截止频率阻带截止频率阻带截止频率 3.4 4.6 阻带 通带 过渡带 频率/kHz n抗混叠防混叠失真和噪声干扰n锐截止模拟低通n防市电干扰50Hzn100Hz3.4kHzn高质量语音信号处理系统,可以用9阶椭圆滤波器实现Yi Wang3.1.2量化和码化16Yi Wang1 1、量化的过程幅度离散化、量化的过程幅度离散化量化器输出量化器输出 = =Q(x)Q(x)=

6、=y yi i ,| |x xi i|x x| k89sfTk此时,码字特点:一连串0或者1Yi Wang当输入信号为正弦信号当输入信号为正弦信号 时,不过载条件为时,不过载条件为 (因(因 )c c、注意区分、注意区分PCMPCM中,过载量化噪声是由于信号幅度过大,超过了量化中,过载量化噪声是由于信号幅度过大,超过了量化器的动态范围产生的;器的动态范围产生的;DMDM系统的过载量化噪声是由于信号的变化速率过快,超系统的过载量化噪声是由于信号的变化速率过快,超过了预测信号的变化速度产生的。过了预测信号的变化速度产生的。dttdxTka)(maxcoskAtksfA/kktkksAttAdttd

7、AdttdAfk0coscosmaxb、不出现过载噪声,信号的斜率应满足: Yi WangB B、颗粒失真、颗粒失真a a、特点:、特点:1.1.输入信号变化缓慢或者不变化时出现输入信号变化缓慢或者不变化时出现2.2.表现为幅度表现为幅度2 2 的震荡的震荡3.3.码字特点:一连串码字特点:一连串0 0和和1 1交替出现的序列交替出现的序列b b、分析、分析 的选取的选取1.1. 较小,颗粒噪声较小较小,颗粒噪声较小2.2. 较大,过载失真较小较大,过载失真较小3.3.一般,选取较小一般,选取较小 (颗粒噪声对整个音频范围有(颗粒噪声对整个音频范围有影响,人耳易感知),通常加大取样频率以减影响

8、,人耳易感知),通常加大取样频率以减小过载失真小过载失真91Yi Wang4、DM的信噪比1. 1bit字长,量化误差比较严重2. 需增加1.方法: 提高取样频率,通常比奈奎斯特频率高几倍2.原因 取样频率高,取样相关度高,预测准确,预测误差方差小92qdxqpSNRSNRGSNR2222edqSNR22dxpGYi Wang5、比特率1.设DM取样频率 为信号最高频率, 为超取样指数2.DM的比特率3.比特率和采样速率相同,说明:超取样指数,等效于 采样时,采用的量化器字长93Msffk2/MfkffBfMss2kffMs2Mf2Yi Wang6、自适应增量调制(ADM)A、 M问题:1.

9、信号频率高,量阶相对小,量化跟不上变化,产生过载失真。2. 信号频率低,量阶相对大,产生颗粒噪声。改进:进行自适应量化B、ADM基本原理:采用自适应方法使量阶的大小跟踪输入信号的统计特性而变化,信号幅度小时阶距减小,信号幅度大时阶距增大。94Yi Wang反馈ADM框图95Yi WangC、ADM的实现方法自适应调制阶距的方法很多,常用的两种:方法1:量阶随信号瞬时值变化时,称为瞬时压扩M。 1971年song提出方法2:量阶随音节时间间隔(520 ms)中信号的平均斜率变化,则称为连续可变斜率增量调制,记作CVSD。目前常用,格林弗基斯(Greefkes)1970提出的96Yi Wang方法

10、方法1 1:瞬时压扩:瞬时压扩MM 阶距调整规则阶距调整规则其中其中P P值的规则为值的规则为说明:说明:码值和前一时刻相同,乘数码值和前一时刻相同,乘数P P取大于取大于1 1,如,如2 2码值和前一时刻不同,乘数码值和前一时刻不同,乘数P P取小于取小于1 1,如,如1/21/2 量化阶距需要限制,以保证量化器可实现量化阶距需要限制,以保证量化器可实现为减小颗粒噪声,为减小颗粒噪声, 足够小足够小保持大动态范围的高保持大动态范围的高SNRSNR, 足够大足够大97) 1()(1) 1()(121ncncPncncPP,当,当) 1()(nPnmaxmin)(nminminmax/Yi Wa

11、ng例1.斜率过载失真时,码字为一连串0(升)或1(降)序列ADM中,阶距将按指数规律 增大,保证量化电平快速跟上信号变化,减小过载失真2.颗粒噪声时,码字为一连串0、1交替序列ADM中,阶距将按指数规律 不断减小至嘴角阶距,大大减小颗粒噪声为了稳定,要求98nnP21nnP 22121PPYi Wang方法方法2 2:CVSDCVSD连续可变斜率增量调制连续可变斜率增量调制 调整规则:调整规则:其中其中 , 且且 说明:说明:如果码流中连续出现三个如果码流中连续出现三个0 0或者三个或者三个1(1(斜率过斜率过载的码型载的码型) )量化阶就加上一个大的增量,阶距量化阶就加上一个大的增量,阶距

12、将不断增大,直到最大阶距将不断增大,直到最大阶距反之,阶距将不断减小反之,阶距将不断减小( (因为因为 ),),直到最小阶距。直到最小阶距。 可以控制自适应速度可以控制自适应速度1099其他情况当,) 1()2() 1()(,) 1()(12DnncncncDnn100,021DD12DD Yi Wang 量化阶距需要限制,以保证量化器可实现为减小颗粒噪声, 足够小保持大动态范围的高SNR, 足够大 在CVSD系统中,接收端的译码器从接收到的码流中获取自适应信息,即根据码流连“1”或连“0”的个数自动改变量阶大小,恢复出原始信号。100maxmin)(nminminmax/Yi WangCVS

13、D的应用 Motorola公司于80年代初期就已经开发了实现CVSD算法的集成电路芯片。如MC3417/MC3517和MC3418/MC3518,前者采用3位算法,后者采用4位算法。MC3417/MC3517用于一般的数字通信,MC3418/MC3518用于数字电话。MC3417/MC3418用于民用,MC3517/MC3518用于军用。101Yi WangD D、ADMADM实例实例 瞬时压扩的改造瞬时压扩的改造 P P值的规则为值的规则为 * *表示表示0 0或者或者1 1均可均可102) 1()(2/1)2() 1()(1)2() 1()(2ncncncncncncncncP,当,当,当

14、) 1()(nPnYi Wang本章主要内容 引言 3.1脉冲编码调制PCM 3.2差分脉冲编码调制DPCM 3.3增量调制DM 3.4波形编码中的自适应技术 3.5压缩比特率的其他方法103Yi Wang3.5压缩比特率的其他方法3.5.1残差信号压缩 残差信号:预测误差 ADPCM中,传送的是:预测误差 残差本身有压缩的潜力 残差影响音质在于其高振幅部分语音信号不同对残差进行峰值限幅导致听觉失真残差高振幅部分进行精确量化很重要残差进行很严重的中心限幅不会引起大的失真104Yi Wang 方法1:严重的中心限幅 中心限幅的方法: 设定门限值(常归一化为信号包络电平如令其正比于残差均方根) 比较残差取样和门限,低于门限取为0 由于大部分残差样值低幅度,限幅可以去掉90%的残差,语音质量保持良好 理论上,可以减小比特率至1/10(实际比这个高)105Yi Wang 方法2:变长编码 没有限幅的量化器,变长编码,最短码字指定给最常发生的值 残差大多数时间处于低振幅区间,所以低振幅对应短码字,振幅增加,码字长度单调增加106Yi Wang3.5.2噪声整形 噪声频谱整形技术,使噪声频谱随着信号的频谱包络变化,这样语音共振峰中的频率成分会掩盖住量化噪声 指为了减少可听到的噪声而专门设法将量化噪声迁移到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论