语音信号处理课件-语音编码

上传人：3*** IP属地：湖北上传时间：2022-04-08 格式：PPT 页数：69 大小：1MB 积分：35 举报 版权申诉

已阅读5页，还剩64页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、语音信号的压缩编码语音信号的压缩编码一一.压缩编码原因压缩编码原因语音信号的压缩编码是研究如何降语音信号的压缩编码是研究如何降低语音信号编码速率的问题。低语音信号编码速率的问题。以语音信号为例，模拟形式下带宽一以语音信号为例，模拟形式下带宽一般不到般不到4KHz4KHz，经过调制后，所需传输带，经过调制后，所需传输带宽不会超过宽不会超过8KHz8KHz。但是以但是以8KHz8KHz抽样，并且每个样值用抽样，并且每个样值用8 8位二进位二进制代码表示时，即采用制代码表示时，即采用A A率率1313折线折线PCMPCM数字语音信数字语音信号时，信息速率为号时，信息速率为64Kbit/s64K

2、bit/s。利用二进制理想基带传输系统传输利用二进制理想基带传输系统传输一路这样的数字语音信号。所占一路这样的数字语音信号。所占系统的最小频带宽度为系统的最小频带宽度为32KHz32KHz。频带利用率频带利用率=传输速率传输速率/带宽带宽v二二.什么是语音压缩编码？什么是语音压缩编码？把数码率低于把数码率低于64Kbit/s64Kbit/s的的语音编码方法称为语音压缩编语音编码方法称为语音压缩编码技术码技术三三.语音编码分类语音编码分类根据编码器的实现机理，分成三大类根据编码器的实现机理，分成三大类波形编码波形编码参数编码参数编码混合编码混合编码1、波形编码、波形编码从语音信号的波形出发，

3、对波形的从语音信号的波形出发，对波形的抽样值、预测值、预测误差进行编码，抽样值、预测值、预测误差进行编码，它以重建语音波形为目的，力图使重它以重建语音波形为目的，力图使重建波形接近原信号波形。建波形接近原信号波形。特点：利用抽样定理，恢复原始信号的波形特点：利用抽样定理，恢复原始信号的波形优点：优点：适应能力强，重建语音质量好适应能力强，重建语音质量好缺点：缺点：编码速率较高编码速率较高类型：类型： PCM，自适应增量调制自适应增量调制（ADM），），自适应差分编码调制（自适应差分编码调制（ADPCM），），自适应预测编码自适应预测编码APC速率通常在速率通常在16-64kbit/s

4、范围范围v2.参数编码参数编码提取语音的一些特征信息进行编码，提取语音的一些特征信息进行编码，在收端利用这些特征参数合成语音。在收端利用这些特征参数合成语音。v优点：优点：编码速率低。编码速率低。v缺点：缺点：语音的音质和自然度较差，很语音的音质和自然度较差，很难辨别说话人。（有一定的可懂度难辨别说话人。（有一定的可懂度)v类型类型:LPC线性预测编码线性预测编码速率通常是在速率通常是在4.8kbit/s以下以下3.混合编码混合编码v介于波形编码和参数编码的一种编码。介于波形编码和参数编码的一种编码。即在参数编码的基础上引入了波形编即在参数编码的基础上引入了波形编码的一些特征。码的一些特征。

5、波形编码波形编码+参数编码参数编码可在可在4-16kbit/s范围内达到良好的语范围内达到良好的语音质量音质量类型：类型：子带编码子带编码衡量话音编码器的参数数据输出速率延迟时间话音质量价格（实现代价）语音信号的冗余度幅度非均匀分布样本之间的相关性周期之间的相关性基音之间的相关性静止系数（话音间隙）长期相关性（long term correlation）tnxa(nT)xa(t) 2.采样：将时间连续信号将时间连续信号变成时间离散信号。变成时间离散信号。采样频率通常为采样频率通常为f fs s8kHz8kHz。vIdeal sampling and real sampling 对离散时间信

6、号进行量化，对离散时间信号进行量化，在每一时刻对在每一时刻对x xa a(nT(nT) )独立进行量化，把给定的幅度连续的信号变成为有独立进行量化，把给定的幅度连续的信号变成为有限多个幅度的集合中某个幅度值的过程。限多个幅度的集合中某个幅度值的过程。3. A/D转换采样采样量化量化x xa a(t(t) )x xa a(nT(nT) )x(n)x(n)x xa1a1x x1 1x xk kx xakakx xak+1ak+1x xk+1k+1x xL Lx xaLaLx xaL+1aL+1x(n)=Qxx(n)=Qxa a(nT(nT) 000001010011111110101100 /2/

7、2量化误差量化误差( (噪声噪声) ) e(n)=x(n)- xe(n)=x(n)- xa a(nT(nT) ) - - /2/2 e(n) e(n) /2/22 m=00 其他其他（1 1）假设量化噪声是平稳的白噪声过程，有）假设量化噪声是平稳的白噪声过程，有 Ee(n)e(n+m)=Ee(n)e(n+m)=（2 2）假设量化噪声与输入信号不相关，有）假设量化噪声与输入信号不相关，有 Ee(n)x(n+m)=0 mEe(n)x(n+m)=0 m为任意值为任意值（3 3）在每个量化间隔上，量化噪声均匀分布，有）在每个量化间隔上，量化噪声均匀分布，有 P Pe e(e(n(e(n)=)=1 |e

8、(n)| 1 |e(n)| /2/2 0 其他其他量化信噪比量化信噪比量化噪声的信噪比：量化噪声的信噪比：SNR=SNR= x x2 2/ / e e2 2 x x2 2语音信号序列的方差，语音信号序列的方差， e e2 2噪声序列的方差，噪声序列的方差，用分贝表示，用分贝表示，SNR=10log(SNR=10log( x x2 2/ / e e2 2） SNR = signals energy / noises energySNR=6.02B+4.77SNR=6.02B+4.7720log(X20log(Xmaxmax/ / x x) )6.02B6.02B7.277.27 X Xmaxm

9、ax表示其峰值表示其峰值 B B为量化的比特数为量化的比特数当语音信号的幅度服从拉普拉斯分布时，当语音信号的幅度服从拉普拉斯分布时，X Xmaxmax4 4 x x 量化器每增加一个比特，量化器每增加一个比特，SNRSNR提高约提高约6dB6dB。当。当B=8,SNR=40dBB=8,SNR=40dB，满足一般通信系统的要求。当量化，满足一般通信系统的要求。当量化噪声的信噪比达到噪声的信噪比达到 606070dB70dB，才能保障有高水平，才能保障有高水平通话质量，这时要求量化为通话质量，这时要求量化为 111113bits13bits。一般的。一般的音频音频A/DA/D、D/AD/A转换芯片

10、，量化为转换芯片，量化为12bits12bits。脉冲编码调制（PCM）Pulse Code ModulationPCM的量化方式均匀量化与非均匀量化非均匀量化对小信号采用小的量化间隔，对大信号采用大的量化间隔，这样可以用较少的位数编码。对大信号来说，虽然绝对量化误差较大，但是因为：（1）大信号出现的机会不多，（2）信噪比（相对误差）与小信号是一致的，所以对总的话音质量影响不大。非均匀量化也是一种压缩。律压扩与A律压扩m 律(m -Law)压扩(G.711)主要用在北美和日本等地区的数字电话通信中。x为x 为输入信号，规格化为1= x =1m 为确定压缩量的参数，它反映最大量化间隔和最小量化间

11、隔之比，取100 = m = 500。律压扩与A律压扩0 0 = | |x x| | = 1/A 1/A1/A 1/A = | |x x| | = 1 1A律(A-Law)压扩(G.711)主要用在欧洲和中国大陆等地区的数字电话通信中对于采样频率为8 kHz，样本精度为13位、14位或者16位的输入信号，使用m 律压扩编码或者使用A律压扩编码，经过PCM编码器之后每个样本的精度为8位，输出的数据率为64 kb/s。这个数据就是CCITT推荐的G.711标准。自适应差值脉冲编码调制原理（自适应差值脉冲编码调制原理（ADPCM）v差值脉冲编码（差值脉冲编码（DPCM）v1.编码思想编码思想提高通信

12、质量提高通信质量必须必须减小量化误差减小量化误差减小量化级减小量化级当抽样值范围确定时当抽样值范围确定时增加编码增加编码位数位数Nv增加编码位数可获得大的信噪比增加编码位数可获得大的信噪比在编码位数固定时，减小抽样值的变化在编码位数固定时，减小抽样值的变化范围，也同样可以提高信噪比范围，也同样可以提高信噪比即：若缩小抽样值（被编码信号）的即：若缩小抽样值（被编码信号）的变化范围，就可以在保证信噪比不变变化范围，就可以在保证信噪比不变的情况下，减小编码的位数。这就是的情况下，减小编码的位数。这就是差值编码的中心思想差值编码的中心思想增量调制(M)增量调制 (delta modulation，DM

13、) 是一种预测编码技术，是对实际的采样信号与预测的采样信号之差的极性进行编码，将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”，则用“1”表示；相反则用“0”表示。DM编码系统又称为“1位系统”。二、差值编码模型图二、差值编码模型图在原来的抽样值中减去某一个值，然后在原来的抽样值中减去某一个值，然后对两者之差进行编码。在接收端将解码对两者之差进行编码。在接收端将解码值再加上发送端所减去的值便可恢复出值再加上发送端所减去的值便可恢复出原始值。原始值。 x(n) + d(n) c(n) d(n) x(n） - x(n) x(n) 差值编码模型差值

14、编码模型译码译码+编码编码+图中：图中：x(n)是原始样值（是原始样值（n时刻的抽样值）时刻的抽样值）x(n)为减去量为减去量d(n)=x(n)-x(n) 为差值为差值可以看出：可以看出：（1）、）、d(n)越小，在相同的编码位数时越小，在相同的编码位数时信噪比越大信噪比越大（2）、收发端必须有相同的减去量）、收发端必须有相同的减去量x(n)根据前些时刻的样值来预测现时刻的样根据前些时刻的样值来预测现时刻的样值，只要传递预测值和实际值之差，而值，只要传递预测值和实际值之差，而不需要每个样值的编码都传。这种方法不需要每个样值的编码都传。这种方法就称为就称为DPCM编码。编码。v三、三、DPCM系

15、统系统1、DPCM系统的概念：系统的概念：v举例来说举例来说,设以设以1/Ts1/Ts的速率对信号的速率对信号S S（t t）抽）抽样样,在在时刻前可得到时刻前可得到，等一组样值等一组样值.以前面以前面N N个个样值作为基础对样值作为基础对的预测值是的预测值是snTt =sSTnTSsSTnTS2sSNTnTSSnTSSSNiiSiTnTSWnTS=1不同时刻样值的加权系数不同时刻样值的加权系数:根据相关性情况，可设根据相关性情况，可设为常量或变量为常量或变量iWiW2、实现预测的横向滤波器（、实现预测的横向滤波器（N阶预测器）阶预测器）在每个抽样时刻到来时，滤波器输出将在每个抽样时

16、刻到来时，滤波器输出将会给出下一个样值的预测值。会给出下一个样值的预测值。SnTS一般来说，在抽样时刻一般来说，在抽样时刻 t=nTs 时所得的预测时所得的预测值值与真正的样值与真正的样值并不相同。并不相同。SnTSSSNiiSiTnTSWnTS=1N阶预测器输出：阶预测器输出：差值脉冲编码就是对真正的样值差值脉冲编码就是对真正的样值与过与过去的样值为基础得到的估值去的样值为基础得到的估值之之间的差值进行量化和编码。间的差值进行量化和编码。SnTSSnTS3、DPCM系统模型框图系统模型框图量化器量化器预测器预测器预测器预测器下张图中：图中：x(n)为抽样信号的实际值为抽样信号的实际值

17、vd(n)=x(n)-x(n)图x(n)=x(n)+d(n)该系统的量化误差可以表示为：该系统的量化误差可以表示为：e(n)=x(n)-x(n) =d(n)+x(n)-x(n)+d(n) =d(n)-d(n)v上式表明：系统的传输误差上式表明：系统的传输误差就是差值（）的量化误差就是差值（）的量化误差4、DPCM系统的抗噪声性能分析系统的抗噪声性能分析系统信噪比定义为：系统信噪比定义为：v)()(22neEnxE=)()()()(2222neEndEndEnxE=qPSNRG 预测器增益预测器增益量化器的量化量化器的量化信噪比信噪比GP1预测器有预测器有增益增益加预测器后加预测器后反而不利反而

18、不利2x2d2eGP ： DPCM系统相对于系统相对于PCM系统而言的系统而言的信噪比增益。信噪比增益。量化器产生的信噪比量化器产生的信噪比qSNR即非预测的即非预测的PCM系统的量化信噪比系统的量化信噪比提高系统信噪比采取的措施提高系统信噪比采取的措施)()()()(2222neEndEndEnxEv)(2ndE)(2neE减小减小 x(n)精确精确)(2ndEd(n)d(n)=x(n)-x(n)最佳预测最佳预测)(2neE量化误差量化误差最佳量化最佳量化小结小结v一一.压缩编码的原因压缩编码的原因v二二.什么是语音压缩编码什么是语音压缩编码v三三.语音编码分类语音编码分类vADPCM系统系

19、统vDPCMv一一.差值编码思想差值编码思想v二二.差值编码系统模型图差值编码系统模型图v三三.DPCM系统系统v1.概念概念2.预测器模型图预测器模型图3.DPCM系统模型系统模型4.DPCM系统的抗噪声性能分析系统的抗噪声性能分析自适应差值脉冲编码调制（自适应差值脉冲编码调制（ADPCM）1、实质：、实质：DPCM+自适应量化和自适应预测自适应量化和自适应预测固定预测固定预测固定量化固定量化2、定义、定义能够实现自适应预测功能，或者能够实现自适应预测功能，或者自适应量化功能或者同时实现两自适应量化功能或者同时实现两种自适应功能的种自适应功能的DPCM系统称为系统称为ADPCM系统。系统。

20、3.设计的目的设计的目的vADPCM充分利用了语音波形的统计特充分利用了语音波形的统计特征和人耳听觉特性征和人耳听觉特性,其设计思路主要瞄准其设计思路主要瞄准了两个目标了两个目标:a: 尽可能去掉语音信号中的冗余信号尽可能去掉语音信号中的冗余信号b:以有效的方式将可用比特分配给语音信以有效的方式将可用比特分配给语音信号号对消除冗余后的信号对消除冗余后的信号,从自适应角度从自适应角度进行最佳编码进行最佳编码1.1预测的自适应预测的自适应(1).极点预测器极点预测器1.预测器的结构预测器的结构(用重建信号用重建信号x(n)进行的预测）进行的预测）+量化器量化器预测器预测器+X(n)X(n)d(n)

21、d(n)编码编码X(n)P（Z）X（n）a:极点预测器的方框图极点预测器的方框图b:预测器传递函数预测器传递函数P(z) )()()(ZXZXZP=N阶预测器公式：阶预测器公式：X(n)=)(1jnxaNjj=进行进行Z变换后得：变换后得：jNjjzzxazx=)()(1则预测器的传递函数为：则预测器的传递函数为：)()()(ZXZXZP=jNjjza=1为预测系数为预测系数jac:重建滤波器重建滤波器+预测器预测器x(n)x(n)X(n)d(n)H(Z)重建滤波器重建滤波器=)1 ( 2 12Px2d2x=E x(n)+Ex(n-1)-2Ex(n)x(n-1)22=2E x(n)-2Ex(n

22、)x(n-1)2分析：分析：)()(22ndEnxEPG=)1 ( 211p（）一阶（）一阶最佳最佳线性预测线性预测求最佳预测系数求最佳预测系数h1N=1时；时；X(n)=h1x(n-1)则差值信号为：则差值信号为：d(n)=x(n)-h1x(n-1)+Ed (n)=2d2=Ex(n)- h1x(n-1) 2=E x(n)+h1Ex(n-1)-2h1Ex(n)x(n-1)22=2x2d21xh2-2112xPh=)21 (1112Phhx2求使求使最小的最小的h1的值的值2012=hdmin2)(d221)1 (xp=令令得最佳预测系数得最佳预测系数h1opt=p1当当N=1时的最大预测增益为

23、：时的最大预测增益为：)1 (121maxpGp=b.二阶线性预测（二阶线性预测（N=2）d(n)=x(n)-h1x(n-1)-h2x(n-2)2d=Ed (n)2=Ex(n)- h1x(n-1)-h2(n-2) 2令令012=hd022=hd得最佳得最佳h1,h2212111)1 (ppphopt=2121221 ppphopt=2212222121min21)(1 )(xdpppp=大于或者大于或者等于零等于零故二阶预测器总是优于一阶预测器故二阶预测器总是优于一阶预测器C：N阶最佳线性预测阶最佳线性预测2d求偏微分，并令为零求偏微分，并令为零NiadEi,.2,102=)()(21jksa

24、ksENii=Ed (k)2所以得到一组线性方程所以得到一组线性方程12(1)(0 )(1).(1)(2 )(1)(0 ).(2 ).(1)(2 ) .(0 )()o p to p tN o p tRaRRRNRaRRRNRNRNRaRN=1optssssRr =12(1)(0)(1).(1)(2)(1)(0).(2).,.(1) (2) .(0)()optoptssssoptaRRRR NaRRRR NrRaR NR NRR N= = 其中.Nopta差值信号在差值信号在最小最小 )()()(21min2=NiioptikSakSEkdE最佳预测增益最佳预测增益=NiioptPoptkSEi

25、RakdEkSEG1222)()(11)()(2.自适应预测自适应预测l1)前向自适应预测算法前向自适应预测算法根据短时间的相关特性根据短时间的相关特性R(i),求短时的最佳预求短时的最佳预测系数测系数特点特点:运算量大，延迟时间大，不能用于高运算量大，延迟时间大，不能用于高速系统。速系统。采用不断修正预测系数采用不断修正预测系数hi(n)的方法来减小瞬时平方的方法来减小瞬时平方差差Ed(n),使使hi(n)逐步的接近逐步的接近hiopt(n).2）后向序贯自适应预测算法）后向序贯自适应预测算法2)()()()(1inxnhnxndNii=)()()()() 1(inxndnnhnhiii=梯度系数，它决定了预测系数自适应速率梯度系数，它决定了预测系数自适应速率)(sgn)(sgn)()() 1(inxndnnhnhiiii=)(sgn)(sgn)()() 1(indndnnhnhiiii=极点预测器极点预测器零点预测器零点预测器衰减因子衰减因子(抗误码因子抗误码因子)1.2量化的自适应量化的自适应1、最佳量化、最佳量化分层电平为相邻量化电平的中点分层电平为相邻量化电平的中点量化电平是该量化间隔内经常出现的瞬量化电平是该量化间隔内经常出现的瞬时电平值时电平值固定量化器固定量化器+可可变增益放大器变增益放大器2、自适应

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

语音信号处理课件-语音编码

文档简介

温馨提示

最新文档

评论

语音信号处理课件-语音编码

文档简介

温馨提示

最新文档

评论

相关文档