第10章 语音编码 波形编码_第1页
第10章 语音编码 波形编码_第2页
第10章 语音编码 波形编码_第3页
第10章 语音编码 波形编码_第4页
第10章 语音编码 波形编码_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第,10,章,语音编码,-,波形编码,2,10.1,概述,对语音信号直接采用模,/,数转换技术进行编码时,传输或,存储语音的数据量太大,为了降低传输或存储的费用,就,必须对其进行压缩。各种编码技术的目的就是为了减少传,输码率或存储量,以提高传输或存储的效率。经过这样的,降低数据量的编码后,同样的信道容量就能传输更多路的,信号,并且需要的存储器容量也会减小,因而这类编码又,称为压缩编码。,3,10.1,概述,实际上,压缩编码需要在保持可懂度和音质、降低,数码率、降低编码过程的计算代价这,3,方面进行折中。,近,10,年来固定电话和移动通信高速发展,信道使用效,率成为一项关键因素,这促使语音压

2、缩编码技术不断发,展。,4,10.1,概述,?,起于,60,年前,窄带电话线语音信号传送系统的发展需要。,早期的声码器是基于对语音信号基音周期和频谱的分析,通,过周期脉冲或随机噪声激励,10,个带通滤波器(表示声道模,型)合成语音信号。,?,20,世纪,50,年代后期,着重于线性语音源系统的生成模型。,源系统是一个自回归时序模型,声道是全极点滤波器,参数,通过,LPC,得到。,?,20,世纪,6,、,70,年代,由于,VLSI,技术的出现和数字信号处理,理论的发展。语音的分析合成采用了短时傅里叶变换,(,SIFT,)、变换编码(,TC,)和子带编码(,SBC,),并且基,于线性预测的语音编码技

3、术得到了进一步的发展。,5,10.1,概述,?,针对提出的鲁棒性、低码率和高质量的要求。出现了新的编,码技术:余弦分析合成技术、多带激励声码器、,LPC,中的多,脉冲和矢量激励和矢量量化。,?,当前的研究集中在,4kbit/s,码率以下的高音质、低延迟的声,码器,提高在噪声信道中低码率编码器的性能,并能传输多,种信号,包括音频信号。,6,10.1,概述,信源,信宿(用户),信道编码,信源解码,信源编码,解调,传输信道,调制,信道解码,噪声,图,10-1,数字传输系统,7,10.1,概述,?,信源编码:主要是解决有效性问题。通过对信源的压缩、,扰乱、加密等处理力求用最少的数码率传递最大的信息,量

4、。也就是用最少的数码表示信源所发的信号,减少容,纳给定信息集合或数据采样集合的信号空间。,?,信道编码:主要是解决可靠性问题。即尽量使处理过的,信号在传输的过程中不出错或者少出错,即使出错也要,能自动检错和尽量纠错。,8,10.1,概述,低数码率的数字语音具有以下优点:,可以在窄带信道上传输,有效地适应了信号电缆带宽窄的特点。,更能克服信道失真,这意味着可以采用更简单的调制解码器。,多数信道中,当误码率给定时,低数码率比高数码率所需要的发射功率更小。,给定容量的复接电路或复按网络允许通过更多的信道。,为了存贮一定的语音所需要的存贮器容量将更少。,当和差错纠正与扩频技术结合使用时,将具有更大的抗

5、噪声与抗干扰能力。,9,10.1,概述,语音压缩编码的应用:,(,1,)语音信号的数字传输。,-,数字通信系统、移动无线电、蜂窝电话和保密话音系统,(,2,)语音信号的数字存储。,-,数字录音电话、语音信箱、电子留言簿、发声字典、多媒体查,询系统,10,10.1,概述,语音编码大致可分为三类:,-,波形编码,-,参数编码,-,混合编码,11,10.1,概述,波形编码,:将时域模拟话音的波形信号经过采样、量,化和编码形成数字语音信号,恢复的语音信号基本上,与输入语音信号波形相同。,?,编码速率较高:,9.6k64kbit/s,?,包括:,PCM,、,ADPCM,、,DM,、,ADM,、,SBC,

6、等,?,适应能力强、语音质量好;编码速率高,12,10.1,概述,参数编码,:基于人类语音的产生机理建立数学模型,根,据输入语音得出模型参数并传输,在收端恢复,重建,的语音信号与原始信号样本之间没有一一对应关系。,?,编码速率较低:,2.4k4.8kbit/s,?,包括各种线性预测编码(,LPC,)方法和余弦声码器等,?,编码速率低;语音质量差、自然度低、对环境噪声敏感,13,10.1,概述,混合编码,:波形编码,+,参数编码(,LPAS,),?,编码速率较低:,16k2.4kbit/s,?,包括多脉冲激励线性预测编码,(MPLPC),、规则脉冲激励线,性编码,(RPE-LPC),、码本激励线

7、性预测编码,(CELP),14,10.2,语音信号的压缩编码原理,10.2.1,语音压缩的基本原理,一、语音压缩的基本原理,对语音信号进行压缩编码的基本依据是语音信号的冗,余度和人的听觉感知机理。,输入语音,编码器,传输信道,存储介质,解码器,输出语音,图,10-2,数字语音通信框图,15,10.2,语音信号的压缩编码原理,对语音进行压缩编码的基本依据有两个:,-,语音信号中存在大量的冗余,-,人耳的听觉特性,16,10.2,语音信号的压缩编码原理,1,、,语音信号中存在大量的冗余,?,语音信号样本间的相关性很强,即其短时谱不平坦。,?,浊音语音段具有准周期性,?,声道的形状及其变化比较缓慢。

8、,?,传输码值的概率分布是非均匀的。,17,10.2,语音信号的压缩编码原理,2,、人的听觉感知机理。主要表现在:,?,人类听觉系统(,HAS,)具有掩蔽效应:单音的声级越高,,对其周围频率声音的掩蔽作用越强。利用这一性质可抑制与,信号同时存在的量化噪声。,?,人耳对不同频段声音的敏感程度不同:强的低频音能妨碍同,时存在的高频音。,?,人耳对语音信号的相位变化不敏感:人耳能做短时的频率分,析,对信号的周期性即音调很敏感但对信号相位感知却不敏,感。人耳听不到或感知很不灵敏的声音分量都可视为冗余信,号。,18,10.2,语音信号的压缩编码原理,总之,利用冗余度或者语音听觉上的制约,可以压缩表示,语

9、音信号的必要信息,从而可以降低传输速率或存储容量。,19,10.2,语音信号的压缩编码原理,10.2.2,语音通信中的语音质量,语音压缩编码考虑的因素有:,输入语音信号的特点。,传输比特率的限制。,对输出重构语音的音质要求。,20,10.2,语音信号的压缩编码原理,在语音通信中,语音质量分为以下四等:,广播质量,:,宽带,带宽为,0-7200Hz,,语音质量高,感觉不出噪声,存在。,长途电话质量,:,指通过电话网传输后得到的语音质量,带宽为,200-3200Hz,,信噪比大于,30dB,,谐波失真小于,2%-3%,。,通信质量,:,可以听懂,但和长途电话质量相比,明显有较大失真。,合成质量,:

10、,80%-90%,可懂度,音质较差,听起来像机器说话,,失去了讲话者的个人特征。,21,10.2,语音信号的压缩编码原理,10.2.3,两种压缩编码方式,波形编码的语音质量好,因为这种方法保留了信号原始样本,的细节变化,从而保留了信号的各种过渡特征,所以解码语音,质量一般较高。但这种方法降低比特率困难。,参数编码解码后合成的语音信号与原始语音信号之间没有一,一对应的关系,因而音质的好坏要由主观进行评价,而缺乏客,观标准。语音的自然度、可懂度差,较少地保留讲话人的特,征,受噪声和误码的影响大,算法复杂。,22,10.3,脉冲编码调制,(PCM),及其自适应,10.3.1,均匀,PCM,?,不论信

11、号幅度的大小,都采用同等的量化阶距进行量化,,即采用均匀量化。,?,完全没有利用语音的性质,信号没有得到压缩。,?,语音是非平稳随机信号,电话语音电平变化超过,40dB,。对,于小信号电平输入,信噪比应保证约,20-30dB,,即最大信噪,比应需,60-70dB,。由第二章知识,信号对量化噪声的信噪比,可近似写为:,其中,,B,为量化器字长。由上式可看出,信噪比取决于量化字长。当要求,60dB,的,SNR,时,,B,至少应取,11bit,。此时,对于带宽为,4kHz,的电话语音信,号,若采样率为,8kHz,,则,PCM,要求的速率为,88Kbit/s,。,(10-2),23,10.3,脉冲编码

12、调制,(PCM),及其自适应,2.,非均匀,PCM,均匀量化的缺点是不论语音信号的幅度大小而量化阶距保持不,变。这样在信号动态范围较大而方差较小时,其信噪比将下降。,根据观测到的语音信号概率密度可知,语音信号大量集中在低,幅度上。这样,就可以设想利用非均匀量化来弥补均匀量化的,缺点。,基本思想,:对大幅度的样本使用大的,,对小幅度的样本使用小,的,,在接收端按此还原。,?,?,(a),均匀量化特性,(b),非均匀量化特性,24,10.3,脉冲编码调制,(PCM),及其自适应,现在非均匀,PCM,一般采用两种压缩扩张非均匀量化方法:,A,律和,律压缩,扩张技术。其中,,律,PCM,主要在北美和日

13、本使用,,A,律,PCM,用于其他国家和,地区。,设,为语音波形的取样值,则,律压缩的定义为,?,?,?,x,n,?,式中,,是,的最大幅度;,是表示压缩程度的参量,,=0,表示没有压缩,,越大压缩率越高,故称之为,律压缩。通常,在,100500,之间取值。取,=255,,可以对电话质量语音进行编码,其音,质与,12,位均匀量化的音质相当。,max,X,?,?,x,n,?,?,?,?,?,?,?,25,10.3,脉冲编码调制,(PCM),及其自适应,我国则采用,A,律压缩,其压缩公式为,律压缩输入输出特性图如下图:,?,图,10-5,律压扩特性,?,26,10.3,脉冲编码调制,(PCM),及

14、其自适应,3.,自适应,PCM(APCM),基本原理:使量化器的特性自适应于输入信号的幅值变化,也就,是量化间隔,匹配于输入信号的方差值,或使量化器的增益,G,随着幅值而变化,从而使量化前信号的能量为恒定值。,?,图,10-6,两种自适应量化的框图,匹配自适应,?,G,匹配自适应,27,10.3,脉冲编码调制,(PCM),及其自适应,如果按自适应参数,或,的来源划分,自适应量化又分为前馈自适,应和反馈自适应。,?,前馈自适应是指,或,是通过对输入信号估计而得到,?,反馈自适应是指由估计量化器的输入,或编码器的输出,得到,?,?,n,?,?,?,G,n,?,?,G,n,?,?,n,?,?,?,?

15、,x,n,?,?,c,n,图,10-7,匹配的前馈和反馈自适应系统框图,?,28,10.3,脉冲编码调制,(PCM),及其自适应,?,前馈自适应是计算信号有效值并决定最合适的量化间隔,用这个量化间隔控,制量化器,,并将量化间隔信息发送给接收端;,?,反馈自适应是由编码器输出,来决定量化间隔,,而在接收端由,量化传输来的幅度信息自动生成量化间隔。,?,显然,反馈与前馈相比的优点是不需要将量化间隔传送到信道中去,但对误差,的灵敏度要求较高。通常,采用了自适应技术之后可得到约,46dB,的编码增益。,Q,g,?,?,c,n,?,?,n,?,不论前馈自适应还是反馈自适应,其参数,或,均由下式产生:,(

16、7-13),即,正比于方差,,而,反比于,。同时,正比于信号的短,时能量,即,或,(7-14),?,?,n,?,?,?,G,n,?,?,?,?,0,n,n,?,?,?,?,?,?,?,?,?,0,/,G,n,G,n,?,?,?,?,n,?,?,?,n,?,?,?,G,n,?,?,n,?,?,?,n,?,?,?,?,?,?,?,2,2,m,n,x,m,h,n,m,?,?,?,?,?,?,?,?,?,?,?,?,2,2,m,n,c,m,h,n,m,?,?,?,?,?,?,29,10.4,预测编码及其自适应,APC,10.4.1,预测编码及自适应预测编码,(APC),原理,基本原理:因为预测误差,的

17、动态范围和平均能量均比输入信号,小,对,进行量化和编码可以减少量化比特数。在接收端,只要,使用与发送端相同的预测器就可恢复原信号,。基于这种原理的,编码方式称为预测编码,(PC),;当预测系数自适应随语音信号变化时,,又称为自适应预测编码,(APC),。,?,?,e,n,?,?,x,n,?,?,e,n,?,?,x,n,图,10-8,自适应预测编码,APC,系统框图,30,10.4,预测编码及其自适应,APC,下面说明预测编码能改善信噪比的原因。根据信号量化噪声比的定义,其中,,、,和,分别为信号、预测误差和量化噪声的平均能量,。,式中,,是由量化器决定的信噪比,而,反映了线性预测带来的增益,称

18、为预测增益。由于引入了线性预测,,SNR,将得到改善。,?,?,2,E,s,n,?,?,?,?,?,?,2,E,e,n,?,?,?,?,?,?,2,E,q,n,?,?,?,?,?,?,?,?,2,2,/,E,e,n,E,q,n,?,?,?,?,?,?,?,?,?,?,?,?,2,2,/,P,G,E,s,n,E,e,n,?,?,?,?,?,?,?,?,?,31,10.4,预测编码及其自适应,APC,自适应预测编码中包含了两种预测:短时预测和长时预测。,?,短时预测是利用比较相邻的样本值进行预测。,?,长时预测是根据浊音信号具有准周期性,相邻周期的样本之间,具有很大的相关性,在进行短时预测之后,预

19、测误差序列仍保持,这种准周期性,可以通过再次预测的方法来压缩比特率,也就是,根据前面预测误差中的脉冲消除基音的周期性。,32,10.5,自适应差分脉冲编码调制,(ADPCM),及自适应增量调制,10.5.1,自适应差分脉冲编码调制,(ADPCM),DPCM,基本原理:由于在相邻的语音样本之间存在着明显的相关,性,因此,对相邻样本间的差信号进行编码,便可获得信息量的,压缩,因为差分信号比原语音信号的动态范围和平均能量都小。,而且,仅对两者之差进行编码和传送,这样就大大降低了信道负,载。,33,10.5,自适应差分脉冲编码调制,(ADPCM),及自适应增量调制,10.5.1,自适应差分脉冲编码调制

20、,(ADPCM),DPCM,实际上是最简单的一阶线性预测,即,当,=1,时,被量化的编码是,?,?,1,1,1,A,z,a,z,?,?,?,1,a,?,?,?,?,?,?,1,d,n,x,n,x,n,?,?,?,图,10-13 DPCM,系统框图,34,10.5,自适应差分脉冲编码调制,(ADPCM),及自适应增量调制,?,DPCM,中的预测器是固定预测器,其预测系数是根据长时统计参数,求出的,尽管总的预测增益大于,1,,但同语音短时段不匹配,使得一,些段的预测增益比较小,甚至小于,1,。,?,是固定的,它不可能对所有讲话者和语音内容都是最佳的。,?,比较好的方法是采用高阶自适应预测。采用自适应量化及高阶自适,应预测的,DPCM,称为自适应差分脉冲编码调制,(ADPCM),。,实践表明,,DPCM,可获得约,10dB,的信噪比增益,而,ADPCM,可,获得约,14dB,的增益。,ADPCM,通常使用的是后向自适

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论