




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章语言信号压缩编码3.1语言信号压缩编码的基本概念3.2自适应差值脉冲编码调制3.3参量编码3.4混合编码3.5低速率语言压缩编码的应用一.压缩编码原因语音信号的压缩编码是研究如何降低语音信号编码速率的问题。以语音信号为例,模拟形式下带宽一般不到4KHz,经过调制后,所需传输带宽不会超过8KHz。
但是以8KHz抽样,并且每个样值用8位二进制代码表示时,即采用A率13折线PCM数字语音信号时,信息速率为64Kbit/s。利用二进制理想基带传输系统传输一路这样的数字语音信号。所占系统的最小频带宽度为32KHz。频带利用率=传输速率/带宽二.什么是语音压缩编码?
把数码率低于64Kbit/s的语音编码方法称为语音压缩编码技术三.语音编码分类根据编码器的实现机理,分成三大类波形编码参数编码混合编码了解语音信号数字化的目的和要求;理解语音信号的波形编码、参数编码、混合编码的定义;掌握对语音编码信号性能的评价方法。理解标量量化和矢量量化的原理及异同点。了解语音信号的参数模型;掌握线性预测的概念、线性预测声码器的工作原理。掌握参数编码中合成分析算法的基本原理和优缺点;了解常用的语音信号的混合编码方法。要求语音编码方法的分类:波形编码参数编码混合编码一、语音编码的方法1.语音信号的波形编码原理:从语音信号波形的特点出发,在时间轴上对模拟语音按一定的速率抽样,对波形的采样值,或其预测值,或其预测的误差值进行量化并编码,编码后的信号为二进制数字序列。解码是其反过程,将收到的数字序列经过解码和滤波恢复成模拟信号。一、语音编码的方法特点:以重构语音波形为目的,力图使重建语音波形保持原语音信号的波形形状。适应能力强、语音质量好。编码速率高。在16至64kbit/s的速率上获得较高的编码质量,当速率进一步下降时,其性能会下降较快。一、语音编码的方法常见的波形编码方式:脉冲编码调制(PCM)、增量调制(△M)自适应增量调制(ADM)、自适应预测编码(APC)、自适应差分编码(ADPCM)子带编码(SBC)
一、语音编码的方法2.语音音信信号号的的参参量量编编码码原理理::从语语音音信信号号的的产产生生机机理理出出发发,,构构造造语语音音信信号号的的模模型型,,提提取取描描述述语语音音信信号号的的特特征征参参数数,,对对模模型型参参数数或或其其预预测测值值进进行行编编码码。。在在收收端端,,根根据据特特征征参参数数通通过过模模型型重重构构语语音音信信号号。。一、、语语音音编编码码的的方方法法特点点::编码码速速率率低低,,可压压缩缩到到2kbit/s-800bit/s;合成成的的话话音音质质量量差差,,只只能能达达到到中中等等,,自自然然度度较较低低;;不以以重重构构语语音音波波形形为为目目的的,,在在解解码码端端重重构构一一个个新新的的有有相相似似声声音音但但波波形形不不尽尽相相同同的的语语音音信信号号。。常见见的的方方式式::线性性预预测测编编码码((LPC),,及及其其各各种种改改进进型型,,如如MBE等。。一、、语语音音编编码码的的方方法法3.语音音信信号号的的混混合合编编码码原理理::混合合编编码码将将波波形形编编码码和和参参量量编编码码组组合合起起来来,,克克服服了了原原有有波波形形编编码码和和参参量量编编码码的的弱弱点点,,结结合合各各自自的的长长处处,,力力图图保保持持波波形形编编码码的的高高质质量量和和参参量量编编码码的的低低速速率率,,目目前前在在1.2-16Kbit/s速率率上上能能够够得得到到高高质质量量的的合合成成语语音音。。特点点::低速速率率、、高高质质量量一、、语语音音编编码码的的方方法法常见见混混合合编编码码方方式式::多脉脉冲冲激激励励线线性性预预测测编编码码((MPLPC)规则则脉脉冲冲激激励励线线性性预预测测编编码码((RPELPC)码本本激激励励线线性性预预测测编编码码((CELP)矢量量和和激激励励线线性性预预测测编编码码((VSELP)多带带激激励励((MBE)及及改改进进型型IMBE(ImprovedMBE)和和AMBE(AdvancedMBE)混合合激激励励线线性性预预测测((MELP)一、、语语音音编编码码的的方方法法说明明上述述语语音音编编码码器器的的分分类类方方法法只只是是一一种种较较通通用用的的方方法法,,并并非非十十分分严严格格。。除了了传传统统的的波波形形编编码码器器和和参参数数编编码码器器以以外外,,许许多多新新型型的的语语音音编编码码技技术术都都比比较较复复杂杂,,很很难难严严格格分分类类。。基于于分分析析合合成成技技术术的的线线性性预预测测编编码码器器则则既既可可以以视视为为参参量量编编码码,,也也可可以以视视为为混混合合编编码码。。一、、语语音音编编码码的的方方法法语音音编编码码性性能能评评价价的的参参量量::1、语语音音编编码码质质量量2、编编码码速速率率3、编编解解码码的的复复杂杂度度4、编编解解码码延延时时语音音编编码码的的基基本本目目标标::在给给定定编编码码速速率率的的条条件件下下,,用用尽尽量量小小的的编编解解码码延延时时和和复复杂杂度度,,得得到到尽尽量量好好的的重重建建语语音音质质量量。二、语音音编码性性能的评评价1、语音编编码质量量语音编码码质量是是衡量语语音编码码算法优优劣的关关键性能能之一,,在数字字通信中中常把语语音质量量分为四四级:广播级质质量长途电话话质量通信质量量合成语音音质量二、语音音编码性性能的评评价语音编码码质量用用质量评评估指标标衡量,,分为以以客观评评定方法法和主观观评定方方法两大大类。主观评定定方法是以人类类听话时时对语音音质量的的感觉来来评定。。国际上上常用的的主观评评定标准准主要有有:平均意见见得分MOS(MeanOpinionScore)判断韵字字测试DRT(DiagnosticRhymeTest)判断满意意度测量量DAM(DiagnosticAcceptabilityMeasure)可懂度指指数AI(ArticulationIndex)二、语音音编码性性能的评评价MOS评定方法法由于语音音质量高高低的直直接感受受者是听听众的主主观感觉觉,因此此目前广广泛采用用的评定定方法是是MOS。获取MOS的方法是是,由数数十名试试听者在在不同的的信道环环境中试试听并给给予评分分,然后后求出统统计平均均分。分数等级级采用5级分制::5分为优,,4分为良,,3分为中,,2分为差,,1分为不可可接受。。4分以及4分以上为为高质量量语音编编码,达达到长途途电话质质量,3.5分左右为为通信级级质量,,3分以及3分以下为为合成语语音质量量。二、语音音编码性性能的评评价对应于主主观评定定等级,,还有一一个收听听注意力力等级((ListeningEffortScale)。表2.1给出了主主观评定定等级制制的质量量等级、、分数和和相应的的收听注注意力等等级。二、语音音编码性性能的评评价客观评价价的方法法:时域:信信噪比、、加权信信噪比、、平均分分段信噪噪比等频域:谱谱失真测测度、LPC倒谱距离离测度等等说明:以上方法法都建立立在度量量均方误误差的基基础上,,其特点点是计算算简单,,但不能能完全反反映人对对语音质质量的感感觉,对对于速率率为16kb/s以下的中中低速率率语音编编码尤为为突出。。主要适适用于速速率较高高的波形形编码的的质量测测量。二、语音音编码性性能的评评价2.编码速率率语言编码码后的速速率用““比特/秒”度量量或用““比特/样点”度度量。后后者表示示平均每每个样点点所需的的编码比比特数。。通常编码码速率高高,则编编码后的的语音质质量高,,但所需需的传输输带宽就就宽。二、语音音编码性性能的评评价好的语音音编码方方法,是是在保持持语音质质量的前前提下降降低速率率。3.编解码的的复杂程程度编解码的复复杂度与与算法有有关。通常算法法复杂,,则话音音质量好好,编码码速率低低,但实实现复杂杂,且体体积大、、功耗高高、成本本高,甚甚至编解解码延时时大。二、语音音编码性性能的评评价二、语音音编码性性能的评评价4.编解码延延时编解码延延时也与与算法有有关。通常算法法复杂,,则编解解码延时时大。也也有专为为减小延延时的短短延时算算法。不不过,质质量好、、延时短短的算法法,相应应的编码码速率也也高。5.对语音编编码的要要求在满足用用户对语语音质量量要求的的前提下下,编码码速率尽尽可能能低。在强噪声声环境中中,算法法应有较较好的抗抗误码性性 能,,也就是是说,当当误码率率较低时时(例如如为10-2) 仍能能保持良良好的话话音质量量。编、解码码延迟应应控制在在几十毫毫秒之内内,越短短越好好。复杂性要要适度,,以便于于使用大大规模集集成器件件。二、语音音编码性性能的评评价二、语音音编码性性能的评评价6.几种语音音编码的的质量比比较LD-CELP:低时延延-码激励线线性预测测MP-MLQ:多脉冲冲最大似似然量化化ACELP:代数码码激励线线性预测测CS-ACELP:共轭结结构-代数码激激励线性性预测三、语音音编码的的标准ETSI:欧洲电电信标准准协会TIA:(北美美)电信信工业协协会RCR:(日本本)无线线通信系系统研究究发展中中心DVSI:数字声声音系统统公司三、语音音编码的的标准保密电话话语音编编码标准准三、语音音编码的的标准窄带保密密电话应应用于带带宽受限限信道,,目前只只有美国国公布了了所用保保密电话话的标准准。FS-1015标准:2.4kb/s的LPC声码器,,DRT为90%FS-1016标准:4.8kb/s的CELP声码器,,比FS-1015具 有好好得多的的自然度度及环境境噪声能能力。混合激励励线性预预测(MELP)标准::编码速速率为2.4kb/s,语音质质量优于于FS-1016。各种语音音编码标标准的相相对效果果三、语音音编码的的标准第三章语语言言信号压压缩编码码3.1语语言信信号压缩缩编码的的基本概概念3.2自自适适应差值值脉冲编编码调制制3.3参参量量编码3.4混混合合编码3.5低低速速率语言言压缩编编码的应应用自适应差差值脉冲冲编码调调制原理理(ADPCM)3.1.1差值脉冲冲编码((DPCM)1.编码思想想提高通信信质量必须减小量化化误差减小量化化级当抽样值值范围确确定时增加编码码位数N增加编码码位数可可获得大大的信噪噪比在编码位位数固定定时,减减小抽样样值的变变化范围围,也同同样可以以提高信信噪比即:若缩缩小抽样样值(被被编码信信号)的的变化范范围,就就可以在在保证信信噪比不不变的情情况下,,减小编编码的位位数。这这就是差差值编码码的中心心思想二、差值值编码模模型图在原来的的抽样值值中减去去某一个个值,然然后对两两者之差差进行编编码。在在接收端端将解码码值再加加上发送送端所减减去的值值便可恢恢复出原原始值。。x(n)+d(n)c(n)d(n)x(n)-x(n)x(n)差值编码码模型译码+编码+图中:x(n)是原始样样值(n时刻的抽抽样值))x(n)为减去量量d(n)=x(n)-x(n)为差值可以看出出:(1)、d(n)越小,在在相同的的编码位位数时信信噪比越越大(2)、收发发端必须须有相同同的减去去量x(n)根据前些些时刻的的样值来来预测现现时刻的的样值,,只要传传递预测测值和实实际值之之差,而而不需要要每个样样值的编编码都传传。这种种方法就就称为DPCM编码。三、DPCM系统1、DPCM系统的概概念:举例来说说,设以以1/Ts的速率对对信号S(t)抽样,在时时刻前可可得到,,,等一组样样值.以以前面N个样值作作为基础础对的的预预测值是是不同时刻刻样值的的加权系系数:根据相关关性情况况,可设设为为常量量或变量量2、实现预预测的横横向滤波波器(N阶预测器器)在每个抽抽样时刻刻到来时时,滤波波器输出出将会给给出下一一个样值值的预测测值。一般来说说,在抽抽样时刻刻t=nTs时所得的的预测值值与与真正正的样值值并并不相同同。N阶预测器器输出::差值脉冲冲编码就就是对真真正的样样值与与过去去的样值值为基础础得到的的估值之间的差差值进行行量化和和编码。。3、DPCM系统模型型框图量化器预测器预测器下张22图中:x(n)为抽样信信号的实实际值d(n)=x(n)-x(n)图x(n)=x(n)+d(n)该系统的的量化误误差可以以表示为为:e(n)=x(n)-x(n)=[d(n)+x(n)]-[x(n)+d(n)]=d(n)-d(n)上式表明明:DPPCM系系统的传传输误差差就是差差值d((n)的的量化误误差.4、DPCM系统的抗抗噪声性性能分析析系统信噪噪比定义义为:SNR====预测器增增益量化器的的量化信信噪比GP<1GP>1预测器有有增益加预测器器后反而而不利GP:DPCM系统相对对于PCM系统而言言的信噪噪比增益益。量化器产产生的信信噪比即非预测测的PCM系统的量量化信噪噪比提高系统统信噪比比采取的的措施SNR==减小x(n)精确d(n)d(n)=x(n)-x(n)最佳预测测量化误差差最佳量化化小结一.压缩编码码的原因因二.什么是语语音压缩缩编码三.语音编码码分类3.1ADPCM系统3.3.1DPCM一.差值编码码思想二.差值编码码系统模模型图三.DPCM系统1.概念2.预测器模模型图3.DPCM系统模型型4.DPCM系统的抗抗噪声性性能分析析自适应差差值脉冲冲编码调调制(ADPCM)1、实质::DPCM+自适应量量化和自自适应预预测固定预测测固固定量化化2、定义能够实现现自适应应预测功功能,或或者自适适应量化化功能或或者同时时实现两两种自适适应功能能的DPCM系统称称为ADPCM系统。。3.设计的的目的的ADPCM充分利利用了了语音音波形形的统统计特特征和和人耳耳听觉觉特性性,其设计计思路路主要要瞄准准了两两个目目标:a:尽可能能去掉掉语音音信号号中的的冗余余信号号b:以有效效的方方式将将可用用比特特分配配给语语音信信号对消除除冗余余后的的信号号,从自适适应角角度进进行最最佳编编码1.1预测的的自适适应(1).极点预预测器器1.预测器器的结结构(用重建建信号号x(n)进行的的预测测)+量化器器预测器器+X(n)X(n)d(n)d(n)编码X(n)P(Z)X(n)a:极点预预测器器的DDPCCM方方框图图b:预测器器传递递函数数P(z)N阶预测测器公公式::X(n)=进行Z变换后后得::则预测测器的的传递递函数数为::为预测测系数数c:重建滤滤波器器+预测器器x(n)x(n)X(n)d(n)H(Z)重建滤滤波器器==E[x(n)]+E[x(n-1)]-2E[x(n)x(n-1)]22=2E[x(n)]-2E[x(n)x(n-1)]2分析::==(2))一阶阶最佳线性预预测求最佳佳预测测系数数h1N=1时;X(n)=h1x(n-1)则差值信号为为:d(n)=x(n)-h1x(n-1)+E[d(n)]=2=E{[x(n)-h1x(n-1)]}2=E[x(n)]+h1E[x(n-1)]-2h1E[x(n)x(n-1)]22=2-=2求使最小的h1的值2令得最佳预测系系数h1opt=p1当N=1时的最大预测测增益为:b.二阶线性预测测(N=2)d(n)=x(n)-h1x(n-1)-h2x(n-2)=E[d(n)]2=E{[x(n)-h1x(n-1)-h2(n-2)]}2令得最佳h1,h2大于或者等于于零故二阶预测器器总是优于一一阶预测器第三章语语言信信号压缩编码码3.1语言言信号压缩编编码的基本概概念3.2自自适应差值脉脉冲编码调制制3.3参量编码3.4混混合编码3.5低低速率语言压压缩编码的应应用波形编码的语语音质量较高高,实现简单单,但速率较较高占频带较较宽,因而将将影响通信系系统的容量。。寻求低速高质质的语音编码码方法一直是是数字通信领领域的一个重重要研究课题题。一个重要概念念:对反映语语音信号特征征的参量进行行编码与传输输而不是对信信号的时域波波形本身,即即所谓参量编编码。可大大大降低编码信信号的速率。。参量编码的基基础是语音信信号特征参数数的提取与语语音信号的恢恢复,这将涉涉及到语音产产生的物理模模型。一、语音信号号产生模型及及其特征参数数人的发音系统统由声带、声声道及次声门门系统构成。。声道从声带带的开口即声声门处开始,,直至嘴唇,,包括咽喉、、口、舌等。。声道的截面面积是可变化化的,它取决决于舌、唇等等器官的位置置。次声门系系统由肺、气气管等级联,,是产生语音音的能量来源源。简化的发发音系统如图图所示。浊音与清音浊音又称为有有声音:气流流通过声门时时,如果声带带振动并产生生一个准周期期的空气脉冲冲激励声道,,就得到浊音音。典型的浊浊音波形如图图所示,其中中(a)为声门处的的气流速度,,(b)为通过声道道后在唇口处处形成的声压压波形,浊音波形具有有明显准周期期性。声带振振动的频率称称为基音频率率fb,周期为基音音周期Tp,基音频率fb一般在70~300Hz的范围内,相相当于Tp为3~15ms。基音周期Tp是语音信号的的主要特征之之一。清音又称无声声音:声道在在某处发生收收缩,同时迫迫使空气以高高速冲过一收收缩部位而产产生湍流,就就得到清音。。发清音时声声带不振动,,此时是由湍湍流建立的宽宽带噪声源激激励着声道。。清音波形类类似于噪声,,如图(c)所示。声道的无损声声管模型声道包括口腔腔和鼻腔,相相当于一个非非均匀截面的的管道。当产产生声音的气气流顺着这个个管道传播时时,其频谱特特征就由管道道的选择性所所改变声道的谐振频频率称为共振振峰频率,简简称共振峰,,其中第一共共振峰就是上上面提到的基基音频率fb。声道截面面积积与声道长度度方向之间的的依赖关系称称为声道的面面积函数,声声道谐振特性性主要取决于于其面积函数数。实际声道可以以用一个级联联的无损声管管来表示。当当选用较多数数量的短管级级联,使得各各管的截面积积逼近声道的的面积函数时时,就可以期期望级联声管管的谐振频率率接近于声道道的谐振频率率。由N个等长无损声声管级联的系系统的传递函函数为:70一、语音信号号的基本特性性语音信号的基基本特性语音信号是非非稳态信号,,特征随时间间变化;但在在一个很短的的时间段内((约5ms--50ms)具有相对对稳定的特征征,称为准平平稳信号。语音信号通常常可以分为浊浊音、清音和和混合音。浊音在时域上上具有准周期期性,在频域域上,精细谱谱具有周期性性起伏的谐波波特性,谱包包络具有共振振峰结构。清音类似于随随机噪声,其其频带较宽。。浊音段的信号号能量要比清清音段的能量量高,这一特特点可用于判判断区分清、、浊音。语音产生模型型无损声管模型型等效为时变变线性数字滤滤波器,滤波波器极点对应应声道振峰频频率,增益参参数G和滤波器系数数都随时间而而变化,且依依赖于面积函函数。终端等效的概概念:当线性性系统的一组组参数被控制制之后其输出出就具有所希希望的语音特特征,而这组组参量是和实实际语音产生生过程有关的的。语音信号具有有慢变化特征征:其激励和和声道的特征征在10~20ms时间内保持不不变。语音产生模型型包括激励源源、声道和反反映嘴唇处声声辐射影响的的部分,如图图所示。语音特征参数数激励源分为浊浊音激励和清清音激励,用用浊音/清音开关进行行控制。在浊音段,激激励由冲激序序列发生器和和声门脉冲模模型G(z)级联构成,前前者产生周期期为Tp的单位冲激响响应,后者为为波形成形系系统。在清音段,激激励模型为一一个随机噪声声源及控制清清音激励强度度的增益参数数。声道模型为一一个时变线性性系统,辐射射模型为R(z)。语音特征参数数有:基音周周期、共振峰峰频率、语音音强度、清音音/浊音判决及时时变滤波器参参数等。特征参量的提提取提取方法是基基于数字信号号处理的理论论和技术。语音信号的准准平稳特性,,即在10~20ms的短时间内认认为语音的特特征参数不变变。这样,可可将实际语音音信号分成短短的时间段,,在各个段内内分别进行参参量提取。简单介绍一下下基音提取问问题:包括两两个方面:首首先进行浊音音/清音判决,然然后再确定浊浊音段语音波波形的周期Tp。浊音/清音判决或称称基音检测,,就是判决一一个时间段是是浊音段还是是清音段,这这就要利用浊浊音和清音在在时域和频域域上的差别。。浊音信号具有有准周期性,,频谱有峰值值,即基音及及其谐波。浊浊音信号有较较强的相关性性。清音信号号的波形近似似于噪声,没没有准周期性性,其频谱没没有明显的峰峰值,时域中中也不存在相相关性。基音提取的方方法很多,可可分为三类。。利用语音信号号的时域特征征,如自相关关函数法;利用语音信号号的频域特征征,主要是利利用浊音频谱谱的峰值特征征;综合利用语音音信号频域与与时域特征,,如线性预测测技术等。76一、语音信号号的基本特性性语音信号的基基本特性语音信号是非非稳态信号,,特征随时间间变化;但在在一个很短的的时间段内((约5ms--50ms)具有相对对稳定的特征征,称为准平平稳信号。语音信号通常常可以分为浊浊音、清音和和混合音。浊音在时域上上具有准周期期性,在频域域上,精细谱谱具有周期性性起伏的谐波波特性,谱包包络具有共振振峰结构。清音类似于随随机噪声,其其频带较宽。。浊音段的信号号能量要比清清音段的能量量高,这一特特点可用于判判断区分清、、浊音。77全极点数字滤波器时变数字滤波器---线性预测(LP)综合滤波器全极点数字滤波器的输出(LPC差分方程)
输出值s(n)可以用当前的输入值Gx(n)和过去输出样值的加权和来表示二、语音信号号的产生模型型78产生语音信号号s(n)的参量清/浊音类型;基音周期TP;代表声道的时时变滤波器的的系数{aj}及滤波器阶数数p;增益系数G;说明:根据语音信号号慢变化的特特点,可以每每隔10-30ms左右右预测一次上上述各参数的的值。即以每每10-30ms为一帧帧传送一次参参数样值的编编码,并不传传送话音样值值的编码,因因此比特速率率低得多。二、语音信号号的产生模型型79清浊音判决滤波器参数分析Ga1ap量化编码器U/V解码器Ga1apTPU/V激励信号产生合成滤波器信道基音周期提取TPs(n)预加重加窗s(n)LPC声码器的原理框图三、LPC声声码器的工作作原理801、全极点数字字滤波器参数数的确定阶数P模型阶数P的选择,应该该从频谱估计计精度、计算算量、存储储量等多方面面综合进行考考虑。P取很大值时,,可以获得很很好的信号谱谱估计,但增增加 的计算算量和存储量量代价太大。。语音谱估计计时主要关心心 的是声道道的谐振特性性,P值过大,估计计的谱中保留留许 多信号号谱细节,反反而使共振峰峰分析效果变变坏。阶数P的经验值在8--12之间。通常采用10个极点的滤波器,模型就就能正确描述述共振峰特性性和谱的基本本形状。三、LPC声声码器的工作作原理81滤波器系数{aj}三、LPC声声码器的工作作原理
设计的滤波器系数{aj}就是使得误差e(n)在某个预定的准则下最小,通常是根据最小均方误差准则求解{aj}在LPC模型中,信号s(n)的估计误差e(n)为:82三、LPC声声码器的工作作原理
在语音信号保持平稳的短时段内,令E对aj的偏导数为零,得到:即:其中:根据最小均方方误差准则通通过求解P个个方程来得到到P个未知数数aj83三、LPC声声码器的工作作原理2、基音检测测根据语音信号号的特性检测测基音周期的的方法有:利用时域特性性检测;利用频域特性性检测;同时利用时域域和频域特性性检测;这里只介绍利利用时域特性性检测84基本原理:利利用语音信号号的时域波形形的相似性,,通过比较原原始信号和它它的移位信号号的相似程度度来寻找基音音周期。如果果移位的距离离等于基音周周期,则两个个信号之间将将具有最大的的相似性。常用方法:短短时自相关函函数和短时平平均幅度差函函数AMDF。利用时域特性性检测三、LPC声声码器的工作作原理85
设sw(n)是一段加窗的语音信号,它的非零区域为:n=0N-1。
s(n)语音输入信号,w(n)是加权窗,一般取矩形窗或哈明窗。三、LPC声声码器的工作作原理基于求短时自自相关函数的的基音周期估估计86三、LPC声声码器的工作作原理sw(n)的自相关函函数称为语音音信号s(n)的短时自相相关函数,用用Rw(l)表示。如果s(n)是浊音,其其短时自相关关函数Rw(l)呈现出明显显的周期性,,其周期等于于s(n)的基音周期期。基音周期期就是第一个个峰值点到零零点之间的距距离。87三、LPC声声码器的工作作原理88设sw(n)是一段加窗的语音信号,它的非零区域为:n=0N-1。
sw(n)的短时平均幅度差函数rw(l)定义为:三、LPC声声码器的工作作原理基于短时平均均幅度差函数数(AMDF)的基音周周期估计89三、LPC声声码器的工作作原理如果s(n)是浊音,其其AMDF也也呈现出明显显的周期性,,其周期等于于s(n)的基音周期期。与Rw(l)不同的是在在基音周期的的各个整数倍倍点上,rw(l)具有谷值而而非峰值,要要通过寻找最最深谷值点的的位置来确定定基音周期。。90周期性语音信号短时自相关函数和AMDF示例三、LPC声声码器的工作作原理91两种基音周期期估计方法比比较AMDF方法法计算简单,,只需减法和和取幅度运算算,不需要乘乘法运算。AMDF的动动态范围较小小,易于算法法的定点实现现。AMDF在基基音周期点上上,它的谷点点锐度较之短短时自相关函函数的峰点锐锐度更尖锐,,估值精度更更高、更稳健健。但信号不不够平稳时,,这个特点不不明显。短时自自相关关函数数法的的特点点是对对相位位不敏敏感,,在信信号有有相位位失真真时能能较好好地检检测基基音。。三、LPC声码码器的的工作作原理理92窗长为了使使较好好地反反映sw(n)的周周期性性,窗窗长N至少应应大于于两两个基基音周周期,,一般般取长长度为为10-30ms。克服共共振峰峰特性性造成成的干干扰由于共共振峰峰的干干扰,,会出出现Rw(l)的第第一最最大峰峰值点点或rw(l)的第第一最最深谷谷值点点与基基音周周期不不一致致的情情况,,当基基音音周期期性和和共振振峰周周期性性混在在一起起时,,检测测出来来的周周期期可能能是NpNf(Np是基音音周期期,Nf是第一一共振振峰的的周周期))。三、LPC声码码器的的工作作原理理讨论93克服上上述干干扰有有两种种方法法:用低通通滤波波器((60Hz900Hz)对对语音音信号号进行行滤波波,去去除大大部分分共振振峰的的影响响,基基音频频率最最高约约450Hz,,滤波波后可可以保保留其其一、、二次次谐波波。先对语语音信信号进进行非非线性性变换换(例例如““中心心削波波”)),然然后再再求Rw(l)或rw(l),这这样可可以明明显地地改善善基音音估计计的效效果,,基音音周期期点上上,峰峰值点点或深深谷值值点比比削波波前得得到的的要尖尖锐、、突出出。三、LPC声码码器的的工作作原理理94产生语语音信信号s(n)的参量量清/浊音类类型;;基音周周期TP;代表声声道的的时变变滤波波器的的系数数{aj}及滤波波器阶阶数p;增益系系数G;说明:根据语语音信信号慢慢变化化的特特点,,可以以每隔隔10-30ms左左右预预测一一次上上述各各参数数的值值。即即以每每10-30ms为为一帧帧传送送一次次参数数样值值的编编码,,并不不传送送话音音样值值的编编码,,因此此比特特速率率低得得多。。二、语语音信信号的的产生生模型型95清浊音判决滤波器参数分析Ga1ap量化编码器U/V解码器Ga1apTPU/V激励信号产生合成滤波器信道基音周期提取TPs(n)预加重加窗s(n)LPC声码器的原理框图三、LPC声码码器的的工作作原理理96
对于加窗的语音信号sw(n),当窗的起点n=0时,语音信号sw(n)的短时能量用E
表示,短时平均幅度用M
表示,计算公式如下:三、LPC声码码器的的工作作原理理3、浊音音、清清音及及无声声的判判别根据语语音信信号的的短时时能量量、短短时平平均幅幅度和和短时时过零零率来来判断断当前前帧的的语音音信号号是浊浊音、、清音音,还还是无无声。。97
语音信号的过零率用Z
表示,它表示一帧语音信号中波形穿过横轴(零电平)的次数。它可以用相邻两个取样改变符号的次数来计算:三、LPC声码码器的的工作作原理理98浊音(V))的M最大而而Z最低,,当采采样率率为8kHz,,帧长长为20ms时时,Z的平均均值约约为20;;清音(U)的M居中而Z最高,当当采样率率为8kHz,,帧长为为20ms时,,Z的平均值值约为70;无声(S)的M最低而Z居中。判断当前前帧是浊浊音、清清音、无无声的依依据如下下:三、LPC声码码器的工工作原理理99三、LPC声码码器的工工作原理理
在S、U、V三种情况下,短时平均幅度M和短时过零率Z的条件概率密度函数示意图通道声码码器通道声码码器发送端通通过若干干个并联联的通道道对语音音信号进进行粗略略的频谱谱估计接收端产产生的信信号其频频谱与发发送端所所规定的的频谱相相匹配。。滤波器组组队频带带的划分分不均匀匀,低频频带的带带宽窄,,高频段段的带宽宽宽主要缺点点:需要要进行基基音检查查和清浊浊音的判判决,精精确性较较差。通道数量量有限,,造成信信号频谱谱畸变共振峰声声码器共振峰声声码器对整体的的语音信信号进行行分析,,提取信信号中的的共振峰峰的位置置、幅度度、带宽宽等参数数,构成成对应清清音和浊浊音的两两个声道道滤波器器。与通道声声码器相相比,共共振峰声声码器合合成的语语音质量量较好,,而且比比特率可可以压缩缩的更低低104四、LPC10声码器器复习:LPC声码器的的工作原原理清浊音判决滤波器参数分析Ga1ap量化编码器U/V解码器Ga1apTPU/V激励信号产生合成滤波器信道基音周期提取TPs(n)预加重加窗s(n)1051、LPC10声码器器概况LPC-10声声码器采采用10阶线性性预测分分析滤波波器,编编码速率率为2.4kb/s,,被美国国在1981年年作为联联邦标准准FS-1015用于于窄带保保密通信信。其语语音质量量清晰可可懂,但但抗噪声声的能力力和自然然度尚有有欠缺。。四、LPC10声码器器106四、LPC10声码器器2、LPC10编码码器低通滤波A/D变换预加重计算分析相位基音分析存储器低通滤波器清/浊检测基音及清/浊校正2阶逆滤波AMDF基音提取V/UV数字语音出并变串及同步产生误差校正的映射参数编码基音周期预测器分析存储器计算RMS计算预测参数2帧参数存储器2帧参数存储器RMSRC107LPC-10编码器的的特点(1)采样采样率8kHz,每个样样本量化化为12bit得到数字字化语音音,每180个样点分分为一帧帧(22.5ms),以帧帧为处理理单元。。四、LPC10声码器器预加重的的目的是是加强语语音谱中中的高频频共振峰峰,使语语音短时时谱以及及线性预预测分析析中的余余数(残残差)频频谱变得得更为平平坦,从从而提高高了谱参参数估值值的精确确性。(2)预加重在提取声道参数之前,先进行预加重(高频提升)处理,预加重滤波器的传输函数Hpw(z)为:108传输函数数Hpw(z)的幅频频和相频频特性四、LPC10声码器器010002000300040005000600070008000-100-50050100Frequency(Hertz)Phase(degrees)010002000300040005000600070008000-30-20-10010Frequency(Hertz)MagnitudeResponse(dB)109(3)声道滤滤滤器参参数RC该编码方方案中采采用协方方差法计计算预测测系数{ai},i=1,,P,P=10。预测系系数不适适于直接接量化,,因为它它的微小小变化会会导致LP综合滤波波器极点点位置很很大的变变化,很很可能造造成滤波波器不稳稳定,为为了保证证滤波器器的稳定定性,要要求有相相当高的的量化精精度(每每个系数数需要8—10bits)。四、LPC10声码器器110四、LPC10声码器器为了降低低量化比比特数,,采用了了在数学学上完全全等价的的P个反反射系数数(RC:ReflectionCoefficient){ki},i=1,,P代替替预测系系数进行行量化编编码。滤滤波器稳稳定的条条件是参参数ki满足下下式:此条件在在量化时时容易保保证。可可以通过过Levinson-Durbin算法求求得部分分相关系系数(PartialCorrelation),部部分相关关系数与与RC在在理论上上是互为为相反数数。111(4)增益RMS增益RMS由下式计计算:Si是经过预预加重后后的数字字语音信信号样本本,N是分析帧帧长度。。对于浊音音帧,其其分析帧帧长取为为130个样本本以内的的基音周周期期整数倍倍值;对于清音音帧,其其分析帧帧长取为为长度为为22.5ms的整个个帧的中中点为中中心的130个个样点。。四、LPC10声码器器112清/浊音音判决是是利用模模式匹配配技术,,基于低低带能量量、AMDF函函数的最最大值与与最小值值之比、、过零率率三个因因素判别别。最后后对基音音值、清清浊音判判决结果果用动态态规划算算法,在在三帧范范围内进进行平滑滑和错误误校正,,从而给给出当前前帧的基基音周期期、清浊浊音判决决参数V/U。。(5)提取基基音周期期和检测测清/浊音采用基于于短时平平均幅度度差函数数(AMDF)法提取基基音周期期。四、LPC10声码器器113(6)参数编编码对10个反射系系数RC、增益RMS、基音周周期、U/V判决标志志以及同同步信号号共编码码成每帧帧54bits,帧长22.5ms,因此编编码速率率为2.4kb/s。各比特特分配如如下表::四、LPC10声码器器114四、LPC10声码器器浊音清音浊音清音基音周期/清浊音77K(6)4RMS55K(7)4同步11K(8)4K(1)55K(9)3K(2)55K(10)2K(3)555433K(4)55误差校正020K(5)4115四、LPC10声码器器3、LPC10译码码器串/并变换同步检测误差检测校正编码参数解码帧块到基音块转换与插值输出存储器计算增益综合器清/浊音开关去加重D/A低通滤波合成语音出RMSRC基音周期V/UV反射系数转换成预测系数基音产生噪音产生116LPC-10声码器的的缺点(1)采用过过分简化化的二元元激励,,合成的的语音自自然度较较低;(2)稳健性性(Robustness)差。(3)LPC-10的语音谱谱共振峰峰的位置置以及带带宽估值值有时会会产生很很大的失失真,从从而影响响语音的的质量。。当浊音音的基音音频率接接近谱包包络中的的第一共共振峰时时,LPC谱估计在在共振峰峰位置上上出现极极其尖锐锐的峰值值(估计计失真)),使得得相应得得在合成成语音中中会出现现尖峰或或较大的的毛刺,,影响语语音质量量。四、LPC10声码器器117采用混合合激励代代替简单单的二元元激励,,使合成成语音的的质量得得到改善善。激励脉冲冲加抖动动:对每每个基音音周期的的长度乘乘上一个个0.75~1.25之间均均匀分布布的随机机数以改改善语音音的自然然度。4、LPC-10e声码器器LPC-10e声码器器采用针针对LPC-10声码码器的缺缺点加以以改进的的算法,,并能与与LPC-10声码器器兼容,,用于美美国第三三代保密密电话。。四、LPC10声码器器(1)激励源源的改善善118(2)基音音提取方方法的改改进LPC-10提取基音音采用的的是AMDF,它的显显著特点点是不需需要乘法法,计算算较小。。LPC-10e中采用LPC的残差信信号或语语音信号号的短时时自相关关函数,,利用动动态规划划的平滑滑算法来来更准确确地提取取基音周周期。四、LPC10声码器器119(3)声道滤波波器参数量化化的改进线谱频率LSF(LineSpectrumFrequency),或称为线谱谱对(LineSpectrumPair)是数学上与线线性预测系数数{ai}(i=1,,P)和反射系数{ki}(i=1,,P)完全等价的另另一种表示方方式。LSF参数集{i}(i=1,,P)都在单位圆上上,它们在频频域描述全极极点滤波器H(Z)。LSF在数学上有良良好的量化特特性。四、LPC10声码器120四、LPC10声码器在求取LSF参数及量化化过程中,如如果保持LSF参数的有有序有界性质质,即:就可以保证全全极点滤波器器H(Z)是稳定的。LSF参数有有序有界性121LSF误差相相对独立性某个频率点的的LSF偏差差只对该频率率附近的语音音频谱产生影影响,而对其其它LSF频频率上的语音音频谱影响不不大,这有利利于LSF的的参数量化和和插值。四、LPC10声码器122LSF参数的的量化在标量量化时时,通过设计计最佳的LSF参数的非非均匀标量量量化器,可以以用较少的量量化比特达到到较高的量化化精度。例如如:对10个个LSF参数数,根据每个个参数所起的的作用,分配配的量化比特特数为:3、、4、4、4、4、3、、3、3、3、3,共34bits。所得的合合成语音质量量与用41bits对反反射系数k参数量化得到到的合成语音音质量相比较较,在听觉上上没有任何差差别,两者的的波形完全吻吻合,计算量量化畸变约为为1dB。四、LPC10声码器123四、LPC10声码器LSF参数的的量化(续)在矢量量化时时,将10个个LSF合并并成(4,6)两个矢量量,每个矢量量量化为12bits,,共24bits,可以以得到平均谱谱畸变为1dB的“透明”矢量量化。第三章语语言信信号压缩编码码3.1语言言信号压缩编编码的基本概概念3.2自自适应差值脉脉冲编码调制制3.3参参量编码3.4混混合编码3.5低低速率语言压压缩编码的应应用3.4.1混混合编码混合编码结合合了波形编码码和参量编码码的优点,采采用线性技术术构成声道模模型。不止传输预测测参数和清浊浊音信息,而而且也同时传传输预测误差差信息。实现混合编码码基本方法是是以参量编码码特别是线性性预测编码LPC为基础础的,合成分析法(AbS,Analysis-By-Synthesis))的基本思想::用合成来指指导分析。将合成器引入入编码系统,,使之与分析析器相结合,,在编码器中中产生与译码码器完全一致致的合成语音音,将此合成成语音与原始始语音相比较较,根据一定定的误差准则则调整计算分析器的各个参数,使使两者之间的的误差达到最最小。然后将将误差最小时时的语音参数数传送到接收收端,得到高高质量的合成成语音。合成分析法在LPC基础上采用AbS的编码方法。。AbS-LPC编码器包括三三个基本部分分:时变滤波器((包括LPC和基音滤波器器)基于感知的最最小化处理;;激励信号;AbS-LPC编码器AbS-LPC编码器与译码码器AbS-LPC编码器激励信号产生编码端基音合成滤波器LPC合成滤波器解码端输出语音误差最小优化的激励基音合成滤波器LPC合成滤波器+误差-+原始语音AbS-LPC编码器合成分析编码码方法的特点点:发端是一个闭闭环系统;对激励信号没没有明显的分分类,由闭环系统统选择与原原始语音误差差最小的激励励信号,使得得合成语音质质量 比传统统的LPC声声码器好得多多。1、时变滤波波器时变滤波器由由LPC合成滤波器和和基音合成滤滤波器级连组组成。LPC合成滤波器实实现语音的短短时预测;基音合成滤波波器实现语音音的长时预测测。AbS-LPC编码器在语音谱中,,能量较高的的频段(如共共振峰处)的的噪声相对于于能量较低频频段的噪声不不易被感知,,在度量原始始语音与合成成语音之间的的误差时可以以计入这一因因素,在语音音能量高的频频段,允许二二者的误差大大一些,反之之则小一些,,为此在计算算二者误差时时,引入频域域感觉加权滤滤波器W(f)。2、感觉加权滤滤波器感觉加权滤波波器:是根据人的听听觉特性对预预测残差信号号进行处理,,以产生较好好的主观听觉觉效果。AbS-LPC编码器3、激励信号源源激励信号是AbS-LPC模型的输入,,包含不能由由时变滤波器器谱模型表征征的残差结构构,如超出长长时线性预测测范围的相关关性就不能由由长时线性预预测包含,激激励信号还包包括不能用确确定方法有效效表征的随机机结构。采用用AbS方法的声码器器都用激励信信号源的种类类命名。例如如:(1)多脉冲线性性预测编码((MP-LPC)(2)规则脉冲激激励—长时预测编码码(RPE-LTP-LPC)(3)码本激励线线性预测编码码(CELP)AbS-LPC编码器语音的合成分分析编码合成分析法((ABS)的基本思想想是用合成来来指导分析。。将合成器引入入编码瑞,使使之与分析器器相结台,在在编码器中产产生与译码器器端完全一致致的合成语音音,将此合成成语音与原始始语音相比较较,根据一定定的误差准则则调整计算各各个参数,使使得二者之间间的误差达到到最小。将误差最小时时的系统参数数传送到接收收端,可以合合成较高质量量的语音。★AbS—LPC编码方法(1)缓存一帧语音音采样值.通通道LPC分析得到一组组LPC系数。(2)通过LPC逆滤波计算不不量化的残差差信号。(3)由于LPC分析帧通常较较长,确定激激励信号时需需要把一帧分分成几个子帧帧。(4)对每个子帧计计算基音滤波波器(长时预测器)参数。(5)将基音和LPC合成滤波器级级联起来,选选择最佳激励励信号。(6)接收端根据收收到的码字或或数据求得最最佳激励信号号,通过级联联滤波器产生生与原始语音音误差最小的的合成语音。。多带激励(MBE)和混合激励线线性预测(MELP)编码多带激励(MBE)语音编码混合激励线性性预测(MELP)编码★多带激励(MBE)语音编码MBE编码算法首先先由美国的MIT大学林肯实验验室的P.W.Griffin和J.S.Lim于1984年提出的。算法的关键是是提出了一种种基于频域的的、新的语音音信号产生模模型——多带激励模型型,进而提高了合合成语音的自自然度。★MBE语音模型MBE模型与传统的的声码器模型型的突出区别别在激励模型型的表示上。。传统的声码器器模型.整个个频带不是清清音就是浊音音.激励谱由由全频带的清清浊音判决并并由基音周期期表示。这种描述方法法不能反映语语音的复杂构构成,合成语语音自然度差差。MBE模型,将整个个频带以基音音谐波为中心心.以基音频频率为带宽划划分为若干频频带,在每个个频带根据频频谱特征进行行清浊音判决决,形成多带带激励谱。整个激励谱由由基音频率和和它的谐波以以及一组清浊浊音判决参数数表示,能较较好地反映语语音特征。★混合激励线性性预测(MELP)编码MELP算法的基本特特点:采用了了混合激励的的形式代替基基本LPC模型的二元激激励形式.将将周期脉冲激激励源和白噪噪声源混合作作为激励信号号解决了二元激激励模式不能能准确描述过过渡帧和弱浊浊音帧的问题题使合成激励信信号谱与残差差信号谱更加加匹配吸取MBE模型的思想,,对激励信号号进行分带处处理MELP声码器的质量量大大超过LPC—10声码器,是一种较理想想的低速率语语音编码算法法★MELP简要框图1.分析部分●基音提取分为为几个步骤::首先是用自自相关法进行行整数基音初初估,得到整整数基音初值值;然后利用用内插公式提提高输入基音音值的准确度度。●分带话音音分析首先将将输入语音信信号滤成5个子频带的信信号,计算5个子带的分带带话音强度井井以此为依据据进行分带清清/浊音判决决。●线性预测分分析用L—D算法进行自相相关分析。对对线性预测系系数的量化使使用多级矢量量量化技术。。●计算残差谐谐波谱时,首首先使用量化化后的LSF参数计算线性性预测系数,,并用它产生生残差信号,,对其进行FFT变换。利用频频谱峰点检测测算法找到与与前10次谐波对应的的傅里叶系数数输出。2.合成部分●合成部分仍然然采取LPC合成的形式,,不同的是激激励信号的合合成方式和后后处理。●MELP算法中,混合合激励为合成成分带滤波后后的脉冲与噪噪声激励之和和。●脉冲激励是是用长度为—个基音周期的的残差谱博里里叶系数的离离散博里叶反反变换计算出出来。●噪声激励是是首先产[0,1]间均匀分布的的白噪声源,,再对其进行行电平调整和和限幅。●脉冲和噪声声源各自滤波波后加在一起起合成混合合激励。●混合激励信信号合成后经经自适应谱增增强滤波器处处理,用于改改善共振峰的的形状。●随后,激励励信号进行LPC合成得到合成成语音。3.参数量化编码码部分MELP算法的参数包包括LPC参数、基音周周期、模式分分类参数、分分带混合比例例、残差谐波波谱参数和增增益。MPLPCRPELPCCELP★数字音频编码码标准★话音音频编码码标准1.G.711标准●CCITT(国际电报电电话咨询委员员会)于1972年对话音频谱谱的模拟信号号用脉冲编码码调制(PCM)编码时的特特性进行了规规范●速率为64kb/s●适合于电话质质量的语言信信号编码(频率范围300Hz~3.4kHz)2.G.721标准●G.721标准是CCITT1988年制订的●速率为32kb/s●采用自适应差差分脉码调制制(ADPCM)算法●适合于中中等质量音频频信号编码,,同时也应用用于调幅广播播质量的音频频信号编码3.G.722标准●G.722标准是CCITT1988年制订的,●该标准规范了了一种音频((50~7000Hz)编码系统的的特性●速率为64kb/s●采用子带自适适应差分脉码码制(SB-ADPCM)算法●具有数据插插入的功能●适合于调幅幅广播质量的的音频信号编编码,也适合合于需要存储储大量高质量量音频信号的的多媒体系统统●例如视听多多媒体、会议议电视等具有有调幅广播质质量的音频G.722编/解码器原理框框图(a)发端编码器;;(b)收端解码器4.G.728标准●速率为16kb/s●采用短时码本本激励线性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45326-2025超粗晶粒硬质合金工程齿
- 茶艺与传统工艺的结合试题及答案
- 战胜压力:健康管理师考试试题及答案
- 妇幼健康工作的可持续性试题及答案
- 土木科研成果应用试题及答案
- 二零二五年度品牌代理解约后的区域代理权转授权协议
- 2025年度智能化房屋租赁续租及配套设施升级合同
- 2025年度试用期劳动合同与岗位胜任能力评估协议
- 2025年度棋牌室品牌战略规划与实施合同
- 二零二五年度国际邮轮代购服务协议
- 2024年电厂讲解直流系统PPT通用课件
- 曹操献刀资料课件
- 2024年国信证券招聘笔试参考题库附带答案详解
- 仙家送钱表文-文字打印版
- 工程测量:四等水准测量
- 2022-2023学年河南省南阳市方城县科普版六年级下学期4月期中英语试卷(解析版)
- 学 生 处 分 登 记 表
- 国家辅助类药品一览表
- 砖厂烟气除尘脱硫项目设计方案
- 国家职业标准-农艺工
- 吉林省吉林市高职单招2022年数学测试题及答案
评论
0/150
提交评论