语音编码基础知识_第1页
语音编码基础知识_第2页
语音编码基础知识_第3页
语音编码基础知识_第4页
语音编码基础知识_第5页
已阅读5页,还剩115页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

语音编码(speechcoding)√概述√语音信号压缩编码的原理及其评价系统√语音信号的波形编码√语音信号的参数编码√语音信号的混合编码√概述一、编码(压缩)的重要性二、编码速率(信息容量)三、编码的分类四、已经标准化的语音编码

编码、传输、存储和译码是语音数字传输和数字存储的必要过程。随着语音通信技术的发展,压缩语音信号的传输带宽,降低信道的传输速率,一直是人们追求的目标。语音编码在实现这一目标的过程中担当重要的角色。语音编码就是使表达语音信号的比特数目最小。一、编码(压缩)的重要性数字传输系统模型信源信源编码信道编码调制传输通道用户信源解码信道解码解调噪声语音编码应用实例(IP电话)接收器模数转换压缩编码IP封装网络IP解包解码数模转换播放器二、编码速率(信息容量)

用比特/秒(b/s或bps)来度量,用I表示,有:I=R•fs,R代表每个语音采样值编码所需的比特数;fs是采样频率。当fs=8kHz,每个采样值用8比特位来编码,则编码速率为64kb/s。三、编码的分类1.波形编码(waveformcoding):基本原理是在时间轴上对模拟话音信号按照一定的速率来抽样,然后将幅度样本分层量化,并使用代码来表示。在接收端将收到的数字序列经过解码恢复到原模拟信号,保持原始语音的波形形状。话音质量高,编码速率高。如PCM编码类(a率或u率PCM、ADPCM、ADM),编码速率为64-16kb/s,语音质量好。2.参数编码(声源编码parametriccoding):

根据语音信号产生的数学模型,通过对语音信号特征参数的提取后进行编码(将特征参数变换成数字代码进行传输)。在接收端将特征参数,结合数学模型,恢复语音,力图使重建语音保持尽可能高的可懂度,重建语音信号的波形同原始语音信号的波形可能会有相当大的区别。如线性预测(LPC)编码类。编码速率低,2.4-1.2kb/s,自然度低,对环境噪声敏感。3.混合编码(Hybridcoding):

将波形编码与参数编码相结合,在2.4-1.2kb/s速率上能够得到高质量的合成语音。规则码激励长时预测编码RPE—LPT即为混合编码技术。混合编码包括若干语音特征参量又包括部分波形编码信息,以达到波形编码的高质量和参量编码的低速率的优点。四、已经标准化的语音编码

指定组织:国际电信联盟ITU-T,

标准编码速率(kb/s)算法MOS得分应用G.71164u律或a律PCM4.3公用网G.72132ADPCM4.1公用网G.723.15.3ACELP3.2无线网G.7298CS-ACELP3.8无线网GSM13RPE-LTP3.9无线网(5)RPE-LTP:长时预测的规则脉冲激励的线性预测Regular-PulseExcitedLPCwithaLong-TermPredictor(1)ADPCM:自适应差分脉冲编码adaptivedifferencepulsecodemodulation(2)CELP:码本激励线性预测(codeexcitedlinearprediction)(3)ACELP:代数码本激励线性预测Algebraic-Code-ExcitedLinear-Prediction(4)CS-ACELP:共轭结构的代数码本激励线性预测ConjugateStructureAlgebraic-Code-ExcitedLinear-Prediction√语音信号压缩编码的原理及其评价系统一、语音压缩的基本依据二、语音编码的关键技术三、语音压缩系统的性能指标和评测方法一、语音压缩的基本依据

是语音信号的冗余度和人的听觉感知机理。1.存在的时域冗余度:(1)幅度非均匀分布(2)语音信号样本间的相关性很强(3)浊音具有准周期(4)声道的形状及其变化缓慢(5)语音间隙(静止系数)2.存在的频域冗余度:(1)非均匀的长时功率谱密度(2)短时功率谱密度女声英文a的功率谱3.人的听觉感知机理(1)人类的听觉特性具有掩蔽效应(2)人耳对不同频段声音的敏感程度不同(3)人耳对语音相位不敏感4.语音编码的极限速率语音中最基本的元素是音素,大约有128~256个,如果按通常的说话速度,每秒平均发出10个音素,则信息率为:I=[log2(256)10]bps=80bps把发音看成是以语音速率来传送,则语音编码的极限速率为80bps,从数字化标准的编码速率64kbps,到极限速率80bps,之间的距离,对于理论研究和实践有着极大的吸引力。二、语音编码的关键技术语音信号中存在两种类型的相关性:(1)样点间的短时相关性(2)相邻基音周期之间的长时相关性e(n)x(n)短时预测滤波器语音信号的短时预测模型

D为基音周期,长时预测系数{bi}的个数取1(q=r=0)或3(q=r=1)。D、{bi}从语音信号中直接提取。语音信号通过长时预测,得出基音周期、增益(振幅大小)。2.语音信号的长时预测

长时线性预测x(n-p),x(n-p+1),….x(n-1)x(n)长时预测滤波器x(n)e(n)激励发生器完整的语音信号的预测模型3.感觉加权滤波器

由于掩蔽效应,在语音频谱中,能量较高的频段(共振峰处)的噪声相对于能量较低的频段的噪声不易被感觉。在度量原始语音和合成语音之间的误差时,在高能量段允许误差大,因此引入一个频域的感觉加权滤波器W(z)来衡量语音之间的误差。加权因子在0~1之间,控制共振峰区域的误差增加。输入语音x(n)线性预测分析感觉加权滤波器后继处理三、语音压缩系统的性能指标和评测方法1.语音压缩系统的性能指标(1)编码速率(2)编码器的顽健性(3)编码器的时延(4)算法的复杂度和可扩展性编码延时

一般地,编解码算法越复杂,延时越大,会明显感觉到通话对方反映“迟钝”,甚至造成正常通信困难。另外一方面,延时造成回声,传统的电话系统中,在2-4线的转换处(混合线圈)因阻抗不匹配,导致接收者的收话音信号泄露到其发送路径上,返回给发送者,形成了回声。当延时小时,回声同房间交混,因此感觉不到;当延迟超过了25ms,能明显感觉到,从而严重影响通信。一般地,要求编解码延时不超过5-10ms。A端的信号+B端经混合线圈的回传信号B端的信号+A端经混合线圈的回传信号A端B端2.语音压缩系统的性能指标和评测方法

语音质量是衡量语音编码算法优劣的关键性能之一。语音质量通常分为四类:(1)广播级(2)网络或电话级(3)通信级(4)合成级

语音质量有主观和客观两种评价方法。

评价指标:清晰度或可懂度、音质。前者是指语音是否容易听清楚;后者指语音听起来有多自然。(1)可懂度评价DRT:DiagnosticRhymerTest(2)音质评价:MOS:MeanOpinionScore平均意见得分和DAM:DiagnosticAcceptabilityMeasure判断满意度得分。主观评价方法

MOS得分为五级:优、良、可、差和坏。满分为5分,相当调频广播质量;4分以上是长途电话网标准;3.5分为通信标准;3.0分仍有较好的可懂度,保持自然度;2.5分只维持可懂度,是战术通信标准。(1)波形失真度,用信噪比来度量(2)频谱失真测量(3)谱包络失真测量客观评价方法语音信号的波形编码一、非均匀量化的PCM编码二、增量调制编码三、自适应增量调制编码四、自适应差分脉冲编码ADPCM五、自适应预测器六、自适应量化器七、ADPCM的总结

均匀量化时,无论大的输入信号还是小的输入信号一律采用相同的量化间隔,为了适应大的输入信号,同时又要满足精度要求,就需要增加样本的位数。=2V/L=2V/2R,但是对话音信号来说,大信号出现的机会并不多,增加的样本数就没有充分利用。因此采用非均匀量化。一、非均匀量化的PCM编码其基本思想是:大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔。在满足精度要求的情况下用较少的位数来表示。译码时,采用相同的规则。也可视为将信号进行非线性变换后再作均匀量化,如对信号进行对数压缩,微弱的信号被放大,强的信号被压缩。译码时,指数扩张。非线性压缩均匀量化编码xa(nT)解码非线性扩张x'(nT)

现在的非均匀量化中,一般采用两种压缩扩张非均匀量化方法。采样后信号幅度和量化数据之间有两种对应关系,一种称为u律压扩(companding)算法,另一种称为A律压扩算法。u律压扩主要用于北美和日本等地区的电话通信中。A律压扩主要用在欧洲和中国的地区的电话通信中。u律压扩(1)输入xa(nT)的范围归一化为(-1~+1);(2)输出FA(x(n))的范围为(-1~+1);(3)A为压扩参数,它反映最大量化间隔和最小量化间隔的比值。A=87.56A律压扩我国的PCM30/32路基群也采用A律13折线压缩特性。μ律15折线主要用于美国、加拿大和日本等国的PCM24路基群中。CCITT建议G.711规定上述两种折线近似压缩律为国际标准,且在国际间数字系统相互连接时,要以A律为标准。因此这里重点介绍A律13折线。

FA(x)01116181321412164112817/86/85/84/83/82/81/8xa(nT)A律压扩编码采用8位二进制编码:C7C6C5C4C3C2C1C0C7:表示信号的极性,称为极性码。0为正,1为负。C3C2C1C0:表示每一段落的16个均匀划分的量化级,称为段内码。

0000000100100011010001010110011110001001101010111100110111101111C6C5C4:表示段落序号,称为段落码。

000001010011100101110111对输入动态范围为(-5v,+5v),用A律压扩编码,有:1/1280.0390625v7654321015v1/22.5v1/41.25v1/80.625v1/160.3125v1/320.15625v1/640.078125v00v输入信号为1.05v,则编码为:极性码:0段落码:101段内码:=(1.25-0.625)/16=0.0390625(1.05-0.625)/=10.88取整数10,对应第10量化间隔,编码为1010最后完整的码字为:01011010

I=8kHz*8bit=64kbit/s实际中,麦克风采集信号,量化为12/13/14/15/16位的输入信号,使用A律压扩编码,每个样本的量化位为8。

A律压扩编码的速率:对输入信号范围(-1,1):A律压扩编码的最小量阶为

min=(1/128)/16=1/2048;在同样的输入信号范围,均匀量化的线性PCM以A律压扩编码的最小量阶为量阶进行量化,得到线性PCM需要12比特编码;

=2V/L=2V/2R=2/2R=1/20482R=2*2048R=12

A律压扩编码则只需要8个比特位。A律压扩编码与线性PCM编码的对比A律压扩编码与其他线性PCM编码的快速转换线性PCM(13bits,b12为符号位)b12b11b10b9b8b7b6b5b4b3b2b1b0A律压扩编码M7=b12M7M6M5M4M3M2M1M0

0000000

abcd1

000

abcd

000000

1abcd100

1abcd

00000

1abcd1×0

10abcd

0000

1abcd1××

0

11abcd

000

1abcd1×××

100abcd

00

1abcd1××××101abcd

0

1abcd1×××××110abcd1abcd1××××××111abcd时分复用TimeDivisionMultiplexing原理:把时间分割成小的时间片,每个时间片分为若干个通道(时隙),每个用户占用一个通道传输数据。

A2A1A3原始信号D2D1D3数字化信号MUX复用后数据时隙1234D3D2D1适用于数字信号传输

时间片复用概念:利用不同时隙在同一信道上同时传输各路不同信号,且互不干扰,这就是时分复用(TDM)。(a)第1路;(b)第2路;(c)第3路;(d)3路合成的波形PCM30/32路介绍

1.基本特性话路数目:30抽样频率:8kHz压扩特性:A=87.6/13折线压扩律,编码位数为8每帧时隙数:32总数码率:8×32×8000=2048kb/s

2时隙分配:在PCM30/32路的制式中,抽样周期为1/8000=125μs,它被称为一个帧周期,即125μs为一帧。一帧内要时分复用32路,每路占用的时隙为125/32=3.9μs,称为一个时隙。因此一帧有32个时隙,按顺序编号为TS0、TS1、……、TS31。时隙的使用分配为:①TS1~TS15,TS17~

TS31为30个话路时隙;②TS0为帧同步码,监视码时隙;③TS16为信令(振铃、占线、摘机……等各种标志信号)时隙。E1-帧格式0121631125ms=32时隙=2.048Mbps帧同步信令信道30路话音数据信道+2路控制信道

话路比特的安排:每个话路时隙内要将样值编为8位二元码,每个码元占3.9μs/8=488ns复接等级和速率系列

二、增量调制编码

1.增量调制的定义:

增量调制(DM)也称为调制,是对输入样本s(k)和预测样本值se(k)的差值d(k)量化的最简单的一种情况,只有两种编码输出:0或1。一般情况下,如果差值大于0,则编码为“0”,若差值小于0,则编码为“1”。由于增量编码只须用1位对语音信号进行编码,所以对增量调制编码系统称为“1位系统”。

2.增量调制(DM)的结构se(k)-DM发送端s(k)+量化器预测器I(k)sr(k)++编码Δd(k)s(k)输入样本se(k)预测样本值d(k)差值sr(k)重建样本值I(k)已量化的差值3.增量调制(DM)的编码预测器采取简单的一阶固定预测器。se(k)=asr(k-1)a为一个常数,一般情况下取,即a=1。用重建信号的前一时刻来预测当前时刻的预测样本值。se(k)=sr(k-1)sr(k)=se(k)+I(k)=sr(k-1)+I(k)d(k)=s(k)-se(k)I(k)=Q[d(k)]=±Δd(k)I(k)Δ-Δ01se(k)=sr(k-1)se(k)=sr(k-1)d(k)=s(k)-se(k)>0d(k)=s(k)-se(k)<0I(k)=Q[d(k)]=+ΔI(k)=Q[d(k)]=-Δsr(k)=se(k)+I(k)sr(k)=se(k)+I(k)码字为0码字为1s(k)Δsr(0)se(1)sr(1)se(2)00sr(2)0001111011010104.增量调制(DM)的译码预测器I(k)sr(k)++译码Δse(k)se(k)=sr(k-1)sr(k)=se(k)+I(k)I(k)=±Δ5.量阶固定的增量调制(线性增量调制LDM)的缺点(1)当输入信号变化快,用固定的量阶量化,可能造成量化波形跟不上实际波形,这种现象称为“斜率过载”。0000(2)当输入信号波形较平坦时,编码为0和1的交替序列,类似随机噪声的特性,这种现象称为“颗粒噪声”。101010三、自适应增量调制编码

采用自适应的方法使量阶的大小随输入信号的统计特性变化。一般都采用后向量化,由量化器输出来自适应地调整量阶。通过推导有:

I(k)=Δ(k)=MΔ(k-1)M是关于码字c(n)的函数,有如下表达式:M=P>1若c(n)=c(n-1)M=Q<1若c(n)≠c(n-1)P=2若c(n)=c(n-1)Q=1/2若c(n)≠c(n-1)s(k)sr(0)se(1)sr(1)se(2)00sr(2)001101100110100Δ(k)=MΔ(k-1)

另一种调整量阶方法是:如果码字中连续出现三个相同的值,量阶就加上一个大的增量,反之,就加一个小的增量。这种方法称为连续可变斜率增量调制(CVSD)。Motorola公司的集成电路芯片,如MC3417/MC3517、MC3418/MC3518,采用了CVSD,前者检测3位,后者检测4位连续的编码。

在PCM中,每个波形样值都独立编码,与其他样值无关,这样,样值的整个幅值编码需要较多位数,比特率较高,造成数字化的信号带宽大大增加。

然而,大多数以奈奎斯特或更高速率抽样的信源信号在相邻抽样间表现出很强的相关性,有很大的冗余度。利用信源的这种相关性,一种比较简单的解决方法是对相邻样值的差值而不是样值本身进行编码。编码位数显著减少,信号带宽大大压缩。这种利用差值的PCM编码称为差分PCM(DPCM)。如果将样值之差仍用N位编码传送,则DPCM的量化信噪比显然优于PCM系统。四、自适应差分脉冲编码ADPCM

对于长途传输系统,64kb/s的速率占用的频带太宽,通信的费用昂贵,因此人们寻找能够在更低的速率上获得高质量语音编码的方法,由此提出了G.72132kb/sADPCMAdaptiveDifferencePulseCodeModulation编码标准,利用语音信号样点的相关性和非平稳特点,使用了自适应预测和自适应量化。1.ADPCM的基本思想

利用样本(采样值)与样本之间的冗余信息进行编码。对实际样本值与预测样本值之差进行量化编码,从而减少了每个样本信号的位数。ADPCM包括两部分的功能:APCM和DPCM。APCM主要改变量化间隔;DPCM主要得到预测样本和差值。

运用自适应的思想,用过去的样本值估算下一个输入样本的值,使实际样本值和预测值之间的差值总是最小。这部分功能称为DPCM。2.DPCM量化器自适应预测器逆量化器s(k)+se(k)-d(k)I(k)sr(k)+dq(k)+编码DPCM发送端s(k)输入样本se(k)预测样本值d(k)差值sr(k)重建样本值dq(k)重建差值I(k)已量化的差值产生误差产生误差

e1(n)和e2(n)是量化器和逆量化器的量化噪声。一般情况下,e1(n)和e2(n)的瞬时值不等,在忽略量化噪声的情况下,d(k)=I(k)-e1(n)dq(k)=I(k)-e2(n)dq(k)≈d(k)d(k)=s(k)-se(k)sr(k)=se(k)+dq(k)≈se(k)+d(k)=se(k)+s(k)-se(k)=s(k)逆量化器自适应预测器I(k)dq(k)sr(k)DPCM接收端+se(k)

+

发送端和接收端采用相同的预测器,进行信号的重建。发送端和接收端中除了I(k)是数字信号,其余信号均为时间离散,幅度未量化的物理量。sr(k)=se(k)+dq(k)差值量化系统的信噪比为:

要使SNR增大,可用增大SNRQ和

GP来达到。

(1)SNRQ为量化器的信噪比,取决于量化器的性质,一般采用自适应量化和非均匀量化可使其增大。(2)GP为差值结构产生的增益,对于给定的语音信号,δs2是固定的,只有减小δd2,DPCM采用自适应预测的思想使δd2最小的方法增大SNR。3.APCM

利用自适应的思想改变量化间隔(量阶)的大小,即用小的量化间隔去编码小的差值,使用大的的量化间隔去编码大的差值,这部分功能称为APCM。量化器量阶自适应d(k)I(k)量阶Δ(k)APCM发送端逆量化器量阶自适应I(k)dq(k)Δ(k)APCM接收端4.ADPCM的简单框图

ADPCM编码结合了APCM和DPCM两者的特性,量化器和预测器均是自适应。将I(k),已量化的样值编码为4个比特,编码速率为32kb/s。s(k)+d(k)量化器自适应预测器逆量化器se(k)-

I(k)sr(k)+

dq(k)+编码发送端量阶自适应Δ(k)ADPCM接收端逆量化器自适应预测器I(k)dq(k)sr(k)++se(k)量阶自适应发送端输入样本:s(k)=se(k)+d(k)接收端输出重建样本值:sr(k)=se(k)+dq(k)归一化输入差值dln(k)=log2|d(k)|-log2(k)量化电平(I(k)对应的码字)归一化量化输出In(k)=log2|I(k)|-log2(k)[3.16+∞]73.34[2.783.16]62.95[2.422.78]52.59[2.042.42]42.23[1.582.04]31.81[0.961.58]21.29[-0.050.96]10.53[-∞-0.05]0-1.05ADPCM的总结1.编码方式

当d(k)的符号为正,则编码的码字最高位b3为0;当d(k)的符号为负,则编码的码字最高位b3为1。码字的b2b1b0由表中码字决定。例如:一个负的d(k)值,归一化后落在[3.16+∞],则编码为1111,归一化量化输出为-3.34;若一个正的d(k)值,归一化后落在[3.16,+∞],则编码为0111,归一化量化输出为3.34。量化器逆量化器s(k)+-se(k)d(k)I(k)dq(k)++编码sr(k)量阶自适应++Δ(k)ADPCM发送端2.ADPCM发送端工作过程:

输入样本s(k),与预测样本值se(k)相减后产生差值d(k),对d(k)进行自适应量化,对量化器输出I(k)进行4个比特位的编码。(1)码字送给接收端的解码器;(2)对其进行本地解码,进行逆量化,得到差值信号dq(k),与预测信号se(k)相加得到本地重建信号sr(k),利用sr(k)、dq(k),对下一时刻输入的s(k+1)进行自适应预测,得到se(k+1)。自适应预测器采用六阶零点和二阶极点。逆量化器I(k)dq(k)sr(k)+se(k)+++量阶自适应Δ(k)ADPCM接收端3.ADPCM接收端工作过程:

将接收的码字进行解码,进行逆量化,得到重建差值信号dq(k),与预测信号se(k)相加得到重建信号sr(k),利用sr(k)、dq(k)进行自适应预测,得到se(k+1)。自适应预测器和自适应量化器采用发送端的同样的对应结构和算法。根据码字,查表得到编码所对应的In(k),一般地,In(k)≈dlqn(k)(归一化重建差值)利用:dlqn(k)=In(k)=log2|dq(k)|-log2(k)log2|dq(k)|=In(k)+log2(k)

log2|dq(k)|的反对数变换就是dq(k),其符号由d(k)与一致。由接收的码字决定。

逆量化过程:子带-自适应差分脉冲编码调制

语音信号的参数编码一、参数编码的特点二、LPC-10编码器低速率语音编码的应用:蜂窝移动电台网;卫星通讯;短波保密通信;

ISDN(IntegratedServiceDigitalNetwork);“语音邮件”、“语音存储”等新型通信业务。一、参数编码的特点

由于参数编码是针对语音信号的特征参数,所以与波形编码不同,只是适用于语音信号。

常用的编码器为线性预测编码器。时间(样点)x(n)x(n-1)x(n-p)p个点线性预测:LPC语音合成图清/浊开关声道模拟滤波器基音周期脉冲序列发生器随机噪声发生器LPC系数增益Gu(n)输出语音s(n)清音/浊音示意图:a1语音输出x’(n)线性预测分析基音频率清/浊音判别参数合成a2ap基音频率输入语音x(n)清/浊音标志G二、LPC-10编码器

美国确定LPC-10作为2.4kb/s速率上的推荐编码形式,用于第三代保密电话中。在其发送端,原始语音信号采用8kHz采样,然后每180个采样值分为一帧(22.5ms),提取语音特征参数并加以编码传送。每帧总共编码为54bits,每秒传输44.4帧,因此总传输速率为2.4kb/s。s(n)采样(8kHz)基音检测(AMDF)清/浊音检测预加重线性预测分析反射系数增益G参数编码c(n)LPC-10编码器发送端预加重:提高语音谱中的高频共振峰,使得语音的频谱较为平滑。短时平均幅度差函数(AMDF)c(n)解码清/浊音开关反射系数转换为预测系数基音增益G合成器去加重噪声产生s'(n)

LPC-10编码器接收端语音信号的混合编码一、混合编码的特点二、CELP的编码原理三、RPE-LPT编码原理一、混合编码的特点

混合编码同参数编码一样,依据语音的线性预测模型,使用了与波形编码相匹配的技术,达到低速率上的高质量的语音编码。目前以CELP为基础的多种算法已经成为国际标准。二、CELP(CodeExcitedLinearPrediction)编码原理

采用矢量量化技术,对激励信号进行训练得到一个码本,每帧语音信号从码本中选出一个在感觉加权误差最小意义上的最佳码矢量作为激励源。Hl(z)e(n)x(n)

CELP是近10年来最成功的语音编码算法。CELP语音编码算法用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码本中的序号。CELP已经被许多语音编码标准所采用,美国联邦标准FS1016就是采用CELP的编码方法,主要用于高质量的窄带语音保密通信。

其基本原理是用一个自适应码本中的码字来逼近语音的长时周期性结构,用一个固定随机码本中的码字来逼近语音经过短时和长时预测后的余量信号,从两个码本中搜索出来的最佳矢量乘以各自的最佳增益后相加,其和即为CELP激励信号源。

将激励信号输入P阶LP综合滤波器1/A(Z),得到合成语音信号,它与原始语音信号s(n)的误差经过感觉加权滤波器W(z),得到感觉加权误差es(n)。CELP就是利用es(n)的最小平方预测误差作为搜索最佳码矢量及其增益的度量准则。由于这种算法能最好地逼近原始语音,语音质量较好,所以它优于脉冲激励线性预测。CELP语音编码示意图s(n)es(n)2550随机码本W(z)误差最小化原始语音s(n)+-5110自适应码本线性预测滤波器g1ga++感觉加权滤波器感觉加权滤波器

由于掩蔽效应,在语音频谱中,能量较高的频段(共振峰处)的噪声相对于能量较低的频段的噪声不易被感觉。在度量原始语音和合成语音之间的误差时,在高能量段允许误差大,因此引入一个频域的感觉加权滤波器W(z)来衡量语音之间的误差。加权因子在0~1之间,控制共振峰区域的误差增加。

CELP有参数编码的特征,另一方面在感觉加权均方误差最小时,实际上是做了波形的最佳匹配,有波形编码的特征,所以CELP又被称为混合编码。CELP语音编码的特点

以码本激励线性预测(CELP)原理为基础的G.729、G.723(G.723.1)话音压缩编码技术,是IP电话技术的一个重要组成部分。以G.729为例,它可将经过采样的64kb/s话音以几乎不失真的质量压缩至8kb/s。CELP语音编码的应用CELP

原始语音ComparisonAlgorithmBitRateComplexityDelayMeanOpinionScorePCM64Kb/s>1Mips.25ms4.4G.7298Kb/s20Mips10ms4.2ITU-TG.7298kb/sCS—ACELP简介

G.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。它需要符合一些严格的要求,比如在良好的信道条件下要达到长话质量,在有随机比特误码、发生帧丢失和多次转接等情况下要有很好的稳健性等。这种语音压缩算法可以应用在很广泛的领域中,包括IP电话、无线通信、数字卫星系统和数字专用线路。

G.729算法采用“共轭结构代数码本激励线性预测编码方案”(CS-ACELP)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论