版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章第三章 语音信号的压缩编码语音信号的压缩编码232参量编码参量编码345混合编码混合编码低速率语音压缩编码的应用低速率语音压缩编码的应用1语音信号压缩编码的基本概念语音信号压缩编码的基本概念自适应差值脉冲编码调制自适应差值脉冲编码调制ADPCMADPCM语音编码发展方向语音编码发展方向极低速率语音编码极低速率语音编码比特率低于比特率低于2400bps的编码的编码保密通信、语音邮件、网络通信、保密通信、语音邮件、网络通信、IP电话电话变速率语音编码变速率语音编码在合成语音质量和系统容量中灵活折中在合成语音质量和系统容量中灵活折中CDMA通信系统中,且前景广阔通信系统中,且前景广阔不压缩语音
2、编码不压缩语音编码压缩费用超过传输费用压缩费用超过传输费用光纤通信、微波通信光纤通信、微波通信压缩的意义压缩的意义为什么需要压缩编码技术为什么需要压缩编码技术PCM编码占用带宽大编码占用带宽大8000Hz采样速率,每样本采样速率,每样本8位码位码数码率:数码率:64kbps有线传输中可以找到大容量传输介质:光纤有线传输中可以找到大容量传输介质:光纤无线接入侧的频谱资源相当紧张无线接入侧的频谱资源相当紧张GSM频点分配频点分配定义:定义:低于低于64kbps的编码方案称为语音压缩编码的编码方案称为语音压缩编码压缩依据压缩依据语音信号中存在的冗余语音信号中存在的冗余人类的听觉感知机理人类的听觉感知
3、机理 3.1 3.1 语音信号压缩编码的基本概念语音信号压缩编码的基本概念信号冗余信号冗余时间域时间域信号的非均匀分布信号的非均匀分布小幅度概率高,信息集中在低功率信号上小幅度概率高,信息集中在低功率信号上采样数据样值间的数据相关性采样数据样值间的数据相关性8kHz速率时,相邻样值相关系数高达速率时,相邻样值相关系数高达0.85周期间相关性:周期间相关性:浊音的准周期性浊音的准周期性全双工通话时存在通话间隙全双工通话时存在通话间隙信号冗余信号冗余频率域频率域长时功率谱密度的非均匀性存在固定的冗余度长时功率谱密度的非均匀性存在固定的冗余度对给定的频段利用不够充分对给定的频段利用不够充分短时功率谱
4、密度在某些频率上存在高振峰,而在另短时功率谱密度在某些频率上存在高振峰,而在另外一些频率上是低谷值外一些频率上是低谷值频谱特征主要由三个共振峰频率决定频谱特征主要由三个共振峰频率决定听觉感知机理听觉感知机理人耳有掩蔽效应人耳有掩蔽效应(masking effect)强音抑制弱音强音抑制弱音人耳对不同频段的声音敏感度不同人耳对不同频段的声音敏感度不同低频比高频更敏感低频比高频更敏感人耳对语音信号的相位不敏感人耳对语音信号的相位不敏感3.1.2 压缩编码方法分类压缩编码方法分类波形编码波形编码原理简单,失真小原理简单,失真小数码率高数码率高参量编码参量编码数码率低数码率低音质较差,复杂度高音质较差
5、,复杂度高混合编码混合编码较低的比特率上获得较高的语音质量较低的比特率上获得较高的语音质量语音编码的极限速率语音编码的极限速率语音最基本元素语音最基本元素-音素音素:大约大约128256个个通常说话速度:每秒平均发通常说话速度:每秒平均发10个音素个音素信息率:信息率: I=log2(256)10bps=80bps把发音看成是以语音速率传送,则语音编码的极限速率为把发音看成是以语音速率传送,则语音编码的极限速率为80bps80bps从数字化标准的编码速率从数字化标准的编码速率64kbps64kbps,到极限速率,到极限速率80bps80bps之间的之间的距离,压缩比可达距离,压缩比可达64kb
6、ps/80bps=80064kbps/80bps=800对于理论研究和实践有着极大的吸引力对于理论研究和实践有着极大的吸引力3.1.3 语音质量评价语音质量评价语音质量语音质量(1)广播级)广播级:宽带宽带(0-7000Hz)高质量的语音,感觉不出噪声存高质量的语音,感觉不出噪声存在在(2)网络或电话级:)网络或电话级:200Hz-3200Hz,信噪比大于信噪比大于30db。(3)通信级)通信级:完全可以听懂,但和长途电话相比,有明显失真完全可以听懂,但和长途电话相比,有明显失真。(4)合成级:)合成级:80%-90%可懂度,音质较差,听起来像机器讲话可懂度,音质较差,听起来像机器讲话,失去了
7、讲话者的个人特征。,失去了讲话者的个人特征。3.2 3.2 自适应差值脉冲自适应差值脉冲压缩编码压缩编码ADPCM是用预测编码方法来压缩数据的,结合了ADM(自适应增量调制)的差分信号和PCM的二进制码的方法,是一种性能比较好的编码方法。利用了语音信号样点间的相关性,针对语音信号非平稳特点,使用自适应预测和自适应量化3.2.1 3.2.1 差值脉冲差值脉冲编码调制的原理和自带编码编码调制的原理和自带编码DPCM原理及实现DPCM就是考虑利用语音信号的相关性找出可反映信号变化特征的一个差值量进行编码的。 差值编码一般是以预测的方式来实现的。定义:对差值序列进行量化编码的方法基本原理发端:将样值序
8、列转化为差值序列发端:将样值序列转化为差值序列 从前从前n个差值序列中估算个差值序列中估算出第出第n个样值个样值收端:将差值序列还原成样值序列收端:将差值序列还原成样值序列 预测实现当由冗余性信号的一部分就可以对区域部分进行推断和估计:预测编码:语音信号的相邻样值点间存在幅度相关性,根据前些时刻的样值来预测现时刻的样值,只要传输样值与预测值之差,不需要对每个样值都传输,降低了量化电平数。接收端把差值叠加在预测序列上,就可恢复原始序列.NississiTnTxwnTxnTx1)()()(的预测值是:图图3-1 实现预测的横截滤波器实现预测的横截滤波器图3-2是DPCM实现的原理框图。如前面所述,
9、DPCM方式的发送端就是将现有样值与预测值之差进行量化编码的方式来实现的,而在接收端为了恢复原信号也必须进行与发送端相同的预测。实现简单,但影响恢复信号质量量化误差没有累积子带编码子带编码(SBC)(SBC)是首先用带通滤波器将语音信号分割成几个是首先用带通滤波器将语音信号分割成几个不同的频带分量不同的频带分量( (子带子带) ),再分别对每个子带进行抽样和编码,再分别对每个子带进行抽样和编码。编码后的码流通过复接器复接,送到信道上传输。接收端。编码后的码流通过复接器复接,送到信道上传输。接收端再将它们分接、译码,并组合起来重建原始的输入信号。下再将它们分接、译码,并组合起来重建原始的输入信号
10、。下图就是子带编码的原理方框图。图就是子带编码的原理方框图。3.2.1.1 3.2.1.1 子带编码子带编码SBC原理与实现原理与实现 在语音信号的子带划分上,应考虑到各频段对主观听在语音信号的子带划分上,应考虑到各频段对主观听觉贡献相等的原则做合理的分配,使低频段的子带宽度较觉贡献相等的原则做合理的分配,使低频段的子带宽度较窄,高频段的子带宽度较宽。通常语音信号经带通滤波器窄,高频段的子带宽度较宽。通常语音信号经带通滤波器组滤波后分成组滤波后分成4 6个子带,子带之间允许有小的间隙,如个子带,子带之间允许有小的间隙,如图所示。图所示。子带编码比特分配与编码速率 在子带编码器的设计中,必须考虑
11、子带数目、子带划分、编码的参数、子带中的比特分配以及带宽等主要参数。 设一个子带编码系统包括m个子带,各子带带宽为Bk(k=1,m),每个子带信号经过频率为fsk=2Bk的抽样后,使用Rk个比特来进行量化和编码,那么该系统总的编码速率I应为式(3-4)mBBfkk22smkkskRfI1各子带带宽相等,即等带宽子带编码,有式(3-5)式(3-3)可化简为式(3-5)BRRmBImkk2)1(21例:一个4子带的SBC系统,子带分别为(0800Hz),(800Hz1600Hz),(1600Hz2400Hz),(2400Hz3200Hz),如果忽略同步的边带信息,子带的比特分配分别为3、2、1、0
12、比特/样值,则SBC编码系统总的传输速率为mkkRmBI12设B=3200Hz, m=4,R1=3, R2=2, R3=1, R4=0,代入上式kbit/s6 . 90123432002)(I全带抽样编码的平均比特数为mkkRmR1bit5 . 10123411)(一、自适应差值脉冲编码调制ADPCM 自适应量化的基本思想是:让量化间隔(t)的变化,与输入信号方差相匹配,即量化器阶距随输入信号的方差而变化,它正比于量化器输入信号的方差。3.2.23.2.2自适应差值脉冲编码调制自适应差值脉冲编码调制自适应差分脉码调制自适应差分脉码调制ADPCMADPCM原理自适应量化比非自适应量化的S/N改善
13、4 7dB;自适应预测使差分PCM的S/N改善达610dB,将以上两种技术结合在一起,可进一步压缩数码率。作用S/N进一步提高;在较低编码位数情况下取得满意通信质量。自适应量化自适应量化基本原理对输入信号的瞬时功率加以监 测,并随时改变量化器量化级差大小,使之“匹配”信号的变化。分类前向自适应后向自适应图图3-5前馈自适应量化前馈自适应量化ADPCM前向自适应图图3-6反馈自适应量化反馈自适应量化ADPCM后向自适应图图3-7 固定和自适应固定和自适应DPCM系统性能系统性能1. ADPCM编码标准G.7211984年ITU-T公布了G.721 32kbit/s ADPCM标准,并于1986年
14、做了进一步的修改。3.2.3 3.2.3 波形编码压缩标准波形编码压缩标准图图3-8G.721 32kbit/s ADPCM工作原理框图工作原理框图三、 单片集成ADPCM编解码器1. MC145532 ADPCM代码转换器(1) 技术特点 满足ITU-T建议G.7211988; 全双工、单信道工作; 选择引脚律或A律编码; 同步或异步工作; 容易与摩托罗拉的PCM编解码器、滤波器等接口; 串行PCM和ADPCM数据传输速率为64kbit/s5120kbit/s; 省电能力用于低电流的消耗; 简单时隙分配定时用于代码转换器; 单5V电源。(2) MC145532引脚符号与功能(3) 应用电路图
15、图2.48 MC145532引脚排列图引脚排列图图图2.49 MC145532ADPCM应用电路应用电路2. MC145540ADPCM编/解码器(1) 技术特点 单电源工作(2.75.25V); 3V时典型功耗为60mW,省电时为15W; 最小噪音的差分模拟电路设计; 完全律或A律压扩PCM编解码器滤波器; 64,32,24和16kbit/s数据率ADPCM代码转换器; 通用可编程双音频发生器; 可编程发送增益、接收增益和侧音增益; 用于与话筒接口的低噪声、高增益、三端输入运算放大器;(2) MC145540引脚符号与功能(3) 应用电路图图2.50 MC145540引脚排列图引脚排列图图图
16、2.51 MC14550手持机应用电路手持机应用电路3.3 3.3 参量编码参量编码参量编码的原理和设计思想与波形编码完全不同。波形编码的基本思路是忠实地再现话音的时域波形,为了降低比特率,可充分利用抽样点之间的信息冗余性对差分信号进行编码,在不影响话音质量的前提下,比特率可以降至32kbit/s。1.语音形成机理语音形成的大致过程可如图3-14所示。从语音信号分析可知,音素分为两类:伴有声带振动的音称为浊音;声带不振动的音称为清音。3.3.1 3.3.1 参量编码的基本原理参量编码的基本原理图图3-14 语音形成过程语音形成过程2. 浊音与基音浊音又称有声音,语音发声时声带在气流的作用下激励
17、起准周期的声波,如图3-15所示。由图可见浊音声波具有明显的准周期特性,这一准周期音称为基音,其基音周期为418ms相当于基音频率在50250Hz范围内。图3-15 语音声波波形图图图3-16 浊音频谱示意浊音频谱示意3. 清音清音又称无声音。图图3-17 清音波形图清音波形图清音没有周期特性,典型的清音波形频谱如图所示。从清音的频谱分析可知,清音中不含具有周期或准周期特性的基音及其谐波成分。图3-18 清音频谱示意4. 语音信号产生模型图图3-19 语音信号产生模型语音信号产生模型浊音清音线性预测编码(linear predictive coding,LPC)话音压缩技术。将话音生成机理模型
18、化为一个离散的、时变的、线性的递归滤波器编码时使用线性预测分析话音波形产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就可减少声音的数据量译码时使用线性预测分析得到的参数,通过话音合成器重构话音。合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的话音生成系统模型时变线性滤波器分析话音波形时,当作预测器使用合成话音波形时,当作生成模型使用3.3.23.3.2 线性预测编码(线性预测编码(LPCLPC)基本概念)基本概念线性预测器使用过去的P个样本值来预测现时刻的采样值x(n),如图3-18所示图3-18 预测概念3.3.23.3.2 线性预测编码(线性预
19、测编码(LPCLPC)基本概念)基本概念补充知识:时变数字滤波器iNiijMjjzazbGzXzSzH111)1()()()(jpjjzaGzXzSzH11)()()(零极点模型全极点模型pjjjnsanGxns1)()()(LPC差分方程预测值用过去P个样本值的线性组合表示为0( )( )( )()ppreiie nx nxna x ni121( )(1)(2)() ()preppiixna x na x na x npa x ni 为方便起见,式中采用了负号 残差误差即线性预测误差为一个线性差分方程, 在给定的时间范围里,如n0, n1,使e(n)的平方和即 102 ( )nn ne n为
20、最小,这样可使预测得到的样本值更精确。 3.3.23.3.2 线性预测编码(线性预测编码(LPCLPC)基本概念)基本概念预测系数通过求解偏微分方程,可找到系数ai的值如果把发音器官等效成滤波器,这些系数ai可以理解成滤波器的系数在接收端重构的话音不再具体复现真实话音的波形,而是合成的声音 3.3.23.3.2 线性预测编码(线性预测编码(LPCLPC)基本概念)基本概念1、 线性预测编码(LPC)声码器在发送端,原始语音输入A/D变换器,以8kHz速率抽样并变换成数字化语音。然后以每180个样值为一帧(帧周期22.5ms),以帧为处理单元逐帧进行线性预测系数分析,并作相应的清/浊音判决和基音
21、提取,最后把这些参量进行量化、编码并送入信道传送。参量预测系数ai(i=1,2,12)增益控制参量G基音周期TP清浊音判断u/v3.3.33.3.3 参数编码的声码器参数编码的声码器图图3-21 线性预测线性预测LPC编译码方框图编译码方框图在接收端,经参量解码分出参量ai、G、 TP和u/v等。G、P以及u/v用作语音信号的合成产生,ai用作形成合成滤波器的参数。最后将合成产生的数字化语音信号再经D/A变换即还原为接收端合成产生的语音信号。为了有较高的预测精度以获得满意的综合语音质量,一般每个预测系数需用11bit编码,12个系数需要1112=132bit,按10ms一帧,比特率需要14.4
22、kbps,对LPC方式显然偏高。在使用系统中采用矢量化技术降低编码速率。3.3.3-23.3.3-2 通道声码器通道声码器3.3.3-23.3.3-2 通道声码器通道声码器主要缺点主要缺点需要进行基音检测和清浊音判决,精确测量这两组数据非常困难,而其误差对合成语音质量有很大影响通道数量有限,可能几个谐波分量会落入同一通道,合成时被赋予相同的幅度,导致合成信号的频谱畸变3.3.3-33.3.3-3 共振峰声码器共振峰声码器对整体的语音信号进行分析,提取信号中共振峰的位置、幅度、带宽等参数,构成对应清音和浊音的两个声道滤波器。清音滤波器一般采用1个极点和一个零点的数字滤波器。浊音滤波器采用全极点滤
23、波器,由多个二阶滤波器级联而成比通道声码器合成的语音质量要好,比特率可以压缩得更低。3.3.43.3.4 线性预测编码标准线性预测编码标准LPC-10LPC-10LPC10:美国:美国 1976 年确定的年确定的 2.4 kbit/s 语音通信的标准技术。语音通信的标准技术。1981 年公布作为年公布作为联邦政府标准联邦政府标准 FED-STD1015。该算法可合成该算法可合成清晰清晰、可懂可懂的语音,但的语音,但抗噪能力抗噪能力和和自然度自然度欠佳。欠佳。LPC10e: 2.4 kbit/s 速率,速率,LPC10 的的增强型增强型。自自 1986 年以来,美国第三代年以来,美国第三代保密电
24、话保密电话装置采用装置采用 LPC10e。LPC10编码器框图(帧编码器框图(帧 180 个样,帧长个样,帧长 22.5 ms)帧长帧长54bit,每秒,每秒44.4帧,传输速率帧,传输速率2.4Kbit/s图图3-24LPC-10发端编码器框图发端编码器框图 数字语音输数字语音输出出预加重预加重计算分析相位计算分析相位预测器分析存储器预测器分析存储器2 阶逆滤波阶逆滤波清清/浊检测浊检测AMDF 基音提取基音提取基音及清基音及清/浊音校正浊音校正基音分析存储基音分析存储低通滤波器低通滤波器1003600Hz低通滤波低通滤波8 kHz 12bitA/D 变换变换原始语音输原始语音输入入U/V参
25、数编码参数编码误差校正和映射误差校正和映射并并/串变换及同步产生串变换及同步产生TRMS RC2 帧参数存储器帧参数存储器计算预测系数计算预测系数计算计算 RMS2 帧参数存储器帧参数存储器LPC10 声码器存在的问题(1) 损失了语音的自然度。实际语音的残差信号中,有部分既非周期脉冲又非随机噪声;或者低频段是周期脉冲,高频段是随机噪声。采用二元激励代替残差信号,使合成语音听起来不自然。(2) 抗干扰能力差。噪声环境下,基音周期和清/浊音判决不易准确提取。噪声较强时,系统性能显著恶化。LPC10 声码器存在的问题声码器存在的问题(1) 损失了语音的自然度。实际语音的残差信号中,有部分既非周期脉
26、冲又非随机噪声;或者低频段是周期脉冲,高频段是随机噪声。采用二元激励代替残差信号,使合成语音听起来不自然。(2) 抗干扰能力差。噪声环境下,基音周期和清/浊音判决不易准确提取。噪声较强时,系统性能显著恶化。图图2.62 LPAS声码器原理结构声码器原理结构2. 激励信号生成及表示激励信号的产生有如下几种:(1) 多脉冲激励(MPE)(2) 规则脉冲激励(RPE)(3) 码本激励激励信号最终要量化后以二进制的形式发送出去。量化有两种类型。一种是标量量化,也就是对每个参数独立地进行量化,然后通过组合确定参数集。另一种是矢量量化,也就是将所有参数组合起来作为一个整体进行量化,在数学上就用矢量来表示参
27、数的组合。第五节第五节 GSMGSM及及IPIP电话系统语音编码技术的应用电话系统语音编码技术的应用及标准及标准一、 G.728声码器G.728是16kbit/s的LPAS声码器,采用低时延码本激励线性预测(LD-CELP)方式。1. G.728编码器G.728的LD-CELP编码器的简化结构如图2.63所示。图图2.63 G.728编码器结构编码器结构2. G.728解码器图图2.64G.728解码器结构解码器结构二、 G.729声码器1. G.729声码器性能特点G.729是8kbit/s的LPAS声码器,线性预测采用前馈型前向自适应技术。2. G.729编码器G.729编码器如图2.65
28、所示。模拟话音信号经话带滤波后,按8kHz频率抽样并变换成16bit线性PCM信号,这就是图中编码器的输入话音信号。图图2.65 G.729编码器结构编码器结构3. G.729解码器图图2.66 G.729解码器结构解码器结构三、 G.723.1声码器G.723.1是双速率LPAS声码,低速率的编码比特率为5.3kbit/s,高速率为6.3kbit/s,线性预测也是采用前馈型前向自适应,并使用了预视技术。LPC声码器性能不佳的主要原因不在于声道模型本省,而在于对激励信号的表示过于简单,因为只是采用了清音和浊音两种激励源。 混合编码多以线性预测编码(LPC)为基础,依据对激励信息的不同处理。3.
29、43.4 混合编码混合编码合成分析法(ABS)的基本思想是用合成来指导分析。将合成器引入编码瑞,使之与分析器相结合,在编码器中产生与译码器端完全一致的合成语音,将此合成语音与原始语音相比较,根据一定的误差准则调整计算各个参数,使得二者之间的误差达到最小。将误差最小时的系统参数传送到接收端,可以合成较高质量的语音。3.4.1 3.4.1 混合编码的基本概念混合编码的基本概念AbSLPCAbSLPC AbSLPCAbSLPC编码方法编码方法缓存一帧语音采样值通道LPC分析得到一组LPC系数。通过LPC逆滤波计算不量化的残差信号。由于LPC分析帧通常较长,确定激励信号时需要把一帧分成几个子帧。对每个
30、子帧计算基音滤波器(长时预测器)参数。将基音和LPC合成滤波器级联起来,选择最佳激励信号。接收端根据收到的码字或数据求得最佳激励信号,通过级联滤波器产生与原始语音误差最小的合成语音。 多脉冲线性预测编码器(MP-LPC)规则脉冲激励线性预测编码器(RPE-LPC)码激励线性预测编码器(CELP)混合激励线性预测编码器(MELP)3.4.2 3.4.2 混合编码的编码方法混合编码的编码方法多脉冲线性预测编码 (MP-LPC)多脉冲线性预测编码 (multipluse linear predictive coding, MP-LPC):对清音/浊音,用有限个脉冲经过最优估值后作为激励信号源脉冲的间
31、隔根据不同码本的模式决定分析过程:混合编码对每帧原始语音先用 LP 分析方法计算 LP 系数,然后对当前帧的子帧用合成分析法估计一次激励脉冲将激励脉冲输入到合成器中,得到合成语音将合成语音与原始语音相减,得到误差信号并输入到感觉加权滤波器,得到加权误差信号根据最小加权均方误差准则,分析出一组位置、幅度最佳的激励脉冲,然后最佳激励索引与 LP 系数一起编码送入信道多脉冲线性预测编、解码器激励发生器LPC综合滤波器多脉冲信息输出合成语音线性预测系数激励发生器线性预测综合滤波器合成器均方误差最小估值感觉加权滤波LP 分析传送至信道的多脉冲信息原始语音信号+-编码器编码器解码器解码器多脉冲线性预测编码
32、的变种码激励线性预测编码(Code-Excited Linear Prediction, CELP):矢量量化码本中的码字作为激励源对每帧,计算最佳匹配的激励矢量美国联邦标准 FS1016G.728 标准规则脉冲激励线性预测(RPE-LPC)激励码字中,非零值规则出现 规则脉冲激励非零值可为多个不同的值RPE- LTC(长时间预测):GSM 标准,13kbps规则脉冲激励线性预测编码器激励发生器LPC综合滤波器规则脉冲序列输出合成语音线性预测系数ai激励发生器均方误差最小估值感觉加权滤波A(z)规则脉冲序列原始语音信号x(n)-+编码器编码器解码器解码器r(n)e(n)码激励线性预测编码(Co
33、de-Excited Linear Prediction, CELP)CELP:矢量量化 + 线性预测码本中每个码矢量代替余量信号作为可能的激励信号源在编码时对码本中的码矢量逐个搜索,找到与输入语音误差最小的合成语音的激励码矢量,将这个码矢量的索引传送给接收端在接收端用存储的同样码本,根据收到的码本索引恢复出相应的码矢量作为激励 4.816kb/s 范围内可以得到质量相当高的合成语音,并且抗噪声和多次转接性能也比较好。然而当速率进一步降低时,由于没有足够的比特表示激励矢量,余量的量化将产生较大的误差,致使合成语音质量迅速下降CELP 声码器码本:自适应码本:逼近语音的长时周期性(基音)结构固定
34、的随机码本:语音的经过短时、长时预测后的余量信号从两个码本中搜索出来的最佳码矢量,乘以各自的最佳增益后相加,其和就是 CELP 激励信号源将激励信号经过 M 阶 LP 综合滤波器,得到合成语音信号合成语音信号与原始语音信号的误差经过感觉加权滤波器,得到感觉加权误差 e(n)。CELP 用感觉加权的最小平方预测误差作为搜索最佳码矢量及其幅度的度量准则,使得感觉加权误差平方最小的码矢量就是最佳码矢量。CELP 声码器用一个自适应码本中的码字来逼近语音的长时周期性(基音)结构。用一个固定的随机码本中的码字来逼近语音的经过短时、长时预测后的余量信号。CELP 声码器计算速度的提高自适应码本和随机码本的
35、搜索过程在本质上是一致的,不同之处在于码本结构和目标矢量的差别为了减少计算复杂性,自适应码本和随机码本的搜索分为两级顺序进行:第一级自适应码本搜索的目标矢量是加权 LP 余量信号第二级随机码本搜索的目标矢量是第一级搜索的目标码本减去自适应码本搜索得到的最佳码矢量激励综合加权滤波取得结果CELP 编码器的计算量主要是对码本中最佳码矢量及幅度的搜索混合激励线性预测(mixed excitation linear predication, MELP)采用更复杂的方式产生激励:多带混合激励语音分为清音、浊音和抖动浊音三种状态浊音:周期脉冲 + 白噪声抖动浊音:非周期脉冲 + 白噪声2.4kbs 的 M
36、ELP 编码方法已经被确定为美国新的联邦语音编码标准编码速率为 2.4kbps,帧长为 22.5ms,每帧数据用 54bit 进行编码在低码率下的合成语音的自然度大大提高,主观语音质量接近美国联邦 4800bps 的 CELPMELP 声码器MELP 以 LPC 参数模型为基础,但新增五大特点:分带混合激励使用非周期脉冲自适应谱增强技术脉冲离散滤波Fourier 幅度模型3.53.5 低速率语音压缩编码的应用低速率语音压缩编码的应用IP电话电话信道扩容信道扩容保密通信保密通信个人移动通信个人移动通信语音存储语音存储多媒体通信多媒体通信1 IP电话的定义: IP电话是在IP网上传送的具有一定质量的语音业务。它采用的技术统称Volp(Voice over IP),即在IP网上传送语音。由于计算机网络采用的是分组交换技术,其传送的数据单元都是由控制部分和数据部分封装而成的独立的数据包,通常称之为“分组”(Packet),因此从更一般的意义上来说,IP电话是采用分组技术传送的语音业务。用分组网络传输语音主要有三种方式:帧中继语音技术、ATM语音技术和IP语音技术,其中IP语音技术应用得最为广泛。3.5.1 IP3.5.1 IP电话系统技术简介电话系统技术简介1. PC到PC PC到
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全国电子工业版初中信息技术第一册第2单元2.3活动3《了解电子邮件传输协议》教学实录
- 临沂房产借款合同范例
- 2025年南充a2驾驶证货运从业资格证模拟考试
- 2025年三亚c1货运从业资格证模拟考试题
- 特殊工种应聘合同范例
- 月饼券订购合同范例
- 买房中介返现合同范例
- 店铺铺面合同范例
- 产品保本合同范例
- 唐山职业技术学院《工程经济学与管理》2023-2024学年第一学期期末试卷
- 在线网课知慧《中学政治教学论(渭南师范学院)》单元测试考核答案
- 国开2024年《机械设计基础》形考任务1-4答案
- 公路工程设计设计的质量保证措施、进度保证措施
- GB/T 43786-2024音频、视频和信息技术设备生产过程中的例行电气安全试验
- XXX加油站安全验收评价报告
- 超市经营管理方案
- 开源情报行业分析
- 物业企业安全风险管控责任清单
- 4.5.1 函数的零点与方程的解(九大题型)(解析版)
- 2024年江西生物科技职业学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 柜长管理方案
评论
0/150
提交评论