手机通信补充材料class课件_第1页
手机通信补充材料class课件_第2页
手机通信补充材料class课件_第3页
手机通信补充材料class课件_第4页
手机通信补充材料class课件_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

移动电话通信原理补充移动电话通信原理补充11.1蜂窝移动系统概述1.2数字通信流程1.3多址接入1.1蜂窝移动系统概述1.2数字通信流程1.3多址接入2一、基本概念起源于美国的贝尔系统模拟移动通信系统:AMPS、TACS、CMTS、NMT

蜂窝与微蜂窝技术:高容量、小区、频率复用

PSTN、MTSO(MSC)、BSS、MS1.1蜂窝移动系统概述一、基本概念1.1蜂窝移动系统概述3移动网络与PSTN连接漫游移动网络与PSTN连接4二、数字移动通信系统基本组成市话局交换子系统NSS基站子系统BSS操作维护系统OMSMS固定电话网移动通信系统二、数字移动通信系统基本组成二、数字移动通信系统基本组成市话局交换子系统NSS基站子系统5信道化扩频通信保密、抗干扰信道化63、数字信号射频化无线电波携带信息的手段——相位、频率、幅度一级调制——QPSK、GMSKIQ信号高频电磁波3、数字信号射频化一级调制——QPSK、GMSK7手机通信补充材料class课件8多址技术即区分信道或用户的技术,使众多的用户共用公共的通信线路,扩大了通信容量实现多址的基本方法:FrequencyDivisionMultipleAccessTimeDivisionMultipleAccessCodeDivisionMultipleAccess实际中混合多址1.3多址接入多址技术即区分信道或用户的技术,使众多的用户共用公共的通信线9频分多址频分多址是将给定的频谱资源划分为若干个等间隔的频道(或称信道)供不同的用户使用频道互不重叠,其宽度仅能传输一路话音或数据信息相邻信道无明显串扰一般情况是,基站的发射频率高,其接收频率低任意两个移动用户之间进行通信都必须经过基站的中转无线广播第一代移动通信系统频分多址频分多址是将给定的频谱资源划分为若干个等间隔的频道(10FDMA的频道划分方法

FDMA的频道划分方法11时分多址TDMA是将每个频带信道分割成若干个时隙(时间片),然后把每个时隙再分配给每个用户方法:把时间分割成周期性的帧,每一帧再分割成若干个时隙无论是帧或时隙都是互不重叠的TDMA系统根据一定的时隙分配原则,使移动台和基站之间在每帧内只能按指定的时隙进行通信不同的移动台共用一个频率,但各个移动台占用的时间不同,即各移动台占用不同的“时隙”,分时通信第二代移动通信系统时分多址TDMA是将每个频带信道分割成若干个时隙(时间片),12TDMA示意图TDMA示意图13码分多址不同用户传输信息所用的信号不是靠频率不同或时隙不同来区分,而是用不同的编码序列来区分,或者说,靠信号的不同波形来区分从频域或时域观察,CDMA信号是相互重叠的!CDMA的关键是所用扩频码有多少个不同的互相正交的码序列,就有多少个不同的地址码,也就有多少个码分信道TDMA、FDMA的特点是为提高通信容量尽力压缩带宽;而CDMA不是扩频通信技术码分多址不同用户传输信息所用的信号不是靠频率不同或时隙不同来14CDMA示意图CDMA示意图15ENDEND16VoIP中的语音编码技术分析(2009-04-0110:38:00)标签:杂谈

随着互联网的迅速发展,出现了一种基于Internet的电话新业务——VoIP业务。VoIP(VoiceoverIP,基于IP的语音通信)也称为IP电话,是建立在Internet上的新型数字化传输技术。VoIP的使用,可以极大地降低用户的通信费用,而互联网的蓬勃发展也促进VoIP技术的迅猛发展。VoIP网络电话的成功开发和应用,预示了以IP为基础的新一代信息网络的出现,积极地探索和跟踪这项新技术无疑具有十分重要的意义。

1语音编码的原理

为使VoIP网络电话能够可靠地进行语音通信,必须解决好两个问题:一是在保证一定话音质量的前提下尽可能地降低编码比特率,二是在IP网络环境下保证一定的通话质量。前者正是我们要探讨的语音编码技术,同一段语音信号,采用不同的编码方式,其编码后的比特率各不相同。那么如何对语音信号进行压缩编码从而达到降低语音信号的比特率呢?

1.1利用了语音信号的相关性

语音信号主要存在两方面的冗余度,即语音信号幅度分布的非均匀性和样本之间的相关性。非均匀性表现为小幅度语音信号出现的概率大而大幅度语音信号出现的概率小,非均匀量化技术正是针对语音信号的这一特点而提出的,例如ADPCM编码算法;样本之间的相关性表现为样本点之间的短时相关性和相邻基音周期之间的长时相关性,利用语音信号的相关性,可以在实现低速率编码时,也能保持较高的语音编码质量,例如线性预测算法就是利用这一原理。

1.2利用了人耳的听觉特性

人耳对语音信号的听觉特性表现在3个方面:一是人耳对语音信号的分辨率有限;二是人耳对语音信号某些失真不是很敏感;三是人耳的掩蔽效应。低速率高品质语音编码算法的实现就是基于人耳的这些听觉特性,既可以保证人耳感觉不到语音质量的下降,又降低了语音编码速率。

1.3静音压缩

测试表明,人在正常谈话时,有50%左右是静音,而静音信息只需很少几个参数(4字节/帧)来表示。静音编码主要由两个算法组成:语音检测(VoiceActivityDetectionVAD)和柔和噪声再生(ComfortNoiseGenerator

CNG)。VAD是用来检测输入的信号是实际语音信号还是背景噪声。如果检测到是语音信号,则对语音信号进行固定速率的编码;如果输入信号被检测为背景噪声,编码器则对其进行低速率编码。CNG的作用是在话音信号的接收端重构背景噪声。在G.723.1编码器中引入静音压缩技术后,实际的平均编码速率要小于5.3kb/s,可以达到3.5kb/s以下。VoIP网络电话中已被广泛使用的线性预测合成分析编码就是基于此项原理的应用。

2语音编码技术的分类

根据语音编码的发展过程,我们把该技术归纳为以下3类:

2.1波形编码(或称为非参数编码)

波形编解码器基本上不考虑信号是如何产生的,而直接将输入的模拟信号抽样编码,然后将量化后的样值传送到终端,在终端原始信号被重组到与原信号大致接近的程度。因此波形编码方式是能够忠实地表现波形的编码方式。由于这类编码器通常将语音信号作为一般的波形信号来处理,所以它具有适应能力强、话音质量好、抗噪抗误码的能力强等特点,它最大的缺点是同其他的编解码器相比,它要使用大量的带宽,当波形编解码器用于低带宽时,话音质量下降得非常快。

脉冲编码调制(PCM)、自适应增量调制(ADM或ΔM编码)、自适应差分编码(ADPCM)、自适应预测编码(APC)、自适应子带编码(ASBC)、自适应变换编码(ATC)等都属于波形编码。

2.2参数编码(或称为模型编码或声码化编码)

参数编码是根据声音的形成模型,把声音变换成参数的编码方式。其基本方法是通过对语音信号特征参数的提取及编码,力图使重建语音信号具有尽可能的可懂性,即保持原语音的语义。而重建的信号波形同原语音信号的波形可能会有相当大的差别。由于参数编码是保护语声模型,重建清晰可识别的语声,而不注重波形的拟合,所以这类编码技术实现的是合成语声质量下的低速或极低速的编码。参数编码的优点是:编码速率低,编码速率通常小于4.8kb/s,可以低至600b/s~2.4kb/s;缺点是:合成语音质量差,特别是自然度较低,连熟人之间都不一定能听出讲话人是谁。另外,这类编码器对讲话环境噪声较敏感,需要安静的讲话环境才能给出较高的可懂度,且时延大。

线性预测编码(LPC)、多带激励(MBE)编码、余弦变换编码(STC)均属参数编码。

2.3混合编码

混合编码是将波形编码与参数编码结合而产生的一种编码方式。采用线性技术构成声道模型,不只传输预测参数和清浊音信息,而是将预测误差信息和预测参数同时传输,在接收端构成新的激励减去激励预测参数构成的合成滤波器,使得合成滤波器输出的信号波形与原始语声信号的波形最大程度地拟合,从而获得自然度较高的语声。混合编码克服了原有波形编码器与声码器的弱点,结合了它们的优点,在4kb/s~16kb/s速率上能够得到高质量合成语音,在本质上具有波形编码的优点,有一定抗噪和抗误码的性能,但时延较大。

多脉冲线性预测编码(MPLPC)、规则脉冲激励线性预测编码(RPELPC)、码激励线性预测编码(CELPC)、低时延的码激励线性预测编码(LD-CELPC)等都属于混合编码。

3VoIP中常用语音编码算法的性能分析和比较

3.1G.711协议

G.711是在电路交换电话网中普遍使用的一种波形编解码算法。G.711以8kHz作为抽样频率,如果使用统一量化方式,话音中通用的信号层次的每一个样本就要12比特来表示,这就产生了96kb/s的比特速率。如果使用不统一的量化方式,表示一个样本只需要8比特。G.711通常被称为PCM(脉冲编码调制)。

G.711有A律和u律两个变型,两者之间的区别主要在于不统一量化的使用方式,两者都是关于0对称。对于较低的信号层次来讲,A律对于信号的歪曲程度比u律更小一些,这是因为它对一个较大范围内的低层次信号提供较小的量化间隔,但以较大范围内的高层信号的较大量化层次为代价。A律和u律都提供了良好的语音质量,并且Mos等级都在4.3左右。

3.2G.723协议

G.723协议是一个双速率语音编码协议,其两种速率分别是5.3kb/s和6.3kb/s,较高比特率的输出基于ML-MLQ技术,提供某种程度上较高质量的音质;较低速率的输出基于CELP,为系统设计人员提供了更大的灵活性。G.723.1协议的编解码算法中两种速率的编解码基本原理是一样的,只是激励信号的量化方法有差别。对高速率(6.3kb/s)编码器,其激励信号采用多脉冲最大似然量化(MP-MLQ)法进行量化,对低速率(5.3kb/s)编码器,其激励信号采用代数码激码线性预测(ACELP)法量化。

编码过程是首先选速率为64kb/s的PCM语音信号转化成均匀量化的PCM信号,然后把输入语音信号的每240个样点组成一个帧,也就是30ms的帧长。每个帧通过高通滤波器后再分为4个子帧。对于每个子帧,计算出10阶线性预测滤波器的系数。为了适于矢量量化,把预测系数转化为线性频谱对(LineSpectrumPair,LSP),然后进行矢量量化。量化前的系数构成短时感觉加权滤波器,原始语音信号经过该滤波器得到感觉加权语音信号。对于每两个子帧,编码器用感觉加权语音信号求得开环基音周期,基音周期范围从18个样点到142个样点。此后编码器所进行的操作都是基于60个样点进行的。由开环基音周期和感觉加权是在开环基音周期点周围的一定范围内求得的。最后,激励信号被量化,然后把这些参数和激励信号量化结果传送到解码器。由于帧长为30ms,并存在另外的7.5ms的前向延迟,导致37.5ms总的编码延迟。

G.723协议适用于低速率多媒体服务中语音或音频信号的压缩算法,在IP电话网关中,被用来实现实时语音编码解码处理。

3.3G.726协议

G.726协议采用的是ADPCM语音编码算法,提供了64kb/sPCM码流至低速率ADPCM码流的转换。协议给出40kb/s,32kb/s,24kb/s和16kb/s4种比特率。其中,40kb/s信道主要用于在数字电路倍增设备(DCME)上传送数据modem信号,特别用于4.8kb/s以上速率的modem;24kb/s和16kb/s信道主要用作DCME语音传送的过载信道。G.726设计的主要用途仍然是传统的电路交换网,但是其低比特率方案也可用于VoIP。

3.4G.728协议

G.728协议采用的编码算法是LD-CELP,即低时延的码激励线性预测的算法。LD-CELP采用后向自适应预测器(BackwordAdaptivePredictor)对短时谱和增益进行预测。LD-CELP编码器发送的只是激励矢量在码本中的地址标号,而解码端的滤波器参数和增益参数都是在解码端计算得来的。在大多数编码系统中,这类参数都是在编码端求得,然后传输到解码端。

编码过程是首先将速率为64kb/s的PCM输入信号转化成均匀量化的PCM信号,接着由5个连续的语音样点组成一个5维矢量,激励码本中共有1024个5维矢量。对每一个输入矢量,编码器利用合成—分析法从码本中搜索出最佳码本矢量,然后将10比特的码本标号传给对方。每20个样点构成一个复帧,一个复帧构成一个自适应周期,每复帧更新一次LP系数。最佳码本矢量通过增益加权和合成滤波器后形成合成语音,该合成语音用来更新滤波器状态,以便继续为下一个输入矢量进行编码。合成滤波器系数和增益分别通过各自的后向自适应单元进行周期性地更新。

3.5G.729协议

G.729协议是一个能在8kb/s速率上实现高质量语音编码的协议,它采用的是CS-ACELP即共轭结构算术码激励线性预测的算法。CS-ACELP以CELP编码模型为基础,它把语音分成帧,每帧10ms,也就是80个采样点。对于每一帧语音,编码器从中分析出CELP模型参数,其中包括线性预测系数,自适应码本和随机码本的索引值和增益,然后把这些参数传送到解码端,解码器利用这些参数构成激励源和合成滤波器,从而重现原始语音。

编码过程是首先将速率为64kb/s的PCM语音信号转化成均匀量化的PCM信号,通过高通滤波器后,把输入语音信号的每80个样点组成一个帧,也就是10ms的帧长。对于每个帧用线性预测法求得LP滤波器系数,为了适于矢量量化,把预测系数转化为线谱对,然后进行矢量量化。利用合成—分析方法,使原始语音和合成语音之间的误差最小,来获得最佳激励信号。激励信号的量化是通过两个码本来实现的,即自适应码本和随机码本。自适应码本反映的是长时预测结果,也就是基音预测结果。随机码本反映的是经过长时预测和短时预测后的残留信号。

在IP电话网关中,G.729协议被用来实现实时语音编码处理。

3.6VoIP常用语音编码算法的性能分析和比较

从表1可以看出:G.711由于采用的是波形编码算法,具有高质量和低时延的语音,主要的缺点是需要64kb/s的带宽。G.723.1,G728,G.729都采用了混合编码算法,混合编码把激励模型和语音的时域波形结合到一起,从而改善了合成语音的质量。但这3种语音压缩编码算法的区别在于激励模型的不同。G.723.1Mos值约为3.8,优点在于仅需要很窄的语音带宽便可具有较高的语音质量;缺点在于在编码器一端至少有37.5ms的时延。G.728最大的优点是它能提供高质量和低时延的语音。

4结语

语音编码技术是建立和处理VoIP网络电话的原动力,可以预见,随着互联网技术的发展,原来G.711的64kb/s语音编码算法最终会被淘汰,并由低比特率编码算法所替代。

VoIP中的语音编码技术分析(2009-04-0110:317频率复用——通用功率控制RAKE接收机CDMA切换1.4CDMA的特征和优势频率复用——通用1.4CDMA的特征和优势18功率控制克服远近效应功率控制19手机通信补充材料class课件20RAKE接收机克服多径干扰RAKE接收机21CDMA切换一个呼叫从一个小区转移到另一个小区的处理过程保持通信的连续性软切换、空闲切换、硬切换CDMA切换22CDMA优点系统具有软容量(取决于扩频码的数量)多媒体通信(宽带特性)语音质量高(可采用冗余度高的纠错编码)无需防护间隔实现软切换保密性强低功耗(功率控制,仅仅为TDMA平均功率的十分之一)建网成本低CDMA优点系统具有软容量(取决于扩频码的数量)231.5呼叫处理阶段初始化空闲模式接入模式通话模式1.5呼叫处理阶段初始化24通用移动通信系统WCDMACDMA2000TD-SCDMA1.6UMTS简介1.6UMTS简介253G的目标全球漫游多种无线技术的融合/并存网络技术的多元化/分层化发展频率资源的一致性业务的宽代化/智能化/个性化/多样化便于过渡和演进多频多模终端卫星系统宏蜂窝微蜂窝城区室内微微蜂窝全球郊区3G的目标全球漫游卫星系统宏蜂窝微蜂窝城区室内微微蜂窝全球郊261、WCDMA技术由爱立信、诺基亚等欧洲设备制造商提出的基于CDMA扩频技术的IMT2000CDMAFDD技术充分考虑现有GSM系统的后向兼容性WCDMA的技术特点可适应多种速率的传输,灵活地提供多种业务基站之间无需同步优化的分组数据传输方式支持不同载频之间的切换上、下行快速功率控制反向采用导频辅助的相干检测(提高反向解调增益,提高功率控制准确性)充分考虑了信号设计对EMC的影响1、WCDMA技术272、CDMA2000技术北美的LUCENT、MOTOROLA、NORTEL、QUALCOMM公司以及韩国SAMSUNG等公司联合提出的基于IS-95的IMT2000CDMAFDD标准充分考虑现有窄带CDMA系统的后向兼容性沿用IS-95的主要技术思路,如帧长20ms,采用IS-95的软切换和功率控制技术,需要GPS同步等。但也做了一些实质性的改进,主要有:反向信道采用连续导频方式反向信道相干接收前向发送分集全部速率采用CRC方式充分考虑了信号设计对EMC的影响2、CDMA2000技术283、TD-SCDMA技术中国提出的具有自主知识产权的IMT2000CDMATDD技术主要特点:能使用各种频率资源,不需要成对的频率适用于不对称的上下行数据产生速率,特别适用于IP型的数据业务上下行工作于同一频率,对称的电波传播特性使之便于使用智能天线等新技术,达到提高性能、降低成本的目的设备成本可能比FDD系统低20-50%3、TD-SCDMA技术29第一章小结移动通信系统组成数字通信流程话音信号处理模拟信号/数字信号转换数字信号射频化移动通信的多址接入方式和各自特点CDMA的特征和优势频率复用——通用功率控制——克服远近效应RAKE接收机——克服多径干扰CDMA切换——实现通信的连续性呼叫处理阶段UMTS简介作业:Page21:1,6,7,8第一章小结移动通信系统组成CDMA的特征和优势作业:Page30/mo/wwwThankYou!/mo/ww31移动电话通信原理补充移动电话通信原理补充321.1蜂窝移动系统概述1.2数字通信流程1.3多址接入1.1蜂窝移动系统概述1.2数字通信流程1.3多址接入33一、基本概念起源于美国的贝尔系统模拟移动通信系统:AMPS、TACS、CMTS、NMT

蜂窝与微蜂窝技术:高容量、小区、频率复用

PSTN、MTSO(MSC)、BSS、MS1.1蜂窝移动系统概述一、基本概念1.1蜂窝移动系统概述34移动网络与PSTN连接漫游移动网络与PSTN连接35二、数字移动通信系统基本组成市话局交换子系统NSS基站子系统BSS操作维护系统OMSMS固定电话网移动通信系统二、数字移动通信系统基本组成二、数字移动通信系统基本组成市话局交换子系统NSS基站子系统36信道化扩频通信保密、抗干扰信道化373、数字信号射频化无线电波携带信息的手段——相位、频率、幅度一级调制——QPSK、GMSKIQ信号高频电磁波3、数字信号射频化一级调制——QPSK、GMSK38手机通信补充材料class课件39多址技术即区分信道或用户的技术,使众多的用户共用公共的通信线路,扩大了通信容量实现多址的基本方法:FrequencyDivisionMultipleAccessTimeDivisionMultipleAccessCodeDivisionMultipleAccess实际中混合多址1.3多址接入多址技术即区分信道或用户的技术,使众多的用户共用公共的通信线40频分多址频分多址是将给定的频谱资源划分为若干个等间隔的频道(或称信道)供不同的用户使用频道互不重叠,其宽度仅能传输一路话音或数据信息相邻信道无明显串扰一般情况是,基站的发射频率高,其接收频率低任意两个移动用户之间进行通信都必须经过基站的中转无线广播第一代移动通信系统频分多址频分多址是将给定的频谱资源划分为若干个等间隔的频道(41FDMA的频道划分方法

FDMA的频道划分方法42时分多址TDMA是将每个频带信道分割成若干个时隙(时间片),然后把每个时隙再分配给每个用户方法:把时间分割成周期性的帧,每一帧再分割成若干个时隙无论是帧或时隙都是互不重叠的TDMA系统根据一定的时隙分配原则,使移动台和基站之间在每帧内只能按指定的时隙进行通信不同的移动台共用一个频率,但各个移动台占用的时间不同,即各移动台占用不同的“时隙”,分时通信第二代移动通信系统时分多址TDMA是将每个频带信道分割成若干个时隙(时间片),43TDMA示意图TDMA示意图44码分多址不同用户传输信息所用的信号不是靠频率不同或时隙不同来区分,而是用不同的编码序列来区分,或者说,靠信号的不同波形来区分从频域或时域观察,CDMA信号是相互重叠的!CDMA的关键是所用扩频码有多少个不同的互相正交的码序列,就有多少个不同的地址码,也就有多少个码分信道TDMA、FDMA的特点是为提高通信容量尽力压缩带宽;而CDMA不是扩频通信技术码分多址不同用户传输信息所用的信号不是靠频率不同或时隙不同来45CDMA示意图CDMA示意图46ENDEND47VoIP中的语音编码技术分析(2009-04-0110:38:00)标签:杂谈

随着互联网的迅速发展,出现了一种基于Internet的电话新业务——VoIP业务。VoIP(VoiceoverIP,基于IP的语音通信)也称为IP电话,是建立在Internet上的新型数字化传输技术。VoIP的使用,可以极大地降低用户的通信费用,而互联网的蓬勃发展也促进VoIP技术的迅猛发展。VoIP网络电话的成功开发和应用,预示了以IP为基础的新一代信息网络的出现,积极地探索和跟踪这项新技术无疑具有十分重要的意义。

1语音编码的原理

为使VoIP网络电话能够可靠地进行语音通信,必须解决好两个问题:一是在保证一定话音质量的前提下尽可能地降低编码比特率,二是在IP网络环境下保证一定的通话质量。前者正是我们要探讨的语音编码技术,同一段语音信号,采用不同的编码方式,其编码后的比特率各不相同。那么如何对语音信号进行压缩编码从而达到降低语音信号的比特率呢?

1.1利用了语音信号的相关性

语音信号主要存在两方面的冗余度,即语音信号幅度分布的非均匀性和样本之间的相关性。非均匀性表现为小幅度语音信号出现的概率大而大幅度语音信号出现的概率小,非均匀量化技术正是针对语音信号的这一特点而提出的,例如ADPCM编码算法;样本之间的相关性表现为样本点之间的短时相关性和相邻基音周期之间的长时相关性,利用语音信号的相关性,可以在实现低速率编码时,也能保持较高的语音编码质量,例如线性预测算法就是利用这一原理。

1.2利用了人耳的听觉特性

人耳对语音信号的听觉特性表现在3个方面:一是人耳对语音信号的分辨率有限;二是人耳对语音信号某些失真不是很敏感;三是人耳的掩蔽效应。低速率高品质语音编码算法的实现就是基于人耳的这些听觉特性,既可以保证人耳感觉不到语音质量的下降,又降低了语音编码速率。

1.3静音压缩

测试表明,人在正常谈话时,有50%左右是静音,而静音信息只需很少几个参数(4字节/帧)来表示。静音编码主要由两个算法组成:语音检测(VoiceActivityDetectionVAD)和柔和噪声再生(ComfortNoiseGenerator

CNG)。VAD是用来检测输入的信号是实际语音信号还是背景噪声。如果检测到是语音信号,则对语音信号进行固定速率的编码;如果输入信号被检测为背景噪声,编码器则对其进行低速率编码。CNG的作用是在话音信号的接收端重构背景噪声。在G.723.1编码器中引入静音压缩技术后,实际的平均编码速率要小于5.3kb/s,可以达到3.5kb/s以下。VoIP网络电话中已被广泛使用的线性预测合成分析编码就是基于此项原理的应用。

2语音编码技术的分类

根据语音编码的发展过程,我们把该技术归纳为以下3类:

2.1波形编码(或称为非参数编码)

波形编解码器基本上不考虑信号是如何产生的,而直接将输入的模拟信号抽样编码,然后将量化后的样值传送到终端,在终端原始信号被重组到与原信号大致接近的程度。因此波形编码方式是能够忠实地表现波形的编码方式。由于这类编码器通常将语音信号作为一般的波形信号来处理,所以它具有适应能力强、话音质量好、抗噪抗误码的能力强等特点,它最大的缺点是同其他的编解码器相比,它要使用大量的带宽,当波形编解码器用于低带宽时,话音质量下降得非常快。

脉冲编码调制(PCM)、自适应增量调制(ADM或ΔM编码)、自适应差分编码(ADPCM)、自适应预测编码(APC)、自适应子带编码(ASBC)、自适应变换编码(ATC)等都属于波形编码。

2.2参数编码(或称为模型编码或声码化编码)

参数编码是根据声音的形成模型,把声音变换成参数的编码方式。其基本方法是通过对语音信号特征参数的提取及编码,力图使重建语音信号具有尽可能的可懂性,即保持原语音的语义。而重建的信号波形同原语音信号的波形可能会有相当大的差别。由于参数编码是保护语声模型,重建清晰可识别的语声,而不注重波形的拟合,所以这类编码技术实现的是合成语声质量下的低速或极低速的编码。参数编码的优点是:编码速率低,编码速率通常小于4.8kb/s,可以低至600b/s~2.4kb/s;缺点是:合成语音质量差,特别是自然度较低,连熟人之间都不一定能听出讲话人是谁。另外,这类编码器对讲话环境噪声较敏感,需要安静的讲话环境才能给出较高的可懂度,且时延大。

线性预测编码(LPC)、多带激励(MBE)编码、余弦变换编码(STC)均属参数编码。

2.3混合编码

混合编码是将波形编码与参数编码结合而产生的一种编码方式。采用线性技术构成声道模型,不只传输预测参数和清浊音信息,而是将预测误差信息和预测参数同时传输,在接收端构成新的激励减去激励预测参数构成的合成滤波器,使得合成滤波器输出的信号波形与原始语声信号的波形最大程度地拟合,从而获得自然度较高的语声。混合编码克服了原有波形编码器与声码器的弱点,结合了它们的优点,在4kb/s~16kb/s速率上能够得到高质量合成语音,在本质上具有波形编码的优点,有一定抗噪和抗误码的性能,但时延较大。

多脉冲线性预测编码(MPLPC)、规则脉冲激励线性预测编码(RPELPC)、码激励线性预测编码(CELPC)、低时延的码激励线性预测编码(LD-CELPC)等都属于混合编码。

3VoIP中常用语音编码算法的性能分析和比较

3.1G.711协议

G.711是在电路交换电话网中普遍使用的一种波形编解码算法。G.711以8kHz作为抽样频率,如果使用统一量化方式,话音中通用的信号层次的每一个样本就要12比特来表示,这就产生了96kb/s的比特速率。如果使用不统一的量化方式,表示一个样本只需要8比特。G.711通常被称为PCM(脉冲编码调制)。

G.711有A律和u律两个变型,两者之间的区别主要在于不统一量化的使用方式,两者都是关于0对称。对于较低的信号层次来讲,A律对于信号的歪曲程度比u律更小一些,这是因为它对一个较大范围内的低层次信号提供较小的量化间隔,但以较大范围内的高层信号的较大量化层次为代价。A律和u律都提供了良好的语音质量,并且Mos等级都在4.3左右。

3.2G.723协议

G.723协议是一个双速率语音编码协议,其两种速率分别是5.3kb/s和6.3kb/s,较高比特率的输出基于ML-MLQ技术,提供某种程度上较高质量的音质;较低速率的输出基于CELP,为系统设计人员提供了更大的灵活性。G.723.1协议的编解码算法中两种速率的编解码基本原理是一样的,只是激励信号的量化方法有差别。对高速率(6.3kb/s)编码器,其激励信号采用多脉冲最大似然量化(MP-MLQ)法进行量化,对低速率(5.3kb/s)编码器,其激励信号采用代数码激码线性预测(ACELP)法量化。

编码过程是首先选速率为64kb/s的PCM语音信号转化成均匀量化的PCM信号,然后把输入语音信号的每240个样点组成一个帧,也就是30ms的帧长。每个帧通过高通滤波器后再分为4个子帧。对于每个子帧,计算出10阶线性预测滤波器的系数。为了适于矢量量化,把预测系数转化为线性频谱对(LineSpectrumPair,LSP),然后进行矢量量化。量化前的系数构成短时感觉加权滤波器,原始语音信号经过该滤波器得到感觉加权语音信号。对于每两个子帧,编码器用感觉加权语音信号求得开环基音周期,基音周期范围从18个样点到142个样点。此后编码器所进行的操作都是基于60个样点进行的。由开环基音周期和感觉加权是在开环基音周期点周围的一定范围内求得的。最后,激励信号被量化,然后把这些参数和激励信号量化结果传送到解码器。由于帧长为30ms,并存在另外的7.5ms的前向延迟,导致37.5ms总的编码延迟。

G.723协议适用于低速率多媒体服务中语音或音频信号的压缩算法,在IP电话网关中,被用来实现实时语音编码解码处理。

3.3G.726协议

G.726协议采用的是ADPCM语音编码算法,提供了64kb/sPCM码流至低速率ADPCM码流的转换。协议给出40kb/s,32kb/s,24kb/s和16kb/s4种比特率。其中,40kb/s信道主要用于在数字电路倍增设备(DCME)上传送数据modem信号,特别用于4.8kb/s以上速率的modem;24kb/s和16kb/s信道主要用作DCME语音传送的过载信道。G.726设计的主要用途仍然是传统的电路交换网,但是其低比特率方案也可用于VoIP。

3.4G.728协议

G.728协议采用的编码算法是LD-CELP,即低时延的码激励线性预测的算法。LD-CELP采用后向自适应预测器(BackwordAdaptivePredictor)对短时谱和增益进行预测。LD-CELP编码器发送的只是激励矢量在码本中的地址标号,而解码端的滤波器参数和增益参数都是在解码端计算得来的。在大多数编码系统中,这类参数都是在编码端求得,然后传输到解码端。

编码过程是首先将速率为64kb/s的PCM输入信号转化成均匀量化的PCM信号,接着由5个连续的语音样点组成一个5维矢量,激励码本中共有1024个5维矢量。对每一个输入矢量,编码器利用合成—分析法从码本中搜索出最佳码本矢量,然后将10比特的码本标号传给对方。每20个样点构成一个复帧,一个复帧构成一个自适应周期,每复帧更新一次LP系数。最佳码本矢量通过增益加权和合成滤波器后形成合成语音,该合成语音用来更新滤波器状态,以便继续为下一个输入矢量进行编码。合成滤波器系数和增益分别通过各自的后向自适应单元进行周期性地更新。

3.5G.729协议

G.729协议是一个能在8kb/s速率上实现高质量语音编码的协议,它采用的是CS-ACELP即共轭结构算术码激励线性预测的算法。CS-ACELP以CELP编码模型为基础,它把语音分成帧,每帧10ms,也就是80个采样点。对于每一帧语音,编码器从中分析出CELP模型参数,其中包括线性预测系数,自适应码本和随机码本的索引值和增益,然后把这些参数传送到解码端,解码器利用这些参数构成激励源和合成滤波器,从而重现原始语音。

编码过程是首先将速率为64kb/s的PCM语音信号转化成均匀量化的PCM信号,通过高通滤波器后,把输入语音信号的每80个样点组成一个帧,也就是10ms的帧长。对于每个帧用线性预测法求得LP滤波器系数,为了适于矢量量化,把预测系数转化为线谱对,然后进行矢量量化。利用合成—分析方法,使原始语音和合成语音之间的误差最小,来获得最佳激励信号。激励信号的量化是通过两个码本来实现的,即自适应码本和随机码本。自适应码本反映的是长时预测结果,也就是基音预测结果。随机码本反映的是经过长时预测和短时预测后的残留信号。

在IP电话网关中,G.729协议被用来实现实时语音编码处理。

3.6VoIP常用语音编码算法的性能分析和比较

从表1可以看出:G.711由于采用的是波形编码算法,具有高质量和低时延的语音,主要的缺点是需要64kb/s的带宽。G.723.1,G728,G.729都采用了混合编码算法,混合编码把激励模型和语音的时域波形结合到一起,从而改善了合成语音的质量。但这3种语音压缩编码算法的区别在于激励模型的不同。G.723.1Mos值约为3.8,优点在于仅需要很窄的语音带宽便可具有较高的语音质量;缺点在于在编码器一端至少有37.5ms的时延。G.728最大的优点是它能提供高质量和低时延的语音。

4结语

语音编码技术是建立和处理VoIP网络电话的原动力,可以预见,随着互联网技术的发展,原来G.711的64kb/s语音编码算法最终会被淘汰,并由低比特率编码算法所替代。

VoIP中的语音编码技术分析(2009-04-0110:348频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论