自适应差分脉冲编码调制语音编码_第1页
自适应差分脉冲编码调制语音编码_第2页
自适应差分脉冲编码调制语音编码_第3页
自适应差分脉冲编码调制语音编码_第4页
自适应差分脉冲编码调制语音编码_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自适应差分脉冲编码调制(ADPCM)语音编摘要:在过去的几十年中人类在语音数字化和数字化压缩领域研究摸索中取得了辉煌的成就。开辟了崭新的信息数字化时代。1972年CCITT制定了G.71164kb/sPCM语音编码标准,CCITTG.711A规定的A律和卩律PCM采用非线性量化,在64kb/s的速率语音质量能够达到网络等级,当前已广泛应用于各种数字通信系统中。由于它是一维统计语音信号,当速率进一步减小时,将达不到网络等级所要求的话音质量。对于许多应用,尤其在长途传输系统中,64kb/s的速率所占用的频带太宽以至通信费用昂贵,因此人们一直寻求能够在更低的速率上获得高质量语音编码质量的办法。于是在1984年CCITT又提出了32kb/s标准的G.721ADPCM编码。ADPCM充分地使用了语音信号样点间的相关性,利用自适应预测和量化来解决语音信号的非平稳特点,在32kb/s速率上能够给出符合公用网的要求的网络等级语音质量。本文对PCM、DPCM、DM、ADM以及ADPCM的编码、译码原理进行讨论,并对它们性能进行比较,然后着重阐述基于ADPCM的语音压缩算法,并介绍了ADPCM编码在蓝牙技术上的使用,最后对ADPCM在现代通信中的应用做个总结与展望。1脉冲编码调制及差分脉冲编码调制1.1脉冲编码调制(PCM)脉冲编码调制PCM(PulseCodeModulation)是把模拟信号变换成数字信号的一种调制方式。其功能是完成模-数转换,实现连续消息数字化。在PCM的调制过程中,将输入的模拟信号进行取样,量化和编码。经量化后的样值进一步变换为表示量化电平大小的二进制,即用二进制的大小来代表模拟信号的幅度(一个二进制码是一组有限的“0”、“1”脉冲序列)。在接收端再将这些编码的二进制数还原为原来的模拟信号。由于二进制PCM便于应用现代数字技术,且具有抗噪性能好的优点,因此是一种最常用的PCM形式。1.2差分脉冲编码调制(DPCM)DPCM(DifferentialPCM)是指采用固定预测器与固定量化器的差值脉冲调制,它是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术,它记录的不是信号的绝对大小而是相对大小。它是分析ADPCM工作原理的基础。DPCM采用预测编码技术,将信号抽样值与信号预测值的差值进行量化、编码后传输。在DPCM中是用n位二进码表示增量,因此它是介于DM和PCM之间的一种编码方式。DPCM相对于PCM信噪比有所改观,与DM相比,由于增加了量化级,因此改善量化噪声方面也优于DM,DPCM的缺点是较易受到传输线路噪声的干扰。2增量调制及自适应增量调制2.1增量调制(DM)增量调制(Deltamodulation,简称为DM)是只保留每一信号样值与其预测值之差的符号,并用一位二进制数编码的差分脉冲编码调制。DM的工作原理,将信号瞬时值与前一个抽样时刻的量化值之差进行量化,而且只对这个差值的符号进行编码,而不对差值的大小编码。因此编码反映的不是原始的信号,而是差分本身。在DM中由电平的量化误差产生的噪声称为颗粒噪声。而由于输入信号的斜率过大,调制器跟踪不及而产生的噪声称为斜率过载噪声。2.2自适应增量调制(ADM)自适应增量调制(AdaptiveDM,简称ADM)。为兼顾过载噪声和量化噪声,而采用了ADM,它的基本方法是检测输入信号的斜率变化,自动改变预测信号和量化台阶,使预测信号总能跟踪上输入信号的变化。近年来,在ADM体制上提出了几种实用有效的算法,例如:(1)常因子自适应增量调制(CFDM)算法;(2)高信息自适应增量调制(HIDM)算法;⑶Song算法;(4)混合自适应增量调制(HCDM)算法;(5)CVSD算法。3自适应差分脉冲编码调制(ADPCM)自适应差分脉冲编码调制(AdaptiveDifferentialPulseCodeModulation,简称ADPCM)最早使用于数字通信系统中。目前我们所使用的IMAADPCM算法简单实用,被广泛应用于数字录音笔和音乐盒中,更是应用于卫星通信IDR系统及小型站卫星通信系统传输语音和数据。自适应差分脉冲编码调制用预测编码来压缩数据量。它是一种结合了ADM的差分信号与PCM的二进制码的方法的波形编码。由于ADPCM主要用来对现有的PCM信道扩容,即把2个2Mkb/sPCM基群信号转换成一个2Mkb/s60路ADPCM编码器输出与解码器输出都采用标准A律或p律PCM码。而经过对数压缩后的64kb/sPCM信号是不能直接进行一般算术运算的,进入编码前,需要将A律或p律PCM码通过内在关系转换成线性PCM码(即自然二进制码)。在接收端,则需要将ADPCM码解码得到的自然二进制码重建信号变换成A律或p律对数PCM信号输出。它的编码简化框图如图1所示:

ADPCM“差直ADPCM“差直'其编码过程为:①为了便于数字运算,在编码器中先将输入的PCM码转换成14位线性码Sl(k),然后与预测信号Se(k)求差得到信号D(k)②将D(k)进行自适应差分量化,得到4比特ADPCM代码I(k)。③先把I(k)送到量化阶调整器,算得新的量化标度因子Y(k)。④再把I(k)送到解码器,同时将I(k)进行本地解码得到量化后的差值信号Dq(k)与预测信号Se(k)求和得到本地重建信号Sr(k),将Sr(k)输入自适应预测器,得到二阶极点和六阶零点的混合预测系数,它利用Dq(k)、Sr(k)以及前几次运算的值对下一个输入信号S1+l(k)进行预测,计算出Se+l(k)。解码是实现解压缩功能,即编码的逆过程,解码与编码有相同的电路,只是多了一个同步编码调整,其作用是使级联工作时不产生误差累积。解码器最后输出的码是8位A律或“律PCM码,因此在得到重建信号Se(k),还需将它转换成相应的PCM码。解码简化框图如图2所示:ADPCM“差值”PCM样本ADPCM“差值”PCM样本图2.ADPCM解码示意图4语音压缩编码现代通信的重要标志是实现数字化。对模拟信号实现数字化通信首先要将模拟信号转变为数字信号。这一过程对语音信号的变换叫语音编码。衡量语音压缩编码性能的主要指标是语音编码质量、编码速率、编码算法及复杂程度和编解码延时。对这些指标的要求往往是相互矛盾的,必须根据实际情况权衡。4.1语音压缩编码方法语音编码技术可以分为两大类:波形编码和参数编码。波形编码是将时间域信号直接变换为数字代码,其特点是再建信号的波形。这种方案中信号的质量较高,而其编码的比特率在64-16kb/s范围内,PCM、DM等均属于这一类。参量编码又叫模型基信源编码。它不传送信号的取样值,而是传送语音生成模型的基本参数以及适当的激励信号。在接收端则从数字代码恢复特征参量,再从参量重建语音信号。这种方法的特点是质量较前者低,但可大大压缩比特速率,多用于窄带信道,如在移动通信、卫星通信、网络通信中的应用日益广泛。基音周期语言信号输出An基音周期语言信号输出An图3:语音生成模型4.2语音压缩编码标准H.323(由国际电信联盟ITU推荐)建议定义的多媒体会议系统工作的网络基础是一个基于分组交换的数据网络,如X.25网、帧中继网和IP网等。目前IP网发展迅速,公用IP网和专用IP网都在大规模建设,使得IP网在通信信息领域越来越重要。H.323建议用于分组交换网络,当然也用在IP网中。H.323会议系统的语音编码主要有6种,即G.711、G.722、G.723.1、G.728、G.729和MPEGaudio,其中G7.11是必备的,即系统中的终端与MCU都必须支持G.711编码,其他5种是可选用的。除了上述6种编码外,也可以通过能力协商来采用其他编码形式。G.711,其编码速率为64kb/s,采用PCM编码方式,采样速率为8kHz,每个样值用8bit非线性的A律或“律进行编码,总速率为64kbit/s。G.728,基于低时延的代数编码激励线性预测(LD-ACELP)压缩原则16kbit/s编码标准的数据压缩算法。G.729和G.729a,基于共轭结构-代数编码激励线性预测(CS-ACELP)压缩原则8kbit/s编码标准的数据压缩算法。由于G.729a是G.729的简化版本,算法复杂度低且执行时间短而受到了广大网关厂商的青睐。G.729标准采用的算法,可以仅用8kbit/s带宽传输话音,而话音质量与32kbit/sADPCM相同。G.723.1,该标准规定了5.3kbit/s和6.3kbit/s两种不同速率。其中5.3kbit/s速率是以ACELP代数码激励线性预测编码算法为基础。

名msMr7219-64CMp34.110.311阳.32---A4._J0.网用公LI6SQ.-w6LJ--约08--537008_y--T--T2Q-Q.---16--4.19网用公2&LI6Q-Q.---s--420o5--MSG0.0SQ.-1X137630Q-8g383.513.355_yg38/128Q-42527Q-8Q-s4ELPc23.1605-lx4.3海信JDC7&18□雷应F□□□LJ6_.s□□D7D□n*n00s72EU3M视电图4:音编码标准5 突破蓝牙ADPCM语音编码CSR公司为解决CVSD作为语音流量编码方法所带来的局限,在第六代蓝牙技术中引入了射频扫描等改进技术,同时开发通过eSCO连接采用自适应差分脉冲编码调制(ADPCM)CODEC来实现更高的音频质量的最领先的技术——AuriStream,由于其速率只有32Kbps,却可执行完全相同的功能,使手机的蓝牙功耗节省一半。ADPCM被视为对CVSD(连续可变斜率增量调制)的理想补充的一种已被广泛接受的CODEC技术。ADPCM不同于CVSD:它能够以相对较慢的取样速度发现样本间的差异。ADPCM以相对于CVSD速率一半的较低速率传输固定电话质量的信号,为蓝牙传输器和接收器节约了大约一半的运行时间。该方法为蓝牙系统减少了40%的功耗。ADPCM使蓝牙连接的语音通话能够达到固定电话的通话质量。CSR公司BlueCore6所采用的AuriStream技术的耳机与采用同样技术的手机相连接,在嘈杂的环境里也能使语音拨号变得更为精确简单。这体现了ADPCM编码在质量方面的优越性。BlueCore6上所采用的AuriStream技术可支持仅为一半CVSD的数据速率的的ADPCM,这就使它能够有潜力支持多达七个更高质量的eSCO语音信道。远远超出传统上仅支持三个同步S

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论