浅论语音编码_第1页
浅论语音编码_第2页
浅论语音编码_第3页
浅论语音编码_第4页
浅论语音编码_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浅论语音编码戴福山(长春理工大学110421227)摘要:本文主要介绍了语音编码的理论根底、方法的分类和几种典型的语音编码方法,分析了各种方法的特点及应用环境,同时简要分析了当前语音编码总体上三个大的开展方向:极低速率语音编码、变速率语音编码和不压缩语音编码,并说明了它们的应用领域。关键词:语音编码语音编码典型方法语音编码的开展方向引言语音编码是将模拟语音信号数字化的手段.语音信号数字化后,可以作为数字数据来传输、存储或处理,因而具有一般数字信号的优点。在近半个世纪的研究中,各国研究人员做出了大量努力,从人类的发生机理、听觉机理、心理因素以及语音信号的时域特性、频域特性等多个方面进行了大量研究,从不同角度提出了多种信号编码方法。一、概述语音编码是将模拟语音信号数字化的手段.语音信号数字化后,可以作为数字数据来传输、存储、或处理,因而具有一般数字信号的优点。话音数字化的技术根本可以分为两大类:第一类方法是在尽可能遵循原波形的前提下,将模拟波形进行数字化编码。其中三种最常用的技术是脉冲编码调制(CPM)差分PCM(DPCM)和增量调制(△M);第二类方法是对模拟波形进行一定处理,但仅对话音和收听过程中能收听到的话音局部进行编码。第二类语音数字化方法主要与用于窄带传输系统或有限容量的数字存储设备的话音编解码器有关。采用该类技术的设备一般被称为声码器(语音编码器)。声码器技术现在正开始展开应用,特别是用于帧中继和IP上等语音。近年来,由于数字信号处理器体系结构和人类说话与识别方面研究的进步,使话音编解码技术得到迅速的开展。新的编解码技术不仅提供模拟转换,而且提供复杂的预测模式,可以分析话音输入,并用最少带宽传输话音。二语音编码的理论根底2.1语音编码的目的为了使信号适于处理、传输和存储,我们需要对语音信号进行压缩,语音编码就是要在保证语音质量的前提下得到尽可能少的数据,所以也常把语音编码叫做语音压缩编码。2.2语音压缩编码的可行性〔1〕语音信号中存在大量冗余信息,即:语音信号样本件具有很强的相关性;浊音语音段具有准周期特性;声道的形状及其变化的速率有限;传输码元的概率分布非均匀。〔2〕人耳对声音信号中的局部信息不敏感,即人耳对声音中的低频成分比高频成分敏感;人耳对语音信号的相位特征不敏感;人耳中存在“听觉掩蔽(AuditoryMasking)”效应,即某一声音引起听觉器官对另一声音的敏感度下降。掩蔽的程度取决于掩蔽声的强度及掩蔽声与被掩蔽声之间的频率关系。正是由于这些原因的存在,我们才可以对语音信号进行各种各样的处理,理论研究和实际应用中出现的各种编码技术都是以此为根底的。语音编码技术原理及应用3.1语音编码的技术分类语音编码主要有三种方式:波形编码、声码器和混合编码,而近年来“感知编码”也逐渐开始步入实际应用行列,通常把编码速率低于64kbps的语音编码方式称为语音压缩编码技术.,下面分别介绍这四种编码方法。波形编码波形编码针对语音波形进行的,这种方法在降低量化每个语音样本比特数的同时又保持了相对良好的语音质量.波形编码包括时域编码和频域编码。〔1〕时域编码时域编码主要有脉冲编码调制(PCM)、差分脉码调制(DPCM)、增量调制(ΔM)、自适应差分脉码调制(ADPCM)、自适应增量调制(ADM)、自适应预测编码(APC)等。线性PCM是用同等的量化级进行量化,没有利用声音的性质,所以信息没有得到压缩,对数PCM利用了语音信号幅度的统计特性,对幅度按对数变换压缩,将压缩的结果作线性编码,在接收端解码时,按指数扩展,这种方法在数字通信中得到了广泛的应用,PCM最大缺点是数码率高,在传输时所占频带较宽。差分脉码调制(DPCM)是根据相邻采样值的差值信号进行编码,图1是DPCM原理方框图。ADPCM是在DPCM的根底上开展起来的,其量化器与预测器的参数能根据输入信号的统计特性自适应于最正确或接近于最正确参数状态.ADPCM是语音编码中复杂程度较低的一种方法。增量调制是根据信号的瞬值是否增大或减小,即根据增量编码,用一位二进制码序列对模拟信号进行编码.这种方法简单,实现容易,但由于量阶固定,量化噪声功率固定,所以当信号下降时,信噪比(SNR)下降.为了改良这种方法的动态范围,引进了自适应技术,让量阶的大小随输入信号的统计特性变化而变,这种方法称为自适应增量调制(ADM)。,APC是根据语音的统计特性,由过去的采样值精确预测出当前样值的一种编码方法,它是通过自适应预测器来提高预测精度的,预测得越精确,编码速率越低。频域编码.频域编码方式主要有子带编码(SBC)和自适应变换编码(ATC)SBC是利用带通滤波器将语音频带分成假设干子带,并且分别进行采样、编码,编码方式可以用ADPCM或ADM,SBC速率可以到达9.6kbps.可变SBC可使子带的设计不固定,而是随共振峰变化,使编码速率进一步提高,这种方式在速率为4.8kbps时可具有相当于7.2kbps的固定SBC的语音质量.ATC是先将语音信号在时间上分段,每一段信号一般有64~512个采样,再将每段时域语音数据经正交变换转换到频域,得到相应的各组频域系数,然后分别对每一组系数的每个分量单独量化、编码和传输,在接收端解码得到的每组系数再进行频域至时域的反变换,恢复时段信号,最后将各时段连接成语音信号,ATC编码在速率为12~16kbps可得到优质语音.3.1.2声码器所谓声码器是根据发音模型,分析并提取语音信号的特征参数,且只传送能够合成语音信息的参数,不需要再现原语音的波形,由于模型参数相对于语音信号而言数据量非常小,所以参量编码的编码率很低,但利用这种编码方法得到的语音质量不理想。典型的声码器有谱带式、共振峰式和按线性预测分析(LPC)所组成的声码器等。图2是线性预测编码器。3.1.3混合编码由于前面两类编码方法各有优缺点,所以后来的研究者更多的是考虑如何将它们综合起来以形成一种性能更优的编码算法,混合编码就是基于这种想法被提出的。其代表是一类称之为“按分析合成”(ABS)的方法,采用听觉加权技术,在闭环的根底上寻找主观意义上失真最小的鼓励矢量.由于采用的鼓励信号模型不同,这类方法派生出多种新的编码方法,典型的方法有剩余鼓励线性预测编码(RELP),多脉冲鼓励线性预测编码(MPC),码鼓励线性预测编码(CELP)。图3为RPE-LTP编码器的原理框图。3.1.4感知编码大局部的编码技术还融合了人类听觉系统的心理声学原理,即感知器编码技术。这种编码方法利用了人耳听觉的心理声学特性,但凡人耳感觉不到的成分不编码、不传送,从而到达降低数据量而又不影响声音质量的目的(见图4)。

图5语音质量与编码速率关系3.2语音编码

图5语音质量与编码速率关系语音质量与编码速率的关系如图5所示。64kbps的PCM编码方法可以得到高质量的语音,利用波形相关性及频谱特性可以将其压缩到24~32kbps,进一步在利用音调结构的同时,进行噪声整形,可以压缩到9.6kbps.但是如果降低的比特数超过上述数目,语音质量将急剧劣化,声码可以使比特数减少较多,但语音质量欠佳。混合编码将波形编码和声码器结合起来,在编码速率较低的情况下获得较好语音质量。3.4语音编码标准及应用实际应用的语音编码算法将会综合考虑各种因素,糅合以上各类编码方法得到的,以期得到特定条件下最正确的编码性能。经过多年的开展,目前已有多个技术标准,并应用于不同的领域。详见下表:四、语音编码的开展方向

当前语音编码总体上有三个大的开展方向。一个方向是语音编码进一步低速率化。另一方向是变速率语音编码。当然,还有一个开展方向就是语音不压缩。这是因为目前传输带宽增长很快,传输本钱大幅度下降,为语音编码付出的费用与所节省的传输费用相比变得不合算了,语音不压缩传输所需费用反而更低。

4.1语音编码开展方向——极低速率语音编码4.1.1极低速率语音编码极低速率语音编码是指比特率低于2400bit/s的语音编解码器。在保密通信、语音邮件、网络通信、IP等领域有广泛的应用前景。特别是在信息化战场上广泛应用于单兵作战通信设备上。4.1.2极低速率语音编码开展的必要性在现代通信中,信道利用的有效性和经济性仍是研究的重要目标。极低速率语音编码技术是语音通信中不可缺少的一个研究方向。在实际通信中,有些信道难以扩宽且质量很差,如短波信道;有的信道正被广泛使用,短期内难以更新;有些特殊条件下的通信,如强干扰下的军事通信等,还有些昂贵的信道,节省的每一个比特都意味着经济上的好处。在这些条件下,极低速率语音编码极具吸引力。随着数字通信业务的开展,高质量的极低速率语音编码技术将成为研究的热点。4.2语音编码开展方向——变速率语音编码4.2.1变速率语音编码变速率语音编码是指在通信过程中,通信系统根据需要动态地调整语音编码速率,在合成语音质量和系统容量中取得灵活的折衷,最大限度地发挥系统的效能。在当前应用广泛、前景广阔的码分多址(CDMA)移动通信系统中,采用的变速率语音编码算法对于系统的容量和通话质量有非常重要的影响。随着技术的成熟,它的应用领域也越来越广阔,不仅限于移动通信系统,在IP、互联网和卫星通信中都有很好的应用前景。4.2.2变速率语音编码开展的必要性传统的语音编码总体来讲,较高速率的编码算法对话音质量较易保证,但占用网络资源较大;较低速率的编码算法占用网络资源小,但对话音质量较难保证。近年来,通信系统开展迅速,随着移动通信的开展,尤其是第三代移动通信的开展,对语音压缩编码算法提出了更高的要求,不但要求编码码率较低以增加系统容量,而且要求合成音质较高以保证通话质量。用传统的编码方式,很难同时满足这两个要求。在这种形势下,提出了变速率语音压缩编码的方法。它可以根据需要动态地调整编码速率,在合成语音质量和系统容量二者中取得灵活的折衷,最大限度地发挥系统的效能。4.3语音编码开展方向——不压缩语音编码极低速率语音编码和变速率语音编码是当前语音编码的主要开展方向。但也有一些通信系统仍然采用不压缩语音编码。这是因为目前传输带宽增长很快,特别是光纤通信的开展,使得传输本钱大幅度下降,为语音编码付出的费用与所节省的传输费用相比变得不合算了,语音不压缩传输所需费用反而更低。因此这些系统就采用了不压缩的语音编码算法,大多数直接利用PCM编码进行传输。这样可以保证很高的语音通信质量和比拟简单的通信设备,大大地降低了通信费用。不压缩语音编码主要应用于地面微波通信和光纤通信系统中。当然,语音编码除了上述三个总体的开展方向以外,寻找最正确的语音鼓励模型和对人类听觉系统机理的不断认识将是近一段时间内的根底性研究工作。结语语音编码是语音信号处理的一个重要方面,它和通信领域联系最为密切。而语音识别、语音合成、语音增强等方面在理论和方法上与语音编码有很多相通之处。因此,系统、全面地了解当今语音编码的开展方向,对语音通信领域工作的开展具有重要意义。语音编码是一个人们熟知的领域,又是一个新颖的领域,随着信息时代的到来对语音编码提出了新的要求,语音编码技术定将进一步开展。参考文献[1]王文星,语音编码技术的分析与应用,焦作工学院学报(自然科学版),2002年5月[2]何春荣,浅析语音编码的三个开展方向,成都纺织高等专科学校学报,2008年1月[3]周波、许萌,数字语音编码技术研究,科技情报开发与经济,2008年第18卷第3期[4]张学英,数字语音处理及matlab仿真,电子工业出版社,2014年[5]陈学艺、凌朝东、陈哲平、杨骁,MELP在数字对讲机基带系统中的应用【J】,通信技术,2012年[6]赵翠、周遥、毛鑫萍、马永阳,基于先行预测的自适应语音压缩感知【J】,杭州电子科技大学学报,2012〔04〕[7][8]梁彦霞.低速率多带鼓励线性预测语音编码技术的研究[D].西安电子科技大学2011[9]魏丽英简析语音编码长春工业大学人文信息学院;2010-11-05[10]计哲低速率语音编码算法研究清华大学2011-04-01[11]何洪华超低速率语音编码算法研究清华大学2011-05-01[12]刘华;高飞燕;李军红ACELP语音编码算法改良与仿真中国自动化学会控制理论专业委员会B卷2011-07-22[13]张辉;陈小云G.729语音编码算法的分析及其基于ARM9的优化实现长春理工大学学报(自然科学版)2011-09-15[14]石宁数字通信中的语音编码技术无线互联科技2011-09-15[15]杜刚;王庆扬;王月珍移动网语音编码技术分析及演进2012全国无线及移动通信学术大会论文集〔下〕2012-09-01[16]周嘉伟自适应多速率语音编码算法的改良和实现西安电子科技大学2013-03-01[17]蔡杨基于PLP分析的CELP编码华东理工大学2012-12-23

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论