语音信号处理第五章_第1页
语音信号处理第五章_第2页
语音信号处理第五章_第3页
语音信号处理第五章_第4页
语音信号处理第五章_第5页
已阅读5页,还剩122页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章

语音编码15.1概述1

5.2语音编码的分类及特性

5.3语音编码性能的评价指标35.4语音信号波形编码4

5.5语音信号参数编码52第5章语音编码6

5.7语音信号宽带变速率编码

7

5.6语音信号混合编码25.1概述

语音数字通信的优越性主要体现在:更好的话音质量;更强的抗干扰性,易于进行加密;节省带宽,更有效地利用网络资源;更易于存储和处理。最简单的数字化方法是直接对语音信号进行模/数转换,只要满足一定的采样率和量化要求,就能够得到高质量的数字语音。但这时语音的数据量仍旧非常大,因此在进行传输和存储之前,往往要对其进行进行压缩编码,以减少其传输码率或存储量。3传输码率也称为数码率或编码速率,表示传输每秒钟语音信号所需的比特数。语音编码的目的:在保证语音音质和可懂度的条件下,采用尽可能少的比特数来表示语音。通常所说的“话音编码”,是特指通信传输系统中代表口语发声的300Hz~3400Hz的信号。本章以前面学习过的语音信号处理技术和方法为基础,介绍语音编码基本原理和常用的编码方法。45.2语音编码的分类及特性按编码方式语音编码分为三种:

波形编码参数编码混合编码5波形编码是将时间域或变换域信号直接变换为数字信号,力求使重建语音波形保持原始语音信号的波形形状。

要求重建语音信号的各个样本尽可能地接近原始语音信号s(n)的样本值,因此在波形编码中,信噪比总是一个有用的性能评定标准。

5.2.1波形编码6

波形编码优点:适应能力强,算法简单,易于实现,语音质量好。

波形编码缺点:编码速率高,一般在16kbit/s~64kbit/s之间。

传统的波形编码方法分类:脉冲编码调制(PCM)

自适应增量调制(ADM)

自适应差分脉冲编码调制(ADPCM)

7脉冲编码调制PCM编码速率:64kbit/s自适应增量调制ADM编码速率:32kbit/s-16kbit/s自适应差分脉冲编码调制ADPCM编码速率:32kbit/s85.2.2参数编码

参数编码又称声码器编码,是将信源信号在频域或其它变换域提取特征参数,然后对这些特征参数进行编码和传输,在译码端再将接收到的数字信号译成特征参数,根据这些特征参数重建语音信号。这种编码方法重建语音信号与原始语音信号样本之间没有一一对应关系。合成语音的音质好坏需要借助于主观评定,缺少客观的评定标准。

9

参数编码优点:

编码速率低,且这类编码器对讲话环境噪声较敏感,需要安静环境才能给出较高的可懂度。

参数编码器有:共振峰声码器线性预测声码器余弦声码器。105.2.3混合编码二十世纪50年代产生混合编码。优点:保留参数编码技术精华,并引用波形编码准则去优化激励源信号,克服了原有波形和参数编码的弱点,而吸取了它们各自的长处。缺点:算法复杂、运算量很大。编码速率:4kbit/s~16kbit/s

包括:多脉冲激励线性预测编码(MPELP)

码本激励线性预测编码(CELP)115.2.4语音压缩编码的依据

语音编码的目的:在给定的编码速率下,使编解码后恢复出的重构语音的质量尽可能高。

提高语音编码效率的基本途径:充分利用语音信号冗余度和人耳的听觉特性。

语音的冗余度主要来源于两个方面:语音信号幅度分布的非均匀性;语音样点之间的相关性。12

语音信号幅度统计特性:具有动态的、时变的、多维的暂态概率密度分布的随机过程。统计时间长度不同,它表现的概率密度分布形式不同。一般长时(几十秒以上)统计幅度特性接近于gamma分布,短时(几到几十毫秒)统计幅度特性接近于高斯分布。但无论哪种统计特性,语音信号总是小幅度出现概率大,大幅度出现概率小。13语音信号具有冗余度的另一原因:语音样点之间存在相关性。利用语音信号的相关性,在时域上采用短时和长时预测,在频域上采用谱平整方法,可以达到压缩编码比特率的目的。14语音压缩编码的第二个途径是利用人耳的听觉特性。人类听觉有一个特点:“听觉掩蔽效应”,是指一个强音能抑制一个同时存在的弱音的听觉。听觉掩蔽效应在语音压缩编码中有非常重要的作用。15

5.3语音编码性能的评价指标

评价一个语音编码算法性能的基本指标包括:编码速率、语音质量评价、编解码延时以及算法复杂度。这四个因素之间有着密切的联系,在具体评价一种语音编码算法的优劣时,需要根据具体的实际情况,综合考虑四个因素进行性能评价。

165.3.1编码速率

编码速率直接反映了语音编码对语音信息的压缩程度。度量方法有:“比特/秒”(bit/s):代表编码的总速率,一般用I表示;“比特/样点”(bit//p):代表平均每个语音样点编码时所用的比特数,用R表示。平均每样点比特数R越高,语音质量越容易提高,对传输带宽或存储容量要求也就越高。17

降低编码速率是语音编码的首要目标,根据编码速率和输入语音的关系可将编码器分成两类:固定速率编码器和可变速率编码器。现在大部分编码标准都是固定速率编码,其范围为0.5kbit/s~64kbit/s。其中:保密电话的编码速率为:0.5kbit/s~4.5kbit/s

数字蜂窝移动电话和卫星电话编码器编码速率为:3kbit/s~13kbit/s

蜂窝系统总的编码速率达到:20kbit/s~30kbit/s

普通电话网的编码速率为:16kbit/s~64kbit/s

宽带编码器编码速率为:45/56/64kbit/s18可变速率编码是近年来出现的新技术。根据统计,两方通话大约只有40%的时间是真正有声音的,因此一个自然的想法是采用通、断状态编码。通状态对应有声期,采用固定编码速率;断状态对应无声期,传送极低速率信息(如背景噪声特征等),甚至不传送任何信息。更复杂的多状态编码还可以根据网络负荷、剩余存储容量等外部因素调节其码率。

19可变速率编码主要包括两个算法:一是话音激活检测(VAD),主要用于确定输入信号是语音还是背景噪声;二是舒适噪声的生成(CNG),主要用于接收端重建背景噪声。除以上两种算法外,可变速率编码还包括以下两个关键技术:速率判决技术(RDA,RateDecisionAlgorithm)以及差错隐藏。205.3.2编码质量

编码质量评价是语音编码性能的最根本指标,分为两类:主观评价方法和客观评价方法。

1.语音质量主观评价方法方法实现:在一组测试者对原始语音和合成语音进行对比试听的基础上,根据某种事先约定的尺度来对语音质量划分等级。常用的方法包括:平均意见得分MOS:MeanOpinionScore

判断韵字测试DRT:DiagnosticRhymeTest

判断满意度测量DAM:DiagnosticAcceptabilityMeasure21主观评价方法符合人听话时对语音质量的感觉,目前得到了广泛应用。常用方法是平均意见得分(MeanOpinionScore,简称MOS得分)等。

MOS得分为五级评分标准,如表5.1所示,多人收听完测试语音后打分,求出平均值,为MOS分。主观评价方法一般都是由较大的通信组织来完成,个人很少采用。

22表5.1MOS分五级标准及对应语音质量

MOS分质量级别失真级别

5优不觉察

4良刚有觉察

3中有觉察且稍觉可厌

2差明显觉察且可厌但可忍受

1坏不可忍受232.语音质量客观评价方法

该方法建立在原始语音和合成语音的数学对比之上,分为时域客观评价和频域客观评价两类。时域客观评价方法有信噪比、加权信噪比、平均分段信噪比等。频域客观评价方法有巴克谱失真测度BSD和MEL谱测度等。

特点:计算简单、结果客观、不受个人主观因素的影响。

缺陷:不能完全反映人类对语音的听觉效果。24

分段SNR(SNRseg)评价法:

是把每隔(10ms~30ms)短时间所测定的SNR的dB值在长时间声音区间取平均而得到的值来表示的方法,能够反映出量化器对不同电平输入段的量化质量,具有与主观值对应比较好的特征。

SNR是经常采用的一种客观评价方法。

255.4波形编码模拟信号数字化抽样-量化-编码编码方式(1)波形编码:时域波形变换为数字代码序列。方法简单,重建信号的质量好,占用频带宽(2)参量编码:--提取语音信号的特征参量,再变换为数字代码。方法复杂,重建信号的质量差,占用频带窄26数字化三步骤:抽样、量化和编码抽样信号抽样信号量化信号t011011011100100100100编码信号27本节目录5.4.1脉冲编码调制(PCM)5.4.2差分脉码调制(DPCM)5.4.3增量调制(∆M)285.4.1脉冲编码调制的基本原理PCM是波形编码中最重要的一种方式。模拟信号为调制信号二进制脉冲序列为载波模拟信号的抽样值改变脉冲序列的码元取值,故称脉冲编码调制(PCM)PCM调制过程有抽样、量化和编码三个步骤。电话语音信号的PCM码组由8位二进制码组成。29

脉冲编码调制原理模拟信源产生要传输的模拟信号;预滤波器为带限滤波器;波形编码器将模拟信号变换成数字编码信号;信号经传输到达接收端,在接收端再将数字编码信号转换成模拟信号。30

1.低通抽样定理

抽样定理:一个频带限制在(0,fH)内的连续信号x(t),如果抽样频率fs大于或等于2fH

,则可以由样值序列{x(nTs)}无失真地重建原始信号x(n)。通常进行等间隔T抽样;理论上,抽样过程=周期单位冲激脉冲模拟信号;实际上,抽样过程=周期性单位窄脉冲模拟信号;5.4.2抽样31

时域中,抽样信号可表示为:单位冲击函数可表示为:故有:频域中,由于所以,有:32

抽样信号的时域与频域对照:时域相乘频域卷积33

设理想低通传递函数为:则滤波器输出为:根据时域卷积定理,可获得重建信号:内插公式34t恢复原信号的方法:频域:当fs

≥2fH时,用一个截止频率为fH的理想低通滤波器就能够从抽样信号中分离出原信号。时域:当用抽样脉冲序列通过此理想低通滤波器时,滤波器的输出就是一系列冲激响应之和。这些冲激响应之和就构成了原信号。理想滤波器是不能实现的。实用滤波器的截止特性不可能做到如此陡峭。所以,实用的抽样频率fs必须比2fH大一些。典型电话信号的最高频率通常限制在3400Hz,而抽样频率通常采用8000Hz。355.4.3量化设模拟信号的抽样值为m(kT),其中T是抽样周期,k是整数。此抽样值仍然是一个取值连续的变量,有无穷多种取值。编码时只能用有限种码元来代表抽样值。若仅用N个不同的二进制数字码元来代表此抽样值的大小,则N个不同的二进制码元只能代表M=2N个不同的抽样值。样值无穷多种----编码有限----限制样值的取值种类必须将抽样值的范围划分成M个区间,每个区间用一个电平表示。共有M个离散电平,它们称为量化电平。用这M个量化电平表示连续抽样值的方法称为量化。36

用有限位数字表示抽样值的过程即为量化。量化器的输入输出关系可表示为:

为量化电平,为分层电平,为量化间隔。37

量化特性曲线图a为均匀中升型;图b为非均匀中升型;图c为均匀中平型;图d为非均匀中平型。38

均匀量化特性和量化误差量化前的模拟信号量化后的信号:阶梯波量化误差:模拟信号和量化信号的差别39均匀量化的讨论均匀量化器的应用:A/D变换;遥控遥测系统、仪表、图像信号的数字化接口等;均匀量化的不足:不适于数字电话的通信电话信号动态范围大,采用均匀量化容易过载;动态范围:满足一定信噪比要求的信号取值范围电话信号的信噪比要求要大于25dB,则需要12位编码,所需传输带宽大;语音信号取小信号的概率大,而均匀量化时信号幅度越小,SNR越低,通信质量越差。非均匀量化:小信号小阶距量化,大信号大阶距量化保证通信质量,减少编码位数,提高小信号的信噪比40例5-1正弦信号,抽样频率,限定抽样时刻通过正弦波的零点。(1)列出在正弦信号一个周期内样值序列的取值,画出样值序列的时间波形图;(2)样值序列输入如图5-13(b)所示的量化器,列出量化后样值序列,画出量化后的样值序列的时间波形图。解(1)正弦信号的频率,抽样频率,在正弦信号的一个周期内抽样次数为m,即抽样的时间间隔为,即相邻样值之间的相位间隔为,即

(36°)

41限定抽样时刻通过正弦波的零点,所以在正弦信号一个周期内x(n)的样值序列可表示为样值序列x(n)的时间波形图如图5-17(a)所示。(2)量化器对样值序列x(n)进行量化,量化后的样值序列xq(n)为量化后的样值序列的时间波形图如图5-17(b)所示。考虑到编码的规则,在抽样值的计算中均不进行四舍五入的近似处理,直接将尾数舍去。42图5-17例5-1中的时间波形图(a)样值序列的时间波形图(b)量化后的样值序列的时间波形图43

例5-2

对频率范围为30Hz~300Hz的模拟信号进行线性PCM编码。(1)求最低抽样频率;(2)若量化电平数

L=64,求PCM信号的信息速率。解:(1)由模拟信号的频率范围可知,该信号应作为低通信号处理。最低抽样频率为(2)由量化电平L可求出编码位数n,即

PCM信号的信息速率为44

5.4.5非均匀量化

为保证信号的SNR要求,又不能使编码位数太多。采用先压缩后扩张的非均匀量化方案,以减少编码位数。非线性变换,对信号幅度范围进行压缩45非均匀量化的关键是非线性压缩问题:非线性压缩特性如何选择?目标:获得最佳压缩特性量化噪声的平均功率最小量化噪声的平均功率的基本公式对数压缩特性对数压缩+均匀量化=对数量化46

5.4.6对数量化及其折线近似CCITT建议对数压缩特性:A律;μ律1.A律对数压缩特性(Alaw)设量化器满载电压值为V,信号幅度的归一化值为A律对数压缩特性A为压缩系数,A=1

时无压缩,A愈大压缩效果愈明显;0<=x<=1/A,是线性函数,特性曲线是一段直线1/A<=x<=1,是对数函数,特性曲线是一段对数曲线47

2.μ律对数压缩特性

μ律对数压缩特性定义为:

μ=255,L=256时,对小信号SNR的改善值为33.5dB。μ律由美国提出,

A律由欧洲提出,我国使用A律。A律和μ律性能比较48

3.对数压缩特性的折线近似CCITT建议A律压缩特性采用13折线近似逼近A=87.6的压缩特性。

律压缩特性采用15折线近似。

(1)A律13折线的形成495.4.7A律PCM编码原理

PCM原理方框图(b)解码器模拟信号输出PCM信号输入解码低通滤波(a)编码器模拟信号输入PCM信号输出抽样保持量化编码冲激脉冲编码:每个样值对应一种量化电平值,每个量化电平值对应一个PCM编码码组。解码:每个PCM编码码组恢复成对应的量化电平值,经LPF输出模拟信号。50

1.折叠二进制码

常见二进制码组自然二进制码:十进制正整数的二进制表示;折叠码:首位为极性码,其余七位为幅度码;格雷码:相邻电平编码只有一位不同。

折叠码的特点在小信号时由误码产生的误差功率最小,对语音信号有利;编码电路简化;语音信号的PCM编码采用折叠码。512.A律PCM编码规则(1)参数(规定)量化电平数L=256

共16段,16电平/段,L=16*16=256

编码位数n=8(2)8位码的排列

M1M2M3M4M5M6M7M8

M1—极性码,1为正,0为负;

M2M3M4—段落码,3位码,8个段落;

M5M6M7M8—电平码,4位码,16种电平。52(3)编码方法段落码的确定过程:归一化电平值∆=1/409653(4)编码过程实现PCM编码的具体方式和电路很多,A律13折线目前常采用逐次比较型编码器。除第1位极性码外,其它7位幅度码是通过逐次比较来确定的。每次比较得出1位码,共需要对样值进行7次比较。段落码的确定以段落为单位逐次对分,从高位到低位逐位编出,如图5-25所示。54段内码以段内的量化级为单位逐次比较,也是从高位到低位逐次编出。在实际的编码器中,还要将编码结果进行偶次比特倒置。例如“0∆”附近的电平编码结果为10000000或00000000,偶次比特倒置后为11010101或01010101。这样的处理方法是为了防止0电平信号及小信号的编码中连0码过多,有利于接收端位定时信号的提取。55比较、判断、确定:极性码----段落码-----段内码段落序号段落码c2c3c4段落范围(单位:∆)81112048~409671101024~20486101512~10245100256~5124011128~256301064~128200132~6410000~32量化电平段内码c5c6c7c815111114111014110112110011101110101091001810007011160110501014010030011200101000100000在每个段落内部都是均匀等分为16个量化电平;但每个段落的量化间隔大小不同;所以总体看来是非均匀量化。56(5)编码表:A率正输入值编码表段落号段落码M2

M3

M4段落码对应的起始电平段内电平码对应的电平M5

M6

M7

M8段内量化间隔10000168422200132168422301064321684440111286432168851002561286432161661015122561286432327110102451225612864648111204810245122561281281.编码表与A律13折线相对应2.对数压缩、均匀量化、编码-----由非线性编码一次完成57(6)解码方法编码的依据是分层电平xk

若,编码的结果是唯一的解码规则恢复分层电平,转化为量化电平

效果:确保所有样值某些样值,增加误差58

例5-4

设输入为,按A律13折编码,求编码码组C,解码输出和量化误差。解:(1)因输入样值为正,故极性码M1=1;因,故段落码M2

M3

M4=110

又因为,而所以,编码码组C=11100011(2)解码输出为:

(3)量化误差为:,即量化误差小于量化间隔的一半。59

3.信道误码对信噪比的影响影响PCM系统性能的噪声有两种:量化过程中引入量化误差量化噪声量化噪声的平均功率传输过程中引入信道噪声信道误码,接收端恢复时出现误码噪声平均误码噪声功率605.4.8PCM信号的码元速率和带宽1.PCM信号的码元速率在A律13折线编码中规定编码位数n=8。在一般的PCM编码中,编码位数n则要根据量化电平数L确定,即满足的关系。当确定抽样频率后,抽样周期即抽样间隔为在一个抽样周期内要编n位码,每个二进制码元的宽度即码元周期为用二进制码表示的PCM编码信号的码元速率为612.PCM信号的带宽如果PCM信号采用矩形脉冲传输,脉冲宽度为τ,则PCM信号的第一零点带宽为B=1/τ二进制码元的占空比D为脉冲宽度τ与码元宽度Ts的比值,即D=τ/Ts已知码元周期和占空比即可计算PCM信号的第一零点带宽。当编码码组中的位数n越多,码元宽度Ts就越小,占用的带宽就越大。传输PCM信号所需要的带宽要比模拟基带信号的带宽大得多。62例5-5模拟信号的最高频率为4000Hz,以奈奎斯特频率抽样并进行PCM编码。编码信号的波形为矩形,占空比为1。(1)按A律13折线编码,计算PCM信号的第一零点带宽;(2)设量化电平数L=128,计算PCM信号的第一零点带宽。解(1)因为以奈奎斯特频率抽样,所以抽样频率为

A律13折线编码的位数n=8,所以PCM信号的码元速率为当矩形波的占空比为1时,脉冲宽度为PCM信号的第一个零点带宽为63(2)量化电平数,编码位数为PCM信号的码元速率为PCM信号的第一零点带宽为645.5差值脉冲编码调制(DPCM)内容提要背景介绍原理分析性能分析工程应用学习目的掌握DPCM的原理了解实际工程应用的情况理解模拟信号波形编码技术的发展脉络655.5.1背景介绍PCM方式的应用情况:64kbit/s的A律或u律的对数压扩PCM编码已经在大容量的光纤通信系统和数字微波系统中得到了广泛的应用。PCM信号占用频带要比模拟通信系统中的一个标准话路带宽(3.1kHz)宽很多倍。采用PCM方式的经济性能很难与模拟通信相比。大容量的长途传输系统带宽有限的移动通信网66需要解决的问题:如何压缩数字化语音占用频带?也即研究如何在相同质量指标的条件下降低数字化语音的码速率,以提高数字通信系统的频带利用率。采用波形编码的解决方案:差分脉码调制(DPCM)自适应差分脉码调制(ADPCM)675.5.2原理分析DPCM的原理基于模拟信号的相关性。语音信号的相邻样值之间存在很强的相关性。可预测成分:由过去的一些样值加权得到不可预测成分:预测误差DPCM是根据信号样值间的关联性来进行编码的一种方法。仅对样值和预测值的差值进行量化编码。差值幅度小于原信号样值幅度,所需编码位数减少,降低码率,压缩带宽。对比:PCM是对波形的每个样值都独立进行量化编码,编码位数较多,比特率较高,数字化信号带宽较大。68DPCM原理框图图中输入抽样信号为x(n),接收端重建信号为,d(n)是输入信号与预测信号的差值,dq(n)为量化后的差值,c(n)是经编码后输出的数字编码信号。其中,预测器满足关系:(式中ai为预测系数、k为预测器阶数,是常数)69根据原理框图,差值信号和重建信号可以表示为:DPCM的总量化误差定义为输入信号与解码器输出的重建信号之差,即系统总的量化信噪比SNR定义为:总量化误差只和差值信号的量化误差有关

70自适应差值脉码调制(ADPCM)特点:在DPCM基础上,用自适应量化取代了固定量化,用自适应预测取代了固定预测。自适应量化:量化阶距随信号的变化而变化,使量化误差减小;自适应预测:预测器系数随信号的统计特性而自适应调整,提高了预测信号的精度,从而得到高的预测增益。性能:编码的动态范围和信噪比大大提高,能在32kbit/s的条件下达到64kbit/sPCM系统的语音质量要求。ITU建议PCM数字电话用于公用网内的市话传输,而ADPCM则用于公用网中的长话传输。71总结:技术发展的脉络技术特点PAM时间离散化,幅度连续PCM时间,幅度都离散化对样值进行量化编码(64Kbps)DPCM时间,幅度都离散化固定预测,对差值进行固定量化、编码ADPCM时间,幅度都离散化自适应预测,对差值进行自适应量化、编码(32kbps)CELP(码激励线性预测)IS-95CDMA,参量编码,速率更低(小于14.4kbps)AMR(自适应多速率)3G系统,智能分配最佳编码速率模拟信号数字信号(波形编码-----参量编码)72

简单增量调制1增量调制的基本概念在PCM系统中,为了得到二进制数字序列,要对量化后的数字信号进行编码,每个抽样量化值用一个码组(码字)表示其大小。码长一般为7位或8位,码长越大,可表示的量化级数越多,但编、解码设备就越复杂。那么能否找到其它更为简单的方法完成信号的模/数转换呢?73我们看一下图4―1。图中在模拟信号f(t)的曲线附近,有一条阶梯状的变化曲线f′(t),f′(t)与f(t)的形状相似。显然,只要阶梯“台阶”σ和时间间隔Δt足够小,则f′(t)与f(t)的相似程度就会提高。对f′(t)进行滤波处理,去掉高频波动,所得到的曲线将会很好地与原曲线重合,这意味着f′(t)可以携带f(t)的全部信息(这一点很重要)。因此,f′(t)可以看成是用一个给定的“台阶”σ对f(t)进行抽样与量化后的曲线。我们把“台阶”的高度σ称为增量,用“1”表示正增量,代表向上增加一个σ;用“0”表示负增量,代表向下减少一个σ。

74则这种阶梯状曲线就可用一个“0”、“1”数字序列来表示(如图4―1所示),也就是说,对f′(t)的编码只用一位二进制码即可。此时的二进制码序列不是代表某一时刻的抽样值,每一位码值反映的是曲线向上或向下的变化趋势。这种只用一位二进制编码将模拟信号变为数字序列的方法(过程)就称为增量调制(DeltaModulation),缩写为DM或ΔM调制。75

增量调制最早由法国人DeLoraine于1946年提出,目的是简化模拟信号的数字化方法。其主要特点是:

(1)在比特率较低的场合,量化信噪比高于PCM。

(2)抗误码性能好。能工作在误比特率为102~103的信道中,而PCM则要求信道的误比特率为104~106。

(3)设备简单、制造容易。它与PCM的本质区别是只用一位二进制码进行编码,但这一位码不表示信号抽样值的大小,而是表示抽样时刻信号曲线的变化趋向。76

4.1.2ΔM的调制原理如何在发送端形成f′(t)信号并编制成相应的二元码序列呢?仔细分析一下图4―1,比较在每个抽样时刻Δt处的f(t)和f′(t)的值可以发现,

当f(iΔt)>f′(iΔt_)时,上升一个σ,发“1”码;当f(iΔt)<f′(iΔt_)时,下降一个σ,发“0”码。

f′(iΔt_)是第i个抽样时刻前一瞬间的量化值。77图4―1增量调制波形示意图78根据上述分析,我们给出增量调制器框图如图4―2所示。f′(iΔt_)可以由编码输出的二进制序列反馈到一个理想的积分器以后得到。由于该积分器又具有解码功能,因此又称为本地解码器(译码器)。f(iΔt)和f′(iΔt_)的差值,可以用一个比较电路(减法器)来完成。量化编码可以用一个双稳判决器来执行,并生成双极性二进制码序列。具体调制过程描述如下:79

设f′(0-)=0(即t=0时刻前一瞬间的量化值为零),因此有t=0时,e(0)=f(0)-f′(0-)>0,则Po(0)=1t=Δt时,e(Δt)=f(Δt)-f′(Δt_)>0,则Po(Δt)=1t=2Δt时,e(2Δt)=f(2Δt)-f′(2Δt_)<0,则Po(2Δt)=0;t=3Δt时,e(3Δt)=f(3Δt)-f′(3Δt_)>0,则Po(3Δt)=1;t=4Δt时,e(4Δt)=f(4Δt)-f′(4Δt_)<0,则Po(4Δt)=0;t=5Δt时,e(5Δt)=f(5Δt)-f′(5Δt_)>0,则Po(5Δt)=1;t=6Δt时,e(6Δt)=f(6Δt)-f′(6Δt_)>0,则Po(6Δt)=1;80图4―2增量调制原理框图81以此类推,即可得到如图4―3所示的波形。细心的读者会发现图4―3中的f′(t)和图4―1的波形不一样。其实,图4―1的阶梯波只是为了形象地说明增量调制原理,而实际积分器的输出波形如图4―3(d)所示。82图4―3增量调制过程示意图83图4―3增量调制过程示意图84

4.1.3ΔM的解调原理为了完成整个通信过程,发送端调制出的信号必须在接收端通过解调恢复出原始模拟信号。ΔM信号的解调比较简单,用一个和本地解码器一样的积分器即可。在接收端和发送端的积分器一般都是一个RC积分器。解调过程就是图4―3中的积分过程。当积分器输入“1”码时,积分器输出产生一个正斜变的电压并上升一个量化台阶σ;而当输入“0”码时,积分器输出电压就下降一个量化台阶σ。85为了保证解调质量,对解码器有两个要求:(1)每次上升或下降的大小要一致,即正负斜率大小一样。(2)解码器应具有“记忆”功能,即输入为连续“1”或“0”码时,输出能连续上升或下降。对积分器的输出信号进行低通滤波,滤除波形中的高频成分,即可得到与原始模拟信号十分近似的解调信号,如图4―4所示。86图4―4增量调制译码(解调)示意图87

4.1.4ΔM调制存在的问题

增量调制尽管有前面所述的不少优点,但它也有两个不足:一个是一般量化噪声问题;另一个是过载噪声问题。两者可统一称为量化噪声。观察图4―1可以发现,阶梯曲线(调制曲线)的最大上升和下降斜率是一个定值,只要增量σ和时间间隔Δt给定,它们就不变。那么,如果原始模拟信号的变化率超过调制曲线的最大斜率,则调制曲线就跟不上原始信号的变化,从而造成误差。我们把这种因调制曲线跟不上原始信号变化的现象叫做过载现象,由此产生的波形失真或者信号误差叫做过载噪声。88另外,由于增量调制是利用调制曲线和原始信号的差值进行编码,也就是利用增量进行量化,因此在调制曲线和原始信号之间存在误差,这种误差称为一般量化误差或一般量化噪声。两种噪声示意图如图4―5所示。89图4―5两种量化噪声示意图90仔细分析两种噪声波形我们发现,两种噪声的大小与阶梯波的抽样间隔Δt和增量σ有关。我们定义K为阶梯波一个台阶的斜率式中,fs是抽样频率。该斜率被称为最大跟踪斜率。当信号斜率大于跟踪斜率时,称为过载条件,此时就会出现过载现象;当信号斜率等于跟踪斜率时,称为临界条件;当信号斜率小于跟踪斜率时,称为不过载条件。91可见,通过增大量化台阶(增量)σ进而提高阶梯波形的最大跟踪斜率,就可以减小过载噪声;而降低σ则可减小一般量化噪声。显然,通过改变量化台阶进行降噪出现了矛盾,因此,σ值必须两头兼顾,适当选取。不过,利用增大抽样频率(即减小抽样时间间隔Δt),却可以“左右逢源”,既能减小过载噪声,又可降低一般量化噪声。因此,实际应用中,ΔM系统的抽样频率要比PCM系统高得多(一般在两倍以上,对于话音信号典型值为16kHz和32kHz)。92

【例题4―1】已知一个话音信号的最高频率分量fH=3.4kHz,幅度为A=1V。若抽样频率fs=32kHz,求增量调制台阶σ=?解首先要找出话音信号的最大斜率。若信号为单频正弦型信号f(t)=Asinωt,则其斜率就是它的导数,

,最大斜率为K=Aω。把话音信号的最高频率分量看成是一个正弦型信号,93由式(4―1)可知当A2πfH≤σfs时,系统不过载。所以增量调制台阶为0.668V。94另外,如果模拟信号为交流信号,且信号峰-峰值小于σ时,增量调制器的输出将不随信号的变化而变化,只输出“1”和“0”交替出现的数字序列。只有当信号峰值大于σ/2时,调制器才输出随交流信号的变化而变化的数字序列,因此,把σ/2电平称为增量调制器的起始编码电平。95

5.7语音信号参数编码

基于参数编码理论的编码器由于其数码率比较低,通常称为声码器。根据语音信号的共振峰模型提出了共振峰声码器,该声码器通过对语音信号整体进行分析,提取共振峰的位置、幅度、带宽等参数,构成浊音和清音两个声道滤波器。浊音滤波器采用全极点滤波器,由多个二阶滤波器级联而成;清音滤波器一般采用一个极点和一个零点的数字滤波器。这些滤波器的参数都是时变的。96

5.6.1LPC声码器原理在声码器中最具有代表性的是线性预测(LPC)声码器及其改进型。

LPC声码器是低速率语音编码器,可以得到很低的比特率(2.4kbit/s以下);基于全极点声道模型的假定,采用线性预测分析合成原理,对模型参数和激励参数进行编码传输。LPC声码器遵循二元激励假设,声码器只需对LPC参数、基音周期、增益和清浊音信息进行编码。97LPC声码器工作原理如下图所示5.6LPC声码器原理图98虽然LPC声码器与ADPCM一样,都是基于线性预测分析来实现对语音信号的编码压缩,但是它们之间有着本质的区别,LPC声码器不考虑重建信号波形是否与原来信号的波形相同,而努力使重建信号具有尽可能高的可懂度和清晰度,所以不必量化和传输预测残差,只需传输LPC参数和重构激励信号的基音周期和清浊音信息。99

LPC声码器的缺点

(1)损失了语音自然度。主要是由于过分简单的二元激励模型,不能完全代表丰富的语音信息。(2)降低了方案的鲁棒性。二元的清浊音判决及语音谱中共振峰的作用使清浊音判决及基音提取方案变得很不准确并易受噪声的影响。(3)在LPC中,谱包络中的共振峰位置及带宽估计有时会产生很大的失真。1005.6.2LPC-10编码器

LPC声码器在通信领域,尤其是军事通信领域得到了广泛的应用,利用LPC声码器可以合成清晰、可懂的语音,但是抗噪声能力和自然度比较差。自1986年以来,美国第三代保密电话装置采用了速率为2.4kbit/s的LPC-10e(LPC-10的增强型)作为语音处理手段。101图8.9LPC-10的编码器框图102

1.编码器

(1)编码器基本原理原始语音以8kHz采样率12bit量化得到数字化语音,然后每180个采样点(22.5ms)为一帧,以帧为处理单元。编码器分两个支路同时进行,其中一个支路用于提取基音周期T和清浊音U/V判决信息;另一支路用于提取声道滤波器参数RC和增益因子RMS。103

(2)计算声道滤波器参数利用协方差法对LPC分析滤波器计算l0阶LPC分析预测系数,并转换成反射系数RC,或者部分相关系数PARCOR来代替预测系数进行量化编码。理论上RC参数和PARCOR参数互为相反数,104

(3)增益因子RMS的计算用如下公式计算RMS:式中x(i)是经过预加重的数字语音;N是分析帧的长度。105

(4)基音周期提取和清/浊音检测输入数字语音经低通滤波器滤波,再经过二阶逆滤波(逆滤波器的系数为前面LPC分析得到的短时谱参数)。把取样频率降低至原来的1/4,再计算延迟时间为20~256个样点的平均幅度差函数AMDF,由AMDF的最小值确定基音周期。计算AMDF的公式为106

(5)参数编码与解码在传输数据流中,将10个反射系数、增益因子(RMS)、基音周期T、清/浊音U/V、同步信号Sync编码成每帧54bit。由于传输速率为44.4帧/s,因此,码率为2.4kbit/s。同步信号采用相邻帧1、0码交替的模式。表8.5是浊音帧和清音帧的比特数分配。107表5.5LPC-10的比特数分配(bit)清音浊音T/Voicing77RMS55Sync11k155k255k355k455k54k64k74k84k93k102误差校正020总计54531082.解码器图5.10LPC-10解码器框图109接收到的语音信号经串/并变换及同步后,利用查表法对数码流进行检错、纠错。纠错译码后的数据经参数解码得到基音周期、清/浊音标志、增益以及反射系数的数值,解码结果延时一帧输出。输出数据在过去的一帧、当前帧和将来的一帧共3帧内进行平滑。由于每帧语音只传输一组参数,但一帧之内可能有不止一个基音周期,因此要对接收数值进行由帧块到基音块的转换和插值。110

(1)参数插值原则对数面积比参数值每帧插值两次;RMS参数值在对数域进行基音同步插值;基音参数值用基音同步的线性插值;在浊音向清音过渡时对数面积比不插值。每个基音周期更新一次预测系数、增益、基音周期、清/浊音等参数,这个过程在帧块到基音块的转换和插值中完成。111

(2)激励源清音帧用随机数作为激励源;浊音帧用周期性冲激序列通过一个全通滤波器来生成激励源,改善了合成语音的尖峰性质。语音合成滤波器输入激励的幅度保持恒定不变,输出幅度受RMS参数加权。一组有41个样点的浊音激励信号:

e(n)={0,0,0,0,0,0,0,0,5,-8,13,-24,43,-83,147,-252,359,-364,92,336,-306,-336,92,364,359,252,147,81,43,24,13,8,5,0,0,0,0,0,0,0,0}112

(3)语音合成用Levinson递推算法将反射参数,变换成预测系数。接收端合成器应用直接型递归滤波器合成语音。对其输出进行幅度校正、去加重,并变换为模拟信号,最后经3600Hz的低通滤波器后输出模拟语音。1133.LPC-10编解码器的缺点及改进

LPC-10优点:编码速率低;缺点:合成语音听起来很不自然,即使提高编码速率也无济于事。

114增强型LPC-10e采用如下一些措施来改善语音质量:(1)改善激励源

①:采用混合激励代替简单的二元激励。

效果:使二元激励合成引起的金属声、重击声、音调噪声等得到改善。

②:采用激励脉冲加抖动的方式。③:采用单脉冲与码本相结合的激励模式。

(2)改进基音提取方法。

(3)选择LSP作为声道滤波器的量化参数。1155.7语音信号混合编码混合编码是在保留参

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论