第十一章声码器和混合编码_第1页
第十一章声码器和混合编码_第2页
第十一章声码器和混合编码_第3页
第十一章声码器和混合编码_第4页
第十一章声码器和混合编码_第5页
已阅读5页,还剩95页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第10章语音编码(1)波形编码:概述及分类脉冲编码调制PCM:预测编码及其自适应APC:自适应差分脉冲编码调制ADPCM及自适应增量调 制ADM:子带编码SBC自适应变换编码ATC语音编码:Speech Coding,在语音通信及人类信息交流中占举足 轻重的地位。研究对语音信号进行压缩传输、存储等内容。目前数 字通信得以广泛应用,语音编码是将模拟语音数字化的手段。将语音信号编码为二进制数字序列,最简单的方法是对其直接进行 模/数变换;只要取样率足够高,量化每个样本的比特数足够多, 则可以保证解码恢复的语音信号有很好的音质,不会丢失有用信息。然而对语音信号直接数字化所需的数码率太高,例如,普通的

2、电 话通信中采用8kHz取样率,如用12bit进行量化,则数码率为 96kbit/so这样大的数码率即使对很大容量的传输信道也是难以承 受的,因而必须对语音信号进行压缩编码。语音编码目的:在保持可以接受的失真的情况下,采用尽可能少的 比特数表示语音,即减少传输码率或存储量。编码后同样的信道容量能传输更多路的信号,因而这类编码又称 为压缩编码,压缩编码需要在保持可懂度与音质、降低数码率和 降低编码过程的计算代价三方面折衷。传输码率:也称为数码率,指传输每秒钟语音信号所需要的比特数。语音编码分类:波形编码,Waveform Coder; 参数编码,Parametric Coder; 混合编码,Hy

3、brid Coder波形编码特点:针对语音波形进行编码,尽量保持输入波形不变,即恢复 的语音信号基本上与输入的语音信号波形相同。优缺点:具有适应能力强、语音质量好等优点,缺点是需要的编 码速率高。在16-64kbit/s的数码率上能给出高的编码质量,当数码率进一步 降低时,其性能下降较快。典型的编码方式:脉冲编码调制PCM、自适应差分脉冲编码调制 ADPCM、子带编码SBC等。声码器:即参数编码特点:先对语音信号进行分析,提取出其参数,对参数进行编码, 解码后这些参数重新合成出重构的语音信号。力图使重建的语音 信号具有尽可能高的可懂度,而不必保持波形的一致。优缺点:优点是编码速率低,可以低到2

4、.4kbps甚至以下,缺点是 合成语音质量差,特别是自然度低,处理复杂。典型的编码方式:如通道声码器、相位声码器、同态声码器、线性 预测声码器等。混合编码特点:上述两类方法的有机结合,与参数编码相同的是,它也是基 于语音产生模型的假定并采用了分析合成技术,但同时它又利用了 语音的时间波形信息,增强了重建语音的自然度,使得语音质量有 明显的提高,代价是编码速率相应上升,一般在1624Kbps之间。典型的编码方式:多脉冲激励线性预测编码MPLPC、规则脉冲激励 线性预测编码RPE-LPC、码本激励线性预测编码CELP等波形编码与参数编码的比较波形编码与参数编码的比较波形编码与参数编码的比较参数编码

5、波形编码波形编码与参数编码的比较波形编码与参数编码的比较9 6-64KbpsSNR谱失真和主观听音编码信息比特率语音质量评价方法樓型鑒数2,49.6Kbps波形编码与参数编码的比较波形编码与参数编码的比较缺虑=1随着量化粗糙语音质董下降合成涪音质量较低鲁处理复杂度高按传输码率分类高速率语音编码:速率32kbit/s以上,PCM, 64kbit/s,主 要用于公用电话网;1-1中高速率语音编码:速率16-32kbit/s, ADPCM, 32kbit/s, 主要用于公用网;中速率语音编码:速率4.8-16kbit/s, GSM用的RPE/LTP 13kbit/s> VSELP, 8kbit

6、/s主要用于数字移动通信话音邮 件; 低速率语音编码:速率 1.2-4.8kbit/s, CELP, 4.8kb/s、LPC, 1.2kb/s,主要用于保密话音;极低速率语音编码:速率1.2kbit/s以下脉冲编码调制PCM波形编码方式的最简单形式是脉冲编码调制(Pulse code modulation, 简称PCM)O它直接把语音信号进行采样量化,表示成二进制数 字信号,并通过并串转换过程转换成串行的脉冲,并用脉冲对采 样幅度进行编码,以便于传输和存储。编码效它没有利用语音信号的冗余度,所以信号没有得到压缩, 率很低。般,PCM有均匀PCM、非均匀PCM和自适应PCM几种形式1均匀PCM:

7、不论信号幅度的大小,它都采用同等的量化阶距 进行量化,即采用均匀量化。A/D转换数字语音编码假设董化误差艺仏)在各个量化间隔的区间里均匀分布, 则信号对址化噪声的信噪比可近似写为:SN/?(dB)= 6.02B-7.2其中B为量化器宇长。当要求60dB的SNR时至少应取llo 此时,对于带宽为4kHz的电话语音信号,若采样率为8kHz,则 PCM要求的速率为8KXH = 88 Kbp况2非均匀PCM:均匀量化的缺点就是不论语音信号的幅度大小而董化阶距保持不变 这样在信号动态范围较大而方差较小时,其信噪比将下降。从观测到的语音信号概率密度可知,语音信号大量集中在低幅度 ±o因而,可以利

8、用非均匀量化来弥补均匀量化的缺点。这种量化在输入为低电平时量化阶距小,而高电平时量化阶距大口 即信号概率密度大的区间,量化间隔应该小些;反之信号概率密 度小的区间,量化间隔应该大些。非均匀量化的基本思想是对大幅度的样本使用大的' 对小幅度 的样本使用小的4在接收端按此还原。PCM的量化方式均匀量化与非均匀量化 非均匀量化也可看作是将佶号进行非线性变换后再作均匀量化. 通當被电话系统釆用的PCM,利用语音信号幅度的统计特性,对 幅度按对数变换压縮,将压縮后的信号作PCM,因此称为对数PCMo 在译码时需要按指数进行扩展。这种技术也称为压缩扩张技术。帚化输人国际上釆用两种非均匀量化方法:4

9、律和“律其中律PCM主要在北美和日本使用,A律PCM用于其他-1国家和地区。这两种方式差别很小皿律压缩是最常用的一种。在美国7位“律PCM-般已被接受为K途电话质量的标准。设占(允为语音波形的取样值,则声律压缩的定义为;匕5)杠5而y sgn(*j)jIn 1 +“ X八maxFTi式中用喚是工(小的最大幅度心是表示压缩程.度的参量. p -0表示没有压缩,戸越大压缩率越高,故称之为H律压编心 通常严在100-500之间取值。取尹= 255,可以对电话质量语 音进行编码,其音质与1?位均匀量化的音质相当乜我国则釆用A律压缩,其压缩公式为:FR&)二丙百沖工1 + nA jc( n )

10、/Xnwc ( . 11 + lnA丨R (兀)丨1% *“ /'tnax目前有标椎的A律PCM编码芯片(如2911) PWnnw-2553自适应 PCM(APCM):PCM在量化间隔上存在矛盾:为适应大的幅值要用大的,但为 了提高信噪比又希望用小的亠 除了前面介绍的非均匀量化外,还 有一种是采用自适应方法,称为自适应PCM (adaptive PCM,简 称 APCM) o自适应脉冲编码调制(APCM)是根据输入信号幅度大小来改变量 化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应, 即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即 量化阶的大小在较长时间周期里发生变化

11、。改变量化阶大小的方法有两种:一种称为前向自适应(fonvardadaptation),另一种称为后向自适应(backward adaptation)。前向是指()是由佔计输入信号而得到的,而后向是指由彳占计 量化器的输出S(k)信道缓伸器1一量化器1.11111>¥ D化器边信道前向自适应是根据未量化的样本值的均方根值来估算输入信号的 电平,以此来确定量化阶的大小,并对其电平进行编码作为边信 息(side information)传送到接收端。其特点是使用原始信号提取预测系数,精度比较高,预测的效 果好。但是需要将预测器系数用边信息传送到接收端的解码器,从而减小了差值信号量化

12、的有效比特数,处理的延时比较大。s(k)量器适配器信道Sr(k)量化阶适配器后向自适应是从量化器刚输出的过去样本中来提取量化阶信息。 由于后向自适应能在发收两端自动生成量化阶,所以它不需要传 送边信息。后向自适应预测利用量化后的信号提取预测信号,避免了前向自 适应预测的缺点,但是由于存在量化噪声,使得预测系数的提取 精度收到一定的影响。预测编码及其自适应APC在第六章中我们详细讨论了线性预测分析原理,利用线性预测可 以改进编码中的量化器性能,因为预测误差e()的动态范围和平均 能量均比信号兀小,如果对和)进行量化和编码,则量化bit数将 减少。在接收端,只要使用与发送端相同的预测器,就可恢复原

13、 彳言号x(n)o 基于这种原理的编码方式称为预测编码(predictive coding,简称PC)当预测系数是自适应随语音信号变化时,又称为自适应预测编码 (Adaptive PC,简称APC)。e(n) = x(n) 一 x(n)语音数据流一般分为10 20 ms相继的帧,而预测器系数(或其 等效参数)则与预测误差一起传输。在接收端,用由预测器系数控制的逆滤波器再现语音。釆用自适 应技术后,预测器Hz)要自适应变化,以便与信号匹配。自适应差分脉冲编码调制ADPCM 及 自适应增量调制ADM一 增调制(DIM!)及自适应增调制(ADM)1 增调制增壘调制简称为DM或AM,是对一个语音信号的

14、信息用最低限度的一位来表示的方法。在这种调制方式中,首先判别下一个语音信号值比当前的信号值是高还是低,如果髙则给定编码“广,如果低给定为这 样来进行语音信号的编码。X(z)如果差值为正,即下一个语音信号值比当前的信号值高, 则量化器输岀为m如果差值为负,即下一个语音信号值比现在的信号值低,则 量化器输出为“0J在接收端,用接收的脉冲串控制,信号就可以用上升下降的阶 梯波形来逼近。在DM中,与量化阶梯相比,当语音波形幅度发生急剧变化时, 译码波形不能充分跟踪这种急剧的变化而必然产生失真,这称为 斜率过载。相反地,在没有输入语音的无声状态时,或者是信号幅度为固定 值时,量化输出都将呈现0、1交替的

15、序列,而译码后的波形只是 的重复增减。这种噪声称为颗粒噪声,它给人以粗糙的噪声感 觉。两种噪声的形式2.自适应增量调制ADM为了减少斜率过载失真,必须把设计得大一些;但是过大, 又增加了颗粒噪声。因此,兼顾两方面要求,需按均方量化误差 为最小(即使两种失真均减至最小)来选择即采用随输入波形自适应地改变大小的自适应编码方式,使厶 值随信号平均斜率而变化;斜率大时,自动增大;反之则减小。 这就是自适应增量调制(Adaptive, DM,简称ADM)。引入自适应技术后、ADM大约可增多10dB的增益。实验表明, 取样率为56kHz时ADM具有与取样率为8kHz时的7bit对数PCM相 同的语音质量。

16、差分脉冲编码调制DPCM降低传输比特率的一种方法是减少必须编码的信息量,这要利用 语音信号中大量的冗余度。在相邻的语音样本之间存在着明显的 相关性,因此,对相邻样本间的差信号(差分)进行编码,便可 谋求信息量的压缩,因为差分信号比原语音信号的动态范围和平 均能量都小。这种编码称为差分脉冲编码调制(Differential PCM,简称DPCM) oDPCM实质上是预测编码APC的一种特殊情况,是最简单的一阶 线性预测,即A二 1当Q二1时,被量化的编码是e(n)=x(n) - x(n-l)sG)是输入语音信号,SpG)是重建语音信号,作为预测器确定 下一"信号估计值的输入信号。Sp(

17、n)是预测语音信号,d(n) 是预测误差信号,也称为差值信号或余量信号。DPCM系统 实际上就是对这个差值信号进行量化编码,用来补偿过去编码 中产生的量化误差。DPCM系统是一个反馈系统,采用这种结 构可以避免量化误差的积累。切)是量化后的差值信号, 心)是d$ (斤)的代码o由于0是固定的,显然它不可能对所有讲话者和所有语音内容 都是最佳的,如果采用高阶(1)的固定顶测,改善效果并 不明显;比较好的方法是采用高阶自适应预测。采用自适应量 化及高阶自适应预测的DPCM称为ADPCM,它本质上也是一种 APCoCCITT (国际电报电话咨询委员会)在1984年提出的32kbit/s编 码器建议(

18、G. 721),就是采用ADPCM作为长途传输中一种新 的国际通用语音编码方案。这利1 ADPCM可达到标准kbit/sPCM的 语音传输质量,并具有很好的抗误码性能。子带编码SBC子带编码(Sub-Band Coding,简称SBC)也称为频带分割编码1带通滤波频率搬移量化编码Avv9f 9 Aw合带通滤波频率搬移J s2量化编码路带通滤波频率搬移量化编码发信码首先使用带通滤波器组将语音信号分割成若干个频段也称为子带, 然后用调制的方法对滤波后的信号即子带信号进行频谱平移变成低 通信号(即基带信号),以利于降低取样率进行抽取;再利用奈奎 斯特速率对其进行取样,最后再进行编码处理。而信号的恢复

19、按与 上面完全相反的过程进行。SBC解码器在接收端,把总的编码分成各子带的编码值,分别解码,再经频谱 平移,带通滤彼,最后相加得到重建信号。SBC的优点是对应于人的听觉特性,可以比较容易地考虑噪声的抑 制;即各子带可以选用不同的量化参数以分别控制其信噪比,满足 主观听觉的要求。例如,由于语音能量的不平衡,对于含有基音频率和第一共振峰 的低频部分,对语音清晰度等主观品质影响较大,应分配比较多 的信息、量化细些;反之,高频部分的量化就可粗些。这样,可以减少量化噪声对听觉的妨害程度,整体上也能降低 比特数。另外,量化噪声只能出现在各被分割的频带内,对其 他频带没有任何影响,所以可以较容易地控制噪声谱

20、。各子带的带宽可以是相同的也可以是不相同的,相同的称为等带 宽子带编码,不同的称为变带宽子带编码。等带宽子带编码的优点是易于用硬件实现也便于进行理论分析。 设有M个子带,则对于等带宽子带编码,艸二W/MM 二 1,2,,M直中附是编码系统总的带宽,M是子带总数在变带宽編码中,常用的子带划分方法是令各子带宽度随由增加而增加,也就是低频段的子带宽度较窄,高频段的较宽。这样划分环仅和语音信号的功率相匹配而且也和语音信号的可懂度:EO. tUL或清晰度随频率变化的关系相匹配。中具有相同带寛的各子带对语音可懂度研究表明,语音信号频带H影响是不同的。低频段的彩响大,高频段的影响小。因此,将低频段 的子带分

21、得细一些,量化精度高一些,就可能使整个重建语音的质 量高一些。但是在等带宽分割时,肘不同子带分配不同的比特数,等带宽子带 编码也能获得很好的质量戋持别是当M比较大时(例如M=16或32SBC中,相邻子带的交迭区或间隔应尽量小。为了减小相邻子带 的交迭区或间隔,滤波器的滚降特性应该比较陡'代价是增加滤波 器阶数。川12i3412 .34l H W) Ia*(a)理想四了帯诞波曙组幅频特性实际滤波器幅度响应都有有限滚降持性,因此,在具体实现滤波组 时有两种情况。424(b)四f带滤波器组幅频特性一种是各子带滤波器之间有交叠区域。若按理想带通滤波器Nyquist 速率采样,则会产生混叠若按实

22、际子带宽度的Nvquist速率采样, 则会增加总的编码速率。第二种情况各子带之间有一定的间隙。实际语音带宽小于原始语音带 宽,虽可以降低总的编码邃率但重建语音会产生混响的主观感觉。这两种情况都要求滤波器组的滚降特性比较陡,尽最接近理想带通特性,其代阶是必须增加滤波器阶数,从而使硬件复杂化。实际应用中SBC往往采用“整数带”取样方法。因为该方法 不需要调制器来平移各子带的频谱成分,所以有利于硬件实现。整数带分割是措各子带的下截止频率几恰好是该子带 宽度的整数倍,即:根据带通信号的采样定理,这时可以用f = 2SW,直接对 子带信号采样,而不发生混叠。图给出了子吊信号的取样、编码和解码过程:/.&

23、#39; ”1回壬巴-/ .f理*叫丿;-( + )/;打.-mJ 仆 /2匚 3Z 4/.J 丨 t t !5)幅度iffW=22/.(卜2 /. j,按厲赢样1 /-2/.02./.4/.'. 山心样洽诂打谱 “2丿;”M誌L 颅构常廿谱在发送端,各个滤波器的输出按2£速率轉取样(£是第i个子带的带宽), 重新取样后的子信号经编码和多路器后送入数字信道。:在接收端,分路器和解码器恢复岀各子带信号,它们经过补零、再增加取样, 和原始信号昭口)相同;再通过和发送端相同的一组带通滤波掘”最后对各 滤波器输岀求和便产生出重构的语音信号。正交镜像滤波器组对于各子带之间有叠

24、接的滤波器组,如果按理想带通的Nyquist采样 定理对子带信号采样,则会产生混叠。为了减少混叠造成的失真,滤波; 器的滚降特性必须陡lb肖,这就要求滤波器的阶数较高。在数字滤波器 实现中为了实现线性相位滤波,往往需要采用128256阶甚至更高 阶的FIR滤波器才能使混叠效应不至于对编码质量产生明显的影响, 这无疑会使实现滤波器的运算负担太重。止交镜像滤波器组QMFB 不但能够解决混叠问题,面目对滤波器的滚降特性可以大大降低要求, 般只要16-32阶就足够。这种方法首先将整个语咅带分成两个相零部分Hi形成子带,然后 这些子带被同样分割以形成四个子带。这个过程可按岛藍重龛. 以产4;任何吵个了帑

25、窓采用这种方法的滤波器就称为正交镜像 滤波器°止交镜像遞波器的原理如图°图仪是低通滤波器,其通带为 工5)的下半带;浙仮绘上半带,是相应丁出的镜像滤波器。 这种滤波器所具有的性质是:匕子带滤波器的频率响应足卜 严带滤波器频率响应的镜像,即I H(出曲)| = |武中、口二2处£ = 2tt/ T是卞(几)的取样角频率(.这样一对滤波器可用有限冲激响应(FIR)数字滤波器实现,U2是将乩冲激响应每隔-个样本的符号反号由H得到的。子带每分隔一次+采样率就随着降低1倍。在接收器,输人样本 通过内插进行过采样,并采用与发送端滤波器相匹配的数字滤 波器进行带逋滤波7自 适应

26、变换编码ATC利用正交变换,把信号从时域变换到另一个域°正交变换可起相关的作用,使变换域系数集中在一个较小范围内把语音数据串分成相邻的帧J每帧由运算A进行变换并对变 换值进行编码和传输匕在接收端由反变换来恢复原来语音。设-帧涪昔信号讯九)w " W N -,町以形成个咲量 x = 15 (0), (I )H- j(yv - |) J1这里T表水转置J该矢最通过一个正交变换矩阵A ,作一个线性变换式中M满足4"y -肛A1,J中的兀素就是变换域系数,它们被竝化后形成矢量" 在接收端通过逆变换重构出倍号矢量ix = Ay = 4tj 这里,问题是要提供一种合

27、适的正交变换“主要选择对象有DFT、沃尔什-哈达马变换、离散余弦变换DCT (Discrete Cosine Transform) KLT变换(Karhunen - Ueve Transform)。目前正交变换都采用DCT, 并往往将这种方式称为ATS其原因是DCT有以下特点:(D DCrr与KLT相比,频域变换明确且与人的听觉频率分析机理相对应,因此容易控制量化噪声的频率范围匚 DCT提供的性能一般在KLT的1 - 2 dB之内其他变换则相当差。而KLT的计算量太大。 由于DCTH需在每帧采用FFT运算即可,因此运算董、数据量少他不 需要传输特征矢量。 由于DCT统计地近似丁氏时间最佳正交变

28、换和特征矢量,所以DCT与DFT相比,统汁地看DCT变换效率高° DC7与DFT相比号在端点取岀彼形的影响较小,在频域区的畸变小。TV点DCT定义如下Y -X)血)二 x( rz) i)cos "2" g 甘"(0 虫 & w 川 一 1)n = Ui其反变换为*( n)=寺 £ Xf( c( fe)cos "" ; JT(0 w n W w - 1)式中I ( k = 0)U'2(1 w & w /v - i)ATC系统的原理框图c上4离敝余轮变换一虽:化編叫=解碍一4余弦反变换计斤比特分 配駅化何

29、隔佔计诸按每一帧作DCT变换,把DCT系数划分为20个左右的 频带,求各频带的平均功率,作为边带信息传送口;这样,编码器输出的信号为表示频谱包络的辅助信息以 及被量化过的DCT系数舁专输边带信息需要2 kbit/s的数 据量。第11章 语音编码(2)-声码器技术及混合编码参数编码也称为模型编码。它是对语音信号建 立模型,然后对模型参数或是语音的特征参数进行 编码,力图使重建语音信号在听觉上具有尽可能高 的清晰度和可懂度。线性预测声码器是一种参数编码方法。参数编码利用生成模型,在幅度谱上逼近原诰音,但重建语音的波形与原语音信号的波形较大差别。参数编码实现语音通信的设备通常称为声码器;例:通道声码

30、器、共振峰声码器、同态声码器、LPC声码器;§11.1线性预测声码器线性预测声码器:应用最成功的低速率参数语音编码器。与利用线性预测的波形编码不同的是它的接收端不再利用残差,即不具体恢复 输入语音的波形,而是直接利用预测系数等参数合成传输语音。 LPC有作为预测器和作为模型的双重作用。直接量化预测系数不介适,因合成误差大,甚至系统不稳定。 解决办法:或用较多的bit量化每个预测器系数。或将预测器系数变换成具它参数形式。归纳起来,有以下儿种(1) 反射系数仏,危,,冷。分析表明:在区间-11对反射系数作线性量化是低效的:比特数应非均分配,仏和他的比特数多些(56 bit) o(2) 对

31、数面积比,師。g = lg 1 += lg4 ; / = 1,2,-! 1- 4式屮 咼,&+ 声管第?节和第汁1节的截fin积。上式映射,使g呈相当均匀的幅度分布,可以采用均匀量化; 参数间相关性低,经内插产生的滤波器是稳定的,需 56 bit 量化。',. -(3) 预测多项式的根务叽、kp o对预测多项式4分解因式,有*)=1-& 件,b)对预测多项式的根进行量化,易保证合成滤波器的稳定性。 每个根平均用5 bit量化就能精确表示屮包含的频谱信息。问题:求根运算量大,计算效率低,故该算法少用。> 一帧典型的LPC参数包括:1 bit清/浊音信息、大约5 bi

32、t增益常数、6 bit基音周期、反射系数或对数面积比平均56 bit量化(共有812个) 每帧共约60 bit。若25 ms帧,则编码速率为2斗kbit/s左右。2.变帧率LPC声码器充分利用了语音信号在时域上的冗余度,尤其是元音和擦音在发音过程中都有 缓变的区间,描述这部分区间的语音不必像一些快变语音那样用很多比特的信语音信号是非平稳的时变信号,波形变化随时间而不同。(清音至浊音的过渡 段,语音特性变化剧烈,理论上应用较短的分析帧,要求LPC声码器至少每隔 10ms就发送一帧新的LPC参数;而对于浊音部分,在发音过程中有缓变的区间 ,语音信号的频谱特性变化很小,分析帧就可以取长些;在语音活动

33、停顿情况 下更是如此。)因而可以采用变帧速率的编码技术来降低声码器的平均传输码率。心辭数:Z鑑曲跡蠶瑟囁氐鑼码率。謡问题:需要一种度量方法来确定当前帧参数和上-帧参数之间的差异(§11.2 LPC-10 编码器LPC10卢码器>LPC-l(h美国1976年确定的2.4kb.to语音通信的标准技 术。1981年公布作为联邦政府标准FED-STD-1015oA该算法可介成清晰、可懂的语音,但抗噪能力和自然度欠佳。>LPC-10e: 2.4kbJ必速率,LPC-1O 的增强型。> H JL986年以来,美国第二代保密电话装宜采用LPC-lOeo »本节主要包括:

34、>.发端编码器* > 收端解码器% LPC-10声码器存在的问题1.编码器LPC-10编码器框图(帧180个样,帧长22.5 ms) 预加重滤波器的传输函数:”严=1-0.9375L】声道滤波器参数RC、增益卍席用准基音同步相位法计算。2.计算声道滤波器参数用7采用10阶LPC分析滤波器,利用协方差法计算预测系数:ava2".a1Q,(用U卩分解法对系数矩阵求逆)转换成反射系数或部分相关系数(PARCOR) o(理论上,RC和PARCOR互为相反数) LPC分析采用半基音同步算法,即浊音帧长度取为130个样本以内的基音周期整数倍值, 来计算和增益心於。每一个基音周期都可以

35、单独用一组系数处理。清音帧长度为22.5 ms的整帧屮点为屮心的130个样本 形成分析帧来计算R0和RA1SO3.计算増益RMS用如下公式计算増益RAIS:RMS =式屮 XU')经过预加重的数字语音; 分析帧的长度。4.提取基音周期和检测清/浊音 x输入语音经3 dB截止频率为80() Hz的4阶Buttenvorth低通滤波,滤波后信号冉经二阶逆滤波。 (盪诡波器葩系敷苟喩而LPC今桁爾列屜親时需畚嶽丿 取样频率降低至原来的1/4,再计算延迟时间为20- 156个样点的AMDF, 基音周期:由AMDF的最小值确定。 计算AMDF:公式为AMDF(r) = Y: x(m)- x(m

36、+ r)|式中,t = 20,21,22,.,40,42,44,.,80.8488,156;相当丁在50400 Hz范围内计算60个AMDF值。清/浊音判决:利用模式匹配技术,基丁低带能量、AMDF函数最大值与最小值Z比、过零率作出的。 对基音值、清/浊音判决结果用动态规划算法:嗪裁1 在3帧范围内进彳亍平滑和错误校正,从而给出当前帧的基音周期T、清/浊音判决参数U讥每帧清/浊音判决结果用两位码表示四种状态:00:稳定的清音;01:清音向浊音转换;10:浊音向清音转换;11:稳定的浊音。LPCJLO 的 bit 分配浊音清音浊音清音ZVoiciiis774RMS冷 JJ.爲4Sync11%45

37、%3爲气5102kp 5误差校正0205总计545345 参数编码与解码 LPC-10的传输数据流含:10个反射系数:济应血0,增益RAIS.基音周期丁、 清/浊音UA-同步信号Sync.同步信号采用相邻帧1、0码交替的模式。编码成每帧54 bit。传输-44.4帧人,编码速率为2 4 khit&o> :浊音帧和清音帧的比特分配。(1) 反射系数的编码S解码 厂用对数而积比品表示反射系数&方法编码,具关系为:+上吕二lg ;/ =J0xLPC-10,先将&变换成再查表量化。方法如下: 符号转换:对丁浊音,血被向+1偏負。 侪和底作对数而积比后,确定仏和亿的符号,负

38、T,正=0:对何和危的绝对值除以2X若±63,取为63,否则取原值。查表2得4 bit码字再附上符号位,得5 bit码为编码输出o表9.2对数面积比编码对数面积比编码对数面积比编码对数面积比编码对数面积比编码05027-33449-5286012612134-38553-559611313-1923943656,5710621420-26344 “ 48758,59116315注:PARCOR参数上的绝对值作为序号于負的上参数用2进制补码运算 浊音帧:心心。取整后除以厶 加上表93屮对应的偏置数,冉乘上表9;的比例因子后取整(具值在范-127-127 内),用8减左按表9-1分配的比

39、特数的位数右移,剩下的比特数即为编码输出,具屮含1位符号位。 浊音帧:用表9.5 (见下页丿对接收的处和他解码,对T'io加一个量化偏置以补偿量化的影响,然后以发送端 相反的相应操作去偏置和去比例因子,即乘以2打,取整。表9.3 FARCOR参数的偏置表参数k3趣k910偏置-1152+28164-1536+3584+ 1280+2432-768+1920>1:偏置加到参数带特号移住Mbit的值上.偏置 一1152 十 2816 十乃 36十 3%4十1280十 2432768 十 1920>i:偏蓋加到参数带脊号移侵坯bit的值上表9.4 FARCOR参数的比例因子参数k

40、5k78比例因子0.00560.00630.00680.00720.00740.00730.00840.0102注:比参数放比例因子扩展为6 bit分布.表9占对数面职比解码表编码对数面积比编码对数面积比编码对数面积比编码对数面积比编码对数面积比0262313431925501672714462057276129830154821582862313933165022 59306341610361752235931 63519113918542460注:接收上参数的绝对值尙左移一便作为解码序号.非浊音帧(清音或过渡音):仅发送k严屮(& 4') Hamming扩展码保护和RAIS

41、的4个高有效位;设4位信息码为/71=777077?1叫皿3'发送码字1円务叫吋爭屮讥尹"则编码方程为:(最偸省软洼丛僑码丿v0 二 m0, v4 二叫刀2 W m2. v = /;71, v5 =叫 mx © 叫 r v2 = m2. v6 = /77O m2 m3 v3 m3, v7 - m ffl m2 叫(2) 恥卅参数的编码、解码KA/S参数用查表法进行-编码、解码。表9.6:数值在2512 Z间的圧於值用步长为0.773 dB的对数码表进行编码和解码。表96用跑编码表序号丄换空值序号WE值序号WE值序号用府值序号用府值序号皿空值序号皿空值序号皿空值008

42、41682416323240664813556275109417825173335417249147573002110518926193439427950164583283.11151910272135424386511765935942126201128233646449452192603925213621122925375145:103532106142863 :14722133027385546113542306246873157231531303960471235525163512注:用对分法查表.在表內我到序号后.序号廉以2即为发送比特. 计算公式为:序号=202)/0.773(3)

43、 基音、清/浊音编码、解码 60个基音值和清/浊音编码用7 bit编码表不。清音/过渡帧;用矢量000C)0C)0/表示: 60个基音值用码字重量3或4的7 bit Gray码编码;A表9.7:编码方案。解码时,收到的7 bit矢量,若码字重量为3或4时,按表97的基音周期编码表解码;若码字重量为0或1时,则判定接收帧为清音帧;表9.7基音周期编码表Gzy码周期GiayS§周期Gmy码周期Grny 码周期Gray®周期Guy码周期0010011200001111300110101401011010601001101801110001120000101121000011131

44、0110001421011000621001001841110000124001101122010011132011001144101110064 '10010118811100101280011001230100110330110010461010100661001010921100010132001110124010111034011011048101011068 .100111096110101013600 W1012501010103501 101005010100107010001101001101000140001011126010101136011110052101001

45110110014400101102701010013701110005410100017410000111081100100148001111028010110138oiii .010561010101761100011112110010115200011102901001013900110105810001017811000011161001100156若码字重量为7或6时,则判定接收帧为过渡帧; 若码字重量为2或5时,则判定接收帧为无效帧。最后按表9.8的比特顺序,组成发送比特流发往线路。表9.8发送比特流bit浊音清音bit浊音清音bit浊音清音Bit浊音清音1

46、妬,0同左15近2同左29go43耳22同左16同左3044褊23乓,0同左17务3同左31可4同左45D/c4Tfl同左18$2同左32虬4同左46心,25Rfi同左19每3同左3331.547同左6心,1同左20同左34艰048闵,17同左21尺3同左35爲,149匕38褊1同左22為,4同左364 550饥,3爲,89盜1同左23觴3同左3751為,3褊810同左24的4同左38去Lj652為2怠,811俎2同左25褊3同左3953心,312褊0同左26R4同左40盘? 2為;754sync同左13同左27石3同左41忌014氏2同左28饥4同左42同左注;1 发送顺序是从bit 1到b

47、it 54;2. T是基音”氏是RM& k是反射系数;3.参数丁后的数字爲严表示的是第j位bit。图9占:LPC-10收端解码器框图。接收信号经串/并变换及同步后,用查表法进行检错、纠错。译码后的数据经参数解码得:解码参数,结果延时一帧输出。输出数据在过去帧、当前帧和将来帧,共3帧内平滑。每帧只传输一组参数,但一帧内可有不止一个基音周期,因此,要对接收数值进行由帧块到基音块的转换和插值。(1) 参数插值原则。对数面积比参数值毎帧插值两次; RMS参数值在对数域进行-基音同步插值;基音参数值用基音同步的线性插值; 在浊音向清音过渡时对数面积比不插值。每个基音周期更新一次预测系数、增益、基

48、音周期、清/浊音 等参数,这个过程在帧块到基音块的转换和插值屮完成。(2) 激励源。根据基音周期和清/浊音标志决定耍采用的激励信号源。清音帧用随机数作为激励源;浊音帧用周期性冲激序列通过一个全通滤波器来生成激励源, 语音合成滤波器输入激励的幅度保持恒定不变,输出幅度受RMS参数加权。给岀一组有41个样点的浊音激励信号:丽二0、0, a Q 0,0,0, Q 5, & 13, 24 43,8U47, 252,359, 364,92,336 -306. -336 92.364.359,252.147 8143、24,13, & 5.0. Q 0, (X 0.0.0、0若当前的基音周

49、期不等于41个样点,则将此激励源截短或者填零,使之与基音周期等长。(3)语音合成。用Levinson递推算法将反射参数变换成预测系数。 收端合成器应用直接型递归滤波器合成语音。对具输出进行幅度校正、去加重,并变换为模拟信号, 最后经3600 Hz的彳氐通滤波器后输岀模拟涪音。LPC-10声码器存在的问题(1) 损失了语音的Fl然度。实际语音的残差信号屮,有部分既非周期脉冲乂非随机噪声; 或者低频段是周期脉冲,高频段是随机噪声。采用二元激励代替残圣信号,使合成语音听起来不H然。(2) 稳健性(Robustness)垦。噪声环境下,基音周期和清/浊音判决不易准确提取。噪声较强时,系统性能显著恶化。

50、(3) 共振峰位置及带宽估值会有很大失真。失真的原因是浊语音段时域上的周期重复信号使得短时语音谱 形接近于线状分布谱。基频较大,且与谱包络中共振峰久相接近,即方=1几 由丁 LPC谱估计力图使模型谱逼近丁信号谱包络, 在估计岀的谱包络屮会岀现极其尖锐的峰值O 在合成语音中会出现尖峰或较大毛刺,从而影响语音质量。§ 11.3语音信号的混合编码20世纪80年代后期,综合了参数编码低比特率与波形编码高语音质量优点的混合编码得到广泛的使用。最为典型的就是CELP模型。它在比特率为4-16Kbps时已经可以得到比其他算法 更高的重建语音质量。:得到最广泛应用的是LPAS (基于线性预测技术的分

51、析合成编码方法),通过线性预测确定系统参数,并通过闭环或分析-合成方法来确定激励序列。0感知加权滤波器:使得量化误差能被高能量的共振峰 所掩盖。« 3种最常见的分析-合成线性预测编码算法分别是: 多脉冲线性预测算法(MPLPC)规则脉冲激励线性预测编码(RPE-LPC):码激励线性预测编码(CELP):具有较高质量的合成语音和良好的抗噪性 和多次复接能力,近年很多声码器基于该模型。传统的LPC声码器采用的是二元激励,它将激励源分为清音 和浊音;CELP的主要改进是采用矢量量化技术对激励信号 编码,将事先经过训练得到的一组码矢量组成一个码本,然 后对每一帧语音信号从这组码本中选出一个在感知加权误差 最小意义上的最佳

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论