




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.4语音编码的综合分析方法。知道s(n)并找到x(n)的过程叫做分析。给定x(n),寻找s(n)的过程称为合成。低通声码器在原理上的主要缺陷是:它是一个开环系统,开始时只有分析过程,没有合成过程;激励模式太简单了。1.综合分析;3.AbS的基本思想是:用综合来指导分析。将合成器引入编码系统,并与分析器结合,在编码器中产生与解码器完全一致的合成语音。将合成语音与原始语音进行比较,并根据一定的误差标准调整分析器的参数,以使它们之间的误差最小。然后,误差最小的语音参数被传送到接收端,以获得高质量的合成语音。1.综合分析法;4.基于LPC的AbS编码方法。AbS-LPC编码器由三个基本部分组成:(1
2、)基于感知的时变滤波器最小化(包括LPC和基音滤波器);激励信号;2.AbS-LPC编码器,5。AbS-LPC编码器和解码器,2。AbS-LPC编码器,6。防抱死制动系统-线性预测控制编码器。综合分析编码方法的特点是:发起者是一个闭环系统;激励信号没有明显的分类,闭环系统选择与原始语音误差最小的激励信号,使得合成语音质量远优于传统的低通声码器。时变滤波器时变滤波器由级联的低通合成滤波器和基音合成滤波器组成。低通合成滤波器实现语音的短期预测;基于基音合成滤波器的语音长期预测。2。AbS-LPC编码器,8,2。AbS-LPC编码器。语音的短期预测(使用一帧中的前p个样本来预测当前样本)可以用全极点
3、模型来描述,其传递函数为:其中H(Z)称为LP综合滤波器;一个(Z)被称为低压分析过滤器。预测系数ai逐帧更新(帧长度2030毫秒)。语音的长期预测长期预测(使用先前子帧的参数来预测当前子帧的参数)可以由全极点模型来描述,其传递函数为1/P(Z):2。AbS-LPC编码器,10。2.AbS-LPC编码器,延迟参数D是基音周期,bi是语音信号的长期预测系数,所以这两个参数可以直接从语音信号中提取出来,预测系数I的个数在1 (1(q=r=0) 3 (q=r=1)之间,每一子帧(子帧长度为510毫秒)更新一次预测。11,在语音频谱中,与较低能量频带中的噪声相比,较高能量频带中的噪声(例如共振峰值)不
4、容易被察觉,这在测量原始语音和合成语音之间的误差时可以被考虑。在具有高语音能量的频带中,两者之间的误差被允许更大,反之亦然。因此,当计算两者之间的误差时,引入了频域感知加权滤波器W(f)。2.感觉加权滤波器:根据人的听觉特性对预测残差信号进行处理,以产生更好的主观听觉效果。2。AbS-LPC编码器,12。FS是采样率,分别是原始信号和合成语音的傅立叶变换。当E达到最小值时,它在整个积分域内保持一个恒定值。误差定义如下:(2) AbS-LPC编码器在高能量的语音频带使W(f)变小,在低能量的频带使W(f)变大,从而提高了前者的误差能量,降低了后者的误差能量。13,感知加权滤波器W(f)在z域中的
5、表达式是:=01,它控制共振峰误差的增加程度。当=1时,W(Z)=1,此时不进行加权。当=0时,W(Z)等于语音的P阶全极点模型谱的倒数,这表明误差信号谱的能量分布与语音信号谱的能量分布是一致的,但此时听觉效果不好,因为人耳对语音的共振峰更敏感,因此要求更高的信噪比。2.AbS-LPC编码器,实际监听结果显示,在8千赫采样频率下,经验值为0.8。,14,感知加权滤波器的频率特性,2,AbS-LPC编码器,15,3,作为AbS-LPC模型的输入的激励信号源,包含时变滤波器谱模型所不能表征的残差结构,如果相关性超出长期线性预测的范围,它就不能被长期线性预测所包含,并且激励信号还包含用某种方法不能有
6、效表征的随机结构。所有使用AbS方法的声码器都以激励信号源的类型命名。例如:(1)多脉冲线性预测编码;(2)规则脉冲激励长期预测编码;(3)码本激励线性预测编码(CELP);(2) AbS-LPC编码器;2.5介绍几种混合编码方法;(17)使用稀疏脉冲序列作为激励,不再提取音调。不管是清音还是浊音,帧中有限数量的脉冲被用作具有最佳估计幅度和位置的激励信号源。首先,多脉冲激励低通滤波器和多脉冲激励低通滤波器的原理:合成的语音具有良好的自然度和一定的抗噪能力,避免了从算法中提取基音的难题,但算法复杂,需要大量的计算。商业标准:国际海事卫星组织航空系统的语音编码标准,9.6kb/s.MP-LPC特征
7、:18,使用具有变化幅度的等间隔脉冲作为激励,每隔子帧(5毫秒)估计一次最佳激励脉冲,对脉冲的幅度和第一个脉冲的位置进行编码,并将其与LP参数的编码一起发送到信道。在GSM标准中,每个子帧(5毫秒)中有40个脉冲(采样点),并且有13个非零脉冲,非零脉冲之间的间隔相等。非零脉冲之间有两个零值采样点,第一个非零脉冲有四个可能的位置,分别位于第一、第二、第三和第四采样点。第二,常规脉冲激励编码LPC,RPE-LTP-LPC原理,19,RPE-LTP-LPC编码框图,第二,常规脉冲激励编码LPC,20,RPE-LTP-LPC解码框图,第二,常规脉冲激励编码LPC,每帧传输的GSM编码方案的比特分配,
8、21通过采用长期预测和对数量化比等一系列措施,语音编码质量在13kb/s的速率下相当好,其MOS得分为3.8。REP-LTP-LPC的特性,23,2,规则脉冲激励编码LPC的特性,REP-LTP-LPC(续),其抗误码能力较好。如果没有纠错,语音质量在Pe=10-3时不会下降,但在Pe=10-2时会下降,但最大似然分数仍可达到3.0。纠错后,在速率为22.8kb/s,Pe=10-1的情况下,语音质量没有明显下降。编解码延迟约为30毫秒,纠错后为80毫秒。非语音信号的编码效果不理想,传输数据的效果也不理想。24、CELP:在一组预先设计的激励序列矢量码本中,按照一定的准则搜索每个子帧的最佳编码矢
9、量作为激励信号,并对滤波器的参数和码本的标号和增益进行编码。3.码本激励低通滤波器,CELP原理;25.码本激励低通滤波器、CELP编码器原理框图;26.码本激励低通滤波器,CELP编码特性,利用线性预测技术构建声道模型;利用矢量量化技术形成有效的剩余激励;复合分析和感知加权用于闭环搜索,并从码本中搜索最佳码矢量作为激励信号。27,CELP,其根据某些规则将预测误差信号的各种可能样本的编码组合存储在存储器中,就像字典一样,样本的每个编码组合具有一个地址码。接收者和发送者都有相同的码本。发送方预测出错误信号后,在自己的码本中搜索与剩余信号最接近的码矢量的地址码,并将地址码发送给接收方。根据接收到
10、的地址码,接收机在自己的码本中找出相应的码向量,并将其加到滤波器中,得到重构的语音。因为码本的地址码被发送,所以发送的比特数大大减少,从而降低了编码率。关于CELP (1)的码本,3。码本激励低通滤波器28。celp通常有两个码本:自适应码本:码字接近语音的长期周期(音调)结构;固定随机码本:码字近似于短期和长期预测后的语音残留信号。如果码本被很好地编译,则码本中的码字非常接近实际的误差信号,并且码本中的码字很少,从而可以以较低的编码速率获得更好的语音质量。利用AbS闭环系统和码本搜索算法,可以得到最佳自适应码矢量及其最佳增益ga,最佳随机码矢量及其最佳增益gs。加权相加后得到CELP激发源。
11、CELP (2),3的码本。码本激励低通滤波器,29,3。码本激励低通滤波器,g728(CELP),16k/s;G.729(CS-ACELP),8kb/s;IS54、IS95(VSELP、QCELP),7.95kb/s、8.5 kb/s;FS-1016(CELP),4.8kb/s .商业标准,30,FS-1016编码器结构图,3。码本激励LPC、MSPE准则,31,8千赫采样,帧长240个样本(30毫秒),一帧中有4个子帧(60个样本,7.5毫秒),每帧发送144位。采用AbS闭环系统,具有10阶短时线性预测、长时自适应码本搜索、随机码本搜索和感知加权滤波。传输的参数是每帧10个LSF参数(3
12、4位);每个子帧的自适应码本索引(偶数子帧6位,奇数子帧8位)和增益(5位)、随机码本索引(9位)和增益(5位)。FS-1016 4.8kb/s CELP声码器的特性,3。码本激励低通滤波器,32。码本激励低通滤波器。1993年,QCELP QUALCOMM利用QCELC(QUALCOMM CELP)专利声码器算法成功开发了全双工语音编解码器Q4400/Q4401声码器。Q4400声码器可以提供固定速率和可变速率操作模式。固定速率模式有4.0kb/s、4.8kb/s、8.0kb/s和9.6kb/s四种速率供用户选择。可变速率模式可根据输入信号的能量自动将最佳速率从800b/s调整到9600b/
13、s,调整间隔为一帧长(每次20毫秒)。33,3。1991年,IMBE 34岁的QELP(改进型MBE) :码本激励低通滤波器被定为国际海事卫星组织的语音编码标准。DVSI提出的AMBE算法进一步提高了合成语音的质量和鲁棒性。被选为INMARSAT ICO系统和铱星系统的语音编码标准。(4)多频带激励低通滤波器。1988年,麻省理工大学林肯实验室提出了多频带激励语音编码方案。分子束外延能以2.4-4.8千字节/秒的速率合成比传统声码器质量好得多的语音,并具有更好的自然度和环境噪声容限。35,传统声码器的缺点是全频带语音仅由清音和基音周期表示,这导致合成语音的自然度差。对于“干净”的语音信号,二进
14、制激励模型LPC声码器可以以2.4kb/s甚至更低的速率给出具有高清晰度的合成语音。然而,对于有噪声的语音信号,由于不能准确提取语音参数,低通声码器的性能严重恶化。事实上,许多语音段包含周期性和非周期性成分。这一特征表现在频谱上:语音频谱在某些频段呈现出周期频谱的特征,而在某些频段则呈现出噪声频谱的特征。4.多频带激励低通滤波器,传统声码器的缺陷,36。基于语音线性预测模型,CELP对残差信号采用矢量量化,在搜索过程中采用A-B-S方法,并采用感知加权均方误差的最小判定准则,在4.816 KB/s的速率范围内取得了很大的成功,但是当速率进一步降低时,由于没有足够的比特来表示激励矢量,残差信号的
15、量化将产生很大的误差,导致合成语音信号的质量急剧下降。4.多频带激励低通滤波器,传统声码器的缺陷(续),37。语音频谱被分成以基频为中心、基频为带宽的几个频带;根据频谱特征,判断每个频带是否清晰,形成多频带激励频谱。整个激励频谱由基音频率及其谐波以及一组清晰的浊音判决参数表示,这些参数很好地反映了语音信号的特征。在合成语音时,根据每个频带的清音/浊音参数,用不同的激励信号合成语音,最后将分频带合成信号相加,形成全频带合成语音。4.多频带激励LPC,多频带激励语音模型,38。分子束外延用多带激励代替了低通滤波器中的二元激励。无论是浊音、清音还是过渡音,在编码过程中必须提取三个参数:基音频率(或基
16、音周期);基频的每个谐波带之后的每个频带的频谱包络参数(可以近似认为每个频带中的频谱包络保持不变);每个频带的单位/体积决策信息。四、多频带激励低通滤波器,多频带激励语音分析算法,39、四、多频带激励低通滤波器,同时提取这三个参数所涉及的计算量相当大。通常,次优算法用于分两步提取参数。首先,确定每个子带的基频和频谱包络参数,并使用类似A-B-S的方法提取这些参数。然后对每个子带作出单位/体积决定。为了选择未来北美公共陆地移动通信系统的语音编码标准,TIA测试了4个工作在7.2kbps的声码器的语音质量,测试结果见下图。7.2kbps的IMBE算法包括4.4kbps的语音编码和2.8kbps的差
17、错控制编码.测试条件是不同的误码率和不同的移动速度。4.多带激励线性预测控制和分子束外延的性能评估:41.IMBE与其他声码器的语音质量对比测试:42.1993年,DDVPC开始选择美国国防部新的2.4千字节/秒标准。1996年3月,由德州仪器和ASP共同开发的MELP(混合激励线性预测)声码器最终被选中取代旧标准FS-1015。MELP声码器的采样率为8千赫,每180个样本为一帧,帧长为22.5毫秒,每帧量化比特为54比特,总速率为2.4千字节/秒,5。混合激励LPC,43,用混合激励代替基本LPC模型的二元激励,混合周期脉冲激励源和白噪声源作为激励信号,准确描述过渡帧和弱浊音帧的激励信号。借鉴分子束外延算法的分区思想,在每个子带中控制混合比。改进了周期脉冲信号源的合成。对低通滤波器残差信号进行傅里叶变换,提取基波分量,量化后传输到对端合成周期性脉冲激励,提高了激励信号与原始残差的匹配度。MELP声码器的特性,5。混合激励LPC,44,引入非周期脉冲
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- it项目采购合同样本
- 中英投资合同样本
- 买卖标准合同样本
- 共用线路三方协议合同标准文本
- 个人租赁土地合同样本
- 代购柴油合同标准文本
- 住房代理销售合同样本
- 中石油用工合同样本
- 个人坟墓购买合同样本
- 住房公积金购房合同样本
- 湖北省十一校2024-2025学年高三第二次联考数学试卷(解析版)
- 《手工制作》课件-幼儿园挂饰
- 人武专干考试题型及答案
- 2025届高三化学二轮复习 化学反应原理综合 课件
- 2025年北京五湖四海人力资源有限公司招聘笔试参考题库含答案解析
- 常见的酸和碱第2课时酸的化学性质 2024-2025学年九年级化学人教版(2024)下册
- 欢乐购物街-认识人民币(说课稿)-2024-2025学年人教版数学一年级下册
- 2025年中国南方航空股份有限公司招聘笔试参考题库含答案解析
- 疫苗与接种管理制度
- 电子商务案例分析知到智慧树章节测试课后答案2024年秋西安邮电大学
- 《通信用开关电源的元器件降额准则-》
评论
0/150
提交评论