


下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 一种增强的LPC参数多级矢量量化技术 一种增强的LPC参数多级矢量量化技术 类别:通信网络  矢量量化(Vector Quantization)是一种极其重要的信号压缩方法,广泛应用于语音、图
2、像信号压缩等领域。信息论的一个分支“率-畸变理论”指出,无论对于何种信息源,即使是无记忆的信息源(即各个采样信号之间互相统计独立),矢量量化总是优于标量量化,且矢量维数越大优度越高。因此,目前国内外对于矢量量化技术的研究非常广泛而深入。平衡考虑量化效果和运算复杂度,多级矢量量化(MSVQ)提供了一个很好的折衷办法。  线性预测编码(LPC)参数能很好地表征语音信号的短时谱包络信息,在各种LPC参数中,线谱频率(LSF)1较其它参数能更有效地表达LPC信息。K.K.Paliwal和B.S.Atal仔细研究了用2426个比特量化一个10阶LSF参
3、数的方法,提出了分裂矢量量化(Split Vector Quantization)和多级矢量量化MSVQ(Multistage Vector Quantization)两种方案,并且试验得到了用25比特的2级MSVQ能取得较好的量化效果(平均失真1dB,24dB概率小于2%,大于4dB为0)。  MSVQ算法有效减小了码本容量,但如果在量化比特有限的情况下,想取得透明的量化效果,必须解决两个问题:(1)怎样搜索码本得到最佳匹配索引;(2)怎样设计码本。在算法设计中这两个问题必须统一考虑。对前一个问题,为了方便一般采用序列搜索算法,依次搜索得到
4、各级的最佳匹配矢量。在码本设计中,更多的也是分级依次进行码本训练,割裂了各级码本之间的相关性。本文将着重研究多级矢量量化的联合优化码本设计问题。  1 问题分析  传统的MSVQ算法在LSF参数码本设计时采用一种连续(stage-by-stage)的设计方法,第k级码本只与前面的第1至第(k-1)级码本有关,而不考虑后续各级码本,即将后续各级码本内容视为0。在量化时,同样只在本级寻找1个最佳匹配矢量,然后得到余量矢量送入下一级量化。量化过程可以
5、用式(1)表示,假设有2级码本,需要找出各级码本索引:  其中,K1和K2是第一、二级的码本容量。最终量化结果为:  在序列搜索算法中,搜索yi时,假设zj为0,搜索zj时yi已经固定。这样的搜索算法显然是一种次优的搜索算法,解决这个问题的方法是全搜索3。全搜索是最优的搜索算法,但是其计算复杂度却是
6、难以承受的。例如,一个25比特2级码本(13-12结构),其全搜索复杂度是上述连续搜索的2000倍以上。M进制搜索4折衷解决了这个问题。在运算量大大减小的情况下,取得了逼近全搜索的量化效果。  在码本设计中,无论是经典的GLA算法还是改进的模拟退火(SA)算法,码本设计都是逐级连续进行的。利用各级码本之间的相关性优化码本设计,可以较明显地改善MSVQ的量化效果。在应用联合码本设计方法量化音频DCT系数时,已经取得了大约0.4 dB的SNR改善5。本文在量化LSF参数时,对比300步的SR算法,得到了大约0.05dB、约1bit的加权对数谱失真
7、(WLSD)6的改进效果。  2 算法说明  21 失真距离量度  对一个MSVQ码本,为方便考虑假设共有2级码本。LSF参数为10维矢量。对LSF参数而言,其敏感矩阵(sensitivity matrix)是对角阵,因此可以用加权最小均方误差(WMSE)代替加权对数谱失真(WLSD)作为失真量度6。量化失真
8、;  其中,wi为功率谱幅度加权,ci为LSF参数人耳听觉加权。  r的经验值一般为0.15。  22 理论推导  对一个训练矢量集X和两级码本Y、Z,可以对X中每个矢量进行2级全搜索,得到最佳索引值对(i,j)。根据i和j的不同可以对
9、X中每个矢量进行聚类。假设S为对第一级码字形成的聚类,Si为所有X中第一级量化索引为i的训练矢量集合。同样假设R为第二级码字聚类,可知,S1,S2,SK1和R1,R2,RK2均是同一X集合的不同划分。对于XSi,平均量化失真为: Z的输入为(x-y),因此(5)式也可表达成:
10、160;  令U=Q2(x-yi),并引入一个中间矢量v,则(6)式成为:  可以令v=Ex-U|xSi,则第三项为0。第二项恒为非负,所以 &
11、#160;  因此,在不改变第二级码本的情况下,更新第一级码字yi可以减少平均失真,新的码字为如下条件期望值:  同样,在第一级码本固定的情况下,第二级码本按(10)式更新得到的将是最优码字。  通过多次迭代,可以得到联合优化的最优码本。
12、0;  23 算法描述 (1)设置初始码本,读入训练矢量文件,并对其进行两级码本全搜索,得到针对两级码本的聚类S1,S2,SK1和R1,R2,RK2。假设训练矢量个数为num,对所有训练矢量计算此时的量化失真之和  失真测度采用WLSD距离。设置迭代最大步数N,设置初始步数n=0;
13、60; (2)n=n+1,利用式(9)更新第一级码本; (3)重新对训练矢量集进行全搜索,得到新的索引值对(i, j),然后利用式(10)更新第二级码本; (4)再次对训练矢量集进行量化搜索,得到新的索引值对(i, j),并重新计算量化总畸变Dn; (5)判
14、断n=N?若n< N,跳转至(2)继续进行迭代;若n=N,结束迭代,保存更新后的码字至码本文件。  24 算法的进一步优化  上述联合优化MSVQ算法中,很重要的一步就是对训练矢量进行聚类,使每个训练矢量得到一个最匹配的索引值对(i, j)。(i, j)应当是通过全搜索得到的全局最佳匹配矢量。在不需要在线更新码本的情况下,全搜索是可以采用的。然而如果在矢量维数较高时,想减小码本训练的运算
15、量,也可以采用M进制序列搜索的方法。取M=8在实验中得到了很好的效果。这样即可得到一个性能近似的简化版JCO-MSVQ码本设计方法。  另外,在码本设计中,可能出现聚类中无训练矢量,即出现空聚类的情况。这时可以删除该空聚类,并将包含训练矢量最多的那个聚类抖动成两个聚类。这样可以获得更小的联合量化误差,如图1所示。
16、; 图1 联合码本优化码本生成算法流程图  3 实验结果和分析  实际应用中,码本训练采用107 MB的语音文件,得到342302帧LSF参数(10维)和加权系数,训练矢量集足够大。在实际的2kbps语音编码算法中,对LSF参数进行3级矢量量化,比特分配为9/8/6,共23bits。利用联合优化码本生成算法进行300步迭代,与SR算法的第三级300步迭代结果进行比较,得到训练码本
17、总畸变数据,如图2所示。  图2 联合码本优化MSVQ迭代效果图  可以看到,同样步数的JCO-MSVQ算法较SR算法能取得更小的量化畸变。SR算法经过一定步数的迭代,基本没有下探的空间。而JCO-MSVQ算法则能继续优化码本,获得更好的量化效果。并且,
18、与SR算法不同,JCO-MSVQ算法中量化畸变是单调递减的,因在训练过程中每一步都是最优的(简化算法中是多进制搜索,因而是次优的)。统计量化谱失真,联合码本优化MSVQ比其他的MSVQ有明显的改善。在同一个LSF量化器中分别采用23bits SR码本(码本1)、24bits SR码本(码本2)和23bits联合优化码本(码本3),测试语音为一个3.5MB的语音文件,既有男声也有女声,共11348帧LSF参数。统计量化谱失真得到表1所示数据。表1不同码本生成算法谱失真比较
19、160;  从表1数据可以看到,同是23bits的量化,联合码本设计MSVQ与应用SR算法生成码本的MSVQ相比较,有大约1个比特的改善,接近于应用SR算法24bits量化的效果。甚至优于文献2中MSVQ算法的26bits量化(平均谱失真0.93dB)。平均谱失真为0.87dB,大于4dB的谱失真统计为0,达到了透明量化的要求。本文研究结果已经成功应用于1/2kbps可变速率声码器项目中。  参考文献
20、160;  1 Itakura F. Line spectrum representation of linear predictive coefficients of speech signals J. J.Acoust.Soc.Amer.,1975; 57:S35  2 Paliwal K K, Atal B S. Efficient vector quantization of LPC parameters at 24 bits/frame J. Proc. ICASSP,1991:661664  3 Juang B H, Gray A H. Multiple stage vector quantization for speech codingJ. Proc.ICASSP,1982:597600  4 Anderson J, Bodie J. Least
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 创新医疗服务体系中的信息管理与共享机制建设研究
- 供应链金融新思维探索基于区块链技术的风险管理方法
- AI在医学影像自动诊断中的技术进展
- 以患者为中心的康复医疗服务模式研究与实践探索
- 剑杆织机企业数字化转型与智慧升级战略研究报告
- 自行车鞍座企业ESG实践与创新战略研究报告
- 能源高效利用工程勘察企业ESG实践与创新战略研究报告
- 成品镜子企业县域市场拓展与下沉战略研究报告
- 功率探头企业ESG实践与创新战略研究报告
- 2025年双层客房车合作协议书
- 危险化学品运输车辆驾驶员安全驾驶习惯考核试卷
- 鲁滨逊漂流记选段:叙事技巧分析教案
- 围手术期下肢静脉血栓预防与护理
- 贵州省气象部门招聘考试真题2024
- 《大学生就业指导》期末笔记
- 陕西省2024年中考语文现代文阅读真题
- 2025届高考语文二轮复习:文言文知识点与答题技巧汇编 讲义
- Unit 5 Here and now Section A Grammar 说课稿 2023-2024学年人教版英语七年级下册
- 地下综合管廊建设项目可行性研究报告
- 基于多源异构数据的地质知识图谱构建与应用
- 2024年领导干部任前廉政知识考试测试题库及答案
评论
0/150
提交评论