语音信号处理课件第七章.ppt

上传人：s*** IP属地：河南上传时间：2020-01-28 格式：PPT 页数：66 大小：802.50KB 积分：20 举报 版权申诉

已阅读5页，还剩61页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第7章矢量量化 7 1概述 1 7 2矢量量化基本原理 7 3最佳矢量量化器 3 7 4矢量量化器的设计算法及MATLAB实现 4 7 5降低复杂度的矢量量化系统 5 2 7 1概述量化分为两大类标量量化和矢量量化标量量化把抽样后的信号值逐个进行量化矢量量化将k k 2 个抽样值形成K维空间Rk中的一个矢量然后将此矢量进行量化矢量量化优于标量量化为不可逆压缩方法具备比特率低解码简单失真较小的优点矢量量化广泛应用于图像语音压缩编码移动通信语音识别文献检索及数据库检索等领域矢量量化的理论基础是仙农的率失真理论率失真理论指出利用矢量量化编码性能有可能任意接近率失真函数其方法是增加维数k 该理论指出了矢量量化的优越性率失真理论在实际应用中的重要指导意义常作为一个理论下界与实际编码速率相比较分析系统还有多大的改进余地但是率失真理论是一个存在性定理而非构造性定理因为它没有指出如何构造矢量量化器矢量量化技术的发展历程最佳矢量量化问题 Steinhaus 1956年如何划分量化区间及求量化值问题 Loyd和Max 1957年提出实际矢量量化器 Buzo 1978年 LBG算法 Linde Buzo和Gray 1980年 7 2矢量量化基本原理7 2 1矢量量化的定义 1 定义矢量量化是先把信号序列的每K个样点分成一组形成K维欧氏空间中的一个矢量然后对此矢量进行量化 xn X1X2X3X4Xn 4 图示输入信号序列 xn 每4个样点构成一个矢量取K 4 共得到n 4个4维矢量 X1 X2 X3 Xn 4 矢量量化就是先集体量化X1 然后量化X2 依次向下量化下面以K 2为例说明其量化过程 2 几个概念量化矢量或称重构矢量利用最小失真原则分别计算用量化矢量Yi i 1 2 7 替代X所带来的失真其中最小失真所对应的那个矢量Yj 就是模拟矢量X的量化矢量码书量化矢量构成的集合称为码书 Codebook 码字码书中的每个矢量Yj i 1 2 N 称为码字 Codeword 7 2 2失真测度失真测度的选择直接影响矢量量化系统的性能失真测度是以什么方法来反映用码字Yi代替信源矢量X时所付出的代价这种代价的统计平均值平均失真描述了矢量量化器的工作特性即式中E 表示求期望常用的失真测度有如下几种平方失真测度这是最常用的失真测度易于处理和计算且在主观评价上有意义即小的失真值对应好的主观评价质量绝对误差失真测度主要优点计算简单硬件容易实现加权平方失真测度式中T 矩阵转置符号 W 正定加权矩阵要使所选用的失真测度有实际意义必须要求它具有以下几个特点 1 必须在主观评价上有意义即小的失真对应好的主观质量评价 2 必须在数学上易于处理能导致实际的系统设计 3 必须可计算并保证平均失真D E D X Q X 存在 4 采用的失真测度应使系统容易用硬件实现 7 2 3矢量量化器通常用最小失真的方法最近邻准则NNR NearestNeighborRule 来设计矢量量化器也就是要满足下式式中IN 1 2 i N N 码书的大小符号表示充分必要条件矢量量化器的工作过程是在编码端输入矢量X与码本中的每一个或部分码字进行比较分别计算出它们的失真搜索到失真最小的码字Yj的序号或此码字在码本中的地址并将j的编码信号通过信道传送到译码端在译码端先把信道传送来的编码信号译成序号j 再根据序号或码字Yj所在地址从码本中查出相应的码字Yj Yj是输入矢量X的重构矢量矢量量化系统通常可以分为两个映射的乘积式中是编码器它是将输入矢量映射为信道符号集IN i1 i2 iN 中的一个元素ij 是译码器它是将信道符号集ij映射为码书中的一个码字Yi 即 X ijX ij IN ij Yiij INYi YN 矢量量化定义把一个K维模拟矢量的有序集称为信源矢量集合中的某个矢量X 映射为N个量化矢量构成的有限集码书或码本中的某个矢量码字或码矢 Y 这种映射称为矢量量化一个矢量量化器可以表示成以下三个部分码书空间划分 S 映射 q 其中 Si是Rk的一个子集且满足矢量量化器Q 的性能以其输入矢量X和输出矢量Y q X 的失真平均值而定失真平均值为 D Q F E d X Y E d X q X 补充矢量量化与标量量化的比较矢量量化是把一个K维模拟矢量映射为一个K维量化矢量标量量化实际是维数K 1的矢量量化一般情况下矢量量化均指K 2的多维量化与标量量化的两个主要步骤相对应矢量量化首先要将抽样值构成的矢量即K维空间的无穷多点划分成有限个胞腔然后从每一个胞腔取一个代表值凡是落入该胞腔的矢量均用该代表值进行量化与标量量化比较矢量量化还具有如下特点 1 矢量量化是把量化矢量码字分别存储在编码器和译码器两端的码书中在信道中传输的并不是输入矢量X的量化矢量Y本身而是码字Y的下标j的编码信号 2 在相同的速率下矢量量化的失真比标量量化的失真明显的小 3 在相同的失真条件下矢量量化所需要的速率比标量量化所需的速率低的多 4 矢量量化是一种多维模式匹配多维优化过程而标量量化是一维模式匹配一维优化过程一般来说用一维优化是得不到多维优化的结果的 5 矢量量化的复杂度随维数成指数增加所以矢量量化的复杂度比标量量化的复杂度高归结起来正如率失真理论所指出的组编码总是优于单个输出的逐个编码的当编码长度K趋于无穷大时可以达到率失真界 7 3最佳矢量量化1 最佳矢量量化器的概念矢量量化器的速率定义为 r B K logN K bit 样值或每维式中B logN表示每个码字的编码比特数 N 码书的大小 K 维数最佳矢量量化器的概念给定条件下失真最小的矢量量化器称为这个条件下的最佳矢量量化器给定矢量量化器的码书大小N 求最小失真式中QN为所有码书大小为N的K维矢量量化器的集合 2 设计最佳矢量量化器的必要条件一是在给定码书的条件下寻找信源空间的最佳划分使平均失真最小二是在给定划分的条件下寻找最佳码书使平均失真最小 1 最佳划分给定码书可以用最近邻准则NNR得到最佳划分图7 4为最佳划分示意图图7 4最佳划分示意图最佳划分定义信源空间中任一点X 若X Sj 当且仅当矢量X与码字Yj的失真小于X和其它码字失真即则Sj为最佳划分 Voronoi划分把信源空间划分成与码书大小相同的N个区间Sj j 1 2 N 这种划分称为Voronoi划分 Voronoi胞腔 Voronoi划分对应子集Sj j 1 2 N 称为Voronoi胞腔 Cell 简称胞腔 2 最佳码书给定了划分Si 并不是最佳划分后为了使码书的平均失真最小码字Yi必须为相应划分Si i 1 2 N 的形心即式中min 1表示选取的Yi使平均失真E d X Y X Si 为最小的Y 对于由训练序列定义的样点分布和常用的均方失真测度形心由下式给出式中 Si 表示集合Si中元素的个数即Si集中有 Si 个X 7 4矢量量化器的设计算法及MATLAB实现7 4 1LBG算法设计矢量量化器的主要任务是设计码书码字数目N给定时由Linde Buzo 和Gray三人1980年首次提出矢量量化器的一个设计算法通常称为LBG算法已知训练序列设计算法的具体步骤如下给定初始码书即给定码书大小N和码字并置n 0 设起始平均失真D 1 给定计算停止门限 0 1 已知训练序列的LBG设计算法用码书为已知形心根据最佳划分原则把训练序列TS 划分为N个胞腔即计算平均失真与相对失真平均失真为式中相对失真为若则停止计算当前的码书就是设计好的码书否则进行第步利用计算这时划分的各胞腔的形心由这N个新形心构成新的码书并置n n 1 返回第步再进行计算直到得到所要求的码书为止 2初始码书的选定与胞腔的处理初始码书如何选取对最佳码书设计很有影响下面介绍初始码书选取方法 1 随机选取法这种方法最先用于K 均值聚类算法中它是从训练序列中随机选取N个矢量作为初始码字构成初始码书优点 1 不用初始化计算可以大大减少计算时间 2 初始码字选自训练序列中无空胞腔问题缺点 1 可能会选到一些非典型的矢量作为码字 2 会造成在某些空间把胞腔分得过细而有些空间分的太大以上缺点会导致码书中有限个码字得不到充分利用设计的矢量量化器性能可能较差 2 分裂法1980年由Linde Buzo和Gray提出具体步骤如下计算所有训练序列TS的形心将此形心作为第一个码字选一个合适参数A乘以码字形成第二个码字以码字为初始码书即用所述LBG算法去设计仅含2个码字的码书将码书中2个码字分别乘以合适的参数B 得到4个码字以这4个码矢为基础按步骤3去构成含4个码字的码书再乘以合适的参数以扩大码字数目如此反复经log2N次设计就得到所要求的有N个码字的初始码书 3 空胞腔和随机选择法中非典型矢量的处理去空胞腔分裂法首先把某空胞腔中的形心去掉然后将最大的胞腔分裂为2个小胞腔分裂方法如下 a 用一个合适的参数A去乘以原形心得到2个码字 b 以2个码字来划分这个大胞腔构成2个小胞腔非典型码字的处理随机选择法存在一些非典型矢量此时可采用下面办法来处理 a 重新选择随机初始码字直到没有非典型码字为止 b 把这种胞腔中少数矢量分别归并到邻近的各个胞腔中再用分裂法把其中一个最大的胞腔分裂为2个小胞腔矢量量化器的复杂度矢量量化与标量量化相比其主要缺点是复杂度随维数的增大而成指数式增加这是实现高维数矢量量化的主要障碍 7 5降低复杂度的矢量量化系统在信号处理中复杂度有两种时间复杂度单位时间内所需要的计算量它包括加减法乘法和比较运算的次数空间复杂度存储容量矢量量化器复杂度的度量应该以时间复杂度和空间复杂度进行度量对降低复杂度的研究可朝两个方向进行一寻找好的快速算法二使码书结构化以减小搜索量和存储量 7 5 1树搜索矢量量化器1树搜索原理下面以二叉树为例说明树搜索原理二叉树结构图中以树根第一层为起点第二层有2个节点 Y0 Y1 第三层有4个节点 Y00 Y01 Y10 Y11 第四层此树的最后一层有8个节点这层上的节点又称为树叶树型编码过程中只计算部分矢量失真就可以解决下一步搜索的子树编码时的走步控制原则为0当上子树的节点失真最小时控制逻辑值 1当下子树的节点失真最小时具体量化步骤如下第一步分别计算输入矢量X与Y0 Y1的失真d X Y0 和d X Y1 并且比较它们的大小若d X Y0 d X Y1 则走下支路下子树到了节点Y1处送出1码至信道若d X Y0 d X Y1 则走上支路上子树到了节点Y0处就送出0码至信道第二步若上一步走的是下支路那么在节点Y1处再计算输入矢量X与节点Y10 Y11的失真d X Y10 和d X Y11 并且比较它们的大小若d X Y10 d X Y10 则走上支路到Y10处送出0码至信道反之就走下支路到了Y11处送出1码至信道第三步若刚才走的是上支路那么在节点Y10处分别计算失真d X Y100 和d X Y101 并且比较它们的大小若d X Y100 d X Y101 则走下支路到了树叶Y101处送出1码到信道 Y101便是输入矢量X的量化矢量在信道中传输的符号是101 反之则走上支路到了树叶Y100处送出0码到信道 Y100便是X的量化矢量在信道中传输的是符号100 2树结构的设计树搜索矢量量化器的编码器是由树型码书和相应的搜索算法构成的这种矢量量化器译码器的码书和编码器的码书不同译码器是采用数组型码书图7 8是它的原理图设计树结构找出各层的码字的方法有两种一种是从树叶开始设计另一种是从树根开始设计图7 8树搜索矢量量化器原理框图 1 从树叶开始设计的办法四层二叉树矢量量化器维数为K 第四层有N 8个码字树叶数第一步假定第四层的8个码字已由前面设计码书的方法得到了将这些码字按码字距离最近配对的原则因为是二叉树型得到 Y000 Y001 Y010 Y011 Y100 Y101 Y110 Y111 并把它们放在相应的树叶位置上第二步求出这些码字对的中心如 Y000 Y001 的中心为Y00 总共得到四个中心 Y00 Y01 Y10 Y11 并把它们放在第三层上第三步将第三层上的码字仍按最近距离原则配对得到 Y00 Y01 Y10 Y11 再求出码字对中心Y0与Y1并将它们放在第二层上这种树形码书总的尺寸为N0 8 4 2 14 即共有14个码字而译码端的码字大小就是树叶数N 8 2 从树根开始设计的方法以四层二叉树为例具体设计步骤如下第一步求出整个训练序列的形心作为初始码书用一个合适的参数A去乘得到另一个码字而后以与为初始码字将训练序列按一定失真测度划分为两个胞腔再计算出两个胞腔的形心Y0与Y1 用这种分裂法得到的Y0 Y1便是第二层地个码字第二步再用上述分裂法得到第三层的4个码字Y00 Y01 Y10 Y11 这样继续下去一直计算到树叶为止从上面的叙述不难看出树搜索的过程是逐步求近似值的过程中间的码字只起指引路线的作用 3树搜索矢量量化器的复杂度树搜索矢量量化器的特点是以适当提高空间复杂度来降低时间复杂度在搜索时间上二叉树的搜索速度最快全搜索最慢在存储量上二叉树多于全搜索由于树搜索并不是从整个码书中寻找最小失真的码字因此它的量化器并不是最佳的也就是说树搜索矢量量化器的性能比全搜索矢量量化器的性能差通常可以适当选择各层的树叉型数在搜索速度存储量及质量三者之间得到一种折衷 7 5 2多级矢量量化器系统多级矢量量化器系统由若干个普通的矢量量化器系统级联而成如图7 9所示它的第一级是一个包括M1个码字的矢量量化器系统对每一个输入矢量X 矢量量化编码器1按最近邻准则找到一个码字Yi 1 并计算出X与此码字的误差矢量这个误差矢量即是第二级矢量量化器系统的输入这样一级级地推导就可以构成一个级联系统整个矢量量化编码器的输出即是各级联矢量量化编码器的输出码字的编号而矢量量化译码器则可以根据这些编号恢复原始的输入矢量多级矢量量化系统无论在减少搜索计算量方面还是减少码字存储量方面都有可观的改进它的缺点是在同样的码书容量下其平均量化失真大于全搜索矢量量化系统 7 5 3波形增益矢量量化器编码器解码器图7 10波形增益矢量量化器原理框图对时域波形进行矢量量化时将待量化矢量的波形和增益分开分别进行矢量量化和标量量化设输入矢量为X 其增益为具有非零增益矢量的波形为S X g 采用平方误差失真测度则输入矢量和量化矢量间的失真为和分别是增益和波形矢量S的量化结果 VQ编码可分两步使上式达到最小首先在VQ码书中找到一个码字使其与输

人人文库> 全部分类> 应用文书 > 技术指导

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

语音信号处理课件第七章.ppt

文档简介

温馨提示

最新文档

评论

语音信号处理课件第七章.ppt

文档简介

温馨提示

最新文档

评论

相关文档