语音信号处理 第4版 第3章 语音信号处理的常用算法 思考题答案_第1页
语音信号处理 第4版 第3章 语音信号处理的常用算法 思考题答案_第2页
语音信号处理 第4版 第3章 语音信号处理的常用算法 思考题答案_第3页
语音信号处理 第4版 第3章 语音信号处理的常用算法 思考题答案_第4页
语音信号处理 第4版 第3章 语音信号处理的常用算法 思考题答案_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章语音信号处理的常用算法思考题答案什么叫矢量量化,它在语音信号处理中有什么用途?什么叫码本、码本尺寸和码矢(或码字)?如何分配矢量量化的各项技术指标?矢量量化是对矢量进行量化,它把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替,或者叫作被量化为这个代表矢量。在语音编码方面,在原来编码速率为2.4kbit/s的线性预测声码器基础上,将每帧的10个反射系数加以10维的矢量量化,就可使编码速率降低到800bit/s,而语音质量基本未下降;又如分段声码器,由于采用了矢量量化,可以使编码速率降低到150bit/s;在语音识别、说话人识别等方面,矢量量化研究也得到很快的发展。矢量量化器里每个子空间的代表矢量就成为码字,所有代表矢量组成的集合称为码本,码本尺寸是该集合的大小。根据香农信息论,矢量维数越长优度越好。显然,矢量量化的过程与标量量化相似。在标量量化时,在一维的零至无穷大值之间设置若干个量化阶梯,当某输入信号的幅度值落在某相邻的两个量化阶梯之间时,就被量化为两阶梯的中心值。与此相对应在矢量量化时,则将K维无限空间划分为J块区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。当然,矢量量化与标量量化一样,是会产生量化误差的(即量化噪声),但只要码本尺寸足够大,量化误差就会足够小。另外,合理选择码本的码字也可以降低误差,这就是码本优化的问题。什么叫失真测度,理想的失真测度应具有什么特性?常用的有哪几种失真测度,它们都是如何定义的?各有什么用途?失真测度(距离测度)是将输入矢量Xi用码本重构矢量Yj来表征时所产生的误差或失真的度量方法,它可以描述两个或多个模型矢量间的相似程度。失真测度的选择的好坏将直接影响到聚类效果和量化精度,进而影响到语音信号矢量量化处理系统的性能。主要包括线性预测失真测度和识别失真测度。当语音信号特征矢量是用线性预测方法求出的LPC系数时,为了比较用这种参数表征的矢量,不宜直接使用欧氏距离。因为仅由预测器系数的差值不能完全表征这两个语音信息的差别。此时应该直接用由这些系数所描述的信号模型的功率谱来进行比较。将矢量量化技术用于语音识别时,对失真测度还应该有其他一些考虑,如果仅仅靠功率谱作为失真比较的参数,则识别的性能将不够理想,此时可采用识别失真测度。如何设计最佳矢量量化器?什么叫LBG算法?如何用程序加以实现?怎样设计初始码本,并用来训练码本?选择了合适的失真测度后,就可进行矢量量化器的最佳设计。所谓最佳设计,就是从大量信号样本中训练出好的码本;从实际效果出发寻找到好的失真测度定义公式;用最少的搜索和计算失真的运算量,来实现最大可能的平均信噪比。LBG算法的步骤如下:矢量量化存在量化误差,通常减小量化误差的思路有哪些?对应于这些思路,有哪些具体的实现方法?矢量量化与标量量化一样,会产生量化误差(即量化噪声),但只要码本尺寸足够大,量化误差就会足够小。另外,合理选择码本的码字也可以降低误差,这就是码本优化的问题。什么叫马尔可夫链?什么叫隐过程?什么叫隐马尔可夫过程?为什么说语音信号可以看成隐马尔可夫过程?隐马尔可夫模型有哪些模型参数?请叙述这些参数的含义。在较短的时间内用线性模型参数来表示,然后,再将许多线性模型在时间上串接起来,这就是马尔可夫链。HMM是一个输出符号序列的统计模型,具有N个状态S1,S2,…,SN,它按一定的周期从一个状态转移到另一个状态,每次转移时,输出一个符号。转移到哪一个状态,转移时输出什么符号,分别由状态转移概率和转移时的输出概率来决定。因为只能观测到输出符号序列,而不能观测到状态转移序列(即模型输出符号序列时,是通过了哪些状态路径,不能知道),所以称为隐马尔可夫模型。HMM用于语音信号建模时,是对语音信号的时间序列结构建立统计模型,它是数学上的双重随机过程:一个是具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数(如状态序列)是不可观测的。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。可见,HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是一种较为理想的语音信号模型。HMM可由六个模型参数来定义,具体含义见教材第33页。给定一个输出符号序列,怎样计算HMM对于该符号序列的输出似然概率?用前向—后向算法来计算HMM对于该符号序列的输出似然概率,具体参见教材第35-36页。为了应用HMM,有哪些基本算法?什么是前向-后向算法?它是怎样解决似然概率的计算问题的?叙述前向-后向算法的工作原理及其节约运算量的原因。HMM有三个基本算法,具体如下:前向—后向算法用以计算HMM对于该符号序列的输出似然概率,具体参见教材第35-36页。什么是Viterbi算法?Viterbi算法是为了解决什么问题的?Viterbi算法的基本过程如下:简述Baum-Welch算法的基本原理Baum-Welch算法利用递归的思想,使P(O|M)局部放大,最后得到优化的模型参数M={A,B,π}。具体过程参见教材第37-38页。深度学习的优缺点各是什么?深度学习模型的主要优点表现在以下几方面。(1)学习能力强,在很多任务中性能优于传统机器学习模型。(2)适应性好:深度学习模型的网络层数多,理论上可以映射到任意函数。(3)数据驱动、上限高:深度学习高度依赖数据,数据量越大,它的表现就越好。深度学习也存在如下的缺点:(1)计算量大:深度学习需要大量的数据与算力支持。(2)硬件需求高:普通的CPU无法满足深度学习模型和算法的运算需求。(3)模型设计复杂:需要投入大量的人力物力与时间来开发新的模型。DNN、RNN和CNN各自有哪些特点?DNN是深度学习最基本的模型之一,它针对单层感知机难以应对复杂非线性函数的困难,将其在深度上做了有效拓展。因此,DNN是具有多个隐藏层和多个输出的网络,可以拟合复杂的非线性函数,模型的灵活性也大幅增强。在DNN中,各神经元分别属于不同的层,每一层的神经元可以接收前一层神经元的信号,并产生信号输出到下一层。DNN具有结构复杂、层次分明等特征,能够更好地拟合输入和输出之间复杂的关系,挖掘出隐藏在数据中的深层次信息。RNN在DNN上扩展,通过加入循环连接使模型具有记忆能力。RNN由具有环路的神经网络结构组成,其神经元不仅可以接收其他神经元的信息,也可以接收自身的信息。与DNN相比,RNN更符合生物神经网络的结构,能够更好地处理时序数据之间的内在关联,在语音识别、自然语言处理等任务上得到了广泛的应用。CNN与DNN的区别在于,CNN中的神经元之间并非全连接,而是局部连接,即CNN中卷积层的某个神经元的输出并不取决于输入特征图中的所有神经元的输入,而是仅由卷积核对应位置的神经元的输入决定。正是由于这种局部连接的特点,使得CNN能够很好地捕捉输入特征图中的局部特征;同时,在进行卷积计算时,卷积核在输入特征图的不同位置其权值参数是不变的,并且通常将卷积层和池化层结合使用,这样使得CNN的计算复杂度显著降低,大大拓展了其应用领域。在深度学习中,长程依赖问题指的是什么?有哪些方法可以解决这个问题,是如何解决的?虽然理论上简单RNN可以通过参数更新,自循环地学习长时序数据间的关联性,但仍存在由序列长度增大所带来的梯度消失或爆炸问题。本质上RNN只能学到短期的“记忆”,即,时刻t的输出yt只与一定时间间隔k内的输入有关,当时间间隔过长时,RNN就难以准确描述关联性,这也称为RNN长程依赖问题。长短期记忆网络(LSTM)是RNN的一个变体。为了缓解RNN的长程依赖问题,LSTM中引入了门控单元,通过选择性地遗忘过去时刻的累积信息来更新网络参数。推导LSTM网络中参数的梯度,并分析其避免梯度消失的效果。LSTM的基本原理详见教材第44页,需要结合其原理推导参数梯度。CNN是如何简化参数,提高训练效率的?CNN结构中隐藏层之间使用的是部分连接,即所谓的卷积层,而且为了进一步降低模型的计算复杂度,一般需要使用池化层结构对卷积层的输出进行处理。在CNN计算过程中,首先通过输入层向模型中输入数据,然后经过卷积层对数据做进一步处理,逐层提取更抽象的特征,紧接着对输出特征图使用池化层达到特征降维的作用,按照该方式对卷积层和池化层进行多次堆叠,最后经过全连接的输出层完成回归、分类等任务;此外,每层网络的输出还需要经过激活函数的映射,从而使模型具有更强的表达能力。设计转置卷积、微步卷积及空洞卷积的目的是什么?(1)转置卷积:在一些任务中,需要将低维特征映射到高维特征,此时则需要转置卷积。具体地,假设有一个转换矩阵W,将一个高维向量映射为一个低维向量,那么可以很容易地通过对W进行转置来实现从低维到高维的反向映射。也可以将卷积操作写成矩阵变换的形式,通过转置卷积操作对应的矩阵,就能实现将低维特征到高维特征的卷积操作。(2)微步卷积:可以通过增加卷积操作的步长S>1来实现对输入特征的下采样操作,从而大幅降低特征维数。同样,也可以通过减少转置卷积的步长S<1来实现上采样操作,从而大幅

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论