![移动通信线性预测编码论文教材_第1页](http://file3.renrendoc.com/fileroot_temp3/2022-5/26/cb2e67c7-3b8f-44d5-b8a7-9c535c2e8500/cb2e67c7-3b8f-44d5-b8a7-9c535c2e85001.gif)
![移动通信线性预测编码论文教材_第2页](http://file3.renrendoc.com/fileroot_temp3/2022-5/26/cb2e67c7-3b8f-44d5-b8a7-9c535c2e8500/cb2e67c7-3b8f-44d5-b8a7-9c535c2e85002.gif)
![移动通信线性预测编码论文教材_第3页](http://file3.renrendoc.com/fileroot_temp3/2022-5/26/cb2e67c7-3b8f-44d5-b8a7-9c535c2e8500/cb2e67c7-3b8f-44d5-b8a7-9c535c2e85003.gif)
![移动通信线性预测编码论文教材_第4页](http://file3.renrendoc.com/fileroot_temp3/2022-5/26/cb2e67c7-3b8f-44d5-b8a7-9c535c2e8500/cb2e67c7-3b8f-44d5-b8a7-9c535c2e85004.gif)
![移动通信线性预测编码论文教材_第5页](http://file3.renrendoc.com/fileroot_temp3/2022-5/26/cb2e67c7-3b8f-44d5-b8a7-9c535c2e8500/cb2e67c7-3b8f-44d5-b8a7-9c535c2e85005.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、沈阳理工大学学士学位论文摘 要线性预测编码技术简称 LPC 技术,在近代电子技术中得到广泛的应用,如窄带通信、语音识别和扬声器鉴定等。它为现代语音信号处理的飞速发展立下了赫赫功劳,在语音分析、合成、编码、识别等方面都有着广泛的应用,至今仍是最有效的语音分析技术之一。线性预测编码作为一种基于全极点模型假定和均方预测误差最小准则下的波形逼近技术,是语音编码中的一种重要技术,运用这种编码方式通过对音频信号的时域和频域分析,线性预测编解码,滤波等处理,能够在尽量保持原音质的基础上合成出高质量的语音。本文通过对波形编码,参量编码,混合编码,中低速率编码的介绍,重点研究了线性预测(LPC)的原理、莱文森-
2、杜宾(Levinson-Durbin)算法及 MATLAB 在处理语音信号时的应用。最后以 MATLAB 为开发工具,编写了线性预测编码的程序,对语音信号进行了线性预测编码处理,并对阶数的选取做了比较分析。关键词: 语音信号;LPC;莱文森-杜宾算法;MATLAB 仿真沈阳理工大学学士学位论文IAbstractTechnology of linear prediction coding called LPC for short,which application in a wide range of modern electronic technology,such as narrow-ban
3、d communication, speech recognition and speaker identification.It made illustrious merit for the rapid development of modern speech processing, which has a wide range of applications in speech analysis, synthesis, coding, recognition,and which remains one of the most effective voice analysis technol
4、ogy. LPC all-pole model as based on assumptions and the smallest mean squared prediction error criterion of waveform approximation technique,is an important speech coding techniques.By using this encoding audio signals in time domain and frequency domain analysis, linear prediction coding and decodi
5、ng, filtering processing, able to keep the original sound quality on the basis of high-quality voice synthesis.In this paper,based on the introduction of the waveform coding,parametric coding, hybrid coding, low rate coding, focuses on the linear prediction (LPC) principle,Levinson-Durbin algorithm
6、and MATLAB in the application of speech signal processing. Finally, with MATLAB as the development tool,write a linear predictive coding procedures,voice signal processing of linear predictive coding.,and the number of orders to do a comparative analysis.Keywords:Voice signal;LPC;Levinson - Durbin a
7、lgorithm;MATLAB simulation沈阳理工大学学士学位论文II目 录1 绪论.11.1 语音信号线性预测编码技术的基本概念.11.2 语音信号线性预测编码技术的发展.21.3 语音信号线性预测编码技术的应用.31.4 基本设计要求及设计思路.32 线性预测编码的基本原理.42.1 语音信号的数字模型.42.1.1 激励模型 .42.1.2 辐射模型 .52.2 线性预测的概念与原理.62.2.1 线性预测分析的概念 .62.2.2 自相关法 .72.2.3 协方差法 .82.2.4 全极点声道模型 .92.3 解线性预测参数方程组的算法.92.3.1 利用乔里斯基分解计算协方
8、差法的方程组 .102.3.2 利用杜宾递推算法计算自相关法的方程组 .122.3.3 利用格型法求解线性预测系数 .142.4 各种算法的比较.183 MATLAB 简介.213.1 MATLAB 的背景.213.2 MATLAB 的组成.233.3 MATLAB 的优势和特点.233.4 MATLAB 的主要功能.263.5 MATLAB 常用的数学函数及三角函数.274 基于 MATLAB 的编程实现.29沈阳理工大学学士学位论文III4.1 程序设计流程图.294.2 主函数及其功能.304.3 程序分析.304.4 实验结果与分析.32结 论.35致 谢.36参考文献.37附 录 .
9、38 附录 A 英文原文.38 附录 B 中文翻译.50沈阳理工大学学士学位论文01 绪论1.1 语音信号线性预测编码技术的基本概念语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。处理的目的就是要得到一些语音参数以便高效的传输或存储;或者是通过处理的某种运算以达到某种用途的要求,例如人工合成出语音、辨识出说话者、识别出讲话的内容等。人类社会愈来愈显示出信息社会的特点。不但在人与人之间,而且在人与机器之间每时每刻都需要进行大量的信息交换。通信或信息交换已经成为人类社会存在的必要条件,正如衣食住行对于人类是必要的一样。虽然,嗅觉、触觉等也是人类固有的感觉,人们也可以从中得到某些外
10、界信息,但是可以指出,最重要的、最精细的信息源只有图像和语言两种。而且,语言是人类最重要、最有效、最常用和最方便的通讯形式。语音是人们交流思想和进行社会活动的最基本手段, 我们要对语音信号进行测定并将其转变为另一种形式, 以提高我们的通信能力。LPC:Linear Predictive Coding,线性预测编码。线性预测这一术语是维纳1947年首次提出的,此后,线性预测应用于许多领域中。1967年,板仓等人最先将线性预测技术直接应用到语音分析和合成中。线性预测作为一种工具,几乎普遍地应用于语音信号处理的各个方面。这种方法是最有效和最流行的语音分析技术之一。在各种语音分析技术中,它是第一个真正
11、得到实际应用的技术。线性预测技术产生至今,语音处理又有许多突破,但这种技术目前仍然是唯一的最重要的分析技术基础。在估计基本的语音参数(例如基音、共振蜂、谱、声道面积函数,以及用低速率传输或储存语音等)方面,线性预测是一种主要的技术。其重要性在于它能够极为精确地估计语音参数,用极少的参数有效而又正确地表现语音波形及其频谱的性质,而且可以用比较简单的计算和比较快的速度求得参数。参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参数编码是通过对语音信号特沈阳理
12、工大学学士学位论文1征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。线性预测分析是最有效的语音分析技术之一,在语音编码、语音合成、语音识别和说话人识别等语音处理领域中得到了广泛的应用。语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。采用线性预测分析不仅能够得到语音信号的预测波形,而且能够提供一个非常好的声道模型。如果将语音模型看作激励源通过一个线性时不变系统产生的输出,那么可以利用LPC分析对声道参数进
13、行估值,以少量低信息率的时变参数精确地描述语音波形及其频谱的性质。此外,LPC分析还能够对共振峰、功率谱等语音参数进行精确估计,LPC分析得到的参数可以作为语音识别的重要参数之一。由于语音是一种短时平稳信号,因此只能利用一段语音来估计模型参数。此时有两种方案:一种是将长的语音序列加窗,然后对加窗语音进行LPC分析,只要限定窗的长度就可以保证分析的短时性,这种方案称为自相关法;另一种方案不对语音加窗,而是在计算均方预测误差时限制其取和区间,这样可以导出LPC分析的自协方差法。1.2 语音信号线性预测编码技术的发展 线性预测编码在近代电子技术中得到广泛地使用,如窄带通信、语言识别和扬声器鉴定等。根
14、据斯坦福大学Robert M.Gray的说法,线性预测编码起源于1966年,当时NTT的描述了一种自动音素识别的方法,这种方法第一次使用了针对语音编码的最大似然估计实现。1967年John Burg略述了最大熵的实现方法。1969年Itakura与Saito提出了部分相关的概念,May Glen Culler提议进行实时语音压缩,B.S.Atal在美国声学协会年会上展示了一个LPC语音编码器。1971年Philco-Ford展示了用16位LPC硬件的实时LPC并且卖出了四个。1972年ARPA的Bob Kahn与Jim Forgie(en:Lincoln Laboratory,LL)以及Dav
15、e Walden开始了语音信息包的第一次开发,这最终带来了Voice over IP技术。根据Lincoln Laboratory的非正式历史资料记载,1973年Ed Hofstetter实现了第一个2400位/秒的实时LPC。1974年,第一个双向实时LPC语音包通信在Culler-Harrison与Lincoln Laboratories之间通过ARPANET以3500位/秒的速度实现。1976年,第一次LPC会议通过ARPANET沈阳理工大学学士学位论文2使用Network Voice Protocol在Culler-Harrison、ISI、SRI与LL之间以3500位/秒的速度实现。
16、最后在1978年,BBN的Vishwanath et al.开发了第一个变速LPC算法。1.3 语音信号线性预测编码技术的应用线性预测编码通常用于语音的重新合成,它是电话公司使用的声音压缩格式,如 GSM 标准就在使用这种格式。它还用作安全无线通信中的格式,在安全的无线通信中,声音必须进行数字化、加密然后通过狭窄的语音信道传输。线性预测编码合成也可以用于构建声音合成器,乐器用作从歌手声音预测得到的时变滤波器的激励信号,这在电子音乐中有一定的流行。1976 年,美国确定用 LPC-10 作为在 2.4kb/s 速率上语音通信的标准基数,1981 年,这个算法被官方接受,作为联邦政府标准 FS-1
17、015 颁布。LPC-10 是一个 10 阶线性预测声码器,它所采用的算法简单明了。为了得到质量好的合成语音,它对每个参数的提取和编码都是很考究的。利用这个算法可以合成清晰、可懂的语音,但是抗噪声能力和自然度尚有欠缺。自 1986 年以来,美国第三代保密电话装置采用了速率为 2.4kb/s的 LPC-10e 作为话音终端。目前,STU-III 的话音质量被评为“良好” 。1980 年流行的Speak&Spell 教育玩具中使用了一个 10 阶的线性预测编码。在 FLAC 音频编解码器中使用了 0 到 4 阶的线性预测编码预测器。1.4 基本设计要求及设计思路根据语音信号的产生模型 ,语
18、音信号 S(z)是一个线性非因果稳定系统 V(Z)受到信号 E(Z)激励所产生的输出。在时域中,语音 s(n)信号是单位取样响应 v(n)和激励信号 e(n)的卷积。在语音信号数字处理所涉及的各个领域需要根据 s(n)来求 v(n)和 e(n)。在实现各种语音编码、识别、合成等算法时需要用到卷积运算。解卷积算法因可减少计算代价,其研究也是十分重要的。设计方法是为线性系统 V(Z)建立一个线性模型,然后对模型参数按某种最佳准则进行估计,并采用最小均方准则(LMS)对全极点 AR 模型参数进行估计的 LPC 算法。考虑到语音信号只有在一个短时段中才可以认为是平稳的,因此对语音信号的线性预测编码的分
19、析和其它语音信号分析相同,必须是一个短时分析。为了进行短时分析可以采取对一个长的语音序列 s(n)用窗函数 w(n)相乘,形成加窗语音 s(n)。然后对 s(n)进沈阳理工大学学士学位论文3行 LPC 分析,只要限定窗的长度便可以保证分析的短时性。由此导出的方法称为自相关法。沈阳理工大学学士学位论文42 线性预测编码的基本原理LPC是通过分析语音波形来产生声道激励和转移函数的参数,对声音波形的编码实际就转化为对这些参数的编码,这就使声音的数据量大大减少。在接收端使用LPC分析得到的参数,通过语音合成器重构语音。合成器实际上是一个离散的随时间变化的时变线性滤波器,它代表人的语音生成系统模型。时变
20、线性滤波器既当作预测器使用,又当作合成器使用。分析语音波形时,主要是当作预测器使用,合成语音时当作语音生成模型使用。随着语音波形的变化,周期性地使模型的参数和激励条件适合新的要求。2.1 语音信号的数字模型完整的语音信号的数字模型可表示为三个子模型:激励模型、声道模型和辐射模型的串联。2.1.1 激励模型发浊音时,由于声带不断的张开和关闭,将产生间歇的脉冲波。它类似于斜三角形的脉冲。这时的激励波是一个以音调周期为周期的斜三角脉冲串,单个三角波形的数学表达式如下: (2.1)02)(cos)cos(1)21()(211NNnNnng其他21110NNnNNn 式中,N1 为斜三角波上升部分的时间
21、,N2 为其下降部分的时间。通常,更希望将它表示成 Z 变换的全极模型的形式:(2.2)210)1 (1)(zezGT沈阳理工大学学士学位论文5 上式表示斜三角波形可描述为一个二极点的模型。因此,斜三角波串科士威加权了单位脉冲串激励上述单个斜三角波模型的结果。而该单位脉冲串及幅值因子则可表示成下面的 Z 变换形式:(2.3)11)(zAzEu所以整个激励模型可表示为:(2.4)2101)1 (11)(zezAzUTu2.1.2 辐射模型从声道模型输入的是速度波,而语音信号是声压波,二者之倒比称为( )Lun( )Lpn辐射阻抗。它表征口唇的辐射效应,也包括圆形的头部的绕射效应等。当然,从理Lz
22、论上推导这个阻抗是有困难的。但是,如果认为口唇张开的面积远小于头部的表面积,则可近似地看成平板槽辐射的情况。此时,可推导出辐射阻抗的公式如下:(2.5)rrrrLLjRRLjz)(式中,这里,是口唇张开时的半径,C是声波传播速度。29128rRcaLr38a由辐射引起的能量的损耗正比于辐射阻抗的实部,所以辐射模型是一阶类高通滤波器。由于除了冲击脉冲串模型E(Z)之外,斜三角波模型是二阶低通而辐射模型是一阶高通,所以,在实际信号分析时,常用所谓“预加重技术” 。即:在取样之后,插入一个一阶的高通滤波器。常用的预加重因子为,这里,R(n)是信号s(n)的自相关函数。通常对1)0() 1 (1zRR
23、于浊音,R(1)/R(0)1;而对于清音,则该值可取得很小。2.1.3 声道模型语音的产生可以用N级无损声管来模拟,其传输函数式(2.6)和(2.7)表示为(2.6)()1 ()1 (5 . 0)(12zDzTzVNmNmu沈阳理工大学学士学位论文6(2.7)NmmmzazD11)(声道系统可用一组面积函数A(x)或一组反射系数rm来表示。在一个音频(1020ms)内,A(x)或r(m)近似不变,另外,如果有一数字系统,其系统函数表示为(2.8)NmmmzaGzV11)(可以看出式(2.8)中G 取决于式(2.1.6)中的rG与rm,此处把固定延迟省略2N_了,而分母形式相同。事实上,上述系统
24、函数V(z)仅有极点而没有零点称为全极点模型。因此,整个系统的系统函数为H(z)=G(z)V(z)R(z) (2.9) 2.2 线性预测的概念与原理2.2.1 线性预测分析的概念一个语音取样的现在值,可以用若干个语音取样的过去值的加权线性组合来逼近,在线性组合中的加权系数就称为线性预测系数(LPC:Linear Predictive Coding)线性预测的基本原理是建立在语音数字模型的基础上的,我们可以用准周期脉冲或随机噪声去激励一个线性时变系统,产生浊音语音或清音语音。为了估计这些线性时变系统的参数,线性预测法提供了一种可靠精确而有效地方法。到目前为止,已经形成了许多不同的线性预测分析方法
25、,这些方法在处理具体问题时所作的假设不同,因而形成了各自不同的算法,这些方法有:1、自相关方法2、协方差法3、格型滤波器法4、逆滤波器法5、谱估值法6、最大似然法沈阳理工大学学士学位论文77、内积法LPC分析方法一般采用个性滤波器提取一组对量化敏感性较低的偏相关(PARCOR)系数,这种个性滤波器是在自相关定义下得到的。近年来,随着自适应滤波技术的发展,得到了前置窗(Pro-Window)和协方差等定义下的格型滤波器形式,利用这些方法能获得比自相关方法更精确地参数估计值。本文只对前三种基本方法进行讨论,因为其他方法都等效于前三种方法的一种。LPC分析为线性时不变因果稳定系统V(z)建立一个全极
26、点模型,并利用均方误差准则,对已知的语音信号s(n)进行模型参数估计。如果利用P个取样值来进行预测,则称为P阶线性预测。 假设用过去P个取样值S(n-1),S(n-2),.S(n-p)的加权之和来预测信号当前取样值S(n),则预测信号S(n)为:(2.10) 1pkkS nank其中加权系数用表示,称为预测系数,则预测误差为:ka (2.11) 1pkke ns nS ns nank要使预测最佳,则要使短时平均预测误差最小有:(2.12) 2minE en(2.13) 20,(1)kenkpa令(2.14),i kE s niS nk最小的 可表示成:(2.15) min10,00,pkkak
27、显然,误差越接近于零,线性预测的准确度在均方误差最小的意义上为最佳,由此可以计算出预测系数。通过LPC分析,由若干帧语音可以得到若干组LPC参数,每组参数形成一个描绘该帧语音特征的矢量,即LPC特征矢量。由LPC特征矢量可以进一步得到很多种派生特征矢量,例如线性预测倒谱系数、线谱对特征、部分相关系数、对数面积比等等。不同的特征矢量具有不同的特点,它们在语音编码和识别领域有着不同的应用价值。沈阳理工大学学士学位论文82.2.2 自相关法在最佳线性预测中,若用下式定义的时间平均最小均方准则代替(2.3)式的集合平均最小均方准则,即令(2.16) 1201minNpnenN事实上就是短时自相关函数,
28、因而(2.17),R iki k(2.18) ,R kE S nS nk根据平稳随机信号的自相关性质,可得(2.19),1,2;0,1i kR ikip kp由(2.6)式,可得:(2.20) min10pkkRaR k综上所述,可以得到如下矩阵形式:(2.21) )()2() 1 ()0()2() 1()2()0() 1 () 1() 1 ()0(21PRRRaaaRPRPRPRRRpRRRn值得注意的是,自相关法在计算预测误差时,数据段S(0),S(1).S(n-1)的两端都需要加P个零取样值,因而可造成谱估计失真。特别是在短数据段的情况下,这一现实更为严重。另外,当预测系数量化时,有可能
29、造成实际系统的不稳定。自相关解法主要有杜宾算法、格型算法和舒尔算法等几种高效递推算法。2.2.3 协方差法如果在最佳线性预测中,用下式定义的时间平均最小均方准则代替(2.1.3)式的集合平均最小均方准则,则可得到类似的方程:(2.22) 121minNnpenN可以看出,这里的数据段两端不需要添加零取样值。在理论上,协方差法计算出来沈阳理工大学学士学位论文9的预测系数有可能造成预测误差滤波器的不稳定,但在实际上当每帧信号取样足够多时,其计算结果将与自相关法的结果很接近,因而稳定性一般是能够保证的 (当然这种方法也有量化效应可能引起不稳定的缺点)。协方差解法的最大优点在于不存在自相关法中两端出现
30、很大预测误差的情况,在N和P相差不大时,其参数估值比自相关法要精确的多。但是在语音信号处理时,往往取N在200左右。此时,自相关法具有较大误差的段落在整个语音段中所占的比例很小,参数估值也是比较准确的。在这种情况下,协方差法误差较小的优点就不再突出,其缺乏高效递推算法的缺点成为了制约因素。所以,在语音信号处理中往往使用高效的自相关法。2.2.4 全极点声道模型将线性预测分析应用于语音信号处理,不仅是为了利用其预测功能,更因为它提供了一个非常好的声道模型。将式(2.2)所示的方程看成是滤波器在语音信号激励下的输入输出方程,则该滤波器称为预测误差滤波器,其e(n)是输出误差。变换到z域,P阶预测误
31、差滤波器的系统函数为(2.23) 11piiiH za z 可以看出,如果将预测误差e(n)作为激励信号,使其通过预测误差滤波器的逆滤波器H(Z),即(2.24) 1111piiiH zA Za z则H(Z)的输出为语音信号s(n),也就是说,H(Z)在预测误差e(n)的激励下可以合成语音。因此,H(Z)被称为语音信号的全极点模型,也称为语音合成器。该模型的参数就是P阶线性预测的预测系数。1,2,.,ia ip因为预测误差含有语音信号的基音信息,所以对于浊音,模型的激励信号源是以基音周期重复的单位脉冲;对于清音,激励信号源e(n)是自噪声。语音信号的全极点模型是一种很重要的声道模型,是许多应用
32、和研究的基础。2.3 解线性预测参数方程组的算法沈阳理工大学学士学位论文10在前面我们推得了线性预测参数方程组,自相关法如(2.29)和(2.31)式所示,协方差法如(2.25)及(2.26)式所示。解线性预测参数方程组的算法有许多种,虽然都能从P个方程中解出P个未知数,但是各种算法的效率是不同的,利用方程组的系数矩阵的对称性可以使运算效率提高。2.3.1 利用乔里斯基分解计算协方差法的方程组协方差法的线性预测方程组如(2.26)式所示(2.25)1( , )( ,0),(1,2,., )pjnnjai jiip或用矩阵形式表示为(2.26)a=式中是正定对称矩阵,它的第(i,j)项元素为(i
33、,j),而 a 和是列矩阵,其元素分别是 ai和(i,0)。因为是一个对称正定矩阵,因此可以利用乔里斯基分解算法。按次算法,矩阵可分解成如下形式:=VDVT(2.27) 式中,V 是一个下三角矩阵,其主对角元素为 1,D 是一个对角矩阵。上标 T 表示矩阵转置。只要令(2.27)式两边的对应元素相等,就可以从(2.3.2)式中解出矩阵 V 和 D 的元素。即(2.28)1( , ),(11)jnikkjkki jV d Vji 由于对角元素 Vij=1,故(2.28)式可表示为(2.29)11( , )( , ),(11)jnjnikkjkki j di jV d Vji 而对于对角元素,利用
34、(2.29)式可以得到(2.30)1( , )inikkikki iV d V由于对角元素 Vij=1,故(2.30)式可以写成沈阳理工大学学士学位论文11(2.31)11( , ),(2)iinikkkdi iV di同时(2.32)1(1,1)nd综上可得其矩阵形式: (2.33) 矩阵分解为 V 和 D 完成后,就可以求解 a 了。利用(2.26)和(2.27)式,可以写出VDVTa=(2.34)令DVTa=Y(2.35)则VY=(2.36)由(2.32)式,可以写出VTa=D-1Y(2.37)利用(2.33)式可以得到求解矢量 Y 的递归关系式,如下式所示:(2.38)11,(2)ii
35、iijjjYV Ypi 初始条件为(2.39)11Y利用(2.34)式可以推得求解 a 的递推关系式为(2.40)1/,(11)niiiijjj iaYdV aip 初始条件为(2.41)/pppaYd)0 ,()0 , 3()0 , 2()0 , 1 (),()3 ,()2 ,() 1 ,(), 3()3 , 3()2 , 3() 1 , 3(), 2()3 , 2()2 , 2() 1 , 2(), 1 ()3 , 1 ()2 , 1 () 1 , 1 (321paaaappppppppp沈阳理工大学学士学位论文12应当指出, (2.37)式的递推过程是从 i=p-1 到 i=1 。至此,
36、协方差法的求解过程结束。利用乔旦斯基分解算法可以将最小预测误差表示成简单形式、协方差法可以将预测误差表示为(2.42)1(0,0)(0, )pnniniEai或利用矩阵形式表示为(2.43)(0,0)TnnEa根据(2.37)式,VTa=D-1Y,可得(2.44)11TTaY D V将(2.45)式代入到(2.44)式,即可写出(2.45)11(0,0)TnnEY D V由(2.36)式,VY=,可得(2.46)1VY将(2.46)式代入到(2.45)式,可以写出(2.47)1(0,0)TnnEY D Y最后可得(2.48)21(0,0)/pnniiiEYd上式表示,根据列矢量 Y 和矩阵 D
37、 可以求得均方预测误差,并可求得随 pnEnE的变化情况,从而决定 p 的选择。2.3.2 利用杜宾递推算法计算自相关法的方程组如 2.2 节所述,对于自相关法,主要是解(2.49)式,求得预测器系数。ia(2.49)1()( ),(1)pinnla RilR iip 沈阳理工大学学士学位论文13上述方程的系数矩阵如(2.12)式所示,是一个托伯利兹矩阵解上述方程有许多算法,如列文逊(Levinson)算法,罗宾逊(Robi-nson)算法等,然而比较有效的方法是杜宾(Durbin)递推算法下面列出这个算法的主要公式: (2.50)(0)(0),ER(2.51)1(1)(1)1( )() /,
38、(1)iiiinjjkR iaR ijEip (2.52)( ) ijiak(2.53)( )(1)(1),(11)iiijjiijaak aji (2.54)( )21(1)iiiEkE由(2.50)式至(2.55)式,可以对 i1,2,P 进行递推求解,而最终解为(2.55)( ),(1)pjjaajp在上面的表达式中,上述括号内的值表示预测器阶数,即表示 i 阶预测器的第( ) ijaj 个预测系数。应当指出,对于一个 p 阶预测器,在上述求解预测器系数的过程中,阶数低于 p 的各阶预测器系数也得到了。 应当指出, (2.50)式得到的是 i 阶预测器的预测误差。计算过程中可以通过( )
39、 iE(2.55)式求得对应阶数为 i 的预测器的预测误差如果自相关系数用一组归一化自相关系数 r(k)R(k)/R(0)来表示,短阵方程的解不变。此时,预测误差将变成归一化预( ) iE测误差,用表示 i 阶预测器归一化预测误差,则表示为( ) iV(2.56)( )( )(0)iiEVR如果假定(2.57)( )( )/(0)r kR kR则(2.58)( )( )( )11( ),(01;0)iikikkVar kVi 式中沈阳理工大学学士学位论文14(2.59)( 11)ik (2.59)式表明,的取恒范围在土 l 范围内。可以证明,它是多项式 A(z)的根在单位圆ik内的充要条件。由
40、此可以保证系统 H(z)的稳定性。2.3.3 利用格型法求解线性预测系数从前面讨论的方法来看,不论是自相关法还是协方差法,都是分为两步:1、 计算语音相关值的矩阵。2、 解一组线性方程求出预测系数。ia 但是,在语音相关值的计算中,特别是在语音段的端点处,由于作了与实际情况不同的假设,因而相关值计算误差较大,影响到线性预测系数汁算结果的准确性。所以,导致了另一类算法的发展,这就是格型法。七十年代初,日本学者板仓(Itakura)在美国从事研究时,在分析自相关法的基础上,引入了“正向预测”和“反向预测”的概念,阐述了参数的物理意义,首先提出了逆滤波器 A(z)的格型结ik构形式。由下面的讨论可知
41、,这种格型法不需要用窗口函数对信号进行加权,同时又保认解的稳定性,因而较好地解决了精度和稳定性之间的矛盾。特别是由于引入了正向预测和反向预测的概念,使均方误差最小逼近难则的运用增加了很大的灵活性,派生出了一系列基于格型结构的新的线性预测算法。在 Levinson-Durbin 递推算法中,如果计算出第 i 阶的线性预测系数为(,jl,2,i),利用这些系数可以计算第 i 阶逆滤波器(或称为预测误差滤波( ) ija器)的系统函数为(2.60)( )( )11( )1iiijjAza z 这个滤波器的输人信号是 s(n),输出信号为预测误差,它们之间的关系为( )( )ien(2.61)( )(
42、 )1( )( )()iiijjens na s nj经过推导,可知第 i 阶线性预测逆滤波器输出可分解为两个部分,第一部分足(i1)阶滤波器的输出;第二部分是与(i1)阶有关的输出信号,经过单位移序和( )( )ien(1)( )ibn沈阳理工大学学士学位论文15加权后的信号。下面讨论这两部分信号的物理意义。将这两部分信号定义为正向预ik测误差信号和反向预测误差信号( )( )ien( )( )ibn(2.62)( )( )1( )( )()iiijjens na s nj(2.63) ( )( )1( )()()iiijjbns nia s nij 式(2.62)中的即是通常的线性预测误差
43、,它是用 i 个过去的样本值:s(n( )( )ien1)、s(n2)、.、s(n-i)来预测 s(n)时的误差。而式(2.63)中的可看成是用时间( )( )ibn上延迟时刻的样本值 s(n-i+1),s(n-i+2),s(n)预测 s(n-i)样本的误差,所以整个误差称为反向预测误差。这个预测过程称为反向预测过程。在建立了正向预测和反向预测的概念后就可以推出线性预测分析用的格型滤波器结构。根据式(2.62)和(2.63) ,当 i=0 时,有(2.64)(0)(0)( )( )( )enbns n而 i=p 时(2.65)( )( )( )pene n这里是 P 价线性预测逆滤波器所输出的
44、预测误差信号,如果改用符号( )e n表示正向预测误差,则可写成如下递推形式( )( )ifn( )( )pen(2.66)s(n)(n)b(n)f(n)fk)(nb(n)b)X(X)(nbk(n)f(n)f)()()(ii)(i(i)nii)(ii)(i(i)0011121111+输入S(n)误差+)(0nf)(1nf)(2nf)(1nfn1k1k2k2knk1Z1Z1Z)(1nb)(2nb)(1nbn)()(nfne沈阳理工大学学士学位论文16图 2.1 滤波器简单示意图这个滤波器输入为 s(n),输出为正向预测误差,亦即预测误差 e(n)。另一( )( )pfn方面,在语音信号模型化的框
45、图中,模型即合成波器的 H(z)亦可采用格型结构。如果将模型中的增益因子 G 考虑到输入信号中,则该滤波器输入是 Gu(n),输出是合成的语音 s(n)。通过线性预测分析求得的 A(z)是 H(z)的逆滤波器,Gu(n)则由 e(n)来逼近,因此合成滤波器 H(z)的结构形式应该满足输入 e(n)时输出语音信号 s(n)。将式(2.66)进行整理,可得(2.67)(1)( )(1)( )(1)(1)( )( )(1)( )(1)( )iiiiiiiifnfnk bnbnbnk fn输入)(0nf)(1nf)(1nfn+1Z1Z1Z)(1nb)(2nb语音输出)(ns1k1k2k2k)()(nf
46、nunk图 2.2 合成滤波器示意图反射系数是语音处理中至关重要的参数,它的计算是一个重要问题。在自相关法和协方差法中,用预测误差最小为条件求出线性预测系数。格型法的特点之一是能够在格型的每一级进行合适的本级反射系数计算。显然,格型法的结构与前面讨论的自相关法和协方差法的结构之间存在若干差异。格型滤波器的优点为:1、反射系数可被直接用于计算预测系数,格型滤波器的级数等于预测系数的个数。2、格型滤波器的稳定性可由其反射系数的值来判定。可以证明,格型滤波器稳定的充要条件是:1。ik下面,我们进行格型法的求解式(2.62)的 Z 变换可以表示为(2.68)( )( )( )( ) ( )iiEzAz
47、 S z将(2.63)式代入到(2.30)式,可以从递( )(1)(1),(11)iiijjiijaak aji (1)( )iAz推沈阳理工大学学士学位论文17求解,将式代人到(2.39)式可得( )( )iAz( )(1)(1)1( )( )()iiiiiAzAzk z Az(2.69)( )(1)(1)1( )( ) ( )() ( )iiiiiEzAz S zk z AzS z取(2.63)式的 Z 变换得(2.70)( )( )1( )() ( )iiiBzz AzS z利用(2.70)式球得(2.69)式的 Z 反变换形式为(2.71)( )(1)(1)( )( )(1)iiiie
48、nenk bn同理可推得(2.72)( )(1)(1)( )(1)( )iiiibnbnk en伯格(Burg)提出了一种算法,它是基于使正反向预测误差的平方和为最小,( ) iE可以表示为( ) iE(2.73)1( )( )2( )20( )( )NiiinEenbn将(2.71)式和(2.72)式代入(2.73)式,可得(2.74)1( )(1)(1)2(1)(1)20( )(1)(1)( )NiiiiiiinEenk bnbnk en令(2.75)( )0iiEk可求出为ik(2.76)1(1)(1)( )01122(1)(1)002( )(1)( )(1)NiiiniiNNiinne
49、n bnkaenbn上式说明,将正向与反向预测误差联系起来了,它表示正向与反向预测误差的ik相关度,故称参数为部分相关系数(PARCOR 系数) 。的取值范围为ikik(2.77)11ik 格型算法的步骤可以归纳如下:沈阳理工大学学士学位论文18(1) 确定初始值:(0)(0)( )( )( )enbns n(2) 由(2.71)式可以求得1(0)(0)(1)0111122(0)(0)002( )(1)( )(1)NnNNnnen bnkaenbn(3) 由(2.71)式和(2.72)式计算正向和反向预测误差:( )(1)(1)( )( )(1)iiiienenk bn( )(1)(1)( )
50、(1)( )iiiibnbnk en(4) 设 i=2。(5) 由(2.71)式求 ki1(1)(1)( )01122(1)(1)002( )(1)( )(1)NiiiniiNNiinnen bnkaenbn(6) 由(2.53)式决定,(j=1,2,i-1) ,( ) ija( )(1)(1),(11)iiijjiijaak aji (7) 同(3) 。(8) 设 i=i+1。(9) 若 ip,重复(5) (6) (7) ,否则(10) 。(10)结束。由于格型算法不需要计算自相关函数,可以直接从语音取样中求得预测系数,因而避免了语音端点处具有比较大的相关函数误差的缺点。此外,格型算法能保证
51、产生一个稳定的滤波器,不要求窗选。上述的这些特性,格型法对于构成线性预测分析系统已成为一种重要的极有生命力的方法。2.4 各种算法的比较沈阳理工大学学士学位论文19前面我们已经讨论了线性预测方程组的协方差算法,自相关算法和格型算法。在这一节中,我们将对这些算法在计算效率与存储要求,以及解的稳定性、选择极点个数和分析段长度等方面进行比较。首先,在存储量方面,若是协方差法分析取样点的数目,则协方差法要求的存1N储量为个数据和数量级为正比于的相关矩阵元素储存位置。若是自相关法1N2/ 2p2N分析取样点的点数,则自相关法需要个位置来存储数据和窗函数,需要数量级正比2N于 p 的位置来存储自相关矩阵元
52、素。若 N3 为格型法分析取样点的点数,则格型法需要3 个位置来存储数据和正反向预测误差。综上所述,协方差法和自相关法所需的存3N储量比格型法少。在运算量方面,对于协方差法,相关矩阵的计算需要的乘法次数正比于P,而1N用乔里斯基方法解矩阵方程需要的乘法次数正比于。对于自相关法,自相关矩阵的3p计算需要的乘法次数正比于,而矩阵方程的解需要的乘法次数正比于。因此,2N p2p如果和近似相等,且P ,P,则自相关方法所要求的运算量略少于协方1N2N1N2N差法。由于计算相关函数的运其量大大超过解矩阵方程的乘法次数。因比,自相关法的运算次数和协方差法是非常接近的。对于格型法,计算部分相关系数需要 5
53、次3N p乘法。因而格型法的运算量较大。表 2.1 列出了解线性预测方程的各种解法在存储量和运算量方面的比较。在解的稳定性方面,也就是所得到的系统表 2.1 LPC 各种解法的比较 方法指标分类协方差法(乔里斯基法)自相关法(杜宾法)格型法(伯格法)存储量数据矩阵窗N1正比于 P/20N2正比于 PN23N3计算量(乘法次数)加窗相关解矩阵0正比于 N1P正比于 P3N2正比于 N2P正比于 P25N3P沈阳理工大学学士学位论文20(2.78)( )( )GH zA z是否稳定,若的所有极点位于单位圆内,则系统稳定,亦即要求( )H z(2.79)11( )1pjjA za z 的所有零点位于
54、单位圆内。对于自相关法,A(s)的所有根位于单位圆内,因而其解是稳定的。但是应当指出,如果计算自相关函数的精度不够,那么解的稳定性就不能保证。实验结果表明,如果对语音进行预加重,使其谱尽可能平滑,则可以使不稳定性尽可能避免。杜宾算法中利用下式作为检验稳定性的方法,即部分相关系数满足ik(2.80)11ik 满足上述条件就满足了解的稳定的充要条件。对于协方差法,它无需对语音信号加窗,即不规定信号 X(n)的长度,测器解的稳定性是不能保证的。然而,当每个分析帧的取样点数足够大,协方差法和自相关法所得的结果相同,则协方差法的解稳定。对于格型法,因为预测器系数求解中,部分相关系数满足(2.80)式,故
55、其解稳定。ik关于预测器阶数 P 的选择问题,它和采用哪一种方法无关。P 的选择主要和取样频率的选择有关。被分析的语音谱一般可以用每千赫具有 2 个极点的系统来表示声道响应,也就是说,当采样频率为 F3(KHZ )时,语音谱最高频率为 F3/2(KHZ )时,总共需要 F3个极点若 F310 (KHZ ),则需要 10 个极点的系统来表示声道响应。此外,还要 34 个极点来表示激励源和辐射负载,因此,对于 10(KHZ )取样频率,要求 p 值为13 至 14。当 p 进一步增加时,预测误差并不减少许多,因而选择 P1314,已经基本可以了。关于分析段长度 N 的选择问题。从运算量考虑,希望
56、N 尽可能小,因为对于所有这三种方法,总运算量正比于 N。然而,对于自相关法,N 的大小必须等于基音周期的若干倍,以使窗效应不致严重影响得到的结果。当取样频率为 10 kHz 时,自相关法要求选择 N400 左右。而对于协方差法和格型法,如果分析能够限制在每个基音周期范围内,一般取 N2p,而对于大多数不能进行基音同步分析的系统,则 N 的选择与自相关法差不多。沈阳理工大学学士学位论文213 MATLAB 简介MATLAB 语言是当今国际上科学界最具影响力、也是最有活力的软件。它起源于矩阵运算,现已经发展成一种高度集成的计算机语言。它提供了强大的科学运算、灵活的程序设计流程、高质量的图形可视化
57、与界面设计、便捷的与其他程序和语言接口的功能。MATLAB 语言在各国高校与研究单位起着重大的作用。MATLAB 是一种用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境。使用 MATLAB,可以较使用传统的编程语言更快地解决技术计算问题。 MATLAB 的应用范围非常广,包括信号和图像处理、通讯、控制系统设计、测试和测量、财务建模和分析以及计算生物学等众多应用领域。附加的工具箱(单独提供的专用 MATLAB 函数集)扩展了 MATLAB 环境,以解决这些应用领域内特定类型的问题。MATLAB 提供了很多用于记录和分享工作成果的功能。可以将 MATLAB 代码与其他语
58、言和应用程序集成,来分发自己的 MATLAB 算法和应用。MATLAB 对整个数据分析过程提供支持,该过程从外部设备和数据库获取数据,通过对其进行预处理、可视化和数值分析,最后到生成质量达到演示要求的输出。3.1 MATLAB 的背景在 70 年代中期,Cleve Moler 博士和其同事在美国国家科学基金的资助下开发了调用 EISPACK 和 LINPACK 的 FORTRAN 子程序库。 EISPACK 是特征值求解的FOETRAN 程序库,LINPACK 是解线性方程的程序库。在当时,这两个程序库代表矩阵运算的最高水平。到 70 年代后期,身为美国 New Mexico 大学计算机系系主
59、任的 Cleve Moler 在给学生讲授线性代数课程时,想教学生使用 EISPACK 和 LINPACK 程序库,但他发现学生用 FORTRAN 编写接口程序很费时间,于是他开始自己动手,利用业余时间为学生编写EISPACK 和 LINPACK 的接口程序。Cleve Moler 给这个接口程序取名为 MATLAB,该名为矩阵(matrix)和实验室(labotatory)两个英文单词的前三个字母的组合。在以后的数年里,MATLAB 在多所大学里作为教学辅助软件使用,并作为面向大众的免费软件广为流传。1983 年春天,Cleve Moler 到 Standford 大学讲学,MATLAB 深
60、深地吸引了工程师沈阳理工大学学士学位论文22John Little。John Little 敏锐地觉察到 MATLAB 在工程领域的广阔前景。同年,他和Cleve Moler,Steve Bangert 一起用 C 语言开发了第二代专业版。这一代的 MATLAB 语言同时具备了数值计算和数据图示化的功能。1984 年,Cleve Moler 和 John Little 成立了 Math Works 公司,正式把 MATLAB 推向市场,并继续进行 MATLAB 的研究和开发。在当今 30 多个数学类科技应用软件中,就软件数学处理的原始内核而言,可分为两大类。一类是数值计算型软件,如 MATLAB、Xm
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- g k h 说课稿-2024-2025学年语文一年级上册统编版
- 2024年四年级英语上册 Unit 5 I like those shoes Lesson 30说课稿 人教精通版(三起)
- 14小狗学叫 说课稿-2024-2025学年三年级上册语文统编版
- 项目产品推广方案
- Unit 1 My classroom Part B Read and write 大单元整体说课稿表格式-2024-2025学年人教PEP版英语四年级上册
- 5《协商决定班级事务》第1课时(说课稿)-部编版道德与法治五年级上册
- 出售供暖平房合同范本
- Unit 4 Then and now 单元整体(说课稿)-2023-2024学年人教PEP版英语六年级下册
- 万亿存款合同范例
- 中介房产抵押合同范例
- 家谱人物简介(优选12篇)
- 品管部岗位职责20篇
- 2023年中智集团下属中智股份公司招聘笔试题库及答案解析
- LM2500燃气轮机结构简介
- GA 1409-2017警用服饰硬式肩章
- 小儿垂钓 (课件)(14张)
- 四级700核心词 词根词缀记忆法 刘一男讲义
- 嘉吉乐恩贝1-FarLactation课件
- 激光拉曼光谱技术课件
- DB33-T 2082-2017(2021)托幼机构消毒卫生规范
- 提高携带双J管患者的健康教育落实率泌尿科品管圈课件
评论
0/150
提交评论