单芯片语音密码机中低速率语音编码研究与实现_第1页
单芯片语音密码机中低速率语音编码研究与实现_第2页
单芯片语音密码机中低速率语音编码研究与实现_第3页
单芯片语音密码机中低速率语音编码研究与实现_第4页
单芯片语音密码机中低速率语音编码研究与实现_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、单芯片语音密码机中低速率语音编码研究与实现 西安电子科技大学/燃哕嬲摘要随着通信技术和信息安全技术的发展,语音的保密通信技术也受到相关部门的重视,尤其是在政府部门、公安部门和军事通信部门应用非常广泛。虽然语音保密通信在近几年来有了很大的发展,但是由于语音速率不够低使得加密后的语音信号数据量大、占用信道宽和传输速率低。所以当前急需一种低速率语音编码算法来满足语音保密通信的需求。压缩感知理论的提出是近几年来信号处理领域的重大突破。它将信号在某个变换域的稀疏性作为先验信息结合到了信号重构过程中。本文创新性的利用了压缩感知的方法,通过找到一个信号的稀疏表示空间,有效的重构原始语音信号。这一研究必将在信

2、号处理领域发挥巨大的作用。针对当前低速率语音编码的发展背景,本文提出了基于压缩感知的低速率语音编码算法。论文首先对语音编码理论的基本知识进行了介绍;对压缩感知理论在语音编码中的应用进行了研究;提出了基于压缩感知低速语音编码的算法,其中还对压缩感知在语音编码中的应用进行了仿真测试。最后,本文通过仿真测试软件设计了测试环境,主要从主观和客观两个方面对该低速率语音编码算法的性能进行了对比分析。其中对各技术细节采用了仿真测试得出实验数据。此外本文还研究了该低速率语音编码算法在硬件平台上的实现方案。本文中选用了达芬奇系列型开发套件进行运行测试。通过在硬件设备测试,完成了低速率语音编码算法在单芯片上实现的

3、目标,对以后的进一步研究具有重要的理论和实践指导意义。关键字:低速率压缩编码压缩感知线谱对参数单芯片语音密码机 ,.,. .,. 嬲 . ., ? ,.; ; . . . ,. .?.,:?目录目录第一章绪论?.语音编码的背景介绍?.语音数字通信系统介绍.语音编码分类及发展方向.语音编码的概念.语音编码的分类.语音编码的发展。.低速率语音编码研究的意义?.本论文的研究工作及结构安排.第二章语音压缩编码基础理论研究.语音信号的特征分析?。.语音声学特征分析?.语音编码基础理论分析?:.语音信号产生的数字模型?.语音可压缩编码的依据.语音编码的极限速率?.衡量语音编码性能的主要指标.语音编码基本技

4、术的研究?。.语音信号的预加重处理.语音信号的加窗处理?.短时平均能量?.短时平均过零率.短时自相关分析.基音周期估值?.多带激励.本章小结第三章压缩感知在语音编码中的应用研究.压缩感知理论的概述。.信号表达的稀疏性.观测矩阵的设计.信号重构算法?.压缩感知的优势单芯片语音密码机中低速率语音编码的研究与实现.压缩感知理论在语音编码中的应用研究.语音信号在离散傅里叶域的压缩感知分析。.语音信号在离散小波域的压缩感知分析.语音信号在离散余弦域的压缩感知分析.压缩感知在其它领域的应用?.本章小结。.第四章基于压缩感知的低速率语音编码算法设计.低速率语音编码模型设计?。.预处理?.基音周期的提取。.子

5、带分析。.线性预测分析?。.增益计算.帧结构及比特分配方案.参数的压缩感知降维算法?.低速率语音解码概述?.编码算法的关键技术?.对线谱对参数进行降维处理技术?。.残差谐波谱的处理技术.自适应谱增强技术.本章小结?。第五章低速率语音编解码算法实现与分析.低速率语音编解码算法在平台的仿真测试.测试环境介绍?.测试平台设计及测试步骤概述:?.主观测试结果分析.客观测试结果分析?.频域情况分析?.语谱特性对比分析?.低速率编码算法与混合激励预测模型的对比分析.比特分配对比分析?一.编码速率分析。. 验证测试?。.实现平台.实时数据采集?目录.语音编码应用程序设计.语音线程的执行过程?.平台运行实现.

6、本章小结.第六章总结与展望?. .工作总结?.工作展望致谢 参考文献?研究生在读期间的研究成果单芯片语音密码机中低速率语音编码的研究与实现第一章绪论第一章绪论本章主要对数字语音通信系统的基本原理以及语音编解码的应用进行了介绍。重点还对当前语音密码机和语音压缩编码的发展和相关背景进行了介绍,最后对本文各章所要研究的内容进行了简单介绍。.语音编码的背景介绍随着通信技术和信息安全技术的飞速发展,语音的保密通信在政府部军事通信领域也得到了广泛的应用。年中国电子科技集团公司所正式宣布了我国首款具有完全自主知识产权的保密系列手机在成都诞生了。这种保密手机通过语音、短信、数据的端到端加密,使通信信息在通信链

7、路的任何节点均以密文方式存储、传输,确保个人通信安全。年据新华社电国家信息安全工程技术中心又成功研制出一款加密手机,将有效解决手机信号泄密问题。据该技术中心有关负责人介绍,这款加密手机使用独立编程软件及具有自主知识产权的保密芯片,其特点是采用密码体制,具有不可丢失性,而且通话延时时间极低,也可实现与加密电话座机之间的互通。更重要的是采用了有效的语音编码算法,使得该手机通话延时很小。由于无线网络本身的特点,无论手机是否开机,手机周围的信号都会通过无线电磁波泄漏出去,手机泄漏给现代信息安全提出了巨大的挑战。所以研究出作为信息安全、防泄密的先进电子设备,运用到国家涉密单.位和日常办公,将有利于保护国

8、家的信息安全【。.语音数字通信系统介绍语音信号一般是一种时变的非平稳的模拟信号。为了提高移动通信的信噪比和频带利用率,通常我们把模拟的语音信号通过,采样后转换成离散的数字信号后传输。根据文献【 中介绍这种把模拟信号转换成数字信号后在通信信道中传输的系统称为数字通信系统。数字通信系统的基本特征主要是:.在系统中传输的信息或信号具有离散的特性。.语音信号数字化后在信道上传输时,可以通过差错控制来减少信道中的噪声和干扰。一般是通过差错控制来提高信噪比的。所以,通常我们在发送端用一个编码器完成,相应的在解码端需要一个解码器。一般编码和解码是同时出现的。此外,在保密通信中为了信息的保密通信需要把数字基带

9、信号加密或扰乱后传输,此时在接收端必须要对应的有一个解密。单芯片语音密码机中低速率语音编码的研究与实现为了使发送端与接收端数字信号传输的有序性,接收端同步信号必须与发送端相同。因此,接收端必须有一个与发送端相同的节拍,以免造成因收发步调不一致而造成混乱。另外,基带信号都是需要把消息的特征编组称为消息码字来表达要表述的消息,一般在数字通信中我们所说的节拍就是“位同步或“码元同步,而称码组一致为“群同步或“帧同步,所以同步信号在数字通信中有很重要的作用。数字频带传输模型】如下图.所示。图.数字频带传输模型在一般的语音保密通信中为了实现信道中的安全传输,在发送端和接收端分别用加密器和解密器来完成对实

10、时语音信号的扰乱。同样在接收端也要完成对语音信号的解码和解密以恢复出原始的数字语音信号。在本文中主要是对语音信号的压缩编码的研究。.语音编码分类及发展方向.语音编码的概念语音信号是模拟信号,不能直接在数字通信系统中传输,必须首先进行模/数转换和数/模转换。这种模/数转换和数模转换就称为语音编译码器,其作用是在发送端将语音模拟信号转换为数字信号,到了接收端,再将收到的数字语音信号还原为模拟语音信号,语音编译码又简称为语音编码。可见语音编码技术在数字通信中具有十分重要的作用。.语音编码的分类语音编码的分类方法有很多,主要有传统的分类方法、按照编码速率的不同的分类方法、按照被编码信号所在域不同的分类

11、方法、按照编码所使用的主要技术的分类方法、按照编码算法是否依赖于某种模型假定的分类方法、按照被编码信号属性不同的分类方法、按照编码速率是否固定的分类方法和按照出现和应用时间以及技术发展情况的分类方法等【。在这里我们介绍按照传统的分类方法和按照被编码信号所在域不同的分类方法。语音编码根据传统的分类方法通常可分为第一章绪论三类,分别是;波形编码、参数编码和混合编码。下面对它们进行简单的介绍。.波形编码波形编码就是通过直接在时间域、频率域或者变换域上重构原始信号波形,尽量使重构的语音信号与语音信号波形相同。波形编码的主要优点是编码重构后的语音信号音质好,抗噪声性能好。主要的缺点就是编码的速率比较高。

12、主要的波形编码包括:编码、增量调制、自适应增量调制等。.参数编码参数编码一般叫声码器或分析.综合器,它是提取信号在频域或者其他变换域的特征参数然后对这些特征参数进行编码和传输。接收端通过先译码出这些特征参数从而恢复出原始的语音信号。参数编码的主要优点是可实现很低的编码速率编码速率一般可到.以下。不足之处在于语音质量差,自然度低等。下面分别分析时域、频域和混合域的编码。.时域编码时域编码就是对语音信号在时间域内进行相关处理并进行压缩编码。主要包括二元激励线性预测模型、混合激励线性预测模型、正弦激励、插值编码模型等。二元激励线性预测模型是最基本的低速率语音编码方法,这个模型的主要特点就是激励源主要

13、由清音和浊音两个分支组成,语音信号是由激励源通过激励一个自适应滤波器产生,滤波器的参数是通过自相关预测来实现的。在低速编码中有很广泛的应用,主要应用于军事通信和其他通信领域。混合激励线性预测声码器算法是把语音分为清音、浊音和抖动音种情况,抖动音是由非周期信号和白噪声合成的激励信号,而浊音信号是由周期信号和白噪声合成的激励信号。另外,混合激励模型的实现还利用了多带模型,即把语音信号通过一个带通滤波器分成若干个频带,然后对每个频带进行清浊音判决。在译码端把个子带信号相加而得到混合激励信号。声码器是在传统的二元激励线性预测模型的基础上作了改进,吸收了多带激励、.等算法的一些思想。并在基音提取算法上作

14、了改进,如改进了基音提取算法,引入了非周期脉冲和傅里叶级数幅度值来合成激励信号等,使得在./速率上能得到很好的语音合成质量,也就是使得合成语音能够很好的拟合自然语音。.频域编码频域编码就是对语音的频域信号进行编码。子带编码就是典型的频域波形编码技术。子带编码就是把输入的语音信号通过带通滤波器组分成若干个小的子带信号,然后通过调制过程把各子带信号的频谱搬移到低频附近进行处理。形成低通信号后,再以采样速率对各子带输出进行取样,并把这些取样的值进行常规的数字编码。例如:编码,编码和自适应编码等。单芯片语音密码机中低速率语音编码的研究与实现.低速率编码多带激励多带激励就是通过把语音信号在频域分成若干子

15、带,对各带信号进行清浊音判决,然后根据判决结果采用不同的激励信号合成语音,最后将各带信号相加形成全带合成语音。该算法在.和./速率上合成出音质比传统的声码器好的多的语音,有较好的自然度和容忍噪声的能力。波形内插编码算法波形内插是最近几年发展起来的一种合成语音质量较高的低速率语音编码算法。它是通过一系列的特征波形来表示语音信号,最后对特征波形内插来重建语音信号。波形内插方法的主要特点是充分的利用了人类产生和感知语音的特性,通过把语音信号的波形分解为两种特征波形,一种是用来表示准周期波形的缓慢演变的波形。它的特点是对时间的分辨率要求不高而对量化精度要求高。另外一种是快速演变波形,这种波形可以表示信

16、号中的非周期性成分。采用这种波形分解的方法,可以避免采用不同的编码模型和在两种模型之间频繁转换,可以提供很高的编码算法的坚韧性。正弦变换编码算法正弦变换编码是低速率语音编码的一类重要语音编码算法。主要采用的技术有浊音信号,它由一组幅度、相位和频率时变的正弦信号线性组合来实现,正弦波的幅度、相位和频率在相邻的帧之间是保持连续的。主要的正弦编码算法有正弦变换编码和多带激励模型。在早期的正弦模型中,语音的短时傅里叶谱决定着正弦波的幅度、相位和频率而和基音周期几乎没有关系。这种方法虽然可以合成较好的语音质量但是由于模型中的参数很多,所以很难降低编码速率。矢量量化声码器标量量化就是把整个动态范围划分成相

17、等的多个不同的区间,然后把每个区间用一个值来代表,量化是把输入的标量信号用落入区间的量化值来代表。由于量化是由一维信号量化的,所以叫做标量量化。矢量量化是将若干个标量量化的数据构成一个矢量,然后在矢量空间中给予整体量化。这样就可以在一定程度上压缩了数据信息。当然这种压缩是有损失的,但这是一种高效的数据压缩技术。在混合激励预测模型中,通过提取每帧的特征参数然后进行多帧联合矢量量化处理,就是通过把多个帧结构组合起来构成一个超帧结构码字。混合激励模型也采用了许多改进的算法,对基音周期的提取,多带激励的方法,以及采用了帧间内插技术。多帧联合矢量量化可以有效的降低编码速率,并且接收端合成的语音能够很好的

18、模拟原始语音波形,具有很好的自然度、清晰度以及可懂度。基于语音识别与合成的语音编码第一章绪论这种编码器就是利用语音识别和语音合成技术对语音基元进行编码,接收端再根据收到的编码恢复出这些基元从而重新合成语音信号。这种声码器由于编码的是语音基元的编号,所以需要传输的比特数较少,在接收端通过语音合成技术重新恢复出原始的语音信号。目前,已经有研究机构开发出了这种基于语音合成的声码器,并且编码速率已经低于匕特以下,合成语音质量的可懂度可达到%以上。实际上,根据研究分析表明,采用语音识别与合成的声码器理论速率可降低到怕以下也可恢复出很好的语音信号。从上面的分析可以看出,通过对人类语音的产生模型进行研究分析

19、,产生了多种不同的低速率语音编码模型。这些编码模型都有各自的优点和不足之处。而编码速率和合成语音质量之间往往是矛盾的。例如波形编码往往能够得到很好的语音合成质量,但是编码速率一般在./以上。而低速率语音编码如混合激励预测编码模型编码速率达./,但合成语音质量相对来说略显不足【。.语音编码的发展语音编码的应用非常广泛,它是通信领域的一个重要研究方向,在通信领域,互联网以及广播电视领域都有它的应用。语音信号数字化后的存储传输在有效性和可靠性方面对于模拟语音信号来说具有很大的优势,并且由于数字信号的灵活方便、易于保密、价格低廉的特点使得数字化语音在通信系统中的比例越来越大。近几年来随着军事通信、移动

20、通信和互联网的发展,语音通信技术也在相互融合中发展。十二五发展规划期间国家提出了三网融合的目标。对于语音编码来说也取得了巨大的发展。语音编码作为数字语音通信过程中的重要组成部分,主要分为三个大的发展方向:低速率语音编码、变速率语音编码和不压缩语音编码。在现代通信中低速率语音编码越来越重要。无线通信中的带宽资源不足的问题依然没有有效的解决方法,所以信道利用的有效性和经济适用性依然是研究的目标。低速率语音编码也因此成为一个重要的研究方向。在实际的通信中可能有些信道带宽难以扩展或者通信质量很差,如短波通信;也有一些信道价格昂贵难以更新例如卫星电话;还有一些特殊用途的通信,如在军事通信领域可能存在恶劣

21、的通信条件。在这种情况下低速率语音编码显得极为重要。随着信息安全等领域的发展低速率语音编码也将在保密通信、语音智能控制、网络通信等领域有广泛的应用前景。不压缩语音编码也是未来语音编码的一个发展方向。随着光纤通信技术的发展,带宽问题已经不再制约语音通信的发展了。通信成本的大幅度下降使语音编码支付的通信费用大于了所节省的通信费用,语音不压缩反而更节约成本。所以可以直接采用不压缩编码的方法进行通信,例女编码直接传输这样可以保证单芯片语音密码机中低速率语音编码的研究与实现很好的通话质量、低的设备成本从而降低了通信费用。在移动通信中广泛应用的变速率语音编码也是未来发展的一个方向。在移动通信中为了合理有效

22、的利用信道资源,通信系统动态地调整语音编码的速率,这样可以提高信道利用率,增加信道容量。在当前非常流行的通信技术就采用技术和采用变速率语音编码算法来提高通信系统有效性的【。.低速率语音编码研究的意义语音保密通信技术是信息安全和通信技术相结合的一个新的研究领域。在军事通信、航空航天、政府部门和公安消防等部门都有广泛的应用。传统的语音加密系统主要包括声码器、加密模块和相应的辅助电路。由于这种密码机的集成度低、成本高、体积大和应用不方便等特征使得我们迫切需要一种适合应用的单芯片语音密码机。目前,语音编码不能实现单芯片化的主要原因是还没有一种有效的低速率编码算法,其次是芯片集成化程度不高。在一般的语音

23、通话中话音的质量很重要,比如语音的自然度,清晰度和可懂度等指标。但在信息安全的角度来说,主要就是语音的保密性,即尽可能的保证数据不被他人窃听,并且在接收方能够完整的解密出原始语音信号,从而接收到正确的信息。因此需要一种可靠的加密算法保证数据的安全,但是由于语音信号经过加密后数据量增大,如果采用一般的语音编码方法,那么编码后在信道中传输的数据会很大,根本不能满足语音实时通信的要求,所以本文以此为出发点,研究一种低速率的语音编码算法来满足语音保密通信的需要【。.本论文的研究工作及结构安排本论文主要研究了基于保密通信的低速率语音编码算法。所做的工作主要有研究了压缩感知理论在语音编码中的应用、提出基于

24、低速率语音编码算法、用仿真实现及性能测试、基于的平台应用实现等。第一章绪论先介绍语音编码的背景知识,然后介绍了语音编码的概念、分类、发展方向,最后介绍了语音编码在保密通信中的应用。第二章主要对语音压缩编码中用到的理论和技术进行分析和研究。第三章深入研究压缩感知的理论知识并把它与语音压缩编码中的应用相结合进行了研究。最后提出了压缩感知在语音编码中的应用方法。第四章提出低速编解码算法的模型,并从编码和解码两方面进行详细介绍。第五章主要对该算法进行实现、设计了测试平台、进行了性能仿真对比测试最后在平台实现。第二章语音压缩编码基础理论研究第二章语音压缩编码基础理论研究为了用数字信号处理方法对语音信号进

25、行处理,首先需要建立语音信号产生的模型,因此,我们必须在对人的发音器官和发声机理进行研究的基础上,才能建立精确的模型。但是,由于人类语音产生过程的复杂性和语音信息的丰富性及多样性,迄今为止还没有找到一种能够精确描述语音产生过程和所有特征的理想模型。.语音信号的特征分析.语音声学特征分析.发浊音的情况根据参考文献介绍当气流通过声带时,如果声带处于紧绷状态的情况下,那么声带就会在气流的作用下产生张弛的振动状态,也就是说声带处于周期的开启和闭合状态。当声带打开时,气流通过声带而产生一个冲激的脉冲波,当声门关闭时,气流不能通过脉冲波,这样,声带的振动就会产生连续的周期脉冲波从而形成了所谓的浊音信号。.

26、发清音的情况当声道中的气流通过声带的时候,如果声带正好处于自由闭合状态,那么由肺部输出的空气流通过声门时将不受影响。当空气流经过声门后会生成两种状态,一种状态是,如果声道的某个部位发生收缩形成了一个狭窄的通道,当空气流到达此处时被迫以高速冲过收缩区,并在附近产生出空气湍流,这种湍流空气通过声道后便形成所谓摩擦音或清音。另一种情况是,如果声道的某个部位完全闭合在一起,当空气流到达时便在此处建立起空气压力,闭合点突然开启便会让气压快速释放,经过声道后便形成所谓爆破音。这两种情况发出的音称为清音。.掩蔽效应一般人耳能够感受语音信号的频率范围大概为,在这个频率范围内人耳对不同的频率的分辨能力是不均匀的

27、,通常频率在?以内,人耳可分辨出来的单音的频率差大约为 .,但是在范围以内,频率分辨率相对来说是不固定大的, /.%。因此,把一的频率范围大概分成个频率间隔。当然对于不同的声强人耳对频率分辨的能力是不同的,人耳对于声音太强或太弱的信号,都会表现出很低的频率分别能力。对于时间人耳单芯片语音密码机中低速率语音编码的研究与实现的分辨力最短为,这是通过测试两个连续的声音,这两个声音具有不同的声音响度,通过对这两个声音的判断来确定人耳的分辨能力。当人耳同时受到两个响度不同的声音信号时,相对声音响度弱的信号就会被声音响度强的信号所掩盖掉,使得人耳不能感受到响度弱的信号的存在,一般我们把这种效应叫做掩蔽效应

28、。根据人耳的特征,频率低的声音的行波在内耳耳蜗基底膜上传递的距离是大于频率较高的声音信号的,所以,频率较低的信号一般会被频率较高的声音所掩盖掉,从而使得因一个声音的存在,而造成另外一个声音的听阀上升。.语音编码基础理论分析.语音信号产生的数字模型在研究语音信号处理之前需要首先建立语音信号的产生模型【】,语音信号的产生是根据人的发声器官的生理结构来建模的。语音信号建模一般有三种数学模型。即激励模型、声道模型、和共振峰模型。语音信号的数学模型就是利用数字信号处理技术来完成对人的发音器官进行模拟。根据发声器官和语音的产生过程,可以建立一个时域离散的语音信号产生模型。当然要建立一个十分精确的语音产生模

29、型是很困难的这是因为语音的产生不仅是一个复杂的生理和心理过程,而且与声道的形状、声道中的声音激励等因素都有一定的关系。语音信号模型建立的基本思想就是构造时变数字滤波器、周期脉冲发生器和伪随机信号发生器来合成语音。下面给出一个简单的语音信号产生模型如下图.所示信号图.语音信号产生模型语音信号产生模型主要包括三部分:由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。语音生成系统的传递函数由这三个函数级联而成,即下面,我们将建立这三个函数的数学表达。.激励模型发浊音时,由于声门的不断开启和关闭,产生间隙的脉冲,经仪器测试,它第二章语音压缩编码基础理论研究类似于斜三角形的脉冲。也就是说

30、,这时的激励波是一个以基音周期为周期的斜三角脉冲串。如下图.所示的三角波及频谱图,单个三角波的数学表达式为墨互爿石。业石 ?石 疗 其它式式.中,为斜三角波的上升时间,为其下降时间,由图.可以看出单个斜三角波的频谱表现出一个带通滤波器的特性。可以把它表示成变换的全极点形式。刁世.趟罂粤.声道模型声道模型有两种,即无损声管模型和共振峰模型。通过两种方法得到的数字模型本质上没有区别。当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。例如,对成人声道其共振频率计算公式 确?, 是共振频/一/率的序号,/声为速。按此算出前三个共振频率为:忡卜硒囊虿式.,。由于发音时,声道的形状很少是均匀断

31、面的。因此典型必通过语音信号来计算共振峰。实践表明,用前个共振峰代表一个元音足够了。对于较复杂的辅音或鼻音共振峰的个数要到个以上。多个叠加可以得到声道的共振峰模型,相对比较精确的估计共振峰的峰值。计算多个共振峰的共振频率可以用式.算出忡嘲加荛毒%。舞角式.单芯片语音密码机中低速率语音编码的研究与实现通常,且分子与分母无公因子及分母无根。可见,声道模型的传递函数是一个零极点模型,即砧立程【。.语音可压缩编码的依据通常在通信过程中为了提高通信信道的利用率,在数据的存储过程中为了节约数据的存储空间,一般是通过对语音信号的数据压缩编码来减少数据的大小。语音信号可以进行低速压缩编码是由其本身的物理特性所

32、决定的。根据参考文献【】中介绍首先在语音的信息成分中含有大量的冗余信息,这些冗余信息一般对语音的合成来说是没有贡献的。所以我们可以通过减少语音信号的冗余信息来降低编码速率。其次就是人耳对语音信号的感知能力。根据人耳的生理特性,人耳对语音信号中的有些频率成分是无法感知的,所以可以通过减少这些无效的频率成分来降低编码速率。.语音信号本身存在很大的冗余度研究表明,语音信号的成中有很多冗余成分,下面分别从时域上和频域上来进行研究。语音信号时域存在冗余度幅度分布的非均匀性。根据在通信过程中信号的分布特征,在语音信号中小幅度信号出现的情况更多,而且在通话过程中有很大一部分时间是不传信号的。所以根据信号的这

33、一分布特点就可以在小信号时用较少的比特来编码。这样就可以减少编码的速率了。劲 语音样本间的相关性很强。根据语音学相关的理论知识可知,音节是由清音和浊音组成的,而浊音信号是近似周期的信号,所以浊音具有很好的相关性。根据线性预测编码的相关知识,可以用过去若干个信号的值近似预测目前的信号值。从而可以减少编码速率。因为声道的形状决定了语音信号变化比较缓慢。语音信号是随机时变的信号,但是在短时分析上来看语音信号是平稳的信号。一般分析是采用帧长为.的语音信号进行分析的。但是在长时信号分析来看语音信号是变化的,根据统计长时自相关系数表明:如果语音的采样率为,则相邻样本间的平均相关系数高达.。存在静止系数语音

34、间隙。根据对通话双方的通话时长分析表明,两个舢人之间打电话,平均每个人的讲话时间各为通话时间的/,另/听对方讲。听的时候一般不讲话,即使在讲的时候,也会出现字、词、旬之间的停顿。通话分析表明,话音间隙使得全双工话路的典型效率约为通话时间的%。显然,话音的静音段是一种冗余信息,如果对这段静音进行标注,则就可对这个静音段进行第二章语音压缩编码基础理论研究“插空”从而传输更多的信息。.语音编码的极限速率由于语音信号本身存在很大的冗余度和根据人耳的听觉存在感知机理特性,使得语音进行压缩编码成为了可能,就是对语音信号中重要的信息进行压缩,把不重要的信息忽略不计。这样既可以降低语音编码的速率又可以保持好的

35、语音合成质量。那么究竟语音信号中把压缩的比特率最低降低到多少呢也就是语音可以压缩的潜力有多大,其极限速率多大。下面我们从语音和语言两个方面分别来研究语音编码的极限速率是多少。从语音的角度来看,语音中最基本的单位是音素。语音的音素共有个,如果按照通常的说话速度,根据参考文献【】如果平均每秒的发音速度为个音素。则根据信息论相关知识,此时的信息率为:川/ 式根据信息论的观点,发音就是以说话的速率来发信息,对于说英语的情况下,每一个字母用编码,每分钟发个英语单词可以认为达到了语音的通信速率。如果每个单词平均由个字母组成,则此时的信息速率为:/./ 式所以,一般认为语音编码的极限速率为一/。当然,这时只

36、能传送句子的内容,至于讲话者的音质、音调等重要信息已全部丢失。但是,从标准的语音编码速率到语音编码的极限速率/之间存在着很大的跨距约倍,这对于理论研究和实践制作有着很大的吸引力【】。.衡量语音编码性能的主要指标语音编码的目的是在一定编码速率的条件下尽可能的重建出好的语音质量,同时应尽可能减少编码译码算法的复杂度和时延,以及坚韧性要求的条件下尽可能的降低语音编码所需的速率等。这些都是衡量语音编码性能的主要指标。.语音编码质量语音编码质量是衡量语音编码优劣的关键指标之一。根据参考文献【】评价语音编码质量的方法很多,归纳起来主要有主观评价法和客观评价法两种。客观评价法客观评价法是用客观测量的手段来评

37、定语音编码质量的方法,主要的评价方法有信噪比评价法、加权信噪比评价法、评价分段信噪比评价法等。它们都是建立在度量均方误差的基础上,其特点是计算简单,但不能完全反映人对语音质量的主观感觉,这对于中、低速率语音编码尤为突出,因此客观评价法主要用于较单芯片语音密码机中低速率语音编码的研究与实现高速率的波形编码。主观评价法主观评价法符合人类听话的时候对语音信号的感觉,现在有很广泛的应用。常用的方法有评价意见打分法法、诊断押韵测试法法判断满意度测量等。其中打分采用的是五级评分标准,如下表.表.判分 质量级别失真级别优 不察觉良 刚有察觉可有察觉且稍觉可厌差明显察觉且可厌但可忍受坏不可忍受参加测试的实验者

38、,在听完所测语音后,从这五个等级中选择其中的一级作为他对所测试语音质量的评定。全体实验者的平均分就是所测语音质量的分。.编码速率编码速率可以用“比特/秒”来衡量,它代表了编码的总速率,一般用表示。编码速率可以用“比特/样点”表示,它代表了平均每个语音样点用多少比特编码,一般用表示。和可以通过取样频率联系起来:戤 式其中的取样速率是根据信号的带宽决定的。显然,平均每样点比特数越高,语音波形或参数量化就越精细,话音质量也就越好,相应的对传输带宽或存储容量的要求也就越高。.编译码复杂程度语音编解码器同语音的合成质量和编译码的复杂程度有很大的关系。一般来说,如果编码的速率相同编码复杂度越高则合成的语音

39、质量越好,但是编码后的延时越大。而话音质量相同,如果编码算法越复杂则编解码的速率就越低。编解码算法越复杂则要求的相应的软硬件结构更复杂。编解码算法复杂度决定着硬件实现的复杂程度、体积、功耗以及成本等。目前在各种语音编译码算法中都是采用数字信号处理器来实现的。它的好处就是研制时间短,投资小。.编译码时延语音编码算法复杂度的提高可以改善语音的质量,但也会增加编码的时延。在实时语音通信系统中语音编译码的时延同线路传输时延的作用是一样的,对系统的通话质量有很大的影响。时延影响通话质量的另外一个因素是回声。在电话网的/四线转换处,由于阻抗匹配的不理想,甲端四线的收话音信号会泄露到该第二章语音压缩编码基础

40、理论研究端四线的发路径中去,它返回到已端发话者,就形成了回声。如果回声传输路径损耗不够大,就会听到多次回声,从而严重影响了通话质量。.坚韧性坚韧性也是衡量语音编码性能的重要指标之一。所谓坚韧性是语音编码能够适应各种环境和条件的能力,在较为不利的环境和条件下能正常工作的能力。这包括以下几种情况:关于对不同说话人的语音辨识能力。关于适应噪声环境下工作的能力。在多级编码的情况下,语音编码质量不应有明显下降。在一定的误码率条件下能正常工作,即在.?.误码率时仍能提供可懂的重建语音。.语音编码基本技术的研究语音信号是一种短时平稳的随机信号,其中含有丰富的特征信息。按照分析的参数类型的不同,语音信号的分析

41、方法主要分为时域分析法和变换域分析法。时域分析法就是直接对语音信号的时域波形进行分析的方法,这种分析方法主要提取的特征参数主要有短时能量、平均幅度、短时自相关系数、平均过零率等。变换域分析主要有傅里叶变换、变换和小波变换等。本节主要对语音信号的时域分析方法做简单介绍。.语音信号的预加重处理对输入的数字语音信号通过采样和量化以后先进行预加重处理,其目的是为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率。一般通过传递函数为日一一的一阶高通数字滤波器来实现预加重,其中为预加重系数,.。设时刻的采样值为,经过预加重处理后的结果为;一一,这里去一.【】.图.为该高通滤波器的幅频特性

42、和相频特性。图.分别为预加重前和预加重后的一段浊音信号及频谱,从中可以看出,预加重后的频谱在高频部分的幅度得到了提升,使得信号的频谱变得更加均匀。单芯片语音密码机中低速率语音编码的研究与实现原始语音信号频谱蜊粤频率经过高通滤波后原始语音信号频谱口赵粤频率图.预加重前后频谱比较.语音信号的加窗处理进行预加重数字滤波处理后,接下来进行加窗分帧处理【】。语音信号是一种随时间而变化的信号,主要分为浊音和清音两大类。浊音的基音周期、清浊音信号幅度和声道参数等都随时间而缓慢变化。由于发声器官的惯性运动,可以认为在一小段时间里语音信号近似不变,即语音信号具有短时平稳性。这样,可以把语音信号分为一些短段来进行

43、处理。语音信号的分帧是采用可移动的有限长度窗口进行加权的方法来实现的。一般每秒帧数约为帧,视情况而定。分帧虽然可以采用连续分段的方法,但一般要采用交叠部分成为帧移,帧移与帧长的比值一般取为./,常用的窗有两种,分别是矩形窗和汉明窗,窗函数如下: 一、其它。,式但.乃 ,、 ./一】,其它吣卜,式相应的矩形窗时域波形和幅频特性图如下:对比图.与图.可以看出,矩形窗的主瓣宽度小于汉明窗,具有较高的频谱分辨率,但是矩形窗的旁瓣峰值较大,因此其频谱泄露比较严重。相比较,虽然汉明窗的主瓣宽度较宽,大约是矩形窗的一倍,但是它的旁瓣衰减较大,第二章语音压缩编码基础理论研究具有更平滑的低通特性,能够在较高的程

44、度上反映短时信号的频率特性。矩形窗时域波形 矩形窗幅度特性赵粤图.说明了加窗方法,其中窗序列沿着语音样点值序列逐帧从左向右移动,窗长度为。在确定了窗函数以后,对语音信号的分帧处理,实际上就是对各帧进行某种变换后运算。设这种变换或运算用【】表示,为输入语音信号,为窗序列,是与有关的滤波器,则各帧经处理后的输出可以表示为:汉明窗时域波形 汉明窗幅度特性口越。罐鲁.样点数 归一化频率图.汉明窗及其频谱.短时平均能量因为语音信号是时变信号,所以在不同时刻语音信号的能量是不同的【。因为浊音信号是周期信号所以能量大,而清音是随机信号能量更小一些。因此对短时能量和短时平均幅度进行分析,可以描述语音的这种特征

45、变化情况。定义时刻某语音信号的短时平均能量为 聊一扰】一罗陋沏一扰】一 罗彳,带一式.式中,为窗长,一帧的短时能量为所有样点的值的加权平方和。特殊地,当窗函数为矩形窗时,有单芯片语音密码机中低速率语音编码的研究与实现.善伽式?从另外一方面来说。令舻则上式可以表示成一川一尼奉厅式?式中首先求语音信号各样点值平方,接着通过一个滤波器,该滤波器的冲激响应为,输出一个时间序列为该语音信号的短时能量,短时能量的计算与冲激响应的选择或者说窗函数的选择有关。通常的选择与语音的基音周期相联系,一般要求窗长为几个基音周期的数量级。由于基音频率范围为?,因此折中选择帧长为下图为“北京欢迎您的短时能量函数随矩形窗长

46、的变化曲线,横坐标为帧数,帧间无交叠。图.中的幅图分别对应,。从图中可以看到,和的短时平均能量曲线不够平滑,而的曲线又太过于平滑,将语音信号个别的细节变化平滑掉了;所以的曲线比较合适。北京欢迎您.?一山山删 蚓疆口口.留留埭嫂且 .帧数一山? 山咖口血塑.鲁 莒壤. 嫂们,一、一?帧数图.短时能量.短时平均过零率短时平均过零率是语音信号时域分析中的一种特征参到。它是指每帧内信号通过零值的次数,对于以时间为横轴的连续语音信号,过零率就是语音信号穿过第二章语音压缩编码基础理论研究横轴的次数。对于时域离散的语音信号来说,相邻的两个点如果它们的值符号相反则可以确定为发生一次过零,所以可以用此方法来统计

47、该语音信号过零的次数。在单位的时间内统计过零的次数就称为过零率。而在一段长时间内统计的过零次数就是平均过零率。如果是正弦信号,其平均过零率就是信号频率的两倍除以采样频率,而采样频率是固定的。因此过零率在一定程度上可以反映信号的频率信息。语音信号不是简单的正弦信号,所以平均过零率的表示方法就不那么确切。但是由于语音是一种短时平稳信号,采用短时平均过零率仍然可以在一定程度上反映其频谱特性,由此可获得谱特性的一种粗略估计。短时平均过零的定义为。丽。赢?卧伽】式.其中,为符号函数,即蝴卅仨揣北四为窗函数,计算时常采用矩形窗,窗长为。可以这样理解:当相邻的两个样点符号相同时,】即没有产生过零;当相邻两个

48、样点符号相反时,?,为过零次数的两倍。因此在统计一帧点的短时平均过零率时,求和后必须要除以。这样就可以将窗函数表示为丽,。一其它【,式在矩形窗的条件下上式可以简化为乙三删一蝴一蝴一枘刮蝴】一蝴一蚋在实际的应用中,过零率容易受到/转换时的偏移,以及噪声的影响,所以常采用带通滤波器消除信号中的直流和低频分量;还可以通过修改门限率来修改过零率,减少随机噪声的影响。过零率反映了穿过正负门限的次数,通过修改过零率就可以抵抗噪声的影响。因为如果语音信号中存在随机噪声的干扰,若信号的幅值没有超过正负门限的范围,就不可能产生不正确的过零次数。在语音信号的端点检测时,经常采用双门限来检测语音的开始和结束的位置,

49、这样在一定的范围内提高了对噪声干扰的抵抗能力。下图.为“北京欢迎您的短时平均过零率运算图。短时平均过零率可以用于语音信号清、浊音的判断。语音产生模型表明,由单芯片语音密码机中低速率语音编码的研究与实现于声门波引起了谱的高频跌落,所以浊音语音能量约集中在以下。但对于清音,多数能量却是出现在较高的频率上。所以,如果过零率高,语音信号就是清音,如果过零率低语音信号就是浊音信号。但有的音,位于清音和浊音的重叠区域,这时,只根据短时平均过零率就不可能来明确地判断清、浊音【。原始信号螂馨样点值原始信号的过零率籁盼捌图.短时平均过零率.短时自相关分析自相关函数用于衡量信号自身时间波形的相似性。由前面的讨论可

50、知,清音和浊音的发声机理不同,因而在波形上存在较大的差异。浊音的时间波形呈现出一定的周期性,波形之间的相似性较好;清音的时间波形呈现出随机噪声的特性,杂乱无章,样点间的相似性太差。这样,可以用短时自相关函数来测定语音的相似性【堋。时域离散确定信号的自相关函数定义为尺一伽讧沏七式?时域离散随机信号的自相关函数定义为聃池熹奎沏弦仰都彻若信号为一周期信号,周期为,则上式说明,周期信号的自相关函数也是一个同样周期的周期信号,自相关函数具有下述性质:第二章语音压缩编码基础理论研究.对称性【.。.在处为最大值,即对于所有来说,。.对于确定信号,对应于能量,而对于随机信号,对应于平均功率。在上述的第个性质中

51、,如果是一个周期为的信号,则在取样,±,±,?处,其自相关函数也是最大值,因此可以根据在相关函数的最大值的位置来估计周期信号的周期值。对于语音来说,采用短时分析方法,可以定义短时自相关函数为一?式?因为一,所以一七聊伽一?一历式?定义蚰那么上式可以表示为:尺。七一?一朋 式?。?上式表明,序经过一个冲激响应茭数字滤波器滤波即得到短时自相关函数。图.分别给出了浊音和清音的短时自相关曲线,图.分别画出了时域波形、加矩形窗和汉明窗后用式计算短时自相关归一化后的结果。从图.中可以看出清音和浊音的短时自相关函数有如下几个特点:一帧语音信号/,/、/、/、/。一/厂/翟.样点数加矩形窗的自相关函数延时加汉明窗的自相关函数工图.短时自相关函数单芯片语音密码机中低速率语音编码的研究与实现.通过对语

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论