语音降噪技术简介

上传人：1*** IP属地：湖北上传时间：2022-04-11 格式：PPTX 页数：24 大小：599.03KB 积分：30 举报 版权申诉

已阅读5页，还剩19页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、语音增强原理及应用的讨论内容内容l语音增强相关概念语音增强相关概念l语音增强基本原理及应用语音增强基本原理及应用语音增强的定义语音增强的定义语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术。一句话，从含噪语音中提取尽可能纯净的原始语音。语音增强的目标语音增强的目标u改进语音质量，消除背景噪音；u提高语音可懂度！两者往往不能兼得，所以实际应用中总是视具体情况而有所侧重的！语音噪声语音噪声类型类型带噪语音的噪声类型按与信号关系可以分为加性噪声加性噪声和非加性噪声非加性噪声。加性噪声有宽带的，窄带的，平稳的，非平稳的，白噪声，有色噪

2、声，等；非加性噪声如乘性噪声，卷积噪声等。语音噪声类型语音噪声类型加性噪声：加性噪声：一般指热噪声、散弹噪声等，它们与信号的关系是相加，不管有没有信号，噪声都存在，信号与噪声是相互独立的信号与噪声是相互独立的！加性噪声来源一殷可以分为三方面：(1)人为噪声；(2)自然噪声；(3)内部噪声。语音噪声类型语音噪声类型乘性噪声：乘性噪声：一般由信道不理想引起，它们与信号的关系是相乘，信号在它在，信号不在他也就不在。一般通信中把加性随机性看成是系统的背景噪声；而乘性随机性看成系统的时变性（如衰落或者多普勒）或者非线性所造成的。其他常见噪声名词其他常见噪声名词白噪声白噪声：表示在全频域内单位频域下都分

3、布有相同的能量密度，在线性空间内它具有平坦的频谱。换句话说，一定频域内的白噪声在其中任意给定的带宽内都具有相等的功率。随机噪声：随机噪声：噪声波形是随机的，不可预测的。平稳噪声：平稳噪声：是指分布参数或者分布律随时间不发生变化的噪声。语音噪声特性语音噪声特性一般，语音增强处理的噪声指环境中的噪声，而这些噪声主要是高斯白噪声，这种噪声一般符合如下的假设：(1)噪声是加性加性的。(2)噪声是局部平稳局部平稳的。局部平稳是指一段加噪语音中的噪声，具有和语音段开始前那段噪声相同的统计特性，且在整个语音段中保持不变。也就是说，可以根据语音开始前那段噪声来估计语音中所叠加的噪声统计特性。(3)噪声与语音

4、统计独立独立或不相关。到底什么是傅立叶变换？到底什么是傅立叶变换？有时信号在时域特征不明显，我们通常的将它变换到频域，这时会用到傅里叶变换，那么傅里叶变换到底是什么呢？傅里叶变换是将时域信号分解为不同频率的正弦信号或余弦函数叠加之和。连续情况下要求原始信号在一个周期内满足绝对可积条件。离散情况下，傅里叶变换一定存在。到底什么是傅立叶变换？到底什么是傅立叶变换？一个恰当的比喻是将傅里叶变换比作一个玻璃棱镜。棱镜是可以将光分解为不同颜色的物理仪器，每个成分的颜色由波长（或频率）来决定。傅里叶变换可以看作是数学上的棱镜，将函数基于频率分解为不同的成分。当我们考虑光时,讨论它的光谱或频率谱。同样,

5、傅立叶变换使我们能通过频率成分来分析一个函数。到底什么是傅立叶变换？到底什么是傅立叶变换？在频域中，频率越大说明原始信号变化速度越快；频率越小说明原始信号越平缓。当频率为0时，表示直流信号，没有变化。因此，频率的大小反应了信号的变化快慢。高频分量解释信号的突变部分，而低频分量决定信号的整体形象。 l语音增强常用方法语音增强常用方法根据语音和噪声的特点，出现了很多种语音增强算法。语音增强方法有噪声对消法、谱相减法、维纳滤波法、卡尔曼滤波法，FIR自适应滤波等。其中谱相减法、wiener滤波，卡尔曼滤波是常用增强方法，下面简单介绍下其原理。维纳滤波维纳滤波维纳滤波维纳滤波卡尔曼滤波卡尔曼滤波卡尔曼

6、滤波的基本思想：采用信号与噪声的状态空间模型，利用前一时刻的估计值和当前时刻的观察值来更新对状态变量的估计, 以求现时刻的估计值。其特点：(1) 无需采用全部过去的观察值进行估计, 适合于实时处理。(2) 用状态方程和量测方程表示信号和噪声, 采用递推法进行计算, 适合于计算机求解。适用范围广：平稳或非平稳, 时变或非时变系统。谱减法的谱减法的基本原理基本原理将含噪语音信号和有声/无声判别得到的纯噪声信号进行FFT变化，从含噪语音幅度谱的平方中减去纯噪声的幅度谱的平方，然后开方，得原始语音谱幅度的估值，再借用含噪语音的相位，进行IFFT变化，得到增强的语音。含噪语音含噪语音纯噪声纯噪声原始语音

7、谱幅度的估值原始语音谱幅度的估值()jX e( )d n( )s n()jD earg()jjX ee22()()jjX eD e22()()()jjjX eD eS e( )x nDFTDFT2()jX e插入相位插入相位DFTDFT2()jD eIDFTIDFTarg()()jjjX eS ee原始语音的频谱的估值原始语音的频谱的估值谱减法谱减法流程图流程图谱减法谱减法假设假设u噪声叠加；u噪声与语音不相关；u对纯净语音无先验知识；u对统计噪声有先验知识。带噪语音模型：y(n)=s(n)+v(n)式中，y(n)是带噪语音，s(n)是纯净语音，v(n)是噪声。谱减法谱减法对语音模型公式两边

8、进行傅立叶变换，得Y(k)=X(k)+N(k)由于对噪声的统计参数的未知，所以在实际应用中，通常使用非语音段噪声谱的均值来作为对噪声谱N(k)的估计，谱减法谱减法则对纯净语音幅度谱的估量表示为谱减法实现步骤谱减法实现步骤根据已知的平台噪声进行FFT，计算噪声功率谱谱平均值N(k)；对含噪语音进行FFT计算得到其功率谱X(k)，保留含噪语音相位；用含噪语音功率谱X(k)减去噪声功率谱N(k)，得到原始语音的功率谱估计值S(k)；利用S(k)以及含噪语音相位进行IFFT，这样就得到原始语音的估计值。谱减法缺点谱减法缺点由于噪声的随机分布的范围广，因此相减时，若该帧某频率点上的噪声幅度谱分量大时，就会有很大一部分残留，在频谱上呈现随机起伏的尖峰。在听觉上形成类似音乐的残留噪声，又称为背景音乐噪声背景音乐噪声。背景音乐噪声损伤了语音的质量，降低了可懂度和清晰度，是该类方法最大的缺点最大的缺点。0100020003000400050006000700080009000-0.500.5010002000300040005000600070008000900002004006000100020003000400050006000700080009000020040

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

语音降噪技术简介

文档简介

温馨提示

最新文档

评论

语音降噪技术简介

文档简介

温馨提示

最新文档

评论

相关文档