一种多通道盲源分离算法srp-nmf_第1页
一种多通道盲源分离算法srp-nmf_第2页
一种多通道盲源分离算法srp-nmf_第3页
一种多通道盲源分离算法srp-nmf_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一种多通道盲源分离算法srp-nmf

0k#m条件下的应用大多数盲源分离算法可分为单通道盲源分离算法(m.1)和多通道盲源分离算法(m.2)。在多通道盲源分离问题中,假设在源信号数量为K和麦克风数量为M,则混合信号x式中:x在正定(K=M)和超定(K<M)条件下的多通道盲源分离算法中,应用最多的是独立成分分析(IndependentComponentAnalysis,ICA)欠定(K>M)条件下的盲源分离算法主要是基于高斯混合模型(GaussianMixtureModel,GMM)最近几年随着深度学习的快速发展,使用深度学习来解决盲源分离问题,成为了盲源分离研究的热点和重点,比如2016年三菱电子研究实验室(MitsubishiElectricResearchLaboratories,MERL)提出了深度聚类非负矩阵分解广义互相关-非负矩阵分解(GeneralizedCrossCorrelation-NMF,GCC-NMF)1相关工作1.1多通道混合声音由式(1)可知,x式中,x1.2is散度规则的生成非负矩阵分解NMF已成功地应用于单通道盲源分离问题中,主要思想是将非负矩阵V非负矩阵分解NMF可以将矩阵分解问题转化成两个非负矩阵之间误差最小化的问题,本文使用IS散度(Itakura-Saitodivergence)定义乘法更新规则,随机初始化基矩阵W式中,⊙表示Hadamard乘积,i表示迭代次数。对于多通道语音信号,将每个通道的V然后通过NMF对这个非负矩阵进行分解,根据式(4)和式(5)更新得到基矩阵W1.3tdoa信号的估计到达方向(DirectionofArrival,DOA)和到达时间差(TimeDifferenceofArrival,TDOA)(1)如果只存在一个源信号,就可以通过DOA对这个方向的信号进行增强。(2)如果存在多个源信号,则:(1)可以通过估计TDOA的数量来对源信号数量进行估计;(2)通过跟踪DOA/TDOA的变化,来定位未知的源信号;(3)通过对某一个特定的DOA方向的源信号进行增强。1.4最大gcc函数的外延估计对DOA和TDOA的估计中,最简单的方法就是GCC-PHAT。GCC-PHAT引入广义互相关的概念,通过最大化GCC函数的延时估计TDOA。式中,τ表示通道p和通道q之间的TDOA,R^这种估计方法称为为GCC-PHAT。SRP-PHAT是在GCC-PHAT的基础上进行改进而来,它使用相位变换2机化编码及解码器在本文中提出了一种新的多通道盲源分离的方法——SRP-NMF。受到GCC-NMF算法的启发,通过将上面介绍SRP-PHAT源定位算法和NMF相结合,可以对混合信号进行分离。图2是SRP-NMF的主要流程图,SRP-NMF算法主要分为编码器、分离块和解码器。编码器和解码器都是一个两层结构,编码器包括STFT变换和NMF分解,而解码器包括一个STFT逆变换和NMF逆分解。分离块主要分为SRP-PHAT部分、SRP在SRP式中,*表示共轭,Y式中,τ根据NMF分解出来的基矩阵W通过除以p、q个麦克风通道的信号幅值,归一化消除因信号幅值大小带来的影响。对于一个给定的基向量,根据它们频率的相对突出程度进行加权计算。结合式(9)~式(12),有:将多通道混合信号代入式(13)中计算,得到一个矩阵SRP选取其中一个基向量,其中虚线表示不同源信号的τ式中,SRP式中,m是表示通道数。最后就是重构源信号,在解码器中将式(15)中得到的结果通过NMF逆分解和短时傅里叶逆变换,得到相应的估计源信号。式中,∠X3实验3.1数据集本文使用的数据集是WSJ0-2mix3.2评估指标本文主要使用了一个开源工具包BSSEval3.3srp-nmf算法与其他算法的比较cACGMM在表1和表2中,分别得到了两组在不同情况下,各个算法在多通道混合语音分离中的实验结果评估指标SDR、SIR和SAR。在表1和表3中,清楚地看到,在两个数据集中,SRP-NMF算法的总体评估结果明显优于其他的多通道算法。在表2和表4中,对于高混响的情况下,尽管SRP-NMF算法的分离效果提升不是那么明显,但是相对于其他算法来说,整体水平优于其他算法。综合这4个表中的实验评估数据,SRP-NMF算法在整体水平上都显著地提高。4srp-nmf分离混合语音本文提出了一种将通道的空间特征与NMF相结合的无监督语音分离方法。SRP-NMF算法利用SRP-PHAT源定位算法计算每个源信号的TDOA,与NMF中分解出的基矩阵结合起来,将它们分组到对应源信号中,并生成一个系数掩码,通过这个掩码对混合信号进行分离。实验表明,SRP-NMF算法优于其他的多通道盲源算法。在混响环境下,无论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论