




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、非负矩阵分解(NMF)技术在音源分离中应用研究一、 研究目的1. 了解非负矩阵分解技术的发展历程。2. 掌握非负矩阵分解技术的基本原理。3. 掌握非负矩阵分解技术在音源分离中的应用原理。4. 结合非负矩阵分解技术及聚类技术对简单语音进行特征分离,画出相应的聚类图或或分离后的频谱图。二、研究背景1NMF简介在信号处理 、神经网络 、模式识别 、计算机视觉和图像工程的研究中 ,如何构造一个能使多维观测数据被更好描述的变换方法始终是一个非常重要的问题。通常,一个好的变换方法应具备两个基本的特性:( 1 ) 可使数据的某种潜在结构变得清晰;( 2 ) 能使数据的维数得到一定程度的约减。主分量分析 、
2、线性鉴别分析 、 矢量量化和独立分量分析是一些最常用的变换方法它们因被施加的限制不同而有着本质的区别,然而,它们有两个共同的特点:( 1 )允许负的分解量存在(允许有减性的描述);( 2 )实现线性的维数约减. 区别于它们,一种新的变换方法非负矩阵分解( Nonngative Matrix Factor ,NMF)由Lee和seung在Nature上提出,它使分解后的所有分量均为非负值( 要求纯加性的描述 ),并且同时实现非线性的维数约减。它在矩阵分解过程中加入了矩阵元素均为为非负的约束条件,从而得到了完全不同的结果。NMF一经提出便引起了各个领域中科研人员的广泛重视:一方面,NMF通过全新的
3、矩阵分解模式为处理大规模数据提供了新的途径;另一方面,NMF算法相比一些传统的算法,具有实现简便,分解形式和分解结果可解释性强、占用存储空间少等诸多优点。因此,随着研究的不断深入,NMF已经逐渐成为信号处理、生物医学工程、模式识别、计算机视觉和图像工程等研究领域最受欢迎的多维数据处理工具之一。NMF理论实质上是利用非负约束条件来获取数据表示的一种方法。其理论问题可以描述为:对于任意给定的一个非负矩阵V,NMF算法能够找到一非负矩阵W和一个非负矩阵H,满足VWH,从而将一个非负矩阵分解为两个非负矩阵的乘积。由于分解前后的矩阵中仅包含非负的元素,因此原矩阵V中的列向量可以解释为对基矩阵W中所有列向
4、量(基向量)的加权和,而权重系数为系数矩阵H中对应列向量中的元素。这种基于基向量组合的表示形式具有很直观的解释。三、非负矩阵技术基本原理及演化技术1、NMF的数学模型NMF理论的数学模型如下:已知非负矩阵V(观测数据矩阵),寻找适当的非负矩阵因子W和H(因子矩阵),使得 V=WH+E,VRnm,WRnr,HRrm (1)其中n为数据向量的维数,m为集合中数据样本的个数,r为主成分数,矩阵V可以分解为基矩阵W和权系数矩阵H的乘积与误差矩阵E之和。但为了简单起见,一般不考虑误差的因素,此时模型可以修改为 VWH (2)或者VijWHij=k=1rWikHkj (3)一般情况下,式(1)、(2)和(
5、3)中r的选取比n和m都要小得多,而且r应该满足条件(n+m)rnm,即用很少的基来描述大量的数据,这样就得到了原始数据矩阵的一个压缩模型。如果假设Vj和Hj是矩阵V和H所对应的列向量,则是(3)还可以写成列向量的形式:VjWHj,也就是说,每一个样本vj可近似的看作是非负矩阵W的列向量的非负线性组合,组合系数是Hj的分量。所以矩阵W可以看做是对数据矩阵V进行线性逼近的一组基,而H则是样本集V在基W上的非负投影系数。通常可以用少量的基向量组来表征大量的数据向量,如果找到合适的基向量组,使其能够代表数据之间潜在的结构关系,则会获得很好的逼近与表示效果。2、NMF算法根据NMF模型中对分解结果的限
6、制是否仅限于非负性,可将现有算法分为基本NMF算法(Basic NMF,BNMF,基于基本NMF模型)和改进NMF算法(Improved NMF,INMF,基于改进NMF模型要依具体的期望特性对分解结果施加除非负外的其他的限制)两大类。1.1 、BNMF算法实现NMF的过程是一个优化求解的过程,Donoho等从理论上分析了BNMF存在唯一解的条件,这个条件的苛刻性告诉 我们:合理地构造一个目标函数,以此交替地优化W和H从而得到BNMF的一个局部最优解才是进行BNMF的可行方法这也是目前BNMF算法构造的基本思想 根据NMF理论的数学模型,必须寻找到一个分解过程VWH,使得WH尽量逼近V,也就是
7、要使误差尽可能小,就必须定义相应的衡量标准,即必须定义目标函数来评价逼近的效果。根据算法基于的目标函数的特点不同,BNMF算法可分为基于极大似然的NMF算法、基于欧式距离的NMF算法、基于散度偏差的NMF算法。1)基于极大似然的NMF算法1999年Lee等最早在Nature上提出了NMF的概念,其假设矩阵的每个元素间是统计独立的,其Vij服从以(WH)ij为参数的泊松分布,在此假设下以似然函数为目标函数,用极大似然估计的思路构造NMF算法。该算法的目标函数定义为:F=i=1nj=1mVijlog2WHij-(WH)ij (4)其迭代规则为:WiaWiajVij(WH)ijHaj(对W的列向量进
8、行归一化),HajHajjWiaVij(WH)ij算法按照上述迭代规则进行迭代,目标函数达到局部最大时算法收敛。此算法为先驱算法。2)基于欧氏距离的NMF算法2001年Lee等提出了利用V和WH间的欧氏距离的平方作为目标函数的基准算法。此算法实现简单、效率高、是目前研究中应用最多的基准算法。该算法的目标函数为:V-WH2=i,jVij-(WH)ij2 (5)当V=WH时,目标函数才取得最小值0。该算法的优化问题为:最小化V-WH2,W,H矩阵元素为负。其迭代规则为:HkjHkj(WTV)kj(WTWH)kj,WikWik(VHT)kj(WHHT)kj算法按照上述迭代规则进行迭代,目标函数达到最
9、小时算法收敛。3)基于散度偏差的NMF算法2001年Lee等提出了基于散度偏差的基准算法。此算法优于以似然函数作为目标函数的算法。直接通过查看所得结果对应的目标函数值大小就可以知道算法的优劣,对优化算法的评价更为简单。此算法是迭代步长自学习的梯度下降算法(?)。该算法的目标函数(KL散度)为:D(V|WH=i,jVijlog2VijWHij-Vij+(WH)ij (6)该目标函数与距离测度不同,它无对称性。当且仅当V=WH时,式(6)才取得最小值0。所以优化问题为:最小化D(V|WH,其中W,H矩阵元素非负。散度偏差D(V|WH单调不增,W和H在某个局部最优点时,算法收敛。此算法具有效率高、实
10、现简单的优点。2.2、改进的非负矩阵算法(INMF)上面讨论的基本NMF算法对分解结果仅施加非负限制。NMF算法被提出来后,为了适应不同应用领域的需求,研究者在基本算法基础上,从多个角度对NMF算法提出了一系列的改进和推广。这些新算法按照实现功能的不同大体分为三类:基于稀疏性的NMF算法,基于加权的NMF算法,基于分类的NMF算法。1) 基于稀疏性的NMF算法基本NMF算法能够无监督地得到观测信号基于部分的相对稀疏化描述,但有时稀疏度并不令人满意,因此以稀疏性为目的的NMF算法研究成为热点,它是NMF算法改进研究中最为活跃的方向。基于稀疏性的NMF算法主要有LNMF、非负稀疏编码(NNSC)、
11、稀疏非负矩阵分解(SNMF)、稀疏受限非负矩阵分解(NMFSC)、非平滑非负矩阵分解(NSNMF)。这些算法都是在BNMF的基础上,增加了稀疏性限制,将BNMF的目标函数进行改进从而得到新的目标函数。LNMF算法2002年Feng等人在研究局部空间时引入LNMF理论,其目的是通过引入稀疏性限制获得编码矢量(矩阵H)真正的局部分解对象,并使基本组件(矩阵W)局部稀疏化,加强基成分的局部化特征,使算法适用局部特征非常重要的应用。该算法附加定义了U=uij=WTW,V=vij=HHT;U,VRrr,并增加了以下3个稀疏性限制:A使H最大稀疏化。H必须包含尽可能多的零元素。一个基成分应该分解到不能再分
12、解为基成分为止,这样就能保证V所需要的基向量个数最小化。令wj=wijij2是其中一个基向量,对于给定的约束wj=i=1nwij=1,针对所有j,目标是最小化i=1nwij2=ujj,以使每一个Wi都包含尽可能多的零,使其更富有表现局部的能力。当且仅当i=1nwij2=ujj=min时,H达到最大稀疏化。B最大化W的局部表现能力。这种思想就是只有那些包含更多训练样本信息的基成分才能被保留。对于样本Vj,基成分Wi包含的信息量有样本在基成分上的“活性”来衡量,定义为hij2,所有样本在Wi上的总活性定义为j=1mhij2。在所有基成分上的总活性定义为i=1mj=1rhij2=ivii。当且仅当i
13、vii=max时,W的局部表现能力最强。C最大化W的正交性。不同的基之间应该尽可能地正交,以使基向量的冗余尽可能达到最小。这可以通过加约束i,juij=min来实现。因此,可将如下散度约束作为目标函数:FV,WH=i,jVijInVijWHij-Vij+WHij+i,juij-ivii (7)其中,是大于零的常量,这些常量可以通过最小化算法进行消除。其迭代规则为: hkl=hkliVilWikkWikhkl, Wkl=WklWkljVkjhljkWklhljjhlj (8)Wkl=WklkWkl按照上述迭代规则进行迭代,目标函数达到局部最小值时算法收敛。2)基于加权的NMF算法加权NMF是NM
14、F的另一种改进算法,现有的加权算法可以归结为不均衡性加权、重要性加权、不确定性加权。a.不均衡性加权:Guillamet等提出的不均衡性加权的目的是在训练样本不均衡时减少基的冗余。实验表明,如果训练样本是不均衡的(即:存在某类样本远多于另一类的情况),那 么得到的基就会更多地体现样本数量占优的类的特性。该算法的加权方式是:(1)统计各类 样本在训练集中占的比重;(2)优化过程中对每类样本的重建错误按其所占比重的倒数加权。该算法引入对角矩阵Q,该矩阵中对角线上的元素qu定义了各个样本向量的重要程度,u=1mqu=1。算法目标函数定义为FQ=u=1mqui=1nViulog2WHiuqu-(WH)
15、iu (9)迭代规则定义为Wia(WiauquHau)uquViu(WH)iuHau WiaWia/jWja (10)HauHauiWiaViu(WH)iu按照上述迭代规则进行迭代,目标函数达到局部最大值时算法收敛。b. 重要区域加权:Blondel等提出的重要区域加权算法的加权目的是使数据中的重要区域被更好地描述。他们的加权方式是:( 1 )定义数据中的重要区域,根据数据的重要程度确定加权矩阵;( 2 )在优化过程中给重要区域上的重建错误以更多的权重。C不确定性加权:Wang等人提出的不确定性加权的加权目的是消除训练样本的不确定性对NMF结果的影响。他们的加权方式是:( 1 )估计每个训练样
16、本的每个元素的不确定度; ( 2 )优化过程中对每个样本的每个元素的重建错误按其不确定度的倒数加权。3)基于分类的NMF算法传统的NMF算法不带有任何类别信息,因此加入鉴别性信息的NMF算法对于分类问题很重要。FNMF算法将鉴别信息(类内散度和类间散度)作为罚函数加入传统的KL散度型目标函数中,最小化类内散度和最大化类间散度,从而使分解结果蕴涵较多的类别信息。实验结果表明,FNMF算法性能优于LNMF算法。3NMF在音源分离中的简单建模3.1).单通道模型在STFT域,单信道的混合模型为:xfn=j=1Jsj,fn其中xfn,sj,fn分别是观测信号和第j个信源信号的短时傅里叶变换系数,J为信
17、源个f=1,F为频率窗指标,n=1,N为帧指标。定义vfn为混合信号的功率谱,即vfn=xfn2,非负矩阵分解就是要将FN的矩阵V=vfnfn分解为VV=WH,W,H分别为FK,KN的非负矩阵。假设信源的STFT系数服从零均值的高斯分布,Sj,fnNc(0,vj,fn),vj,fn=W(j)H(j)fn,W(j)和H(j)分别为FKj和KjN的矩阵,以此对第j个信源的分布建立数学模型。由线性vfn=jvj,fn可得:W=W(1),W(J),H=H(1)T,H(J)TT。定义目标函数为:C1=fndis(vfn|vfn), (3.1) 其中=W,H。优化问题:最小化C1.迭代规则为: (3.2)
18、得到最优化的W,H后,则可以根据sj,fn=vj,fnvfnxfn得到第j个信源的STFT系数,在经过逆STFT变换就可得到第j个信源。3.2).多通道模型在STFT域中,多通道的混合模型表示为xfn=j=1Jaijsj,fn+bi,fn (3.3)表示成矩阵形式为: Xfn=Afsfn+bfn (3.4) 其中Xfn=x1,fn,xI,fnT,sfn=s1,fn,sJ,fnT,bfn=b1,fn,bI,fnT, Af=aij,fijIJ一个关键的要素是将信源j用非负矩阵Wj和Hj建立FN的功率谱模型也就是|Sj|2WjHj (3.5)给定观测到的混合信号的STFTs X=xi,fnifn,我
19、们的目标是估计信源频率谱因子Wj,Hjj和混合系统Aff,如figure1所示该问题可以被分为两个子任务:1)定义合适的估计准则;2)设计算法来优化这一准则。在这里,我们采用一种算法,该方法使用期望最大化算法来最大化多通道数据的联合对数似然。3.2.1)建模(1)信源让K且Kjj=1J是K=1,K的不重叠的子集,则可以对信源建立模型sj,fn=kKjck,fn 其中 ck,fnNc(0,wfkhkn) (3.6) Ncx;,=1|exp-x-H-1(x-)这里的sj,fn和ck,fn分别代表“信源”和“成分”,最后得到信源的模型为:sj,fnNc(0,kKjwfkhkn) (3.7)最后我们得
20、到描述信源j的参数的对数似然函数-logpSjWj,Hj=fndIS(sj,fn2|WjHjfn) (3.8)其中 dISxy=xy-logxy-1(2).噪声一般情况下,我们假设噪声模型为bi,fnNc(0,i,f2) (3.9)以及b,f=diag(i,f2) (3)卷积混合模型的改写根据建立的信源模型,可以将混合模型改写为:Xfn=Afcfn+bfn (3.10) 其中cfn=c1,fn,cK,fnT,Af是所谓的“增大混合矩阵”,其维数为IK,当且仅当kKj时其元素aik,f=aij,f。3.3.一种多通道NMF算法首先,令=A,W,H,b为所有参数的集合,A是IJF的矩阵,W为FK的
21、矩阵,H为KN的矩阵,b是噪声协方差参数。ML算法的目标函数为C1=fntrace(XfnXfnHx,fn-1)+logdetx,fn (3.11)其中x,fn=Afs,fnAfH+b,f 以及s,fn=diag(pj,fnj),通过最小化上式可以得到相应的参数,从而实现分离。然而该准则得到的参数会发生明显的大小、相位和排列顺序的不确定性。后来研究者们提出了一种基于完备数据集的X,C的EM算法。其定义了一个概率密度函数p(X,C|)和数据集Rxx,f,Rxs,f,Rss,f,k,fnknf称为自然统计量Rxx,f=1NnxfnxfnH, Rxs,f=1NnxfnsfnH Rss,f=1NnsfnsfnH, k,fn=|ck,fn| 2 该算法在E步根据当前的参数计算自然统计量的期望,在M步通过最大化完备数据集的对数似然Q=logp(X,C|)p(C|X,)dC来更新参数集。具体步骤如下:在E步计算条件期望:在M步更新参数信源重构:在求的最优的参数后,就可以利用维纳滤波来得到信源STFT值的最小均方误差估计值。时域信号可以通过逆STFT变换得到。4. 实验仿真实验所用的数据是合成立体声信号,由三个信源卷积混合而成,分别是鼓,主唱和钢琴。通过合成房间脉冲响应对静态信源进行滤波,通过Roomsim工具箱模拟一对无指向的麦克风得到合成卷积信号。卷积合成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业机械采购协议
- 劳动合同中工会的作用
- 大学生创业优惠政策
- 悦读助力成长课件
- 怎制作主题教育
- 阿勒泰职业技术学院《中国现当代文学思潮研究》2023-2024学年第二学期期末试卷
- 阿巴嘎旗2025年三下数学期末达标检测试题含解析
- 陇南地区成县2025年小升初总复习数学精练含解析
- 陕西中医药大学《综合英语AV》2023-2024学年第一学期期末试卷
- SCI论文写作与投稿 第2版-课件 5-SCI论文结果与讨论写作(一)
- 2023-2024学年山东省济南市历城区八年级(下)期中数学试卷(含解析)
- DB-T29-247-2017天津市岩土工程勘察规范
- 2023年全国高考体育单招考试英语试卷试题真题(精校打印版)
- 4-1-1 土石料料场规划与开采讲解
- 2022开关电源电子元器件降额技术规范
- 太阳能热利用系统的太阳能集热系统、得热量、集热效率、太阳能保证率执行标准
- 试验检验资料管理措施
- 加油站安全风险评估与控制培训
- 机械工程师的职业发展与就业前景
- 连接员题库(全)题库(855道)
- 精神科理论知识考核试题题库及答案
评论
0/150
提交评论