(应用数学专业论文)盲稀疏源信号分离算法的恢复性研究.pdf_第1页
(应用数学专业论文)盲稀疏源信号分离算法的恢复性研究.pdf_第2页
(应用数学专业论文)盲稀疏源信号分离算法的恢复性研究.pdf_第3页
(应用数学专业论文)盲稀疏源信号分离算法的恢复性研究.pdf_第4页
(应用数学专业论文)盲稀疏源信号分离算法的恢复性研究.pdf_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 盲信号分离技术是信号处理中用于阵列处理和数据分析的一种 新的技术,在源信号和混合过程未知的情况下,从混合信号中分离出源 信号。盲信号分离技术可广泛应用于无线通讯、医学信号处理、图像处 理以及雷达信号处理等多个应用领域,己成为信号处理领域的一个研究 热点。本论文主要做了以下几个方面的研究工作: 1 论文提出了修正k 一均值聚类盲分离算法,仿真试验说明该方法不仅保 留了原来k 一均值算法盲分离速度快的特点,而且克服了常规k 一均值据 类算法盲分离算法精度低的不足。 2 基于一种两步稀疏表示的方法,利用随机框架讨论欠定盲源分离的恢 复能力。盲稀疏源信号分离算法一般假设源信号是充分稀疏的,本文讨 论了在源信号不充分稀疏的情况下欠定盲源分离的恢复能力的概率估 计,进一步刻画了源的稀疏性与恢复能力的关系,揭示了利用两步法处 理盲源分离问题的有效性。 关键词:盲分离;欠定混合;稀疏表示;恢复能力 a b s t r a c t b 1 i n d s i g n a ls e p a r a t i o i l isanew t e c h n i q u e 0 f s i g n a l p r o c e s s i n ga i m e da tr e t r i e v i n gas y s t e m su n k n o w ni n f o r m a t i o l qf r o m i t so u t p u to n l y w h i c hc a r lb eu s e di na r r a yp r o c e s s i n ga n dd a t a a n a l y s is t h e r ea r em a n yp o t e n t i a la p p l ic a t i o i l ,e s p e c i a l l yi n w i r e l e s sc o m m u n ic a ti o n ,m e d i c a l si g n a l p r o c e s s in g ,i m a g e p r o c e s s i n ga n dr a d a rs i g n a lp r o c e s s i n g i nr e e e n ty e a r s ,b l i n d s i g n a ls e p a r a t i o nh a sb e e r lg na t t r a c t i v et r e n dir lt h e8 , r e s o f a c a d e n l i a 。t h er f l a if ic o n t r i b u t i o n s0 ft h ist h e s i s8 , r ea sf o l l o w s : 1 t h isp a p e rp r e s e n t sm o d i f ie dk - m e a f t sb s sa l g o t i t h m ,a n dt h e s i i i l l l a t i o ns h o r st h a tt h ea l g o r it h mn o t o f 1 yk e e p sd o w nt h e c h a r a c t e l i s t i cir ls e p a r a t i n gt h eb l i n ds o u r c e sa sc o n v e n t i o n a l k - i i l e a r l sb s sa l g o r i t h mb u ta ls om a k e su pt h e1 a c k0 fc 0 1 1 v c f i t i o n a l k m e a n sb s sa l g o t i t h m 2 t h i sp a p e rd is c u s s e sr e c o v e ! t a b i l i t y0 fu r i d e r d e t e r i l l if i e db l in d s o u f c es e p a r a t i o nh a s e do f tat w o s r a g es p a r s er e p r e s e n t a t i o i l a p p r o a c h w i t h i l 2t h es t o c h a s t icf r a m e w o r k b 1 i n ds o u r c e s e p a r a t i o i lb a s e d0 r l s p a r s er e p r e s e n t a t i o r lu s u a l l ys u p p o s e st h a t s o t lr c e s i g n a ls 8 f e s p a r s es u f f i c i er l t l y t h isp a p e re s t i m a t e s r e c o v e f a b i l i t yp r o b a b i l i t yw h e n s o u r c es i g n a lsaren o t s p a r s e s u f f i c i e f t t ly ,w h ic hn o t0 1 3 1 yr e f l e c t st h er e t a t i o n s h i pb e t w e er lt h e r e c o v e r a b i l i t y a n d s p a r s e n e s s o fs o u r c e sb u ta 1 s oi n d i c a t e s e f f ic a c y0 ft h e t w o s t a g es p a r s er e p r e s e n t a t i o na p p r o a c h f o r s o l v i n gb s s i ( e y w o r d s : 1 3 1 i n ds o l i r c es e p a r a t i o n :u n d e r d e t e r m i n e dm i x t h r e s p a r s er e p r e s er l t a t i o n :f e c o v e r a b i l i t y 独创性声明 秉承学校严谨的学风与优良的科学道德,本人声明所呈交的论文是 我个人在导师的指导下的研究工作以及取得的研究成果。尽我所知,除 了文中特别加以标注和致谢的地方之外,论文中不包含其他人已经发表 或者撰写过的研究成果,不包含本人或其他用途使用过的成果。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明, 并表示了谢意。 本学位论文成果是本人在广东工业大学读书期间在导师的指导下取 得的,论文成果归广东工业大学所有。 申请学位论文与资料若有不实之处,本人承担一切相关责任,特此 说明。 论文作者签字:设耸耄 指导导师签字:翻i 献 刁躬叩 第一章绪论 第一章绪论 1 1 盲信号分离的研究背景以及研究意义 盲信号分离的研究起源于鸡尾酒问题( 如图1 一l 所示) ,在多个 说话人同时讲话的语音环境中,通常每个麦克风接收到是多个说话者的 混合声音,如何仅仅从话筒接收到的语音信号中分离出所需要的说话者 的声音? 这便是盲信号分离问题。 图1 1 鸡尾酒会问题 f i g 1 一lc o c k t a i lp a r t yp r o b l e m 盲信号分离中的“盲”就是指源信号信息和传输信道的信息事先未 知,在盲信号分离算法中不能利用这些信息。例如,在移动通讯应用中, 由于发射端所发出的原始信号是未知的,而且由于“移动”的原因,信 道也在不断变化之中,因而也是未知的,而通信的任务是必须由接收信 号去恢复原始信号本身;又如在地震勘探中,震源信号和传播信道都是 不可知的,我们只能通过接收信号去确定地层信息;再如对于“鸡尾酒 会问题”,在嘈杂的大厅中,人耳能够准确的捕捉所关心和感兴趣的语 广东工业大学理学硕士学位论文 音,而现有的仪器设备却很难做到这一步,必须通过盲信号分离技术, 才能从接收语音信号的麦克风或传感器的混合信号中恢复出我们感兴趣 的信息。因此,盲信号处理的实质及主要任务就是对于未知系统,在其 输入信号完全未知或仅有少量先验知识的情况下,仅由系统的输出信号 ( 即混合信号) 来重构输入信号或进行系统辨识。 图1 2盲信号分离示意图 f i g 1 2b i i n ds o u r c es e p a r a t i o ns t r u c t u r e 现实生活中很多问题都可以归结为盲分离。上面所提到的鸡尾酒问 题“,从多个话筒接收到的声音中确认出每个说话者的内容( 通常语音 识别之前,首先需要分离出识别对象的声音) ;信号去噪,在对噪声先验 信息一无所知的情况下进行信号去噪“1 ;c d m a 盲多用户检测“卜1 , 在存在用户问干扰和码问干扰的情况下,从与多个发射器相对应的天线 观测到的接收信号中恢复出通信信号;声纳问题“一1 ,在多个船舶的 马达噪声构成的水下声音环境中,从多个声音传感器接收到的信号里, 分离出所需的信号;光纤通信中光频分复用器的设计卜“”,利用了一 根光纤可以同时传输多个不同波长的光载波的特点,把光纤可能应用的 波长范围划分成若干个波段,每个波段用作一个独立的通道传输一种预 定波长的光信号,在接收端采用复用器分离出不同波长的光信号,从而 大大提高光纤容量。此外。盲信号分离在图像识别,语音增强,图像增 强,e e g 、m e g 、e c g 、f _ f r i 之类医学信号处理等方面有着广泛的应用前 2 景或者潜在应用价值,使得盲信号处理具有极其广阔的应用领域“i “1 1 ”。 在这样的背景之下,最近十多年,有关盲信号处理的研究成了信号处理 领域和神经网络领域的研究热点。 a ) b ) 图1 3a ) 语音分离b ) 图像去噪 f i g 卜3 a ) s e p a r a t i o i lo fv o i c e ,b ) i m a g ed e n o i s i n g 奎三墼兰塑圭丝墼 图1 4m e g ( 脑磁图) 问题 f i g 1 4s e p a r a t i o no fa r t i f a c t si nm e gd a t a 1 2 盲信号分离问题的描述 图l 一5 盲信号处理问题的示意图 f i g 1 5s k e t c hm a po fb s s 盲信号处理问题的示意图如图1 5 所示,其中输入的源信号和混合 系统都是未知的。以矢量s ( t ) 表示未知的源信号,矩阵a 表示未知的混叠 矩阵,矢量x ( t ) 表示已知的观测信号,盲信号分离问题的数学模型可以 表示为: x ( o = a s ( t ) ( 1 1 ) 盲处理问题包括盲信道辨识,盲均衡和盲信号分离,是同一个问题的不 同侧重点,本质上是一样的。当目的在于提取我们感兴趣的信号源时, 即为盲信号分离。很明显,方程( 1 1 ) 有很多类解( a ,s ( t ) ) ,然而只 有一类解是符合实际情况的,这一类解之间只有幅度和排序上的不同, 4 第一章绪论 也即波形保持。为解决实际中的问题,我们必须获得正确的一类解, 所以a 和s ( t ) 必须有一些属性限制,这些属性能够充分保证我们所获得的 解的正确性。 根据混合系统的不同,可以将盲信号分离问题分为几类: 1 ,如果混合系统是非线性的,则是非线性盲信号分离: 2 ,如果混合系统是线性的,则是线性盲信号分离:线性盲信号分离包括 卷积信号的盲分离和瞬态盲信号分离。卷积信号盲分离是指信号源以卷 积叠加的形式混合,以。鸡尾酒会”为例,这种情况相当于考虑了信号 源到达传感器的时延和说话者的位置移动:瞬态盲信号分离是最简单的 一种情况,其中a 为常数矩阵; 3 ,当输入的源信号的个数不多于观测信号个数时,属于常规的盲信号分 离“”;当输入源的个数多与观测信号的个数时,属于非常规的盲信号 分离“,即欠定盲信号分离“”。 1 3 盲信号分离的发展历史 正是因为其广阔的应用前景,盲信号分离问题引起了大量科研工作 人员的热情和兴趣。盲信号分离的早期研究始于二十世纪八十年代中后 期,短短的十几年里,有关的理论和算法研究得到了较快的发展,包括 盲源信号分离问题本身的可解性以及求解原理等方面的基本问题已经在 一定的程度上得到了部分解决,并提出了一些在分离能力,内存需求、 计算量等方面性能各异的盲分离算法。一般认为,对信号源盲分离问题 的最早研究是由法国的h e r a u l t 和j u t t e n 于1 9 8 5 年左右开始的,1 9 9 1 年发 表论文,现在通常称他们的方法为h j 算法t ”,l t - j 算法中提出了一种 针对两个源信号和两个混合信号的递归连接人工神经网络,利用梯度下 降算法调整网络权值对网络输出信号的残差最小化实现盲分离。h e r a u l t 和j u t t e n 之后,不少学者对h j 算法的收敛性进行了系统的研究,在只 存在两个源信号和两个混合信号的最简单情况下,收敛性问题得到了完 满的解决,此后盲分离问题引起了神经网络领域和信号处理领域的广泛 研究兴趣。 5 奎三:氅兰墨量耋兰竺鎏三 发展至今,无论是线性盲分离还是非线性的盲分离,混合系统是动 态或是静态的,决大多数的盲分离算法都是基于观测信号的个数不少于 源信号个数的假设。现有的算法分为代数类算祛和自适应算法两大类: ( 1 ) 代数方法,根据信号的统计独立性,利用代数的矩阵特征值分解,奇 异值分解,使用高阶累积量( 一般是四阶累积量,由于现实信号一般都 是对称分布的,所以三阶累积量是零) 分离信号,因为高斯噪声高阶矩为 零,所以此类方法可以有效的抑制高斯噪声,并且在不要求实时处理的 情况下,此类方法的效果相对较好,随着数据量的增加,信号的统计特 性越能得到较好的体现,使得分离的信号误码率越小。但是这种方法运 算复杂,必须是信号的同时分离,并且不能进行实时处理,还要求信号 是平稳随机过程,对于非高斯干扰信号的处理也比较困难。( 2 ) 自适应的 方法,它便于信号的实时处理,而且不仅做到信号的同时分离,还可以 有目的的进行信号提取,由于它对信道的自适应构造主要决定于当前一 小段的数据,因此适用非平稳随机过程,但是对于此类诸多算法的收敛 性问题,的确是当前的一个难点,仅有部分算法得到了收敛性证明,实 验也证明若参数或初始信道矩阵选取不合适,将会使算法收敛到我们不 希望的极小值甚至发散。但总体上,由于自适应的一些应用上的优越性, 使其受到了科研工作者与技术人员的钟爱。具有代表性的算法如独立分 量分析( i c a ) ,非线性主分量分析( n o n l i n e a rp c a ) 等_ ”1 。独立分 量分析的基本思想是:对已知的信号矢量做某种线性变换,使得输出的 信号矢量之间尽可能的统计独立;非线性主分量分析的基本思想是,先 对己知的观测信号作非线性变换,以此引入高阶统计量,然后再作主分 量分析。独立分量分析算法与非线性主分量分析算法的不同在于:自适应 的独立分量分析算法为梯度型算法( 即l m s 算法) ,而非线性主分量分析可 以用递推最小二乘算法( r l s ) ,一般来说,r l s 型算法比梯度型算法收敛 性要好。 虽然盲信号分离技术获得了长足的发展,但是还有许多问题有待更 好的解决。例如,信号源中既有超高斯信号,也有亚高斯信号的情况; 非线性盲分离;卷积信号的盲分离;信号源个数未知的情况等等,欠定 盲分离也是其中的一个重要分支,具有重要的实际意义。因为,在很多 6 实际情况下,用来采集信号的传感器个数往往少于源的个数,而且,若 适当的排列传感器的位置,就可能用较少的传感器获得我们所感兴趣的 信号源,在盲信号分离技术发展的十几年来,只有少数科研人员对欠定 问题作了一些初步探讨和研究,直到近几年才涌现了研究的热潮“2 1 - ”1 。 可以说,m i t h a tc d o g a n 在1 9 9 1 年提出的由单个传感器检测和分类 多个信号源问题开辟了欠定盲信号分离领域“”,到目前为止,欠定盲 分离的算法大致可以分为以下几类: l ,基于高阶累积量的算法。1 9 9 1 年,c a r d o s o 提出了一种基于四阶累积量 张量超对称分解的方法“”;1 9 9 9 年,d el a t h a t n v e r 等提出了基于三 阶和四阶累积量的代数类方法,从两个观测信号中分离出三个信号源, 同时又借助于复值信号的特性定义了两个不同的四阶累积量,并提出一 种从n 个观测信号中分离出n ( n + i ) 2 个源信号的算法“”;2 0 0 3 年 l a u r e n ta l b e r a 等首先提出四阶预白化的概念,然后利用源信号倒谱多 样性来估计方向矢量“”;2 0 0 4 年,pc o m o n 提出一种基于张量规范分 解的盲辨识算法,并用于离散源的盲分离“”。 2 ,几何过完备独立分量分析( o v e r c o m p l e t ei c a ) 算法) 2 ”“”。几 何i c a 算法由p u n t o n e t 和p r i e t o 于1 9 9 5 年第次提出,由于算法容易实现而 引起很多人的兴趣,2 0 0 2 年,fjt h e i s 将几何i c a 算法拓展到过完备的 情况中,并对其收敛的条件和性能给予分析 3 。利用源的时频域特性的算法”。如h s i a o - c h u nw u 等提出的基于 源的时频微结构的算法3 ”:2 0 0 0 年s c o tr i c k a r d 在假设信号源的加窗 傅立叶变换互不相交的前提下,提出的一种由两个观测信号分离n 个( n 2 ) 源的方法“”;2 0 0 1 年,l i n h t r u n gn g u y e n 等人的非平稳源的时频域方 法“”:2 0 0 3 年,r a d u b a l a n 和p e t e r s o n 分别提出了一种噪声中欠定盲 分离算法和种卷积信号的欠定盲分离算法,同时y u h u il u o 等提出了 一种可以动态估计激励源个数的分离算法n ”。 4 ,最大似然的算法铂”1 1 9 9 7 年,e m o u l i n e s 提出用混合高斯模型 来近似源的分布,从而得到观测数据的近似似然函数和相应的期望最大 算法3 “;另一种完全不同的近似似然方法由a a p o 在1 9 9 8 年提出,其中 用到竞争学习机制”,适合于源信号极其稀疏时的盲分离,虽然其应 7 广东工业大学理学硕士学位论文 用受到一定的限制,但1 9 9 9 年l e w i c k i 和s e j n o w s k i 将稀疏编码理论拓展 到过完备i c a 问题,提出了一种高斯近似方法”,并由l e e 等给予进一 步的研究和用于盲语音信号的分离。 5 ,基于稀疏分解理论的算法“_ ”1 。这也是本文将要重点讨论的一类 算法。这类算法的共同点是它们目的都是找出尽可能稀疏分布的源信号, 如2 0 0 1 年m u r r a y 和d e l g a d o 提出的最大后验概率算法“”,和r g r i b o n v a l 提出的一种立体声音信号的稀疏分解方法并用于欠定立体声信号的盲分 离”;2 0 0 2 年l v i e l v a 出的一种稀疏分布的概率模型和其相应的静 态与时变环境中的盲分离算法”:2 0 0 3 年,y u a n q i n gl i 等也提出一种 基于稀疏分解的聚类方法用于估计源的混合矩阵,并用最小l l 范数解作 为源的估计”;2 0 0 4 年,t a k i g a w a 在文献中分析了最小l l 范数解的性 能和最佳适用条件“。 对于欠定情形,起初l i 等人采用盲提取方法实现部分信号的盲分离 4 0 1 ,他们从线性代数的角度研究了可解性,并且提出了盲提取方法。 但对于欠定情形,这类方法通常只能实现部分源信号的盲分离。针对这 种情况,人们利用实际应用中某些情况下信号所具有的稀疏特性,采用 稀疏分析工具,对信号进行稀疏表示或稀疏分解,成功地实现了欠定情 况下的盲分离。如b e l o u c h r a n i 针对离散源信号提出“最大后验概率”方 法:z i b u l e v s k y 稀疏分解方法,l e e ,l e w i c k i 和l i 的超完备基表示 ( o v e r c o m p l e t er e d r e s e n t a t i o n ) 方法,b o f i l l 的频域稀疏表示方法等 等,这些算法都获得了较好的盲分离效果“”叫5 ”。 所谓稀疏信号,p e a r l m u t t e r 指出:直观的讲就是说信号绝大多数 采样点取值为零“”,或者接近于零,少数采样点取值明显远离零如 果任何时刻非零的源信号数目少于或等于观测器的数目,这时候盲分离 问题可能存在唯一解而分离出源信号。一个典型的例予是b o f i l l ( 2 0 0 1 ) 通过稀疏表示方法,从两个接收的混叠信号中实现了六个源信号的盲分 离”1 截至目前,将稀疏分析方法应用于欠定混叠盲分离上主要有两类算 法,其一为k 一均值聚类法,其二为超完备稀疏表示自适应求解方法。k 一 均值聚类法通过两个步骤实现,首先通过聚类分析,以聚类中心估计混 3 叠信道,然后在已知混叠矩阵情况下,借助线性规划估计出源信号:l e e 和l e w i c k i ( 1 9 9 9 ) 的基于l e w i c k i 和s e j n o w s k i ( 2 0 0 0 ) 的“超完备表示基 学习一理论,借助l e w i c k i s e j n o w s k i 自然梯度实现盲分离卜 1 。 1 4 稀疏信号欠定混叠盲分离面临的问题 对于观测信号数目少于源信号数目的欠定混叠情形,传统盲信号分 离方法是无能为力的。基于稀疏表示的盲信号分离是近年来盲信号分离 的研究亮点,这类问题有很强的实际背景,同时该方法具有实现欠定混 叠盲信号分离的能力,但该方法尚未成熟。 对于稀疏信号欠定混叠盲分离的研究已经开始引起广大研究人员的 关注,当前还面l 临着以下基本问题和重要问题: ( 1 ) 稀疏的定义和测量。即稀疏的较为准确的定义是什么;怎样才能客观 地测量信号的稀疏程度。 ( 2 ) 目前尚缺乏速度既快,同时盲分离精度又高的基于稀疏表示的盲信 号分离算法。当前稀疏表示在盲分离中的应用主要包括两类算法。一类 是两步法,首先采用聚类方法估计混叠矩阵a ,然后在己知a 的情况下再 估计源信号,这类算法或者参数过多、主观性太强,可操作性很差:或 者采用k 一均值聚类估计混叠矩阵a ,精度太低。另一类算法是自适应的算 法,这种算法在迭代过程中交替估计混叠矩阵和源信号,相对而然,盲 分离速度慢。 ( 3 ) 如何确定源信号数目。稀疏表示具有解决欠定盲信号分离的能力,这 意味着能够对源信号数目超过感知器数目的混叠模型进行盲分离。但是 在源信号数目未知的盲信号分离中,怎样确定混叠信号中究竟包含多少 个源信号,这个问题目前还无法回答。 1 5 论文的研究内容以及章节安排 论文共分三章,第二章提出了修正k 一均值聚类盲分离算法。对于稀 疏信号盲分离,由于聚类中心的选择的不同,常规k 一均值聚类算法会陷 9 入局部最优,为此第二章提出修正k 一均值聚类盲分离算法可以克服常规 k 一均值聚类方法的这种不足。 第三章根据g e o r g i e v 的最新理论,并基于一种两步稀疏表示的方法, 利用随机框架来讨论欠定盲源分离的恢复能力。 最后,我们对全文进行了总结。 1 0 第二章修正k 一均值聚类盲分离方法 2 1 引言 当源信号个数多于观测信号的个数时,即欠定盲信号分离,由于不 存在混合系统的逆系统,而且,即使已知混合系统,我们所得到的源信 号的解也不是唯一的,因此,我们要先估计混合系统,其次再估计信号 源。本章引入稀疏表示,研究欠定瞬时混叠盲信号分离。 目前,k 一均值聚类法是实现稀疏信号欠定混叠盲分离的重要方法。 k 一均值聚类法通过两个步骤实现”,首先通过聚类分析,以聚类中心 估计混叠信道,然后在已知混叠矩阵情况下,借助线性规划估计出源信 号,但常规k 一均值聚类法估计精度不够高。本章提出了修正k 一均值聚类 盲信号分离算法,新的算法保留了k 一均值聚类方法盲分离速度快的优点, 同时新的算法有着很高的盲分离精度,鲁棒性也得到提高。 2 2 稀疏信号的特征 什么是稀疏信号? 文献 5 0 1 指出,稀疏信号通常很多采样点为零, 或者很多采样点接近于零,同时又有很小部分时刻幅值较大;从统计角 度看,相比于高斯信号,稀疏信号的概率密度函数更近似于l a p l a c i a n 分 布,即在零点有一个密度峰值,而在远离零点的地方不象高斯分布那样 较快的趋向于零,如图2 一l 所示。 图2 - 1 高斯分布和拉普拉斯分布密度函数之比较 奎三兰查罂塑兰些苎 f i g 2 - i p d fc o m p a r i s i o no fg a u s s i a nd i s t r i b u t i o n a n dl a p l a c i a nd i s t r i b u t i o i l 假设源信号之间相互独立,服从参数为b 的l a p l a cj a n 分布,概率密 度函数为: p c 曲= 专唧c 一觯c 一,佃, 如果源信号都是稀疏信号,则它们取值为非零( 或者比较大) 的时 刻比较少,即绝大多数时刻取值为零( 或者接近零) ,这样在同一时刻出 现两个源信号取值较大的可能性就非常小。此时,瞬时线性混叠盲信号 分离模型式展开为如下式: 五( f ) x 2 ( t ) ( f ) q i ( 1 2 1 o r a l s i ( t ) + q 2 a 2 2 口0 2 fq 一 啪) + + 卜 1 l ( ,) ( 2 1 ) 由于在同一个时刻出现两个源信号取值比较大的可能性非常小,所以在 绝大部分时刻最多只有一个源信号取值比较大。假设在时刻t 只有源信 号s ( ,) 取值不是零,其他源信号幅值很小或者等于零,那么上面的模型 可以化为或者近似的化为: 毛( f ) x 2 ( t ) h ( f )= 巴 置( f ) j 盟。业。业。墨( ,) ( 2 2 ) a i ja 2 - 从几何上来讲,( 2 2 ) 式近似为一个直线方程,所以源信号置( ,) 所有取值 非零的时刻将确定一条直线,并且该直线的方向为混叠矩阵a 的第i 个 列向量口f = ( ,a 2 ,a m ,) 7 ,为了方便比较,我们作下面两个假设:1 假设 a 的每个列向量的模为l ,那么不同的源信号 ( ,) ,是( r ) ,矗( ,) 各自分别确 定一条直线,而直线的方向分别为混叠矩阵的某一个列向量;2 假设混 叠矩阵a 的各个列之间不相互成比例,则n 个源信号 ( ,) ,s 2 ( t ) ,s 。( f ) 将 确定n 条直线,而这n 条直线也就可以确定混叠矩阵a 。 由于稀疏源信号混叠所得观测信号散点图成直线状分稚。直线的方 1 2 向分别为混叠矩阵a 的列向量。所以求解a 归结为求解观测信号确定的 直线方向,可以通过聚类直接事先求出混叠矩阵a 。 2 3 稀疏信号盲分离求解原理 现有的各种盲分离算法,包括j a d e 算法,i c a 算法,h j 算法等等, 在源信号的数目超过观测信号的数日的情况之下( 即病态情形) ,是无法 分离出源信号的,而基于稀疏表示的盲分离算法却有可能做到,但是有 关稀疏盲分离的算法还不是很多,而且算法的性能还有待改进和完善 到目前为止,主要采用“两步法”和自适应盲信号分离算法来求解 稀疏盲信号分离阀题“8 e4 0 1 0 两步法即求解过程分两步实现,首先采用k 一均值聚类算法估计混叠矩阵a ,在此基础上再通过求线性规划的最小 l 一1 范数解来求解源信号s ( t ) : 础窆k s l a s j = x ( _ ,) 其中j = l ,2 ,t ( 2 3 ) 通常两步法官分离速度比较快,但k 一均值聚类法估计混叠矩阵a 精度 不是很理想,导致盲信号分离精度较低。文献 4 6 4 7 中提出来的自适 应欠定盲信号分离算法借助l e w i c k i s e j n o w s k i 自然梯度,自适应的交 替更新混叠矩阵a 和源信号s ( t ) ,这种算法盲分离的精度比较高,但是 需要反复迭代更新,速度不是很快。本文基于修正k 一均值聚类,设计 一种新的两步法,这种算法综合了以上两种算法的优点,盲分离速度快, 精度也很高。 2 4 修正k 一均值聚类盲分离算法 2 4 1 观测信号的标准化表示方法 对于观测信号x ( r ) - - ( x , ( 0 ,屯( f ) ,( f ) ) 7 ,可以表示为: 广东工业大学理学硕士学位论文 排吲锏纠砸) 1 1 吲 ( 2 5 ) 颤o = i i _ 8 缸r ) 0 p = 0 fi i ( 2 5 ) l ( ,) jl 气( f ) j 其中i i | | 表示向量x ( f ) 的模, p ( f ) 表示x ( ,) 的方向,满足 彳( ,) + z ( f ) + + e 2 ( t ) - - 1 。由( 2 2 ) 式可以知道,如果在时刻t ,源信号s ( t ) 中只有墨( f ) 取值非零,其他源信号幅值都很小或者为零,由( 2 5 ) 式可 以得到肛( ,) 8 = b 酬,p ( ,) = ( q ,a :,q ) 7 ,这说明如果源信号有着比较 理想的稀疏特性,那么观测信号的模l x ( t ) l i 反映出某一个源信号的幅度 b ( ,) i ,而观测信号的方向p ( f ) 即为对应的混叠矩阵列向量( q 。,a :,) 7 。 2 4 2k 一均值算法的一般过程 常规k m e a n s 算法的一般过程: 输入:聚类个数k ,以及包含t 个数据对象的样本集。 输出:满足方差最小标准的k 个聚类。 处理流程: 从t 个数据对象中任意选择k 个对象作为初始聚类中心: 循环下述流程到,直到每个聚类不再发生变化为止: 根据每个聚类中所有对象的均值( 中心对象) ,计算样本集中每个对象 与这些中心对象的距离,并根据最小距离重新对相应对象进行划分: 重新计算每个( 有变化) 聚类的均值( 中心对象) 。 这是k m e a n s 算法的一般过程,是一个不断迭代的过程。参数k 的值 是已经给定的,所以影响最后聚类结果的唯一因素就是初始聚类中心的 选取。那么选取不同的聚类中心对最后聚类结果有没有影响呢? 答案是肯 定的。许多文章指出k - m e a n s 算法会陷入局部最优。怎样从这些局部最优 中找到较好的聚类结果是一个值得研究的问题。本文给出一种从数据对 象分布出发寻找初始聚类中心的思想以及基于这种思想的改进算法。 1 4 第二章修正k - 均值聚类盲分离方法 2 4 3 修正k 一均值算法的思想 在k 一均值算法中,选择不同的初始聚类中心会产生不同的聚类结果 且有不同的准确率。本文研究的目的就是如何找到与数据在空间分布上 相一致的初始聚类中心。事实上对数据集合进行划分,最根本的目的就 是使得同一个聚类中的对象是相似的,而不同聚类中的对象是不相似的。 如果用距离来表示对象之间的相似性程度,那么相似的对象之甸的距离 比不相似的对象之间的距离要小。如果能够寻找到k 个初始中心,它们分 别代表了相似程度较大的数据集合,那么就找到了与数据在空问分布上 相一致的初始聚类中心。为了找到与数据在空间分布上相一致的、相似 程度较大的数据集合,我们采取如下步骤:计算数据对象两两之间的距离: 找出距离最近的两个数据对象,形成一个数据对象集合z ,并将它们从 总的数据集合u 中删除:计算正中每一个数据对象与数据对象集合u 中每 一个样本的距离,找出在u 中与五中最近的数据对象,将它并入集合写并 从u 中删除,直到z 中的数据对象个数到达一定阈值:再从u 中找到样本两 两间距离最近的两个数据对象构成正,重复上面的过程,直到形成k 个对 象集合:最后对k 个对象集合分别进行算术平均,形成k 个初始聚类中心。 假设有一个2 维数据集包含有l o 个对象,它们的分布如图2 一l 所示。 , ,g hd e - i 0co膏 a b j 。 图2 - 2 样本分布网 f i g 2 - 2d is t r i b u t i n gf i g u r eo fs w a t c h 假设要把它们划分为2 类,我们按照上面的思想寻找初始聚类中一f i , a ,b 之间的距离最近,那么选择a ,b 构成一个数据对象集合正,并将它们从 总的集合u 中删除。u 中与7 ;相邻最近的对象是c ,这样便将c 加入五集合并 将它从u 中删除。如果规定每个数据集合中所包含对象最大个数为4 ,则正 1 5 中将会再添加对象d 。然后在u 中再找出相互之间距离最近的两个对象g , h 构成正,并将它们从u 中删除。u 中与互相邻最近的对象是i ,这样便将i 加入瓦并将它从u 中删除,同样j 也会并入瓦。最后将这两个对象集合分 别进行算术平均,从而形成两个初始聚类中心。如此得到的初始聚类中 - i i , 与实际样本的分布更加相符,可以得到更好的划分效果。 2 4 4 修正的初始聚类中心选择算法 下面,本文将做如下定义: a x ,y ) = 如一m ) 2 + ( t 一乃) 2 + + ( 一只) 2 ( 2 6 ) d ( x ,y ) 表示数据对象x = ( ,乇,矗) 和数据对象】,= 瓴,躬,以) 之 间的距离: d ( x ,矿) = n f m ( d ( x ,y ) ,y 矿) ( 2 7 ) d ( x ,v ) 表示一个数据对象x 与一个数据对象集合v 之间的距离,即: 这个数据对象与这个数据对象集合中所有数据对象当中最近的距离。 d ( s ,矿) = m i n ( d ( x ,y ) ,x s ,y 矿) ( 2 8 ) d ( s ,矿) 表示两个对象集合s 和v z 间的距离,即:两个集合s 和v :l 间 距离最近的两个数据对象x 和y 之间的距离。 假设数据对象集合u 有n 个数据对象,要将其聚为k 类,m 的初值为1 , 修正算法描述如下: 计算任意两个数据对象问的距离d ( x ,y ) ,找到集合u 中距离最近的两 个数据对象,形成集合t m ( 1 s m k ) ,从集合u 中删除这两个对象; 在u 中找到距离集合t m 最近的数据对象,将其加入集合t m ,并从集合u 中删除; 重复第步直到集合中的数据对象个数大于等于! 当( o 口s 1 ) ; 如果m 竿,m = m + 1 ,再从集合u 中找到距离最近的两个数据对象,形 成新的集合t m ( 1 s m n ) 并从集合u 中删除这两个数据对象,返回到第 步执行: 1 6 第二章修正k - 均值聚类盲分离方法 将最终形成的k 个集合中的数据对象分别进行算术平均,从而形成k 个 初始聚类中心: 从这k 个初始聚类中心出发,应用k 一均值聚类算法形成最终聚类; 输出混叠矩阵a ,利用( 2 3 ) 式求解源信号s ( t ) 。 口的取值因实验数据不同而有所不同。口的取值过小则可能使几个 初始聚类中心点在同一区域得到,口的取值过大则可能使初始聚类中心 点偏离数据密集区域。下面看一个例子。如图2 3 所示。 j g , d h f c e 0 r j i j b 曩 图2 - 3样本示意图 f i g 2 - 3s k e t c hm a po fs w a t c h 如果k 的取值为2 ,盯取值为0 4 ,那么每个构成聚类初始中心的集合就只 需要2 个数据对象构成。根据算法首先找到a 和b 构成第一个集合z ,此集 合已经达到阈值( 己经包含了两个数据对象) ;然后再找到c 和d 构成第二 个集合五:最后将这两个集合进行算术平均形成初始聚类中心。从形成 的初始聚类中心来看,它们全部位于右边的密集区域,根部那没有真正 反应出数据的分布情况。而当口取值过大时,因为每个聚类的个数和形 状并不一定完全相同,也可能会让初始聚类中心偏离密集区域。从所做 实验的情况来看取0 7 时效果是比较好的。所以算法中口取值为0 7 2 5 仿真实验 为了说明所给的方法的有效性,下面将就语音信号进行仿真实验 其分离的效果我们将采用通常的评价标准信噪比,即 一龇g 舟 1 7 广东工业大学理学硕士学位论文 其中,为j 的估计,由s n r 的定义可知,s n r 的取值越大,分离的效果 就越好。通常情况下,当s n r 的取值达到甚至超过2 5 时,分离的效果 就很好了。 在下面的仿真中,我们任意选取四个满足稀疏条件的语音信号进行 仿真试验,如下图2 4 所示。其混叠矩阵为; f 0 4 6 6 0o 2 1 8 6 - 0 1 0 0 9 - 0 2 5 8 4 1 a = 10 0 4 5 0 - 0 4 9 0 9 - 0 3 8 2 9 0 1 7 3 7i i o 3 7 1 4 0 2 4 4 4 - 0 4 6 5 8o 3 4 2 3j 从而可以得到三个观测信号。它们的波形图如下: 忡竹。_ 。i 薯卅州竹 图2 - 4源信号波形图 f i g 2 - 4w a v e f o r mo fs o u r c e s 图2 - 5混叠信号波形图 f i g 2 5w a v e f o r mo fm i x t u r e s 这时利用上述的聚类方法可以得到估计的混叠矩阵为 1 8 兰三耋兰番:鳖銮耋喜坌塞耄鎏 尽管估计的混叠矩阵彳与原来的混叠矩阵a 之间存在符号和顺序的差 异,但是这并不影响盲分离的结果,下图2 6 是利用本章的源信号恢复 算法恢复得到的源信号。 :_ 卜”:= ! j m 咿j :_ h 叶卜:_ _ j 图2 - 6 分离信号波形图 f i g 2 - 6w a v e f o r mo fs e p a r a t e ds i g n a l s 最后由( 2 9 ) 式定义的信噪比计算,源信号与分离信号之间的信噪 依次为: 2 5 7 8 4 52 8 5 6 7 42 8 6 7 5 22 8 8 7 9 3 因此算法是成功的。 2 6 本章小结 本章给出了一种在欠定情况下稀疏盲分离中通过对混叠矩阵的估计 来恢复盲分离的算法,理论和仿真实验证明了此算法在恢复源信号时的 可行性,以及良好的性能。同时对于高维的混叠矩阵同样可以用此方法 进行估计和分离 1 9 、j纠 ;呈 鸯;耋 ”o n 溢一 跖鸺罨;哪耋|篓蝴 书 广东工业大学理学硕士学位论文 第三章盲稀疏源信号分离算法的恢复性研究 3 1 引言 盲信号分离问题自研究到现在已经取得了许多成果,但是以往的研 究多数是针对非欠定盲分离而言,即观测器的个数大于源信号的个数, 因此在实际应用中有许多限制。为此,对于观测器个数少于源信号个数 的欠定盲分离问题的研究,目前已经是国际上盲信号处理领域中备受人 们关注的具有挑战性的问题,在这种情况下,观测信号的个数1 7 少于源 信号的个数腰相应的无噪盲信号分离模型如下: j = 彳s( 3 1 ) 其中,未知的混合矩阵彳r 一,矩阵弘e s ( 1 ) ,s ( 肋 r ”含有四 个未知的源信号,唯一可知的x - - - - - i x ( 1 ) ,j ( k ) 胄“是观测信号,其 中行 脚。 对这类问题的研究,目前有人采用的方法是稀疏分解,即利用信号 在时域和变换域中的稀疏特性进行盲信号分离。如b e l o u c h r a n i 针对离

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论