毕业设计(论文)-基于ICA算法的混合语音信号分离.doc_第1页
毕业设计(论文)-基于ICA算法的混合语音信号分离.doc_第2页
毕业设计(论文)-基于ICA算法的混合语音信号分离.doc_第3页
毕业设计(论文)-基于ICA算法的混合语音信号分离.doc_第4页
毕业设计(论文)-基于ICA算法的混合语音信号分离.doc_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

( 二二一二一二 年年 六六 月月 本科毕业设计说明书本科毕业设计说明书 学校代码:学校代码: 1012810128 学学 号:号:200811204070200811204070 题题 目目: 基于基于 ICAICA 算法的混合语音信号分离算法的混合语音信号分离 学学生生姓姓名名 : 学学 院院 : 电电 力力 学学 院院 系系 别别: 自自 动动 化化 系系 专专 业业: 自自 动动 化化 ( 电电 厂厂 热热 工工 过过 程程 控控 制制 及及 其其 自自 动动 化化 方方 向向 ) 班班 级级: 自自 动动 化化 ( 电电 )0 0 8 8 - - 1 1 指指导导教教师师 : 讲讲师师 内蒙古工业大学本科毕业设计说明书 摘 要 现阶段对语音识别、医学、生物、通信等领域中的盲源混合语音信号进行分离 有着较高的要求。在任意环境下,会普遍遇到从多维信号源提取或分离出某一独立 语音信号这种类似于“鸡尾酒会”的问题。这时,就迫切需要一种合理可靠的方法 将观测信号分解为若干独立份。 由于信号源是不可观测的,并不知道信号源是由哪些独立信号混合而成。正是, 由于 ICA 算法建立在独立统计之上,适用于解决这种分离混合语音的问题。本文参 考算法中独立统计的原则。建立信号源的目标函数,对目标函数进行预处理,运用 负熵极大化法求出原独立信号向量的预估向量 Y。ICA 算法中的负熵极大化法具有使 分离后的语音快速发散、信息极大化的特点。所以本文选择 ICA 算法中的负熵极大 化法来分离混合语音。这就是使用 ICA 算法独立统计原则推断混合系统的独立源信 号的基本原因。 经过对实验仿真图与原独立语音图比较,实验得出如下结论:利用 ICA 算法处 理盲源混合信号,分离后得到的独立语音清晰、准确、算法优化、方便快捷。 关键词:独立分量分析;ICA 算法;熵极大化法 内蒙古工业大学本科毕业设计说明书 Abstract At the present stage speech recognition at medicine, biology, communications and other fields for BSS(Blind Source Speech Separation)has an important position. Whatever the environment is,we need deal with something about separate independent voice from the unknow mixed voice. This situation is nearly “Cocktail party”.So,we need find a good way to solve this problem. As source is not observed, we dont know the source be made up by which independent signals . ICA algorithm is apply to solve the problem which mixed voice of this separation. This reference algorithm independent statistical principles to establish the source of the objective function. Pretreatment of the objective function, the use of negative entropy maximization method to calculate the estimated vector Y of the original independent signal vector. ICA algorithm in a negative entropy maximization method after the separation of voice rapid divergence, the characteristics of information maximization. Therefore negative entropy maximization method in the ICA algorithm to separate the mixed voice. This is the basic reason of the independent source signals using the ICA algorithm independent statistical principles to infer hybrid systems. Experimental results show that:using the algorithm of ICA (Independent Component Analysis) process the blind source mixed-signal.We can easy get an independent signal which is very clear, accurate, algorithm optimization and convenient. Keywords:Independent component analysis;Algorithm of ICA;Method of negative entropy maximization. 内蒙古工业大学本科毕业设计说明书 目 录 引 言.1 第一章 前 言.2 1.1 ICA 算法应用背景.2 1.2 ICA 算法的研究现状.2 1.3 ICA 算法的发展趋势.2 1.4 研究任务与方向 .3 第二章 ICA 算法 .4 2.1 ICA 算法的提出.4 2.2 ICA 算法的原理.4 2.3 独立统计简介 .5 2.4 ICA 算法的预处理.7 2.5 负熵极大化法 .9 第三章 仿真实验.15 3.1 流程图 .15 3.2 仿真实验 .16 3.3 结果分析 .20 总 结.21 参考文献.22 附 录.23 谢 辞.25 内蒙古工业大学本科毕业设计说明书 1 1 引 言 在多语音源情况下,要求分离得到独立声音,即仿真人类语音的识别能力, “鸡 尾酒会”就是典型的此类问题。现阶段许多有关多源声音处理的领域,对混合语音 信号的分离提取都属于重点研究课题。 最近几年盲源语音分离技术已经接近成熟。很多项目已经投入使用,例如我国 就把这种技术使用在 CDMA 通讯中,用于改良语音信号传输的清晰度,实践证明可以 得到非常理想的效果。通过改进算法和智能化的引入,现阶段已经能做到排除噪声 干扰等外界环境因素对分离结果的影响。但是,还是有很多复杂的语音分离环境仅 仅通过算法是无法解决的。进而说明虽然人类对盲源语音分离的研究已经迈出关键 一步,但这仅仅只是个开始。我们还需要做更多的科学研究,来使技术更成熟,应 用领域更广泛。因此,我们还要走很长的路。 内蒙古工业大学本科毕业设计说明书 2 2 第一章 前 言 1.1 ICA 算法应用背景 随着社会的进步,科技的发达,人民生活的需求,在很多领域都需要对盲源信 号进行分离提纯。因此,为了解决此类问题,我们必须了解混合声音的特性,以便 于我们找到合理有效的算法将独立语音声音按要求分离出来。由于 ICA 算法是基于 独立统计基础之上,各个随机变量之间互不相干。基于负熵极大的 ICA 算法对此类 盲源信号分离后的噪声小,与原独立语音信号相比较语音效果非常近似。正是由于 这种对症下药的特点,面对盲源信号等分离问题,ICA 算法是最合理的选择。 1.2 ICA 算法的研究现状 上世纪 90 年代,国外学者利用大量数学算法和模型,例如:递归神经网络模型、 独立分量算法、中心归一法等处理多个独立源混合信号的分离。各国学者通过大量 的科学验证,ICA 算法是处理盲源混合语音最有效的方法。 本世纪以来,为了方便处理各个领域盲信号分离问题,许多种优化算法应运而 生。但是算法有利有弊,算法间也很难得到统一处理。因此,学者们从不同的角度 考虑这个问题。在算法上,BBS 算法包括批处理算法与自适应算法;在准则上,又 可以分为多种方法,例如:统一处理准则,寻求最优化准则,网孔模式化准则等。 随着时代的发展,运用优化算法处理盲源信号已经趋于成熟,技术应用已经与 人民生活息息相关。尽管我国对此类技术研究较晚,但在实际应用上已经获得很大 进展。本文处于初级研究阶段,仅仅简要介绍一下有关盲分离的基础理论,对盲源 分离技术的深层次了解请参照更多文献。 很多国家已经把此类技术应用于军事侦查和间谍监听中,我国则大范围应用于 提高通信质量,生物技术和民用方向。由北京科技大学研究开发的盲源语音甄别系 统第二代升级版,已经试用于辅助公安机关侦破案件。这也间接证明我国对此类技 术的广泛重视与开发应用。借此希望国家加大对此类技术各类基金的扶持,成立专 门的科学研究小组。 1.3 ICA 算法的发展趋势 有需求就有问题,就有解决问题的方法应运而生。就如 30 年前学者为了处理 “鸡尾酒会”问题应运而生的 ICA 算法。处理盲源语音信号的方法发展至今,经过 改良已经应用于更广泛的领域。诸如国外马里兰大学和欧洲、日本的一些研究机构 已经着手于运用此技术研究外太空声音、海上声纳监听识别系统和用于预测海洋地 内蒙古工业大学本科毕业设计说明书 3 3 震的发生等。在生物领域也有望通过此类技术研究导致帕金森症产生的真实原因。 目前,各国学者一致统一,ICA 算法的研究中主要面对的问题有两个。一个是稳定 性问题,另一个是收敛性问题。在未来的发展趋势下,力求对多维混合语音分离条 件下的分离效果更准确;在多噪声环境下,排除噪声干扰的能力更强;获得独立语 音信号更理想清晰。盲源分离技术将会朝着算法更优,分离效果跟明显,去噪效果 更好,完全智能化等方向发展。 1.4 研究任务与方向 本文主要探讨 ICA 算法的基本理论,知道混合语音的特点,了解算法中处理独 立信号的原理,了解 ICA 算法中负熵极大化算法的应用。运用 matlab 软件对算法进 行编程,学会用程序表示矩阵方程和单独方程的方法。利用已编写程序对录制好的 盲源混合语音信号进行语音分离。完成多种二维线型混合语音信号的分离,做好应 对各种不确定因素导致仿真结果的不同,及时调整程序,观察仿真图,对比原独立 信号与分离信号,找出误差,分析实验结果,得出正确的实验结论。 内蒙古工业大学本科毕业设计说明书 4 4 第二章 ICA 算法 2.1 ICA 算法的提出 当人们寻求一种解决分离盲源混合声音的方法时,需要了解混合声音的特点。 盲源混合语音的特点是由多个独立自主的语音信号所构成。因此,我们只要寻找一 个可以解决处理独立统一的算法,就可以继续探讨下一步解决问题的方法。因此, 学者们提出了 ICA 算法。图 2-1 就是类似此类问题的简图。 . . . . . . . . . . . . . . . . S Sp pe ea ak ke er r 1 1 S Sp pe ea ak ke er r 2 2 S Sp pe ea ak ke er r N N M Mi ic cr ro op ph ho on ne e 1 1 M Mi ic cr ro op ph ho on ne e 2 2 M Mi ic cr ro op ph ho on ne e N N 源源信信号号观观测测信信号号 图 2-1 盲源混合语音信号框图 2.2 ICA 算法的原理 本文用这个公式模拟录音机录制的的多维混合语音 12 ( )( ),( ),.( )T N X tx tx txt 信号,用公式来模拟每个独立信号,并且每个独立信号 12 ( ) ( ),( ),.( )T M S ts t s tst 间是没联系的,从公式(1)可以看出,矩阵是由矩阵和A 矩阵混合构成( )X t( )S t 的: (2- 11 111 22 1 M NNM NM x ts t aa xtst X tAS t aa xtst 1) A 为混合矩阵。 ICA 算法关键在于假设一个独立统计的信号源,并且找到一个 W 矩阵对 X 矩阵 进行解混。本课题里所涉及的混合矩阵 A 和源信号均未知,本论文介绍的算法( )S t 就是要分离出每一个独立信号。通过上述方法,得到维输出向量,向量即为NYY 独立分量的预估,即,如 2-2 图示:SSASWXWY TT 内蒙古工业大学本科毕业设计说明书 5 5 图 2-2 经线性混合后的 ICA 模型 由图 2-2 可知,通过公式(中各行各列仅存在一个 TTT YW XW ASM SM 元素)求解值,得到。需要找出确定矩阵的值,才能进一步解决问题。WYSW 事实上未知,因此无法确切的求出,但可以寻找一种方法求出的近似解。AWW 推理证明,得到公式,是源信号的线性组合,通 TTT YW XW ASM S i Y i S 过定可以证明的高斯性大于的高斯性。如果(式中的可作为单独的独立 i Y i S ii YS i Y 分量) ,这样做的目的是寻找最小高斯性区域,经过计算中各行各列仅存在一个M 非零元素,通过问题转化,就可以求能使非高斯性最大的来解决。 T W XW ICA 算法最简洁的方法就是寻找最优解,找出最合适的目标函数(又称对比函 数)通过最合适的算法求出的最优解。这样就可以认为 ICA 算法就是求出目标函W 数与寻找优化算法的过程。 在明确目标函数的情况下,可以利用传统的最优化算法进行求解,目标函数的 选取决定了算法的一些统计特性,例如算法收敛的速度和计算的稳定性是由优化算 法所决定。 2.3 独立统计简介 一、概念简介 ICA 算法的核心内容是独立统计。简要说明,在统计学上独立的定义由概率密 度来定义,假定和是两个随机变量,和互不包含各自信息,如果他们的 1 y 2 y 1 y 2 y 联合概率密度可按公式进行分解,和为和)()(),( 221121 ypypyyp 11 ()p y 22 ()py 1 y 的边缘概率密度,则可以证 2 y 11 ()p y 1 212 (y )py , ,dy 22 ()py 1 212 (y )py , ,dx 明和是独立的。由大量实验和数据证明,在个随机变量条件下,上述定理依 1 y 2 yn 然成立,由此可以间接证明联合密度可用个随机变量的乘积来表示。n 二、独立性的随机变量的性质 对于假定函数和,总有,正常情况下 1 h 2 h)()()()( 22112211 yhEyhEyhyhE 随机变量的概率密度无从知晓,仅仅从概率的角度来考虑独立问题是非常麻烦的, 我们可以换一种角度来讨论独立的定义。依然假设两个随机变量和,如果公式 1 y 2 y 成立,推导出和不相关,如果公式0),cov( 212121 yEyEyyEyy 1 y 2 y 成立,并且(和R) ,就可以确切0),cov( 212121 qpqpqp yEyEyyEyypq 的推导出和是统计独立的。综上所述,假设的和独立,那么和一定 1 y 2 y 1 y 2 y 1 y 2 y 不相关;同理可证,假设的和不相关,那它们却不一定是独立的。 1 y 2 y 最终讨论出来的结果证明,上述两种方法表达的意思相同,第一种从定义出发, 内蒙古工业大学本科毕业设计说明书 6 6 有很强的严谨性,依赖于数学计算和公式推导,但也存在着很强的局限性,不方便 初学者对其综合性计算;第二种的核心讨论问题是“相关性”理论的考虑,相关性 使独立概念浅显易懂,更适合初学者理解。 三、ICA 模型中的几个限制条件: (1) 必须确保信号源之间相互独立;( )S t (2) 在诸多源信号、之中最多只有一个正态(高斯)分布, 1( ) s t 2( ) s t( ) M st 本来分离高斯信号就是一个病态问题,而且混合后的高斯信号依旧以高斯信 号形式表现; (3) 仿真过程中观测信号的数量要源信号的数量,即,当时,矩NMNM 阵 为不可逆矩阵,在这种情况下不可能分离出源信号或者是非常困难的分A 离出来,大多数的情况下应该取;NM (4) 需要注意的是:本文要求混合矩阵 必须是列满秩的矩阵,并且程序设计中A 取为非奇异方阵。A 正常情况中,提取的盲源声音中都包含噪声。为了使问题处理简单化,本轮文 涉及的盲源混合语音是在非常安静的环境下录制的,可以近似认为忽略噪声带来的 的影响。 四、ICA 算法中存在的不确定因素: 在求解时,我们可以通过不同的方法,得到不同的结果,所得到的解也不WW 是唯一的,下面主要谈论几种常见解 W 矩阵的小方法: (1)还原法: 信号源属于盲源信号,信号的幅度是任意的,导致仿真结果图与原独立信号图 存在幅度不同的问题。因此在计算时,由于和确切数值并不知道,但是XASAS 本文通过将中分量扩大倍,在求解 W 解混矩阵时,仅仅把中对应的混合系S i sA 数除以,就可以轻易求出 W 矩阵。运用这种方法可以在确保观测信号幅度不变, 排出源信号存在的不确定因素。 (2)排序混乱法: 联系上文,可知和矩阵都未知,而且在不知道盲源语音信号的前提下,不AS 可能按照人们的意愿先分离出哪个声音,再分离出哪个声音。通常情况下分离出的 独立语音都是没有顺序的。但本文将置换矩阵和它的逆矩阵插入在中, P 1 P XAS 经计算可以求得,作为一个新的混合矩阵,起到保持语音有序性 1 XAPPS 1 AP 的原则,这样程序就可以通过所有分量完成分离独立语音顺序的的任务,得到PS i s 内蒙古工业大学本科毕业设计说明书 7 7 理想有序的独立分离语音。 综上所述,尽管以上谈到这两点问题虽然对信号特征分析起不到太大影响,但 是本文力求对最终结果的稳定性、清晰性有序性达到一个合理的设计。还是考虑了 信号的主要特征。正是因为信号的波形与幅度,排序无关。因此,在独立分量的求 解中,通常情况下设矩阵存在单位方差,并且把S中各分量的均值都看作是零,用 S 公式表示为: , (2- 0 i E s 2 1 i E s 2) ICA算法的目的是要分离盲源语音信号,通过大量实验证明,作为一种新的盲 源分离技术,独立分量分析算法在特定条件下,可以有效的将多维盲源语音混合信 号进行分离提纯,最终获得清晰、准确的独立信号源。 2.4 ICA 算法的预处理 为了减少噪声和存在的一些潜在病态问题。本文撰写过程中对 ICA 进行了预处 理。ICA 预处理应该分两步进行:中心化和白化。对混合矩阵 X 进行 ICA 预处理可 以大大提高分离结果的准确度,减少程序编写时的工作量,提高了 ICA 算法的工作 效率。为了高效的完成混合语音分离,在论文编写和程序设计中对 ICA 的预处理是 最关键,且必不可少的步骤。通过实验结果可以看出,ICA 算法经过预处理后,使 程序设计变得更简洁明了,使问题更简单化。 一、中心化: 中心化就是要要对原始混合语音矩阵 X 进行处理,利用 X 减去平均值, E x 为期望,本文取作平均值,用公示表达: E x (2- xxE x 3) 此时,=0。 E x 二、白化: 白化法是 ICA 预处理的核心步骤。白化需要做的工作是把原信号 X 进行线性变, 得到一个新的向量 Z。并且向量各个分量之间没有任何瓜葛,然后得到的协方ZZ 差矩阵:,此矩阵是单位矩阵。向量以空间白色的形式表现出来,这 T E zzIZ 就是“白化”说法的由来。白化很形象的表现出 Z 向量的特点。通过白化,我们可 以很形象的了解处理后向量的规律。方便进行下一步的工作。为了更好的实现白化 过程,本文采用了奇异值分解法。 通过学习概率论可知,N 维随机变量协方差矩阵可用: 12 (,) N x xx 内蒙古工业大学本科毕业设计说明书 8 8 表示,其中: 111 1 N NNN cc C cc , (2-( ,)()() ijijiijj cCov x xExE xxE x ,1,2,i jN 4) 因为,所以,()0 i E x() ijij cE x x 2 11 2 1 ()() ()() N NN E xE x x C E x xE x 通过矩阵概念了解到,语音信号的协方差矩阵可分解为:X T X CE XX (2- TT X CE XXUVU 5) (5)式中存在的矩阵是由这个特征向量的正交矩阵所构成, 12 ( ,) N Uu uu x C 使公式成立。是由特征值的对角阵组成。最终0, T ij E u uij 12, (,) N Vdiag 确定白化公式为: (2- 1 2T ZUVU X 6) 令作为白化矩阵,由此可以推导出 1 2T p WUVU T E zzI 上式是由公式: (2- 1 21 2 TTTTTTTT pPpP E zzE W XX WW E XXWUVU UVU UVUI 7) 推导出来的。 已知 ICA 线性模型: (2- 1 2T pp ZUVU XW XW ASBS 8) 对语音信号矩阵白化处理结束后,由(2-8)式知,向量和都成为白化矩阵XZS (2- TTTTTT E zzE BSS BBE SSBBBI 9) 上式中的属于正交变换。 p BW A 白化预处理结束后,工作量大大减少,减少量大约为原工作量的 50%。这样就 内蒙古工业大学本科毕业设计说明书 9 9 可以从寻求正交矩阵 B 的方法去处理 ICA 算法上的问题。矩阵的自由度从减少到 2 N ,方便程序的运行和计算。 (1) 2 N N 注意:跟语音信号有关的实验中避免不了噪声产生的影响。在深层次研究 ICA 的过程中,可以借鉴 PCA 方法来减少协方差矩阵中没有用的较小特征值,力求排出 噪声影响实验结果的目的。但是在本实验中,只是要求运用算法实现混合语音的分 离,达不到那么高的要求。在此只作简要介绍。本实验中可以根据实际需要对观测 信号进行降维,也可达到减少工作量的目的。 2.5 负熵极大化法 一、负熵极大化法公式推导: 本文对于混合语音的处理主要运用 ICA 算法中的负熵极大化法。负熵的定义是: 熵函数的负向变化量 ,即熵减。由于混合语音 X 是随机变量,熵正好可以表述 随机变量的不确定因素,本文对随机变量的熵定义可分为如下两个公式: 离散随机变量用下式表示: (2- n i iii pppEXH 1 log)log()( 10) 连续随机变量用下式表示: (2- dxxpxpXH)(log)()( 11) 通过公式(2-10)和公式(2-11) ,可以知道熵从始至终都必须是非负的,可以表示 为,由此可以得出结论:面对明确存在的事件或零概率事件的熵为零。0)(XH 讨论完上述问题,设两个连续型随机变量,对于联合熵的定义式xy与),(yxH 如下: (2- dxdyyxpyxpyxH),(log),(),( 12) 然后给出两个条件熵和的定义:xyHyxH (2- dxdyxypxypxpxyHlog)( 13) (2- dxdyyxpyxpypyxHlog)( 内蒙古工业大学本科毕业设计说明书 1010 14) 表示对 x 观测结束后, 中所剩余不确定因素的大小,同理,表示xyHyH x y 对 y 观测结束后,x 中所剩余不确定因素的大小。联合熵用表示,、),(yxHxyH 用来表示条件熵,、则表示边缘熵,得出其关系式如下:yxH)(xH)(yH (2-yxHyHxyHxHyxH)()(),( 15) 正常情况下,熵越大,随机变量就存在更大的不确定性,这是负熵极大化法中 重要的特点。所以要使 ICA 算法中不确定因素降到最低点,就要考虑熵的问题,可 见对于本文所处理的问题,熵越小越好。 下面本文重点讨论等方情况下差随机变量熵的特点。最大熵定理规定:当任意 一个随机变量满足高斯分布时,熵可以取近似最大值。根据这条定理,本文采用负 熵理论来弄清楚任意分布与随机高斯分布之间存在的不相同问题。首先)(xp)(xpG 假设与的均值和方差都一样,负熵的公式如下:)(xp)(xpG (2- dx xp xp xpxHxHxJ G G )( )( log)()()()( 16) 由公式(2-16)得,负熵的值总永远都只是非负的。但也在特殊条件下,例如为x 高斯分布时,负熵只能为零。 下面介绍一个有关于负熵的性质:在一切可逆线性变换过程中,要求负熵的数 值必须不可以变化。这样从统计角度特性可以得出,统计随机变量的非高斯性,用 负熵的定义来考虑问题是目前最好的方法,也是使用最普遍的方法。 就算负熵有他合理的判断不确定性,也依然存在一些缺陷。本文尽最大努力做 好问题全面性的考虑。负熵计算中不可避免要对随机变量的概率密度进行预测判断。 经验告诉我们,对概率密度进行随意的预测判断是不合理的。预测判断是否具有可 行性,主要取决于参数选取的正确性。本文还考虑到抛去计算大的问题不谈,只对 对负熵的预测判断一项要做的工作量,就需要大量的实验去验证。这不仅仅是本次 仿真实验的一个难点,更是一个较为棘手的问题。但本文必须要找到行之有效的计 算方法,来解决以上难题。 下面我们就开始寻找这种计算公式,任意给出随机变量的均值和方差,用下x 式表示负熵近似计算公式: 内蒙古工业大学本科毕业设计说明书 1111 (2- 223 )( 48 1 )( 12 1 )(ykurtyEyJ 17) 对于上式,还是有不合理处值得指出,现在讨论的问题要尽量避免使用随机变量, 可是上式出现了随机变量的函数值,这里有很多不稳定的因素存在,这样避免不了 对负熵的预测判断产生影响,使负熵处于波动状态。更严重的是,上式对负熵的近 似精确度估计较弱,面对随机采集语音信息分离效果并不会理想。这也是通过对大 量随机样本的实验得出的经验结论。 然后本文在讨论另一种基于最大负熵法的预测判断,介绍这种方法的目的是为 了寻找出比(2-17)式精确度更准确的办法来解决不确定性的问题,计算公式为: (2- p i iii vGEyGEkyJ 1 2 )()()( 18) 公式中的是非负常数, 用来表示标准的高斯随机变量, 的均值为零且存在单位 i kvv 方差。 假定上文提到的随机变量存在,本文设定一个值,y 的均值为零且存在单位y 方差。设代表任意一种二次函数的形式,本文给出常见的三种二次函数供编程过 i G 程中验证使用。三种函数公式如下: (2-ua a uG 1 1 1 coslog 1 )(21 1 a 19) (2-) 2 exp( 1 )( 2 2 2 2 ua a uG1 2 a 20) (2- 4 3 4 1 )(uuG 21) 其中, (2-19)式属于万能二次函数;(2-20)式适用于独立分量为超高斯分布 和收敛性能有较强的要求;对亚高斯独立分量的误差值不必精确估测时应该使用公 式(2-21) 。 在二次函数中,也存在特殊情况,例如时,负熵可近似表示为:1p (2- 2 )()()(vGEyGEyJ 内蒙古工业大学本科毕业设计说明书 1212 22) 由(2-22)式和得到负熵的近似二次函数表达式为:ZWY T (2- 2 )()()(vGEZwGEwJ T G 23) 前面已经讲过,本文主要核心问题是求解混矩阵,目的是让函数达到最大。W)(wJG 正好印证了负熵极大化法中的“极大”含义。至此,我们所要做的主要工作已接近 尾声。剩下的只是要处理一些细节问题。 当时,得到以下公式:1)( 2 ZwE T max)()(zwGEwJ T G (2-24). .ts1w 经过推导证明,得到以下公式: (2-) 1()()( 2 wcZwGEwF T 25) 根据定理求解此目标函数的最优解, 对求导得:)(wF (2-wZwZgE dw wdF T )( )( 26) 其中是常数,是的倒数。若,则,是使gG0 )( dw wdF )( 00 ZwZgwE TT 0 w 最大的。)(wFw 令得到一个矩阵表示成:wZwZgE dw wdF wH T )( )( )( (2-IZwgZZEwJH TT )()( 27) 是白化处理后的向量,ZIZwgEZwgEZZEZwgZZE TTTTT )()()( (2-)()(ZwgEwZwZgEd TT 28) (2- www ZwgEwZwZgEwdww TT * )()( 内蒙古工业大学本科毕业设计说明书 1313 29) 根据,把(2-29)式中第一式两端同时乘以得到)(ZwZgwE TT )(ZwgE T 以下公式: (2- www wZwgEZwZgEw TT * )()( 30) 通过以上的介绍,可以将 ICA 算法中负熵极大化法求解迭代步骤总结如下: 首先利用公式对目标混合语音信号 X 进行预处理;其次,XWZ p 0n 是处理后的起始值,令;然后整理值,得到公式:)0(w1 nnw (2-)()()() 1(nwZnwgEZnwZgEnw TT 31) 接下来进行归一整合处理,得到下式: (2-) 1() 1() 1(nwnwnw 32) 再次考虑算法的收敛性,如果不收敛,就继续迭代,知道收敛为止;最后得到收敛 结果,就可以求出独立分量的数值。wZs 1 经过各种公式推导,终于得到了独立分量的数值。基于此种方法,可以进一步 讨论到提取多个独立分量的问题上来。在实际实验过程中,仿真图出现多次与原独 立语音图不相似的情况。经过分析,很大原因是由于迭代时,公式运算过程中去近 似值,造成仿真结果的近似。因此,考虑到迭代后与前面求得的 个权值向量的 1i wi 收敛性和方可能产生相同的方向,本文采用分离矩阵与已求得的分离矩阵向量相互 正交的办法来消除这种疑虑。这样,在对新向量迭代过程中,要充分做好近似 1i w 值取值过程等工作,得到计算公式如下: (2- 1111 1 111 i T iii i j jj T iii wwww wwwww 33) 考虑对于目标函数: max)()(zwGEwJ T G (2-34). .ts1w 内蒙古工业大学本科毕业设计说明书 1414 本文还可采用共扼下降法求解混合矩阵,但是此算法的收敛速度只能达到二阶,W 对于(2-34)式所示目标函数还可用梯度法进行求解得迭代公式为: () T wZG w Z (2-ww w 35) 二、ICA 算法下负熵极大化法的特点: 第一,二次方收敛速度极快,即以做到稳、准、快; 第二,收敛性能非常理想,没有过于复杂的计算过程; 第三,收敛最次数高,包含信息量巨大,可以同时处理多维独立分量; 第四,负熵极大化法没有步长参数,简化运算步骤。 三、ICA 算法中负熵极大化法的缺点与不足: (1)在实际计算过程中,只能选择样本的平均值来代替方差,这与理论上存在 很大的差异,间接增大了计算的复杂性和计算量。本文在面对这种情况下,只能调 节采样点数以达到控制计算量的目的,但最终的仿真图效果不是非常理想。这也留 给后续研究者可创新的研究项目。鉴于水平有限,只能在符合运算简洁化的前提下, 配合整个仿真图象征性的进行试验对比。 (2)由于迭代过程中独立分量和源信号间存在符号不确定性问题,而且在算法 中需要判断迭代的收敛性,在迭两次后和的正负号仅代表方向,但在计算www 过程中,却很难排出正负的影响,进而影响收敛性。所以需要强调的是,在 ICA 算 法中,尽可能选择能收敛的初始值,随机选择可能导致结果不收敛,符号不确定, 以至于实验结果偏差过大。 小结:本章是本次设计的关键,一切实际问题将在本章完成,从算法的目的,到 预处理,再到最优算法的选择。都对最后实验结果产生直接的作用。本章也是 ICA 算法实现盲源混合语音分离的核心,盲源混合语音的特点就是不管你是有多少个独 立语音合成的,每个独立语音必然有自己独特的波形特点。就要寻求一种分离这种 独立混合声音的方法。ICA 算法正好从概率论的角度讨论独立统一问题的方法,从 理论上解决了此类问题。接下来,本文就开始对仿真实验效果进行验证。 内蒙古工业大学本科毕业设计说明书 1515 第三章 仿真实验 通过上一章的介绍,利用负熵极大化法,对二维混合语音信号进行分离,运用 matlab 仿真,通过仿真图与原独立语音图比较,验证试验的准确性。 3.1 流程图 本文采用的是 ICA 算法中非高斯性负熵极大化方法对混合语音信号进行分离。 设计所选用的函数式为第二章中的公式,其导函数为 11 1 1 ( )logcosG uau a ,二阶导函数为,式中,为方便 11 ( )tan()g UaU 2 111 1tangUaaU 1 12a 取 a1=1。算法总流程图如图 3-1 所示,负熵极大化法流程图如 3-2 所示。 图 3-1 算法总流程图 初始化 录制语音 线性混合语音 中心化 白化 FastICA 算法 结束 Y=WT.S 内蒙古工业大学本科毕业设计说明书 1616 图 3-2 负熵极大化法流程图 3.2 仿真实验 一、实验一: 录制两女声语音 sig1 和 sig2,这两路语音信号是在 11025Hz 的采样频率下录制 N 归一化 W 白化后 X 迭代 W 是否相关? 去相关 是否收敛? Y Y N 初始化权值 |W|=1 结束 内蒙古工业大学本科毕业设计说明书 1717 的,如图 3-3 所示。将这两路语音信号按比例进行线性混合,如下式所示: (3-10.5*1 0.5*2mixsigsig 1) (3-20.6*1 0.4*2mixsigsig 2) 从而得到模拟实际采集的混合语音信号,对此混合信号进行预处理(即中心化和白 化 处理得到矩阵 X) ,然后根据白化后的矩阵 X,运用负熵极大化法迭代寻找解混矩阵 W,最后利用 Y=WTS 即可得到独立分量 Y,利用负熵极大化法分离的结果如图 3- 3。 图 3-3 两女声混合语音分离 实验一分离的语音信号在波形上能基本保持了原始信号的波形,从图 3-3 可看 出在幅值上有差别不大,分离效果很好。从仿真误差图可以看出误差不是很大,误 差值在允许的范围内。实验一验证了,在安静环境下,ICA 负熵极大化法可以清晰, 快速的分离二维混合语音,只迭代了 3 次就得到仿真实验图。 二、实验二: 内蒙古工业大学本科毕业设计说明书 1818 在同样安静的环境下,以 11025Hz 的采样频率下录制两段独立声音源。将这两 路语音信号按比例进行线性混合,得到以下两式: (3-112mixsigsig 3) 20.2*1 0.9*2mixsigsig (3-4) 图 3-4 两独立语音的混合和分离 从而得到模拟实际采集的混合语音信号,对此混合信号进行预处理(即中心化和白 化 处理得到矩阵 X) ,然后根据白化后的矩阵 X,运用负熵极大化法迭代寻找解混矩阵 W,最后利用 Y=WTS 即可得到独立分量 Y,利用负熵极大化法分离的结果如图 3- 4div1 和 div2。 实验二使混合声音中一个人的声音极弱,弱到人耳几乎不可辨别的程度,另一 个人的声音清晰可辨,使其变成一个人为混合的 2*2 矩阵。通过图 3-4 中 err1 和 内蒙古工业大学本科毕业设计说明书 1919 err2 两幅误差图分析得到原语音信号与分离语音信号在振幅上基本一致,仿真误差 在允许范围内波动。且实际分离的混合语音信号在听觉上和原始信号基本一致,几 乎不失真。由实验二可得出结论:分离语音信号在波形上能很好的保持了原始信号 的波形,几乎不可辨别的语音可被清晰的分离出来,且分离效果很理想。实验只需 要迭代 3 次就可以迭代出语音信号,收敛速度快。因此,利用基于负熵极大化法能 很好的分离这两个语音信号。 三、实验三: 同实验二,在相同且安静的环境下,以 11025Hz 的采样频率下录制两段独立声 音源。将这两路语音信号按比例进行线性混合,如下式所示: (3-112mixsigsig 5) (3-20.9*1 0.2*2mixsigsig 6)从而得到模拟实际采集的混合语音信号,对此混合信号进行预处理(即中心化和 白化处理得到矩阵 X) ,然后根据白化后的矩阵 X,运用负熵极大化法迭代寻找解混 矩阵 W,最后利用 Y=WTS 即可得到独立分量 Y,利用负熵极大化法分离的结果如图 3-5 中 div1 和 div2 所示。 内蒙古工业大学本科毕业设计说明书 2020 图 3-5 两独立语音的混合与分离 实验三是通过人为混合使验证实验二中不清晰的声音变得清晰可辨,而其清晰 可变的声音则变成了不可辨别的语音。则通过仿真实分离实验图 3-5 比较。得出与 与实验一相似的结论。实验二结合实验一验证出:在相同环境下,同样的混合语音, 在不同的可辨独立语音下,可以通过 ICA 算法分离得到清晰可辨的独立语音信号。 但通过误差分析图还可看出本次误差相比实验一中的误差较大。这是由于:第一, 这两个语音信号比较接近,同一种语音信号出现的概率比较多,所以系统不能很好 地准确地做出判断;第二,受噪音和人为设定误差值造成此分离效果。但通过加上 滤波,会减小以上原因产生的影响,效果就会更理想。但误差还是在允许范围内,分 离的语音信号在听觉上和原始信号依然一致,效果依然理想,没有明显失真效果, 同样只需要迭代 1 次就可以迭代出语音信号,收敛速度也比较快。 3.3 结果分析 本文主要探讨混合语音分离后的效果受否理想。不论初始混合语音是什么状态。 达到最终能清晰可辨的分离出俩种原始独立声音的实验目的。通过仿真实验图比较 我们可以看出,分离后的独立语音信号,与原独立信号振幅相似。在初始阶段也存 在不相关振幅点现象。这很可能是因为语音录制环境有噪声引起的,因为实验初期 已经介绍过,假设的语音录制环境是绝对安静,无噪声的。因此,可以认为分离效 果接近理想,达到预期要求。 内蒙古工业大学本科毕业设计说明书 2121 总 结 本文利用 ICA 算法中的负熵极

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论