




已阅读5页,还剩68页未读, 继续免费阅读
(计算机应用技术专业论文)多传感器相关分析方法研究与应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文题目:多传感器相关分析方法研究与应用 专业:计算机应用技术 硕士生:宋利娜 ( 签名) 盈圣l 塑e 指导教师:李爱国 ( 签名) 銮i 嚣f 丢i 摘要 本文研究多传感器同步相关分析方法和异步相关滞后步长分析方法,并将其应用于 分类主特征选择及煤矿瓦斯监测数据的异常检测和遗失值估计问题。同时,开发了基于 时间序列数据挖掘的煤矿瓦斯涌出量分析系统。主要研究内容如下: 运用多传感器相关信息熵的概念,定义了多传感器相关组合的概念并分析了其性 质。在此基础上提出了一类发现所有相关传感器组合的快速算法,即s c c ( s u p e r c o r r e l a t i o nc o m b i n a t i o n ) 算法。该算法能够高效的找出全部相关组合。 提出了基于粒子群优化的异步相关滞后步长分析方法。研究了两种针对多传感器系 统异步相关最优滞后步长分析的适应值函数,分别为基于相关信息熵的适应值函数与基 于相关系数的适应值函数。实验表明提出的方法是有效的。 提出了基于多传感器相关分析的主特征选择方法。该方法引入主特征和主特征子集 的概念描述被分类对象的关键分类特征,并给出了计算被分类对象的主特征和主特征子 集的方法。其特点是主特征和主特征子集与所采用的分类器无关。实验结果显示:利用 数据集的主特征和主特征子集进行数据分类比用数据集的全部属性进行分类的性能要 好。 瓦斯浓度异常检测和遗失值估计事关煤矿安全。以往的解决方法是使用一个矿井中 的全部瓦斯传感器采样数据分析求解这两个问题。但是这种方法存在着不足:计算量大 和异常检测的准确率相对较低,遗失值的估计精度也较低。提出了利用相关传感器组合 的信息进行瓦斯异常检测和遗失值估计的方法。仿真结果表明该方法克服了上述不足。 开发了基于时间序列数据挖掘的煤矿瓦斯涌出量分析软件原型系统。本文的研究结 果主要开发了其中的多传感器相关分析模块与瓦斯涌出量预测模块。测试结果表明该系 统运行正确。 关键词:时间序列数据挖掘;多传感器系统;相关分析;瓦斯监测 研究类型:应用研究 s u b j e c t :s t u d ya n da p p l i c a t i o no fm u l t i s e n s o rc o r r e l a t i o na n a l y s i s m e t h o d s s p e c i a l t y :c o m p u t e ra p p l i c a t i o nt e c h n o l o g y n a m e :s o n gl i n a i n s t r u c t o r :l ia i g u o a b s t r a c t ( s i g n a t u r e ) ( s i g n a t ur e ) t h et h e s i sm a i n l yf o c u s e so nm e t h o d so fs y n c h r o n o u sm u l t i s e n s o rc o r r e l a t i o na n a l y s i s a n de s t i m a t i n ga s y n c h r o n o u sc o r r e l a t i o nd e l a yt i m e ,a n de m p l o y st h e s em e t h o d st os o l v e p r i m a r yf e a t u r es e l e c t i n go fc l a s s i f i e r sa n dd e t e c t i n ga b n o r m a ls a m p l e d a t aa n de s t i m a t i n g m i s s i n gv a l u e so fg a ss e n s o r si nc o a lm i n e s a tt h es a m et i m e ,ap r o t o t y p es o f t w a r es y s t e mo f g a se m i s s i o na n a l y s i sb a s e do nt i m es e r i e sd a t am i n i n gw a sd e v e l o p e d t h em a i nc o n t e n t sa r e a sf o l l o w s : t h em u l t i s e n s o rc o r r e l a t i o nc o m b i n a t i o nw a sd e f i n e da n di t sc h a r a c t e r sw e r ea n a l y z e d b yu s i n go fc o r r e l a t i o ni n f o r m a t i o ne n t r o p y af a s ta l g o r i t h mf o rf i n d i n ga l lt h ec o r r e l a t i v e s e n s o r sc o m b i n a t i o n sf r o mam u l t i s e n s o rs y s t e mw a st h e np r o p o s e d t h ep r o p o s e da l g o r i t h m i sn a m e ds c c ( s u p e rc o r r e l a t i o nc o m b i n a t i o n ) a l g o r i t h m s c ca l g o r i t h mi sa b l et of i n do u t a l lt h ec o r r e l a t i o nc o m b i n a t i o me f f e c t i v e l y am e t h o do fe s t i m a t i n ga s y n c h r o n o u sc o r r e l a t i o nd e l a yt i m eb a s e do np a r t i c l es w a r m o p t i m i z a t i o ni sp r o p o s e d t w of i t n e s sf u n c t i o n s ,i e c o r r e l a t i o ni n f o r m a t i o ne n t r o p yb a s e d f i t n e s sf u n c t i o na n dc o r r e l a t i o nc o e f f i c i e n tb a s e df i t n e s sf u n c t i o n , a r er e s p e c t i v e l ye m p l o y e d b yp r o p o s e dm e t h o d t h ee x p e r i m e n t a lr e s u l t ss h o w t h a tp r o p o s e dm e t h o di se f f i c i e n t am e t h o do fp r i m a r yf e a t u r es e l e c t i n gb a s e do nm u l t i s e n s o rc o r r e l a t i o na n a l y s i si s p r o p o s e d t h ec o n c e p t so fp r i m a r yf e a t u r ea n dp r i m a r yf e a t u r es u b s e ta r ep r e e n e dt o d e s c r i b ek e yf e a t u r e so fac l a s s i f i e do b j e c t t h e n , c a l c u l a t i o nm e t h o d so fp r i m a r yf e a t u r ea n d p r i m a r yf e a t u r es u b s e tw e r ep r o p o s e d p r i m a r yf e a t m ea n dp r i m a r yf e a t u r es u b s e to fa c l a s s i f i e do b j e c ta r eb o t l li n d e p e n d e n t 谢t hc l a s s i f i e r su s e dt oc l a s s i f yt h eo b j e c t t h e e x p e r i m e n t a lr e s u l t so fp r o p o s e dm e t h o dw e r eg i v e ni nt h i st h e s i s f o rag a sm o n i t o rs y s t e mo fc o a lm i n e s ,h o wt od e t e c ta b n o r m a ls a m p l e - d a t ao fg a s s e n s o r sa n dh o wt oe s t i m a t em i s s i n gs a m p l ev a l u e so fg a ss e n s o r sa r et w oi m p o r t a n tp r o b l e m s p r e v i o u sr e s e a r c hw a st h a te m p l o y ss a m p l ed a t ao fa l lg a ss e n s o r so fa g a sm o n i t o rs y s t e mt o s o l v et h et w o p r o b l e m s h o w e v e r , i th a sd i s a d v a n t a g e s ,w h i c ha r el a r g e ra m o u n to f c a l c u l a t i o n ,a n dl o w e ra c c u r a c yr a t ef o rd e t e c t i n ga b n o r m a ls a m p l e d a t aa n dl o w e rp r e c i s i o n f o re s t i m a t i n gm i s s i n gs a m p l ev a l u e s t h em e t h o d sw h i c he m p l o yc o r r e l a t i o nc o m b i n a t i o n s e n s o r st os o l v et h et w op r o b l e m sw e r ep r o v i d e dr e s p e c t i v e l y t h es i m u l a t i o nr e s u l t ss h o w i t o v e r t a k e ss h o r t c o m i n g so f p r e v i o u sr e s e a r c h b a s e do na b o v er e s e a r c hr e s u l t s ,g a se m i s s i o na n a l y s i ss o f t w a r ef o rg a sm o n i t o r i n go f c o a lm i n e sw a sd e v e l o p e d t w om o d u l e so ft h es o f t w a r e ,i e m u l t i s e n s o rc o r r e l a t i o n a n a l y s i s m o d u l ea n dg a sc o n c e n t r a t i o np r e d i c t i n gm o d u l ea r ed e s c r i b e d t h et e s tr e s u l t ss h o w t l l a tt h e s o f t w a r er u n sw e l l k e y w o r d s :t i m es e r i e sd a t am i n i n gm u l t i s e n s o rs y s t e m c o r r e l a t i o na n a l y s i s g a sm o n i t o r i n g t h e s i s :a p p l i c a t i o nr e s e a r c h 要料技大学 学位论文独创性说明 本人郑重声明:所呈交的学位论文是我个人在导师指导下进行的研究工作及 其取得研究成果。尽我所知,除了文巾加以标注和致谢的地方外,论文中不包含 其他人或集体已经公开发表或撰写过的研究成果,也不包含为获得西安科技大学 或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所 做的任何贡献均已在论文中做了明确的说明并表示了谢意。 学位论文作者签名:扇涕1 确p 日期:砷f6 学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻读学位期间 论文工作的知识产权单位属于西安科技大学。学校有权保留并向国家有关部门或 机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。学校可以将本学 位论文的全部或部分内容编入有关数据库进行检索。可以采用影印、缩印或扫描 等复制手段保存和汇编本学位论文。同时本人保证,毕业后结合学位论文研究课 题再撰写的文章一律注明作者单位为西安科技大学。 保密论文待解密后适用本声明。 学位论文作者签名:牺1 翻辛指导教师签名:巷铜 d 一9 年歹胄弓日 1 绪论 1 绪论 1 1 研究背景及意义 随着微电子技术、信号检测与处理技术、计算机技术、网络通信技术以及控制技术 的飞速发展,各种面向复杂应用背景的多传感器系统大量涌现而出。在这些多传感器系 统中,信息表现形式的多样性、信息数量的巨大性、信息关系的复杂性以及要求信息处 理的即时性、准确性和可靠性是前所未有的。由此迫切需要利用新的技术手段对过多的 信息进行消化、解释和评估【l j 。 多传感器信息融合技术在自动目标识别、自主飞行器导航、遥感系统、制造过程监 控、复杂环境的设备维护维修、机器人、医用系统等领域有着广泛的应用【2 】。尽管多传 感器信息融合的应用研究已是如此广泛,但其绝大部分工作都是针对使用多种传感器进 行互补获得更好的目标信息。也就是说,充分利用多个传感器资源去除冗余信息,进而 使整个多传感器系统的探测信息能更完整、更全面地反映和描述对象。然而,由于环境 或对象各状态的相互作用,传感器之间具有一定程度的耦合关系,或称相关关系。这种 相关关系的研究对一些系统的综合分析与评估、设计、提高可靠性以及事故预测、事故 分析等领域均具有重要的应用价值。 相关关系可分为正相关和负相关。一个系统中的同类传感器之间通常是正相关。例 如:煤矿瓦斯监测系统是一类典型的多传感器系统,在煤矿瓦斯监测系统中,同类瓦斯 传感器之间就存在正相关,即,如果两个瓦斯传感器相关,那么其中一个瓦斯传感器的 量测值逐渐增大时另一个的量测值也将在某种程度上逐渐增大。本文主要研究同类传感 器之间的相关问题,故本文中提到相关都指的是正相关( 除特别说明) 。 瓦斯多传感器之间的相关分析在煤矿瓦斯监测系统的综合分析、评估与设计中具有 重要的应用价值。如果传感器之间存在着相关性,就意味着这些传感器的采样数据之间 存在着信息冗余。传感器之间的相关性越强,信息冗余就越大。倘若某个传感器发生了 软失效,那么可通过分析与之相关的传感器采样数据及时发现软失效的传感器,从而提 高系统的安全性。若对某些重要部位或物理量的检测,那么可通过相关分析部署传感器, 使得传感器之间具有较强的相关性,进而提高系统的可靠性。具体而言,多传感器相关 分析方法的研究可以为求解矿井中瓦斯传感器的部署数量及合理部署问题,及时发现软 失效的传感器,更确切地估计软失效传感器的遗失值,更准确地预测关键位置传感器的 量测值以及对煤矿瓦斯监测系统的综合分析与评估等问题提供新思路。 就我们所知,目前尚缺乏从一个多传感器系统中找出所有相关传感器组合及其相关 程度的强弱的方法。这一理论短缺现象使得多传感器信息融合在某种程度上仅被看成是 西安科技大学硕士学位论文 一种多传感器信息处理,阻碍了研究者对多传感器信息融合的深入认识。 1 2 国内外研究现状 相关分析是经典统计理论中的重要组成部分。在经典理论中变量的相关性通常分为 四种形式:简单相关,偏相关,多重相关和典型相关。简单相关是测度两个随机变量之 自j 关联的程度;偏相关所测度的是当两个变量就其他变量去做调整时这两个变量之间的 关联程度;多重相关的定义是一个随机变量与一个随机变量集线性组合之间的极大相 关;典型相关是探讨两个随机变量集之间关联的程度。 近年来,相关分析的方法在解决各个领域的理论与实践中所遇到的难题时起到了关 键的作用。文献 3 】用动力学相关分析方法揭示了有机化学反应中的主要影响因素,文献 【4 】采用分形相关法使得散斑图的相关性特征得到了更充分的利用。文献 s l n 用图像的 大范围冗余信息实现了对有坏点的图像的修复、增强和错误隐藏。 在实际应用中,有时需要准确测定一个随机变量集作为一个整体时它所包含的各变 量的相关程度或信息的重叠程度。如在文献 6 】中为了进行超谱图像的分组,必须确定同 一组内多个图像的相关性强弱,利用相关信息熵对超谱数据各谱带间的相关性进行了精 确的度量,根据度量结果对数据进行了自适应子空间划分,取得了良好的应用效果。在 文献 7 】中,需要根据数据融合方法所得结果与原始数据间的相关性强弱来评价数据融合 方法的性能,可以利用相关信息熵概念定量地计算出融合方法所得结果与原始数据间的 相关性,进而对融合性能进行准确的评价。 国内外瓦斯治理的重要手段之一是对瓦斯实时监测。就矿井瓦斯监测系统而言,主 要有法国o l d h a m 公司的c t t 6 3 4 0 u ,波兰的c m m 2 0 m 和c m m 1 ,英国h s d e 公 司的m i n o s ,德国a e g 公司的c p 8 0 ,德国f h 公司的t f 2 0 0 h 和z m 4 0 0 ,美国的 d a n 6 4 0 0 系统以及加拿大的m i n l 6 0 0 系统,国内自行研制的6 6 、9 5 、9 0 系统 等。但是上述监测系统是以监测功能为主,不能形成对瓦斯状况的预警与工程措施效果 预案分析等专业功能。目前在国有重点和县( 市) 的高瓦斯和突出矿井,都装备了瓦斯监 测系统,对井下工作地点和重要的监测点进行有效的通风瓦斯监测,因而积累了大量的 通风瓦斯监测数据,为开展多传感器相关分析研究创造了条件。 煤矿瓦斯涌出量的预测是国内外研究热点之一。矿井瓦斯涌出是随时间动态发展的 复杂系统,瓦斯涌出量多少是受自然因素和开采技术因素综合影响的结果,是非线性的。 由于瓦斯涌出动力学现象的复杂性和瓦斯涌出发生的突然性、危害性给研究工作带来了 很大的不便,既无法在现场直接观察到其发生和发展的全过程,也不能在实验室真实再 现,故国内外对瓦斯涌出规律尚未形成统一的认识和完整的理论体系博j 。文献 9 】研究了 瓦斯涌出时间序列的分形特性,证明瓦斯涌出时间序列具有混沌特征,且j 下常情况下其 h u r s t 指数接近1 ,而发生火灾时,h u r s t 指数接近0 5 。但是这个研究结论是分析很小的 2 1 绪论 数据样本得到的,是否具有一般性有待进一步研究。在瓦斯涌出预测研究方面,大体可 以分为2 大类:基于传统的统计分析方法【lo j 和基于人工智能的方法。后者包括基于模糊 推理的方法【1 6 1 ,基于灰色系统理论的方法【1 1 , 1 4 】,基于人工神经网络的方法【8 , 1 3 , 1 7 , 1 8 , 1 9 】,基 于支持向量机的方法【1 2 】以及基于自适应神经模糊推理的方法【l5 。然而,这些研究存在3 个不足:数据样本小;算法实时性差;没有考虑到瓦斯监测系统是多传感器系统,瓦斯 传感器之间存在着复杂的耦合关系这一事实。 造成前两种情况的一个重要原因是现有的瓦斯涌出分析技术不适合处理海量数据。 多传感器相关分析方法是时间序列数据挖掘( t i m es e r i e sd a t am i n i n g ,t s d m ) 领域研究 的热点之一。瓦斯监测数据是时间序列数据,而t s d m 技术特别适合处理海量时间序列 数据。十多年来t s d m 研究取得大量的成果,根据研究任务归纳为:海量时间序列数据 索引( 基于内容的查询) 、时间序列聚类与分类分析、海量时间序列可视化以及时间序列 预测与趋势分析【2 0 】。将这些研究成果应用于瓦斯涌出分析是有意义的。 瓦斯随风流通过回风巷排出矿井或进入井下瓦斯抽排系统,从而确保煤矿的安全。 为确保瓦斯传感器能够及时监测到瓦斯气体的浓度变化,瓦斯传感器的布置要根据瓦斯 来源、风流方向以及监控对象三个主要方面的因素来进行合理的布置1 2 。如果相邻或邻 近瓦斯传感器之间存在着某种相关关系( 即耦合) ,就可以利用这种相关关系提供的信息 冗余来提高瓦斯监测系统的可靠性,为解决异常瓦斯采样数据检测、遗失瓦斯采样数据 估计等问题开辟新途径。因此,煤矿瓦斯多传感器的相关性研究对实时瓦斯涌出量分析 具有重要的意义。 1 3 本论文的研究内容和成果 本课题是教育厅自然科学专项计划项目( 项目编号0 7 j k 31 4 ) 与陕西省科技攻关项目 ( 项目编号2 0 0 8 k 0 1 5 8 ) 的项目基金资助下,研究多传感器相关分析方法的研究及应用。 主要的研究内容如下: 运用多传感器相关信息熵的概念,定义了多传感器相关组合的描述方法及性质。在 此基础上提出了一类发现相关传感器组合的快速算法。该算法不仅能够有效率的找出全 部相关组合,而且可以获得最大相关组合。这将为深入研究多传感器相关分析开辟一条 新途径。本研究成果在我校与同本鸟取大学的学术交流会议( s x t u 2 0 0 7 ) 上进行了内部交 流,该论文荣获西安市第十二届自然科学优秀学术论文一等奖。2 0 0 9 年公开发表在 g l o b a lc o n g r e s so ni n t e l l i g e n ts y s t e m s 。 提出了基于粒子群优化的异步相关滞后步长分析方法。提出了两种针对多传感器系 统最优滞后步长分析的适应值函数,分别为基于相关信息熵的适应值函数与基于相关系 数的适应值函数。实验表明:提出方法不仅能够获得多传感器系统的异步相关滞后步长, 而且能够有效的避免噪声对最优滞后时间的扰动。此外,该算法的收敛速度快。 3 西安科技大学硕士学位论文 作为多传感器相关分析方法的应用,提出了一种快速的分类主特征选择方法。该方 法引入主特征和主特征子集的概念描述被分类对象的关键分类特征,并给出了计算被分 类对象的主特征和主特征子集的方法。其特点是主特征和主特征子集与所采用的分类器 无关。分别对p r o t e i nh o m o l o g y 数据集和w i n e 数据集进行了实验分析。结果显示:利用 数据集的主特征和主特征子集进行数据分类比用数据集的全部属性进行分类的性能要 好。因此基于多传感器相关分析的主特征选择具有实用价值。这一研究结果已投“电子 学报 。 作为多传感器相关分析方法的应用,考虑到矿井中瓦斯浓度之间的耦合关系,以往 的研究是利用全部传感器的信息进行瓦斯涌出量分析。然而,根据多传感器相关分析的 研究结果表明,一个矿井中的全部瓦斯监测传感器组合可能不是一个相关组合。又从主 特征与主特征子集的研究中发现,利用数据集的主特征和主特征子集进行数据分类比用 数据集的全部属性进行分类的性能要好。因此,提出将多传感器相关分析方法应用于煤 矿瓦斯监测数据处理中,解决异常检测与遗失值估计两个问题。采用实际的瓦斯监测数 据,分别以i s g n n 和b p 网络方法进行实验。实验结果表明:多传感器相关分析方法对 解决异常瓦斯监测数据检测和遗失瓦斯监测数据估计两个问题是一种行之有效且具有 研究价值的方法。 开发了基于时间序列数据挖掘的煤矿瓦斯涌出量分析软件原型系统。本文主要开发 了多传感器相关分析模块和瓦斯涌出量预测模块,多传感器相关分析模块使用简单、直 观性好且结合s c c 算法,输出以列表和文字的形式给出k 相关组合和k 相关组合包含 的传感器。瓦斯涌出量预测模块采用多种不同的异常检测和遗失值估计模型,输出以列 表和图的形式给出均方根误差、训练样本时间、精度、漏报率、误报率等。通过曲线可 以看出模型与实际数据的拟合情况。 1 4 本论文的章节安排 本论文共分七章,其中第二章与第三章是理论研究,第四章与第五章是应用,第六 章简要介绍本课题开发的基于时间序列数据挖掘的煤矿瓦斯涌出量分析软件原型系统。 各章的主要内容如下: 第一章是绪论。介绍了本论文的研究背景、研究意义以及国内外研究现状。 第二章运用多传感器相关信息熵的概念研究了多传感器相关组合方法的描述及性 质。为解决随着传感器数目的增加而涉及到的算法计算量过大的问题,提出了一类发现 相关传感器组合的快速算法。 第三章是基于粒子群优化的异步相关滞后步长分析方法。提出了两种针对多传感器 系统异步相关最优滞后步长分析的适应值函数,分别为基于相关信息熵的适应值函数与 基于相关系数的适应值函数。 4 1 绪论 第四章引入主特征和主特征子集的概念描述被分类对象的关键分类特征,给出了计 算被分类对象的主特征和主特征子集的方法。并给出了实验结果。 第五章提出将多传感器相关分析方法应用于煤矿瓦斯监测数据处理中,解决异常检 测与遗失值估计两个问题。并给出了仿真实验结果。 第六章开发了基于时间序列数据的挖掘煤矿瓦斯涌出量分析软件原型系统。 第七章是总结全文。 5 西安科技大学硕士学位论丈 2 快速发现多传感器相关组合的方法 本章运用相关信息熵的概念定义了多传感器相关组合的概念并分析其性质。这一研 究为评价和支持多传感器相关分析和快速算法的实现及应用奠定基础。在此基础上,为 解决随着传感器数目的增加而涉及到的算法计算量过大的问题,提出了一类发现一个多 传感器系统中的相关传感器组合的快速算法。 2 1 研究基础 多传感器信息融合充分利用多个传感器资源,通过对这些传感器及其观测信息的合 理支配和使用,把多个传感器在空间或时间上的冗余或互补信息依据某种准则来进行组 合,以获得被测对象的一致性解释或描述,使该信息系统由此而获得比它的各组成部分 的子集所构成的系统更优越的性能。r i c h a r d s o n 和m a s h 证明应用最优理论综合多个传 感器数据信息总能得到比单个传感器数据信息更好的对象状态估计1 2 引。 相关分析方法已经有着广泛的应用,如医学领域,模式识别领域,图像处理领域等 等。文献 2 3 1 提出基于c c a ( c a n o n i c a lc o r r e l a t i o n a n a l y s i s ) 方法的盲源分离技术并使用这 种技术解决移除脑电图中的肌肉信号问题。文献【2 4 】提出使用c c a 方法来提高具有相关 组成与非相关组成的混合多模型识别系统的性能。文献 2 5 】使用k c c a ( k e m e lc a n o n i c a l c o r r e l a t i o n a n a l y s i s ) 方法解决非线性的模式识别问题,k c c a 方法能有效的处理面部表 情识别问题。文献 2 6 提出使用相关矩阵的特征值来描述多传感器系统中的相关信息熵, 文献【6 】基于相关信息熵理论为解决评估多光谱数据融合方法的性能提出了一种q c a ( q u a n t i t a t i v ec o r r e l a t i o na n a l y s i s ) 方法。q c a 方法可以对不同融合方法的融合性能以数 量的形式直观的展示原始图像与融合图像之间的相互关联程度的强弱。文献 2 8 】提出使 用相关信息熵理论来研究煤矿瓦斯多传感器之间的相互关联程度的强弱。研究多传感器 相关组合及其性质并探讨如何高效的从一个传感器系统中找出所有传感器相关组合是 一个有广泛应用价值的研究领域。然而,目前这方面的研究还相对缺乏。 2 2 相关信息熵 2 2 1 信息熵 信息熵在香农信息理论中是从整个信源的统计特性考虑的,它是从平均意义上来表 征信源的总体信息测度的。熵是对不确定性的度量,熵越大的量就越不确定。 信息熵定义如下: 6 2 快速发现多传感器相关组合的方法 h ( x ) = 一p ( a ,) l o g p ( a , ) ( 2 1 ) t = l 式中口,是信源x 发出的具体符号;p ( a ,) 是符号a ,在概率空间中的概率分布。 信息熵的物理含义归纳如下三点: 信息熵h ( x ) 表示信源x 每发出一个符号所提供的平均信息量; 信息熵h ( x ) 是表示信源x 在没有发出符号前,收信者对信源x 存在的平均不 确定性; 信息熵h ( x ) 反映了随机变量的随机性的大小。 2 2 2 相关信息熵多传感器信息的相关度量 文献 2 6 1 定义了相关信息熵,本小节对此进行简单介绍。需要说明的是,本小节在 数据预处理上做了一些改变。对多传感器系统输出信号时间序列的相关分析等价于对传 感器之间获取的信息特征的相似度量。由于每个传感器的输出量范围不同,在相关分析 时需要对传感器输出时间数据序列中心化和归一化。 设一个多传感器系统具有个传感器,该系统在时刻t ( t = 1 , 2 ,m ) 的时间序列为 p ,不失一般性,设n o砰 0 , 2 ,n 一1 】。如果传感器& + i 添加到,那么结果组合( 即,+ lu s ) 肯定会存在一个h ( 墨,而) 0 ,【2 ,n - 1 】。因此,+ 。u & 也是非相关的。 性质2 3 :任意k 组合的相关信息熵与组合中传感器的排列次序无关。 证明:q = 航( ,) ) l s ,鲥妇,相关矩阵r = q t q 。v 是q 经过任意列变化所形成的 矩阵。 v 2 q 肾,厶j( 2 1 3 ) 其中,点= 【0 9 o9 0 ,1 ,o ,o 】t 是单位列向量。暖,磊】表示由n 个不同的单位列向量任意 排列组成的阶矩阵。由v 组成的相关矩阵 w = v t v( 2 1 4 ) 将式( 2 1 3 ) 代入式( 2 1 4 ) 得 w = ( q 【夤,氨d t ( q 【鼻,孝少 = 陆,氨r q t q 陆90 9 氨】 9 西安科技大学硕士学位论文 w = 匕,氕j rr 畴,知】 ( 2 1 5 ) 根据内积的定义知,如果当= 善,则其内积( 当,善,) = 1 ;如果参善,则其内积 ( 毒,孝,) = o 。因此, 陵,厶r 瓯,厶】_ e 其中e 表示单位矩阵。 高,知r = 匕,乱】。1 ( 2 1 6 ) 将式( 2 16 ) 代入式( 2 15 ) 得, w = 窿,厶】- 1r 畴,厶】 根据相似矩阵的定义和性质得知,相关矩阵w 与相关矩阵r 具有相同的特征值。 又根据相关信息熵的定义知,相关信息熵只与相关矩阵的特征值有关。因此,任意k - 组合的相关信息熵与组合中传感器的排列次序无关。 2 4 一类发现相关组合的快速算法 假设一个煤矿瓦斯监测系统中有n 个瓦斯传感器,最坏情况下,用穷举算法找出其 中全部相关组合的时间复杂度是o ( n n ) ,因此研究时间复杂度低的算法是一个关键的学 术问题。如何有效率的寻找煤矿瓦斯监测系统中全部相关组合的快速算法正是本章的研 究重点。为解决随着传感器数目的增加而涉及到的算法计算量过大问题,提出从一个多 传感器系统中找出全部相关组合的快速算法。 2 4 1s c c 算法描述 根据以上性质,本章提出s c c ( s u p e rc o r r e l a t i o nc o m b i n a t i o n ) 算法,它可以从一个 多传感器系统中快速的找出全部相关组合。s c c 算法的思想由两步构成。 第一步,判断s p k 中任意k 组合是否都在c 风中。如果不满足s p k 任意的k 组合在 c r k 中,那么该超集一定是不相关的( 根据性质2 2 ) 。如果满足s p k 任意的k 一组合在c 风 中,那么该超集可能是相关的,并放入到c k + l 。 第二步,计算c k + l 中各组合的相关信息熵。将满足h r 0 的组合添加到c r k + l 。 其中,c k + l 表示候选( k + 1 ) 相关组合的集合,c 毗表示k 相关组合的集合,s p k 表示 k 相关组合的超集。 构造超集的思想主要依据本章所提出的性质2 1 ,性质2 2 以及性质2 3 。构造超集 的思想是构造超集时所添加的传感器& + 。来源于c r k 中所包含的传感器。此种构造超集 1 0 2 快速发现多传感器相关组合的方法 的思想可以很大程度上提高查找所有相关组合的效率。 结束条件:直到c 凡中包含的传感器个数不大于k 时,或s p k 中所有的组合都不相 关时停止。 2 4 2s c c 算法的实现 图2 1 给出s c c 算法m a t l a b 语言描述的伪代码。第1 步给出初始的k 相关组合k 的初始值。在步骤2 4 步中计算出包含的多传感器数目以及把这些传感器放入到向量v 中。d a t a p r o c e s s i n g 函数用于数据预处理( 步骤5 ) 。在6 2 8 步,找出全部相关组合c r 。 c o r r e l a t i o n c o m b i n a t i o n 过程产生候选k 相关组合c k ,然后根据s c c 算法的定义与性质 从c k 删除那些非空子集包含非相关组合的候选项,最终得到k 相关组合c 戤( 步骤 l1 - 2 3 ) 。对于每个c 风,使用a l l e l e m e n t s 函数找出c 风中所包含传感器c r s e t ( 步骤2 4 ) , 计算出c r s e t 包含的传感器数目并且将c r s e t 中的传感器放入到向量v 中( 步骤2 5 和 2 6 ) 。最后,进行归并操作得到c r 。 程序中的一些函数定义如下: d a t a p r o c e s s i n g ( p ) ,输入参数p 表示原始的多传感器数据。其功能是数据预处理。 该函数返回值为预处理后的多传感器数据q 。 c o r r e l a t i o n c o m b i n a t i o n ( q ,v ,k ,t h r e s h o l d ) ,输入参数q 表示预处理后的数据;v 表示 多传感器系统所包含的传感器;k 表示k 相关组合k 的取值;t h r e s h o l d 为阈值。其功能 是找出多传感器系统中小于阈值的k 组合。该函数返回值是小于阈值的k 组合集合c k 。 a l l e l e m e n t s ( c r k ) ,输入c 风参数表示k 相关组合集合。其功能是找出k - 相关组合 c 凡中所包含的传感器。该函数的返回值是c 轧中的传感器集合c r s e t 。 西安科技大学硕士学位论文 2 快速发现多传感器相关组合的方法 2 4 3s c c 算法的复杂度分析 具有刀个传感器的多传感器中,使用穷举法进行多传感器相关分析,当所有传感器 彼此之间全部相关情况下的时间复杂度为0 ( 2 ”) 。当所有的传感器彼此之间相互独立情 况下的时间复杂度为o ( n 2 ) 。 穷举法仅找出所有小于阈值的传感器组合就需要罗口= 2 ”一聆一1 次。( 1 + x ) ”= c k n x ,当z = l 时噼= ( 1 + 矿= z ,故,q + q + + g = 2 ”- n - 1 。随着传感器数 目的增长,所需要的查找次数会显著增加。 然而,使用s c c 算法进行多传感器相关分析,查找c 风的次数依赖于c r k - l 中所包 含的传感器数目。具体而言,假定e 是c 砒1 所包含的传感器数目,其中e 胛。为找出 c 凡所需要的查找次数为口,查找次数依赖于e 。当所有传感器彼此之间全部相关的情 况下,找出c r 需y 群次。当所有传感器彼此之间相互独立的情况下,找出c r 仅需 次。当所有传感器彼此之间部分相关的情况下,找出c r 的次数介于q 与y 碟之间。 图2 2 是s c c 算法比较次数。 一 j ,全静 查 找 次 数 , 部分 ? 。, 名二一一堋互 传感器个数 图2 2s c c 算法的比较次数 相关 相关 独立 本章使用s c c 算法对人工合成数据与煤矿瓦斯多传感器监测数据分别给出具体的 实验。 2 5 实验结果 实验数据分别来源于人工合成数据和真实数据。为了验证算法的效果,分别采用穷 举法和s c c 算法将找出的全部相关组合进行对比。实验环境为:主频2 2 0 g h z 的p c 机,内存2 g b ,w i n d o w sx p 操作系统;编程语言为m a t l a bv e r s i o n7 0 1 。 1 3 西安科技大学硕士学位论文 2 5 1 人工合成数据实验 实验数据集d = 少l ,y 2 ,y 3 ,y 4 ,y 5 ,y 6 ,y 7 ,y s ,其中y 1 = s i n ( t ) ,y 2 = s i n ( z + f ) , y 3 = s i n ( 2 n + f ) ,y 4 = s i n ( 3 n + f ) , y 5 = s i n ( 4 万+ t ) ,y 6 = t a n ( t ) , y 7 = t a n o r + ,) , y 。= t a n ( 2 x + f ) 。为了下文讲述方便,分别将这8 个变量的编码对应为:1 ,2 ,3 ,4 ,5 , 6 ,7 ,8 。选取参数f 从l 到1 0 0 ,取固定步长o 0 1 。实验数据集d 共有1 0 0 0 x 8 个数据, 其中1 0 0 0 个采样点,8 个变量。本小节实验阈值0 = o 0 5 。 ( 1 ) 理论分析 s i n ( t ) 函数是以2 万为周期的周期函数,t a n ( t ) 函数是以万周期的周期函数。 c o r r 2 ( v 。,v :) 表示变量v 。与变量v :之间的相关系数。现在我们对实验数据进行相关分析。 当c o r r 2 ( s i n ( t ) ,s i n ( 2 k z + f ) ) = 1 ,k = 1 , 2 ,玎,此种情况下为完全相关,具有很强 的相关性。 当c o r r 2 ( s i n ( t ) ,s i n ( k x + ,) ) = 一1 ,k = 1 , 2 ,2 ,此种情况下为完全负相关,也是 具有很强的相关性。 当c o r r 2 ( t a n ( t ) ,t a n ( k 7 r + r ) ) = l ,k = 1 , 2 ,n ,此种情况下为完全相关,具有很强 的相关性。 当c o r r 2 ( s i n ( t ) ,t a n ( t ) ) = 0 0 0 1 5 ,k = 1 , 2 ,玎,此种情况下为相关程度很弱,可以 说此种情况下彼此之问不存在相关性。 根据以上分析可以得出s i n ( t ) 与s i n ( 2 k x + f ) 之间都具有强的相关性;t a n ( t ) 与 t a n ( x + f ) 之间也都具有强的相关性;然而,s i n ( t ) 与t a n ( t ) 之间的相关程度很弱。 ( 2 ) s c c 算法实验结果 采用s c c 算法找出的全部相关组合如表2 1 所出。这与相关理论分析得出的结果是 一致的。从表2 1 可以看到, 1 ,2 ,3 ,4 ,5 组合是最大相关组合。s c c 算法不仅可以找出 所有的相关组合,而且可以找出最大相关组合。 表2 1 使用s c c 算法找出的所有相关组合 k 相关组合k 相关组合的集合 2 相关组合 3 相关组合 4 相关组合 5 相关组合 l ,2 ; l ,3 ) ; l ,4 ) ; 1 , 5 1 ; 2 ,3 ) ; 2 ,4 ; 2 ,5 ; 3 ,4 ; 3 ,5 ; 4 ,5 ; 6 ,7 ; 6 ,8 ; 7 ,8 1 , 2 ,3 ) ; 1 ,2 ,4 ; 1 , 2 ,5 ) ; 1 ,3 ,4 ; 1 , 3 ,5 ; 1 ,4 ,5 ; 2 ,3 ,4 ) ; 2 ,3 ,5 ; 2 ,4 ,5 ;3 ,4 ,5 ; 6 ,7 ,8 l ,2 ,3 ,4 ) ; 1 , 2 ,3 ,5 ) ; 1 , 2 ,4 ,5 ; l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 河北单招试题及答案英语
- 激光光源调制技术的研究进展试题及答案
- 系统架构设计师考试的宗旨与目标结合点的系统分析及实践经验总结试题及答案
- 电工识基础图试题及答案
- 生物设备管理试题及答案
- 科普知识公共卫生考试试题及答案
- 激光技术工程师证书考试基础知识与试题答案
- 江苏邮局笔试题目及答案
- 系统架构设计师考试的可持续发展理念试题及答案
- 西医临床提升方案试题及答案讨论
- 国开电大软件工程形考作业3参考答案
- 通用电子嘉宾礼薄
- 国家开放大学《会计学概论》形考任务1-4参考答案
- 统编版四年级道德与法治下册第8课《这些东西哪里来》精美课件(含视频)
- 停车场应急预案
- 手术质量与安全分析报告模板
- 研究生在读证明.docx
- 卡农曲谱canon-in-D-钢琴小提琴合奏-五线谱(共6页)
- 常用药物配伍禁忌表
- 2020年度希望之星英语大赛小低组看图说话(图文五篇
- B+WASI网关使用手册-第10章节
评论
0/150
提交评论