下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于非线性降维特征映射的煤与瓦斯突出序贯最小优化算法
煤和严肃的风险预测受到煤和气的严重威胁,制约着矿山经济效益的提高。预测阿德尔和煤和严肃的风险是确保煤和硬件安全生产的重要前提。煤和严肃的发生是由多因素引起的。例如,地应力、高压氧和坏煤结构性能、地质结构、煤厚变化、煤结构和围岩特征。它的生成机制是复杂的、模糊性和不确定性,这给煤炭和庄重的预测带来了很大困难。1煤与瓦斯突出危险性预测模型的改进随着现代科技的发展,特别是数学方法和计算机技术的应用,煤与瓦斯突出的分析方法有了长足的发展,目前已有许多先进理论和复合方法如灰色系统理论、支持向量机、层次分析、模糊识别理论和神经网络等应用于其分析与预测中,并取得了一定的研究成果.不同预测方法使用的参数不同,有的只有几个,有的多达十几个,甚至更多.高维特性带来的维数灾难问题和非线性特征引起的线性模型失效问题,使得现有的煤与瓦斯突出预测方法在实际应用中受到限制,预测结果的准确性存在一定的偏差.等距特征映射(Isometricfeaturemapping,Isomap)是一种新的非线性降维技术,它从样本局部出发,用标准多维尺度变换算法获得保持样本间测地距离不变的低维流型.序贯最小优化(SequentialMinimalOptimization,SMO)算法是一种改进的SVM训练算法,能够快速有效地解决二次规划问题.本文在前人研究的基础上,提出一种将Isomap和SMO相结合的方法,记为Isomap-SMO,并利用该方法对煤与瓦斯突出危险性预测研究做了一些有益的探索.该方法先对煤与瓦斯突出的各影响因素进行Isomap变换,降低其维数并突出有效特征信息,然后再利用SMO算法建立煤与瓦斯突出的危险性状态预测的数学模型,并通过该模型对煤与瓦斯突出的危险性状态进行预测,取得了较好的效果.实验同时将所得的结果和广泛使用的线性降维主成份分析(PrincipalComponentAnalysis,PCA)方法降维后的预测结果相比较,发现Isomap具有更好的降维能力,这说明了非线性降维技术在地学数据分析中具有一定的应用潜力.2自主模式算法2.1多—Isomap算法2000年Tenenbaum等学者首次在science提出Isomap算法,它是针对非线性数据的一种新的无监督降维方法,来源于传统的降维算法多—维标度法(multi-dimensionalscaling,MDS),结合了PCA和MDS算法的主要特征:计算有效性、全局的优化性和渐近收敛性,且比较灵活地学习到数据点的非线性结构.用测量距离代替传统方法的欧式距离,较好地揭示了高维数据集的自由度.该算法核心是估计两点间的测地距离:距离近的点间测地距离用欧氏距离代替,距离较远的点间测地距离用最短路径来逼近,这种方法更有效地在低维空间表达高维空间的数据,减少降维后损失的数据信息.2.2采用了二次规划优化方法SMO算法基本思想是将工作样本集的规模减到最小,仅有两个样本.由于子问题的优化只涉及两个变量,它在每一步迭代过程中选择两个变量进行调整,固定其他变量,通过求解最优化问题,得到这两个变量的最优值,来更新相应的Lagrange乘子,所以迭代过程中每一步子问题的最优解可以直接用解析的方法求出来,而不用在算法的迭代中求解二次规划问题.SMO算法设计一个两层嵌套循环:外层循环首先遍历非边界样本,确定哪些样本违反Karush-Kuhn-Tucker(KKT)条件并以此来进行调整,当所有的非边界样本都满足KKT条件后,再在整个样本空间循环一遍,来检验所有的样本是否都满足KKT条件,直到所有的样本点都满足该条件.而内层循环则是针对以上违反KKT条件的样本来选择另一个样本与它配对优化,其选择的准则是使所选择的样本能够对决策函数得到最大的优化步长.SMO算法最大特色在于它采用的解析方法避免了二次规划数值解法的迭代过程,因此避开了复杂的数值求解优化问题,大大减少了计算复杂度,在速度和精度方面都得以保证,在内存方面它也颇具特色,SMO使用的内存是和样本集大小成线性增长,这使存储空间问题不再是瓶颈.2.3自主模式算法的结构本文提出的Isomap-SMO算法框架描述如下:2.4煤与瓦斯突出的预测模型煤与瓦斯突出是一种典型的复杂非线性动力系统,受到很多因素的影响,给煤与瓦斯突出预测带来极大的困难.控制煤与瓦斯突出的因素众多,其中地质构造因素是控制瓦斯突出发生的主导地质因素.地质构造类型、规模、性质、疏密程度、排列组合以及构造部位等的差异,对瓦斯突出均有不同程度的影响.煤层因素包括煤层厚度、煤层倾角、软分层厚度和煤层埋藏深度,煤层越厚特别是软分层越厚突出越频繁,突出次数和突出强度也相应增多.受煤自重影响,倾角越大的煤层越容易发生突出,突出的次数随着煤层倾角增大有增多的趋势.强烈破坏的松软煤层,由于强度低,极易发生煤与瓦斯突出.地应力由岩层自重应力和构造应力组成,构造应力在突出中起重要作用,是构造带发生瓦斯突出能量的重要组成部分.煤与瓦斯突出前总是伴随一些特征,这些特征是预测煤与瓦斯突出的依据之一.突出特征主要有巷道顶板来压、掉渣、片帮、响煤炮、闷雷声、瓦斯压力增大、喷孔、顶钻、卡钻等.发生突出前并非所有特征同时出现,而是出现其中一种或某几种预兆.人们提出了很多假说来探讨煤与瓦斯突出的机理,但大都认为:煤与瓦斯突出是地应力、瓦斯和煤层因素以及地质构造因素等综合作用的结果.从上述影响因素中取n个因素研究,把每一个因素看作一个向量的元素,那么,n个因素就组成一个n维向量,n个因素的每一种组合就是一个n维向量样本,在n维特征(即影响因素)空间唯一对应一个位置.理论上同类样本在特征空间相距较近,不同类的样本相距较远.如果用某种方法分割空间,使得同一类样本大体在特征空间的同一个区域中,则可实现类别划分.用SMO方法划分特征空间,使得煤与瓦斯突出危险类与非突出危险类的样本位于两个不同的区域.对于预测样本,就可根据它的特征向量位于特征空间的哪一个区域而判定它属于突出危险类或非突出危险类.由于影响煤与瓦斯突出的因素众多,突出机理和各因素之间的相互制约关系错综复杂,影响因素具有高度的不确定性,若直接将这些影响因素作为模型的输入,必然包含大量的冗余信息,所以本文先将这些影响因素用Isomap方法进行压缩,然后再将压缩后的变量作为SMO模型的输入.结合前文介绍的Isomap和SMO算法,即可建立Isomap-SMO的煤与瓦斯突出危险性状态预测模型.建模原理如图1所示.本文以降维后的I1,I2,…,Im来代替样本中的原始输入变量x1,x2,…,xn,进行支持向量机SMO的训练,降低了样本空间的维数,且消除了原样本空间的自相关性.3自主模式算法和smo3.1输入参数选取本模型采用与文献相同的数据进行建模和预测,该数据选取矿井历年煤与瓦斯突出记载资料,该资料来源于1995年的涟邵矿务局煤与瓦斯突出评价.包括突出点地质特征、突出预兆、突出位置(煤巷、上山、石门揭煤)、预测指标值等.输入参数是指影响突出的主要因素,由于突出本身是一个复杂的动力学过程,影响因素多且因地区而异,为了减少系统规模,使系统学习难度和复杂性减小,在建立预测模型时,先剔除一些不可靠的数据源,采用煤层地质特征、钻孔瓦斯动力特征、突出敏感性指标等来综合判断,最终选取地质构造、煤层倾角变化、K1、Smax、D、K等17个指标作为本模型的输入,建模数据如表1.3.2基于smo算法的数据降维优化本实验使用平台是PC(PentiumⅣ,3.06GHz中央处理器,512Mb内存),操作系统是WindowsXP.Isomap程序用Matlab语言编制,在Matlab7.0平台上运行,SMO程序在WEKA平台上运行.在煤与瓦斯突出影响因素属性进行数据降维处理过程中,Isomap算法近邻点k的选取起了关键的作用,k值过小,会使图不连通,过大会使Isomap算法趋于MDS算法,k值的选取直接影响预测精度的高低.近邻点k的最优值是能够保证图连通的最小值,本实验经过参数选择,最终确定用k=6构造近邻图.SMO算法选择多项式核函数:K(x,xi)=[(x·xi)+c]q,c取1.0,其它参数都选择默认参数.3.3实验结果及分析如果对训练数据不做降维预处理,用SMO算法训练样本实例1—12条数据,并用样本实例13—15来测试煤与瓦斯突出危险性,实验结果预测错误2个,预测正确1个,当对原始输入数据进行非线性降维,只剩下七维输入变量属性时,再对测试数据重新进行预测,分类的结果如下:预测值的详细分类结果如表2所示,13、14工作面为有突出危险,15工作面无突出危险.分类结果的预测值与实际情况完全一致,可见该模型识别与实际是完全符合的.为客观地比较PCA降维和Isomap降维后SMO的分类结果,再对表1的所有数据采用十折交叉验证法进行实验,即将表1数据随机分成10份,从一组数据中取出一份作为测试集,其余的样本作为训练集,然后取下一份作为测试集,剩余的作为训练集,重复运算直至计算完所有的数据样本,本文对表1的数据重复做十次实验,取十次实验预测精度的平均值做为最终预测精度.采用SMO算法对Isomap和PCA两种降维的结果分别进行预测,实验结果如图2所示.图2的横轴表示对原始数据经过Isomap非线性降维和PCA线性降维的维数,纵轴表示对降维后的数据用SMO算法进行十折交叉验证后的分类精度.由图2可知,原始数据用SMO算法经过十折交叉验证后,分类的精确度是89%.当经Isomap算法将煤与瓦斯突出的影响因素降维后,分类精度有了较大的变化,随着主分量的增加,经过Isomap-SMO方法降维后十折交叉验证后的分类精度从3维变量的85%增加到5维变量的93%,至7个变量时,分类精度高达96%.随着次分量的增加所引入的噪声会反映到某些独立分量中,使识别性能下降,分类精度略有下降.当特征值较小的主分量(即次分量)增加到接近未降维的原始数据时,Isomap-SMO方法的分类识别率反而要略低于PCA-SMO方法.根据图2比较可以得出Isomap-SMO的分类预测结果大都高于PCA-SMO的预测结果,其预测精度明显优于PCA-SMO方法,从而检验了在煤与瓦斯突出预测方面Isomap非线性降维的有效性与可适性.4基于isomak的煤与瓦斯突出危险状态识别方法目前有很多降维方法,但大部分是基于线性的方法,这些方法并不能很好地保证样本的非线性特征.Isomap来源于传统的MDS,该方法利用样本向量之间的最短距离计算出用于取代传统欧式距离的测地线距离,然后运用经典的MDS算法构造新的低维空间,最大限度地保证样本之间的距离,以达到降维的目的.该方法真实地再现了高维数据内在的非线性几何特征,是一种十分有效的降维方法.对于煤与瓦斯突出的各种影响因素这种高维数据,Isomap非线性降维算法具有独特的优点,它将样本向量之间的欧式距离转换为测地距离,重现样本空间内在的几何结构.笔者提出的基于Isomap的SMO煤与瓦斯突出危险状态识别方法,利用了Isomap在特征提取方面的非线性优势,能很好地保留各类煤与瓦斯突出影响状态的拓扑结构,减小了识别误差.在识别方法方面,笔
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度房地产项目补充协议合同范本3篇
- 二零二五年度出口代理服务合同模板(含知识产权保护条款)2篇
- 二零二五年临时动物保护员服务合同协议3篇
- 2025年外卖配送员劳动权益保障与职业培训合同3篇
- 2025年度智能社区物业管理平台开发与后续服务合同3篇
- 二零二五年度二手挖掘机买卖合同智能设备配套3篇
- 二零二五年度国际品牌国内加盟合作协议2篇
- 二零二五年度旅游安全责任保障合同
- 二零二五年度房屋拆除项目拆除物处置与环保达标协议3篇
- 二零二五年度新型建筑机械租赁服务合同范本3篇
- 江苏省苏州市2023-2024学年高一上学期期末学业质量阳光指标调研语文试卷
- 大学军事理论课教程第三章军事思想第四节当代中国军事思想
- 开展学科周活动方案
- 园林景观给排水设计汇总计算书
- 《电线电缆常用计算公式》
- 关于心理健康教育情况的调研报告
- 内侧蒂直线短瘢痕法治疗乳房肥大症的临床研究
- 天一大联考2024届物理高一上期末学业水平测试试题含解析
- 整改回复书样板后边附带图片
- 空气能施工方案
- 常见藻类图谱(史上最全版本)
评论
0/150
提交评论