试论数据挖掘在化学研究生产中的应用论文_第1页
试论数据挖掘在化学研究生产中的应用论文_第2页
试论数据挖掘在化学研究生产中的应用论文_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、资料来源:来自本人网络整理!祝您工作顺利!试论数据挖掘在化学研究生产中的应用论文 近年来,数据挖掘引起了信息产业界的极大关注,其主要缘由是存在大量数据,可以广泛用法,并且迫切需要将这些数据转换成有用的信息和学问。猎取的信息和学问可以广泛用于各种应用,包括商务管理,消费掌握,市场分析,工程设计和科学探究等。以下是我为大家细心预备的:试论数据挖掘在化学讨论消费中的应用相关论文。内容仅供参考,欢送阅读! 试论数据挖掘在化学讨论消费中的应用全文如下: 1 引言 化学是一门讨论化合物组成、性质以及改变的一门学科。在长期的化学、化工试验中产生了大量的数据,但是数据的海量增加却造成了诸如信息过量、信息平安隐

2、患、信息真假难辨等困难。同时,这些海量的数据内部存在着许多有价值的信息和规律,如何从这些数据中发觉更多更有价值的信息和规律也成为化学、化工专家关注的焦点,需要是创造之母,面对这一要求,数据挖掘技术在化学、化工中的应用也就应运而生,并显示了强大的生命力。在化学领域内,数据挖掘理论和算法的进展,极大地促进了计算机化学、化学计量学和化学信息学等新学科的进展。本文就针对数据挖掘方法在化学、化工各方面的应用进展简述。 2 数据挖掘的概述 数据挖掘(data mining),是数据库学问发觉(kdd, knowledge-discovery in databases)中的一个步骤。数据挖掘一般是指从大量的

3、数据中通过算法搜寻发觉隐藏于其中的规律和信息的过程。近十年来,数据挖掘技术不管是在理论上还是在实际应用上,都已获得了很大的进展1,同时也出现了各种专用或商用的数据挖掘软件。 数据挖掘领域利用的主要思想有:统计学的抽样、估量和假设检验;人工智能、形式识别和机器学习的搜寻算法、建模技术和学习理论。数据挖掘同时也快速地接纳了最优化、进化计算、信息论、信号处理、可视化和信息检索等领域方面的思想。目前,常用的数据挖掘方法主要有以下几种:数学统计方法、决策树、形式识别方法、人工神经网络方法、遗传算法、粗糙集方法、支持向量机方法等。 3 数据挖掘在化学与化工消费中的应用 数据挖掘利用多学科领域的学问从全新的

4、角度以及更深层次中开掘存在于海量信息内部有效的、新颖的形式。在化学与化工消费中利用这种数据挖掘技术可从化学和化工消费数据中查找潜在的规律,同时利用这些规律指导企业的消费过程,最终实现消费过程的优化以及企业效益的最大化。 3.1 中草药成分分析中的数据挖掘 方兆华等对化装品专利中草药成分利用关联规章进展分析,得出化装品中有当归、白芷和芦荟等高频单味药,有当归-川芎等高频药对,有芦荟-芝麻-向日葵子等高频药组;基于置信度和支持度分析,得到了化装品中中草药应用的13 条强关联规章,如向日葵子-芝麻等。陆爱军等利用关联规章对中医药效、植物科属、化学的成分活性、中药提取物和现代药理之间的互相关系进展讨论

5、,在分析之前对数据进展预处理,然后再对处理后的数据进展挖掘,从而得到一些好玩的关联规章,比方中药药效和植物科分类的关联规章,都是因为在该科下面的植物许多具有相应的中药药效。 3.2 化学讨论中的数据挖掘 朱建国分析了数据的详细特征,采纳id3 的决策树算法将数据的离散化和属性选择进展预处理,使决策树树状构造的分类器对数据能进展更有效的分类。通过二苯乙烯系列化合物试验数据的建树过程,以及对所得到的规章进展分析,将决策树有效地运用在二苯乙烯系列化合物讨论过程中,并开发方案实现系统让讨论者可以清楚地表达分类规章,从而给讨论者带来了极大的便利。 李峰等将数据挖掘应用在稀土掺杂纳米tio2构造与光催化活

6、性的关系中,用多元逐步回来分析对数据样本间的联络进展挖掘,从而发觉构造参数与光催化剂的表观速率常数间之间存在着良好的相关性,其相关系数大于0.99,说明该模型具有良好的稳定性和预报力量。溶胶-凝胶法制备的不同稀土掺杂纳米tio2不管是试验结果还是计算机模拟结果都说明其纳米构造相像,光催化活性是相近的,对于系列光催化剂制备及其动力学性质讨论都能较好地建立起定量构效关系,进而通过xrd参数测试,发觉活性相近的催化剂,为选择高效的光催化剂节省资源。 ru等人提出了一种称为bsvr(boosting support vector regression)的方法,该方法支持向量回来,以boosting 结

7、合支持向量回来(svr)为分类器,继而用它来处理硝基苯类,并且将其用作5-脂肪氧化酶抑止剂的1-phenyl2h-tetrahydro-triazine-3-one类化合物的qsar数据预报毒性,试验结果说明这种方法在病毒性预报的精确性方面有明显的进步。 cai 与feng 等人提出了一种称为logistboost 的算法,该算法基于对数回来策略,可以对蛋白质构造数据(基于氨基酸序列)的二类、多类分类问题进展预报,试验结果说明这种算法具有很好的预报结果。boosting 算法在蛋白质构造分类方面的预报应用是以构成蛋白质的氨基酸种类、排列挨次作为主要属性对蛋白质的二级构造进展推断。随着数据挖掘在

8、化学中的应用,boosting算法有望可以对蛋白质的3d构造进展预报。friedman 等人提出了梯度boosting 算法,该方法在回来问题上挺直应用boosting 算法,从而有效解决了数据挖掘中在化学应用中回来问题上常见的问题,而tao 等人提出的新boosting算法那么可以有效解决数据挖掘在化学应用中异样值的检测问题。 3.3 化工消费中的数据挖掘 张泉灵等利用多支持度关联规章的挖掘算法,开发了化工消费过程的数据挖掘软件,通过数据挖掘软件对操作参数和配方进展优化,使产品的收率和有效成分得到进步,并将该系统应用在三唑磷的合成过程中,使三唑磷进步了1.5%的收率,同时三唑磷的含量也进步了

9、三个百分点,从80%进步到83%,为企业带来了较好的经济的效益和社会效益。 陆治荣等利用数据挖掘方法开发了适用于消费过程优化、故障诊断、优化新产品研制和配方设计的系列软件dmos,该软件为化工、炼油等行业消费过程优化的工程化运营制造了条件,并将该系统应用到某石化厂,主要解决丙烯的收率不能满足下游消费的问题,更重要的是回收的丙烯收率的进步可以进步经济效益,结果说明经过dmos数据挖掘后提出了新的消费参数,对原来正常的消费状态进展优化后进步了丙烯的收率,优化后丙烯的收率从14.7%进步到了19.11%。 基于合成氨消费效益的数据挖掘,用于解决氨合成装置dmos合成氨优化系统,用于解决合成氨工业消费

10、参数的优化,实现氨合成装置消费时实时工况诊断、实时趋势扫瞄、优化操作指导、报表生成等功能。通过对云维集团有限公司氨合成装置合成塔生成数据的数据挖掘,找出了影响装置目的变量的主要工艺参数,建立目的变量与有关工艺参数间的数学模型,通过试验说明所建模型的牢靠性强,可以优扮装置工艺操作,进步合成氨产量,全面进步企业的经济效益。 3.4 化学分类中的数据挖掘 李琳等15利用决策树对玻璃和葡萄酒进展分类,玻璃有9 个属性作为衡量指标,葡萄酒为意大利某地的三种酒、含有13 个属性作为分类指标。他们首先用法mdlp(最小长度描绘方法)进展离散化,再用lvf(lasvegas filter)方法进展属性选择,剔除冗余数据后,再由c4.5 方法构建决策树。通过试验说明:由决策树建成的分类模型具有良好的预报性能,合适于化学分类学问形式的挖掘。基于预处理的决策树克制了一般决策树方法难以处理连续型数据集的缺点,又具有其它方法所不具备的优势,可从大量数据中挖掘出潜在的分类学问,并具有简沽直观的表达形式,易为专业人员理解和分析。 4 结论 本文对数据挖掘方法在化学和化工消费过程中如何利用海量数据、发觉和挖掘出新的规律和信息,为化学讨论和化工消费供应有效精确的根据。虽然数据挖掘技术在化学和化工消费过程中获得了大量应用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论