信息与信息技术导论报告_第1页
信息与信息技术导论报告_第2页
信息与信息技术导论报告_第3页
信息与信息技术导论报告_第4页
信息与信息技术导论报告_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中 国 地 质 大 学 ( 武 汉 ) 信 息 与 信 息 技 术 导 论 报 告 题目 化学信息学的研究和应用 姓名 宋军勇 班级 031101-18 学号 20101002706 院系专业 应用化学 指导老师 马钊 化学信息学的研究和应用 作者:宋军勇 摘要:本文叙述了目前化学领域的发展热点之一化学信息学( Chemoinformatics) 的 发展概况, 从信息学角度对其产生、成长及未来发展趋势进行了探讨。 关键词:化学信息学 化学信息 计算机技术 化学信息学的产生背景 化学信息学是一门应用信息学方法来解决化学问题的学科。20 世纪中后期, 伴随着计 算机技术的发展,化学家开始意识到, 多年来所积累的大量信息, 只有通过计算机技术才能 让科学界容易获得和处理, 换言之,这些信息必须通过数据库的形式存在才能为科学界所用。 1973 年, 由 NATO 高级研究所夏季学校在荷兰 Noordwijkerhout 举办的一次研讨班, 首次 将在不同化学领域工作, 但都是采用计算机方法处理化学信息, 或是用计算机技术从化学 数据中获取知识的科学家集中在一起, 这次研讨班的名称就定为“化学信息学的计算机表 征与处理” 。参加这次会议的科学家主要从事化学结构数据库、计算机辅助有机合成设计、 光谱信息分析和化学计量学等方面的研究。研讨班期间, 这些化学家意识到, 一个新的研 究领域已经形成, 而且它隐含在化学各分支之间。从那之后, 应用于化学问题的计算机科 学和信息学方法悄然进入了化学的各个领域。诺贝尔化学奖获得者法国化学家 J.M.Lehn 教授 1987 年首次提出“化学信息学”的概念。之后, 国外一些大学开设了化学信息学课 程并确定为研究生的研究方向, 从事研究、管理和开发化学信息的团体、机构和公司也相 继出现。在国内, 化学教学指导委员会已将化学信息学列入化学教学的基本内容, 北京大 学化学学院已设课并编写了讲义, 南京大学、复旦大学、中国科技大学等校也已开设相关 课程。近十多年来, 由于计算机及网络技术向智能化、网络化方向发展, 使得应用计算机 技术能解决的化学问题越来越多, 化学工作者获得了关于物质结构大量而精确的信息。计 算机技术与化学之间的相互渗透已成为化学和计算机科学工作者的研究热点。由于计算机 主要是用数学的方法通过计算来解决问题, 而化学是对化学物质进行认识、分析、合成及 利用, 因而两者的结合前所未有地使化学工作者达到对物质化学结构的解析、表征、计算 机模拟与分子设计等。 化学信息学的定义 1987 年 J. M. Lehn 教授首次提出化学信息学的概念以后并没有进一步深入研究这一 概念的本质 , 但我们可以看出, 当时化学信息的内在含义应为分子间的相互作用或相互识 别的有关信息, 而化学信息学应为研究分子间相互作用实质或识别机理的一个学科, 主要 目的是为解释超分子的形成过程提供依据。化学信息学这一名词是随着 Internet 的普及 和生物信息学等相关学科的发展而被广泛接受的。因此, 无论是化学信息的含义还是化学 信息学的内容均有了较大的发展。化学信息学的内容更加强调了化学文献、化学信息数据 库、特别是 Inter-12net 中的化学资源等内容。 我们对化学信息学的定义为: 化学信息学是近几年发展起来的一个新的化学分支, 它 利用计算机和计算机网络技术, 对化学信息进行表示、管理、分析、模拟和传播, 以实现 化学信息的提取、转化与共享, 揭示化学信息的内在实质与内在联系, 促进化学学科的知 识创新。0 首先, 化学信息学是化学学科的分支学科, 其研究对象和研究目的均属于化学 的学科领域。它的研究手段为计算机技术和计算机网络技术, 研究内容则包括如何利用计 算机和计算机网络技术对化学信息进行表示、管理、分析、模拟和传播等。最后, 化学信 息学的目的是为了实现化学信息的提取、转化以及化学家之间的资源共享, 从而为促进化 学学科的发展与知识创新作出贡献。 在上述定义中, 化学信息包括两大类: 即化学物质的化学信息和媒体形式的化学信息。 前者是利用科学的原理和方法通过测量得到的化学成分的相关信息, 如物质的物理、化学 性质,物质中各成分的定性、定量以及结构信息, 分子间的相互作用信息( 包括化学反应信 息) 等。而后者是化学信息的记录形式, 如书籍、文献、专利、数据库以及音像资料等, 通过化学信息的传播使化学家们共享测量的原理、方法及测量结果。 化学信息学的结构特点 刘冀昆等发现化学信息学的主体部分实际上是由三个层次构成的, 即信息核心层、信 息处理层和信息表示层。三个层次中最重要的层次为信息核心层, 它在化学信息学中处于 基础核心地位, 并决定了其它两个层次的构成。核心层对外层起着决定性作用, 外层对核 心层也能够产生一定的影响。另外, 化学信息通过“信息采集接口”从化学实践中获取原 始信息, 原始信息经过接口的处理后, 以数字化形式存储到信息核心层中, 并通过外层将 其重现出来给 化学工作者, 如图 1 所示。信息采集接口也是化学信息学中一个极为重要的组成部分, 它 是现实化学世界通往信息化学的桥梁。信息采集接口和信息化学的三个层次构成了整个化 学信息学。 化学信息学的应用方法 化学信息学有其独特的解决化学问题的方法, 主要可以分为三大类: 基于数据、基于 逻辑和基于原理。第一类主要是指建立多种数据库管理系统和数据库, 利用其中的数据; 第二类主要是利用已有数据库中的数据, 并在此基础上, 利用归纳、推理和分类等方法将 数据转化成知识, 并对知识实施有效的管理, 以便于知识得到广泛地应用; 第三类主要是 利用已有的量子化学的理论,对相关的化学问题开展研究。其中, 就前两类方法而言, 它们 注重于适用大量的化学信息( 整体) 的分析处理, 其核心在于化学结构的分析比较、相关 物化性质的分析处理方法和应用研究。而第三类方法主要注重化合物个体的相关性质精确 分析的方法及其应用研究。这三类方法的合理组合将对化学家开展相关研究起到辅助作用, 促进化学界的研究方法和工业界的生产方式不断革新。 化学信息学在社会与经济可持续发展中的地位与重要性 随着化学信息的大量积累及计算机与网络技术的飞速发展, “化学信息学”已成为化学 学科的重要分支之一,在社会与经济发展中发挥着越来越重要的作用。近年来,分子模拟、 计算机辅助药物设计、虚拟筛选(VHTS)和定量构效关系(QSAR)等化学信息学技术的引入, 推动了生命科学和生物医药领域的发展,促进了新药的研发和创制。理论化学在理解物质 结构和性质、解释化学反应机理等方面取得了飞速发展,在结构化学、材料科学和生命科 学领域中发挥着不可替代的作用。由于化学计量学方法与技术的发展,近红外光谱(NIR)技 术得到了广泛应用,已成为复杂体系分析、产品质量评价与控制、环境检测与控制、生命 与健康等领域的关键技术之一。同时,复杂信号和高维分析化学信号的解析技术推动了分 析化学的发展,大大增强了分析化学解决实际问题的能力。此外,化学软件、数据库以及 网络技术的发展对推动化学信息的搜索与共享、化学信息的深层挖掘与知识发现等发挥了 重要作用。 近些年化学信息学的研究进展 理论与计算化学是化学信息学的传统研究内容,近两年量子化学得到了广泛研究,在 理论方法、程序以及应用等方面都取得很大进展。碎片分子轨道(FMO)方法被用于处理大体 系,极化连续模型(PCM)、普通液体优化边界模型(GLOB)等一系列新方法被应用于计算溶液 中的光谱。理论化学计算与实验相结合用于合成化学和材料设也得到了很好的效果。基于 分子力学的分子模拟技术得到发展,并在物理化学性质的预测方面发挥了重要作用。分子 动力学是分子模拟的重要手段,分子动力学新方法的引入加快了计算速度,经典的全原子 动力学模拟与粗化晶粒模拟的共同发展使模拟的对象扩展到微米尺度以及毫秒时间级别, 从而使模拟成为预测体系性质及解释实验现象的有效工具。新的优化算法不断涌现,粒子 群优化算法用于团簇的结构优化,无偏优化算法实现大尺寸团簇的结构优化,合金团簇的 结构优化方法得到了进一步的完善。 复杂体系信号解析一直是化学计量学的主要研究内容之一,近年来信号解析的复杂程 度不断提高,在指纹图谱研究的基础上已经逐渐向“组学(omics)”方向发展,同时,信号 解析已成为反应机理等研究的有效手段。另一方面,独立成分分析以及免疫算法的改进与 发展,不仅发展了新的方法,而且使复杂体系的高通量分析成为可能。高维数据的解析方 法研究继续得到了高度重视,从一维到三维数据的发展使数据分析具有明显优势,同时四 维数据的解析方法也得到了发展。高维数据的解析方法在复杂体系分析中的应用明显增多, 在组学数 据分析、环境样品分析等实际复杂体系分析中的作用逐步得到体现。化学计量学还促进了 光谱分析技术的发展17,使生理样本中葡萄糖浓度及无创血糖检测技术得以建立,近红 外光谱用于过程分析和药理代谢组学研究也得以提出并得到应用。基于网络的信息获取与 共享一直是化学信息学的研究内容之一。通过网络技术实现计算资源的共享及提供大规模 计算的用户接口22,23在近两年得到了快速发展。 我国化学信息学研究的地位与近期研究进展 近两年来,我国的化学信息学研究得到了快速发展,在某些专题的研究方面达到了国 际前沿水平。在理论与计算化学研究中,基于第一性原理的新型并行计算方法被提出并用 于纳米材料电子结构的高效计算,轨道分解方法被用来简化磁性质的四分量相对论计算。 同时,量化计算被越来越多地应用于团簇优化及材料性质的预测27,并越来越注重与实 际结合用于反应过程过渡态和催化机理研究。此外,密度泛函理论方法用于富勒烯衍生物 及碳纳米管复合物的研究也成为科研热点。分子动力学模拟在化学领域的应用也取得了较 好的研究成果。 半离子化模型的提出,很好地描述了金属氧化物和有机分子之间的相互作用。分子动力学 结合自由能计算预测药物分子的包结模型,为设计新的药物分子提供思路。分子动力学模 拟用于激动剂和拮抗剂的作用机理及信号转导模型研究,开发了治疗中枢神经系统疾病的 新药物33。分子动力学在生命与化学现象研究中也取得了一定的进展34。浙江大学李 浩然教授的课题组采用分子动力学模拟及量子化学计算等方法开展了催化氧化过程、离子 液体及其相互作用、生物小分子的异构化过程等一系列研究工作,对水分子提升和抑制催 化剂催化能力的机理、TMGL 离子液体与二氧化硫及二氧化碳间的相互作用、二氧化硫及二 氧化碳在此离子液体中的溶解度问题以及核糖的异构化行为等的研究得到了国际同行的好 评。上海交通大学孙淮教授带领的课题组多年来一直从事用分子模拟技术预测流体热力学 性质的研究,他们采用的方法包括平衡分子动力学、非平衡分子动力学和不同类型(GEMC, GCMC)的蒙特卡洛方法。与国际上其它课题组相比,他们所用的分子力学力场是基于第一性 原理计算推导得到的,因而可以应用到没有实验数据的真实流体。他们用同一力场预测包 括密度、蒸发焓、混合焓、亨利常数、气液相平衡、压缩系数、热容系数、表面张力、粘 度系数和热传导系 数等多种物理性质。在前四届国际工业流体模拟挑战赛(IFPSC)中,取得了三个冠军、三 个第三名的好成绩。 化学信息的组织、管理与应用是化学信息学的核心研究内容之一。为了有效地管理和 利用大量的化学信息,中国科学院上海有机化学研究所建立了化学信息管理系统 CISOC- ChIMS,旨在实现化学结构的子结构、全结构检索和文字检索功能。该所还结合几种基于结 构的药物设计工具组建了虚拟筛选平台 VSM-G,采用几何匹配方法实现了多步高通量实验 的首要模块。中国科学院过程工程研究所对国家科学数字图书馆 ChIN 系统进行了进一步 改善,使其与国际知名的同类系统(如 ChemDex、Links for Chemists 等)相比,无论从索 引的资源总量、内容质量、还是从系统的整体性能上都毫不逊色,是一个兼有 Internet 化学资源的发现、收集、分类、描述;门户网站导航系统的生成与发布;用户交流环境等 功能的化学化工门户系统。另外,利用机器学习的方法,通过对文本自动分类和控制爬行, 建成了包含 1000 万页面的化学专业搜索引擎原型系统 ChemEngine。ChIN 对网络化学资源 检索发挥了积极作用,且具有一定的国际影响。此外,中国科学院上海药物研究所基于 Web 的蛋白质靶标数据库(PDTD)对于现代药物发现中的靶标识别也有望发挥重要作用。 化学信息学的研究热点与展望 化学信息学的实质是“从数据到知识” ,通过各种化学信息库的建立与分析,总结出规 律,最大限度地挖掘、开发和应用化学信息。因此,化学信息学将作为实验归纳和理论演 绎的桥梁,推动化学和化工学科的发展,为社会发展和国民经济服务。随着化学信息的不 断积累,化学信息学在化学及相关学科中必将发挥越来越重要的作用。药物开发、材料设 计、复杂体系分析、海量数据挖掘与知识发现、实际化学体系的理论计算以及有关化学信 息学新理论和新算法的研究将仍然是本学科关注的重点和热点问题。数据挖掘和知识发现 是化学信息学的核心内容,对于海量的生命科学及医药研究数据,如何从中挖掘出最有用 的信息,是对化学信息学的巨大挑战。高精度的实际化学体系的量子化学计算以及分子动 力学、QSAR 等分子模拟方法在化学、生物领域的应用,也有待更深入广泛的工作。解释实 验现象,指导实验的发展仍然是重要的研究课题。更高效、快速的优化算法仍是关注的焦 点,针对特定的化学问题进行优化算法研究可能是一个重要的突破口。算法研究是化学计 量学的基本任务,高维数据、海量数据的分析处理新算法,及其在海量的化学结构数据、 实际复杂体系的分析数据以及生命体系相关数据的处理中的应用,将有助于发现新的规律 和创造新的知识。 结语 经过多年的发展, 化学信息学已经成为一门应用于化学各个领域的、相对成熟的学科。 随着化学信息学研究的深入, 应用范围的拓宽, 化学信息学所起的作用将越来越重要, 必 然会促进化学信息学的进一步发展。 参考文献: 1 李晓霞, 袁小龙, 聂锋光 等. 化学信息门户 ChIN 十年回顾. 计算机与应用化学, 2007, 24: 125129. 2 刘武平, 张平民. 计算机与应用化学, 2000, 17( 3) : 224- 226. 3 Fedorov D G, Kitaura K. Extending the power of quantum chemistry to large systemswith the fragment molecular orbital method. J. Phys. Chem. A, 2007, 111: 69046914. 4 Barone V, Improta R, Rega N. Quantum mechanical computations and spectroscopy:From small rigid molecules in the gas phase to

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论