定量构效关系建模方法的研究进展_第1页
定量构效关系建模方法的研究进展_第2页
定量构效关系建模方法的研究进展_第3页
定量构效关系建模方法的研究进展_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定量构效关系建模方法的研究进展

1生物活性的预测和定量构效关系定量结构效应关系(psar)是一种研究化合物的化学结构和活性之间的关系。我们分析了不同结构参数和研究样本量,并确定了分子结构参数和研究性质之间的定量关系。一旦建立了可靠的定量构效关系模型,就能从分子水平上理解分子的微观结构同其宏观活性之间的关系,推论呈现化合物某些性质的影响因素,为设计,筛选或预测具有人们期望的性质的化合物提供信息,同时还可用它来预测新的或未合成出来的化合物的各种性质。随着化学工业,特别是精细化工的飞速发展,成千上万种化学物质被合成,定量构效关系的研究引起了人们的广泛关注,其已成为目前化学信息学研究中所关注的热点问题之一。QSAR的研究对象包括化合物的各种生物活性、毒性、药物的各种药代动力学参数和生物利用度以及分子的各种物理化学性质和环境行为等,研究领域涉及化学、药物以及环境等诸多学科。QSAR研究在环境化学、农业化学、药物化学中有着重要的理论和应用价值,被广泛认为是探索化合物的活性与其结构之间关系的1种最有效的方法,是预测新化合物活性的不可或缺的方法。22d-qar建模方法2.1结构方程模型的建立多元线性回归(multiplelinearregression,MLR)是通过多个自变量的最优组合建立自变量与因变量之间的线性模型来预测因变量。多元线性回归最大优点是可获得因果模型且物理意义明确,但必须满足下列条件:(1)描述变量与参数相互正交;(2)化合物或样本数大于描述变量数。通常要求样本数至少是描述因子的3倍,最好10倍以上。浙江大学的桑鹏等人研究了吲唑脲类辣椒素受体通道拮抗剂的定量构效关系,运用多元线性回归方法对吲唑脲类分子的生物活性与其分子结构参数进行了关联,建立了1个较为可靠的定量模型。Paliwal等人运用多元线性回归方法研究了43种化合物的抗锥虫活性与其结构之间定量构效关系,建立回归方程得出化合物的能量、logP与抗锥虫活性紧密相关。2.2力保原有变量转换主成分分析(principalcomponentanalysis,PCA)是1种多变量降维方法,Pearcon于1901年首次提出主成分分析的概念,在30年代Hotelling对主成分分析进行了发展,计算机出现后,主成分分析得以广泛地应用。主成分分析的优点是能对数据集降维,它在力保原有信息不丢失的基础上将变量集进行转换,用几个由原始变量线性组合的互不相关的新变量来代表原变量集。在进行QSAR研究时样本的自变量集维数太高会增加QSAR研究的难度,通过运用主成分分析可以有效的提取对系统解释性最强的综合变量,从而有利于QSAR研究的进行。Tulp等人通过主成分分析将1个大的数据矩阵(153溶剂×396溶质)降维,由2个得分98.6%的主成分代表原始数据的信息,建立定量构效关系模型研究Ostwald溶解系数与其结构之间的关系。我们实验室的王岚等人从抗生素类化合物的结构性质出发,运用PCA建立了抗生素类化合物与DNA反应的键合亲和常数值与其结构之间的定量构效关系模型。模型表明Balaban指数、Connolly分子面积、N原子数等结构参数对抗生素类化合物与DNA反应的键合亲和常数值影响显著。主成分分析虽然较好地解决了多重共线性问题,但仍存在不足之处,比如:主成分的实际含义不明确,主成分与因变量之间的关系不直接。2.3相关性最大分析偏最小二乘法(partialleastsquares,PLS)也是采用成分提取的方法,它不仅考虑了自变量数据集中的信息,而且考虑了因变量数据集中的信息,同时在自变量和因变量数据集中分别提取成分。所提取的成分具有以下2个优点:(1)尽可能多地代表原数据集中的信息;(2)相关性最大。偏最小二乘法集中了主成分分析法与线性回归分析的优点,能有效解决自变量间的多重共线性问题,并适合在样本容量小于变量个数的情况下进行回归建模,所得到的模型更易于辨识系统信息与噪声。赵蔡斌等人运用偏最小二乘法研究了3-取代-4-氧-3H-咪唑并[5,l-d]四嗪-8-羧酸衍生物分子结构与其抗肿瘤活性的定量构效关系。用偏最小二乘法方法所建的定量构效关系模型是稳健的,其相关系数高达0.932。研究表明:3-取代-4-氧-3H-咪唑并[5,1-d]四嗪-8-羧酸衍生物抗肿瘤活性与分子油水分配系数LogP和8位取代基R1上的非氢原子净电荷Q1相关。大连水产学院的王姮等人分别采用MLR、PCA和PLS方法构建环境化合物对鱼类毒害的定量构效关系模型,确定影响毒性的关键分子结构特征,对用不同方法所建的定量构效关系模型进行比较,结果表明PLS方法所建的模型预测效果最好。2.4数学上的行为具有非线性关系人工神经网络(artificialneuralnetwork,ANN)是1种模拟人脑功能的信息处理系统,它以数学网络拓扑结构为理论基础,通过网络的变换和动力学行为进行并行分布式的信息处理。人工神经网络具有4个基本特征:(1)非线性,人工神经元处于激活或者抑制2种不同的状态,这种行为在数学上表现为1种非线性关系;(2)非局限性,1个神经网络通常由多个神经元连接而成;(3)非定性,人工神经网络具有自适应、自组织、自学习能力;(4)非凸性,1个系统的演化方向,在一定条件下将取决于某个特定的状态函数。人工神经网络因能较好地处理高度非线性体系,被广泛应用于各个领域。张佳瑛等人用人工神经网络方法研究了38个苯烷基胺类化合物的迷幻活性与其结构之间的定量构效关系,所建立的定量构效关系模型的相关系数高达0.9992。Worachartcheewan等人运用人工神经网络研究了弗林蛋白酶抑制剂的抑制活性与其结构之间的定量构效关系,通过E-Dragon和RECON分子描述符建立了2个预测能力强的定量构效关系模型,其相关系数为80.7%和92.3%,此定量构效关系模型对设计和合成新的弗林蛋白酶抑制剂具有重要的参考价值。2.5基于核的方法原则,其方法的精确性原则为支持向量机(supportvectormachine,SVM)是Vapink等人在统计学习理论基础之上发展起来的1种新的机器学习方法。SVM基于统计学习理论的结构风险最小化原则,将最大化分类间隔的思想和基于核的方法结合在一起。由于支持向量机有统计学习理论作为数学基础,并且可以很好地克服“维数灾难”和“过拟合”等传统算法所不可规避的问题,所以受到了越来越多研究人员的关注,该方法成为继神经网络之后新的研究热点,并在很多领域中得到了成功的应用,如人脸,手写体,汽车牌照,指纹,声音和数字识别等等。Darnag等人运用支持向量机方法通过4个分子描述符研究了82个非核苷逆转录酶抑制剂的抑制活性与其结构之间的关系,得到具有较好统计结果的定量构效关系模型,其测试集和训练集的相关系数为0.96,0.89。33d-ssar研究方法20世纪80年代初以来,在QSAR的研究中,逐渐出现了几种考虑化合物的三维构象性质的研究方法,即在QSAR研究中引入与物质三维结构信息有关的量作为描述符,称为3D-QSAR研究方法。由于3D-QSAR能精确地反映化合物分子与受体作用的真实图像,能更准确表达化合物分子与受体之间的相互作用,能更深刻地揭示化合物分子与受体相互作用的机理,因此近20多年来3D-QSAR研究得到了迅速的发展。3.1cofma方法的基本原理比较分子力场分析法(comparativemolecularfieldanalysis,CoMFA)是1988年由Cramer等人提出的,它是目前3D-QSAR中应用最广泛且最为成功的1种方法。其基本原理是:如果一组相似化合物以同样的方式与受体部位发生相互作用,那么它们周围的分子场有一定的相似性,把化合物周围分子场的分布与其活性定量地联系起,这样化合物活性的强弱就取决于每个化合物周围分子场的差别。CoFMA方法主要由以下5个步骤组成:(1)寻找被研究化合物的最低能量构象;(2)确定被研究化合物构象式彼此重叠的原则;(3)设计1个三维网格,其空间能容纳所有被研究化合物的构象式;(4)1个探针原子在网格中以一定步长计算每个点与化合物构象空间的立体排斥能、静电势和疏水性作用,确定化合物分子周围各种作用力场的空间分布;(5)通过偏最小二乘方法建立化合物活性和分子场特征之间的关系。陈凝木子等人对67个黄酮类化合物进行了三维定量构效关系研究,选取其中58个化合物作为训练集,另外的9个化合物作为测试集,用CoMFA方法所建的定量关系模型给出了令人满意的交叉验证系数值,为高活性黄酮类衍生物的设计提供了理论依据。3.2提取化合物毒性与结构参数的定量构效关系比较分子相似性指数分析法(comparativemolecularsimilarityindicesanalysis,CoMSIA)是由Klebe等人于1994年提出。CoMSIA与CoMFA方法相比,最大的不同就是分子场的能量函数采用了与距离相关的高斯函数的形式,而不是传统的库仑势能和Lemard-Jones势能函数的形式。郭亦然等人采用CoMSIA方法研究了氯代芳烃化合物的发光菌毒性与三维结构参数之间的定量构效关系。所建的定量构效关系模型具有较好的预测能力,其交叉验证相关系数q2=0.702,非交叉验证相关系数r2=0.947,标准偏差SE=0.151,F=18.027。定量构效关系模型表明降低甲基对位负电性或减弱甲基邻位、间位、对位取代基亲水性可以降低化合物毒性。Gupte等人分别采用CoMFA和CoMSIA方法对hENT1抑制剂进行了研究,2种方法都表明分子骨架中的苯甲基上的氢键对hENT1抑制剂的键合力起到关键作用,对后期活性分子的设计起到了指导作用。石佳奇等人对苯酚衍生物的生物降解性能进行了2D-QSAR和CoMSIA研究,对18个苯酚衍生物进行了定量构效关系分析,2D-QSAR模型和CoMSIA模型在解释该类化合物的生物降解性能上相互印证和相互补充,更加全面地认识了分子的结构特征对降解性能的影响。4定量构效关系qar研究是本领域的应用之一一般说来,MLR能较好地反映化合物分子与活性之间的线性关系,PCA能较准确地从高维数据中提取信息,适合于多变量体系;PLS能反映小样本高纬度体系的化合物分子与活性之间线性关系;ANN能较好地处理高度非线性体系;SVM采用结构风险最小化原则建模使模型预测能力显著提高;CoMFA和CoMSIA因能更直观、准确地反映化合物分子与活性之间的关系,而具有广阔的应用前景。在实际的定量构效关系研究过程中,往往1种建模方法不能满足研究的需要,综合运用各种方法、相互补充相互验证,这样才更有可能得到更满意的结果。随着化学和计算机技术的发展,QSAR研究在各领域中的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论