激酶抑制剂三维定量构效关系的研究_第1页
激酶抑制剂三维定量构效关系的研究_第2页
激酶抑制剂三维定量构效关系的研究_第3页
激酶抑制剂三维定量构效关系的研究_第4页
激酶抑制剂三维定量构效关系的研究_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、毕业设计(论文)题 目:Rho激酶抑制剂三维定量构效关系的研究专 业: 应用化学班 级:XXXXXXX学生姓名:XXX学生学号: XXXXXX指导教师: XXXX化学与环境工程学院2013年6月 3日上海应用技术学院毕业设计(论文)任务书 题目:Rho激酶抑制剂三维定量构效关系的研究学生姓名:XX学号:XXXXXXX专业:应用化学任务起至日期:  2013      年   1  月    1  日至  &

2、#160;   2013  年   6  月  18   日  共  18    周一、课题的任务内容:本论文将采用3D-QSAR法,在SYBYL-X 2.0的水平下,以部分分子结构和生物活性(pIC50值)已知的Rho激酶抑制剂分子为训练集, 选用此系列分子的理化描述子, 包括分子的形状, 静电作用能和范德华作用能以及疏水描述子, 用三维定量构效关系(3D-QSAR) 方法建立反映分子结构与生物活性之间的定量构效关

3、系模型。并基于此模型来设计新的Rho激酶抑制剂分子和进行结构修饰。二、原始条件及数据: 原始资料来自于文献和指导教师提供的资料三、设计的技术要求(论文的研究要求): 建立具有显著统计学意义,预测能力良好的3D-QSAR模型四、毕业设计(论文)应完成的具体工作: 1分子结构的搭建2分子叠合3.COMFA、COMSIA 回归分析(3D-QSAR模型的建立)4. COMFA、COMSIA模型结果分析 软硬件名称、内容及主要的技术指标(可按以下类型选择):计算机软件  结构模型  五、查阅文献要求及主要的参考文献:

4、0;           要求:查阅中文文献10篇,外文文献5篇以上主要参考文献:1. Ramasamy Thilagavathi, Raj Kumar, Vema Aparna, M. Elizabeth Sobhia,Bulusu Gopalakrishnan and Asit K. Chakraborti. “Three-dimensional quantitative structure (3-D QSAR) activity relationship studies on imidaz

5、olyl and N-pyrrolyl heptenoates as 3-hydroxy-3-methylglutaryl-CoA reductase (HMGR) inhibitors by comparative molecular similarity indices analysis (CoMSIA)” Bioorganic & Medicinal Chemistry Letters, 2005, 15:102710322. Assia Kovatcheva, Gerhard Buchbauer et al. QSAR Modeling of r-Campholenic Der

6、ivatives with Sandalwood Odor J. Chem. Inf. Comput. Sci. 2003, 43, 259-266 六、进度安排:(设计或论文各阶段的要求,时间安排):求计算机应用能力和英语阅读能力较强工作计划:要求完成下列内容: 1分子结构的搭建; 2分子结构的优化; 3分子的叠合;43D-QSAR模型的建立;5.模型的有效性检验、新型活性分子设计及结构修饰。工作计划:第1周 第3周查阅文献和收集资料。第4周 第13周分子结构的搭建、优化、模型的建立与验证第14周 第15周新型活性分子设计及结构修饰第16周 第18周撰写论文,准备答辩。 

7、指导教师:XXX                    审核意见:  教研室主任:  Rho激酶抑制剂三维定量构效关系的研究摘要:运用比较分子力场分析方法(CoMFA)和比较分子相似性指数分析法(CoMSIA)对一系列Rho激酶抑制剂化合物的结构参数和pIC50值进行分析,以58个分子结构和pIC50值已知的Rho激酶抑制剂化合物为训练集, 用三维定量构效关系(3D-

8、QSAR)方法建立了预测模型,采用抽一法(leave one out,LOO) 检验了预测模型的可信性,接着用一个由5个Rho激酶抑制剂化合物组成的测试集进一步验证预测模型的预测能力,用交叉验证系数q2和相关系数R2的值来证实3D-QSAR 预测模型是否有良好的预测能力。研究结果表明我们所建立的3D-QSAR模型在统计学上具有明确、良好的预测能力。关键词:三维定量构效关系(3D-QSAR);Rho激酶抑制剂;pIC50值;CoMFA;CoMSIAStudy of the 3D quantitative structure-activity relationship (QSAR) in Rho

9、kinase inhibitorAbstract:Using comparative molecular field analysis (CoMFA) and comparative molecular similarity indices analysis (CoMSIA) to analyze the structural parameters and the pIC50 value of the Rho kinase inhibitor,I select 58 of them for the training set,using three-dimensional quantitativ

10、e structure-activity relationship (3D-QSAR) method to build a prediction model,using the pumping method (leave one out, LOO) to test the credibility of the forecasting model, and then use a test set by 5 compounds further validate the predictive capability of the prediction model,and using cross-val

11、idation coefficient of q2 and the value of the correlation coefficient R2 QSAR prediction model has good predictive ability or not.The results show that the 3D-QSAR model which we built has statistically clear, and good predictive ability.Key words:Three-dimensional quantitative structure-activity r

12、elationship (3D-QSAR);Rho kinase inhibitor;pIC50 value;CoMFA;CoMSIA目录1 绪论11.1 研究的背景与目的11.2 研究现状和进展21.2.1 基于结合口袋关键位点残基差异的选择性抑制剂设计21.2.2 以激酶的活性和非活性构象差异为基础的选择性抑制剂设计31.2.3 多靶点的ATP-竞争性蛋白激酶抑制剂的研究31.3 主要研究内容31.3.1 分子结构的搭建与优化41.3.2 分子的叠合41.3.3 建立模型、回归分析以及模型分析42 理论原理及计算方法52.1 SYBYL软件简介52.2 三维定量构效关系(3D-QSAR)的

13、介绍及其基本原理52.3 研究方法概述62.3.1 化合物活性构象的确定62.3.2 分子叠合62.3.3 CoMFA和CoMSIA简介72.4 研究方案82.4.1数据集的收集82.4.2 建立训练集(training set),测试集(test set)及结构的优化92.4.3 建立数据库92.4.4 模型构建的准备工作及分子叠合92.4.5 CoMFA模型的建立102.4.6 CoMSIA模型的建立102.4.7 预测活性计算113 3D-QSAR模型结果分析133.1 研究对象133.2 分子叠合173.3 PLS分析结果183.4 CoMFA模型的预测193.5 CoMSIA模型的预

14、测203.6 测试集化合物的预测223.7 CoMFA等势图233.8 CoMSIA等势图243.9 新药物分子的设计264 结论29致谢301绪论研究的背景与目的蛋白激酶(protein kinase,PK)是细胞内最大的蛋白家族之一,在真核细胞信号转导中扮演重要的角色,是酶家族中重要的成员。人类基因组内共含有518个蛋白激酶基因,约占真核生物基因的1.7%。蛋白激酶是一类磷酸转移酶,其作用是将ATP(三磷酸腺苷)分子的磷酸基转移到底物蛋白特定的氨基酸残基上,使底物蛋白磷酸化。蛋白质磷酸化的逆过程是由蛋白磷酸酶(protein Phosphatase,PP)催化脱去磷酸基,称为蛋白质的去磷酸

15、化。蛋白激酶在信号转导中的作用主要有两个方面:(1)通过磷酸化调节蛋白质的活性,磷酸化和去磷酸化是绝大多数信号通路组分可逆激活的共同机制,大多数蛋白质在磷酸化后具有活性,少数则在去磷酸化后具有活性;(2)通过蛋白质的逐级磷酸化,使信号逐级放大,引起细胞反应。由细胞外信号引起的蛋白磷酸化和去磷酸化过程调节着真核细胞的大部分信号转导,在调节代谢、基因表达、细胞生长、细胞分裂和细胞分化等方面起关键性作用。因此蛋白激酶活性异常通常会引发包括癌症、糖尿病、炎症在内的许多重大疾病。超过400种人类疾病与蛋白激酶有直接或间接的关系,鉴于此,激酶己成为继G蛋白偶联受体之后的第二大药物治疗靶标。据统计,目前全世

16、界药物在研或开发项目中约三分之一均与蛋白激酶相关。Rho蛋白是由200300个氨基酸组成的信号肽,相对分子质量为2030ku。该蛋白有2种异构酶:ROCK I/Rho激酶/pl60ROCK和ROCK/Rho激酶。Rho蛋白可呈胞质游离型或与膜结合型,能够结合并水解鸟苷酸,使其在有活性的GTP结合状态与无活性的GDP结合状态之间循环1。在细胞的信号转导通路中,Rho蛋白起到分子开关作用,通过作用于细胞骨架、靶蛋白而产生多种生物效应,主要在肌动蛋白细胞骨架重组、细胞移动与黏附、细胞形态改变、平滑肌细胞收缩、血管平滑肌细胞增殖、血小板集聚、细胞生长和凋亡、抑制神经元轴突再生、基因转录、细胞周期调控、

17、细胞分裂、膜泡运输等细胞活动中起重要作用2,3-5。Rho激酶为Rho蛋白下游作用底物,它与血管痉挛、动脉硬化、局部缺血/再灌注损伤、心力衰竭、心肌梗死、高血压及心绞痛等心血管疾病的发生及发展关系密切,被看作是心血管疾病治疗的新靶标6,7。研究表明,Rho激酶还与支气管哮喘、青光眼、勃起功能障碍8、神经系统疾病(如中风、脊髓损伤、阿尔茨海默病等)9,以及肿瘤的浸润和转移10等有关。Rho激酶对许多细胞活动,如血管平滑肌细胞收缩、肌动蛋白细胞骨架重组、细胞黏附和移动、胞质分裂、肿瘤细胞浸润和基因表达等具有重要的调节作用。Rho激酶抑制剂已成为目前新药研究的热点,为心血管等多种疾病的治疗开辟了新途

18、径。三维定量构效关系技术已经成为药物设计中的常规手段之一。对于各类药物的设计及先导物的优化起着重要指导作用。三维定量构效关系(3D-QSAR)技术在药物设计中的成功应用,可以有效指导药物的设计合成,缩短药物的研发周期,降低企业的成本,从而减少投资风险,是一种省时、省力、省钱的应用技术,因此越来越受到研发机构和企业的重视。由此可见,这种研究方法对于设计新药物具有十分重要的意义。近年来,分子对接和3D-QSAR方法被应用于ROCK抑制剂即Rho激酶抑制剂的研究。在本论文中,3D-QSAR方法被应用于Rho激酶抑制剂的研究。CoMFA和CoMSIA分析,用来研究影响化合物活性的结构因素。考虑到基于受

19、体的3D-QSAR研究通常能得到比较好的结果,因此选用这些化合物在结合口袋中叠合的构象来建立3D-QSAR模型。得到的模型不仅能够用于预测新设计的抑制剂,也可对抑制剂的结构修饰给出指导。Rho激酶是近十年来发现参与细胞运动的主要激酶之一,对细胞的分裂、收缩、粘附、迁移、分泌等活动具有重要调节作用。Rho激酶的高表达或过度激活与许多心脑血管疾病的发生发展密切相关,Rho激酶现在已经成为新药研发的重要靶点,而Rho激酶抑制剂的不断发现为心血管、神经系统等疾病的治疗提供了新的希望。蛋白激酶抑制剂可用于多种疾病的治疗。至今已发现了大量天然和合成的蛋白激酶抑制剂(PKI),其中多数是通过与ATP、肽底物

20、或酶辅助因子等竞争结合激酶的ATP结合位点、肽结合位点或变构调节位点而起作用的。其中ATP-竞争性抑制研究得最多,这类抑制剂已经开发和正在开发成为治疗多种复杂性疾病的新药,其抑制活性依赖于它对ATP-结合口袋和它周围残基的内在亲合力,以及ATP分子对于激酶的特异性亲合力。目前ATP-竞争性蛋白激酶抑制剂的研究主要是新骨架先导化合物的发现以及选择性和多靶点抑制剂的研究。基于结合口袋关键位点残基差异的选择性抑制剂设计Vulpettia等人分解出38个组成激酶活性口袋的残基,这38个残基对于不同的激酶略有差异,这种差异正是目前许多选择性激酶抑制剂设计的依据。在这些残基中,目前利用最多的是gateke

21、eper残基,不同激酶的gatekeeper残基不一样,可据此设计出特异性的抑制剂。另外,研究发现细胞周期蛋白依赖性激酶-2(CDK-2)的抑制剂通常对糖原育成酶激酶-3(GSK-3)的抑制活性也相当高,因此选择性的CDK-2抑制剂的设计首先要解决针对GSK-3的选择性问题。Vulpettia等人用GRID/CPCA和GRIND/CPCA方法比较了10个不同配体与CDK-2和GSK-3结合的晶体结构并主要分析了激酶的活性口袋的两个重要的残基差异:CDK-2的gatekeeper残基为phe80,而GSK-3的为LeuI32;CDK- 2的Alal44残基对应的是GSK-3的Cysl99残基。同

22、时发现CDK-2的结合口袋相对不如GSK-3的结合口袋细长和平坦。研究结果为CDK- 2和GSK-3选择性抑制剂的合理设计提供了指导。最近,Blundell等人用多元线性回归方法研究了十字饱碱的结合亲合力与结合位点的形状之间的关系,统计分析结果指出gatekeeper残基较大的激酶和十字饱碱结合力更强。除可利用一个关键残基差异外,也可同时利用多个关键残基差异,即使用多重“过滤”条件。此外,还可以从非选择性的激酶抑制剂或选择性作用于关系紧密的其他激酶的抑制剂出发,利用结合位点的关键残基差异来设计特异性的蛋白激酶抑制剂。以激酶的活性和非活性构象差异为基础的选择性抑制剂设计激酶有活性和非活性两种构象

23、。目前己发现一些激酶抑制剂,除占据ATP结合位点外,还同时占据变构位点,一般将这种类型的激酶抑制剂称为型抑制剂(或间接的ATP竞争性抑制剂),而仅作用于ATP结合位点的抑制剂则称为I型抑制剂。由于变构位点的序列和结构保守性较低,因此,与I型抑制剂相比,型抑制剂具有更高的选择性。Liu等人发展了一套设计新一代型蛋白激酶抑制剂的方法。其基本思路是以某个I型抑制剂为基础,在其尾部添加一个片段,该片段需要具有一个氢键给体和受体基团,以及一个疏水取代基,以占据变构位点。该工作组己用此方法在四种不同的I型抑制剂骨架上添加3-三氟甲基苯酞胺基团,设计出了一系列高亲合性的型抑制剂。多靶点的ATP-竞争性蛋白激

24、酶抑制剂的研究由于细胞的信号通路相互交错,单靶点PKI疗效可能不够理想,也有可能产生耐药性,于是多靶点PKI成为另一种研究趋势。多靶点PKI能作用于多个靶点、效率高、安全性好、抑制肿瘤效果显著。目前有关多靶点受体酪氨酸激酶抑制剂的研究非常活跃,出现了一些新药,有的己经取得了重大突破性进展。Rho激酶(ROCK)是目前研究最为清楚的小GTP结合蛋白Rho效应器,它属于丝氨酸/苏氨酸蛋白激酶家族成员。ROCK通过控制肌动蛋白细胞骨架组装和细胞收缩来调控细胞生长、迁移、代谢和凋亡。它有两个亚型:ROCK-1和ROCK-2。这两个亚型具有高度同源性,序列的同源性大于65%,激酶域的同源性高达92%。他

25、们在多种组织中都有特异性表达,比如大脑、心脏、肺、肝、胃、脾、肾以及骨骼肌。ROCK抑制剂可用于多种疾病的治疗,比如高血压、老年性痴呆症、支气管哮喘、心肌缺血、心力衰竭、中风、癌症转移和肾病等。近年来,对Rho激酶的研究已取得很大进展,其抑制剂法舒地尔在临床上已被用作蛛网膜下腔出血的治疗药物。另外,Iijima等人识别出了几种ATP竞争性ROCK抑制剂,并在此基础上合成了一系列1H-吲唑和异喹啉类的新化学骨架。主要研究内容本课题主要研究的是Rho激酶抑制剂化合物中具有相同骨架的分子的三维定量构效关系。利用SYBYL-X软件,对已知训练集中的分子进行研究分析,以便预测出未知的测试集中的分子的生物

26、活性11。具体包括以下内容:分子结构的搭建与优化将所要进行试验的63个化合物用ChemDraw,Chem3D软件画好结构,并保存为pdb格式文件,再用SYBYL-X软件打开,利用Tripos力场进行能量最小化计算来优化化合物结构,保存为SYBYL-X专用的mol2格式文件。分别建立由58个化合物组成的training set(训练集)数据库和其他5个化合物组成的test set(测试集)数据库。 分子的叠合利用SYBYL-X软件提供的Align Database对训练集和测试集中化合物进行分子叠合,这是基于公共骨架的叠合,叠合完毕后将数据库表格刷新。 建立模型、回归分析以及模型分析分别对训练集

27、中的化合物进行CoMFA和CoMSIA计算,进行回归分析,根据交叉验证系数及相关系数的数值开始对化合物的构象进行调整、优化,直至交叉验证系数大于00,相关系数大于00。利用训练集所得模型对测试集进行预测活性计算,得到模型结果进行分析。2 理论原理及计算方法2.1 SYBYL软件简介SYBYL是Tripos公司专门为药物小分子与生物大分子科学领域研究者所设计分子模拟软件。它提供了一套完整的分子结构搭建、编辑和可视化的工具。其功能包括:分子模建与编辑、计算(分子三维结构优化)、数据分析与组织、分子在三维空间的图形表达和注释、高质量图形输出及用户定制等等。SYBYL内嵌多种力场,包括Tripos ,

28、 AMBER,MM2和MMFF94,适用于药物设计相关的各种体系。模拟的内容包括了药物小分子的建模、构象分析、三维定量构效关系研究、药效团建模、虚拟筛选、生物大分子的同源模建、活性位点分析、数据库搜索等。包括以下内容相关的模块:1基本操作平台(包括开发平台) Linux 操作系统下运行 2基于配体的药物设计(药效团概念、QSAR和ADME) 3药物设计(虚拟筛选 和denovo设计) 4组合化学(化学库设计和分子多样性) 5结构生物学(大分子模拟和同源模建) 6信息学(生物信息学和化学信息学) 7 NMR相关模块总的来说,它是最全面的药物与分子设计专业工具,提供了综合的分子模拟工具结构搭建、优

29、化、比较;结构与相关数据可视化;注解、硬拷贝、以及屏幕截图;此外,全部的用户界面重新设计以节约时间并简化了工作流。在SYBYL内用户可以通过分子表单(Molecular Spreadsheet)来计算,管理,显示和分析分子的特性。灵活的输入输出方式可以让用户方便使用通用的数据库资源。用户使用内置的脚本语言SPL (SYBYL Programing Language)能够将复杂的分子模拟和药物设计过程自动完成,实现自己的药物设计理念。在SYBYL-X中,完成常规任务更加快捷与便利,从获得数据到科学发现的发表等全部工作流程的性能得到提升。所有的这一切都是以最高质量的分子发现科研为目的的。2.2三维

30、定量构效关系(3D-QSAR)的介绍及其基本原理所谓定量构效关系(Quantitative Structure-Activity Relationship,QSAR),是指将化合物的结构参数和其生物活性数据以一定的等式相联系起来的定量关系,是一种基于小分子结构的设计方法,利用它可以为药物设计和先导物的优化提供理论依据。上世纪Hansch、Fujita和Free、Wilson分别发现了两种不同表达方式的二维定量构效关系,从中我们深刻了解了药物-受体结合作用方式。但是传统的2D-QSAR方法的局限性很大,在研究新化合物或者新取代基的定量构效关系时,很难找到相对应的量化参数,不仅如此,在设计合成由2

31、D-QSAR预测高活性化合物时,我们还必须要有相当的物理有机化学、量子化学、计算化学等方面的只是,结果很难以图像的方式直观的显示出来。3D-QSAR是以配基和受体的三维结构特征为基础,根据分子的内能变化和分子间相互作用的能量变化来定量分析三维结构与生物活性间的关系。这就使得预测高活性化合物的结果可以用图像直观的显示出来12。3D-QSAR使用的技术主要有分子形状分析法(MSA)、比较分子力场分析法(CoMFA)、比较分子相似因子分析法(CoMSIA)、分子力场分析(MFA)、虚拟受体等。一般来说,3D-QSAR方法通过计算被研究化合物的优势构象和分子中的原子电荷,确定被研究化合物构象在网格中的

32、定位规则,并设计能容纳所有被研究化合物构象式的三维网格,根据定位规则将分子在空间进行叠加,计算每个化合物构象的一系列空间性参数(如立体排斥能、静电势等),最后用偏最小二乘法得出最佳组分数和3D-QSAR 模型。通过3D-QSAR模型可预测未知化合物的活性,同时得到的等高图可反映出决定化合物生物活性的各药效基团13-14。3D-QSAR的基本原理主要是利用数学模式对药物的化学结构信息(如各种取代基参数,拓扑指数以及量子化学与分子力学计算参数)与其生物活性之间的关系进行定量分析,找出结构与活性间的量变规律,然后根据这种规律及未知化合物的结构预测未知化合物的性能。3D-QSAR模型的研究建立在以下基

33、础上:(1)分子的形状在一定程度上影响其生物活性,分子的活性构象是研究3D-QSAR的关键;(2)药物分子与受体之间的相互作用是借助可逆的、非共价结合的弱作用力实现的,如静电引力、疏水作用、氢键、范德华引力等。由于3D-QSAR直接反映药物分子与受体三维空间上的互补性,更准确表达了药物与受体之间的相互作用,因此,近十多年来3D-QSAR方法得到了迅速的发展。2.3 研究方法概述 化合物活性构象的确定在预测分子的几何构象以得到能量函数局部极小(即化合物的活性最大),力场是一种重要的方式。力场需要根据研究对象的特点来进行选择,在SYBYL-X软件中,提供了多种优秀的力场,而针对本文对Rho激酶抑制

34、剂化合物,我们选用Tripos力场来进行优化,以确定化合物的活性构象。 分子叠合要进行3D-QSAR研究,首先要选取化合物的3D活性构象进行叠合。构象选取及叠合的好坏直接关系到3D-QSAR研究的结果。如果化合物具有公共的骨架,就以公共骨架进行构象叠合;如果已知受体与配体的复合物三维结构,可以采用分子对接的方法得到其叠合的三维活性构象;也可以采用3D药效团模型得到的叠合构象进行3D-QSAR研究。鉴于本文化合物具有公共骨架,采用的是Align Database方法将训练集化合物分子进行叠合。2.3.3 CoMFA和CoMSIA简介CoMFA和CoMSIA是应用最广泛的合理药物设计方法之一15,

35、这种方法认为,药物分子与受体间的相互作用取决于化合物周围分子场的差别,以定量化的分子场参数作为变量,对药物活性进行回归分析便可以反应药物与生物大分子之间的相互作用模式进而有选择地设计新药。比较分子力场分析方法(CoMFA),是目前最为成熟且应用最为广泛的方法。CoMFA 是在分子水平采用分子场研究分子性质,其最初是为小分子集而设计的,在不了解受体三维结构的情况下,研究这些药物分子周围三种作用力场分布,把它们与生物活性定量地联系起来,既可以推测受体的某些性质,又可依此建立一个模型来设计新化合物,并定量地预测其药效强度。CoMFA 的基本步骤可概括为:(1)确定各化合物的药效构象,依据合理重叠规则

36、,把它们重叠在一个包容全部化合物分子的空间网格上;(2) 使用一个探针比如带一个单位正电荷的甲基计算相互作用能,这一步将产生一个基于Lennard-Jones 6-12 势的立体相互作用能和一个基于Coulombic 势的静电相互作用能,这些作用能即构成CoMFA 描述子矢量;(3) 用偏最小二乘法16,17(partial least square,PLS)确定可区分被研究化合物活性的最少网格点(以立体阻障、静电势、疏水性相互作用表示),进而建立各分子生物活性与相互作用能的3D-QSAR 模型;(4)作CoMFA 系数图,从系数图上可以清楚地看出哪些地方场强对生物活性影响最大,据此可以设计具

37、有更强生物活性的新化合物。这只是一个总体简化的计算过程,大量的研究工作包括在上述各个步骤中,对其展开的激烈争论仍在继续。从CoMFA 的计算步骤及其应用情况可以看出:分析过程中要严格选择各种参数,慎重选取电荷以及有关的计算方法;严格定义排列标准和所选择的条件以及场的缩放比例和权重,对每一个分析都应该作交互检验并且应该考虑交互检验中的典型问题如离群项的讨论;最后要提供或至少要讨论最终模型的等高线,给出有关生物数据的出处以及生物数据的标准误差,提供观测值和预测值以及依赖于训练集的生物活性值的预测效果。应该说,CoMFA 方法中关键问题是合适的校准策略分子对接问题的选择。相对于2D-QSAR,CoM

38、FA 具有两大优势即可应用于非同系物体系和可以3D 图形显示,因此自其公布以来,正在得到广泛的应用18-22。但CoMFA方法受很多因素比如活性构象确定、分子叠合规则、分子场势函数定义以及分子场变量选取等影响,结果不是很稳定;同时还有一定的应用限度21,比如CoMFA 中没有真正体现疏水性相互作用,而疏水性相互作用是配体-受体间一种很重要的相互作用力,尽管这种作用力的含义至今尚不完全清楚。其次,CoMFA 对于体内生物活性数据的分析经常得不到有意义的结果,并且CoMFA 中应用PLS 统计技术得出的潜参数(组分)难以用传统的化学思维来解释。另外,由于选取的参数不尽一样,因此结果之间难于比较。正

39、因为如此,其正在不断被完善和发展,如Gaillard 等22,23把“疏水场”概念引入到CoMFA 计算中;Kellogg 等24发展了计算氢键相互作用的HINT(hydropathic interaction)程序并把它成功地引入CoMFA中。起初,CoMFA的方法应用于靶标蛋白结构未知的3D-QSAR 建模中,最近也被应用于靶标结构已知的研究中25-28。CoMFA的基本原理是:如果一组相似化合物以同样的方式与受体部位发生相互作用,那么它们的生物活性的强弱就取决于每个化合物周围分子场的差别,这种分子场可以反映药物分子和受体之间非键相互作用特性。马翼等人采用CoFMA方法对N-(4-取代嘧啶

40、-2-基)苄基磺酰脲和苯氧基磺酰脲类化合物进行三维定量构效关系研究,建立了一个较为可靠的预测模型。近年来,研究人员对传统的CoMSIA进行了大量的改进,其中涉及到活性构象的确定,分子叠加规则、分子场势函数的定义以及分子场变量的选取等等,在很大程度上提高了CoMFA计算的成功率。在这里值得一提的是与CoMFA 类似的一种3D模型化方法:比较分子相似性指数分析法(CoMSIA)。1994 年Klebe 等29定义了包含配体成键的主要作用场30的5 种分子特征:立体场、静电场、疏水场、氢键场(包括氢键受体和氢键给体)。其中,立体场同原子半径的三次方相关,静电场来自于原子净电荷,疏水场来源于Viswa

41、nadhan等31的研究工作,氢键场则是通过自经验得到的基本准则来获得的32。比较分子相似性指数分析法(CoMSIA)是对CoMFA方法的改进,他改变了探针粒子与药物分子相互作用能量的计算公式,从而获得更好的分子场参数。CoMSIA 中采用与距离相关高斯函数形式代替经典Coulomb 和Lennard-Jones 6-12势函数形式,致使在分子表面附近格点上的能量自动收敛为确定值,从而不要人为定义阈值(cutoff)。CoMSIA 方法能有效地避免在CoMFA 方法中由静电场和立体场函数形式所引起的缺陷。其计算在不同格点大小以及分子空间取向下得到的结果比CoMFA 稳健得多33。CoMSIA方

42、法中,可避免在原子附近数值的奇异性以及分子表面附近格点处势能的急剧变化,等势图克服了CoMFA的不足,其可视性、揭示构效关系和对新化合物活性的预测均得到了改善。在一般情况下,CoMSIA 会得到更满意的3D-QSAR 模型30,34,35。2.4 研究方案本论文以分子结构参数及相应的实验数据为基础,应用CoMFA、CoMSIA等方法对Rho激酶抑制剂的三维定量构效关系的进行了研究。采用比较分子力场分析(CoMFA)和比较分子相似性指数分析(CoMSIA)的方法建立了Rho激酶抑制剂的三维定量构效关系模型。2.4.1 数据集的收集可靠的预测模型是建立在可靠的数据集基础之上的,因此数据集的获得及数

43、据的质量是QSAR研究成败的重要影响因素。数据可以来自实验,也可以来自文献资料或者数据库。理想的实验数据应该是在同样的实验条件下测得的,甚至应该是由同一个实验室的同一个研究者测得的。并且活性数据最好是使用当前学术界公认的一些标准样本进行实验测量的,这种的数据实验误差较小、质量较高36。Dearden37等人建议数据集的活性值范围至少要大于1个数量级,38:则指出,活性值应大于2-3个数量级。另外,数据集的样本量一般不能少于10个。同时,样本的取代基最好多样化,吸电子、给电子基,体积大、体积小的取代基尽量要包含在内。本文所选择的63种Rho激酶抑制剂的结构和活性值是从文献39-41的QSAR研究

44、中选择出来的。 建立训练集(training set),测试集(test set)及结构的优化数据集被分别随机分成训练集和测试集,测试集包括化合物27,40,49,60和61,所有其他化合物被列入到训练集。利用ChemDraw分别将63个分子结构图表示出来,再导入Chem3D软件中,与表中所给结构图进行对比看是否有误,确认无误后另存为pdb格式文件。分子力场的选择与优化方法的选择:本文选择的是利用Tripos力场进行能量最小化计算。打开SYBYL-X软件,从分子数据库中读入初始结构。选择所要进行优化的分子,对分子进行命名。命名完成后确定力场并确定电荷类型,进行最小化计算,参数设定如下:在Min

45、imize对话框中,点击Minimize Details,将最大重复次数()增加到1000,把Gradient减低到0.005,再将Color Option设定为Force,利用Tripos力场进行能量最小化计算的参数设定就完成了。点击OK,就完成了一个分子的优化,然后把优化好的分子存成Mol2格式文件以便后面的分析。接下来对剩下所有分子进行同样的操作,共得到63个优化好的分子文件。 建立数据库文件分为两类,化合物27,40,49,60和61为测试集,剩下的为训练集。训练集化合物的Mol2文件保存在training.mdb,测试集化合物的Mol2文件在test.mdb。 模型构建的准备工作及分

46、子叠合在SYBYL-X软件中读取训练集数据库文件training.mdb,并在数据库的第一列导入活性值即pIC50值。接下来进行分子的叠合。分子叠合的方法有多种42-45:1)化合物具有公共的骨架,就以其公共骨架进行构象叠合;2)采用3D药效团模型GALAHAD进行叠合构象:它可以快速生成高质量的药效团和分子叠合结果。对结合于同一位点的一系列分子,GALAHAD可自动生成药效团模型和分子叠合结果。这一方法无需预先知道药效团元素,限制条件和分子叠合,这使它成为探索新靶标和新作用模式的理想工具。GALAHAD采用成熟的新遗传算法(GA),它把分子定义为核心结构和一系列二面角。为了克服现有药效团工具

47、的局限性,GALAHAD的遗传算法在真实的数据集上开发出来的。分子叠合是CoMFA和CoMSIA计算的关键步骤,叠加的好坏直接影响着最终模型的合理性及预测能力的强弱。分子叠合的依据是所分析的配体分子以相同或相似作用方式与受体结合部位相互作用,因而必须确保药效团在空间的分布具有相同性。通过不断地尝试,我最终选定公共骨架叠合法做为本次试验的叠合方法。叠合前可以利用Distill Rigid来寻找共同骨架。本文选取活性最高的36号分子为模板,以该化合物的刚性主体部分为分子叠加的公共结构,应用Align Database模块将训练集中所有化合物的公共部分与模板分子的基本骨架相重叠。采用此方法叠合可保证

48、每个分子力场的取向具有一致性。 CoMFA模型的建立选中数据库表格第二列,添加CoMFA列。操作步骤如图2-1。图2-1添加CoMFA列图2-2 CoMFA回归分析参数接下来进行回归分析,参数设置如图2-2,最大主成分数Components的数值由默认值改为20,如果结果不好,可增大。采用抽一法(Leave-One-Out)23对训练集化合物进行交叉验证,运算结束后查看Sybyl命令框。在Sybyl命令框中找出最佳主成分数,接着验证系数q2数值来进一步分析模型的拟合能力及其他性质。将Components改为最佳主成分数,Validation改为No Validation。进行回归运算后可以得出

49、验证q2的结果。将结果保存为PLS分析文件。 CoMSIA模型的建立选中数据库表格第二列,添加CoMSIA计算立体和静电场列,计算疏水场的Hydrophobic列、Steric_and_Electrostatic列以及氢键供体场和氢键受体场的Donor_and_Acceptor,点击Advanced Details进行参数设置如图2-3、图2-4。图2-3添加CoMSIA列 图2-4 CoMSIA参数设置接下来进行回归分析,参数设置如图2-5,最大主成分数Components的数值由默认值改为20,如果结果不好,可增大。采用抽一法(Leave-One-Out)对训练集化合物进行交叉验证,运算结

50、束后查看Sybyl命令框。图2-5CoMSIA回归分析参数验证系数q2数值表明CoMSIA模型的预测能力较为理想。接下来进一步分析模型的拟合能力及其他能力。将Components改为最佳主成分数,Validation改为No Validation。进行回归运算后可以得出验证q2的结果。将结果保存为PLS分析文件。 预测活性计算CoMFA模型的预测:在Training表格的第6列进行PREDICT预测pIC50值。在Training表格中选中第7列,添加FUNCTIONAL_DATA列,结果实际活性与预测活性的差值就被计算出来了。CoMSIA模型的预测方法操作与CoMFA模型类似。现在就可以利用

51、已经构建好的3D-QSAR模型对测试集化合物进行生物活性的预测计算了:在SYBYL-X软件中打开test.mdb文件,重复寻找共同骨架的方法进行叠合,利用CoMFA模型和CoMSIA模型的PLS文件对测试集化合物进行活性预测。3 3D-QSAR模型结果分析3.1 研究对象本工作所研究的63个化合物均来自文献39-41。表给出了它们的结构和活性数据(pIC50)。整个数据集分成训练集和测试集。训练集包含58个化合物,用来建立QSAR模型,测试集包含5个化合物,用来检验模型。测试集分子的选择考虑了化合物结构和活性的分布()。除了活性最高和最低的化合物被划分在训练集中,测试集分子的活性分布和训练集分

52、子相近,并从结构上保证了训练集分子的代表性和多样性。表3.1 Rho激酶抑制剂化合物12pIC50:3pIC50:4pIC50:5pIC50:6pIC50:7pIC50:8pIC50:9pIC50:12pIC50:16pIC50:17pIC50:18pIC50:19pIC50:20pIC50:22pIC50:23pIC50:24pIC50:25pIC50:26pIC50:27pIC50:28pIC50:29pIC50:30pIC50:31pIC50:32pIC50:34pIC50:36pIC50:37pIC50:38pIC50:40pIC50:41pIC50:42pIC50:43pIC50:4

53、4pIC50:45pIC50:47pIC50:48pIC50:49pIC50:50pIC50:52pIC50:56pIC50:57pIC50:58pIC50:59pIC50:60pIC50:61pIC50:62pIC50:63pIC50:64pIC50:65pIC50:66pIC50:67pIC50:68pIC50:69pIC50:71pIC50:72pIC50:73pIC50:74pIC50:75pIC50:76pIC50:77pIC50:78pIC50:分子叠合训练集分子和测试集分子的叠合选取活性值最高的36号化合物为模版,选取的公共骨架如图3-1所示,叠合效果图如图3-2、3-3所示。图

54、3-1 公共骨架(以36号化合物为例)图3-2 训练集叠合效果图图3-3 测试集化合物叠合图此次训练集和测试集的化合物叠合图是通过不断的改变化合物构象,使叠合效果看上去最好,即CoMFA和CoMSIA模型具有统计学意义,更好的用来预测Rho激酶抑制剂的活性值而得到的。3.3 PLS分析结果表3.2 CoMFA模型回归分析结果模型q2R2n对模型的贡献/%SES+E19表3.3 CoMSIA模型回归分析结果模型q2R2n对模型的贡献/%SEHADS+E+H+A+D20其中,s为立体场、E为静电场、H为疏水场、D为氢键供体场、A为氢键受体场;q2为模型的交互验证相关系数,R为模型的相关系数,n为模

55、型的主成分数。在CoMFA/CoMSIA模型的PLS分析中,q2为模型预测能力的统计指标,当q2>0.5时,所建立模型在5显著水平上有统计意义,其机会相关的可能性小于5(该模型可信度为95),而当0.5<q21时,表明所建立模型的统计意义十分显著46-48。此次建立的CoMFA模型的回归分析结果:统计结果表明,模型的交叉验证系数q2 为0.548,说明模型具有较好的预测能力;此外其非交叉验证相关系数R 为,标准偏差为,数据组间的平均平方误差与数据组内部的平均平方误差的比值F为,说明模型的统计学稳定性较好。此次建立的CoMSIA模型的回归分析结果:统计结果表明,模型的交叉验证系数q2 为0.578,说明模型具有较好的预测能力;此外其非交叉验证相关系数R 为,标准偏差为,数据组间的平均平方误差与数据组内部的平均平方误差的比值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论