计算机药物辅助设计cadd课件9-10_第1页
计算机药物辅助设计cadd课件9-10_第2页
计算机药物辅助设计cadd课件9-10_第3页
计算机药物辅助设计cadd课件9-10_第4页
计算机药物辅助设计cadd课件9-10_第5页
已阅读5页,还剩151页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11/27/2022药物的化学信息计算机系统11/27/2022药物的化学信息计算机系统1化学信息学(Chemoinformatics,chemicalinformatics,Cheminformatics,chemi-informatics)利用计算机信息处理技术对化学分子结构,性质,来源及用途等相关信息进行管理(包括储存,分析,处理,检索和传递等)的一种综合性技术和学科。应用化学信息学可促进化学信息的获取、转化与共享化学信息处理化学信息学(Chemoinformatics,chemica22D:3D:H3CC化学分子结构的层次

1D:CH3CHO

OH*一、2D和3D分子结构的计算机处理方法2D:3D:H3CC化学分子结构的层次H*一、2D和3D分3(一)以一维形式表示

对2D结构进行编码——储存和交换化学结构式数据 的命名法•SMILES(SimplifiedMolecularInputLineEntrySystem,简化分子线性输入系统)•SLN(Sybyllinearnotation,Sybyl线性标记法)*(一)以一维形式表示•SMILES(Simplifi4SMILES

按化合价模型,每个原子被氢原子饱和;双键用=

表示;三键用#表示;环化分子用闭合原子序号表 示;芳香环中不饱和原子用小写字母表示甲烷CH4C水乙醇

H2OOC2H5OHCCO氰化氢HCNC#N环已烷C6H12C1CCCCC1吡啶C5H5Nn1ccccc1*SMILES甲烷CH4C水 H2OO氰化5•分子中分支用()表示;用/和\表示双键顺反异 构;对映异构:手性原子用[]表示,@表示反时 针,@@表示顺时针反式二溴甲烷顺式二溴甲烷L-丙氨酸D-丙氨酸

Br/C=C/Br或Br\C=C\Br Br\C=C/Br或Br/C=C\BrN[C@@H](C)C(=O)O N[C@H](C)C(=O)O*•分子中分支用()表示;用/和\表示双键顺反异反6•用图表示•用矩阵表示CCCC CCC

NCHHC OHO*(二)以二维形式表示•用图表示•用矩阵表示CCCCCC NHHCHO*(二)7•用连接表表示*•用连接表表示*8(三)以三维形式表示

1、直接坐标法

用卡迪尔坐标直接存储每个原子的三维坐 标(x,y,z)*(三)以三维形式表示*9每个原子位置以与其他原子间的3个相对位置关系表示——距离、夹角、二面角r1和r2为键长,α为键角,τ为扭转角α876

514321378624τ 5zr2r1y1,2-二氯乙烷*2、内坐标法每个原子位置以与其他原子间的3个相对r1和r2为键长,α为键10(四)分子存储格式及其相互转换

每一软件系统都有自己的分子存储格式

MDL公司的MOL格式(MACSS格式) Tripos公司的MOL2格式 剑桥晶体数据库CSD的FDAT和CIF格式 蛋白质数据库PDB的PDB格式(ENT格式)*(四)分子存储格式及其相互转换*11基本存储: 分子的元素组成、原子坐标、原子连接关系还能存储: 分子子结构信息,能适用于生物大分子 原子电荷信息,调用时不必再计算 确定特定原子化学环境的原子类型信息*基本存储:*12二、化合物数据库的生成和管理

输入 搜寻和检索 管理 输出二、化合物数据库的生成和管理13合成反应信息管理软件及数据库目的:用于计算机获取,管理,搜寻,检索合成反应,包括反应物,产物的结构式及其反应的有关信息计算机辅助有机合成:应用计算机合成反应管理软件从反应数据库中寻找和检索合成反应方法合成反应信息管理软件及数据库目的:用于计算机获取,管理,搜寻14合成反应信息管理软件及数据库管理软件的功能:输入:绘制反应物和产物结构输入其他反应信息搜寻与检索:一般用户绘制出并指明产物或反应物结构。合成反应信息管理软件及数据库管理软件的功能:输入其他反应信息15ISIS(IntegratedScientificInformationManagement System)——MDL的综合性结构和反应管理软件•由三个主要分软件组成:(1)ISIS/DRAW——用于输入结构式和搜寻询问条件(2)ISIS/BASE——用于生成局部数据库及处理信息(3)ISIS/HOST——主服务器应用程序,进行通讯连 接,集中数据库数据并作处理ISIS(IntegratedScientificIn162D结构输入:

——计算机绘制化学结构式 •首先输入原子和键的骨架结构,原子数、电荷会自动变 为上下标 •软件的模板中收集大量分子片段 •可智能分析结构式,处理结构式的编码和变换 •还可有附加功能, 如自动命名、化学计 算、光谱分析等2D结构输入:17三维结构的转化:

3D结晶结构转入3D数据库 软件将2D化学结构迅速地转为3D模型NHHNCH3OCH3O三维结构的转化:NHCH3OCH3O18三.组合化学信息管理软件及数据库意义:产生先导化合物的有效方法库中化合物既可是分子实体,也可是虚拟化合物库的质量指标:化学多样性先导化合物优化库的规模先导化合物筛选103~106<103三.组合化学信息管理软件及数据库意义:产生先导化合物的有效方19例:五肽的合成用20种天然氨基酸合成的五肽,组合起来有以下种:二聚体202=400三聚体203=8000四聚体204=160,000五聚体205=3200,000例:五肽的合成用20种天然氨基酸合成的五肽,组合起来有以下种20分子相似性和多样性分析

数据库的化学多样性(chemicaldiversity) 数量巨大的、结构不同的贮藏和检索系统——适用于 先导化合物发现 数据库的化学相似性(chemicalsimilarity)

——适用于先导化合物优化分子相似性和多样性分析21

化学多样性的定量表达——Tanimoto系数用化学空间中电荷和电势等描述符比较不同分子的性质

TC=c/(a+b-c)

a为A中基础片断的描述符的数目; b为B中基础片断的描述符的数目; c为共有的基础片断的描述符的数目 相同分子TC=1;分子没有共同描述符时TC=0 化学多样性的定量表达——Tanimoto系数22四、化学信息学资源

FCD(FineChemicalsDirectory)——MDL维护。 收载约90000个化合物和20000种化合物数据,包括 化学系统名、俗称、分子式、分子量、供应商、价格、

CAS登录号、纯度等。可通过结构式或其它任何数据 检索

ACD(AvailableChemicalsDirectory)——MDL维 护。FCD数据库加上可大批量供货的化学品信息。目 前有25万个化合物

CSD(CambridgeStructureDatabase)——20多 万个结晶的3D结构实验数据及相关数据四、化学信息学资源23生物信息处理

生物信息学(bioinformatics)•基于数学、生命科学、化学和计算机科学的交叉学科•利用计算机信息处理技术对大量生物大分子作信息获取、加工、储存、分类、检索与统计分析,揭示生物大分子的分子结构、功能、同源性和进化关系•推动生命科学的发展,为创新药物的研究和开发奠定基础生物信息处理 生物信息学(bioinformatics)24生物信息学的内容

建立可贮存和管理大量生物信息学数据集 的数据库 处理大量数据的算法和统计方法 分析和解释不同类型的生物数据,如RNA、

DNA和蛋白质序列、蛋白质结构、基因表 达以及生化途径生物信息学的内容25

可视化,数据处理结构预测(同源模建)GenomesTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACAT...ProteinsSRVSVMTVKTSDTCSSRRRSQLVCKRMPGADKPVRARQRV...

序列分析蛋白质作用网络生物信息学的应用

分子动力学模拟 分子相互作用

PowerEdge 6400 可视化,数据处理Genomes蛋白质作用网络生物信息学的应26氨基酸疏水值氨基酸疏水值氨基酸疏水值Ala(A)1.8Gly(G)-0.4Pro(P)-1.6Arg(R)-4.5His(H)-3.2Ser(S)-0.8Asn(N)-3.5Ile(I)4.5Thr(T)-0.7Asp(D)-3.5Leu(L)3.8Trp(W)-0.9Cys(C)2.5Lys(K)-3.9Tyr(Y)-1.3Gln(Q)-3.5Met(M)1.9Val(V)4.2Glu(E)-3.5Phe(F)2.8(一)单个序列分析

根据单个氨基酸的物化性质推测整个蛋白质的性质, 也可预测二级结构出现的可能性

20种氨基酸的疏水参数*一、核酸和蛋白质的序列分析sequenceanalysis氨基酸疏水值氨基酸疏水值氨基酸疏水值Ala(A)1.8Gly27氨基酸螺旋(α)偏好链(β)偏好Glu1.590.52Val0.901.87Pro0.340.31Ala1.410.72Leu1.341.22Lys1.230.69………………根据统计值:谷氨酸(Glu)经常出现在α-螺旋中;缬氨酸(Val)常在β-折叠中发现;脯氨酸(Pro)通常不出现于α-螺旋中和β-折叠中,而倾向于在回折中……(数值=1代表偏好处于平均;>1代表偏好大于平均;<1代表偏好小于平均)*氨基酸螺旋(α)偏好链(β)偏好Glu1.590.52Val28(二)双重序列比较——序列比对sequencealignment

序列对比可以用各种矩阵表达并作相似性打分 两个残基越相似则打分值越高*(二)双重序列比较——序列比对sequencealign29多重序列比对可以从更多细节上揭示保守模式和结构信息可采用多种统计算法进行多重序列比对*(三)多重序列比对multiplesequencealignment多重序列比对可以从更多细节上揭示保守模式和结构信息*(三)30二、蛋白质三维结构预测基因

蛋白质一级结构

蛋白质三维结构决定折叠预测二、蛋白质三维结构预测基因 蛋白质 蛋白质决定折叠预测31

主要方法蛋白三维结构预测从头预测法

abinitio

线引法threading

同源模建法homologymodeling基于知识的预测方法knowledge-basedprediction基于理论的预测方法theory-basedprediction 主要方法从头预测法 线引法 同源模建法基于知识的预测方法k321、从头预测法(abinitioprediction)

采用理论计算(分子力学、分子动力学、量子 化学)方法,直接从分子和原子参数计算出蛋 白质分子的稳定构象, 理论上最理想的方法,但计算量极大,对于实 际分子的计算超过能力范围1、从头预测法(abinitioprediction)332、穿针引线法,线串法,线程法,折叠识别 (threading,foldrecognition)

根据已知的蛋白质三维结构来预测可能的三维 结构——基于知识的预测 可应用于进化非常疏远的结构预测 未知蛋白序列与折叠库中已知结构的蛋白序列 作匹配计算,将序列吻合的三维结构模块串连 起来,得到整个蛋白三维结构2、穿针引线法,线串法,线程法,折叠识别343、同源蛋白模建法homologousmodelbuilding比较分子模拟法comparativemolecularmodeling同源模建homologymodeling同源蛋白法proteinhomology

根据已知的蛋白质三维结构来预测可能的三维 结构——基于知识的预测 同源蛋白有着相似的来源、相似的结构和生物 功能。通过比较蛋白序列的相似性,按同源蛋 白的三维结构为模板,构建未知蛋白的结构 一般要求同源性在30%以上,特别是在结合区 域同源性要好3、同源蛋白模建法homologousmodelbui35步骤:(1)根据未知蛋白质的序列,寻找同源蛋白 (2)二重或多重序列对比 (3)找出共同的二级结构区域,构建骨架 (4)对初始模型作能量优化 (5)判断结构合理性步骤:(1)根据未知蛋白质的序列,寻找同源蛋白36

三、代表性生物信息学数据库(一)核酸数据库

GenBank——美国国立卫生研究所NIH国家生物技术信息中心NCBI

NucleicAcidDatabase(NDB)——由European MolecularBiologyLaboratory(EMBL)创建,现由 英国剑桥的欧洲生物信息学研究所(European BioinformaticsInstitute,EBI)维护

DNADataBankofJapan(DDBJ)——日本国 立遗传学研究所的日本信息生物学中心(Centerfor InformationBiology,CIB)开发维护三大库可交互 三、代表性生物信息学数据库三大库可交互37PDB(ProteinDataBankatBrookhavenNationalLaboratories)——美国ResearchCollaborationforStructuralBioinformatics(RCSB)开发维护的多肽、酶、病毒、碳水化合物和核酸的三维结构数据(二)蛋白质数据库PDB(ProteinDataBankatBrookh38虚拟筛选(virtualscreening)计算机辅助筛选(computer-aidedscreening)计算机筛选(screeninginsilico)三维结构搜寻(three-dimensionalstructuresearching)

虚拟:

•计算机上进行 •不需要化合物,只需结构 •化合物数据库——实际分子的索引;虚拟分子; 类药性分子虚拟筛选(virtualscreening)39

靶点三维结构命中物一、基于靶点结构的虚拟筛选——对接

target-basedvirtualscreening——docking

化合物库搜寻 靶点命中物一、基于靶点结构的虚拟筛选——对接搜寻40VirtualScreening•对接——受体和配基之间通过能量匹配和空间匹配而相互识别形成分子复合物,并预测复合物结构的操作过程

数据库VirtualScreening•对接——受体和配基之间41分子对接的原理分子对接是将已知三维结构数据库中的分子逐一放在靶标分子的活性位点处。通过不断优化受体化合物的位置、构象、分子内部可旋转键的二面角和受体的氨基酸残基侧链和骨架,寻找受体小分子化合物与靶标大分子作用的最佳构象,并预测其结合模式、亲和力和通过打分函数挑选出接近天然构象的与受体亲和力最佳的配体的一种理论模拟分子间作用的方法。

分子对接的原理42分子对接的种类分子对接的种类主要包括:(1)刚体对接:指在对接过程中,研究体系(受体和配体)的构象不发生变化。适合考察比较大的体系,如蛋白质和蛋白质间以及蛋白质和核酸之间的对接。(2)半柔性对接:指在对接过程中,研究体系尤其是配体的构象允许在一定的范围内变化。适合处理大分子和小分子间的对接,对接过程中,小分子的构象一般是可以变化的,但大分子是刚性的。(3)柔性对接:指在对接过程中,研究体系的构象基本上可以自由变化的。一般用于精确考虑分子间的识别情况。由于计算过程中体系的构象可以变化,所以计算耗费最大。分子对接的种类431、靶点检验:

X-晶体衍射——分辨率、R因子、温度因子评价 结构的准确率

NMR——RMSD评价 同源模型——同源性、序列与3D结构的相容性打 分值*

(一)靶点结构的预处理1、靶点检验:*442、靶点处理:加氢原子、加电荷、带电残基的质子化*2、靶点处理:*453、结合位点确定:

复合物中的配体剥离 同源蛋白模型的提示 定点突变(site-mutation) 以程序模拟:InsiteII/Bindsiteanalysis Sybyl/SiteID*3、结合位点确定:*463D结构转化结构优化加电荷类药性分析多样性分析*

(二)小分子数据库的预处理3D结构转化*47(三)分子对接

将小分子配体旋转到靶点结合位点,搜寻 合适的构象和取象,使作用力和形状匹 配,按结合能打分 一般只考虑配体构象,忽略靶点柔性(三)分子对接48

(1)同一分子各种构象 (2)不同分子的最佳构象基于力场的打分函数——以分子间作用力表达,忽略熵变半经验的自由能打分函数基于知识的打分函数——根据已知复合物结构,计算作用力统计值一致性打分——以不同方法分别打分,统计出打分值排名*

(四)打分函数 (1)同一分子各种构象*49[例]

抗艾滋病药物的发现——虚拟筛选

艾滋病病毒,人类免疫缺陷病毒

humanimmunodeficiencyvirus,HIV[例]抗艾滋病药物的发现——虚拟筛选50

HIV-1蛋白酶(HIV-PR),所催化的水解反应在艾滋病病毒 导入人体细胞过程中起着重要的作用•高效的HIV-PR抑制剂为治疗艾滋病的有效药物•肽类HIV-PR抑制剂生物性质不稳定,吸收性差,易被代谢分解,因此口服给药无效 HIV-1蛋白酶(HIV-PR),所催化的水解反应在艾滋511.X-射线晶体结构2.搜寻数据库

DOCK程序受点影象反转

DOCK程序搜寻CSD,对接>200个分子限制:亲和力,易合成NOHRF

O

R=Br:溴氟哌啶醇

R=Cl:氟哌啶醇3.生物测试:高选择性,高活性(Ki=0.1nM)1.X-射线晶体结构 DOCK程序 DOCK程序>20052严重急性呼吸道综合征SevereAcuteRespiratorySyndrome

SARS病原体——SARS冠状病毒SARS-Cov[例]抗SARS冠状病毒药物的设计——基于SARS-CoV3CL蛋白酶的虚拟筛选*严重急性呼吸道综合征SevereAcuteRespira53••••••E蛋白(smallenvelopeprotein,小信封蛋白)S蛋白(spikeglycoprotein,刺突糖蛋白)M蛋白(membraneprotein,膜蛋白)N蛋白(nucleocapsidprotein,核衣壳蛋白)多聚酶(polymerase)类3C蛋白酶(3Clikeproteinase,3CL)*SARS-Cov感染宿主细胞起重要作用的结构蛋白:•E蛋白(smallenvelopeprotein,小信54获得SARS病毒 重要蛋白基因蛋白表达蛋白结构 与功能基本思路:

药物筛选 靶点*获得SARS病毒蛋白蛋白结构基本思路:*553CL蛋白酶作为抗SARS药物筛选靶点的优点:•在冠状病毒复制过程中起着重要作用•有许多已知抑制剂,便于迅速开发•较易表达,有利于加紧研究•有较高的同源性,可用同源法模建三维结构模型*3CL蛋白酶作为抗SARS药物筛选靶点的优点:*56(1)3CL蛋白酶序列(GenBank)与各类冠状病毒蛋白酶序列(PDB)作序列分析和同源性分析(BLAST程序)人冠状病毒;鼠科肝炎病毒;猪传染性腹泻病毒;猫传染性腹膜炎病毒;禽传染性支气管炎病毒;猪冠状病毒;传染性胃肠炎病毒(2)传染性胃肠炎病毒(TGEV)的MPRo与3CL蛋白酶有极高的同源性,特别在底物结合口袋(活性部位)(3)以TGEVMPRo的X-射线晶体结构为模板,模建3CL蛋白酶三维结构(Sybyl6.8/SiteID程序)*步骤1.同源模建(1)3CL蛋白酶序列(GenBank)与各类冠状病毒蛋57(1)所建模型与TGEVMPRo晶体结构基本重叠(2)3CL蛋白酶的折叠方式与TGEVMPRo相同,结合口袋的结构以及空间特征几乎一样3CL蛋白酶结构与MPRo蛋白酶晶体结构的重叠图3CL蛋白酶的缎带模型*结果:(1)所建模型与TGEVMPRo晶体结构基本重叠3CL蛋白58步骤2.分析酶-配体作用模型两种蛋白酶的结合部位(Sybyl6.8/MOLCAD程序)中,小分子C能以同样的方式与两种酶的结合口袋契合

A.TGEVMPRo蛋白酶

B.SARS3CL蛋白酶

C.蛋白酶抑制剂

两种蛋白酶的底物结合口袋的表面特征∴3CL蛋白酶模建模型或TGEVMPRo的晶体结构*步骤2.分析酶-配体作用模型两种蛋白酶的结合部位(S59步骤3.虚拟筛选

以SARS冠状病毒3CL蛋白酶三维结构模型和TGEVMPRo为筛选模型作虚拟筛选(SGIOrigin3800超级计算机和392CPU的神威1号超级计算机)ACD数据库、MDDR数据库、SPECS数据库、中国天然产物数据库(CNPD)和国家药物筛选中心内部样品库——共数十万个化合物(1)DOCK4.0作初筛,选出得分高的前1000个化合物;(2)用Cscore软件和AutoDock3.0软件作评价,从每个数据库中挑选出100个得分最高的化合物结果:共找到300个可能具有抗SARS冠状病毒潜力的*步骤3.虚拟筛选 以SARS冠状病毒3CL蛋白酶三维结60(1)用病毒3CL蛋白酶分子水平筛选模型筛选候选化合物——发现了7个具有高活性的化合物(2)在P3实验室中作SARS病毒感染细胞水平的测试,发现5-HT受体拮抗剂(DDDC-AS-001)有明显的抗SARS病毒感染和保护细胞的作用(3)申请专利,以CADD作结构优化步骤4.药理测试*(1)用病毒3CL蛋白酶分子水平筛选模型筛选候步骤4.61对接研究

•阿尔茨海默症(Alzheimer’sDisease,AD)与乙 酰胆碱(ACh)水平降低和对AChE诱导的β-淀 粉样蛋白(Aβ)聚集有关 •治疗AD的药靶:乙酰胆碱酯酶(

acetylcholinesterase,AChE)和Aβ •AchE抑制剂:美普他酚(Meptazinol)

•研究发现Aβ的聚集与AChE上的外周阴离子位 点(PAS)有关XieQetal.J.Med.Chem.2008,51(7):2027*[例]美普他酚双配体衍生物与AChE的对接研究XieQetal.J.Med.Chem.62

合成n=2-12的多个美普他酚双配体类似物,发现n=9的AChE抑制活性最强(IC50=3.9nM),比美普他酚高2万倍,同时对AChE诱导的Aβ聚集具有明显的抑制作用(IC50=79µM),具双重作用OH

在美普他酚分子中通过引入不同长度连接链,希望使另一个配体能与PAS相互作用

N(CH2)nNHO*美普他酚双配体类似物的设计: 合成n=2-12的多个美普他酚双配体类似物,发现OH 在美63•小鼠乙酰胆碱酯酶(mAChE)——PDB数据库中的琥珀酰胆碱与mAChE的复合物(PDB编号:2HA2)•双配体分子(n=9)的三维结构——以CORINA软件生成,将N原子质子化,再用Tripos力场进行分子力学优化•以GOLD3.0进行分子对接,最后用SYBYL/CScore一致性打分和半经验自由能评价函数X-SCORE打分,评价出最优结合构象以分子对接证明作用模式:*•小鼠乙酰胆碱酯酶(mAChE)——PDB数据库以分子64*对接模型:证明了AChE抑制作用和Aβ聚集抑制作用AChE催化位点PAS中心*对接模型:证明了AChE抑制作用和Aβ聚集抑制作用ACh65224n=9双配体与mAChE对接的二维平面示意图(Ligplot)配体单元深入底部的催化中心,苯环与Trp86发另一配体单元处于PAS区生面对面的疏水作用 酚羟基与His447

的羰基形成氢键 氮原子与Tyr124

酚羟基形成氢键 氮杂卓环与Trp286形生面对面的疏水作用*224n=9双配体与mAChE对接的二维平面示意图(Ligp66结合方式与对接相似*双配基配体与电鳐TcAChE复合物的单晶X衍射证明:结合方式与对接相似*双配基配体与电鳐TcAChE复合物的单67n=9酚羟基与His440

形成氢键 氮卓杂环与Trp84面 对面的疏水作用 氮卓杂环与Trp279

形成疏水作用酚羟基与Tyr70和Glu73形成氢键*n=9酚羟基与His440 形成氢键*68药物三维结构

(含药效基团单元)药效基团识别药效基团命中物二、基于配体相似性的虚拟筛选ligandsimilarity-basedvirtualscreening

基于药效基团的结构搜寻

化合物库搜寻药物三维结构药效基团识别药效命中物二、基于配体相似性的虚拟筛69药效基团的获取基于靶点的药效基团基于配体的药效基团药效基团的获取基于靶点的药效基团基于配体的药效基团701、二维药效基团搜寻

以平面的提问结构搜寻化合物结构式

二维药效基团搜寻

二维子结构搜寻 二维相似性搜寻1、二维药效基团搜寻71NONNOONNNNNNNNO

O

OO

NNOONOONOOquery(1)二维子结构搜寻

搜寻具有与提问结构相同子结构的化合物分子NONNOONNNNNNNNO ONONOO72(2)二维相似性搜寻

搜寻与提问结构某些特征相似的化合物分子

生物电子等排体(2)二维相似性搜寻73OONOOOOO

NOOOONNNOOOOOONNNNSOOOOOPOOPO OOOPOONNNNNOOOOONNNONOOObnbabc2、三维药效基团搜寻

搜寻具有与相同作用基团和空间排布的化合物分子OONOOOOO NOOONNNOOOOOONNNNSOOO74•D3受体选择性拮抗剂——苯酰胺类和的四氢萘类NNHNN

[例]D2/D3受体选择性拮抗剂药效基团模型•多巴胺D2类受体为抗帕金森症和安定类药物的靶点•D3/D4受体可能与精神分裂症有关•D2受体选择性拮抗剂——取代哌嗪/哌啶类

RNNNHClNNNHXORNNNR1R2*•D3受体选择性拮抗剂——苯酰胺类和的四氢萘类NNHNN [75•挑选26个D2受体选择性和22个D3受体选择性的化合物分别作为训练集,分别产生D2受体D3受体模型•以Catalyst将结构式转化为三维构象,用Bestconformationalanalysis进行构象优化•用Catalyst/HypoGen产生药效基团。选择5个结构特征作为药效基团单元:HBAcceptor,HBDonor,HYDPHOBIC,HYDROPHOBaromatic,RINGAROMATIC•为D2/D3受体选择性拮抗剂分别产生了10个得分从高到低的Hypothesis*药效基团模型的建立:•挑选26个D2受体选择性和22个D3受体选择性的化合*76

药效基团模型的可信度:•对于D2受体和D3受体产生的药效团模型,每个药效基团模型的得分与理想模型的得分差值均大于40,说明数据关联的可能性较大•所建立的D2受体和D3受体药效团模型可用于虚拟筛选* 药效基团模型的可信度:*77•以未知化合物作为验证集•大部分预测值与实验值处于同一个数量级,并反映D2/D3受体的选择性D2(左)和D3(右)受体拮抗剂药效基团MAPPING图*未知化合物的活性预测:•以未知化合物作为验证集•大部分预测值与实验值处于同一个数7811/27/2022药物的化学信息计算机系统11/27/2022药物的化学信息计算机系统79化学信息学(Chemoinformatics,chemicalinformatics,Cheminformatics,chemi-informatics)利用计算机信息处理技术对化学分子结构,性质,来源及用途等相关信息进行管理(包括储存,分析,处理,检索和传递等)的一种综合性技术和学科。应用化学信息学可促进化学信息的获取、转化与共享化学信息处理化学信息学(Chemoinformatics,chemica802D:3D:H3CC化学分子结构的层次

1D:CH3CHO

OH*一、2D和3D分子结构的计算机处理方法2D:3D:H3CC化学分子结构的层次H*一、2D和3D分81(一)以一维形式表示

对2D结构进行编码——储存和交换化学结构式数据 的命名法•SMILES(SimplifiedMolecularInputLineEntrySystem,简化分子线性输入系统)•SLN(Sybyllinearnotation,Sybyl线性标记法)*(一)以一维形式表示•SMILES(Simplifi82SMILES

按化合价模型,每个原子被氢原子饱和;双键用=

表示;三键用#表示;环化分子用闭合原子序号表 示;芳香环中不饱和原子用小写字母表示甲烷CH4C水乙醇

H2OOC2H5OHCCO氰化氢HCNC#N环已烷C6H12C1CCCCC1吡啶C5H5Nn1ccccc1*SMILES甲烷CH4C水 H2OO氰化83•分子中分支用()表示;用/和\表示双键顺反异 构;对映异构:手性原子用[]表示,@表示反时 针,@@表示顺时针反式二溴甲烷顺式二溴甲烷L-丙氨酸D-丙氨酸

Br/C=C/Br或Br\C=C\Br Br\C=C/Br或Br/C=C\BrN[C@@H](C)C(=O)O N[C@H](C)C(=O)O*•分子中分支用()表示;用/和\表示双键顺反异反84•用图表示•用矩阵表示CCCC CCC

NCHHC OHO*(二)以二维形式表示•用图表示•用矩阵表示CCCCCC NHHCHO*(二)85•用连接表表示*•用连接表表示*86(三)以三维形式表示

1、直接坐标法

用卡迪尔坐标直接存储每个原子的三维坐 标(x,y,z)*(三)以三维形式表示*87每个原子位置以与其他原子间的3个相对位置关系表示——距离、夹角、二面角r1和r2为键长,α为键角,τ为扭转角α876

514321378624τ 5zr2r1y1,2-二氯乙烷*2、内坐标法每个原子位置以与其他原子间的3个相对r1和r2为键长,α为键88(四)分子存储格式及其相互转换

每一软件系统都有自己的分子存储格式

MDL公司的MOL格式(MACSS格式) Tripos公司的MOL2格式 剑桥晶体数据库CSD的FDAT和CIF格式 蛋白质数据库PDB的PDB格式(ENT格式)*(四)分子存储格式及其相互转换*89基本存储: 分子的元素组成、原子坐标、原子连接关系还能存储: 分子子结构信息,能适用于生物大分子 原子电荷信息,调用时不必再计算 确定特定原子化学环境的原子类型信息*基本存储:*90二、化合物数据库的生成和管理

输入 搜寻和检索 管理 输出二、化合物数据库的生成和管理91合成反应信息管理软件及数据库目的:用于计算机获取,管理,搜寻,检索合成反应,包括反应物,产物的结构式及其反应的有关信息计算机辅助有机合成:应用计算机合成反应管理软件从反应数据库中寻找和检索合成反应方法合成反应信息管理软件及数据库目的:用于计算机获取,管理,搜寻92合成反应信息管理软件及数据库管理软件的功能:输入:绘制反应物和产物结构输入其他反应信息搜寻与检索:一般用户绘制出并指明产物或反应物结构。合成反应信息管理软件及数据库管理软件的功能:输入其他反应信息93ISIS(IntegratedScientificInformationManagement System)——MDL的综合性结构和反应管理软件•由三个主要分软件组成:(1)ISIS/DRAW——用于输入结构式和搜寻询问条件(2)ISIS/BASE——用于生成局部数据库及处理信息(3)ISIS/HOST——主服务器应用程序,进行通讯连 接,集中数据库数据并作处理ISIS(IntegratedScientificIn942D结构输入:

——计算机绘制化学结构式 •首先输入原子和键的骨架结构,原子数、电荷会自动变 为上下标 •软件的模板中收集大量分子片段 •可智能分析结构式,处理结构式的编码和变换 •还可有附加功能, 如自动命名、化学计 算、光谱分析等2D结构输入:95三维结构的转化:

3D结晶结构转入3D数据库 软件将2D化学结构迅速地转为3D模型NHHNCH3OCH3O三维结构的转化:NHCH3OCH3O96三.组合化学信息管理软件及数据库意义:产生先导化合物的有效方法库中化合物既可是分子实体,也可是虚拟化合物库的质量指标:化学多样性先导化合物优化库的规模先导化合物筛选103~106<103三.组合化学信息管理软件及数据库意义:产生先导化合物的有效方97例:五肽的合成用20种天然氨基酸合成的五肽,组合起来有以下种:二聚体202=400三聚体203=8000四聚体204=160,000五聚体205=3200,000例:五肽的合成用20种天然氨基酸合成的五肽,组合起来有以下种98分子相似性和多样性分析

数据库的化学多样性(chemicaldiversity) 数量巨大的、结构不同的贮藏和检索系统——适用于 先导化合物发现 数据库的化学相似性(chemicalsimilarity)

——适用于先导化合物优化分子相似性和多样性分析99

化学多样性的定量表达——Tanimoto系数用化学空间中电荷和电势等描述符比较不同分子的性质

TC=c/(a+b-c)

a为A中基础片断的描述符的数目; b为B中基础片断的描述符的数目; c为共有的基础片断的描述符的数目 相同分子TC=1;分子没有共同描述符时TC=0 化学多样性的定量表达——Tanimoto系数100四、化学信息学资源

FCD(FineChemicalsDirectory)——MDL维护。 收载约90000个化合物和20000种化合物数据,包括 化学系统名、俗称、分子式、分子量、供应商、价格、

CAS登录号、纯度等。可通过结构式或其它任何数据 检索

ACD(AvailableChemicalsDirectory)——MDL维 护。FCD数据库加上可大批量供货的化学品信息。目 前有25万个化合物

CSD(CambridgeStructureDatabase)——20多 万个结晶的3D结构实验数据及相关数据四、化学信息学资源101生物信息处理

生物信息学(bioinformatics)•基于数学、生命科学、化学和计算机科学的交叉学科•利用计算机信息处理技术对大量生物大分子作信息获取、加工、储存、分类、检索与统计分析,揭示生物大分子的分子结构、功能、同源性和进化关系•推动生命科学的发展,为创新药物的研究和开发奠定基础生物信息处理 生物信息学(bioinformatics)102生物信息学的内容

建立可贮存和管理大量生物信息学数据集 的数据库 处理大量数据的算法和统计方法 分析和解释不同类型的生物数据,如RNA、

DNA和蛋白质序列、蛋白质结构、基因表 达以及生化途径生物信息学的内容103

可视化,数据处理结构预测(同源模建)GenomesTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACAT...ProteinsSRVSVMTVKTSDTCSSRRRSQLVCKRMPGADKPVRARQRV...

序列分析蛋白质作用网络生物信息学的应用

分子动力学模拟 分子相互作用

PowerEdge 6400 可视化,数据处理Genomes蛋白质作用网络生物信息学的应104氨基酸疏水值氨基酸疏水值氨基酸疏水值Ala(A)1.8Gly(G)-0.4Pro(P)-1.6Arg(R)-4.5His(H)-3.2Ser(S)-0.8Asn(N)-3.5Ile(I)4.5Thr(T)-0.7Asp(D)-3.5Leu(L)3.8Trp(W)-0.9Cys(C)2.5Lys(K)-3.9Tyr(Y)-1.3Gln(Q)-3.5Met(M)1.9Val(V)4.2Glu(E)-3.5Phe(F)2.8(一)单个序列分析

根据单个氨基酸的物化性质推测整个蛋白质的性质, 也可预测二级结构出现的可能性

20种氨基酸的疏水参数*一、核酸和蛋白质的序列分析sequenceanalysis氨基酸疏水值氨基酸疏水值氨基酸疏水值Ala(A)1.8Gly105氨基酸螺旋(α)偏好链(β)偏好Glu1.590.52Val0.901.87Pro0.340.31Ala1.410.72Leu1.341.22Lys1.230.69………………根据统计值:谷氨酸(Glu)经常出现在α-螺旋中;缬氨酸(Val)常在β-折叠中发现;脯氨酸(Pro)通常不出现于α-螺旋中和β-折叠中,而倾向于在回折中……(数值=1代表偏好处于平均;>1代表偏好大于平均;<1代表偏好小于平均)*氨基酸螺旋(α)偏好链(β)偏好Glu1.590.52Val106(二)双重序列比较——序列比对sequencealignment

序列对比可以用各种矩阵表达并作相似性打分 两个残基越相似则打分值越高*(二)双重序列比较——序列比对sequencealign107多重序列比对可以从更多细节上揭示保守模式和结构信息可采用多种统计算法进行多重序列比对*(三)多重序列比对multiplesequencealignment多重序列比对可以从更多细节上揭示保守模式和结构信息*(三)108二、蛋白质三维结构预测基因

蛋白质一级结构

蛋白质三维结构决定折叠预测二、蛋白质三维结构预测基因 蛋白质 蛋白质决定折叠预测109

主要方法蛋白三维结构预测从头预测法

abinitio

线引法threading

同源模建法homologymodeling基于知识的预测方法knowledge-basedprediction基于理论的预测方法theory-basedprediction 主要方法从头预测法 线引法 同源模建法基于知识的预测方法k1101、从头预测法(abinitioprediction)

采用理论计算(分子力学、分子动力学、量子 化学)方法,直接从分子和原子参数计算出蛋 白质分子的稳定构象, 理论上最理想的方法,但计算量极大,对于实 际分子的计算超过能力范围1、从头预测法(abinitioprediction)1112、穿针引线法,线串法,线程法,折叠识别 (threading,foldrecognition)

根据已知的蛋白质三维结构来预测可能的三维 结构——基于知识的预测 可应用于进化非常疏远的结构预测 未知蛋白序列与折叠库中已知结构的蛋白序列 作匹配计算,将序列吻合的三维结构模块串连 起来,得到整个蛋白三维结构2、穿针引线法,线串法,线程法,折叠识别1123、同源蛋白模建法homologousmodelbuilding比较分子模拟法comparativemolecularmodeling同源模建homologymodeling同源蛋白法proteinhomology

根据已知的蛋白质三维结构来预测可能的三维 结构——基于知识的预测 同源蛋白有着相似的来源、相似的结构和生物 功能。通过比较蛋白序列的相似性,按同源蛋 白的三维结构为模板,构建未知蛋白的结构 一般要求同源性在30%以上,特别是在结合区 域同源性要好3、同源蛋白模建法homologousmodelbui113步骤:(1)根据未知蛋白质的序列,寻找同源蛋白 (2)二重或多重序列对比 (3)找出共同的二级结构区域,构建骨架 (4)对初始模型作能量优化 (5)判断结构合理性步骤:(1)根据未知蛋白质的序列,寻找同源蛋白114

三、代表性生物信息学数据库(一)核酸数据库

GenBank——美国国立卫生研究所NIH国家生物技术信息中心NCBI

NucleicAcidDatabase(NDB)——由European MolecularBiologyLaboratory(EMBL)创建,现由 英国剑桥的欧洲生物信息学研究所(European BioinformaticsInstitute,EBI)维护

DNADataBankofJapan(DDBJ)——日本国 立遗传学研究所的日本信息生物学中心(Centerfor InformationBiology,CIB)开发维护三大库可交互 三、代表性生物信息学数据库三大库可交互115PDB(ProteinDataBankatBrookhavenNationalLaboratories)——美国ResearchCollaborationforStructuralBioinformatics(RCSB)开发维护的多肽、酶、病毒、碳水化合物和核酸的三维结构数据(二)蛋白质数据库PDB(ProteinDataBankatBrookh116虚拟筛选(virtualscreening)计算机辅助筛选(computer-aidedscreening)计算机筛选(screeninginsilico)三维结构搜寻(three-dimensionalstructuresearching)

虚拟:

•计算机上进行 •不需要化合物,只需结构 •化合物数据库——实际分子的索引;虚拟分子; 类药性分子虚拟筛选(virtualscreening)117

靶点三维结构命中物一、基于靶点结构的虚拟筛选——对接

target-basedvirtualscreening——docking

化合物库搜寻 靶点命中物一、基于靶点结构的虚拟筛选——对接搜寻118VirtualScreening•对接——受体和配基之间通过能量匹配和空间匹配而相互识别形成分子复合物,并预测复合物结构的操作过程

数据库VirtualScreening•对接——受体和配基之间119分子对接的原理分子对接是将已知三维结构数据库中的分子逐一放在靶标分子的活性位点处。通过不断优化受体化合物的位置、构象、分子内部可旋转键的二面角和受体的氨基酸残基侧链和骨架,寻找受体小分子化合物与靶标大分子作用的最佳构象,并预测其结合模式、亲和力和通过打分函数挑选出接近天然构象的与受体亲和力最佳的配体的一种理论模拟分子间作用的方法。

分子对接的原理120分子对接的种类分子对接的种类主要包括:(1)刚体对接:指在对接过程中,研究体系(受体和配体)的构象不发生变化。适合考察比较大的体系,如蛋白质和蛋白质间以及蛋白质和核酸之间的对接。(2)半柔性对接:指在对接过程中,研究体系尤其是配体的构象允许在一定的范围内变化。适合处理大分子和小分子间的对接,对接过程中,小分子的构象一般是可以变化的,但大分子是刚性的。(3)柔性对接:指在对接过程中,研究体系的构象基本上可以自由变化的。一般用于精确考虑分子间的识别情况。由于计算过程中体系的构象可以变化,所以计算耗费最大。分子对接的种类1211、靶点检验:

X-晶体衍射——分辨率、R因子、温度因子评价 结构的准确率

NMR——RMSD评价 同源模型——同源性、序列与3D结构的相容性打 分值*

(一)靶点结构的预处理1、靶点检验:*1222、靶点处理:加氢原子、加电荷、带电残基的质子化*2、靶点处理:*1233、结合位点确定:

复合物中的配体剥离 同源蛋白模型的提示 定点突变(site-mutation) 以程序模拟:InsiteII/Bindsiteanalysis Sybyl/SiteID*3、结合位点确定:*1243D结构转化结构优化加电荷类药性分析多样性分析*

(二)小分子数据库的预处理3D结构转化*125(三)分子对接

将小分子配体旋转到靶点结合位点,搜寻 合适的构象和取象,使作用力和形状匹 配,按结合能打分 一般只考虑配体构象,忽略靶点柔性(三)分子对接126

(1)同一分子各种构象 (2)不同分子的最佳构象基于力场的打分函数——以分子间作用力表达,忽略熵变半经验的自由能打分函数基于知识的打分函数——根据已知复合物结构,计算作用力统计值一致性打分——以不同方法分别打分,统计出打分值排名*

(四)打分函数 (1)同一分子各种构象*127[例]

抗艾滋病药物的发现——虚拟筛选

艾滋病病毒,人类免疫缺陷病毒

humanimmunodeficiencyvirus,HIV[例]抗艾滋病药物的发现——虚拟筛选128

HIV-1蛋白酶(HIV-PR),所催化的水解反应在艾滋病病毒 导入人体细胞过程中起着重要的作用•高效的HIV-PR抑制剂为治疗艾滋病的有效药物•肽类HIV-PR抑制剂生物性质不稳定,吸收性差,易被代谢分解,因此口服给药无效 HIV-1蛋白酶(HIV-PR),所催化的水解反应在艾滋1291.X-射线晶体结构2.搜寻数据库

DOCK程序受点影象反转

DOCK程序搜寻CSD,对接>200个分子限制:亲和力,易合成NOHRF

O

R=Br:溴氟哌啶醇

R=Cl:氟哌啶醇3.生物测试:高选择性,高活性(Ki=0.1nM)1.X-射线晶体结构 DOCK程序 DOCK程序>200130严重急性呼吸道综合征SevereAcuteRespiratorySyndrome

SARS病原体——SARS冠状病毒SARS-Cov[例]抗SARS冠状病毒药物的设计——基于SARS-CoV3CL蛋白酶的虚拟筛选*严重急性呼吸道综合征SevereAcuteRespira131••••••E蛋白(smallenvelopeprotein,小信封蛋白)S蛋白(spikeglycoprotein,刺突糖蛋白)M蛋白(membraneprotein,膜蛋白)N蛋白(nucleocapsidprotein,核衣壳蛋白)多聚酶(polymerase)类3C蛋白酶(3Clikeproteinase,3CL)*SARS-Cov感染宿主细胞起重要作用的结构蛋白:•E蛋白(smallenvelopeprotein,小信132获得SARS病毒 重要蛋白基因蛋白表达蛋白结构 与功能基本思路:

药物筛选 靶点*获得SARS病毒蛋白蛋白结构基本思路:*1333CL蛋白酶作为抗SARS药物筛选靶点的优点:•在冠状病毒复制过程中起着重要作用•有许多已知抑制剂,便于迅速开发•较易表达,有利于加紧研究•有较高的同源性,可用同源法模建三维结构模型*3CL蛋白酶作为抗SARS药物筛选靶点的优点:*134(1)3CL蛋白酶序列(GenBank)与各类冠状病毒蛋白酶序列(PDB)作序列分析和同源性分析(BLAST程序)人冠状病毒;鼠科肝炎病毒;猪传染性腹泻病毒;猫传染性腹膜炎病毒;禽传染性支气管炎病毒;猪冠状病毒;传染性胃肠炎病毒(2)传染性胃肠炎病毒(TGEV)的MPRo与3CL蛋白酶有极高的同源性,特别在底物结合口袋(活性部位)(3)以TGEVMPRo的X-射线晶体结构为模板,模建3CL蛋白酶三维结构(Sybyl6.8/SiteID程序)*步骤1.同源模建(1)3CL蛋白酶序列(GenBank)与各类冠状病毒蛋135(1)所建模型与TGEVMPRo晶体结构基本重叠(2)3CL蛋白酶的折叠方式与TGEVMPRo相同,结合口袋的结构以及空间特征几乎一样3CL蛋白酶结构与MPRo蛋白酶晶体结构的重叠图3CL蛋白酶的缎带模型*结果:(1)所建模型与TGEVMPRo晶体结构基本重叠3CL蛋白136步骤2.分析酶-配体作用模型两种蛋白酶的结合部位(Sybyl6.8/MOLCAD程序)中,小分子C能以同样的方式与两种酶的结合口袋契合

A.TGEVMPRo蛋白酶

B.SARS3CL蛋白酶

C.蛋白酶抑制剂

两种蛋白酶的底物结合口袋的表面特征∴3CL蛋白酶模建模型或TGEVMPRo的晶体结构*步骤2.分析酶-配体作用模型两种蛋白酶的结合部位(S137步骤3.虚拟筛选

以SARS冠状病毒3CL蛋白酶三维结构模型和TGEVMPRo为筛选模型作虚拟筛选(SGIOrigin3800超级计算机和392CPU的神威1号超级计算机)ACD数据库、MDDR数据库、SPECS数据库、中国天然产物数据库(CNPD)和国家药物筛选中心内部样品库——共数十万个化合物(1)DOCK4.0作初筛,选出得分高的前1000个化合物;(2)用Cscore软件和AutoDock3.0软件作评价,从每个数据库中挑选出100个得分最高的化合物结果:共找到300个可能具有抗SARS冠状病毒潜力的*步骤3.虚拟筛选 以SARS冠状病毒3CL蛋白酶三维结138(1)用病毒3CL蛋白酶分子水平筛选模型筛选候选化合物——发现了7个具有高活性的化合物(2)在P3实验室中作SARS病毒感染细胞水平的测试,发现5-HT受体拮抗剂(DDDC-AS-001)有明显的抗SARS病毒感染和保护细胞的作用(3)申请专利,以CADD作结构优化步骤4.药理测试*(1)用病毒3CL蛋白酶分子水平筛选模型筛选候步骤4.139对接研究

•阿尔茨海默症(Alzheimer’sDisease,AD)与乙 酰胆碱(ACh)水平降低和对AChE诱导的β-淀 粉样蛋白(Aβ)聚集有关 •治疗AD的药靶:乙酰胆碱酯酶(

acetylcholinesterase,AChE)和Aβ •AchE抑制剂:美普他酚(Meptazinol)

•研究发现Aβ的聚集与AChE上的外周阴离子位 点(PAS)有关XieQetal.J.Med.Chem.2008,51(7):2027*[例]

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论