outdockvina分子对接操作手册_第1页
outdockvina分子对接操作手册_第2页
outdockvina分子对接操作手册_第3页
outdockvina分子对接操作手册_第4页
outdockvina分子对接操作手册_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

虚拟筛选实例分析主要内容1、对接理论局部a/分子对接介绍。b/靶点的选择、结合位点确实认;c/虚拟筛选的一般流程;2、对接实战局部a/小分子数据库的建设;b/软件AutoDockVina的介绍;c/实例演示。获得受体PDB文件和3D小分子数据库;受体对接前处理;受体结合位点确实定;晶格的生成;对接操作;结果查看与软件分析〔蛋白文件准备、小分子文件准备、建盒子、对接〕3、后续分析流程常用的后续小分子分析方法介绍; 2虚拟筛选实例分析虚拟筛选3虚拟筛选实例分析是计算机辅助药物设计的核心技术之一。狭义上讲,基于分子对接的数据库搜索方法称为虚拟筛选。广义地讲,只要是基于某种问题形式的数据库筛选方法都可以称为虚拟筛选。虚拟筛选的目标是从几十到上百万个分子中,发现具成药性的先导化合物,降低实验筛选化合物数量,缩短研究周期,节约研究经费。虚拟筛选根本方法4虚拟筛选实例分析虚拟筛选基于配体基于受体LBVSSBVSLBVS是根据药物活性的一系列化合物的结构、理化性质与生物活性的分析,建立适宜的查询结构,进而进行小分子库的搜索,如基于药效团模型的虚拟筛选。基于药效团模型的虚拟筛选是应用最多的LBVS方法之一。SBVS主要是指基于分子对接的虚拟筛选方法。虚拟筛选方法可分为基于配体结构的虚拟筛选(1igand-basedvirtualscreening,LBVS)和基于受体的虚拟筛选(structure-basedvirtualscreening,SBVS)两种形式。5分子对接的最初思想起源于FisherE提出的“锁和钥匙模型”。即受体与配体的相互识别首要条件是空间结构的匹配。

配体受体复合物受体-配体的锁和钥匙模型

虚拟筛选实例分析分子对接6perfectmatch!虚拟筛选实例分析这类方法首先要建立大量化合物〔例如几十至上百万个化合物〕的三维结构数据库,然后将库中的分子逐一与靶标分子进行“对接”〔docking〕,通过不断优化小分子化合物的位置〔取向〕以及分子内部柔性键的二面角〔构象〕,寻找小分子化合物与靶标大分子作用的最正确构象,计算其相互作用及结合能。在库中所有分子均完成了对接计算之后,即可从中找出与靶标分子结合的最正确分子〔前50或前100名〕分子对接的根本方法(1)刚体对接:指在对接过程中,研究体系(受体和配体)的构象不发生变化。适合考察比较大的体系,如蛋白质和蛋白质间以及蛋白质和核酸之间的对接。(2)半柔性对接:指在对接过程中,研究体系尤其是配体的构象允许在一定的范围内变化。适合处理大分子和小分子间的对接,对接过程中,小分子的构象一般是可以变化的,但大分子是刚性的。(3)柔性对接:指在对接过程中,研究体系的构象基本上可以自由变化的。一般用于精确考虑分子间的识别情况。由于计算过程中体系的构象可以变化,所以计算耗费最大。7虚拟筛选实例分析8虚拟筛选流程9虚拟筛选实例分析(A)准备工作蛋白靶标化合物数据库分子对接结果(B)虚拟筛选对接软件:Autodockvina、Gold,Dock,Discoverstudio等。化合物数据库:pdbqt格式

2D->3D

软件openbabel蛋白靶标:来源PDB数据库结构分析软件MGLTOOLS化合物数据库10虚拟筛选实例分析PubChem()是由美国国家卫生研究所〔NIH〕建立的关于小分子生物活性的公共数据库.11PubChemPcsubstancecontainsabout120millionrecords.Pccompoundcontainsnearly48millionuniquestructures.PCBioAssaycontainsmorethan717,000BioAssays.支持文本检索和结构检索

虚拟筛选实例分析PubChem检索可得到的结果包含了分子式、SMILES、2D和3D结构、InChI和InChIKey、相对分子质量、脂水分配系数、氢键受体和供体数目、可旋转键数目、互变异构体数目等根本的结构信息和物化性质,除此以外,还有该化合物作为药物的剂型和商品信息、药理性质、毒性、生物活性检测等信息,并通过文献分类副标题可以查看相关文献。12虚拟筛选实例分析DrugBankDrugBank〔〕是1个包含药物的结构、药效、作用靶标等信息的综合数据库,是由Alberta大学计算机科学和生物学系的DavidWishart博士最初建立的。13主要应用于计算机辅助的药物靶标的发现、药物设计、药物分子对接或筛选、药物活性和作用预测等方面。迄今,drugbank包含了6811种药物,1528种FDA批准的小分子药物,150种FDA批准的生物技术药,87种营养药和5080种实验药。每一种药物都有一个drugcard,每个drugcard包含150种数据字段,其中一半描述了药物信息,另外一半描述了药物靶标信息。虚拟筛选实例分析药物信息包括了该药物的CAS号、商品名、分子式、分子量、SMILES、2D和3D结构、logP、logS、pKa、熔点、吸收性、Caco-2细胞穿透性、药物类别和临床使用、性质描述、剂型与给药途径、半衰期、体内的生物转化、毒性、作用于哪些生物体、食物对服用的影响、与其它药物的相互作用、作用机理、代谢途径、药理学特征、与蛋白质的结合情况、溶解度、物质形态、同义词、关于合成的相关文献等,还与ChEBI、GenBank、PubChem等外部数据库有链接。14虚拟筛选实例分析ZINC包含2000多万个化合物分子,适用于虚拟筛选。通过ZINCid、SMILES格式等进行检索,检索结果中给出了化合物的结构,一些化合物的重要性质,包括xlogP,溶解度,氢键给体和受体数目等,以及二维和三维结构,供给商信息。用户可以自行绘制或输入分子的SMILES字符串来上传待检索的分子,同时,还可以限定净电荷量、xLogP、可旋转键数、氢键供体和受体数等参数范围。库中的分子结构均可被免费下载,支持SMILES、mol2、3DSDF和DOCKflexibase格式,并且,化合物的相关信息可以以表格形式下载,便于用户使用。15ZINC()ZINC数据库(://)是免费的用于虚拟筛选的化合物数据库,由美国加州大学药物化学系的Shoichet教授实验室建立并维护。其口号就是“ZINCisnotcommercial”。为了方便虚拟筛选和分子对接的研究者而设计的小分子数据库。虚拟筛选实例分析eMolecules该数据库可以通过结构搜索和文本检索获得结果,前者包括子结构检索和精确检索,后者包括化合物名称、CAS号和SMILES,支持SDF文件上传,以及多个化合物批量查找。结果信息中包括化合物的分子式、CAS号、分子量、logP值、SMILES等,并列出了供给商的链接,建立起买卖之间的桥梁,方便购置。16eMolecules〔〕eMolecules是eMolecules.Inc于2005年创立的关于商购化合物的数据库。其提出的口号是“使购置化合物像买书一样简单”。虚拟筛选实例分析17DatabaseDescriptionPubChemPubChemisadatabaseofchemicalmoleculeswhichmaintainsthreetypesofinformationnamely,substance,compoundandBioAssays.ZINCZINCdatabasecontains21millioncompoundsavailableforvirtualscreening.Inthisdatabasevariousmoleculefeatureslikemolecularweight,logPetcareincluded.ChEMBLThisdatabaseprovidescomprehensiveinformationabout1millionbioactive(smalldrug-likemolecules)compoundswith8200drugtargets.NCINCIdatabasehadmorethan275,000smallmoleculesstructures,averyusefulresourceforresearchersworkinginthefilledofcancer/AIDS.ChemDBItisadatabseoffivemillionchemicalswhichcontainsinformationofchemicalsthatincludespredictedorexperimentallydeterminedphysicochemicalproperties,suchas3Dstructure,meltingtemperatureandsolubility.ChemSpiderChemSpidercontainsmorethan28millionuniquechemicalentitiesaggregatedfrommorethan400diversedatasources.BindingDBItisabindingaffinitydatabaseofsmallmoleculeswhichcontains910,836bindingdata,for6,263proteintargetsand378,980smallmolecules.PDB-BindItisacollectionofbindingaffinitiesforprotein-ligandcomplexeswithknownthree-dimensionalstructures.Itcontains5671protein-ligandcomplexes.PDBeChemItprovidescomprehensiveinformationofligands,smallmoleculesandmonomers.Presentlyitconsists15502ligands.KEGGItisadatabaseresourcethatintegratesgenomic,chemicalandsystemicfunctionalinformation.HMDBAdatabasecontainingdetailedinformationaboutsmallmoleculemetabolitesfoundinthehumanbody.SMPDBItisSmallmoleculePathwaydatabasethatcontainingmorethan350small-moleculepathwaysfoundinhumans.BIAdbItisacomprehensivedatabaseofbenzylisoquinolinealkaloidswhichcontainsinformationabout846uniquebenzylisoquinolinealkaloids.DrugBankThedatabasethatcombinesdetaileddrug(i.e.chemical,pharmacologicalandpharmaceutical)datawithcomprehensivedrugtarget(i.e.sequence,structure,andpathway)information.Thedatabasecontains6712drugentriesincluding1448FDA-approvedsmallmoleculedrugs,131FDA-approvedbiotech(protein/peptide)drugs,85nutraceuticalsand5080experimentaldrugs.HITHITisacomprehensivedatabaseforproteintargetsforFDA-approveddrugsaswellasthepromisingprecursors.Itcurrentlycontainsabout1,301knownproteintargets(221proteinsaredescribedasdirecttargets).SuperNaturalAfreelyavailabledatabaseofapproximately50,000naturalcompounds.NPACTItcontainsexperimentallyvalidatedplant-derivednaturalcompoundsexhibitinganti-cancerousactivity.Currentlyitcontains1574compoundentries.TTDThisdatabaseprovideinformationabouttheknownandexploredtherapeuticproteinandnucleicacidtargets,thetargeteddisease,pathwayinformationandthecorrespondingdrugsdirectedateachofthesetargets.PharmaGKBItisapharmacogenomicsknowledgeresourcethatencompassesclinicalinformationofdrugmolecules.SuperDrugThisdatabasecontainsapproximately25003D-structuresofactiveingredientsofessentialmarketeddrugs.化合物类药性相关参数范围参数最小值最大值LOGP -25分子量 200500氢键给体05氢键受体010摩尔折射率40130旋转键数目010重原子数目2070极性表面积0120电荷-2218虚拟筛选实例分析构建个性化的化合物数据库小分子结构信息化学分子结构的层次1D:CH3CHO2D:3D:19虚拟筛选实例分析一维形式SMILES格式简化分子线性输入标准〔英文:Simplifiedmolecularinputlineentryspecification,简称SMILES〕,是一种用ASCII字符串明确描述分子结构的标准。SMILES用一串字符来描述一个三维化学结构,将化学结构转化成一个生成树,采用纵向优先遍历树算法。转化时,先要去掉氢,还要把环翻开。表示时,被拆掉的键端的原子要用数字标记,支链写在小括号里。SMILES字符串可以被大多数分子编辑软件导入并转换成二维图形或分子的三维模型。20虚拟筛选实例分析原子:方括号内的化学元素符号表示。例如[Au]表示“金”。有机物中的C、N、O、P、S、Br、Cl、I等原子可以省略方括号,其他元素必须包括在方括号之内。氢原子常被省略。对于省略了方括号的原子,用氢原子补足价数。例如,水的SMILES就是O,乙醇是CCO。离子用方括号括起,用元素符号和电荷表示,"+"表示正电荷、"-"表示负电荷,电荷数跟在正负号之后。如果该原子与氢原子相连,氢原子写在元素符号后面。例如,四价钛离子(Ti4+)写作

[Ti+4]

[Ti++++]

。三价钴离子(Co3+)写作

[Co+3]

[Co+++]

。氢氧根

(OH-)表示为

[OH-]

,水合氢离子

(H3O+)表示为

[OH3+]

。21虚拟筛选实例分析化学键:双键用“=”表示;三键用“#”表示。例如,含有双键的二氧化碳那么表示为O=C=O,含有三键的氰化氢表示为C#N。环:如果结构中有环,那么要翻开。断开处的两个原子用同一个数字标记,表示原子间有键相连。例如,环己烷〔C6H12〕表示为C1CCCCC1。芳环中的C、O、S、N原子分别用用小写字母c,o,s,n表示。如苯表示为

c1ccccc1。支链:碳链上的分支用圆括号表示。例如丙酸表示为CCC(=O)O,FC(F)F或者C(F)(F)F表示三氟甲烷。22虚拟筛选实例分析立体化学:用/和\表示双键顺反异构;对映异构:手性原子用[]表示,@表示反时针,@@表示顺时针:化合物SMILES反式二溴甲烷Br/C=C/Br或Br\C=C\Br顺式二溴甲烷Br\C=C/Br或Br/C=C\BrL-丙氨酸N[C@@H](C)C(=O)OD-丙氨酸N[C@H](C)C(=O)O23虚拟筛选实例分析二维形式用图表示24用矩阵表示虚拟筛选实例分析三维形式坐标法用坐标直接存储每个原子的三维坐标〔x,y,z〕25虚拟筛选实例分析分子存储格式及其相互转换存储格式:Mol2、pdb、pdbqt、sdf、smiles、mdl等根本存储:分子的元素组成、原子坐标、原子连接关系还能存储:分子子结构信息,能适用于生物大分子原子电荷信息,调用时不必再计算确定特定原子化学环境的原子类型信息26虚拟筛选实例分析不同的化学文件格式用来表示不同的化合物结构信息,不同的应用软件需要不同格式的化学格式,因此需要对化合物格式进行进一步转换才能进行后续的工作。27虚拟筛选实例分析化合物格式转换软件:OpenBabel下载::///wiki/Main_Page运行环境:Windows,LinuxandMacintoshOpenbabel是一个免费开源的软件,用于转换不同的分子文件格式,能够识别100多种分子文件格式。28虚拟筛选实例分析2930虚拟筛选实例分析Mol2格式openbabelpdbqt格式obabel-imol2./zinc_20031600.mol2-opdbqt-O./zinc_20031600.pdbqt31zinc_20031600.mol2zinc_20031600.pdbqt虚拟筛选实例分析药物作用靶标确定基于靶标三维结构的分子对接方法搜寻小分子数据库,依据靶标结构,在的三维数据库中进行搜寻,从而找到与之结构和性质互补的配体。从与生物活性有关的靶点入手,说明靶点的功能、三维结构、内源性配体或天然产物的化学结构特征,以计算机辅助展示这些物质的结合位点,然后用各种方法得到选择性作于该部位的配体分子。结合位点确实定是基于受体蛋白与小分子配体的互补结合,包括空间互补及疏水作用、离子键、氢键、电荷转移等作用。32虚拟筛选实例分析蛋白质靶标靶标选择:://MGLTOOLS分析:33虚拟筛选实例分析pdbqt格式的protein文件准备:File->readmoleculeEdit->Hydrogensàadd:polaronlyok1.AddHydrogen:Edit->Hydrogens->Add:non-proteinneedadd“allhydrogens”.Proteinneedadd“Polaronly”.2.Deleteatomsormolecule:Select->SelectFromString:

Thenclick“Add”,thenclick“Dismiss”.Then:Edit->Delete->DeleteAtomSet->…->Continue

Todisplaythemoleculesurfacewithselection

Grid->macromolecule->chose->SelectMolecule->…->save*.pdbqtfile

34虚拟筛选实例分析Wehavetochoosethepartfordocking!1.

SettheCenterGridBox.(Thevaluesneedtoberemembered).2.

SettheSpacing(angstrom)as1.000.3.

Setupthenumberofpointsinx,y,z-dimension.(Thevaluesneedtoberememberedfordockingprocess).

35虚拟筛选实例分析vina筛选中的配置文件:建立一个文本文件,把设置的值记录下来分子对接软件36虚拟筛选实例分析Autodock软件介绍AutoDockAutoDock是分子对接的工具。当前的版本包括AutoDock4和AutoDockVina。AutoDock4主要包括2个主程序:autodock和autogrid。其中AutoGrid主要负责格点中相关能量的计算,而AutoDock那么负责构象搜索及评价。AutoDockvina用于分子对接、虚拟筛选,多核运行,性能高,准确率高,易应用。37虚拟筛选实例分析vina--receptor*.pdbqt--ligand*.pdbqt--out*.pdbqt--log*.log--configconf38虚拟筛选实例分析2002年11月中国广东省发现第一例非典型性肺炎病例,世界卫生组织将其命名为严重急性呼吸道综合征〔SARS〕,SARS的病原体为一种新的冠状病毒-SARS-Cov。SARS-Cov感染宿主细胞起重要作用的结构蛋白:•E蛋白〔smallenvelopeprotein,小信封蛋白〕•S蛋白〔spikeglycoprotein,刺突糖蛋白〕•M蛋白〔membraneprotein,膜蛋

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论