版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE50附录APPENDIX药物生物信息学PHARMACEUTICALBIOINFORMATICS治疗药物概述Section1Introductiontotherapeuticdrugs一、疾病和代谢途径的关系人体内DNA、蛋白质、激素、离子等都在进行新陈代谢,但不同物质的稳态浓度(steady-statelevel)和代谢速度(metabolismrate)差异很大。如肾上腺素作用于肝细胞后很快生成环腺苷酸(cyclicadenosinemononucleotide,cAMP),但cAMP又很快被环核苷酸磷酸二酯酶(cyclicnucleotidephosphodiesterase,PDE)水解失去活性,故胞内cAMP稳态浓度很低。相反,脂肪组织内的脂肪含量高,其脂肪分解和合成代谢的速度变化也小得多。cAMP对细胞生理活动有很强且快速的调节作用,需对其稳态水平进行精确控制;脂肪作为储备能源物质含量高且其含量不需精确控制。因此,人体生理活动需有效控制各种物质的新陈代谢,其中不同作用的物质其代谢速度和控制精度也不同。体内物质代谢都有对应的代谢途径(metabolicpathway),且常由物质转运载体、(系列)酶、所需原料等组成,每条代谢途径都有关键成分控制其进行速度。体内任何物质的完整代谢途径不可逆,但人体物质代谢可由多组织协同完成,某个组织或细胞可只完成一部分代谢过程。例如,很多细胞都可快速水解cAMP而精确控制胞内cAMP的稳态浓度,但cAMP彻底分解则需血液、肝脏和肾脏等参与。尽管任何物质的合成和分解代谢都对维持其稳态水平有贡献且大部分酶催化反应可逆,但体内任何物质合成和分解的代谢途径有区分,否则其稳态水平将由反应的热力学而不是代谢速度控制。另外,不同器官、组织、细胞功能不同,对不同物质的需求和维持其稳态的贡献也不同;随生长发育或生理节律变化,人体整体或局部对物质的需求也有变化,体内物质的局部稳态水平也应呈现对应的变化。因此,讨论疾病相关代谢途径时,既要将体内任何物质的合成和分解代谢途径、整体和局部对特定物质的需求等分别考虑,又要将它们紧密联系为整体考虑。所讨论物质代谢途径通常只是其完整代谢途径的一部分,有时对特殊物质的代谢途径可简单到只含一种蛋白质和一种小分子物质。另一方面,在细胞内外都有各种物质通过相互作用传递信号调节细胞的生理活动,这些物质及其相互作用组成的系统称为信号通路(signalingpathway),启动信号传递过程的物质可来自胞外或胞内。信号通路中的物质对细胞生理活动有很强的控制作用,故其含量及活性需精确控制。细胞对不同信号通路响应速度相差很大。作用于细胞后产生效应快的大部分胞外信号可诱导胞内产生新的信号分子,例如肾上腺素作用于肝细胞产生的cAMP等,即第二信使(secondarymessenger)。信号通路中蛋白质等大分子物质的从头合成受到生物化学机制限制不可能很快,其通常通过化学修饰与其他分子相互作用,如变构效应(allostericeffect)等方式快速调节其活性。作用于细胞后产生效应较慢的信号通路中,小分子物质仍参与对应的代谢途径但含量控制较精密,而此类信号通路中蛋白质等大分子物质的含量也类似于小分子物质主要通过合成和降解进行调节。信号通路涉及细胞外成分时常需膜受体。信号通路本质上仍属于代谢途径,只是其关键成分的活性控制方式更精密,且其生物学意义不是控制信号通路中物质自身的含量而是通过信号传递控制其他代谢途径中物质的含量和细胞的生理活动。多数信号通路下游成分较多,对细胞生理活动影响广泛。也正是因为如此,细胞、组织、器官和个体才需要精确控制信号通路中各种成分的含量和活性,以维持整体的协调性。在疾病发生过程中有的物质启动或促进疾病发生,有的物质阻断或抑制疾病发生,人体疾病发生主要是由生命活动过程中重要物质(包括水)的整体或局部代谢失衡(其中,部分疾病是基因表达缺陷造成的对应代谢功能缺失造成),或对应的信号通路调节失衡所引起。例如,各种原因造成炎症介质(inflammatorymediator)释放过多而引起疼痛、不同原因引起肿瘤基因活跃表达使细胞生长失控、外部物质供应不足造成营养不良、未知原因造成淀粉样蛋白质大量聚集而诱发老年性痴呆(AlzheimerDisease,AD)、胰岛功能不足导致胰岛素分泌降低造成糖尿病(diabetes)等。尽管有些疾病诱因还不明确,但可相信它们直接或间接诱因还是某个或某些特定物质的代谢失衡。因此,干预体内代谢途径和信号通路以维护体内环境的相对稳定是药物治疗的根本目的。二、代谢途径与信号通路的干预和药物作用模式药物在体内的作用主要是直接或间接地使体内引起病理现象的代谢物或信号传递分子恢复到人体健康所需的稳态,或阻断这些能诱发疾病发生与发展的代谢物或信号传递分子的作用。最常见药物作用模式是其直接调节体内有重要病理或生理作用物质的代谢速度而控制其稳态水平。体内物质局部或整体水平取决于其摄入、合成、生理利用、分解(转化)与排泄等的综合效应。从外部摄入物质主要由生理活动控制;一旦物质被转化成需排泄的形式就会进入缓慢的排泄过程,且通常不能逆转为所需物质。因此,要用药物升高体内缓解或防止疾病进程物质的局部或整体水平(活性),最简单方式是以这类物质作为药物从外部直接补充,或用其他药物升高其局部或整体的内源性合成代谢;如该物质为生理功能不必需,则还可用药物降低其局部或整体分解代谢;如其为生理功能必需而内源性合成代谢不足或缺乏,则其只能作为药物直接从外界补充,如维生素和营养必需氨基酸等。相反,要用药物降低体内特定物质的局部或整体水平(活性),最简单方式是用药物升高局部或整体分解代谢速度,或加速其代谢转化后排泄;如该物质合成代谢不是生理活动所必需,则还可用药物降低其局部或整体合成代谢;如其合成代谢是生理活动所必需且分解代谢不足或缺乏或排泄受限,则只能用其他来源(如微生物)的关键成分作为药物直接从外界补充而辅助完成这类物质的转化(如尿酸和毒品)。另一类药物作用模式是其调节信号通路中所需成分的活性。体内信号通路的作用取决于其必需物质间的相互作用及对被调节代谢通路的作用。要增强某个信号通路的作用,可用药物选择性增加启动信号传递物质的稳态水平,升高第二信使的稳态浓度,促进蛋白质等关键成分的化学修饰调节,或升高其激动物质的稳态水平。要降低某个信号通路的作用,可用药物选择性清除信号传递启动物质,加速第二信使的分解失活,阻止蛋白质等关键成分的必须化学修饰,或促进其激动物质分解与转化。信号通路下游成分比较发散,故药物适宜作用于信号通路的最后环节。另外,人体天生具有免疫系统应对外源或不应暴露的抗原,故疫苗可看作是药物用于启动体内免疫应答的信号传递通路形成记忆,从而升高对应抗体的水平或效应细胞的活力以快速应对抗原的再刺激。显然,用药物控制物质代谢速度可直接调节对应代谢途径关键成分的活性,也可调节对应信号通路而间接调节代谢途径关键成分的活性,但通常直接调节代谢途径的效应常弱于调节对应信号通路的效应。人体器官、组织及细胞(器)中的特殊代谢途径或信号通路是这些器官、组织及细胞分化的基础,药物干预目的是调节这些代谢途径或信号通路中关键成分的量或活性。药物主要选择性作用于特定代谢途径或信号通路的关键成分。这些关键成分包括人体蛋白质、核酸、细胞膜或特殊小分子物质(如尿酸、精氨酸)等,也包括病原微生物的特定关键成分。药物与体内特定代谢途径的某个关键成分发生直接的相互作用而产生所需治疗作用,则这些关键成分称为药物作用靶点(target)。基于这种直接相互作用定义的靶点包括大分子物质和特殊小分子物质。用不同定义标准,相同药物的作用靶点会不同。药物与靶点之间相互作用的高选择性是决定药物安全性的关键基础,这种相互作用的高亲和力是决定药物有效性的重要特征。大多数药物在体内只有一个(类)作用靶点,部分药物有多个(类)作用靶点,也有些临床药物至今未确定其作用靶点。三、小分子化学药物和生物技术药物据药物生物化学性质可分成大分子药物和小分子药物;小分子药物即传统化学药物,分子量多在800Da以内;大分子药物主要为生物技术药物,包括蛋白质、核酸和多糖等。大分子药物又分为人源成分如人胰岛素,外源成分如精氨酸脱亚氨酶,及基因治疗所用载体。临床药物目前主要是小分子化合物,其制备成本较低,基本无免疫原性(immunogenicity),但外源小分子药物在体内代谢和排泄过程是影响其成药性的主要环节。蛋白质等大分子药物代谢分解产物为体内既有物质,其分解和代谢副作用很少,但如何消除其免疫原性和延长体内代谢半衰期是严峻的挑战。哺乳动物可产生针对抗原(antigen)的高选择性抗体(antibody),针对体内特定靶点的治疗性单抗(therapeuticmonoclonalantibody)是当前生物技术药物发展的重要方向之一。生物大分子靶点有特殊的空间构象,其表面通常有特殊的裂隙状活性中心,可通过多位点相互作用与特殊的小分子化合物或大分子形状互补的特定位点结合。可与大分子靶点的特定活性中心通过多位点相互作用结合成复合物的这些物质称为配体(ligand)。配体类药物同靶点的作用有很高的特异性和亲和力。针对大分子靶点的药物主要是小分子配体,也有治疗性单抗等大分子药物。小分子靶点相对较少,代表性有内源性物质尿酸、外源性物质如可卡因或重金属离子等。当小分子靶点有非常特殊的化学反应活性,可与小分子药物高选择性直接相互作用而被消除原有活性时,其对应药物也可以是小分子,如1,3-二巯基丙酸络合重金属离子。针对小分子靶点的大分子药物(酶)更常见,因为这种相互作用容易保障高选择性。药物发现是生物医药科学的重要任务之一,在此过程中药物设计和成药性(pharmaceuticalproperties)预测的关键技术来自生物信息学。调节人体代谢途径的信号通路有复杂网络结构,需从系统生物学角度更全面理解代谢调控和信号通路的网络系统。第二节药物相关信息资源Section2BioinformaticsResourcesofPharmaceuticals一、综合性药物信息资源DrugBank(http://www.drugbank.ca/)为免费药物数据库,覆盖大量药物及其靶标相关信息,有近4800种已上市或在研究中的药物。其中,FDA批准小分子药物约1300种、蛋白质和多肽类生物技术药物123种,营养制品71种,处于实验研究阶段的药物约3200种。每种药物提供近100项信息,包括药物作用靶点及其单核苷酸多态性、药物副反应和文献的网上链接等。DrugBank的特色是其支持多种搜索模式并提供可视化软件,便于检索药物及其靶标的相关信息,并可按每种生理系统疾病治疗药物进行浏览(图17-1)。图17-1Drugbank检索界面治疗靶点数据库(TherapeuticTargetDatabase,TTD).sg/group/cjttd/ttd.asp,也是免费数据库,覆盖1894个药物靶点及靶点相关疾病和信号通路,其中已证实靶点348个,试验阶段靶点292个及研究靶点1254个;TTD包含药物和配体5028个,FDA批准药物1514种,临床试验阶段药物1212种,实验研究阶段药物2302种,小分子药物3382种,反义核酸类药物649种。通过TTD中的链接可以方便地检索蛋白功能、氨基酸序列、三维结构信息、配体结合特性、药物结构、治疗应用等信息。可见,TTD也是关于药物的综合性数据库。国内刚建成部分基础条件平台,其中包含医药卫生领域的药学中心数据库,也是关于药物、药物靶点、药物作用等的综合性数据库(/drugtarget/default.asp)。二、治疗靶点信息资源NRDB(nonredundantdatabase)由NCBI建立,数据来自Genpept(GenBankCDS自动翻译的数据库)、PDB序列数据库、SWISS-PROT数据库等,是较完全且包含最新信息的蛋白质数据库,也是检索药物靶点的主要信息来源。实际上NRDB中仍有一些冗余信息。另外,NRDB数据库也被作为NCBI提供的BLAST算法搜索服务时检索的默认数据库。潜在药物治疗靶点数据库(potentialdrugtherapeuticdatabase,PDTD)为国内建立的免费药物靶点数据库,收集了已知和潜在药物靶点三维结构数据,是反向对接筛选候选药物靶点软件所用数据库。此数据库目前包括1207个晶体结构数据,涵盖841种不同药物靶点。这些靶点按照治疗应用领域和靶点的生物化学性质分成十多类,支持多种检索方式,并可链接到其他数据库。蛋白质信息学资源(protein-informatics-resource,PIR)/,提供蛋白质序列和功能数据,并链接到UniProtKB等多种数据库;此数据库的特色是提供详细全面的蛋白质功能分类数据,其中包含药物靶点蛋白质的数据。还有很多其他的蛋白质数据库。三、药物副反应靶点信息资源药物副反应靶点(DrugAdverseReactionTargets,DAR).sg/group/drt/dart.asp,也是免费数据库,包含了已知药物副反应靶点、功能和性质、文献链接等。这些靶点的鉴定与分类主要用支持向量机的药物副反应靶点识别程序完成,其使用了759个副反应相关的靶点结构特征和2280个非药物副反应靶点结构特征进行训练。治疗相关多信号通路数据库(TherapeuticallyRelevantMultiplePathwaysDatabase,TRMPD)包含来自文献的药物作用信号通路及靶点交叉信息(.sg/group/trmp/trmp.asp),也提供对应文献来源、疾病相关情况、针对通路中靶点的配体药物等信息。目前该数据库中包含97个独立的信号通路及11个多信号通路,对应72种疾病和1220种药物,可用信号通路名称或疾病名称等多种方式检索,能获得对应的靶点蛋白序列与基因等各种相关信息,及与其他数据库的链接。细胞色素P450相关代谢数据库(CytochromeP450-relatedmetabolicinformation)收集药物代谢干扰的靶点信息(http://sciencelinks.jp/j-east/article/200702/000020070207A0003559.php),并提供相关的软件用于预测药物相互作用,是指导联合用药和防止药物相互作用的重要信息来源。四、ADME关联蛋白信息资源吸收、分布、代谢和排泄(absorption,distribution,metabolismandexcretion,ADME)相关蛋白数据库(DrugADMEAssociatedProteinDatabase,ADME-AP).sg/group/admeap/admeap.asp,可检索药物ADME信息和相关蛋白功能、结构、相似性和组织分布等,同时提供文献链接,目前覆盖321种相关蛋白。转运蛋白数据库(transporterdatabase,TransportDB)/index.html,是转运相关膜蛋白的数据库,来自对已测定基因组解析预测所得的细胞质膜蛋白。对具有基因组信息的物种进行了全面的信息加工和收集;对每个物种的转运载体类型和家族提供概括性描述,对每个转运载体列出了被转运的底物类别,并连接蛋白质的序列数据库。五、药物-蛋白互作数据资源生物分子互作动力学数据库(Kineticdataofbio-molecularinteraction,KDBI).sg/group/kdbi/kdbi.asp,收集了来自文献的实验测定蛋白质间、蛋白质-RNA间、蛋白质-DNA间、蛋白质-小分子配体间、RNA-配体间、DNA-配体间的结合反应数据。目前,KDBI覆盖63条信号相关的蛋白,19263项数据记录,10532个特殊生物分子结合参数和1954项相互作用数据,涉及2635蛋白质-蛋白质复合物、847核酸复合物、1603小分子复合物和超过100条通路信息。蛋白质-配体相互作用数据库(protein-ligandinteractiondatabase,PLID)3/gnsmmg/databases/plid/,是基于网络的免费数据库,其收集了6295配体同从蛋白质结构数据库中提取的蛋白质的复合物结构,还提供配体物理化学性质、量子力学特征描述和蛋白质活性位点接触残基等信息。蛋白质-小分子数据库(protein-small-moleculedatabase,PSMDB)/psmdb,是来自PDB数据库的复合物非冗余数据,可自动更新,收集了更多配体和游离靶蛋白数据。另一个免费数据库CREDO(\o"http://www-cryst.bioc.cam.ac.uk/credo"http://www-cryst.bioc.cam.ac.uk/credo)与此类似,但其可用分子形状的描述符、PDB数据库中配体片段、序列和结构作图等进行检索。PDSPKi数据库(/kidb.php)也收集了多种配体与不同靶蛋白的亲和力数据,可用受体名称、组织来源、配体的名称等进行检索。生物学相互作用通用库(BiologicalGeneralRepositoryforInteractionDatasets,BioGRID)/index.php,收集来自常见模式生物的蛋白质及基因间的相互作用信息。目前包含来自6个物种的198000相互作用数据,及来自原始文献的酵母细胞内相互作用数据的完整集合;该库对来自酵母的数据每月更新,并连接有蛋白质间相互作用的可视化显示软件Osprey。此数据库可用于预测同类蛋白质的功能。六、药物毒理学资源药物诱导毒性相关蛋白数据库(Drug-InducedToxicityRelatedProteins,DITOP)收集了与药物相互作用或代谢中间产物造成毒性的相关蛋白质信息;其数据主要来自文献报道,目前包含618个典型的毒性相关蛋白、529个相应的药物、418个对应毒性术语。可以用关键词、化学结构、蛋白质和毒性术语等进行检索。有害物质目录(/niosh/rtecs-html)、危险物质数据库()、毒物文献库(/cgi-bin/sis/htmlgen?TOXLINE)等资源也可供检索。基于药物代谢干扰的数据库已尝试用于临床治疗方案的优化。七、药物基因组资源药物遗传效应数据库(PharmacoGeneticEffectDatabase,PharmGED).sg/phg/,专门提供蛋白质靶点的多态性、非编码区突变、剪切变异、表达变异等遗传信息对药物作用效应的影响,已有1825条目,涉及266个不同蛋白质,414个药物和对应文献。八、候选小分子药物资源SymyxACD(/products/databases/sourcing/acd/)是商业的药物筛选常用化合物来源数据库,可用结构进行检索,提供分子的三维结构图。NCBI提供了免费的化合物资源PubChem,并包含对应的三个子数据库,提供已知的化合物的结构和基本性质、生物活性、文献链接等信息。在通过网址http://cds.dl.ac.uk/cds/datasets/orgchem/screening.html可以获得主要候选化合物数据库和来源。剑桥结构数据库(CambridgeStructuralDatabase,CSD)http://www.ccdc.cam.ac.uk/products/csd/,提供实验测定的小分子结构数据。除了经典的小分子,还收集聚合度低于24个单体的寡核苷酸、小肽的结构数据,同时提供分子间相互作用的信息。九、免疫信息学资源国际免疫遗传信息系统(theinternationalimmunogeneticsinformationsystem,IMGT)http://imgt.cines.fr,是一个综合性的免疫信息学数据库,收集了人体和脊椎动物的常见免疫球蛋白、T细胞受体、主要组织相容性抗原复合物(MHC)、多种生物的免疫球蛋白超家族和MHC超家族等免疫系统相关蛋白。此数据库有五个子数据库,包括一个序列数据库、一个基因组数据库和免疫反应相关蛋白的结构数据库,提供了十多种在线工具和网络资源。该数据库提供了关于免疫相关疾病和抗体的较完整信息和数据,是分析潜在免疫治疗靶点和免疫治疗蛋白质药物的重要信息资源。其他的免疫信息学数据库还有MHCPEP(.au/mhcpep)、MPID(.sg)、SYFPEITHI(www.syfpeithi.de)、FIMM(.sg)、MHCBN(www.imtech.res.in/raghava/mhcbn)、IEDB(/)等。第三节药物作用靶点发掘Section3MiningDrugTargets一、药物靶点概述药物靶点主要是特定物质代谢途径或信号通路的关键成分,包括人体的特定大分子、小分子或病原微生物的特定对应成分。如控制胞内特定离子稳态浓度的离子通道、水解灭活环核苷酸的PDE、控制花生四烯酸(arachidonate)代谢成炎症介质的环加氧酶、激活腺苷酸环化酶生成cAMP的肾上腺素受体。体内的代谢途径交叉连接,有的物质也会参与多个代谢途径;体内的信号通路之间也有交叉连接,有些成分能同时参与不同的信号通路(图17-2)。因此,有效的药物靶点需具备如下特征:①对影响疾病病理过程的物质代谢途径或信号通路有控制作用;②尽可能位于诱发疾病病理过程物质代谢途径中生成该物质的最终环节,或疾病密切相关信号通路下游与疾病发生物质代谢途径直接交换信息的关联环节;③尽可能不参与人体其他组织或细胞生命活动所必需的代谢过程或信号传递过程;④尽可能避开多个代谢途径或信号通路的交叉点。显然,作为一个有效的药物靶点,上述第一个特征是所需具备的必要条件,而后面的三个特征主要是充分条件。小分子靶点的识别过程相对直接,大分子靶点的识别与确认过程就很复杂。图17-2单个细胞内NF-B参与信号通路的连接和交叉病原微生物通常有决定其致病能力且人体不需要的代谢途径,人体正常代谢不需要而此代谢途径必需的任何独特性成分都是潜在的药物靶点;如病原细菌或真菌常需合成人体不需要的细胞壁,其细胞壁合成的所有独特性关键酶都是理想的靶点。体内用于启动病理过程的信号通路关键成分都是合适的药物靶点,如费城染色体阳性的慢性髓系白血病中Bcr/Abl激酶是其治疗的理想靶点,其选择性抑制剂伊马替尼(imatinib)是低毒性抗肿瘤药物。体内相同代谢途径在不同细胞中可发挥不同作用,分化的组织器官和细胞含有控制对应物质局部稳态水平的受体亚型或同工酶可作为合适的药物靶点,如环鸟苷酸(cyclicguanidinenucleotide,cGMP)对多数细胞生理活动有重要调节作用,但PDE5是阴茎海绵体cGMP稳态水平的主要控制者而不是其他组织细胞中cGMP稳态水平的主要控制者,因此PDE5同工酶选择性抑制剂seldinafil是疗效显著的药物。人体蛋白质类药物靶点可分成几个主要的家族(表17-1)。表17-1人体蛋白质中的常用药物靶点靶点类别治疗领域G-proteincoupledreceptors代谢疾病、心血管系统疾病、炎症Kinase肿瘤、炎症、病毒感染NuclearReceptor肿瘤、代谢疾病Ionchannel中枢神经疾病、疼痛、感染、肿瘤、炎症Phosphodiesterase炎症、心血管疾病、勃起障碍、中枢神经疾病protease炎症、骨组织疾病、肿瘤、病毒感染用生物信息学技术发掘药物靶点是新药发现的基础。随着对疾病认识的积累,发现了大批药物靶点,目前已确认的药物靶点约500个。随着各种高通量测定数据的获得,新的治疗药物靶点不断地被发现,预期人体自身的蛋白质类靶点总数可达到3000个。人类基因组计划的积极推进和各种疾病相关代谢途径、相互作用分子网络、基因表达和蛋白质谱及病原微生物基因组和蛋白组数据的积累,成为发掘药物作用新靶点的基础,奠定了新药发现的重要基础。分析大量数据发掘潜在的药物新靶点主要有两种策略。一种以实验测定疾病与健康个体的相关数据为主进行比较分析推断与疾病发生相关的基因和蛋白质,并推断其功能和作为候选药物新靶点的可能性;另一种分析基因组或蛋白质的序列数据,通过药物靶蛋白的序列特征进行模式识别分类判断候选序列作为潜在药物靶点的可能性。以下简介这两类常用策略。二、分析基因组和基因型数据发掘潜在的候选药物靶点分析基因组数据发掘药物靶点的最直接应用是寻找病原微生物的基因组中与人体细胞代谢不同而对病原微生物的生长和致病必需的基因产物作为候选药物靶点。对于病原微生物生长和致病所需而人体不需的代谢途径,包括该途径的小分子物质,都是理想的药物靶点。即使是人体和病原微生物共同的代谢途径,例如嘧啶核苷酸合成代谢途径,不同的进化层次使得病原细菌对应代谢途径的某些关键酶和人体对应代谢途径的关键酶编码序列也有显著差异,对应的关键酶的活性中心精细结构存在差异。基于这种序列差异和预测的功能域精细三维结构的差异仍然能设计出针对病原菌代谢途径关键酶的高选择性小分子药物。另外,对于某些特殊的微生物,其亚型不同则致病能力显著不同。对于这些病原微生物,分析其基因型数据寻找对应的差异基因是发现新的抗感染药物靶点的有效策略。例如肺炎链球菌的荚膜型和光滑型两种亚型明显致病能力不同,故与荚膜形成相关的基因信息必定是独特数据,对应的编码蛋白都是候选的药物靶点。分析人体基因组数据发掘候选药物靶点的应用难度相对较大。人体基因组太大,需要一定的线索关联以缩小需要测序分析的基因范围。分析不同基因的位点多态性等与疾病发生的内在联系,是寻找潜在的候选靶点的有用策略之一。通过这种策略发现与疾病发生关联的基因如属于人体内常用的药物靶点蛋白家族,则其作为新的药物靶点的可能性就很大。另一种策略是分析功能基因组,解析新基因的功能并考察其是否属于目前常用的药物靶点蛋白家族(表17-1)。其中分析酵母基因组和对应基因功能是用实验验证新基因潜在功能的有效策略。目前,关于酵母的信息资源相对齐全,其基因组、蛋白质组、蛋白质相互作用网络、蛋白质定位、缺失突变表型等都有对应数据库,且新的数据还在增加。通过转入基因考察功能的增强、敲除基因和功能的缺失、小分子RNA干扰目标基因表达,都是验证基因功能的有效策略。人体基因组中与酵母基因组中进化同源的蛋白质有类似的功能,这可用于预测人体新基因的潜在功能及是否可作为潜在的药物靶点。这种策略是疾病相关功能基因组学的重要工作之一。三、分析表达谱数据发掘潜在的药物靶点发掘基因表达谱中随着疾病进程表达显著变化的基因,是寻找潜在药物靶点的常用策略。而比较疾病与健康个体表达谱,寻找编码常见药物靶点蛋白质的基因表达差异与疾病发生的关联,是快速发现潜在药物靶点的有效策略。另一方面,对表达标签和蛋白质组学数据的比较分析,尤其和药物蛋白质组学技术联合应用,能快速获得有价值的信息。用未知靶点但明确有效的天然产物作用于疾病的动物或细胞模型,通过蛋白质组学技术分析药物作用下发生改变的蛋白质,这些蛋白质通常与药物的治疗作用明确相关,也与此类药物靶点参与的疾病发生机制有关。应用这种策略的典型代表,如从近海生长的海绵中分离的天然产物Bengamide在体内外都有明显抗肿瘤作用。将此天然产物修饰成药效更强的衍生物LAF389作用于小细胞肺癌细胞系H1299,发现了二十多个表达有差异的蛋白质,并用蛋白质的肽质量指纹图谱对这些蛋白质进行了鉴定;进一步分析发现LAF389阻断了一种特殊蛋白的N-端脱甲硫氨酸,并最终证实LAF389是甲硫氨酸氨肽酶(methionineaminopeptidase,MetAP)的强效抑制剂,且获得了其复合物的晶体结构(1QZY.pdb)(图17-3)。此策略提供了两个重要信息,即MetAP参与的代谢途径中,需要MetAP脱甲硫氨酸的对应目标蛋白底物(其地位相当于代谢途径中的小分子物质)和MetAP本身都是潜在的抗肿瘤药物靶点。图17-3甲硫氨酸氨肽酶和Bengamide衍生物的复合物中间的配体显示为树枝状,绿色为C原子,红色为氧原子,蓝色为氮原子四、分析序列数据发掘药物靶点分析序列信息判断对应蛋白质是否为潜在药物靶点的策略集中分析已知药物靶点的序列特征,通过机器学习等方法从中发掘规律并形成判断方法,用于分类或判断候选序列是否为靶点。这属于典型的生物信息学策略,各种模式识别的方法都可用于发掘靶点的序列特征用于建立对应的判断方法。一个代表性的应用是从已知药物靶蛋白质的氨基酸序列中提取氨基酸残基组成、氨基酸残基的理化性质(包括疏水性、极性、电荷、溶剂可及性等,详见第十章和本章第四节)等信息,用支持向量机模型,用特定核函数(线性、多项式或径向基本函数RBF)和已知靶蛋白数据为训练集,所建立判断分类方法的正确率接近80%。经过优化训练数据集和核函数后,盲法测试的特异性、灵敏度和正确率都能达到80%以上,用这种策略预测潜在的人体靶蛋白有一千多个。五、反向对接分析配体作用位点寻找靶点基于分子对接寻找候选配体的方法,可用已知体内和体外活性配体,从已知蛋白质晶体结构的数据库中搜索对应的潜在靶蛋白,这是一种新的靶点发现策略。这种策略对发掘有明确药理活性天然产物的作用靶点具有重要价值。此策略目前已有对应的在线免费服务器和程序可用(/tarfisdock/),并有对应的潜在治疗性靶点的数据库。这对很多未知靶点却有明确治疗价值的配体药物靶点发掘和基于靶点结构的配体结构优化策略是一个很好的方向。六、识别与证实靶点的实验设计策略从大量数据中发掘出来的候选大分子靶点还需用实验多方面验证。前面已提到有效药物靶点所需要的基本特征。体内蛋白质种类非常多,药物只有选择性作用于靶点才能有所需治疗作用和尽可能少的副作用。通常要确认一个有效的药物靶点可用针对该靶点的已有工具药物或临床药物,但对用生物信息学策略发现的候选新靶点通常没有这类工具配体,只能多角度反复交叉验证候选新靶点的有效性。小分子药物的作用通常没有组织选择性而大分子药物主要在循环体系发挥作用,故一个靶点在体内如分布很广或参与其他组织的很多必需代谢过程就难以成为有效的药物靶点。同时,验证候选大分子靶点的有效性一般需要确认下特征:①候选靶点的功能与动物模型中疾病发生的病理学过程存在必然联系;②细胞模型中表达的靶点功能与疾病发生的细胞病理学过程存在必然联系;③在疾病动物模型中,(工具)配体达到有效浓度时能与靶点发生明确相互作用;④靶点和药物间离体的相互作用数据可预测动物模型体内的(工具)配体与靶点相互作用;⑤体内靶点含量或活性与病理学过程有明确联系。在验证这些特征时,还需同时考虑所用动物模型是否能够真实模拟人体疾病、存在种属差异性时如何进行替代验证、不同靶点应用于发现小分子及大分子药物的适用性差异等问题。(一)分析动物疾病模型考察候选靶点与病理学过程的联系从疾病发生病理学角度确认药物靶点的有效性,需测定靶点功能增强、正常及抑制等情况下疾病病理过程的变化。实现此目的一般需建立疾病的动物模型并改变其靶点的功能,可用公认的对靶点功能有调节作用的工具配体(药物)来探索这种关联性。另外,对大分子靶点,通过基因转染、小分子RNA干扰、核酶等增强或降低靶点的功能考察疾病发生的变化;对小分子靶点,也可直接从外部补充以观察疾病发生过程的变化。在分析这些结果时还需考虑动物模型及不同类型工具药物的有效性差异。(二)检测细胞模型中表达的靶点考察与疾病发生的细胞病理学过程的关联性从细胞和分子水平考察疾病发生过程的共性,考察细胞模型中靶点功能的调节对细胞病理学过程的影响。在细胞模型上更容易通过上述技术改变靶点的功能,同时考察同病理相关的物质的变化。尤其在细胞模型中有对应的分子实时显影等技术证实靶点与工具药物之间的直接作用。(三)考察在疾病动物模型中(工具)药物达到有效浓度时与靶点的相互作用在活体内测定靶点与(工具)药物相互作用是证实靶点有效性和药物作用机制的最直接证据,但限于技术这类数据在药物靶点研究的前期积累很少。通过标记药物和靶点进行活体成像是考察活体内靶点与药物作用的有效证据之一,这类方法提供的数据主要是来自共定位。(四)靶点和(工具)药物间离体的相互作用及其是否可用于预测动物模型及人体内的相互作用各种技术可用于考察离体(工具)药物与靶点的离体相互作用;建立药物作用动态过程的数学模型,可用于模拟(工具)药物在疾病动物模型体内的作用,并与实验测定的疾病动物模型体内的工具药物作用动态变化比较,考察离体的数据用于预测体内作用的有效性。在这些过程中需考虑到小分子药物对预期靶点的分布一般没有严格要求,但大分子药物主要在血液循环系统发挥作用而很难进入细胞内,除非采用特殊的制剂与给药策略,否则大分子药物要求靶点暴露于循环系统。(五)人体内靶点含量或活性变化及其与病理学过程的联系对于大分子靶点,应用荧光实时定量PCR、westernblotting等技术监测病理变化过程中靶点的含量和活性的变化;对于小分子靶点,应用高效液相层析与MS联用等技术,可监测疾病发生的病理过程中靶点的含量变化。分析疾病发生过程中靶点的含量或活性对控制疾病进程的重要物质含量变化的响应、病理生理紊乱程度的响应,可探索在人体疾病发生发展过程中靶点的作用。第四节小分子药物的成药性及其预测Section4PharmaceuticalPropertiesofOrganicDrugsandTheirPrediction一、概述广义的小分子药物指分子量小于800Da且在人体内能发挥明确药理学作用的化合物,这是目前临床应用最广的药物,有数千种。狭义的小分子药物不包括广义小分子药物中的多肽和寡核苷酸药物。绝大多数小分子药物能在体内预期部位发挥药理学作用,且基本无免疫原性。这些小分子药物主要是配体,小分子配体同大分子靶点的相互作用是治疗作用的基础,故小分子配体药物与大分子靶点的相互作用强度,即配体的亲和力(affinity),是小分子药物成药性的关键指标之一。另外,绝大多数小分子药物本身基本无免疫原性。但除了氨基酸、糖、维生素、激素等人体内本来就有的生理活性和药理活性物质,绝大多数小分子药物为非营养物质,在体内需经过生物转化(biotranformation)进行代谢并最终排泄,在这个复杂的过程中可能代谢产生新的生物活性物质而影响人体的生理活动,这也是影响小分子药物成药特性的关键环节之一。同时,小分子药物的生物利用度也是决定其特定制剂形式要求和成药性的关键指标。因此,据候选药物结构特征预测其成药性,是利用生物信息学技术高效率和低成本发现具有明确药用价值候选小分子新药的重要应用。二、结构特征和性质描述用信息学技术分析小分子药物的作用规律需发掘其结构特征、性质与其药理学、毒理学特征间的联系;对配体(ligand)类药物基于各种策略进行虚拟筛选,也需描述分子结构特征;用先导配体(leadligand)通过反对接搜索潜在药物靶点也需要描述小分子化合物的结构特点。因此,描述小分子化学物的结构特征和性质是药物生物信息学的必要基础。(一)小分子化合物的结构描述和模型化按IUPAC规则对化合物命名可反映化合物结构特征,但要包含足够信息则名称很长且过于复杂,唯一性也不够。化合物结构曾用过碎片码、线性码和拓扑码等编码,但仍难保障唯一性,且碎片码和线性码在检索子结构不方便。连接表(connectionlist)是目前用计算机表示、记录和检索化合物结构最常用的信息化手段,其可包含分子结构的二维和三维信息。连接表是用文本记录分子中所有原子、化学键及其空间关系的列表。连接表不需考虑不同分子的唯一性问题,原子的序号也不影响分子结构。但连接表在应用中有多种文件格式,不同分子结构模型可视化软件有自己的特殊格式,SMD、MOL和MOL2等是通用性的结构文件格式(图17-4),记录了所含原子属性和化学键性质等信息。用于记录蛋白质结构的文件格式也可用于记录小分子结构,其记录内容也属于连接表,系统带有根据原子间化学键长确定化学键类型的定义词典,所记录的化学键类型由计算所得键长确定,但一般免费软件不能生成这种格式的小分子结构文件。图17-4甲醇的结构模型(a)和其连接表(b),用MOL格式记录的结构文件(c).有多种小分子化合物模型可视化系统可用鼠标描绘分子结构模型,其中不少是免费的,如ISIS-Draw(/downloads/downloadable/)和ACD(/download/)等。通常小分子化合物的结构模型可视化系统大多可对小分子三维构象进行初步真空优化,这是建立三维定量构效关系模型的基础。一些基于网络和java语言的插件也可编辑分子结构。这些软件通常可直观显示分子的表面性质,包括范德华表面、溶剂以及表面、溶剂排斥表面等性质。(二)小分子化合物的疏水性疏水相互作用(hydrophobicinteraction)描述物质或基团与水分子相互作用的热力学性质。小分子化合物的疏水性(hydrophobicity)对其成药性有重要影响。不管哪种方式给药(口服或注射等),小分子药物都需在体内的对应病理部位达到所需有效浓度,才能改变对应代谢途径或信号通路上靶点的功能而表现出预期的药理作用。口服药物需要有足够高的吸收利用度,即生物利用度(bioavailability);同时,即使注射给药,药物如要进入对应细胞内发挥预期的药理作用,还需穿过细胞膜。疏水性是小分子药物穿过细胞膜并在血液和胞液中达到所需浓度的关键因素。因此,小分子药物的疏水性是决定口服药物生物利用度及细胞内有效浓度等性质的关键特性。另一方面,多数小分子药物为配体,发挥作用时需与靶点(蛋白)的特定功能域形成复合物,即结合(biding)。在配体类药物同靶蛋白结合过程中,配体的疏水性越高则亲和力(affinity)越高,但如疏水相互作用在配体与靶蛋白结合的自由能释放总量中贡献太大则配体的特异性(specificity)会降低,容易导致毒副作用。而且,药物的疏水性过高则其与膜脂和血浆中与清蛋白等的结合率很高,不利于提高药物在预期位点的有效浓度。即使对膜蛋白类靶点,大多数小分子药物的作用仍主要是同膜蛋白与细胞液或体液接触面的特定功能域形成复合物,而不是同膜蛋白中与膜脂直接接触区域形成复合物。所以,理想的小分子药物需有恰当的疏水性而不是越高越好;在寻找疏水性与药物成药性之间的联系时,通常将小分子药物的疏水性进行量化,才能建立对应的预测模型。在药物研究中常通过测定小分子药物的疏水性参数(hydrophobicparameter)定量表征小分子的疏水性。目前常用脂水分配系数(partitioncoefficient,P)作为疏水性的定量参数,即待测化合物在脂相和水相之间分配达到平衡时的脂相浓度与水相浓度的比值。测定脂水分配系数最常用的是正辛醇-水体系(图17-5)。用各种方法测定达到平衡后的待测化合物在两相的浓度可用于计算脂水分配系数。很多化合物同血浆蛋白达到1:1结合对应浓度与其在正辛醇-水体系的脂水分配系数有明确联系。正辛醇的物理化学性质使其适合于测定脂水分配系数,但正辛醇-水体系与生物膜系统有差别。目前积累的脂水分配系数已很多且能用于有效表征化合物结构与活性关系。图17-5化合物同蛋白的结合及其脂水分配系数化合物在正辛醇-水体系的脂水分配系数同其结构具有明显联系。同系物间脂水分配系数对取代基有累加效应,故依据间接测定小分子化合物中常见基团的脂水分配系数,可用于预测同系物中预期结构化合物的脂水分配系数;这种策略限制用于同系物。将分子结构分解成各种碎片,并测定常见类型碎片的脂水分配系数(fi),再用碎片脂水分配系数从头计算目标化合物的脂水分配系数(式17-1])。其中系数ai和bi代表来自不同的主要结构体系相同碎片的数量,fi为对应碎片的脂水分配系数。式17-1对于能电离的物质计算其脂水分配系数还需考虑pH的影响。在免费的ACD软件中也提供计算脂水分配系数的功能。(三)分子的电荷分布特征和电性参数电性参数(electronicparameters)主要描述分子中电荷的不对称分布等带来的对应性质差异。有几种常用的描述分子结构中电性参数的概念和对应的参数化方法。1.hammett电性参数(σ)Hammett用线性自由能描述取代基化学反应效应,并据涉及带电中间体的同系物化学反应活性进行测定。目前,可用量子化学方法计算得到这种电荷分布性质。在两个取代基之间没有相互作用则它们对同一分子电性参数的贡献也有加合性。2.共轭效应及诱导效应用Hammett方程时发现当取代基存在特殊的相互作用时发现参数存在显著偏差,所以将诱导效应(σI)和共轭效应(σR)分别考虑。3.解离常数(pKa)表示化合物整体的电性状态。同系物的解离常数同取代基的Hammett参数之间有明确联系。小分子药物解离常数同其吸收、分布、代谢与排泄有明确的联系。(四)分子立体结构特征和参数描述小分子化合物立体结构特征的相关参数很多。为应用生物信息学和化学信息的技术建立更好的成药性预测模型,还在探索新的立体结构特征描述符号。这部分具体内容更偏重化学结构,可在所列文献或有关专著中找到更全面的描述。以下简要介绍常用的分子立体结构特征描述符及其参数化。1.Taft立体参数(Es)描述由于立体效应对反应中心的影响,主要用取代醋酸酯等水解测得。2.摩尔折射率(ME)考虑原子间内聚力、原子极化度、离子化势等得到的描述配体与蛋白质功能域间相互作用的参数,近似代表分子的体积。3.Vanderwaals体积(Vw)描述分子的体积大小,可用原子半径和化学键长等计算。4.多维立体参数STERIMOL配体与蛋白质间结合时,需形状和理化性质互补。因此,Verloop等用长度、宽度等立体结构形状描述参数表示分子结构的立体参数。5.分子形状描述符主要用于描述同系物之间的形状差异,以计算的结果与参考分子间的重叠体积为指标,这是描述三维定量构效关系的起点,但最初的描述方法和参数现已很少用。6.分子连接性指数用分子中非氢原子的支链数计算的拓扑学参数,主要指化合物中一个非氢原子与若干个非氢原子相连的数值,此参数完全靠计算获得,但物理意义解释不全面。另外,还有3D自相关性质、基于电子衍射编码的分子结构、径向分布函数编码等更复杂的分子3D信息描述符号,是用于建立与靶点三维结构相关的定量关系模型的重要参数。三、配体与靶蛋白的对接和配体的虚拟筛选组合化学(combinatorialchemistry)的理论和技术是发现小分子新药的重要技术。组合化学认为通过基团随机组合合成能得到各种各样的化合物,这些化合物构成组合库(combinatoriallibrary);对于选定的靶蛋白,只要所用组合库中候选化合物的结构多样性足够丰富,总能从中筛选到所需药物。在小分子药物发现过程中,用常规策略设计的小分子化合物实际上是小规模的集中组合库。小分子配体同靶蛋白的亲和力是其成药性的关键指标之一。因此,制备和测定组合库中候选配体的亲和力是发现配体类小分子药物的关键环节,而制备和筛选的成本与效率成为发现小分子配体药物的难题。常规制备候选配体并测定其对靶蛋白的亲和力进行筛选的成本高而效率低。高通量筛选(High-ThroughputScreening,HTS)的效率和成本相对于常规筛选具有明显的优势,这是与组合化学技术联用发现新药的重要技术,但其所需样品制备的效率和成本仍是问题。因此,虚拟筛选(virtualscreening)应需而生。虚拟筛选用于从虚拟的大规模小分子库(现有的非肽候选小分子配体类化合物已超过700万个)中,通过生物信息学的手段评价候选小分子药物的成药性;虚拟筛选所发现的预期药物才进行实验制备和验证,这样可显著提高新药发现的成功率和效率并降低成本。对于配体类药物,广义虚拟筛选指对候选配体亲和力及其成药性的预测,狭义虚拟筛选主要指对配体与靶蛋白亲和力的预测。本节讨论配体类药物的狭义虚拟筛选,即配体对靶蛋白亲和力的预测。20世纪80年代,Kuntz等建立并发展了分子对接(docking)方法。分子对接是把大量的虚拟化合物库缩减成可操作的子集,并用于快速评估配体与靶蛋白的亲和力。分子对接的策略通常都考虑候选配体分子和靶蛋白在结合过程中可能的构象变化和对应的配体亲和力差异,此即柔性对接;但多数方法不考虑靶蛋白的柔性以减少计算量。目前,在分子对接过程中评价配体亲和力进行虚拟筛选主要有打分函数方法和机器学习方法等策略,目前已经有很多软件可用于分子对接和评价配体的亲和力。分子对接的前提是需要靶蛋白和候选小分子配体的三维结构。靶蛋白结构数据可来自PDB数据库,候选小分子配体的.mol2数据可从ZINC或剑桥晶体数据库或NCBI下载资源,或用分子结构编辑软件生成并优化后再格式化以满足不同软件读入分子结构信息的要求。(一)通过对接评价配体亲和力的方法1.基于打分函数的评价策略目前大部分对接算法中使用的打分函数主要分为三种类型:基于配体与靶蛋白结合物理化学相互作用的打分函数、基于经验的打分函数和基于知识的打分函数。这些打分函数能够作为构象优化过程的适应值函数,并将预测的配体分子构象进行排序,对于分子对接筛选高亲和力配体有决定性作用。(1)基于配体结合的物理化学相互作用的打分函数:基于配体结合的物理化学原理,将结合自由能表示为具有独立物理意义的多项式之和,使得各自由能函数项能尽可能反映蛋白质内部、蛋白质与溶剂分子之间的相互作用,其准确率较高但计算量巨大。大部分基于物理化学原理的打分函数采用AMBER和CHARMm力场的非键相互作用部分计算相互作用能,即将配体-受体结合自由能近似为范德华力和经典相互作用的加和,忽略溶剂效应和熵效应,估算配体结合的自由能变化或焓变。为了减少计算量,通常将靶蛋白中配体结合位点划分成很小的网格,估算候选配体的各种构象状态下不同取代基对各个网格节点的结合自由能变化,快速比较不同候选配体的亲和力差异进行筛选。(2)基于经验的打分函数:基于经验的打分函数利用多元线性回归、偏最小二乘法等统计学方法将结合自由能表示成带有权重的氢键、静电、疏水效应以及熵效应等项的加和,分别计算候选配体对接时各项的贡献及其加和。此方法计算量小,能快速直接估算出结合自由能,但所用统计学模型不能通用,打分结果对不同体系的可移植性较差。(3)基于知识的打分函数:基于知识的打分函数利用蛋白质结构数据库中的蛋白质与配体复合物结构数据作为学习样本,计算得到的具有统计性质的区分参数,从中提取配体与靶蛋白等结合的相互作用规律,用以判断配体的亲和力高低进行快速筛选。2.机器学习方法用已知的数据集进行训练,机器学习法能够建立起预测化合物某种性质的模型。自组织神经网络法、决策树、K最邻近算法(k-nearestneighborsapproach,KNN)都得到尝试和应用。这些机器学习方法都通过捕获训练集中化合物分子的属性,用能区分训练集中的不同亲和力配体的这些属性判断未知候选配体的亲和力高低。此方法计算效率很高,但受训练集数据质量和来源的限制。(二)常用软件简介1.DOCKDock/DOCK/index.htm,1982年由美国加利福尼亚大学旧金山分校Kuntz研究小组开发,用于模拟小分子与生物大分子结合的三维结构及强度,是目前应用最广泛的分子对接软件之一。对接中固定小分子的键长和键角,将小分子配体拆分成若干刚性片段,根据受体表面的几何性质,将小分子的刚性片段重新组合,进行构象搜索;最终以能量评分和原子接触罚分之和作为对接结果的评价依据。DOCK进行分子对接时,配体分子可以是柔性的。对于柔性分子其键长和键角保持不变,但二面角可旋转,并搜索数据库。在DOCK中变化柔性分子的构象时首先确定刚性片段,然后搜索构象。构象搜索采用两种方法:一种是锚定搜索(anchor-firstsearch);第二种方法是同时搜索(simultaneoussearch)。该软件目前已发展至DOCK5.0。其应用主要包括如下环节:在windows系统上用cynwin软件模拟一个unix的环境安装dock和dms;从数据库获得靶蛋白结构和小分子候选配体的结构;可按DOCK教程进行分子对接,此过程主要包括如下几步:靶蛋白处理,对接配基处理↓dms处理受体蛋白,得到球面↓运行sphgen.exe,得到负模↓选择对接位点区域↓生成包含对接区域的box↓在box内建立网格grid↓进行对接↓分析对接结果2.AUTODOCK/,它是由Olson研究组开发的另一种分子对接程序。其用半柔性对接的方法,即允许候选配体的构象发生变化和调整,采用模拟退火和遗传算法来寻找靶蛋白和配体最佳的相对结合构象,最终以结合自由能的大小来评价候选配体对接结果的好坏。此软件目前缺乏数据库搜索功能,仍仅限于实现单个配体和靶蛋白分子的对接。3.Affinity由Accelrys(MSI)和杜邦联合开发且最早实现商业化的分子对接软件。Affinity中候选配体和靶蛋白间匹配主要采用能量得分的评价方式,提供了精确和快速计算配合和受体之间非键相互作用的两种有效方法:基于格点的能量计算方法和单元多偶极(cellmultipolemethod)方法。Affinity的分子对接主要包括通过蒙特卡罗或模拟退火计算配体分子在靶蛋白活性位点中可能的结合位置和用分子力学或分子动力学方法进行细化对接复合物两个步骤。该方法适合对配体和受体之间的相互作用模式进行精细地考察,但计算量大,难以用于大规模数据库的快速虚拟筛选。4.GOLDGOLD(GeneticOptimizationforLigandDocking)是一种采用遗传算法同时考虑配体构象柔性及靶蛋白活性位点部分柔性(只考虑几种残基上羟基和氨基)的分子对接程序,但限制性要求配体与受体间形成氢键。GOLD程序中遗传算法采用子种群策略,初始的500个体被等分为5个子种群,每个子种群之间允许个体迁移;将靶蛋白活性位点与配体构象信息分别被封装在两条二进制字符串中,字符串中每个字节代表一个旋转键,每个旋转键的允许变化范围在-180°~180°之间,步长为1.4°,受体与配体之间的氢键信息则被封装在两条整型字符串中。GOLD采用轮盘赌选择优势个体,进行下一代的杂交、突变及迁移操作,最后按照达到预设的操作次数结束迭代。5.MolegroVirtualDocker(MVD)/,可在多种操作系统上运行,它提供了在Docking过程中所需的所有功能,包括从分子结构的准备到结合位点的预测以及最后小分子的结合及构象,有免费的测试版本可用。此软件的最大特色在于其高准确性的docking结果(MVD87%、Glide82%、Surflex75%、FlexX58%),简单易用的软件界面让使用者可以很快的设定及执行docking、针对docking结果提供完整的视觉及分析工具等。以下用基质金属蛋白酶MMP14为靶蛋白简介其候选多肽配体AHQLH的对接过程。(1)将MMP14(1BQQ.pdb中的M亚基)和候选的多肽配体AHQLH的三维结构导入到MVD软件的主界面中并调整视角,显示MMP14的三维模型,将配体AHQLH的结构表示成球棍状(图17-6)。(2)在工作空间内选择“createsurface”创建表面(图17-7),运行MVD软件中的“preparation|detectcavities”预测配体结合域;共发现到三个潜在的结合域;综合考虑配体大小等选择恰当结合域。(3)选择“View|DockingView”,点击“Docking|DockingWizard”,使用默认参数进行对接;大约经过10轮的迭代之后找到了能量最优的对接模式。将对接结果保存到制定文件路径(路径名为全英文),再读入MVD观察对接后的AHQLH同MMP14aa.121-123位His-Asn-Glu接触(图17-8)。图17-6MMP14的模型和其配体AHQLH图17-7结合区域预测图17-8优化对接状态的接触残基四、药物的定量构效关系预测候选小分子药物的成药性时,可将尽可能多的分子结构信息提取并量化作为药物结构特征信息的描述集;用信息处理技术,如经典统计学方法和模式识别技术等,选择恰当结构特征为自变量,建立化合物的结构与其成药性的定量关系作为预测模型,用同样参数化的候选化合物结构特征预测其成药性。这就是定量构效关系(quantitativestructure-activityrelationship,QSAR)的主要研究内容。在QSAR研究过程中,需要提取描述分子结构特征的信息数量化后作为自变量。技术与方法的发展促进了QSAR模型朝三维(3D)方向发展。配体类药物是目前临床用药的主要类型。本节简介建立小分子配体类药物与靶蛋白亲和力的QSAR模型的常用思路。(一)小分子化合物结构特征信息的提取与量化建立针对新靶点或新系列化合物的定量构效关系模型时,结构特征描述子集应尽可能大,以便能从中找到适合描述已知化合物与靶蛋白亲和力的结构特征描述符。此前介绍的疏水性、电性参数、立体结构特征都可包括在内,以便随后用信息处理的技术筛选有效结构特征描述参数。同时,需较多数量的成药性相差足够大已知配体的数据,这些数据的质量是建立有预测价值的定量关系模型的决定因素。如数据量不够多,则会限制模式识别等特殊的信息处理技术的应用。(二)定量构效关系模型的建立建立定量构效关系模型时首先需要确定合适的自变量,获得所确定的自变量后,多元回归分析能给出对应的定量构效关系模型。经典统计学方法,包括逐步向前或向后回归方法,都可用于选择自变量;也可通过模式识别先确定对配体亲和力影响最大的结构特征描述符,再使用逐步回归分析策略增加所需的结构特征参数。线性学习机及线性判别方法、基于距离的判别分类法、投影法等都可用于从候选的结构特征描述子集中找到对配体亲和力影响最大的参数。实践中,参数适宜进行归一化预处理以缩小不同性质参数的数量级差异对自变量选择的干扰。应用人工神经网络也可辅助选择自变量等建立对应的定量构效关系模型。(三)三维定量构效关系模型的建立策略配体和靶点相互作用在功能域和配体间要求构象互补,故建立3D-QSAR模型是主导发展方向。建立3D-QSAR模型需配体三维结构,这些数据可从CSD数据库中获得,或通过分子力学等计算获得。依据是否有靶点三维结构的数据,建立3D-QSAR模型又有如下两类方法。具备靶点三维结构数据时,可通过配体与分子对接后对复合物的构象进行优化,再分析配体与靶点三维结构之间的相互作用,并可通过自由能微扰等计算,结合分子动力学模拟,计算不同配体的结合自由能之差,并用于关联已知的配体亲和力和预测未知配体的亲和力。不具备靶点三维结构数据时,3D-QSAR主要用通过提取候选药物结构差异与成药性差异的联系建立预测模型。此过程有两种主要策略。第一种是用成药性最好化合物的优势构象为基础,比较不同小分子的体积等三维性质,寻找与成药性相关的结构特征。另一类是比较分子场分析(comparativemolecularfieldanalysis,CoMFA),利用小分子、基团或原子作为探针计算候选分子周围立体相互作用能,用回归方法分析这些作用能同亲和力的关系。现有CoMFA计算作用能时没有考虑疏水相互作用,且用探针计算相互作用精度较低。CoMFA目前主要用于分析离体的成药性数据。基于靶点三维模型的3D-QSAR策略主要用于配体类候选药物,而不需要靶点三维结构模型的3D-QSAR策略还可用于非配体类药物。预期在这两种策略中更全面地考虑候选药物同靶点的相互作用,有可能进一步改善3D-QSAR模型的预测性能,这无疑对药物发现有重要意义。总体而言,3D-QSAR模型还不够成熟,有许多环节还需要进一步完善。五、药物的吸收、分布、代谢、排泄与毒性预测从给药途径而言,外用或口服给药是理想的方式,但除非特意设计的局部外用或消化道局部给药,这两类给药方式都面临药物的吸收(Absorption),即其生物利用度的问题。小分子药物进入体内需要通过血液循环到达预期的作用位置,即需要考虑这些小分子药物的分布(Distribution);有机小分子药物进入体内都需被代谢(Metabolism);药物进入体内都面临被代谢后排泄或直接排泄(excretion);体内需相对稳定的环境,药物在体内除了所需要的治疗作用外,通常可能影响机体的正常代谢过程,即可能产生毒性(toxicity)。所以,对于靶蛋白的配体类药物,除了预测其对靶蛋白的亲和力外,还需考虑吸收、分布、代谢、排泄与毒性(ADMET)等药物代谢动力学特性。小分子药物的ADEME-Tox效应是决定其临床应用成败的关键特征。因此,小分子药物发现的早期就进行ADEME-Tox效应测定,是显著提高小分子药物发现的成功率和临床应用价值的关键环节。至今绝大多数小分子药物ADMET效应的分子机制还不清楚。虽然细胞层次的研究经过多年的发展,已建立了一些高通量的体外ADMET研究方法。例如,测定肠吸收的细胞单层转运实验;基于肝细胞或提取的肝微粒体的新陈代谢和药物-药物相互作用实验;基于肝细胞或其他组织细胞的生长抑制为指标的细胞毒性实验等;但这些高通量筛选实验还仅仅局限于少数几种药代动力学的特征。所以,发展有效的ADMET效应预测方法具有非常重要的意义。人体对药物的吸收、吸收药物的分布、药物的体内代谢,药物的排泄及其毒性,都涉及与人体内不同组织器官和不同蛋白等成分的非常复杂相互作用。因此,总结已有小分子药物的结构性质同其ADMET效应的联系,即发掘决定小分子药物产生ADMET效应的特殊模式,成为预测小分子药物ADMET的主要策略。这种预测的经典方法是Lipinski提出的五规则,实践中主要应用四项特征判断候选小分子药物能否成为口服有效的药物,即:①小分子化合物的分子量要小于500;②小分子化合物的脂水分配系数(logP)要小于5;③化合物上氢键给体,即与N和O相连的氢原子数要少于5个;④化合物上氢键受体,即N和O的数目少于10个。目前,直接利用小分子化合物的结构来预测它在体内的吸收及分布的方法已逐步建立,可通过直接计算小分子化合物的结构特征、电子分布特征、极性表面积等指标来预测表示分子吸收及分布的特征,例如脂水分配系数、脑血分布系数、肠穿透性以及水溶性等。而对于代谢、排泄及毒性的预测,虽然各种模式识别的方法都进行尝试,例如人工神经网络、模式识别方法及专家系统等,但预测的准确度仍然十分有限。模式识别方法分析小分子药物ADMET效应的预测软件很多,如英国Surrey大学的COMPACT预测系统,该系统主要针对与P450酶家族有关的蛋白进行毒性预测;开发的专家系统DEREK,以及HazardExpert,CASE,TOPKAT等软件(表17-2)。另外,除了以上专门用于毒性预测的软件外,本章第二节还提到的化合物ADMET相关数据库,也是用于发掘决定小分子化合物ADMET效应的规律和建立预测方法的重要资源。表17-2用于ADMET预测的软件软件网址Gmax-BCerius2,ADME,TACD/logP,ACD/logD,ACD/pKCLOGP,CQSARLeadPMOEQikPVolS第五节药用蛋白和多肽的成药性预测Section5PredictionofPharmaceuticalPropertiesofProteinsandPolypeptides概述当前临床应用的生物技术药物中,基因治疗(载体)和大分子核酸类药物还很少,而很多细胞因子、治疗性单抗、针对小分子靶点的酶类药物已在常规应用,还有部分多肽类生物技术药物也已经用于临床。因此,本节主要讨论蛋白质和多肽类生物技术药物的成药性及其预测。按照前述药物作用模式,当需增强体内某个信号传递蛋白或某个物质代谢途径的关键蛋白活性时,可选择性促进该蛋白质的合成、降低该蛋白质降解、促进蛋白修饰增强活性、增强其激动剂(activator)水平甚至上述策略中多种联用。为了实现这种效应,可用对应蛋白或特殊多肽作为药物从外界补充以增强或阻断对应信号通路或代谢途径的作用。除了局部外用蛋白质药物外,其他蛋白质药物经过各种途径给药后一般需经过血液循环;蛋白质药物很难进入细胞内,其主要是在血液循环系统发挥作用。除了药理活性外,多数蛋白质药物在人体内血浆的循环半衰期和人体免疫反应是其成药性的决定因素(显然蛋白疫苗需要其免疫反应)。决定蛋白质和多肽药物血浆半衰期的主要因素是血浆中蛋白质药物的肾脏滤除、热稳定性、免疫清除、蛋白酶解等因素,这对包括疫苗在内的蛋白质药物都适用;而除了疫苗以外,其余药用蛋白质都需要避免其引起人体的免疫反应,以免产生过敏和炎症反应等难以控制的副作用。多肽药物如分子比较小则除了设计的疫苗以外,一般免疫原性很小,影响其半衰期的主要是肾脏滤除和蛋白酶解等因素。蛋白质和多肽类药物常需修饰其N端和C端的氨基酸残基(置换成非天然氨基酸等)以降低降解。除了蛋白质疫苗外,用亲水聚合物修饰蛋白质和多肽药物的抗原决定簇既可降低其免疫原性,又可延长其血浆半衰期。蛋白质表面能被免疫球蛋白分子的抗原结合位点或特定效应分子识别并结合的抗原区域即抗原表位(epitope)或抗原决定簇(antigenicdeterminant)。因此,预测药用蛋白质的抗原决定簇对改善其药代特性具有重要意义。本节简介蛋白质与多肽类药物除了其药理作用外的成药性特征及其预测。蛋白质的免疫原性预测免疫(immunity)是指机体对外源或本来不暴露的自身物质的识别,并利用相应方式进行清除以维持体内环境稳定的现象和过程,由机体的免疫系统执行,涉及免疫活性分子、免疫细胞、免疫组织和免疫器官等。动物都有免疫系统,但特异性免疫(specificimmunity)主要在脊椎动物体内,无脊椎动物的免疫系统主要是非特异性免疫。免疫应答(immuneresponse)指机体对异物刺激引起的一系列特异性生理反应以维持内环境稳定的过程;广义的免疫应答包括非特异性免疫(即天然免疫,innateimmune)和特异性免疫。天然免疫是物种进化过程中具备的对外界刺激的自然防御系统,可遗传且相对稳定,主要识别异种物质,由皮肤粘膜、吞噬细胞、NK细胞和组织间隙液体成分组成。特异性免疫即获得性免疫(acquiredimmunity)或适应性免疫(adaptiveimmunity),其作用高度特异、效力强、有记忆性但不能遗传。诱导机体的特异性免疫是使用疫苗进行防疫与治疗的主要机制。参与特异性免疫反应的细胞主要是B淋巴细胞和T淋巴细胞;来自机体的参与免疫反应的主要蛋白质是抗体(antibody),补体(complement)和细胞因子(cytokine)。诱发免疫反应的是抗原(antigen),即能刺激机体产生特异性抗体或致敏淋巴细胞,并能与对应抗体等在体内外发生特异性相互作用的成分,可据其刺激B淋巴细胞产生抗体对胸腺的依赖分成胸腺依赖抗原(TDantigen)和非胸腺依赖抗原(TIantigen)。免疫反应过程中抗原需经过抗原递呈中的识别和加工,再传递给特异性免疫细胞(主要是T和B淋巴细胞)。能进行抗原递呈的细胞称为抗原递呈细胞(antigen-presentationcell,APC)。抗原递呈中涉及蛋白质抗原的部分水解,主要有经过吞噬小泡进入溶酶体(lysosome)的水解途径、经过蛋白酶体(proteosome)的降解过程。APC主要有两类:一类表面表达主要组织相容性复合体(majorhistocompatibilitycomplex,MHC)Ⅱ分子,负责识别通过吞噬加工的外来抗原;另一类在病原体和细胞因子作用下才参与抗原递呈,主要表达MHCⅠ分子并可识别和加工来自机体内部的自身抗原、寄生病毒、细菌抗原。T细胞依靠其表面受体识别与APC表面与MHC分子结合的连续抗原肽表位(epitope),其中CD4细胞识别与MHCⅡ结合的外来抗原,CD8识别与MHCⅠ结合的内源性抗原。B细胞识别抗原依靠表面的膜免疫球蛋白和免疫球蛋白形成的跨膜复合物,可识别TD抗原和TI抗原,但识别机制有差异。多数抗原为TD抗原,其需经过APC处理后提交给辅助性T淋巴细胞,再传递给B淋巴细胞;这些处理后的抗原肽含有多个抗原决定簇,分别与辅助性T淋巴细胞和B淋巴细胞作用后激活B淋巴细胞产生抗体。TI抗原不需要辅助性T淋巴细胞,可直接刺激B淋巴细胞产生抗体。免疫反应涉及复杂的细胞和分子作用网络,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 方剂练习题练习试题及答案
- 施工个人年终工作总结报告
- 产业园基础设施项目申请报告
- 国家安全教育公开课学习心得10篇
- 长距离供热管道投资估算与资金筹措
- 2024年度幼儿园教室地板改造与维护管理合同2篇
- 2024双方金融科技项目融资担保服务协议3篇
- 2024年债权债务担保合同范本(金融领域)3篇
- 2024年股权转让合同的保全与信用担保
- 2024年规范化种植协议样本版B版
- 土木工程材料智慧树知到期末考试答案章节答案2024年山东建筑大学
- 社会工作行政复习题
- 培训市场调查分析报告
- 物业小区安全生产隐患排查治理表
- 公路法知识培训课件
- (高清版)DZT 0331-2020 地热资源评价方法及估算规程
- 循环水泵岗位安全操作规程培训
- 医院筹建新科室方案
- 人民大会堂介绍课件
- 大营销管控:持续做大做强的科学管控体系
- 基于杜邦分析的三元股份有限公司盈利能力分析
评论
0/150
提交评论