药物设计学-QSAR-wj课件_第1页
药物设计学-QSAR-wj课件_第2页
药物设计学-QSAR-wj课件_第3页
药物设计学-QSAR-wj课件_第4页
药物设计学-QSAR-wj课件_第5页
已阅读5页,还剩123页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11.基于配体结构的药物设计Ligandstructure-baseddrugdesignSBDD2.基于受体结构的药物设计Receptorstructure-baseddrugdesign间接药物设计直接药物设计基于结构的药物设计(Structure-baseddrugdesign,SBDD)11.基于配体结构的药物设计SBDD2.基于受体结构的药12基于配体结构的药物设计——直接法已知活性化合物结构分析QSAR合成虚拟受体活性测试结构优化先导化合物药效基团候选药物2基于配体结构的药物设计——直接法已知活性化合物结构分析QS23第二节基于配体的药物设计方法之一

——定量构效关系(QSAR)3第二节基于配体的药物设计方法之一

——定量构效关系(QS34QSAR是指定量的构效关系,是使用数学模型来描述分子结构和分子的某种生物活性之间的关系。其基本假设是:化合物的分子结构包含了决定其物理,化学及生物等方面的性质信息,而这些理化性质则进一步决定了该化合物的生物活性。进而,化合物的分子结构性质数据与其生物活性也应该存在某种程度上的相关!找出这些药物分子结构性质与它们的活性之间的数学关系,就有可能预测出活性高的药物分子结构,这种方法就是所谓的定量结构-活性关系(QuantitativeStructureActivityRelationship,QSAR)。通常把这种药物设计方法称为基于配体(小分子)的设计方法。4QSAR是指定量的构效关系,是使用数学模型来描述分子结构和4QSAR发展历史1853年,英国医生Snow首次应用氯仿为维多利亚女王实施无痛分娩手术后,开始深入研究吸入性全身麻醉药,确定了首先测定药物沸点和饱和蒸汽压的实验原则这是历史上人类首次考虑到药物分子的理化性质与生理活性的关系,是构效关系研究的雏形。1863年法国斯特拉斯堡大学Cros博士的论文,他发现在哺乳动物体内醇类的毒性随着其水溶性的降低而增加,最终可以达到一个最大值。这是关于分子结构和生物活性之间关系的最早文献报道。

1868年,英国药理学家Fraser和化学家CrumBrown在研究一种生物碱的碱性N原子甲基化前后的生物效应后,提出了化合物的生理活性依赖于其组分的理论,即生物活性Φ应该是化合物组成C的函数:

Φ=f(C)这就是著名的Crum-Brown方程。QSAR发展历史1853年,英国医生Snow首次应用氯仿为51893年,Richet发现一些简单有机物的细胞毒性与其水溶性成反比关系。在十九、二十世纪之交,Meyer和Overton各自独立的发现,一组有机化合物的麻醉镇定作用与其橄榄油-水分配系数存在相应关系。Ferguson在1939年提出了挥发性有机物的镇定作用和其在媒介中的相对饱和度之间的热力学相关性.二十世纪30年代Hammett研究了有机物毒性与分子电性效应(σ)之间的相关性,提出有机物芳环上取代基的电性效应可表示为

σ=log(Kx/Kh)

Kx和Kh分别是取代和未取代时化合物的电性常数,而且认为化合物的毒性或麻醉作用与溶解度相关。二十世纪50年代Taft发展了SAR方法,提出立体参数,把Hammett的思想扩展到脂肪族化合物。指出Es=log(KS/KH)

KS和KH分别是取代衍生物和未取代母体化合物的水解速率常数,即体系分子的空间效应可由化合物的水解速率常数决定。药物设计学-QSAR-wj课件67重要参数1:疏水性参数油水分配系数,也就是正辛醇/水分配系数

P–分配系数

HighPvalue:hydrophobic(疏水的)

LowPvalue:hydrophilic(亲水的)7重要参数1:疏水性参数油水分配系数,也就是正辛醇/水分配系78logP的获得计算上:通过加和基团或者原子的疏水常数来计算分子的logP值,分别称为ClogP和AlogP。可由软件sybyl或hyperchem计算得到。实验上:

摇瓶法高效液相色谱法8logP的获得计算上:实验上:89logP与pp=logPX-logPHPH=母体化合物的分配系数.PX=取代的母体化合物的分配系数.logP:化合物的疏水性:取代基的疏水性p是正的,取代基比氢疏水p是负的,取代基比氢亲水9logP与pp=logPX-logPHlog910疏水参数π对logP的影响分子结构的改变对logP有显著的影响,通过对先导化合物的结构修饰,可以改变其物理性质,调节通过血脑屏障的难易程度,从而使药理作用往有利的方向发展。引入下列基团到脂肪族化合物中,其logP递降顺序大致为:Ph>Me>Cl>CR>CO2Me>NMe2>OMe>COMe>NO2>OH>NH2>CO2H>CONH2引入下列基团到芳香族化合物中,其logP递降顺序大致为:PH>C4H9>I>Cl>Ar>OMe>NO2≥CO2H>COMe>CHO>OH>NHCOMe>NH2>CONH2>SO2NH2p是正的,取代基比氢疏水p是负的,取代基比氢亲水10疏水参数π对logP的影响分子结构的改变对logP有显著1011111112121213重要参数2:电性参数Hammett常数sHammett在1935年提出用参数s来表示取代基的电性效应::苯甲酸和相应的取代苯甲酸在25摄氏度水溶液中的电离常数。

,值的正负可以反映基团吸电子或者给电子能力(吸电子基,正值;反之负值)值的大小可以反映相应能力的强弱。需要注意的是:(1)常可利用的是间位或对位取代基常数

,由于邻位取代基既有电性效应,又有立体效应(熵效应),故没有可资利用。(2)有加和性,依据是线性自由能关系。(3)许多取代基的值不易获得。13重要参数2:电性参数Hammett常数sHammet1314141415重要参数3:立体参数Taft参数-ESkS=酰基上取代的乙酸甲脂的酸水解反应速率常数。kH

=乙酸甲脂的酸水解速率常数;取代基越大,Ks越小,水解速率越慢,

Es越负;取代基越小,Ks越大,Es越大-CCl3Es=-2.06-CF3Es=-1.16二十世纪50年代15重要参数3:立体参数Taft参数-ESkS=酰基上取1516摩尔折射率(MolarRefractivity,MR)MW=分子量MW/d:近似体积分子越大,摩尔折射率越大由于摩尔折射率有良好的加和性,因此可以通过加和基团的摩尔折射率来获得整个分子的摩尔折射率。Verloop立体参数根据键长键角以及范德华半径计算获得。70年代由Verloop等人提出16摩尔折射率(MolarRefractivity,MR1617定量构效关系方法大体可以分为17定量构效关系方法大体可以分为1718二维定量构效关系(2DQSAR)方法取代基多参数法:Hansch法Free-Wilson法18二维定量构效关系(2DQSAR)方法取代基多参数法:1819经典的QSAR模型——Hansch模型

1964年,Hansch和Fujita等人提出,分子的生物活性主要是由其静电效应、立体效应和疏水效应决定的,并且假设这三种效应彼此可以独立相加。据此提出Hansch模型:logP是疏水参数,Es是立体参数,σ是电性参数。a,b,ρ,d是方程系数

Hansch模型揭开了经典QSAR研究的篇章,成为QSAR发展历史中的里程碑。Hansch模型的提出标志着药物定量构效关系研究的开始,也被认为从盲目药物设计过渡到合理药物设计的重要标志。在QSAR中,因变量活性参数通常以产生标准生物效应时药物的物质的量剂量或物质的量浓度的负对数(log1/C)表示。c可以是半数有效浓度EC50、半数抑制浓度IC50、半数致死量LD50、半数有效剂量ED50和最低抑制浓度(MIC)等19经典的QSAR模型——Hansch模型1964年,H1920优点:物理化学意义明确Hansch方程中的各个变量都有明确的物理化学意义,可以用来预测活性和推测药物分子的作用机理,进而指导新药的设计,因此在药物设计中取得了广泛的应用。

在Hansch方法的指导下,人们成功地设计得到了诺氟沙星等喹诺酮类抗菌药。其中logP是疏水参数,Es是立体参数,σ是电性参数。a,b,ρ,d是方程系数

20优点:物理化学意义明确在Hansch方法的指导下,人们成2021Hansch模型的实现步骤从先导化合物出发,设计和合成首批化合物;用可靠的定量方法测试活性;确定及计算化合物及取代基的各种理化参数和常数;用计算机程序计算Hansch方程,求出一个或几个显著相关的方程;通过所建立的模型阐明影响生物活性的主要结构因素;根据影响生物活性的结构因素定量地设计第二批新的化合物,并预测活性。21Hansch模型的实现步骤从先导化合物出发,设计和合成首21对样本(即化合物结构)也有一定的要求,这些要求包括:1)结构特异性作用的化合物,应有相同或相似的基本结构,以保障化合物与同一个靶位作用,亦即有相同的作用机理。这是因为线性自由能相关分析是以药物与靶位分子的物理化学作用为基础的。若母体结构不同,常需引入指示变量,但使用时须十分小心。2)为保证多元统计分析得到的回归方程有足够的推广能力,即在预测未知化合物的活性时,化合物的物理化学性质或取代基团的性质要有足够大的差异。例如包含有疏水性或亲水性,推电子或拉电子,位阻大或位阻小的各种化合物,生物活性强度的变异有一个或数个数量级(一个或数个对数单位)。3)其它模型相比,线性模型其自身的优点,如因果关系明确,因变量与某独立变量之间是“正相关”还是“负相关”,可以从线性关系式中独立变量前的系数是“正”值还是“负”值直接判断。对样本(即化合物结构)也有一定的要求,这些要求包括:1)结2223m-X

p-Y

π

σ

Es(meta)log(1/C)obslog(1/C)alog(1/C)b H H 0.00 0.00 1.24 7.46 7.82 7.88 F H 0.13 0.35 0.78 7.52 7.45 7.43 H F 0.15 -0.07 1.24 8.16 8.09 8.17 Cl H 0.76 0.40 0.27 8.16 8.11 8.05 Cl F 0.91 0.33 0.27 8.19 8.38 8.34 Br H 0.94 0.41 0.08 8.30 8.30 8.22 I H 1.15 0.36 -0.16 8.40 8.61 8.51 Me H 0.51 -0.07 0.00 8.46 8.51 8.36 Br F 1.09 0.34 0.08 8.57 8.57 8.51 H Cl 0.70 0.11 1.24 8.68 8.46 8.60 Me F 0.66 -0.14 0.00 8.82 8.78 8.65 H Br 1.02 0.15 1.24 8.89 8.77 8.94 Cl Cl 1.46 0.51 0.27 8.89 8.75 8.77 Br Cl 1.64 0.52 0.08 8.92 8.94 8.94 Me Cl 1.21 0.04 0.00 8.96 9.15 9.08 Cl Br 1.78 0.55 0.27 9.00 9.06 9.11 Me Br 1.53 0.08 0.00 9.22 9.46 9.43 H I 1.26 0.14 1.24 9.25 9.06 9.26 H Me 0.52 -0.31 1.24 9.30 8.87 8.98 Me Me 1.03 -0.38 0.00 9.30 9.56 9.47 Br Br 1.96 0.56 0.08 9.35 9.25 9.29Br Me 1.46 0.10 0.08 9.52 9.35 9.33 Hansch模型应用举例预测结果一系列抗肾上腺素的活性化合物23m-X p-Y π σ2324QSAR方程a:(用两个变量)

值越大越好log(1/C)=1.151π-1.464s+7.817 (n=22;r=0.945)疏水性、电性效应QSAR方程b:(用三个变量) log(1/C)=1.259π-1.460s+0.208Es(meta)+7.619 (n=22;r=0.959)还考虑到了立体参数

π=疏水性参数

σ=Hammett电性效应(吸电子基团σ为正值)

Es(meta)=Taft立体参数Hansch模型应用举例提高X,Y位置上取代基的疏水性,有利于提高生物活性,供电子基团的引入有利于提高生物活性24QSAR方程a:(用两个变量) 值越大越好24

氟哌酸是喹诺酮类抗菌药的一类,商品名为诺氟沙星,由古贺弘利用Hansch方程进行了一系列QSAR研究而设计。活性的理论计算值为6.38,实验值为6.63。这是Hansch方法指导药物设计的成功范例。氟哌酸是喹诺酮类抗菌药的一类,商品名为诺氟沙2526262627272728282829292930303031313132323233333334343435Free-Wilson模型

基本假设

对于母体骨架相同的系列化合物,它们的活性是某些特定位置上的取代基所产生的活性加和

其中A是基准化合物活性的负对数值;是取代基所产生的活性加和,是取代基i在第j个位置上的基团活性贡献;表示取代基i在第j个位置上的有无。如果有,等于1,没有等于0。A和值由线性回归确定。35Free-Wilson模型基本假设其中A是基准化合物活3536Free-Wilson模型

Free-Wilson法常被用于同源化合物中,这种模式认为生物活性是由母体结构(基本结构)的活性贡献与取代基的活性贡献之和,即药物分子中某一特定位置的结构因素的加和就是化合物的生物活性。这种方法不采用任何经验、半经验参数,回避了一些复杂因素,比较直观地反映了活性与结构片段特征参数间的关系,有助于从整体分子上认识化合物。优点36Free-Wilson模型Free-Wilson法常3637首先,参比化合物选择得不同研究结果将有很大差异;其次,它将药物研究与生物体关系完全脱离,判断物质的存在的方法过于简单,不能准确反映生物体的性状。介于Hansch法与Free-Wilson法二者的研究方法中有一定的相关性,若把这两个方法合并得到的双线性模型,相当于在Hansch法中引入指示变量,使方程式所表达的相关性更精确,因而预测生物活性时更具有实用价值。缺点Free-Wilson模型

37首先,参比化合物选择得不同研究结果将有很大差异;缺点Fr3738Free-Wilson模型

log(1/C)=0.0+1.8+0.6+0.0+0.1=2.5

log(1/C)=0.0+0.4+0.0+(-0.5)+0.3=0.2其中A是基准化合物活性的负对数值;是取代基所产生的活性加和,是取代基i在第j个位置上的基团活性贡献;表示取代基i在第j个位置上的有无。如果有,等于1,没有等于0。A和值由线性回归确定。38Free-Wilson模型log(1/C)=0.03839其它模型Hansch提出了抛物线模型Kubinyi提出双线性模型更能反映药物活性和疏水性关系的内在联系,具有更广泛的实用价值。为了解释活性与分配系数的非线性关系39其它模型Hansch提出了抛物线模型更能反映药物活性和39Kubinyi双线性模型在生物体内,水溶性大的药物(疏水常数呈负值)难以通过生物膜,到达受体的机会很小;随着脂溶性增加(值增加),到达受体的机会逐渐增加;达到高峰后,又由于亲脂性过大(值很大),则药物难以在水相中运转,而在脂肪组织中含量增加,使到达受体的机会又下降,所以药物需要有适当的疏水性。Hansch抛物线模型Kubinyi双线性模型在生物体内,水溶性大的药物(疏水4041药物的结构和性质

药物的基本属性(有效性、安全性、可控性),在一定意义上,由药物的化学结构所决定。活性=f

(结构)定量构效关系(QuantitativeStructureActivityRelationship,QSAR

)是指选择一定的数学模式,对药物分子的化学结构与其生物活性间的关系进行定量分析,找出结构与活性间的量变规律。41药物的结构和性质药物的基本属性(有效性、安全4142QSAR在药物设计中的作用QSAR活性的优化选择性的优化药代动力学性质的优化机理的推断组合化学库的设计42QSAR在药物设计中的作用QSAR活性的优化选择性的优化4243药物设计中的QSXR定量结构—活性关系(Quantitativestructure-activityrelationship,QSAR)定量结构—毒性关系(Quantitativestructure-toxicityrelationship,QSTR)定量结构—亲和关系(Quantitativestructure-affinityrelationship,QSAFIR)定量结构—药动关系(Quantitativestructure-pharmacokineticsrelationship,QSKR)定量结构—吸收关系(Quantitativestructure-absorptionrelationship,QSAbR)定量结构—分布关系(Quantitativestructure-distributionrelationship,QSDR)定量结构—代谢关系(Quantitativestructure-metabolismrelationship,QSMR)定量结构—排泄关系(Quantitativestructure-eliminationrelationship,QSER)定量结构—转运关系(Quantitativestructure-transporterrelationship,QSTrR)43药物设计中的QSXR定量结构—活性关系(Quantita431.通用资源搜索引擎

通用资源搜索引擎很多,多数已为人们熟知。例如百度Google.hkYahoohttp://www.Y/science/chemistrylnfoSeekAltaVistaExciteLycos…

1.通用资源搜索引擎442.化学资源导航系统这种导航系统非常多,仅举数例:2.化学资源导航系统45

中国科学院化工冶金研究所计算化学开放实验室

化学信息资源导航系统ChIN(新版本)

/

中国科学院化工冶金研究所计算化学开放实验室

化学信息资源46药物设计学-QSAR-wj课件47中国科学院计算机化学开放实验室

中国科学院上海有机化学研究所

16/hxwzdh.htm中国科学院计算机化学开放实验室

中国科学院上海有机化学研究所48

美国加州大学洛杉矶分校(UCLA)化学和生物化学系

/chempointers.html从该网站提供的链接,可以很快找到大量的化学信息.美国加州大学洛杉矶分校(UCLA)化学和生物化学系

ht49在化学信息数据库中,化学结构数据库占有很大的比例。如果熟悉这些网站或数据库,不必使用搜索引擎就可直接链接。本节摘要介绍,以供参考。

化学结构数据库在化学信息数据库中,化学结构数据库占有很50美国国家标准与技术研究院(NIST)开发:

ChemistryWebBook/chemistry/美国国家标准与技术研究院(NIST)开发:51

印第安纳大学分子结构中心/

晶体结构和分子图来源印第安纳大学分子结构中心52

中国科学院计算机化学开放实验室16/molinformatics.htm中国科学院计算机化学开放实验室53

曼彻斯特大学-结构化学部http://spec.ch.man.ac.uk/Structural_Chemistry.html曼彻斯特大学-结构化学部54

Ponder实验室WWW服务器

/

主要内容为计算化学与分子模型Ponder实验室WWW服务器55

维也纳大学-理论化学学院

http://www.itc.univie.ac.at/维也纳大学-理论化学学院56

辛辛那提大学-OBR计算机辅助分子设计中心

辛辛那提大学-OBR计算机辅助分子设计中心57

乔治亚大学-计算量子化学中心/乔治亚大学-计算量子化学中心58

国际晶体学联合会

http://www.iucr.ac.uk/国际晶体学联合会59剑桥晶体结构数据中心http://www.ccdc.cam.ac.uk

剑桥晶体结构数据中心60布鲁克海文蛋白质数据库/pdb/

蛋白质、DNA、RNA、病毒、碳水化合物等生物大分子的3D结构数据库,含原子坐标、一级序列与二级结构信息、晶体结构因子和2D–NMR数据.布鲁克海文蛋白质数据库61美国矿物学家晶体结构数据库/xtal-cgi/test美国矿物学家晶体结构数据库http://www.geo.ar62矿物结构数据库http://database.iem.ac.ru/mincryst/search.php3矿物的晶体结构参数和衍射资料,可由化学式首字母、晶体结构等检索.矿物结构数据库63矿物数据库

/矿物数据库

http://www.webmineral.co6465Molecularstructureactivity/propertyVariablesRepresentationModelbuildingActivity/Property=f(Structure)65Molecularstructureactivity/6566MolecularStructure1D3D2D..············........CCCCCCCCCCCCClClClClHHHHHHClClClClClClClClHHHHHH66MolecularStructure1D3D2D..·6667Variables(Moleculardescriptor)化学结构的数值表示分子描述符经验参数理论计算参数67Variables(Moleculardescrip6768经验参数立体参数电性参数经验参数疏水性参数68经验参数立体参数电性参数经验参数疏水性参数6869 一维(结构的线性表示,将化合物的结构图转化成计算机容易识别和搜索的字符串,WLN)

二维(如连接表,容易表示分子的拓扑特征)

三维(可以表达空间结构)其他理论描述符的计算69 一维(结构的线性表示,将化合物的结构图转化成计算机容69701Ddescriptors-Constitutionaldescriptors

numberofatoms

absoluteandrelativenumbersofC,H,O,S,N,F,Cl,Br,I,Patoms

numberofbonds(single,double,tripleandaromaticbonds)

numberofbenzenerings,numberofbenzeneringsdividedbythenumberofatoms

molecularweightandaverageatomicweight

numberofrotatablebonds(AllterminalHatomsareignored)

Hbondacceptor-Numberofhydrogenbondacceptors

Hbonddonor-NumberofhydrogenbonddonorsThesesimpledescriptorsreflectonlythemolecularcompositionofthecompoundwithoutusingthegeometryorelectronicstructureofthemolecule.701Ddescriptors-Constituti7071TopologicalDescriptorsMoleculargraph(CH3)3C-C(CH3)3Describe

Size Degreeofbranching Flexibility Overallshape123456782DDescriptors71TopologicalDescriptorsMolec7172TopologicalDescriptorspair distance pair distance pair distance1-2 1 1-6 2 3-8 3WienerindexSumoflengthsofminimalpathbetweeneachtwoatoms:12345678其他的拓扑描述符Randic分子连接性指数,Kier&Hall分子连接性指数,Balaban指数等等72TopologicalDescriptorspair 7273Surfacearea

Relatedtobinding,transportandsolubility.Molecularvolume

RelatedtobindingandtransportMolecularDensity

RelatedtotransportandmeltbehaviorRadiusofgyration(回转半径)

Relatedtothemolecularsize:Shadowindices

GeometricDescriptors3DDescriptors73SurfaceareaGeometricDescri7374ShadowIndices:ShapeDescriptorsProjectmolecularstructureonthexy,yzandxzplanes.Areaofmolecularshadowinthexy,yz,xzplanes.Fractionofareaofmolecularshadowinthexy,yz,xz planesoverareaofenclosingbox.Lengthofmoleculeinthex,y,zdirection.74ShadowIndices:ShapeDescri7475QuantumChemicalDescriptorsQuantitativevaluescalculatedintheMOPAC&GaussianapplicationoftheQUANTUMMECHANICS(QM)Calculatedusingasemi-empirical&AbinitiomethodthatislikelytogeneratemoreaccuratevaluesQuantumCharge

LUMO-LowestunoccupiedmolecularorbitalenergyHOMO-Highestoccupiedmolecularorbitalenergy

DIPOLE-Dipolemoment-Componentsofdipolemomentalonginertiaaxes(Dx,Dy,Dz)Hf-HeatofformationMeanPolarizability-=1/3(xx+yy+zz)

EA–ElectronAffinityIP–IonizationPotentialE–EnergyofProtonationElectrostaticPotential-75QuantumChemicalDescriptors75计算描述符的软件CODESSADRAGONMOEADAPTADMETPredictorADRIANA.CodeALMONDGRIDJOELibMOLCONN-ZMOLGEN-QSPRPowerMVPreADMETSarchitectMODEL……计算描述符的软件CODESSA76CODESSA

组成描述符、拓扑描述符、几何描述符、静电场描述符和量子化学描述符DRAGON一维的组成描述符、官能团描述符、以原子为中心的片段描述符二维的拓扑描述符、walkandpathcounts描述符、连接指数、信息指数、分子图形的自相关信息、edge连接指数、Burden特征值描述符、拓扑电荷描述符、基于特征值的指数三维的几何描述符、WHIM描述符、GETWAY描述符、Randicmolecularprofiles电荷描述符化合物的性质描述符CODESSA一维的组成描述符、官能团描述符、以原子为中心的7778Molecularstructureactivity/propertyVariablesRepresentationModelbuildingActivity/Property=f(Structure)78Molecularstructureactivity/7879对生物活性数据的要求活性=f

(结构)正确有代表性同源数量尽可能多对生物活性数据的要求:79对生物活性数据的要求活性=f(结构)正确对生物活性7980在QSAR研究中,一般不直接使用浓度作为因变量生物活性的单位,而是使用它的负对数(log1/C)。其理论依据是药物的生物活性与药物与受体的结合能ΔG相关,而结合能与其浓度的负对数线性相关。E+SES生物活性数据的表示

药物的生物活性定义为产生预定的生物效应时所需剂量或浓度半数有效量ED50:产生最大生物效应一半时的剂量半数致死率LD50:一半死亡时的剂量抑制活性IC50:活性被抑制50%时抑制剂的浓度80在QSAR研究中,一般不直接使用浓度作为因变量生物活性的8081Molecularstructureactivity/propertyVariablesRepresentationModelbuildingActivity/Property=f(Structure)81Molecularstructureactivity/8182DescriptorsSelectionRemovecorrelateddescriptors.Thesedatawerecollectedforaseriesof13steroidsdifferingintheidentityoftheirRgroup82DescriptorsSelectionRemove82药物设计学-QSAR-wj课件8384BackwardstepwiseregressionSimilarly,backwardstepwiseregressioncanbeemployedstartingwithamodelwhichincludesalldescriptorsandsubsequentlyremovingdescriptorswhichdonotresultinmodelperformancedegradation.Stopremovingdescriptorswhenperformancedegradationoccurs.84Backwardstepwiseregression8485ExampleThebestequation:Y=1.468(±0.27)X1+0.662(0.10)X2+52.58(±5.09)

(n=13;r=0.989;s=2.41;F=229.50)NotethecorrelationbetweenX2andX4anditseffects.85ExampleThebestequation:8586遗传算法(GeneticAlgorithm)86遗传算法(GeneticAlgorithm)8687Createaninitialpopulation:

Eachoneisrepresentedbyachromosome. Calculateafitnessfunctionforeachchromosome.Selectasub-population:

Selectionisbiasedtowardsmorefitchromosomes.Subjectthenewpopulationtogeneticoperators:

Propagatehighest-rankingindividuals.

Crossover(80%):

Pointmutation(1%):Repeatprocedureonnewpopulation.001000111100011100001100110000100011001100110000111100010010001111000100100010110001GeneticAlgorithm101011010001010010001010110100010100100087Createaninitialpopulation87建模方法分类(Classification)与回归(Regression)模型线性(Linear)与非线性(Nonlinear)模型前向(Forward)与反向(Reverse)模型全局(Global)和局部(Local)模型单一模型(Singlemodel)与一致性建模分析(Consensusmodeling)建模方法分类(Classification)与回归(R88按模型维数分类按模型维数分类8990909091919192建立模型的方法是影响QSAR模型质量的关键因素目前最常用的建模方法

多元线性回归线性方法主成分回归偏最小二乘法…人工神经网络非线性方法支持向量机方法…最常用的建模方法92建立模型的方法是影响QSAR模型质量的关键因素最常用的9293MultipleLinearRegression(MLR)HanschAnalysis:Requirements:

Thereshouldbeatleast3-5timesmoresamplesthandescriptors. Totalnumberofdescriptorsshouldnotexceed~20.Otherwise, chancecorrelationsmayoccur. Descriptorsshouldbeuncorrelated.93MultipleLinearRegression(9394模型检验拟合能力的评价预测能力的评价内部验证

外部验证94模型检验拟合能力的评价预测能力的评9495相关系数(R)标准偏差(s)F检验值n是样本数,k是自变量的数目

R,F越高,s越小,表明模型的拟合能力越强

内部检验有很多内部检验的方法可以用来估测一个模型的你和能力、稳定性和内部预测能力,如拟和相关系数、交互检验、Y

随机和各种残差表示方式(均方根误差、标准偏差等)等。95相关系数(R)标准偏差(s)F检验值n是样本数,k是自9596交互检验Leave-one-out(LOO)Leave-many(group)–out(LMO)BootstrappingOut-of-train(OOT)StochasticModelValidation

(SMV)96交互检验Leave-one-out(LOO)9697交互检验:依次从N个样本中抽出1个样本,用剩下的N-1个样本来建立构效关系模型,然后用建立的模型预测抽取出来的1个样本的活性,重复这个操作,直到所有样本都被抽去和预测。然后,计算预测误差的平方和PRESS和交互检验相关系数rcv

。最常用交互检验方法:留一法(leave-one-out)

97交互检验:依次从N个样本中抽出1个样本,用剩下的N-1个97典型的LMO交互检验根据数据量的大小,把数据集分成2到10个组(G=2-10),每一组包含化合物数目基本相同(mj=n/G,相差最大为1),每次抽取一组mj

作为临时的测试集,用剩下的n-mj个化合物建立模型对测试集进行预测。Leave-many(group)–out(LMO)对于大型数据,只要保证剩余的临时训练集能够得到有意义的模型,每次抽取的化合物可以任意多;但对于中小型数据(比如n<50),如果每次抽取太多的化合物出来,剩余化合物就很难包含所有的重要结构信息从而得不到好的QSAR模型。有文献已经证明对于只包含20到30个化合物的小数据集,每次抽出30%左右的化合物是比较理想的数字。典型的LMO交互检验根据数据量的大小,把数据集分成2到1098对于含有N个化合物的训练集来说,随机抽取若干(j)化合物作为测试集,然后Bootstrapping从N-j个化合物中随机选择j个化合物填充到训练集中,使训练集化合物数目保持在N个,这样,有些化合物就会在训练集中出现两次甚至多次(>=2)。此时用重组后的训练集建立模型预测j个化合物的生物活性,计算j个化合物的预测残差的平方和(PRESS)。此过程重复若干次,可以得到上千个PRESS值,最后将PRESS值求和,取平均值进行计算:Bootstrapping对于含有N个化合物的训练集来说,随机抽取若干(j)化合物作为99该方法和Bootstrapping的区别在于,在抽取j个化合物作为训练集后,OOT并不会随机在N-j个化合物中选择一些化合物进行重复以保证训练集化合物数目保持不变,只是用N-j个化合物直接建立QSAR模型并进行活性预测。Out-of-train(OOT)该方法和Bootstrapping的区别在于,在抽取j个化合100随机模型检验(StochasticModelValidation,SMV)是另一个新的检验技术,可以用来估测所有数据对于模型建模能力和交互预测能力的影响。这种技术也是要产生许多临时的训练集和测试集(Nv=1ormany),但其旨在穷举化合物作为临时训练集(N-Nv)和临时测试集(Nv)所有可能的组合,即SMV会给出N!/(N-Nv)!种可能的组合,也就会建立这么多的模型。很容易可以想象,这种方法实际上是LOO和LMO的结合。StochasticModelValidation

(SMV)随机模型检验(StochasticModelValida101该方法将响应值如生物活性随机打乱顺序,而保持描述符的顺序不变,从而建立新的QSAR模型。该过程重复若干次后,与原来模型的统计信息进行比较,希望所得到的平均R2和Q2等比较低,如果R2>0.50,那么这个模型有可能就有随机相关的嫌疑,该QSAR模型的可靠性是值得怀疑的。是检验模型是否存在偶然相关的有力工具。Y随机检验该方法将响应值如生物活性随机打乱顺序,而保持描述符的顺序不变102103外部检验测试集(testset)的预测:

从研究的化合物中挑选出足够多的样本组成预测集,预测集中的样本不参加模型的构建,然后通过模型对预测集中的分子的预测结果来检验模型真实的预测能力。

103外部检验测试集(testset)的预测:1031041041041051051052002年在葡萄牙的

Setubal召开的一次国际会议上,与会的科学工作者们提出了关于QSAR模型有效性的几条规则,被称为“SetubalPrinciples”;这些规则在2004年11月得到了进一步详细的修正,并被正式命名为“OECDPrinciples”。规定,一个QSAR模型要达到调控(regulatorypurpose)目的,必须满足以下5个条件:

1)adefinedendpoint;2)anunambiguousalgorithm;3)adefineddomainofapplicability;4)appropriatemeasuresofgoodness-of–fit,robustnessandpredictivity;5)amechanisticinterpretation,ifpossible。实际上这五个条件就已经全面概括了QSAR研究工作的基本步骤。QSAR的主要步骤2002年在葡萄牙的Setubal召开的一次国际会议上,与106107结构输入ISIS/Draw,ChemDraw,PCmodel等结构优化分子力学:量子力学(半经验,从头算):PCmodel,Sybyl等MOPAC,AMSOLGaussian分子描述符的计算CODESSA,DRAGON等分子描述符的选择模型的评价与解释模型的建立107结构输入结构优化分子描述符的计算分子描述符的选择模型的1071081.基于配体结构的药物设计Ligandstructure-baseddrugdesignSBDD2.基于受体结构的药物设计Receptorstructure-baseddrugdesign间接药物设计直接药物设计基于结构的药物设计(Structure-baseddrugdesign,SBDD)11.基于配体结构的药物设计SBDD2.基于受体结构的药108109基于配体结构的药物设计——直接法已知活性化合物结构分析QSAR合成虚拟受体活性测试结构优化先导化合物药效基团候选药物2基于配体结构的药物设计——直接法已知活性化合物结构分析QS109110第二节基于配体的药物设计方法之一

——定量构效关系(QSAR)3第二节基于配体的药物设计方法之一

——定量构效关系(QS110111QSAR是指定量的构效关系,是使用数学模型来描述分子结构和分子的某种生物活性之间的关系。其基本假设是:化合物的分子结构包含了决定其物理,化学及生物等方面的性质信息,而这些理化性质则进一步决定了该化合物的生物活性。进而,化合物的分子结构性质数据与其生物活性也应该存在某种程度上的相关!找出这些药物分子结构性质与它们的活性之间的数学关系,就有可能预测出活性高的药物分子结构,这种方法就是所谓的定量结构-活性关系(QuantitativeStructureActivityRelationship,QSAR)。通常把这种药物设计方法称为基于配体(小分子)的设计方法。4QSAR是指定量的构效关系,是使用数学模型来描述分子结构和111QSAR发展历史1853年,英国医生Snow首次应用氯仿为维多利亚女王实施无痛分娩手术后,开始深入研究吸入性全身麻醉药,确定了首先测定药物沸点和饱和蒸汽压的实验原则这是历史上人类首次考虑到药物分子的理化性质与生理活性的关系,是构效关系研究的雏形。1863年法国斯特拉斯堡大学Cros博士的论文,他发现在哺乳动物体内醇类的毒性随着其水溶性的降低而增加,最终可以达到一个最大值。这是关于分子结构和生物活性之间关系的最早文献报道。

1868年,英国药理学家Fraser和化学家CrumBrown在研究一种生物碱的碱性N原子甲基化前后的生物效应后,提出了化合物的生理活性依赖于其组分的理论,即生物活性Φ应该是化合物组成C的函数:

Φ=f(C)这就是著名的Crum-Brown方程。QSAR发展历史1853年,英国医生Snow首次应用氯仿为1121893年,Richet发现一些简单有机物的细胞毒性与其水溶性成反比关系。在十九、二十世纪之交,Meyer和Overton各自独立的发现,一组有机化合物的麻醉镇定作用与其橄榄油-水分配系数存在相应关系。Ferguson在1939年提出了挥发性有机物的镇定作用和其在媒介中的相对饱和度之间的热力学相关性.二十世纪30年代Hammett研究了有机物毒性与分子电性效应(σ)之间的相关性,提出有机物芳环上取代基的电性效应可表示为

σ=log(Kx/Kh)

Kx和Kh分别是取代和未取代时化合物的电性常数,而且认为化合物的毒性或麻醉作用与溶解度相关。二十世纪50年代Taft发展了SAR方法,提出立体参数,把Hammett的思想扩展到脂肪族化合物。指出Es=log(KS/KH)

KS和KH分别是取代衍生物和未取代母体化合物的水解速率常数,即体系分子的空间效应可由化合物的水解速率常数决定。药物设计学-QSAR-wj课件113114重要参数1:疏水性参数油水分配系数,也就是正辛醇/水分配系数

P–分配系数

HighPvalue:hydrophobic(疏水的)

LowPvalue:hydrophilic(亲水的)7重要参数1:疏水性参数油水分配系数,也就是正辛醇/水分配系114115logP的获得计算上:通过加和基团或者原子的疏水常数来计算分子的logP值,分别称为ClogP和AlogP。可由软件sybyl或hyperchem计算得到。实验上:

摇瓶法高效液相色谱法8logP的获得计算上:实验上:115116logP与pp=logPX-logPHPH=母体化合物的分配系数.PX=取代的母体化合物的分配系数.logP:化合物的疏水性:取代基的疏水性p是正的,取代基比氢疏水p是负的,取代基比氢亲水9logP与pp=logPX-logPHlog116117疏水参数π对logP的影响分子结构的改变对logP有显著的影响,通过对先导化合物的结构修饰,可以改变其物理性质,调节通过血脑屏障的难易程度,从而使药理作用往有利的方向发展。引入下列基团到脂肪族化合物中,其logP递降顺序大致为:Ph>Me>Cl>CR>CO2Me>NMe2>OMe>COMe>NO2>OH>NH2>CO2H>CONH2引入下列基团到芳香族化合物中,其logP递降顺序大致为:PH>C4H9>I>Cl>Ar>OMe>NO2≥CO2H>COMe>CHO>OH>NHCOMe>NH2>CONH2>SO2NH2p是正的,取代基比氢疏水p是负的,取代基比氢亲水10疏水参数π对logP的影响分子结构的改变对logP有显著1171181111811912119120重要参数2:电性参数Hammett常数sHammett在1935年提出用参数s来表示取代基的电性效应::苯甲酸和相应的取代苯甲酸在25摄氏度水溶液中的电离常数。

,值的正负可以反映基团吸电子或者给电子能力(吸电子基,正值;反之负值)值的大小可以反映相应能力的强弱。需要注意的是:(1)常可利用的是间位或对位取代基常数

,由于邻位取代基既有电性效应,又有立体效应(熵效应),故没有可资利用。(2)有加和性,依据是线性自由能关系。(3)许多取代基的值不易获得。13重要参数2:电性参数Hammett常数sHammet12012114121122重要参数3:立体参数Taft参数-ESkS=酰基上取代的乙酸甲脂的酸水解反应速率常数。kH

=乙酸甲脂的酸水解速率常数;取代基越大,Ks越小,水解速率越慢,

Es越负;取代基越小,Ks越大,Es越大-CCl3Es=-2.06-CF3Es=-1.16二十世纪50年代15重要参数3:立体参数Taft参数-ESkS=酰基上取122123摩尔折射率(MolarRefractivity,MR)MW=分子量MW/d:近似体积分子越大,摩尔折射率越大由于摩尔折射率有良好的加和性,因此可以通过加和基团的摩尔折射率来获得整个分子的摩尔折射率。Verloop立体参数根据键长键角以及范德华半径计算获得。70年代由Verloop等人提出16摩尔折射率(MolarRefractivity,MR123124定量构效关系方法大体可以分为17定量构效关系方法大体可以分为124125二维定量构效关系(2DQSAR)方法取代基多参数法:Hansch法Free-Wilson法18二维定量构效关系(2DQSAR)方法取代基多参数法:125126经典的QSAR模型——Hansch模型

1964年,Hansch和Fujita等人提出,分子的生物活性主要是由其静电效应、立体效应和疏水效应决定的,并且假设这三种效应彼此可以独立相加。据此提出Hansch模型:logP是疏水参数,Es是立体参数,σ是电性参数。a,b,ρ,d是方程系数

Hansch模型揭开了经典QSAR研究的篇章,成为QSAR发展历史中的里程碑。Hansch模型的提出标志着药物定量构效关系研究的开始,也被认为从盲目药物设计过渡到合理药物设计的重要标志。在QSAR中,因变量活性参数通常以产生标准生物效应时药物的物质的量剂量或物质的量浓度的负对数(log1/C)表示。c可以是半数有效浓度EC50、半数抑制浓度IC50、半数致死量LD50、半数有效剂量ED50和最低抑制浓度(MIC)等19经典的QSAR模型——Hansch模型1964年,H126127优点:物理化学意义明确Hansch方程中的各个变量都有明确的物理化学意义,可以用来预测活性和推测药物分子的作用机理,进而指导新药的设计,因此在药物设计中取得了广泛的应用。

在Hansch方法的指导下,人们成功地设计得到了诺氟沙星等喹诺酮类抗菌药。其中logP是疏水参数,Es是立体参数,σ是电性参数。a,b,ρ,d是方程系数

20优点:物理化学意义明确在Hansch方法的指导下,人们成127128Hansch模型的实现步骤从先导化合物出发,设计和合成首批化合物;用可靠的定量方法测试活性;确定及计算化合物及取代基的各种理化参数和常数;用计算机程序计算Hansch方程,求出一个或几个显著相关的方程;通过所建立的模型阐明影响生物活性的主要结构因素;根据影响生物活性的结构因素定量地设计第二批新的化合物,并预测活性。21Hansch模型的实现步骤从先导化合物出发,设计和合成首128对样本(即化合物结构)也有一定的要求,这些要求包括:1)结构特异性作用的化合物,应有相同或相似的基本结构,以保障化合物与同一个靶位作用,亦即有相同的作用机理。这是因为线性自由能相关分析是以药物与靶位分子的物理化学作用为基础的。若母体结构不同,常需引入指示变量,但使用时须十分小心。2)为保证多元统计分析得到的回归方程有足够的推广能力,即在预测未知化合物的活性时,化合物的物理化学性质或取代基团的性质要有足够大的差异。例如包含有疏水性或亲水性,推电子或拉电子,位阻大或位阻小的各种化合物,生物活性强度的变异有一个或数个数量级(一个或数个对数单位)。3)其它模型相比,线性模型其自身的优点,如因果关系明确,因变量与某独立变量之间是“正相关”还是“负相关”,可以从线性关系式中独立变量前的系数是“正”值还是“负”值直接判断。对样本(即化合物结构)也有一定的要求,这些要求包括:1)结129130m-X

p-Y

π

σ

Es(meta)log(1/C)obslog(1/C)alog(1/C)b H H 0.00 0.00 1.24 7.46 7.82 7.88 F H 0.13 0.35 0.78 7.52 7.45 7.43 H F 0.15 -0.07 1.24 8.16 8.09 8.17 Cl H 0.76 0.40 0.27 8.16 8.11 8.05 Cl F 0.91 0.33 0.27 8.19 8.38 8.34 Br H 0.94 0.41 0.08 8.30 8.30 8.22 I H 1.15 0.36 -0.16 8.40 8.61 8.51 Me H 0.51 -0.07 0.00 8.46 8.51 8.36 Br F 1.09 0.34 0.08 8.57 8.57 8.51 H Cl 0.70 0.11 1.24 8.68 8.46 8.60 Me F 0.66 -0.14 0.00 8.82 8.78 8.65 H Br 1.02 0.15 1.24 8.89 8.77 8.94 Cl Cl 1.46 0.51 0.27 8.89 8.75 8.77 Br Cl 1.64 0.52 0.08 8.92 8.94 8.94 Me Cl 1.21 0.04 0.00 8.96 9.15 9.08 Cl Br 1.78 0.55 0.27 9.00 9.06 9.11 Me Br 1.53 0.08 0.00 9.22 9.46 9.43 H I 1.26 0.14 1.24 9.25 9.06 9.26 H Me 0.52 -0.31 1.24 9.30 8.87 8.98 Me Me 1.03 -0.38 0.00 9.30 9.56 9.47 Br Br 1.96 0.56 0.08 9.35 9.25 9.29Br Me 1.46 0.10 0.08 9.52 9.35 9.33 Hansch模型应用举例预测结果一系列抗肾上腺素的活性化合物23m-X p-Y π σ130131QSAR方程a:(用两个变量)

值越大越好log(1/C)=1.151π-1.464s+7.817 (n=22;r=0.945)疏水性、电性效应QSAR方程b:(用三个变量) log(1/C)=1.259π-1.460s+0.208Es(meta)+7.619 (n=22;r=0.959)还考虑到了立体参数

π=疏水性参数

σ=Hammett电性效应(吸电子基团σ为正值)

Es(meta)=Taft立体参数Hansch模型应用举例提高X,Y位置上取代基的疏水性,有利于提高生物活性,供电子基团的引入有利于提高生物活性24QSAR方程a:(用两个变量) 值越大越好131

氟哌酸是喹诺酮类抗菌药的一类,商品名为诺氟沙星,由古贺弘利用Hansch方程进行了一系列QSAR研究而设计。活性的理论计算值为6.38,实验值为6.63。这是Hansch方法指导药物设计的成功范例。氟哌酸是喹诺酮类抗菌药的一类,商品名为诺氟沙132133261331342713413528135136291361373013713831138139321391403314014134141142Free-Wilson模型

基本假设

对于母体骨架相同的系列化合物,它们的活性是某些特定位置上的取代基所产生的活性加和

其中A是基准化合物活性的负对数值;是取代基所产生的活性加和,是取代基i在第j个位置上的基团活性贡献;表示取代基i在第j个位置上的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论