




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机辅助药物设计完整版第1章概论一、药物发现一般过程新药得研尢有三个决立阶段:先导化合物得发现.新药物得优化研究临床与开发研究。计算机辅 助药物设计得主要任务就就是先导化合物得发现打优化。二、合理药物设计1、合理药物设计(rational drug design)就是依据与药物作用得靶点,即广义上得受体,如酶、受体、 离子通道、病毒、核酸、多糖等,寻找与设计合理得药物分子。通过对药物与受体得结构在分子水平 甚至电子水平得全面准确了解进行基于结构得药物设计与通过对靶点得结构、功能、与药物作用方 式及产生生理活性得机理得认识基于机理得药物设计。CADD通过内源性物质或外源性小分子作为 效应子作用
2、于机体得靶点,考察其形状互补.性质互补(包扌舌氢键、疏水性、静电等).溶剂效应及运动协 调性等进行分子设计。2、方法分类(1)合理药物设计有基于靶点结构得三维结构搜索与全新药物设计等方法。后者分为模板立位 法、原子生长法、分子碎片法。(2)根据受体就是否已知分为宜接药物设计与间接药物设计。前者即通过结构测立已知受体或受 体-配体复合物得三维结构,根据受体得三维结构要求设讣新药得结构。受体结构测追方法:同源模建 (知道氨基酸序列不知道空间结构时).X射线衍射(叮结晶并得到晶体时).多维核磁共振技术(在体液即 在水溶液环境中)。后者通过一些配体得结构知识(SAR3I-算机图形显示等)推测受体得图像
3、、提岀假想 受体,采用建立药效团模型或3D-QSAR与基于药效团模型得三维结构搜索等方法,间接进行药物设 计。三、计算化学il算化学包括分子模型、计算方法、讣算机辅助分子设计(CAMD)、化学数据库及有机合成设 计。il算方法基本上可分为两大类:分子力学(采用经典得物理学定律只考虑分子得核而忽略外用得 电子)与量子力学(采用薛主谒方程考虑外圉电子得影响,分为从头计算方法与半经验方法)。常用得计算应用有:(1)单点能计算:根摇模型中原子得空间位置给出相应原子坐标得势能:(2)几 何优化:系统得修改原子坐标使原子得三维构象能呈最小化;(3)性质计算:预测某些物理化学性质,如 电荷、偶极矩、生成热等
4、;(4)构象搜索:寻找能量最低得构象:(5)分子动力学模拟:模拟分子得构象变化。方法选择主要有三个标准:模型大小;可用得参数;(3川算机资源 四、计算化学中得基本概念1、坐标系统分为笛卡尔坐标(三维空间坐标)与内坐标(Z矩阵表示,参数为键长、键角、二而角数摇)。前者适 合于描述一系列得不同分子,多用于分子力学程序,有3N个坐标;后者常用于描述单分子系统内$原 子得相互关系,多用于量子力学程序,有3N-6个坐标。2、原子类型:用来标记原子属性。3、势能而体系能量得变化被认为能量在一个多维得面上运动,这个而被称为势能面。坐标上能量得一阶导 数为零得点为立点(原子力为零,局部或全局最稳定)。4、面积
5、Van der Waals面积:原子以van der Waals为半径得球得简单堆积。分子面积:试探分子(常为半径1、4A得水分子)在Van der Waals面积上滚动得而积(包括试探球 与分子得接触而积与分子空穴产生得悬空而积)。可接近面积:试探球在分子van derWaais表而滚动时试探球原点处所产生得面积。5、单位:键长多用A(埃*angstroms),键能多用kcal/mol表示。五、计算机辅助药物设计软件及限制目前CADD存在得问题:蛋白质结构三维结构得真实性与可用性问题(细胞膜上得受体或跨膜蛋 白离开原先环境,空间排列会发生很大变化,难以得到真实得三维空间结构;大量受体结构未知
6、;很多受 体只有一级结构,获得得三维结构有限):受体配体相互作用得方式问题:设计得分子能否进行化学合 成:药物体内转运、代谢与体内毒副作用问题等。第2章分子力学分子力学就是基于原子间存在化学键、非键原子之间得范德华及静电相互作用这一经典理论,通 过分子几何、能量、振动光谱及其她物理性质得计算寻求分子得平衡构型及能量,确是有机分子得结 构、构象、能量及动力学模型。其计算忽略了电子得贡献,只考虑核。计算较小仅与分子中原子数目 得平方成正比。一般分子动力学软件提供三种位能而采样算法:单点:只就是对位能而上某一点计算,给出该构象下得系统能量与梯度(反应能量下降方向上该点 在位能曲线上陡度)几何优化:对
7、单点位能而采样,寻找梯度为零得构象,局部最小分子动力学:对势能面增加动能,导致分子系统按Ncton是律运动,在势能低点运动加快。主要用于能量最小化与构象搜索。受体结构已知,该法计算药物与受体得结合能;受体未知通过已知配 体导出药效团模型。、理论简介分子力学基本思想就是通过选择一套势函数与从实验中得到得一套力常数从给楚得分子体系 原子得空间坐标得初值,用分子力场描述得体系总能量对于原子坐标得梯度,通过多次迭代得数值算 法来得到合理得分子体系得结构。分子得化学键具有一立得键长、键角,分子要调整它得几何形状(构象),必须使其键长值与键角值 尽可能接近标准值,同时非键作用能处于最小得状态,由这些键长与
8、键角调节构象,给岀核位置得最佳 分布,即分子得平衡构型。分子力学优化只能就是局部优化若为了找到全局能量最低构象,须将所有可能得初始构象分别 进行优化,最后进行比较确楚分子体系得最优构象。二、分子力场分子力学有能力处理大分子体系,它从经典力学得观点来描述分子中原子得拓扑结构,就是通过 分子立场这个分子模拟得基石实现得。如果一个解析表达式能拟合位能而,则此解析表达式就成为分子力场,亦即一个力场得确定就就 是选择解析函数形式与确定参数。分子力学用几个典型结构参数与作用力来描述结构得变化,由分子 内相互作用(键伸缩,角弯曲,扭转能,而外弯曲等)与分子间相互作用(静电、氢键、vdW)构成。三、能量最小化
9、按就是否采用能量得导数分为两类:非导数法(即单纯型法:以逐个改变原子得位置来寻找能量最 小值,找到得并不一主就是局部最小值,主要用于调整分子得超始构象)与导数法。一阶能量导数得方 向指向能量最小化得点,梯度反映该点得陡度,有最陡下降法(SD)、共魏梯度法、任意步长逼近法;二 阶能量导数预测何处能量梯度方向发生变化,有牛顿拉普森法.SD:梯度就是进行搜索得方向,每次搜索之后旧得方向被新点处得梯度取代,适合优化最初段,尤 其就是减少大呈得非键相互作用非常有用,适用于大分子。共巍梯度法:不仅运用当前梯度,也采用先 前得最小化历史来确左下一步,收敛比SD快,用于大分子。NeYton.Ruphson法:
10、原则上可一步收敛, 但存储导数得矩阵太大,不适用于大体系。四、常用得分子力场以适合生物大分子得Amber *j适合小分子得MM2为代表。力场对静电得相互作用采用键得偶极方法,对于极性或电荷系统不能充分模拟,适用于 小非极性分子得结构与热动力学模拟。AMBER力场:广泛用于蛋白质与核酸,不适合用于小分子。OPLS力场:用于蛋白质与核酸,特别适用在液相系统中模拟物理性质。CHARMM力场:适用于生物大分子,充分考虑溶剂与溶剂、溶质打溶质、溶剂与溶质之间得相互作用。BIO+力场:CHARMM力场得补充,采用CHARMM立场得参数,结果与CHARMM 样。MMFF94力场:运用凝聚态过程,适合大分子与
11、小分子,且精确一致。Universal力场:针对整个周期表得分子力学与动态模拟力场,有过渡元素时得最佳选择。PASS力场五、分子动力学以牛顿力学为基础,把毎个原子瞧做符合牛顿运动楚律得粒子,在一怎时间内,连续几分牛顿运动 方程计算原子得位苣口速度得出原子得运动轨逍。分子动力学涉及Newton运动方程得积分,需要选 取适当得时间步长,选取得时间步长与运动得频率有关。分子动力学模拟经过三个阶段:加热、模拟(包 括平衡期与资料收集期)、冷却。构建分子得时候就是0K(原子运动速度为0),缓慢加热(使系统在每个步长里都接近平衡,在较短 时间达到模拟温度下得平衡)到模拟温度。对室温下得模拟,梯度应小于3,
12、就是为了避免人为得在高能 区产生得局部力使分子在张力较大得地方发生断裂或扭曲。在模拟期得平衡很重要,可以避免加热过 程中引入人为因素。分子体系冷却可降低在较高温度时分子得张力,冷却过程也叫模拟退火使分子从 高能构象越过一定得能垒转向稳定得低能构象。分子动力学模拟溶剂得作用,可通过选择媒介得介电常数与周期边界条件模拟,水得介电常数 80、4。采用周期边界条件模拟就是为了消除刚性壁边界条件与自然边界条件得表面效应。去顶八面 体常用于球形分子。分子力学模拟一般都应先对分子进行几何优化,在几何优化基础上再对分子进行动力学模拟。分子动力学得作用:(1)分子动力学主要用于能量最小化与分子力学得区别:分子力
13、学不能越过一定得能垒,只就是局 部优化;分子动力学模拟则就是全局优化低能构象(越过能垒高度与模拟温度有关h(2)通过分子动力学模拟,可再现分子得各种构象形式,用于推测药物与受体相作用得构象。(3)分子力学适合处理分子内张力(键,角,二面角)或vdw力等分子处于非极性溶剂中,当考虑到极性溶剂(如体内)或溶剂效应时,使用分子动力学方法.Monte carlo方法,Langevin动力学或模拟退火法。六、Monte Cmio 方法利用随机取样处理问题得方法称为Monte Carlo方法,它就是一种通过得采取随机数与概率统计 进行猜测来研究问题。分子动力学不能越过得能垒-Monte Carlo构象搜寻
14、可以就是跳跃式得,其优点 就是取样得构象恰当,对低能构象取样几率大。七、LangevinLangevin模拟就是随机动力学模拟,通过给各原子分配分子在溶剂中与其她分子相互碰撞并随着 在溶剂中运动产生得摩擦力得值进行模拟。Langevin动力学模拟只就是对分子施加一个力模拟碰撞 后得能量损失,所以不需要指明溶剂分子,多用于长链分子与聚合物。特别适用于研究溶剂中得大分 子。八、构象分析描述分子结构得三个层次:分子构造,分子构型,分子构象。构彖搜寻采用适当得方法产生种不 同得构象,并对这些构象进行能量最小化,比较这些构象并找出其中能量最低得构象。根据产生构象得 方法不同,可分为(1)系统搜寻法(系统
15、地搜寻分子得争购构象空间,寻找势能而上得极小点。最基本得 搜索方法就是格点搜索.即在分子构象空间中以柔性键得旋转角度小间隔为变量逐渐搜索。只适合处 理小分子体系,也不适用于环状结构。)与非系统搜寻两类。九、随机搜寻法(1)模拟退火方法就是分子动力学-Monte Carlo Langevin动力学在模拟时采取温度缓慢降低得方法。它首先使 体系升温,使分子体系有足够得能量,克服柔性分子中存在得$种旋转能垒与顺反异构能垒,搜寻全部 构象空间,在构象空间中选出一些能量相对极小得构象,然后逐步降温,再进行分子动力学模拟,此时较 高能垒已无法越过,在极小化后去除能量较高得构彖,最后可以得到能量最小得优势构
16、象。Monte Cmio退火方法采用Monte Carlo方法得Metropolis采样算法在某温度下,体系有起始 构象,构象发生微小得随机变化产生新得构象,相应得能量发生变化。如果能量差不大于零则接受构象 变化,新构象成为下一步得初始构象。如果能量大于零,选择一个随机数将其与原相比较,若能量小于 零则接受,新得构象成为下一次随机变化得起始点;否则拒绝变化,老得构象仍就是下一次随机变化得 起始点(过程中产生Boltzmann分布)。(与Monic Carlo得区别在于Monte Carlo模拟退火方法中温度 也就是体系得变量。模拟退火方法可有效地寻找分子得优势构象,因为其取舍构象时不仅接受能量
17、下降得变化,也接 收部分部分能量上升得变化,并且该法不依赖于初始构象。(2)高温淬火动力学就是高温分子动力学与能量最低化相结合来判断一系列构象得分布,往往还需要结合模拟退火。(3)遗传算法(主要用于全局优化)算法步骤:随机产生初始群体,群体中个体以二进制序列标记计算适应值(个体优劣得度量与 下一代存活概率)通过复制算子、杂交算子与变异算子产生新一代更具适应得群体。对于构象搜寻,染色体二进制序列得值表示分子可旋转得扭角。适应值为能量得函数。(4)距离几何法该方法核心仍为随机技术。待別适用于导岀大量信息无法手工解析得蛋白质与核酸得结构。第3章量子力学一、量子化学理论简介应用量子力学原理处理化学问题
18、,形成分子轨道理论、价键理论打配位场理论。分子轨道理论(又称Hancc-Fock理论)在物理模型上有三个基本近似:工:非相对近似就是电子在 原子核附近运动而不被得原子核俘获,必须保持很高运动度。近似认为电子质量等于电子静止得质量, 即电子质S恒为1个单位。Born-Oppenhehner近似就是在计算分子总能量(电子总能量与核排斥 能值与)时,把电子得运动与核得运动分开处理,忽略贡献很小得电子态之间偶合项,即非绝热项,故又 称绝热近似。单电子近似则认为电子波函数为n个电子所占据得轨道(单电子函数)得乘积。自洽 场:每一个电子得运动状态不仅受核力得作用,而且还要受其她n-1个电子所产生得势场得作
19、用,这样 在描述与电子势场时,必须考虑受作用得那一个电子状态与它本身作为其她电子运动时对势场得贡 献要一致起来,即自洽起来。这样得势场,成为自洽场。1、Hartree-Fock方法固有近似性,它忽略了局部得电子-电子效应,即忽略了电子相关。因此常采 取组态相互作用弥补这一缺点。组态指电子在其可能达到得各轨道上得排布方式得描述。通过用不 同组态得波函数进行混合来表示分子得波函数称为组态相互作用。利用组态相互作用给岀基态与激 发态得能虽可以预测电子得吸收频率、紫外可见光谱,用RHF得组态相互作用而不就是用UHF研究 键得断裂。2、另一个考虎电子相关能得方法就是MOIkr-Plesset微扰法(IP
20、)(NIP2最常用)。3、密度泛函(DFT)方法讣算电子相关能。传统得ab initio HF SCF方法难以考虎电子相关作用, 而MP等方法难以处理即使就是稍稍较大得体系。与波函数方法相比DFT使得量子力学方法可以 直接用于大分子得计算,比如生物大分子。二、从头计算法从头il算法(ab inifio)就是解全电子体系得非相对论得量子力学方程,全部严格讣算分子积分,不 做任何近似处理。体系得Hmilkm算符显全部电子(包括内层电子)得贡献。求解Hartrcc-Fock方程 就是一个试探与迭代得过程,全部计算达到进一步迭代时轨道能量(或总能量)不再变化(超过某阈值) 为止,于就是就称这些轨道与它
21、们所产生得位能场自洽,并務全部过程称为自洽场(SCF)方法。 Roothaan把分子轨道(MO)表示为原子轨道(A0)得基函数线性组合(LCAO-MO),即用LCAO逼近 Hariree-Fock轨道,导出一组代数函数,即Hartree-Fock-Rooihaan方程或Roothaan方程。原子轨道得集合称为基组(basis sei).极小基组就是Slater型轨道(Slater type orbitals.STO),毎个占 据轨道只用一个指数相表示,形式为STO-nGn表示毎个原子轨道得Gaussian函数个数,适当表示Slater 轨道至少需要有3个Gaussian函数。用具有不同指数来表
22、示每个占据轨道,用两个指数时得基组称为 双E基组(由一个收缩指数与一个发散指数线性组合给岀计算结果)。若对内层电子采用一个指数,而 对价电子采用两个指数,即为双E混合基组(般表示为3-21G3代表有3个Gauss函数描述内层轨道, 价电子也有3个gauss函数.2个收缩函数J个发散函数)。在双基组再加上极化函数,用*号表示增 加一组d型函数描述2p轨道分子中得极化情况,用*表示表示除增加d型函数外,又增加P型函数表 示1S轨逍在分子中得计划情况,称为双g扩展基组。从头il算法只就是说明它就是全电子得、非经验得计算方法。量子化学从头计算方法可以获得 相当高得精度,甚至达到所谓得化学精度。三、简化
23、得从头计算方法2、3、4、5、1、价电子从头计算方法(VE-AB INITIO)浮动球高斯轨道方法(FSGO)分子碎片法(MF)通常用于研究有机大分子。模拟从头计算分子轨道方法(SAMO)基于固体物理得Slater-Xa方法 四、半经验方法定义:引入可调参数,体系Hamilton算符只显价电子得贡献。一种基于Harircc-Fock-Roothaan方 程,借用经验或半经验参数代替分子积分。叮分为处理兀价电子与处理全部价电子两大类。每一类中 又分为单电子法与双电子法两种。前者忽略了电子间得相互作用,后者则考察了电子间得排斥能。(1加价电子处理(Huckel近似):只考察n价电子,对于共轨分子就
24、是十分成功得。其单电子法为简 单分子轨道法(HMO),双电子法为PPP法。(2)全价电子处理:对于非平面型分子,已不能将7t电子单独分离出来,必须将G电子包括在内得所 有价电子都考察进去。 单电子法:包扌舌推广得HMO法(EHMO)o EHMO从就是否要求电荷自恰与自洽得严格程度又 分为簡单EHMO.电荷迭代EHMO(IT-EMHO)与电荷迭代与组态相关EHMO(C-EHMO.EP MWH法)。 EHMO不能预测键长,计算电荷密度较高,一立条件下汁算键角比较准确。由于EHMO方法汁算量小, 又能在研究同系物与分子内部电荷分布、键性质、分子轨道能级及其对称性,较多应用于大分子与含 重元素得化合物
25、或原子簇。 双电子法:包扌舌外种忽略微分重叠方法(NDO)及修正得NDO方法。NDO根据双电子积分时忽 略程度又分为全忽略微分重叠方法(CNDO),间略忽略微分重叠方法(INDO)与忽略双原子微分重叠方 法(NDDO)半经验方法中常用得计算方法CNDO, INDO CNDO就是最简单得自洽方法,用于计算敞开与封闭体系基态得电子性质,就是计 算药物电荷分布得首选方法(注:但并非精度最高得方法)。MINDO3就是将INDO许多相互作用得计 算用参数代替,汁算分子基态性质较为成功,主要用于有机大分子特别适用于含硫化合物。ZINDO/1将INDO扩展到过渡金属.用于汁算含过渡金属分子得能量打几何优化.
26、ZINDO/S可用 于预测紫外可见光谱环适用于计算几何优化与分子动力学。基于忽略双原子重叠方法有MNDO与AMI法.MNDO方法对NDDO方法所做得得修正主要就 是采用电荷多极矩作用表示双中心电子积分,其次就是引入带参数得函数来表示几个重要积分,最后, 它用光谱数据对单中心双电子积分参数化时部份地考虑了相关能。AM1就是对MNDO方法得改进,也就是最精确得方法之一,用于含有第一周期与第二周期元素得 有机分子,不适用于过渡金属,计算同时含有氮与氧得分子结果好于MNDO. PM3仃AM1方法一样, 只就是参数与不一样,其对非键相互作用计算优于AM1,主要用于有机分子与主族元素。五、药物设计中量子力
27、学活性指标无论就是药物分子还就是生物大分子,都就是具有一世结构得化学物质,它们得化学性质都就是 有其外周电子得基本结构特性所决是得。1、轨道能fi以前沿轨道能量最为重要,它们就是HOMO(最高占有轨道能)与LUMO(最低空轨到 能)o HOMO能可作为分子给电子能力得量度,而LUMO能则可作为分子接收电子能力得量度-Ehomo 分子得电离势相关,作为分子给电子能力得量度,其值越小,该轨道中得电子越稳左,分子给电子能力 越小,Ellmo与分子得电子亲与能直接相关,其值越小,电子进入该轨逍后体系能量降低越多,该分子接 收电子得能力越强。Euomo-Elcmo之差就是非常重要得稳立性指标,其差越大稳
28、运性越好,在化学反 应中得活性越差,该值近似等于分子得最低激发能,所以有时也将其作为化学反应得最低活化能(但这 种想法忽略了分子在激发态时得重组,常出现错误)。2、电荷密度得大小可以反映原子发生反应得倾向性,电子密度越大得位置与亲电试剂得反应 性越大,而电子密度越小得位置则于亲与试剂得反应性越大。3、键级(bond order,P)即键得数目,表示两个相邻原子间成键得强度。4、离域能亦称共觇能,就是指通过电子得共轨作用发生超共轨而使体系趋于稳,活化能降低得 能量。离域能越大,反应则越易于进行。超离域度(SJ就是以轨逍能级系数得倒数加权得电子密度,就 是离域能得度量参数。5、原子自极化率(旳其值
29、越大则表明她在攻击物质面前越容易调节自己得电荷,因而活性也较尢 常成为反应活性点。6、前沿电子密度如也称福井函数,前沿轨道得电子密度fr就是比较分子内部不同位置得化学反 应活性得量度。注:前沿轨道电荷只能用来描述同一分子内不同原子得活性。7、静电势指一个单位正电荷从无限远处带到某一点所要做得功,比单个原子得静电荷密度更反 映实际。夭、QM/MM量子力学与分子力学相结合在研究受体与药物相互作用时,有时要涉及到化学键得生成与断裂,近年来发展了虽子力学与经 验力学相结合得方法一M/MM模型。方法中最重要得一步就是根据研究得目得划分体系,通常将 体系化分为如下几个区域:量子力学区域,分子力学区域与边界
30、区域。第4章二维定量构效关系定ft构效关系就是研究一组化合物得活性或毒性或药代性质仃其结构之间、物理化学性质Z间 Z间或者拓扑结构之间得相关关系,用数理统讣与数理模型加以表征得研究方法。其意义为:在受体结 构未知得情况下,揭示化合物得结构打活性得依赖关系,建立表征这种关系得数学模型,以预测新化合 物得活性,演绎受体与药物结合并呈活性时得立体环境及物理化学要求。QSAR数据主要由两部分组成:活性数据又可称为应变量,在QSAR中,应变量活性参数通常以产生标准生物效应时药物得物质 得量剂量或物质得量浓度得负对数(logl/C)表示。化学描述变*(即为自变虽)包括:(1) 理化参数描述符 疏水性参数L
31、ogR脂水分配系数。通过摇瓶法与HPLC法测左。 电性参数Hammcu cr常数:表示芳香取代基得诱导与共轨效应之与;t值:取代基诱导效应之与; 偶极矩(P);解离常数pKa;红外、紫外、NMR、MS等光谱数据。 立体参数Taft立体参数:Es=l藝虽(kx/kH)A Es越小,表示体积越大,水解速度越慢。摩尔折 射:MR=m2-ln2+2SMIV/d(cm3/nioD,数值越大代表体积越大;Van der Waals 体积:STERIMOL 多维立 体参数。(2) 分子片段描述符描述符将分子中某一特征片断,如原子片断、环片断以及亚结构片断作为描述 符代码,就是一种拓扑学范畴得描述符。(3)
32、分子连接性指数反映了分子中各原子排列状况、分支大小且与多种理化常数及生物活性相关。 可用质谱得质荷比作为描述符。(4)其她参数QSAR得分折方法:线性回归分析法与模式判别法。回归分析:就是对一组数据进行最小二乘拟合处理并建立函数关系得过程。当有几种性质可能对 活性有贡献时,可用多元回归来处理。拟合函数得统计评价也就是这种分析得一部分。常用得包括 Free-Wilson方法与Hanseh分析法等。线性关系得判别:因变量与自变量之间就是否存在线性关系通过对回归系数进行I检验来断 宦。进行I检验后,如果发现有得偏回归系数不显著,那么就要从回归方程中删除这些没有明显作用得 自变量,删除变量时不可同时将
33、几个不显著得自变量一起去掉,应当先删去t值最小得一个变量,重新 计算回归方程,对新得回归方程得回归系数作检脸,再删去新方程中一个不显著得自变量,如此重复,直 到回归方程中所有得自变量都显著为止。方程得显著性检验可用复相关系数取值R断宦。复相关系数R反映了因变量与所有自变量之间 回归关系密切得程度,检脸R得显著性就就是检验回归方程得显著性。因变量与自变量总体相关并 不意味因变量与每个自变量都显著相关,因此还需按上述方法对偏回归系数作显著性检验。虽然R就是衡量总回归效果得重要标志,但R值得大小与回归方程中自变量得个数n,及因变量所 取得观察值得个数k有关。当n相对于k不很大时,会获得较大得R值,即
34、容易产生偶然相关。进行多 元回归时要注意n y k得比例。一般认为n至少就是k得4倍或5倍以上,就就是说1个自变虽要求 因变量有45个观察值对应,以消除偶然相关得影响。另外,需要注意,由自变量预测因变量时,所用得 数据不应超出建立回归方程时数据范围,不能随意外推。数据拟合后所得方程得好坏也可用R2与S两种统计量来判断。R2就是方程方差在数摇方差中 所占得份数.R2= 1表示数据对方程完全适合,而W=0、50表示数据中只有50%得方差可用方程解释; 补充统计量S就是观察值与方程预测值得标准偏差。如果方程得S值较实际测宦得标准偏差小,表明 数据拟合得较理想。回归分析通常被运用于结构非常近似得化合物
35、。当化合物结构差别较大时,由于描述符类型过多 且难以产生相关性,此时有模式识别:以建立能区分活性种类得判别函数为目得。常用得方法:(1) 聚类分析 预先将为数众多得不同取代基(称为样本或样品),按K化学结构参数(称作变量或指 标)进行分类,使化学结构参数相近者归为一类,不同者归为其它类别。对样本分类得方法为Q型聚类 方法,对变量分类得方法为R型聚类分析法。(2) 主成分分析合理地从I;个主成分中挑选出少数儿个彼此无相关性得主成分作代表,就可以获取 由原始变撼提供得绝大部分信息。(3)非线性变换(4)因子分析主成分分析相当类似,利用相关系 数矩阵以少数几个互不相关得主因子来代表原始变量所提供得信
36、息。(5)人工神经网络QSAR应用:(1)预测同源物质得生物活性(2)避免合成过多得化合物;(3)更有目得地提高化合物得 选择性作用;(4)预测化合物得某些成药性质;(5)帮助了解药物得作用机制及描述受体得图像。2D-QSAR限制:使用前提(1)假出化合物得结构与生物活性之间存在一楚得关系,也就就是说,结 构打活性之间存在函数关系(2)根据已知化合物结构一活性数据建立得函数.可以外推置新得化合物 (3)化合物得结构可用适当得结构描述符来表示(4)所有化合物得限速反应均相同(5)化合物与酶或受 体结合时,药物、酶或受体所引起得构象变化不予考虑(6)与受体亲与力有关得线性自由能参数得具有 加与性(
37、7)药物在体内代谢得差异均予以忽略。定量构效关系得应用注意以下几个方面:(1)只能应用于作用机制相同得化合物,作用机制不同得 化舍物难于应用。一般认为,结构相近得同源物,其在体内得作用机制就是相同得;(2)只能预测同源物 得生物活性,对于非同源物由于作用机制不同不能预测;(3)在预测生物活性方面并不都就是成功得。 因为所得到得楚量关系式还不能完全解释化合物与受体或酶间得作用情况,同时现有得理化参数还 不足以真正描述化合物生物活性得本质;(4) 一组同源物质得生物活性变化幅度若小于一个对数单位 时,往往难于得到满意得相关结果,这可以由相关系数r得计算方法造成得;(5)参与回归分析得化合物 数目与
38、所得到得相关式中参数项数目之比至少为5:1,在进行回归分折计算:中,若有偏离较大得化合物 需要除掉时,除掉得数据点不能多于原化合物总数得10%以避免掺入人为得因素而导致机会相关。对 于被除去得数据点应给以合理得解释;(6)主量构效关系得研究不能代替药物设计得所用工作,也不能 发现结构全新得先导化合物,对于一个全新得化合物也无法预测她得生物活性,这一方面可以通过三 维左量构效关系进行。非极性化合物了水混合时会形成互不相溶得两相,即非极性分子有离开水相进入非极性相得趋 势,即疏水性.非极性溶质打水溶剂得相互作用则称为疏水效应。疏水常数得定义:化合物在脂水两相中平衡浓度之比,通常将分子在水正辛醇体系
39、中得分配系数 logP作为疏水性得度量,选择水一正辛醇体系就是由于该体系与生物体系相似。Lo胃P得测定方法:(1) 摇瓶法。摇动一个装有两种互不相溶溶剂与一种溶质得烧瓶,待达到平衡后,分析溶质在其中一 相或两相中得浓度。缺点:速度慢、费时、繁琐、易受溶质得稳宦性或纯度得影响。(2) 薄层色谱法(原理就是Io胃P与色谱保留指数RM具有线性关系):(3)反相高效液相色谱法;(4) 估算方法碎片加合性法(原理就是把分子划分为基本片段,每种特立得基本片段具有特定 得贡献值,整个分子得logP值就是其所含得所有片段贡献得加与。由于该法假宦分子得疏水常数具有 加与性,因而若偏离该假定则就有较大误差。)基于
40、分子性质得汁算方法(注意:含竣基等极性基团得 分子在疏水过程中包含电离、水合与形成离子对等现象logP得计算偏差较大。)用20个已知LOGP得緡体化合物库名为建立只有5个参数得回归方程,预测化合物LOGP得取 舍得原则有可能以实验题考核):(1)若交叉相关系数0、9,说明两参数就是高度相关得,也就就是说回归方程中只需其中一个就可 (2)若删除与logP相关系数W0、05得参数导致F值下降,则不应删除对两个参数其它条件相似可 删除与logP相关性小得参数(4)删除过程中应注意复相关系数R2 -与Fisher值,以判断参数得取舍。Hansh回归方程(即多元线性回归方程,又称二维楚量构效关系)提出了
41、同源物得生物活性与各种 取代基得理化参数之间得依赖关系,采用最小二乘法经多重回归,用与自由能相关得参数方程表示也 就就是线性自由能相关方法丄Ogl/C=k“2+k2” +k3 0 +k4Es + kS.K中C为化合物产生指楚生物效 应得物质得量浓度、n为疏水参数、0为电性参数、Es为立体参数、kl.k2.k3.k4代表权重即各因素 贡献大小得系数。1、疏水参数处就是被取代得化合物得脂水分配系数(正辛醇-水)(logP)*j未取代得母体化合物得 脂水分配系数之差。-兀2表示药物得亲脂性与生物活性呈倒抛物线关系。随着脂溶性增加,到达作用 部位得概率也逐渐增加,达高绦后,又由于亲脂性过大,则药物难以
42、在水相中运转,而在脂肪组织中含量 增加,使到达作用部位得概率又下降,所以药物需要适当得疏水性,活性最大时得疏水性为最适兀值 (logPO (参见下面得HANSCH抛物线模型)2、电性参数指取代基得电性效应对分子反应性能得影响。Hammett取代常数(。)反映芳环间 位或对位上侧链取代基得影响(共轨效应与诱导效应之与),0为正值表示为吸电子基;负值表示为推 电子基。Taft取代常数9 *)就是反映脂肪族化合物中未构成共轨体系得取代基团极性效应得量度。3、立体参数仮映所代表基团得大小及它对配体受体位相互作用接近得影响。Taft Es值为用 酸性介质中得水解速率常数反映立体因素得影响。氢得Es值为零
43、.基团越大,Es值越负。摩尔折射 (MR)反应就是液体得物质得量体积,若方程中MR项为负值,即表示空间位阻为重要影响因素,如果为 正值,说明由诱导极化产生得色散力为主要影响因素。der Waals参数.用van der Waals体积(必) 与半径仏)来表示基团得实际大小理an der Waals半径与Taft E值用作立体参数得主要缺点就是具有 这些常数得基团数目很有限。最小立体差异(MSD)参数:反映一个化学式与另一个化学式相互重叠 在一起时,以其不重合部分得差异为基础。Kubinyi双线性模型:该模型与Hansch得抛物线模型得不同点就是曲线得上升及下降部分均为 直线,仅在最适logPO
44、附近为抛物线,且两直线得斜率根据数据得分布情况而变化,而不就是像抛物线 那样上升与下降两部分为对称得弧线,因此对数据可更好地拟合。HANSCH-FUJITA法得注意:所有化合物必须就是同源物,即母环相同与受体具有相同得作 用机理需要化合物具有较大得物理化学性质得差异所选择得参数之间不能有相关性化合物 得活性差异至少要大于10倍(6)建模化合物得数量至少就是回归分析选用参数得5倍。HANSCH-FUJITA法得限制:(1)只考虑化合物与受体得作用位点,而不考虑化合物化合物与受体 结合时得构象变化(2)所有参数只能表达二维意义上得结构特征,不能表征三维特征;不能世量得解释 三维结构与生物活性之间得
45、关系(3)只能用于先导物得优化,不能用于先导物得发现。第五章基于受体得药物设计(直接设计法)分子对接(Molecular Docking).就是将小分子化合物(配体)识別、适配与结合于生物大分子(受体) 得虚拟操作,旨在发现与受体结合部位相匹配得小分子化合物。就是从虚拟库中筛选苗头与先导化合 物得重要方法。受体与药物分子之间通过空间匹配与能量匹配而相互识别形成分子复合物,并预测复 合物结构得操作过程。分子对接得用途:(1)研究分子间得结合模式(2)预测分子间得结合能力(3)药物设计(先导化合物 得发现或者改适)(4)蛋白质工程分子对接得原理:药物与受体分子得结合强度取决于结合得自由能变化(AG姑小,结合得自由能变 化与药物-受体复合物得解离常数得对数成线性关系。AGtAA=-2. 303 /?ngKi,即85 IgKi 基于该公式,由分子对接得能量值即可预测配体与受体间
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高三数学复习计划的在线学习工具
- 榜样激励法在青年大学生理想信念教育中应用研究
- 光催化异腈自由基串联环化合成喹啉-菲啶的研究
- 小学“双减”政策实施的校内活动案例
- 2025年按摩池设备项目市场调查研究报告
- 环境监测人员穿脱隔离衣流程
- 班级活动中的趣事记事作文9篇
- 绿色建筑物业交付工作计划
- 公共事务管理实习总结与未来展望
- 2024-2025学年初一英语阅读理解计划
- 《离散数学》题库答案
- 口腔种植手术协议书
- 小学英语-国际音标-练习及答案
- 2025-2030年国有银行行业市场深度分析及竞争格局与投资发展研究报告
- 2025年建筑模板制品行业深度研究报告
- 挂名股东签署协议书
- 2025国家开放大学《员工劳动关系管理》形考任务1234答案
- 湖北省荆门市2025年七年级下学期语文期末考试试卷及答案
- 环境监测中的化学分析技术试题及答案
- 2024-2025湘科版小学科学四年级下册期末考试卷及答案(三套)
- 下肢深静脉血栓的预防和护理新进展
评论
0/150
提交评论