




已阅读5页,还剩24页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
硕士学位论文 m a s t e r st h e s i s 摘要 定量构效关系研究( q u a m i t a t i v es t r u c t u r ea l l da c t i v i t yr e l a t i o n s h i p ,q s a r ) 是开 发新药物的重要辅助手段。尤其是在不知道受体结构的情况下,q s a r 研究能够总结 实验结果,确定下一步实验的目标。 本文第一章详细介绍了一种3 d q s a r 方法比较力场分析( c o m 口a r a t i v e m o i e c l l l a rf i e l da l l a l v s i s ,c o m f a ) ,及其强化工具包:a d v 柚c e dc o m e a 。a d v a n c e d c o m e a 工具包由数据库叠合,r e g i o nf o c u s i i l g ,o p t i m i z i n gq s a r 等几个模块组成。 不仅能帮助我们生成并优化c o m e a 模型,而且还可以大量自动生成新的结构并进 行活性预测,使整个分析过程更加快速,全面。 文中第二章详细讨论了一个使用c o m f a 法和a d v a c e dc o m e a 工具包构建模 型并预测新化合物活性的例子:a 一氧代膦酸酯类衍生物的c o m f a 分析。 为了研究n 氧代膦酸酯类衍生物的除草活性与其结构之间的关系,发现有更高 活性的除草剂,我们对它们作了c 0 m f a 分析,建立了比较好的c o m e a 模型。在 得到的c o m e a 模型基础上,参考合成人员的意见,选用了s y b y l 程序中s u b l v 表格内常见的3 2 个取代基,使用o p l i m i z i i l gq s a r 模块生成并预钡4 了大量的新结 构( 共计5 1 2 0 个) 及其活性,从中进行筛选的结果,为合成人员的下步工作提 供了可能的方向。 关键字:q s a r ;c o m f a :a d v 柚c e dc 0 m e ;a 一氧代膦酸酯类衍生物 硕士学值论文 m a s t e r st h e s i s a b s t r a c t q s a r ( ( h 柚t i t a t i v es t m c t u r ea i l da c t i v i t yr e l a t i o n s l i i p ) i sv e 哆i m p o n a i l tf o r d i s c 0 血gn e wd r u 笋,w h c nt h ee x a c ts t m c t u r eo ft h er e c e p t o ii su n d e a r i l it l l i sp a p e r ,c o m f a ,ak i i l do f3 d q s a ra p p r o a c h ,a n di t sp a c k a g co fe x t e n s j o n s a d v a 眦e dc o m e a r ei n t r o d u c c di nd e t a i l s “a d v 柚c e dc o m e ”w h i c hi n c l u d s “d a t a b 鹋ea l i g n n l e n t ”,“r c 舀o nf o c i i s i n 窖,“o p t i l l l i z i n gq s a r ”,e t qi sv e r yu s e f u l t o h e l pu sb u j l d 锄do p t i m i z eo u fo d m f am o d e l ,a n dm o r e ,c r c a tam a s so fn e ws t n | c t u r e s ( m a yb co v c rt h o u s 锄d s ) a l l dp r c d i c h ec o r r e s p o n d i n gt a r g e tp m p e n i e s h o wc a nt h e t e c h n i q u e sm e n t i o n e da b o v cb e u s e dt ob u n dt t i eo d m e am o d e lw a sd i s c u s s e di nd e t a i l t bf i i r t h e re x p l o r et l l e m p r e h e l l s i v es t n l c t u r e - a c t i v i t yr e l a t i o n s h i po ft l l ea ( s u b s t i t u t e dp h e n o x ya c e t o x y ) a l k y lp h o s p h o n a t e s 她ds e e km o l e c i l l e sw i t hs u p c r i o r p m p e r t y ,t h e ( b m i as t u d i e sa r cp e r f b 咖e d i nt h i sp r o c e s s ,w ea l s ou s e ds e v e r a l f a c i l i t j 鹪i na d v 柚c e d ( = 0 m 壬1 a ,w i t l lt l l e j rh e l p ,w eo b t a i n e dm cc o m i am o d e lf a s t c ra n d b e t t e la n dt h e n ,b 舔e do nt 量l em o d e l ,w cd e s i g n e d5 1 2 0c a n d i d a i es i m c t u r c s ,g o tt h e c o r r e s p o n d i n gb i o l o 百c a lp o t e n c i e s t h j ss t u d yo f ! i - c r e dt l l ec h e m i s t sap o s s i b l ed i r e c t i o n k e y w o r d s :q s a r ;c o m e a ;a d v a i i c c dc o m e a ;a 一( s u b s t i t u t e dp h e n o x ya c e t o x y ) a l k y i p h o s p h o n a t e s 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作 所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本声明的法律结果由本人承担。 作者签名:爿汤荡 日期:2 裤月争日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借 阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 作者签名:彳匆苗 日期:刀形年月厶日 导师签名:参鬯 日期:矽嘲绰多月年日 本人已经认真阅读“c a l i s 高校学位论文全文数据库发布章程”,同意将本人的 学位论文提交“c a l i s 高校学位论文全文数据库”中全文发布,并可按“章程”中的 规定享受相关权益。回童途塞握銮后澄卮! 旦圭生;旦二生;旦三堡蕉壹。 作者签名:彳纫荡 日期:勿r 裤月4 日 导师签名: 日期:耐年多月争日 第一章绪论 1 10 s a r 定量构效关系1 。2 ( q s a r ,q u a n t i t a t i v es t r u c t u r e a c t i v i t yr e l a t i o n s h i p ) , 是用化合物的理化参数或结构参数拟合数学方程以预测化合物的生物活性。用此方 程,人们可以“定量”地预测化合物的结构发生一定量的变化时,其对应的生物活 性的改变。 定量构效关系的历史可以追溯到1 9 世纪中期。f r a s e r 和c r u m b r o w n 提出了第 一个定量的构效关系表达式3 : 中= f ( c )( 1 ) 其后的r i c h a r d s o n ,r i c h e t ,m e y e r 等人也是沿着这条思路进行研究,但是他们 没有提出具有普遍意义的结果。 1 22 d 一0 s a r 1 2 1h a n s c h f u j i t a 法 上世纪6 0 年代,美国p o m o n ac o l l e g e 化学系的理论有机化学教授c o r w i n h a n s c h “,和来自日本京都大学农学院的t o s h i of u j i t a 6 ,共同提出了h a n s c h 方程: l o g ( 1 c ) = a l o g p + b o + + 常数 ( 2 ) ,= l o g p r 一。一l o g p r ,h ( 3 ) ( 2 ) 式中的l o g ( 1 c ) 为化合物产生的一定生物活性所需的摩尔浓度的负对数, l o g p 为化合物以正辛烷水为溶剂系统测定的酯水分配系数,o 为h a i f i i n e t to 电性 参数:( 3 ) 式中。为取代基的疏水性常数,l o g p 。为取代化合物的酯水分配系数, l o g 艮。为母体化合物的酯水分配系数。 h a n s c h 方程第一次提出了有普遍意义的定量构效关系模型,而且在研究过程中 开始利用计算机,由此产生了一门新兴的边缘学科:计算机辅助药物设计 ( c o m p u t e r a i d e dd r u gd e s i g n ,c a d d ) 。这使定量构效关系的研究从l9 世纪萌芽 以来,出现了第一次的大突破。 硕士学位论文 m a s t e r s t h e s l s h a n s c h 法的一个特点是所使用的参数:包括物化参数,结构参数,拓扑学参数, 大都来自化合物的二维结构,因此把这些方法统称为2 d q s a r 。目前,公认的主要 2 d q s a r 研究方法除了h a n s c h f u j i t a 法,还有f r e e w i l s o n 法,和分子连接法。 1 2 2f r e e w is o n 法 f r e e w i l s o n 法7 的基本思想是:药物分子中某一基团在某一特定的位置上对活 性有特定的贡献,且这种贡献有加和性。基于此种思想建立的统计模型为: 生物活性= a + ;j g 。j x “ ( 4 ) 式中: 生物活性引起一定生物效应所需化合物的物质的量浓度的负对数:一1 0 9 c 。 a 参比化合物的生物效应 g 。,一取代基i 在j 位置上的贡献。 x i 。取代基i 在j 位置上存在,x ;,= 1 ;否则,x ,。= o 。 用最小二乘法解出( 4 ) 式,g 。,即为参数x ;,的回归系数,根据系数的数值即可 得到相应取代基在特定位置上对生物活性的贡献情况。 1 2 3 分子连接性指数法 分子连接性指数8 是根据分子结构计算出来的常数,反映了分子结构上的拓扑性 质,如分子结构中的连接情况和分枝的多少。这种方法的基本假设是:分子的性质 和分子结构计算得到的连接性指数间存在某种函数关系。该方法的主要特点是:应 用范围广,使用简便,但是无法处理分子在立体结构上的差异,也就无法知道最佳 化合物的确切结构。 分子连接性指数法,f r e e w i l s o n 法和h a n s c h _ f u j i t a 法使用的参数都来自化 合物的二维结构,其中h a n s c h f u j i t a 法所使用的参数,如1 0 驴( 酯水分配系数) , o ( h a m m e t to 电性参数) ;,( 疏水性常数) 等有很明确的物理意义,是目前最重 要的2 d q s a r 方法。 1 33 d 一0 s a r 方法 实际的药物和受体都是3 维结构,考虑两者之间的互补也应该考虑其3 维结构 的互补。用2 d q s a r 研究,必然会有其片面性。为此,一些学者提出了考虑分子三 维结构性质的研究方法。 1 3 1 分子形状分析方法 分子形状分析9 ( m o l e c u l a rs h a p ea n a l y s i s ,m s a ) 由h o p f i n g e r 等人于1 9 8 0 年开创。它认为柔性分子可以有多种构象,从而也就有多种形状,而受体所能接受 的形状是有限的,这样分子的活性就应该与该分子形状对受体腔的适应能力有关。 m s a 使用可以表达分子形状的参数,如与体系参照分子的重叠体积,分子势场积分 差异等作为变元,经统计分析求出q s a r 关系式。 分子形状分析法是分子构象分析与h a n s c h f u j i t a 方法结合的产物。它与 2 d q s a r 的不同仅在于引入分子重叠体积和分子势场积分等反映分子形状的参数作 为变量,但这些参数的物理意义并不很明确,所以这种方法只能算是一种初级的 3 d q s a r 方法。 1 3 2 距离几何学方法 距离几何学三维构效关系”认为:药物一受体相互作用是通过药物的活性基团与 受体部位相应的结合点的直接作用而实现的。药物的活性强度由其活性基团与受体 结合位点的结合能衡量。这一结合能与药物活性基团的性质和活性位点的类型有 关。通过选择合理的受体结合位点分布模型和药物分子的结合模式,使之最佳拟合 实验数据,就可以得到一套与药物活性基团和受体结合点类型相关的能量参数。对 于新化合物,确定其结合模式之后,使用这些能量参数,就可以定量预测其结合能, 进而推之其药效强度。 距离几何学方法的基本步骤有: 1 ) 用合适的方法构建出各化合物分子的三维结构,旋转各分子中的重要单键, 在几何允许的条件下,求得一个表示分子内两两原子之间的上下限矩阵。 2 ) 精简化合物结构。 3 ) 分析各化合物的结构特征,设置一套合理的受体结合点的空间分布方式和 各结合点的物化特性。 4 ) 用距离几何学法,从空间点阵的上下限矩阵出发,寻找一种对各化合物都 硕士学位论文 m a s t e r st h e s i s 适合的结合模式,结合模式指药物分子的哪一活性基团与受体结合部位的 哪一个结合点相作用。 5 ) 计算第i 个分子的结合能。 6 ) 如果第5 步的结果与实验值差值很大,则修改结合模式以提高拟合程度。 7 ) 对新化合物利用结合能参数搜寻结合能最佳的结合模式,计算结合能,即 可预测其生物活性。 1 3 3 比较分子力场分析( c o 岬a r a t i v em o l e c u i a rf i e i da n a l y s is c o m f a ) 1 9 7 9 年c r a i i i e r 提出一种用分子周围的体现在三维空间的力场来描述化合物性 质的方法,并用主成分分析法从这些力场中提取变量,进而构建构效关系的模型。 经过几年的改进,如用p l s 法代替传统的主成分分析法,并引入交叉验证等,1 9 8 8 年,c r 鲫e r 等人提出了比较分子力场分析( c o m p a r a t i v em o l e c u l a rf i e l d a n a l y s i s ,c o m f a ) 。 比较分子力场分析”( c o m p a r a t i v em 0 1 e c u l a rf i e l da n a l y s i s ,c o m f a ) 基 于一个基本假设:药物与受体之间通过非共价键的作用力来相互作用,不同的化合 物之间生物活性的差别和化合物周围的这种非共价键“力场”相关。c o m f a 法就是 表达出候选化合物的力场,比较这些力场的差异性,然后利用统计学的方法,归纳 出分子周围的“力场”与分子的生物活性之间的关系一比较力场分析。因为这种 分子力场是体现在3 维空间的,所以c o m f a 分析是一种典型的3 d 咱s a r 。 c o m f a 法的具体的步骤是: 1 ) 构建已知生物活性的化合物在生物体内的活性构象。不过,因为生物体内 化合物的活性构象无法直接测得,因此这一步需要的构象一般用化合物的 最低能量构象替代。 2 ) 将构建好的化合物构象按一定的规则进行叠合“。 3 ) 设计一个3 维网格,大小能容纳叠合后的构象。 4 ) 选择合适的分子或基团作为探针。 5 ) 将被研究的所有化合物的构象依次放入所设计的网格中,用选择的探针在 网格内以一定的步长( 默认为o 2 n m ) 移动,每移动一步就计算探针与化合 物之间的立体静电相互作用能。 项士学位论文 m a s t e r st h e s i s 6 ) 用偏最小二乘法( p a r t i a ll e a s ts q u a r e s ,p l s ) 对数据进行分析。得出 q s a r 模型 7 ) 构建欲合成的目标化合物的构象,用得到的q s a r 模型对其活性进行预测。 8 ) 合成出预计有好的生物活性的化合物,测量其活性,检验c o m f a 模型。 这里有几点要说明的是: 1 为什么要叠合? 叠合分子是为了方便比较它们周围的力场的差异。好比,我们若要比较自己左 右两个手掌上十根手指的差异,很自然地会双手合十,大拇指对大拇指,食指对食 指,这样一对应起来,两两之间的差异一目了然。一样的道理,只有我们把分子 骨架叠合好时,力场之间地差异才易于被比较出来。 2 关于探针 c r a m e r 认为可以使用任何的原子作为探针进行计算。不过当要解释力场的理化 意义时,比如,要考虑力场中有静电相互作用时,就不能不考虑探针的性质。一般 在s y b y l 的默认条件下使用s p 3 杂化的c + ,用其来计算立体场和静电场。 3 关于偏最小二乘法( p a r t i a il e a s ts q u a r e s ,p l s ) 偏最小二乘法( p a r t i a ll e a s ts q u a r e s ) 是一种多元统计数据分析方法,它于 1 9 8 4 年由伍德( s w 0 1 d ) 和阿巴诺( c a l b a n o ) 等人首次提出”。经过二十年多年的发 展,在化学计量学上,偏最小二乘回归已作为一种标准的多元建模工具。 偏最小二乘法能实现回归建模( 多元线性回归) 、数据结构简化( 主成分分析) 以 及两组变量之间的相关性分析( 典型相关分析) 三种数据分析方法的综合应用,因此 偏最小二乘法之又被称为第二代回归方法。 硕士学位论文 m a s t e r st h e s l s l 嗣) 世。:、。:、。:、。、:,、:、。:、。 1 1 ,:1 :q :、h ,:、h ,q :、:q 。:1 p l s 。口u 盯。h 山 肋= + 占 鱼彬,+ 矗岸虫丸材一 所印粥p 厅 。a 丸, 。+ z x 芒9 9 8 图lc o m f a 的建模流程图 偏最小二乘法对比常规的多元线性回归的优势体现在以下几个方面: 1 偏最小二乘法是一种多因变量对多自变量的回归建模方法。偏最小二乘法 可以较好的解决许多以往用普通多元回归无法解决的问题。具体说就是, 在s y b y l 的q s a r 表格中列的数量比行的数量多出许多:例如,上面的q s a r 表格中有一列生物活性值9 9 8 列立体场值( s o o 卜s 9 9 8 ) 、9 9 8 列静电场值 硕士举住论文 m a s t e r st h e s i s ( e 0 0 卜e 9 9 8 ) ,它们加起来远远多于我们测量到的化合物生物活性值的数 量,即分析时自变量远远多于因变量。 2 偏最小二乘法类似主成分分析,可从大量变量中提取组分,再将组分按照 与因变量之间的相关性从大到小排列,这样就优先选取哪些对预测能力有 较大贡献的成分。 3 对数据之间正交性的要求不高,不像多元线性回归分析那样,要求数据之 间互相正交。 4 在p l s 的计算中,可以意义明确地一次考虑不只一个自变量。当限定了组 分数的时候,这也大大加快了计算的速度。 4 交叉验证 交叉验证”在c o m f a 分析中可谓大名鼎鼎。它的运行流程是:将所有化合物随 机分组,然后每次随机排除一个组( 当一个组里面只有一个化合物时,排除一个组 也就是排除出一个化合物,这时就是l 0 0 ( l e a v eo n eo u t ) :不过,一个组里面有 多个化合物时,每次就是排除好几个化合物出去,所以就称为l s o ( l e a v es o m eo u t ) ) 对剩余的其他化和物进行p l s 计算,得出q s a r 模型,然后将被排除的化合物带入 其中,求出预测值,预测值与真实值之间的差。其实就相当于用计算机程序随机地 将化合物分为训练集和测试集,并进行计算。用这样的方法反复计算直到每组化合 物均被排除过一次为止。求出所有化和物的生物活性预测值与实测值的残差平方和 ( p r e d i c t i v ee r r o rs u mo fs q u a r e s ,p r e s s ) ,p r e s s = ( y 。f y ,“) 2 ,y 。l 为实际 值,y 。为预测值。 进一步求出交叉验证预测标准偏差s ,。:s ,。s s = p r e s s ( n c 1 ) “2 上式中,n 为化合物的数目,c 为组分数,n c l 就是自由度。 q 2 = 卜p r e s s s , s 。= ( y 。i y ) 2 , 即:q 2 = 卜( y y 呷d ) 2 ( y 曲f y 一) 2 在交叉验证运行前,用户先选择个组分数,比如7 ,交叉验证时,计算机就 会自动计算当组分数分别为1 ,2 ,7 时,对应的s ,。和q 2 值,选取最大的q 2 对应的组分数,即是最佳组分数。选用最佳组分数作后面的非交叉验证的p l s 分析, 得到c o m f a 模型。一般l s o ( l e a v es o m eo u t ) 的算法,每次分析得到的结果不稳 定,为了有好的重现性,一般我们采用l 0 0 ( l e a v e0 n eo u t ) 。 硕士学位论文 m a s t e r st h e s i s 1 3 4 分子相似性指数分析( c o m p a m t i v em o l e c u l a rs i m i l a r i t yl n d j c e sa 且a l y s i s , c o m s i a ) 1 9 9 4 年,k l e b e 介绍了比较分子相似性指数分析( c o m p a r a t i v em 0 1 e c u l a r s i m i l a r i t yi n d i c e sa n a l y s i s ) 。这种分析法是对c o m f a 方法的一种改进,它同样 是通过在一组叠合好的分子周围格点上布置的探针原子,计算每个分子的相似性指 数,经过统计来寻找规律。相似性指数用下式来进行计算: 名蔗( 胪肚 e 叫 4 0 ( ,) 是分子j 在网格点q 的相似指数,是研究分子j 中所有原予i 的总和。 , 。是半径为l 爿,电荷为十1 ,疏水性为+ 1 ,氢键给体+ l ,氢键受体一l 的探 针原子。 。是原子i 的物理化学性质k 的实际值。 口是衰减因子,默认值为0 3 。 t 是位于格点q 的探针原子与测试分子中原子i 间的距离。 计算相似性时采用与距离相关的的高斯函数形式,与l e n n a r d j o n e 势能函数 相比,前者的计算值对距离的关系曲线更加平滑,避免了在分子表面附近格点上能 量产生显著变化。c o m s i a 考虑了5 种不同的场:分子静电场,立体场,疏水场,氢 键受体场,氢键给体场,来表征小分子作为抑制剂与周围残基的相互效应,比c o m f a 中仅考虑静电场和体积场更加细致。 1 4s a m p is a d v a n c e dc o m f a 介绍 s a m p l s ”:p l s 分析中需要对m s s ( m o l e c u l a rs p r e a d s h e e t ) n p 的矩阵进行计 算( p 往往远远大于n ) 。使用s 州p l s 可以减少自变量的数量,变成n n 的计算, 但是仍能得到比较好的统计结果。 a d v a n c e dc o m f a 是s y b y l 程序中常规q s a r 模块的辅助工具包。它其实是由好 几个功能模块集成: 数据库叠合:一种自动的叠台方式,先选取数据库中活性最高的分子的结构模 型,对其进行“裁剪”仅留下数据库中所有分子都有的“公共结构”,将它作为标 准“模板”。程序自动将其余分子结构与“模版”比对完成叠合过程。 硕士学位论文 m a s t e r st h e s i s r e g i o nf o c u s i n g :改变c o m f a 阏格中各个格点进行统计分析时的权重,优化统 计模型。 o p t i m i z i n gq s a r :这是s y b y l 中一个很重要但却鲜为人知的模块。在c o m f a 模 型建立好了之后,我们可以设计新的结构并用c 0 m f a 模型来预测其活性。 “o p t i m i z i n gq s a r ”模块,可以在分子结构指定的位置上面,自动地接上不同的 取代基,组合出成千上万个新的结构,并进行简单的能量优化,然后根据我们的 c o m f a 模型,给出组合出的新结构的预测活性,能量值等相关信息。 1 5s u b l v 表介绍 进行o p t i 皿i z i n gq s a r 需要选择不同的基团接到我们感兴趣的位点上去。s y b y l 中,这些基团来自于个名为s u b l v 的表格。这个表格里面含有3 0 9 个合成中常见 的基团,及其相关的信息,这些信息除了常见的电荷,疏水性,h a 衄e t t 常数 之外,还有一个“般配系数”对实验人员十分有用。 般配系数是考虑此种基团与“c ,n ,0 ,s ”四种常见的“中心原子”连接的难 易程度( 合成的难度) ,键合的稳定性。比如:甲基的般配系数是c 2 ,n 3 ,0 3 ,s 3 : 因为甲基加成到n ,0 ,s 原子上十分容易,所以在元素符号n ,0 ,s 后面跟的数字 是“3 ”;而碳碳键是比较难得形成的,所以元素符号c 后面的数字是“2 ”。元素符 号后面跟的数字越大,表示此基团与此元素越“般配”。 9 硕士学位论文 m a s t e r st h e s i s 第二章a 一氧代膦酸酯类化合物的c o m e a 研究 丙酮酸脱氢酶是生物体有氧代谢关键酶之一,它催化植物体中由丙酮酸氧化脱 羧转化为乙酰辅酶a 的代谢过程。在这一代谢过程的第一步反应中,由于丙酮酸脱 氢酶系的催化,丙酮酸的酮羰基与脱质子化硫胺素焦磷酸酯( t t p ) 加成结合,形 成中间体,然后脱羧产生烃乙基t p p ,之后进一步转化为乙酰辅酶a 。而在些丙酮 酸的含磷类似物中,膦酰基中的羰基也极易与t p p 加成并生成牢固的不能进行脱羧 的中间产物,从而使植物体中的丙酮酸氧化脱羧形成乙酰c o a 的代谢过程受阻,破 坏了植物的正常运转,而显示出生物活性。a 一氧代膦酸酯类化合物即是根据这个 原理设计的除草剂。该类膦酸脂结构主要特点是在n 一氧代膦酸母体中引入取代苯 氧乙酸活性结构单元与膦酰基协同作用。生物活性测试表明,该类化合物不仅有良 好的除草活性,还有显著的植物生长调节活性”。 本课题组合成了一系列a 一氧代膦酸酯类化合物( 共6 0 个) ,通过试验的方法得 到了这些化合物的活性值。为确定进一步选择性合成的方向,对上述化合物作了 c o m f a 分析,得到3 d q s a r 活性预测模型,再利用a d v a n c e d c o m f a 中o p t i m i z i n gq s a r 模块,生成了大量n 一氧代膦酸酯类化合物的取代基修饰物,并预测了它们的生物 活性。上述3 d q s a r 研究的结果,为先导化合物的结构设计提供了理论指导。 2 1 分析化合物结构 本c o m f a 分析的对象是6 0 个a 一氧代膦酸酯类化合物,这些化合物的结构特点 主要有3 处: 1 与膦酸根相连的碳原子是一个手性中心,在这里存在对映异构的问题。 2 手性碳上的取代基r 不同。 3 各个分子上的取代基x 1 ,x 2 不同。 o 图2 化合物结构图 1 0 表格1 实验的得到的6 0 个化合物的结构和活性数据 n 锄er x ix 2 p i t m l 一1 m e2 一fh3 4 2 4 2 4 2 t m 2 1m e3 一fh3 9 5 4 1 3 5 t m 3 一l m e4 一f h5 8 1 9 1 4 l t m 4 1m e 4 一c f , h3 6 0 7 5 4 4 t m 5 1 m e 4 c l h 6 3 6 9 5 2 3 t m 6 1m e2 一f4 f5 7 3 5 6 5 3 t m 7 一lm e3 一f 5 一f 3 5 4 2 1 2 7 t m 8 1m e2 一c 14 一f6 5 4 7 3 5 7 t m 9 一lm e3 一c l4 一f 5 9 4 9 8 1 6 t f l o 一1m e2 一c 13 c l3 6 8 2 9 1 5 t m l l 一lm e2 一c l6 一c l4 o o o l l 4 t l f i l 2 1m e2 一c l5 一m e 4 3 1 3 4 5 7 t m l 3 一lm e3 m e4 一c l5 5 2 9 0 8 4 t m l 4 1m e2 一m e4 一c l 6 3 6 0 2 3 4 t m l 2c c l 。2 一fh3 7 7 1 5 1 8 t m 2 2 c c l 。 3 一fh4 0 7 9 8 1 8 t m 3 2c c l ,4 一fh5 9 2 9 9 9 2 t f 4 2 c c l 。4 一c f 。 h3 5 8 3 4 5 2 t m 5 2c c l ,4 一c lh6 1 4 4 8 3 5 t m 6 2 c c l 。 2 一f4 一f5 6 7 8 3 8 8 t m 7 2 c c l , 3 一f5 一f 3 8 0 7 1 8 7 t m 8 2c c l :2 一c l4 一f6 5 4 5 2 9 2 t m 9 2c c l 。3 一c 14 一f6 0 7 7 0 7 4 t m l 0 2c c l , 2 一c 1 3 一c l4 1 5 0 3 9 3 t m 卜2 c c l 。 2 c l6 一c 13 9 4 1 2 9 2 t m l 2 2 c c l , 2 一c l5 一m e4 1 2 3 6 9 3 t m l 3 2c c l 。3 一m e4 一c l5 4 5 7 1 0 l t m l 4 2c c l 。2 一m e 4 一c 1 6 4 0 3 1 9 3 w t o l2 一f u r v l2 一c 14 一c l6 4 6 3 9 1 2 w t o 一22 一f u r y l3 一c f 3h3 3 2 7 0 6 w t o 一3 2 一f u r y l 4 一c lh6 1 9 0 3 1 4 w t o 一42 一f u r v l4 一fh5 7 3 6 l1 9 w t 沪52 一f u r v l2 一c l5 一c h ,4 0 6 7 6 3 2 n a m e w t o 一6 w t o 一7 w t o 一8 w t o 一9 w t o 1 1 w t 0 一1 2 w t o 一1 3 w t s l w t s 一2 w t s 一3 1 盯s 一4 w t s 一5 w t s 一6 w t s 一7 w t s 一8 w t s 一9 w t s l l 盯s 1 2 1 盯s 1 3 w t n l w t n 一2 w t n 一3 w t n 一4 详t n 一5 w t n 一6 w t n 一7 r 2 一f u r v l 2 一f u r y l 2 一f u r y l 2 f u r y l 2 一f u r y l 2 一f u r v l 2 一f u r y l 2 一t h i e n y l 2 一t h i e n y l 2 一t h i e n v l 2 _ t h i e n y l 2 一t h i e n v i 2 一t h i e n y l 2 一t h i e n y l 2 一t h i e n y l 2 一t h ie n y l 2 一t h i e n y l 2 一t h i e n y l 2 一t h i e n v l 2 一p y r i d y l 2 一p y r i d y l 2 一p y r i d y l 2 一p y r i d y l 2 一p y r i d y l 2 一p y r i d y l 2 一p y r i d y l x l 4 一c 1 2 一c l 2 一c l 2 一f 3 一f 2 一c l 2 一c h 3 2 一c l 3 一c r 4 一c l 4 一f 2 一c l 4 一c 1 2 c l 2 一c 1 2 一f 3 一f 2 一c l 2 一c h 。 2 一c l 3 一c f 3 4 一c 1 4 一f 2 一c 1 4 一c 1 2 一c l x ? 5 一c h 。 3 一c l 6 一c l h h 4 一f 4 c l 4 一c 1 h h h 5 一c 地 5 一c h 3 3 一c l 6 c l h h 4 一f 4 一c 1 4 叫c l h h h 5 一c 磁 5 c h 3 3 一c 1 p i c 柏 5 4 4 1 0 3 2 3 3 4 8 6 6 3 4 8 5 9 6 3 2 6 5 5 8 3 4 1 6 6 8 8 3 6 5 2 9 5 7 8 5 4 2 2 0 4 7 6 5 4 7 4 6 1 4 9 0 3 8 6 9 6 2 3 4 4 6 5 5 5 8 3 3 7 7 4 2 9 1 了8 3 5 6 3 2 6 0 7 3 2 2 7 1 6 6 3 7 4 6 6 6 6 3 1 8 7 7 7 2 3 8 9 9 9 7 2 6 4 1 8 0 9 3 6 3 2 8 5 4 3 6 4 3 6 9 5 5 5 0 9 1 5 1 5 6 。3 6 3 5 2 5 5 8 0 0 9 8 6 4 3 3 2 5 7 5 5 6 2 4 8 0 6 3 6 l l l l 4 2 2 分子三维构象的建立 这里头一个困难的问题是分子的对映异构构型的确定。到底是选择r 构型还是 s 构型昵? 我们对表一中的头2 8 个化合物作了一个小测试:平行构建了三组分子库:r 构 型分子库,s 构型分子库和一个混合库( 1 4 个化合物选用r 构型,另1 4 个化合物 选用s 构型) 。对它们采用同样的能量优化,构象搜索和统计分析,看最终的统计 结果。 1 2 硕士学位论文 m a s t e r st h e s i s 表格2 测试结果 s 构型r 构型混合构型 组分数 q 2 组分数 q 2组分数 q 2 3o 6 4 570 5 4 64o 4 7 7 最后我们选取s 构型。选取s 构型的理由一方面是由它得到的q 2 值高,另一方 面p l s 分析时使用的组分数少,因为大的组分数往往带来高的q 2 值但是也大大 提高了模型的复杂度,且增加了过拟合的风险。 本研究中,所有的分子构象的建模在s g if u e l 图形工作站上完成的,使用 s y b y l 6 9 2 ”软件包。采用分子的最低能量构象作为可能的活性构象。所有的6 0 个 分子结构都是用s y b y l s k e t c h 完成。能量优化使用的是分子力学程序m i n i m i z e , t r i p o s 力场。原子载电荷采用g a s t e i g e r - h u c k e l 电荷,最大优化次数为1 0 0 0 次, 能量优化的收敛条件是变化梯度小于0 0 5 k c a l m 0 1 书n m 2 3 分子叠合 由于研究的这些分子有一个比较大的公共骨架( 图3 分子骨架图) ,所以采用 数据库叠合比较合适。 本实验中,取的是活性最高的w t s l 的结构,将它a 碳上接的噻吩,苯环上的 取代基,以及所有的氢原子“裁”去,剩余“骨架”作为模板结构,其余分子在模 板分子上进行叠合。 o 图3 分子骨架图 2 4c o m e a 分析 c o m f a 分析用s y b y l 6 9 2 中的q s a r 模块完成。将叠合好的分子放入程序自动生 成的网格中,以s f 杂化的c + 为探针,以o 2 n m 为步长移动,每移动步就计算探 针和分子之间的立体场能( l e n n a r d j o n e sp o t e n t i a l ) 与静电场能( c o u l d m b i c p o t e n t i a l ) ,能量阙值均为3 0 k c a l m o l ,计算过程使用了s a m p l s 。使用l o o ( l e a v e 厢士学位论文 m a s t e r st h e s l s 。n eo u t ) 交叉验证和s a m p l s 计算得到交叉验证的q 2 ,最佳组分数,使用此最佳组 分数,建立非交叉验证的p l s 分析模型,得到模型的r 2 ,标准偏差s ,和f 值。 2 5 应用a d v a n c e d c o m f a 2 5 1r e 舀o n f o c u s i n g 用a d v a n c e dc o m f a 中的r e g i o nf o c u s i n g 对此模型进行优化,进一步提高其对 化合物活性的预测能力。分别使用s t d e v 虬o e f f i c i e n t ,d i s c r i m i n a n t , m o d e l i n g p o w e r ,s i g m af i e l d 作参数,参数的指数因子为o 3 。得到优化后的4 种 交叉验证和非交叉验证模型。 对比以上5 种交叉验证和非交叉验证模型。取最好结果作为最终的模型。 2 5 2o p t i m i z i n go s a r 作c o m f a 研究的目的不仅仅是建立好的模型,还要预测可能拥有高活性的新化 合物。方法是先构建化合物,再利用已有的c o m f a 模型作出关于其活性值的预测。 利用o p t i m i z i n gq s a r 模块,结合包含有3 0 9 个官能团倍息的s u b l v 表格,我们可 以很轻松地选取自己感兴趣的基团,在分子骨架特定的位置上作修饰,组合出成千 上万个新的化合物结构,并在随即给出的表格中得到相应结构的能量,预测的活性 等信息,以对这些结构作进一步的分析。 2 6 结果与讨论 图4 分子叠合图 可以看到所有分子在w t s 一1 “裁剪”得到的骨架上叠合的情况还是比较好的。 顾士举住论文 m a s t e r st h e s l s 表格3 传统c o m f a 分析的结果 主成分q 2 ,sf 7o 7 4 7 0 9 4 50 2 9 41 2 7 3 9 2 表格4 应用r e g i o nf o c u s i n g 处理后的c o 盯a 结果 d i s c r i m i n a n tm o d e li n g s t d e v 木c o e f f i c i e n t s i g m af i e l d p o w e r p o w e r 主成分数 671 07 q 2 0 8 1 8o 8 1 30 7 6 8 o 7 6 2 r 2 0 9 4 lo 9 4 2o 9 5 4o 9 4 3 so 3 0 20 3 0 0 o 2 7 7o 3 0 0 f 1 4 0 2 1 61 2 1 5 5 91 0 l - 5 0 91 2 1 8 5 6 从 表格4 中,我们看到使用r e g i o nf o c u s 后,提高了模型的信噪比,对比传统的 c o m f a 分析,交叉验证系数q 2 有比较大的提高,而虽佳组分数一定情况下却可以减 小。其中,在使用s t d e v 牝o e f f i c i e n t 为参数的模型时,最佳主分数为6 ,最小; 而q 2 最高,为0 8 1 8 ,为最佳选择,选此模型为最终的c o m f a 模型。 图5 实验值与预测值相关性图 图6 体积场等值线圈圈7 静电场等值线圈
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 九年级英语下册 Unit 13 We're trying to save the earth Section A第1课时(1a-2d)教学设计(新版)人教新目标版
- 人教版七年级上册生物3.1.1 藻类、苔藓和蕨类植物教学设计
- 餐前餐中餐后培训
- 损有余补不足-【2022年暑假预习】云名著《世说新语》之“德行”卷
- 三年级数学上册 五 四则混合运算第2课时 除法和加、减的混合运算教学设计 西师大版
- 人教部编版五年级上册10 牛郎织女(一)教案设计
- 肺癌伴脑转移护理查房
- 电网服务培训
- 报销制度培训
- 2024中国能源建设集团东电三公司社会招聘6人笔试参考题库附带答案详解
- 《控制计划培训》课件
- 中学风险辨识评估和应急资源调查报告
- 《他汀不耐受的临床诊断与处理专家共识》解读
- 2024年中考英语复习:补全对话 中考真题练习题汇编(含答案解析)
- 2024年郑州信息科技职业学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 部编版二年级下册道德与法治第三单元《绿色小卫士》全部教案
- 乳猪料生产工艺
- Braden压疮风险评估量表解析
- 蔚来培训课件
- 牙周病的护理课件
- 【ABC分类管理法在吉利汽车企业库存管理中的应用分析案例报告7200字(论文)】
评论
0/150
提交评论