定量结构性质关系QSPR用于紫外吸收最大波长预测_第1页
定量结构性质关系QSPR用于紫外吸收最大波长预测_第2页
定量结构性质关系QSPR用于紫外吸收最大波长预测_第3页
定量结构性质关系QSPR用于紫外吸收最大波长预测_第4页
定量结构性质关系QSPR用于紫外吸收最大波长预测_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

定量结构性质关系QSPR用于紫外吸收最大波长预测

目录课题背景QSPR多元线性回归(MLR)模型的建立径向基神经网络(RBFNN)模型的建立交互检验结果与讨论致谢课题背景

黄酮类化合物通常指广泛存在于植物中的黄色素,目前已发现2000余种,其中有一些具有明显的生理活性,并已应用于临床。黄酮类化合物中有药用价值的化合物很多。近十几年来对黄酮类化合物的紫外光谱研究较多,已经积累了很多数据及规律性,因此紫外光谱对黄酮类化合物的鉴定有重要的价值。

黄酮类化合物结构

黄酮化合物的基本结构为2-苯色酮,即具有C6-C3部分的B环和C6部分的A环骨架。从这个基本结构衍生出很多不同类型的黄酮化合物,可以分为黄酮、黄酮醇、异黄酮、二氢黄酮、二氢黄酮醇、二氢异黄酮、双黄酮、查耳酮和橙酮等。黄酮异黄酮双黄酮查耳酮橙酮各类黄酮化合物的紫外吸收

种类带Ⅰ带Ⅱ黄酮和黄酮醇290~300nm240~280nm异黄酮300~330nm(w)245~270nm(s)二氢黄酮和二氢黄酮醇肩峰或弱峰270~295nm(s)二氢异黄酮同上同上查耳酮300~400nm(s)220~270nm(w)橙酮一个或两个高于300nm(s)两个低于300nm双黄酮其紫外光谱仍保持原黄酮的吸收带

鉴于黄酮类化合物具有明显的生理活性,因此我们可以人工合成集多个优点于一身的化合物,来弥补天然黄酮类化合物的不足。合成出来的化合物要通过鉴定才能确定其结构,通过实验才能确定其性质。结构与紫外最大吸收之间的关系化合物的性质确定

应用实验测定方法存在着如下的不足:(1)要求具备良好的实验设备,而且工作量巨大;(2)考虑到实验过程中的安全问题;(3)有毒、易挥发、爆炸性或有辐射的物质;(4)尚未合成的物质。

因此,单纯地应用实验研究来确定化合物的性质是不可取的,有必要借助理论计算方法对有机物的性质进行预测,以弥补实验研究方法的不足.当今比较热门的定量结构-性质关系(QSPR)研究可以满足这一要求。QSPR的简介

QSPR的研究就是对计算出来的分子结构参数和所研究的实验性质进行统计分析,建立它们之间的定量关系模型。一旦建立了可靠的定量关系模型,就可以用它来预测新的甚至是未合成出来的化合物的性质。

原理部分QSPR研究的步骤

数据的搜集与整理(可靠)预测模型的建立与评估(交互检验)↓↑分子结构的输入与优化ChemDrawHyperChem→描述符的计算与选择CODESSA

原理部分

原理部分QSPR研究中的首要问题之一是分子结构的描述问题,即选择各种分子描述符,全面地反映分子的结构特征。组成描述符(ConstitutionalDescriptors)

拓扑描述符(TopologicalDescriptors)

几何描述符(GeometricalDescriptors)电荷相关描述符(ElectrostaticDescriptors)

量子化学描述符(Quantum-ChemicalDescriptors)

分子结构描述符的产生及计算QSPR

模型线性非线性

原理部分径向基神经网络线性回归分析误差反向传播神经网络主成分分析偏最小二乘法多元线性回归(Multiplelinearregression,MLR)模型

建立MLR模型中最主要的步骤就是筛选符合条件的描述符这一步,本论文中我们采用了启发式回归方法(HeuristicMethod,HM)。

原理部分参数的预选相关性分析

建立多元线性相关模型(一参数模型→两参数模型→

→n参数模型)径向基神经网络(Radialbasisfunctionneuralnetwork,RBFNN)模型RBF网络的基本思想:(1)用RBF作为隐单元的“基”构成隐含层空间,将输入矢量直接映射到隐空间;(2)当RBF的中心点确定后,映射关系也就确定;(3)隐含层空间到输出空间的映射是线性的。wwy1y211hnyn….….…

原理部分

交互检验

模型建立好以后,要对所建模型进行评估,于是选择交互检验对其预测能力及稳定性来进行检验。交互检验的过程如下:为了检验模型的稳定性和所选参数的合理性,我们随机地把样本集分为A、B、C、D、E、F六组,用建立模型时筛选出的六个描述符对任意五组进行多元线性回归分析,余下的一组作为测试集。

原理部分

实验部分1、黄酮2、3-去甲醚水黄皮素3、黄连苷Ⅰ4、蓟黄苷5、5,7,4‘-三甲氧基黄酮6、异金雀儿黄素7、5-羟基-4‘,7-二甲氧基-6-甲基黄酮8、阿勒亭黄素9、5,6,7,2‘-四甲氧基黄酮10、泽蓝黄素11、泽蓝黄素-7,3‘,4’-三甲醚

12、胡麻苷13、5-氧-去甲福桔黄素14、魏穿心莲黄素15、山胡椒黄素

实验部分16、干楂黄酮17、5,7,3‘,5’-四羟-18、3-甲氧基黄酮19、3,2'-二羟基黄酮20、3,5-二羟基-21、3,5,8,4‘-22、5-羟基-3,7,4’-23、赤杨黄素24、甲基赤杨黄素25、3,5,7,2‘-四羟基黄酮26、蜜茱萸三黄素27、5,4’-二羟基-8,4'-二甲氧基黄酮7,4‘-二甲氧基黄酮四羟基黄酮三甲氧基黄酮3,7,8-三甲氧基黄酮

28、因特灵29、九里香黄酮30、桑白皮素B31、桑白皮素C

实验部分32、异黄酮33、紫藤苷34、香槐黄素35、3',4'-次甲二氧基-6,7-二甲氧基异黄酮36、尼鸢尾黄苷37、血苋黄素38、6,7,3‘-三甲氧基-39、藤薇甘菊黄素4',5'-次甲二氧基异黄酮40、5,7,2‘-三羟基-4’-甲氧基异黄酮41、底普脱利辛42、奥多那亭43、普劳特亭44、6,7-二甲氧基-3‘,4’-45、阿曼讬黄素46、西阿多黄素47、破故纸素甲醚次甲二氧基异黄酮

实验部分48、5-羟基-7,4‘-49、里柯亭50、阿奇白芷黄素51、黄杉甲素-5-甲醚二甲氧基二氢黄酮52、黄杉甲素-7,4‘-二甲醚53、黄杉甲素三甲醚54、6,7,3’,4‘-55、高圣草素四甲氧基二氢黄酮56、紫铆素-3-氧-葡萄糖苷57、5,7-二羟基-8-甲氧基二氢黄酮58、赤杨素59、雪松素

60、安哥杜鹃素61、环广豆根素62、广豆根素

实验部分63、二氢异鼠李素64、阿柯里宁A65、2'-羟基查耳酮66、广豆根酮

67、环广豆根酮

68、3‘-羟基橙酮69、4-羟基橙酮

实验部分样本集(69个)训练集(其余57个)测试集(12个)={1,7,14,18,24,29,36,42,48,54,60,66}MOPAC分子结构和数据的获得

ChemDrawCODESSAHyperChemProfessional

实验部分MLR模型的建立

本文中我们采用CODESSA软件来建立线性关系模型。采用启发式回归方法,总共计算了381个描述符,经过筛选后还剩97个描述符,最后筛选至6个描述符。

实验部分RBFNN模型的建立

本次实验中我们选择用MATLAB来建立RBFNN模型,采用的是其中的径向基神经网络(RBFNN),用线性模型中的6个分子描述符建立了RBFNN的非线性模型。在建模过程中,为了获得更好的结果,我们最优化了影响模型结果的参数。

实验部分交互检验

实验部分样本集分组:A={1,7,14,18,24,29,36,42,48,54,60,66}B={2,8,13,19,25,30,37,43,49,55,61,67}C={3,9,15,20,26,31,38,44,50,56,62,68}D={4,10,16,21,27,32,39,45,51,57,63}E={5,11,17,22,28,33,40,46,52,58,64}F={6,12,23,34,35,41,47,53,59,65,69}

交互检验计算包括线性模型改换六组不同测试集时训练集和测试集分别对应的R2、RMS、F-检验值,以及非线性模型中相对应的这三类数值。MLR模型结果

DescriptorsCoefficientsStandardErrort-testIntercept6.20E+022.83E+0121.92Numberofrings-2.50E+011.18E+00-21.09Avgnucleoph.react.indexforaOatom-9.39E+031.04E+03-9.06Maxelectroph.react.indexforaCatom-2.62E+031.96E+02-13.401XGAMMApolarizability(DIP)3.59E-043.00E-0511.92Avg1-electronreact.indexforaCatom4.50E+045.71E+037.87Totmolecular2-centerexchangeenergy/#ofatoms2.65E+014.54E+005.83R2=0.96F=207.83s2=42.96

结果部分描述符含义变化趋势λmax变化趋势NR分子中所包含的环数↑↓ANRIOA氧原子的亲核反应指数的平均值↑↓MERICA分子中碳原子亲电反应指数的极大值↑↓GAMMAP1X轴γ方向分子的极化度↑↑AERICA分子中碳原子对1-电子亲电反应指数的平均值↑↑TMEE分子中二级中心原子交换能量的总和↑↑

结果部分

MLR模型结果

结果部分

RBFNN模型结果

在建立了线性模型后,以相同的描述符作为RBFNNs的输入建立了非线性模型。为了得到好的结果,优化了影响RBFNNs的参数。最佳的半径选择是通过在训练过程中系统改变它的值实现的。对于本数据集最佳的半径值是3.6,相应的隐含层结点数是20。

结果部分

RBFNN模型结果

结果部分

结果部分

结果部分

结果部分

结果部分两个模型的统计参数

MLRRBFNNForthetrainingsetForthetestsetForthetrainingsetForthetestsetR20.96140.96700.97080.9781F207.8250293.21801823.7420447.8660RMS6.55477.17635.34945.7219

从上表可以看出,RBFNN模型的结果中无论是训练集还是测试集,R2都略高于MLR模型。

结果部分交互检验结果(MLR)HM训练集测试集训练集测试集R2RMSCVFR2RMSFA+B+C+D+EF0.9666.465238.3450.9447.503150.382A+B+C+D+FE0.9636.995219.6320.9574.761201.644A+B+C+E+FD0.9666.515243.7050.9457.203153.913A+B+D+E+FC0.9666.604234.3470.9377.190147.577A+C+D+E+FB0.9596.720192.3320.9776.620428.929B+C+D+E+FA0.9616.555207.8250.9677.176293.218

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论