版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
WORD格式可编辑4.6.1模型拟合能评价模型拟合能评价主要用于表明模型解释训练集变化的能。本文主要采用以下几个统计评价指标对模型拟合能专评价:1)相关系4(R)相关系数表示预测值与目标值之间线性关系的密程, 其取值范围在0到1之间。其值越接近于1,表示线性关系越强;越接近于0表示线性关系越差。2)决定系数^2)决定系数又称为复相关系数,它是判定线性回归拟台优的重要指标,其定义为ExplainedVariation_£(y.一y)2TotalVariation £(yExplainedVariation_£(y.一y)2TotalVariation £(y-y)2i= i-1 £(Y-Y)2ii=1(4-1)从上面的公式可以看出,决定系数等于回归平方和在总平方和中所占的比,因此它体现回归模型所能解释的应变变异的百分比。如, R2=0.825说明应变的变异82.5%是由自变引起的;R2=1则表明所有的观测点在回归方程」;R2=0则说明自变与应变间存在线性关系。3)均方根误差(RMSE)、平均绝对误差(AAE)、平均相对误差(APE)和标准误差(SE)均方根误差表示随机误差的分散程,其定义为1(y-y)2i,pred i,obsRMS=?4=1 专业知识分享
WORD格式可编辑(4-2)平均绝对误差表示拟合值与目标值之差,其定义为f、, ,Vi,pred i,obsAAE二 n(4-3)平均相对误差的定义为2nXpred-'obs,JAPE=-i^1 i*obs n(4-4)标准误差布拟合值的标准误差,其定义为SE=\:2(J-J)2SE=\:pred i,obsi=1 n一1(4-5)上述各式中,n为实验《样本数,y.d和y 分别为样本预测值及目标值。这些参数是衡模型确的一些常用参数, 它们依赖于应变数据的范围和分布,并受“离域点的影响[133]。4)F检验F检验是一种检验自变和应变之间的线性关系是否显著的方法,适用于基于]^上法建的模型[133]。它将回归离差平方和与剩余离差平方和进比较,分析二者之间的差别是否显著如果是显著的,说明两个变之间存在线性关系,如果显著,则说明两个变之间存在线性关系。上述评价指标能够对模型的拟合能进较好的评价。 然而,对于QSPR研究专业知识分享
WORD格式可编辑中经常出现的两类问题——“欠拟合和''过拟合问题,它们对无法进有效的鉴别。所谓“欠拟合,是指模型没有充分揭示出样本集所包含的变信息,从而导致模型的预测能低, 这类问题常出现于采用线性建模方法所得到的模型;所谓“过拟合则是由于拟合误差信息描述符结合的变化性,这类问题常出现于由于这两类问题与模型的稳定性紧密相连需要通过模型的稳定性分析加以解决。4.6.2型;所谓“过拟合则是由于拟合误差信息描述符结合的变化性,这类问题常出现于由于这两类问题与模型的稳定性紧密相连需要通过模型的稳定性分析加以解决。4.6.2棹型稳定性分析,导致模型拟合高于性质数据和采用非线性建模方法所得到的模型[134]。[133,135],因此对于此类问题的鉴别,常所谓模型稳定性分析实际上是对模型的“稳定性进分析。模型“稳定性的含义是模型受训练集中某些个别化合物或化合物子集的影响比较大,如果化合物的预测值超出模型的直信区间,就会导致模型稳定[133]。目前文献上直接对模型的稳定性进定分析的研究较少。 对模型稳定性的研究常用的方法是通过内部验证的方式进。因为任何内部验证技术能在一定程上评价模型的稳定性。因此,本文采用以下几种内部验证技术对模型稳定性进研究:“多法交互验证[136]“多法(Leave-many-out,LMO)交互验证是一种较为常用的内部验证技术。该方法将初始训练集中的n个样本平均划分为大小为m的G(=n/m)个子集,然后每次去除m个数据点,采用剩下的n-m个样本作为训练集重新建模并验证由m个样本构成的验证集。经G次计算,得到交互验证系数Q2来表征模型的稳定性和内部预测能[%。一般认为,如果Q2大于0.5,则模型比较稳定;如果大于0.9,则专业知识分享
WORD格式可编辑模型的稳定性非常优秀[137]。Q2的计算公式如下:training 八、乙(y—y)2iiCV=1 1 CVtraining_乙(y—y)2i=1(4-6)其中,y,y和y分别代表训练样本的自燃点实验值、预测值及实验值平均1i位。“一法交互验证[136]“一法(Leave-one-out,LOO)交互验证是一种特法的“多法交互验证方法,其具体过程与“多法相似,区别仅在于m=1。由于“一法用全部的样本数据, 因而也是一种最经济的方法。尽管有研究者指出,“一法交互验证所得结果常会过高的估计模型的预测能[138],但它在QSPR建模过程中仍是必可少的,尤其是对于小样本的研究体系。Y-随机性检验[136]Y-随机性检如是一种广泛用于表征模型稳定性的统计方法。它将原样本集因变Y随机打乱,与原有自变组合成新的样本集,建模型。重复上述过程50〜100次,将结果与原样本集结果对比,原样本集预测模型性能参数明显优于新样本集的性能参数,则认为原样本数据中存在真正的QSPR关系,所建模型稳定性较好,存在“偶然相关现象;反之,则表明原所建模型能被接受。残差图分析法残差图分析法指在直角坐标系中以预测值为横轴,以残差为纵轴绘制残差的散点图。如果散点呈现明显的规性, 则认为所建模型存在自相关性或者存在非线性、非常数方差的问题;如果散点呈现随机分布,则认为所建模型是合适的,专业知识分享WORD格式可编辑在建过程中大产生系统误差。内部验证在QSPR建模过程中是必可少的一步,但是内部验证结果好只能说明模型稳定性较高或具有较强的内部预测能,并能保证模型对外部样本的真实的预测能也好。因此,还必须对模型的外部预测能即外推性进评价。4.6.3棹型预测£”求价QSPR模型的预测能以模型的拟合优、 稳定性为基础。评价模型预测能最有效的方法是进外部验证,即采用未参与建模的独的样本集作为验证集,以评价模型对未知化合物的预测能。 其具体方式如下:将原始样本集按照一定的比随机划分为训练集和测试集两个子集,其中训练集用于变选择和建模,测试集则用于对模型的外部验证[136]。外部验证的结果既能够体现所建模型的泛化能,又能够反映模型对未参与建模的外部样本的真实预测能。对于样本划分时训练集和测试集中样本的比,目前还没有明确的定论,大多数研究中测试集的样本个数远远小于训练集的样本个数。6^1^^。@[138]最近的研究指出r寸某一QSPR模型预测能的验证能仅仅通过少化合物(W5个)进,市必须建在足够大的外部测试集的基础之上( 三样本集的20%),以避免''偶然相关现象的发生。因此,本文在各燃煤特性的预测研究中均随机选择样本集中20%的样本作为测试集,其余80%样本作为训练集,以保证模型验证的有效性。模型的外部预测能可以用测试集样本预测值与目标值之间的交互验证系数Q2,来衡:ext/专业知识分享WORD格式可编辑prediction人乙(y—y)2iiQ2 =1一i=1ext prediction _乙(y一y)2itri=1(4-7)其中,y和y分别表示测试样本燃煤特性的实验值和预测值,y表示训练
ii tr样本燃煤特性实验值的平均值。此外,前面评价模型拟合能所用的统计评价指标,如 R2,RMSE,AAE,APE和SE等,均同样可以用来对模型的预测能进衡。一轨来说,针对测试集的指标要比训练集的差一些,但如果前者远远差于后者,那么模型很有可能发生“过拟合。此外,Q2ext与测试集的拟合系数R2之间没有相关性,较高的Q2ext值仅仅是模型具有较高预测能的必要条件,而非充分条件[139,140]。专业知识分享WORD格式可编辑5.3结果与讨论模型1结臬针对训练集样本,采用GA-MLR方法在广泛的分子描述符空间进行搜索,通过比较所得各模型适应度函数的大小,确定了本研究中与有机物闪点最为密切相关的5个分子描述符,其类型与定义列尸表5-1;最佳描述符所对应的最优MLR模型见下式:FP=81.321-28.669*CIC0+80.491*RDCHI+54.497*ESpm02d+34,098*nHDon-5,651*nCOOR(5-1)回归范围:169.15KWFPW716KR2=0.967,Q2loo=0.967,SE=12.59,F=4832.180,n=824式中,FP为闪点,R2为复相关系数,Q2loou“留一法”交互验证的复相关系数,SE为模型标准误差,F%F检验值,n为模型中样本数。模型的其它统计学参数见表5-1。表5-1模型I所选择的分子描述符及其统计学参数Table5-1DescriptorsselectedformodelIandtheirstatisticsparameters系数平均描述符类型定义系数标准误差t-值影响值常数81.321CIC0拓扑描述符补充信息量(0阶邻域对称性)-28.6690.881-32.536-95.760RDCHI拓扑描述符反距离Randic类型指数80.4911.48954.068175.897ESpm02d边缘邻接指数边缘邻接矩阵中的02谱矩(按偶极能加权)54.4971.34040.680175.243nHDon官能团与N原子和O原子相连的H原子数34.0980.61355.65012.952nCOOR官能团脂肪酯数目-5.6511.1255.021-0.679在模型I所选择的5个分子描述符中,CIC0和RDCHI均为拓扑描述符,由分子专业知识分享WORD格式可编辑图论获得。其中,CIC0主要衡分子中元素的差异程;而RDCHI主要表征分子的大小和形状。ESpm02d%边缘邻接指数,它主要表征分子中键的数目和强。nHDon和nCOOR均为官能团描述符。其中,nHDon表示分子中与所有的O原子和N原子相连的H原子的总和,它与分子中氢键形成的可能性密相关;而nCOOR表示分子中脂肪酯的数目,它能够对相应化合物的结构特征进好的表征[67]随后,应用模型1(式5-1)对训练集中824个样本的闪点进校泡,以评价模型的拟合能;同时,对测试集中 206个样本的闪点进预测,以验证模型的外部预测能。经过计算,所得闪点校准值与预测值见附表1,模型I的主要性能参数见表5-2,模型校准值和预测值与实验值的比较见图5-1。表5-2模型I,II,III的主要性能参数Table5-2Themainstatisticalparametersoftheobtainedmodels(I,II,III)性能参数训练集模型I测试集样本集训练集模型II测试集样本集训练集模型III测试集样本集R20.9670.9700.9680.9750.9730.9750.9750.9740.976Q2LOO0.9670.9730.974Q2弋ext0.9700.9720.973AAE10.229.6710.118.658.958.718.628.938.68RMSE12.5812.2312.5110.9311.6411.0710.8911.4311.00n824206103082420610308242061030图5-1模型I所得闪点预测值(校准值)与实跄值的比较Fig.5-1Correlationbetweenthepredicted(calibrated)andexperimentalFPvalues
formodelI专业知识分享WORD格式可编辑从表5-2可以看出,模型I对测试集样本的预测平均绝对误差为9.67K,在±10K[145,146]的闪点实验误差允许范围之内,过说明模型I具有较强的预测能。同时,通过比较训练集和测试集的预测结果发现,两个子集的预测误差(AAE和RMSE)但较低,而且均比较接近。这说明模型I但具备较强的预测能,而且具有较强的泛化性能[138]。随后,对样本集中所有1030个化合物的预测相对误差进计算。通过计算,得到模型I的预测平均相对误差为2.90%,最大相对误差为10.6%。具体计算结果见图5-2。从图中可以看出,共有859个化合物的预测相对误差小于5%,超出模型中所有样本数的80%。数个物合化间区各数个物合化间区各图5-2模型I所得预测相对误差及各误差范围中的化合物个数Fig.5-2ThepercenterrorsobtainedbymodelIandthenumberofcompoundsineach
range然而,从图5-1和图5-2中也可以看出,个别化合物的预测误差较大,如1,4-Benzenedicarboxylicacid,bis(2,3-Dihydroxypropyl)ester和Diisodecylphthalate,其预测误差均大于40K,过说明模型中可能有“异常值存在,这些“异常值对整个模型的预测性能产生一定的影响。因此,本文对模型中可能存在的“异常值进研究,以预测绝对误差大于模型标准误差 SE专业知识分享
WORD格式可编辑的3倍为标准,对模型I中可能存在的“异常值进筛选,筛选结果于表5-3。表5-3各模型中的“异常值及其闪点实验值与预测值Table5-3Theoutliersineachmodelandtheirexperimentalandpredictedflashpoints化合物闪点实验值(K)闪点预测值(K)模型I模型II模型III1,4-Benzenedicarboxylicacid,bis(2,3-dihydroxypropyl)estera575616.90583.65584.22Diisodecylphthalatea505.37546.48520.56523.78Hexamethylphosphoramide…378.71339.35335.83331.95Diisononylphthalatea489529.14511.77509.44Diethylphthalateb390.15418.39425.42411.79l-Glutamicacidb'c478505.20512.45520.46Sebacicacidb496469.77461.45466.472'6-Toluenediisocyanateb388415.75424.65417.39Isophoronediisocyanateb383.15413.21421.13397.80Tartaricacidb483.15502.87516.67512.96gamma-Valerolactonec354327.30324.26320.39a模型I中的“异常值;b模型II中的“异常?但;c模型III中的“异常值关于''异常值产生的原因,可能主要有两个方面:一是其闪点实验数据本身存在问题;二是其与闪点密相关的部分结构特征没有得到很好的表征。具体原因将在下文中继续予以讨论。专业知识分享WORD格式可编辑模型U结果模型n是以模型I所选择的分子描述符作为输入变,以相应的闪点作为输出交,应用非线性的支持向机方法所建的混合性 QSPR模型。为与模型I具有可比性,模型n中选取的训练集和测试集与模型I完全相同。模拟开始前首先对所有样本数据进“归一化处,确保所有数据点均在[-1-1]范围之内;随后针对训练集样本,采用基于“1/5法交互验证的格点搜方法确定SVM模型的最优参数如下:C=512,£=0.03125,Y=0.125,相应的支持向数为348;然后以上述参数作为SVM的输入参数法相应的QSPR预测模型,即溶型n。模型建以后,应用该模型分别对训练集和预测集样本的闪点进预测,所得1030个样本的预测值见附表1,模型n的主要性能参数见表5-2,模型预测值与实验值的比较见图5-3。从表5-2可以看出,模型n对测试集样本的预测平均绝对误差为8.95K,在闪点实验误差允许范围(±10K)之内,说明模型n同样具有较强的预测能。同时,对训练集和测试集的预测结臬进比较,发现两个子集的预测误差但较低,而且比较接近,说明模型n同时具备较强的预测能和泛化性能。图5-3图5-3模型n所得闪点预测值与实跄值的比较k值测预点闪n型模专业知识分享WORD格式可编辑Fig.5-3CorrelationbetweenthepredictedandexperimentalFPvaluesformodelII通常,由于SVM方法具有强大的数据拟合能力,在输入变量相同的情况下,模型I的预测性能一般要优于模型I。通过对两个模型进行比较,发现模型1相对于训练集和测试集的预测误差RMSE分别比模型I下降了13.1%和4.8%。随后,对样本集中所有1030个化合物的预测相对误差进行计算,得到模型I的预测平均相对误差为2.52%,最大相对误差为23.29%。具体计算结果见图5-4。从图中可以看出,共有909个化合物的预测相对误差小于5%,接近模型中所有样人数的90%。说明与模型1相比,模型I中具有较大预测误差的样本数明显减少。数个物合化间区各数个物合化间区各误差区间图5-4模型I所得预测相对误差及各误差范围中的化合物个数Fig.5-4ThepercenterrorsobtainedbymodelIandthenumberofcompoundsineachrange同样,从图5-3和图5-4中也可以看出,模型I中可能有“异常值”存在。本文以模型标准误差SE的3倍为标准,对模型I中可能存在的“异常值”进行筛选,筛选结果列尸表5-3。模型iii转臬为了进一步对闪点与其分子结构间可能存在的非线性关系进行研究,本文采用新建立的GA-SVMT)法建立相应的最优纯非线性模型。模型II中通过搜索所获得专业知识分享WORD格式可编辑的SVM最优参数在GA-SVM参数设置中被保。同时,为与前面两个模型具有可比性,在进GA-SVM筛选时,模型III中所选取的分子描述符个数以大于 5个为标准。随后,针对同样的训练集样本,采用GA-SVM方法在广泛的分子描述符空间进搜,当算法满足终止条件以后,得到与有机物闪点非线性关系最为密的5个结构描述符,其类型与定义于表5-4。在这5个分子描述符之中,有3个描述符(RDCHI,ESpm02d,nHDon)同样出现在模型I之中,其所表征的分子结构特征见模型I°SIC0为扑指数,主要衡分子中元素的差异和分子形状;RCON为GETAWAY描述符,与分子的3D结构有关,主要表征分子的大小、构象变化以及周期性。表5-4模型III所选择的分子描述符Table5-4DescriptorsselectedformodelIII描述符类型定义RDCHI扑描述符反距离Randic类型指数SIC0扑描述符结构信息(0阶邻域对称性)ESpm02d边缘邻接指数边缘邻接矩阵中的02谱矩(按偶极能加权)RCONGETAWAY描述符Randic类型R矩阵连接性nHDon官能团与N原子和O原子相连的H原子数随后,应用所选择的这5个结构参数法相应的SVM模型,模型的输入参数通过“1/5法交互验证确定如下:C=32,£=0.03125,Y=0.25,相应的支持向数为333。模型建以后,应用该模型分别对训练集和测试集样本的闪点进预测,所得1030个样本的预测值见附表1,模型III的主要性能参数见表5-2,模型预测值与实验值的比较凡图5-5。专业知识分享WORD格式可编辑kk值测预点闪楠土模图5-5模型III所得闪点预测值与实验值的比较Fig.5-5CorrelationbetweenthepredictedandexperimentalFPvaluesformodelIII从表5-2可以看出,模型III对测试集样本的预测平均绝对误差为8.93K,在闪点实验误差允许范围(±10K)之内,这说明模型III同样具有较强的预测能力。同时,通过对模型III训练集和测试集的预测结果进行比较发现,两个子集的预测误差不但较低,而且比较接近,说明模型III同样具备较强的泛化性能。同时,对模型III和模型I的预测性能进行比较,发现模型【【【相对于训练集和测试集的预测误差RMSE分别比模型I下降了13.4%和6.5%。与模型0相比,模型III的预测性能得到进一步提升。随后对样本集中所有1030个化合物的预测相对误差进行计算,得到模型III的预测平均相对误差为2.50%,最大相对误差为12.35%。具体计算结果见图5-6。从图中可以看出,共有929个化合物的预测相对误差小于5%,接近于模型中所有样本数的90%。同样,模型III中具有较大预测误差的样本数比模型I明显减少。专业知识分享WORD格式可编辑数个物合化间区各数个物合化间区各误差区间图5-6模型III所得预测相对误差及各误差范围中的化合物个数Fig.5-6ThepercenterrorsobtainedbymodelIIIandthenumberofcompoundsineachrange关于模型III中存在的“异常值,以同样的标准进筛选,筛选结果于表5-3。从表5-3可以看出,Hexamethylphosphoramide在3个模型中均作为“异常值出现,即无论是在线性模型、混合模型还是非线性模型之中,该物质均被认为是“异常值。结合前文关于“异常值产生原因的讨论,可以推断该物质成为模型“异常值的主要原因是其闪点实验数据本身存在问题。关于模型中出现的其它“异常值,由于 3个模型中至少有一个模型能够对其进较好的预测, 因此可以推断这些物质在某些模型中成为“异常值的主要原因,可能是由于其与闪点密相关的有关分子结构特征在相应模型中没有得到很好的表征。模型稳定性分析为进一步对所建模型的稳定性进分析, 排除建模过程中“偶然相关现象的发生,本文采用“Y-随机性检验方法分别对三个模型进验证。“Y-随机性检验是一种评估QSPR模型对“偶然相关现象依赖程的方法。该方法首先将训练集样本中的自变x保持交,将对应的应变y顺序随机打乱,使应变专业知识分享
WORD格式可编辑和自变量不再 对应,从而消除两者之间可能存在的内在相关性;随后,针对上述改变序列的新样本集建立新的QSPR模型,并计算其相关性能参数如此等;将上述过程重复运行50〜100次,获得某一相对“最优”的预测模型,将其与基于原始样本建立的实际预测模型进行比较,若实际预测模型的性能参数明显优于相对“最优”模型,则认为原始样本数据中存在真正的QSPR关系,所建立的模型稳定性较好,不存在“偶然相关”现象;反之,则表明原所建模型不能被接受。本文将“Y-随机性检验”方法针对三个模型分别运行50次。对于模型1所得最大R2为0.020,模型n最大R2为0.022,模型III最大R2为0,025,三者均分别不足原始模型R2的1/10。由此可见,只有在使用正确的应变量数据时样本数据才能产生合理的QSPR模型。因而本文所建立的预测模型不存在“偶然相关"现象,具备较强的稳定性。随后,本文还对模型的预测残差进行分析,讨论模型在建立过程中是否有系统误差产生。三个模型的预测残差图分别见图5-7,5-8及5-9。由图可以看出,三个预测模型的计算残差均随机分布于基准线的两侧,不存在明显的机隹性。由此可以推断,三个预测模型在建立过程中入产生系统误差。50403020100-10-20-30-40100 200 300 400 500 600 700-50100 200 300 400 500 600 700闪点实验僮K)图5-7模型I闪点预测残差图Fig.5-7PlotoftheresidualsversustheexperimentalFPvaluesformodell专业知识分享WORD格式可编辑II型模1差残)型模(II型模1差残)型模(差残50:40:30:20:10:-10:-20:-30:-40-50-100 200 300 400 500 600 700闪点实验值(K)504030201001020304050100 200 300 400 500 600 700闪点实验值(K)图5-8模型nF点预测残差图Fig.5-8PlotoftheresidualsversustheexperimentalFPvaluesformodeln图5-9模型III闪点预测残差图Fig.5-9PlotoftheresidualsversustheexperimentalFPvaluesformodelIII专业知识分享WORD格式可编辑5.3.6模型的比较三个模型的比较从表5-2结果可以看出,在本文所建的3个闪点预测模型中,模型III的性能最为优越,同时具有最佳的数据拟合能和最优的外部预测能。此外,通过模型稳定性分析可以看出,模型III还具有最优的稳定性和可靠性。由此可见,与线性模型I和混合模型II相比,共线性模型III在模型稳健性和预测能等方面具有明显的优越性。这一结果也表明,本文所建的GA-SVM组合算法是一种高效的QSPR算法,比传统的GA-MLR算法和混合建模方法适合于对有机物闪点的QSPR预测研究。从表5-2也可以看出,与线性模型I相比,混合模型II的各项性能均较优。由于两模型所使用的分子描述符相同性能上的差异主要是由于前者使用线性方法MLR建模,而后者使用非线性方法SVM建模所致。由此可见,与传统线性方法相比,SVM方法具有强的预测能和泛化性能,特别适用于这种非线性的QSPR研究体系。同样,与混合模型0相比,共线性模型III的各项性能均较优。由于两模型均采用SVM方法进建模,性能上的差异主要是由于两模型所使用的分子描述符同所致:前者使用线性交选择方法GA-MLR筛选出的结构参数作为分子描述符,而后者使用非线性变选择方法GA-SVM筛选出的结构参数作为分子描述符。这一结果表明,通过线性变选择方法筛选出的最佳描述符一定是非线性拟合的最佳选择,有机物闪点与其分子结构间的非线性关系只有采用通过非线性方法筛选出的描述符才能进为有效的表征。专业知识分享WORD格式可编辑然而,需要注意的是,尽管与混合模型II和非线性模型111相比,线性模型I的各项性能相对较差,但是,无论是混合模型II还是非线性模型III均使用非第性的SVMT)^建模,市SVMT)法建的是一种“黑箱模型,能给出直观的数学表达式,因而就无法根据模型直接准确地解和掌握各分子描述符对闪点的影响程和机,也就无法有效地对模型机作出解释,而这些正是MLR模型的优势。此外,与模型II、0相比,线性模型I还具有建模简单、使用简等优点。因此,这三种模型各有弊,并存在一定的互补性,在实际应用过程中,可根据实际需要加以选择。与已有模型的人较为进一步对本文所建模型的可靠性和优越性进验证,将其与文献上已有的闪点预测模型进全面的比较。首先,将本文模型的预测性能与已有模型进比较,结果于表5-7。从表5-7可以看出,本文采用GA-SVM算法建的非线性模型III具有较强的预测性能,在所有已有的闪点预测模型中仅次于文献[50]所建的基团贡献模型(以平均绝对误差AAE为标准)。这说明模型III对有机物闪点与其分子结构存在的非第性关系进较好的表征,同时再次表明本文所建的GA-SVM组合算法是一种高效的QSPR算法,比传统的GA-MLR算法和混合建模方法适用于有机物闪点的QSPR预测研究。表5-7大文模型与已有模型预测性能的比较Table5-7Performancecomparisonsbetweenthepresentedmodelsandpreviousmodels模型R2AAERMSEnSuzuki等[36]0.935110.313.52400Tetteh等[37]0.932610.213.1400Katritzky等[54]0.90216.1271Zhokhova等画0.95914.6398专业知识分享WORD格式可编辑Katritzky等[55]0.87813.9758Gharagheizi和Alamdari[56]0.966910.212.71030Gharagheizi等[39]0.97578.10111.2061378Pan等[50]0.9746.89411.3671282人文模型I0.96810.1112.511030人文模型II0.9758.7111.071030人文模型III0.9768.6811.001030然而,必须指出的是,上述各预测模型均建在同的样本集基础之上,因市预测结果间存在一致性;同时,各模型的建使用同的研究方法,因而每个模型均有其自身的优缺点。因此,仅仅对模型的预测性能进比较是合的,必须从模型其它的一些重要特征,如模型应用效、应用范围、可解释性等方面着手对各预测模型进为全面的比较分析。 本研究以文献[56]和文献[50]所建模型为,将本文模型与其进较为全面的比较。文献[56
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《上下料机器人工作站系统应用(ABB)》试卷1
- 2024年孟安与配偶解除同居合同
- 2024年建筑施工临时设施租赁合同
- 安徽省宿州市灵璧县2024-2025学年八年级上学期期中考试地理试卷
- 2024年工厂自动化生产线特许经营合同
- 湖南省天一大联考2024-2025学年高二上学期11月期中物理试题(无答案)
- 2024年建筑材料注塑模具制造合同
- 2024年国际货物买卖合同详细条款与标的说明
- 2024年度环保型塑胶原料采购合同
- 2024定制版:某公司与供应商的物资采购合同(contractual subject)
- 《创意改善生活》课件 2024-2025学年湘美版(2024)初中美术七年级上册
- 2024-2025学年 浙教版七年级数学上册期中(第1-4章)培优试卷
- 个人简历模板(5套完整版)
- CHT 1027-2012 数字正射影像图质量检验技术规程(正式版)
- 狭窄隧道汽车双向行PLC控制设计
- 修复科病历书写要求和标准(整理自北医的材料)
- 移相整流变压器设计及试验
- 05S502阀门井图集
- 舒方特方格练习(共6页)
- 90、808系列铝合金门窗自动计算下料表
- 管道定额价目表
评论
0/150
提交评论