下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于pso-svr的二维色谱柱效预测模型
1基于回归模型的二维柱色谱作为一种复杂的混合物分离方法,该方法在分析化合物方面发挥了重要作用。早期使用的一维色谱,使用一根色谱柱,仅适用于含几十至几百种物质的样品的分析。当样品更复杂时就需采用多维色谱技术。多维色谱法利用两个或更多个色谱柱对复杂样品中的待分析组分进行分离,在柱之间利用切换阀将经过初次分离的全部或部分组分选择性地转入另一根或多根不同类型的色谱柱中进一步分离。至今,多维色谱无论在理论上还是在应用在上均已相当成熟。目前,多维色谱主要是二维技术,许多色谱工作者从不同的方面对二维柱色谱进行了研究和改进。许国旺等在美国PE公司生产的SIGMA1气相色谱仪的基础上,将一维柱色谱改装成二维柱色谱系统,并通过柱效评价实验方法,得出二维柱色谱系统的柱效主要由预柱柱温(T0)、主柱柱温(T1)、柱间压差(ΔP)和主柱间的放空量(V)决定,由于它们之间关系复杂,多元线性回归已不再适用于非线性建模;黄俊等利用BP神经网络(BPNN)建立了二维柱色谱系统的柱效预测模型,尽管神经网络模型能较好地预测二维色谱柱效,但它的预测精度还不够高,泛化能力仍不理想。因此,进一步探索和寻求更加准确、有效的预测方法很有必要。支持向量机(supportvectormachine,SVM)是由Vapnik等于1995年提出的一种基于统计学理论的监督学习机,可用于两类及多类别分类和回归分析,已被成功地应用到很多实际领域[8,9,10,11,12,13,14,15,16,17,18,19]。由于实际应用以有效塔板数(N)来衡量柱效,因此,本研究利用文献中二维色谱有效塔板数实验数据集,应用基于粒子群算法参数寻优的支持向量回归(supportvectorregression,SVR)方法,并结合留一交叉验证法(leave-one-outcrossvalidation,LOOCV),建立二维色谱在其主要影响因素下的柱效预测模型,并与BP神经网络(BPNN)模型的预测结果进行对比。结果表明:基于支持向量回归的模型能更准确地预测主要影响因素下的二维色谱柱效。2支持向量回归方法2.1次规划回归引入一个适当的损失函数,SVM能很好地解决回归问题。本研究采用常用的ε不敏感损失函数。设样本集为(x1,y1),…,(xm,ym),寻找一个输入空间到输出空间的非线性映射Φ,通过该映射,将样本集中的数据x映射到高维空间F,并在特征空间F中用下述线性函数进行线性回归,即:f(x)=w·Φ(x)+b,Φ:Rn→F,w∈F,(1)式中,b是阈值,w是回归系数向量。影响w的因素有:经验风险的总和以及使其在高维空间平坦的‖w‖2,即:R(w)=12∥w∥2+Cm∑i=1ε(f(xi)-yi),(2)ε(f(xi)-yi)={0,|f(xi)-yi|<ε|f(xi)-yi|-ε,|f(xi)-yi|≥ε(3)按照最大间隔法的基本思想,引入拉格朗日乘子α和α*,求解在一定约束条件下的最小泛化函数,构造出如下最优化问题:min{12m∑i,j=1(αi-α*i)(αj-α*j)(Φ(xi)⋅Φ(xj))+mΣi=1αi(ε-yi)+m∑i=1α*i(ε+yi)},st.{m∑i=1(αi-α*i)=0αi,α*i∈[0,C](4)由此,支持向量机的函数回归即可归结为二次规划问题(4)。求解该二次规划问题,得到用训练样本点表示的w:w=m∑i=1(αi-α*i)Φ(xi),(5)式中,αi和α*i是最小化R(w)的解。由此可求得线性回归函数:f(x)=m∑i=1(αi-α*i)k(x‚xi)+b(6)式中,k(x,xi)=Ф(x)·Ф(xi)为核函数。选择不同形式的核函数就可以生成不同的回归模型。常用的核函数有:径向基函数、多项式函数、Sigmoid函数、线性函数等。本研究采用径向基函数来建立支持向量回归模型:k(x,xi)=exp(-γ‖x-xi‖2)(7)2.2随机初始化粒子3g由于支持向量回归模型的泛化性能在很大程度上依赖于3个参数:不敏感损失函数ε、误差惩罚因子C和核函数参数γ,因此,对(ε,С,γ)参数进行寻优是十分关键的。本研究采用粒子群算法来寻找最优参数子集(ε,С,γ),即采用速度-位置搜索模型来寻找最优参数。群体中的每个粒子由3维参数向量(ε,С,γ)组成,设第i个粒子在3维解空间的位置为ui=(ui1,ui2,ui3)T,其速度为vi=(vi1,vi2,vi3)T,当前时刻的个体极值记为pibest,全局极值记为gbest。在每次迭代中,粒子跟踪个体极值、全局极值和自己前一时刻的状态来调整当前时刻的位置和速度,迭代公式如下:v(t+1)=ω·vi(t)+c1·rand()·(pibest-ui(t))+c2·rand()(gbest-ui(t))(8)ui(t+1)=ui(t)+vi(t+1)(9)式中,v(t),v(t+1),u(t),u(t+1)分别是粒子在当前时刻和下一时刻的速度及位置;rand()是[0,1]之间的随机数;c1、c2是学习因子,通常取为2;ω是权重因子,为加快收敛速度,其值应随算法迭代的进行而自动调节,一般定义为:ω=ωmin+(itermax-iter)·(ωmax-ωmin)/itermax(10)式中,ωmax和ωmin分别为最大和最小权重因子,iter为当前迭代次数,itermax为总的迭代次数,且ωmax和ωmin的值一般取为0.9和0.4。值得注意的是:由于要同时优化3个参数ε、C和γ,它们的取值一般又不在同一数量级上。因此,在随机初始化粒子的速度v时,应该乘上它们各自相对应的系数。为了直接反映支持向量回归性能,本研究选用均方根误差(RMSE)作为适应度函数:RΜSE=√1mm∑i=1(ˆyi-yi)2(11)式中,m是训练样本数,yi和ˆyi分别是第i个训练样本目标量的实测值和预测值。2.3支持向量回归模型的构建2.3.1色谱有效塔板数的测定本文所用数据(见表1)源于文献。该数据集共包含24个样本,是在不同主要影响因素(即预柱柱温、主柱柱温、柱间压差和主柱间的放空量)下测定的二维色谱有效塔板数N。其详细实验过程参见文献。2.3.2模型训练与预测在利用支持向量回归方法对文献的实验数据集训练建模的过程中,以预柱柱温(T0)、主柱柱温(T1)、柱间压差(ΔP)和主柱间的放空量(V)4个因素为输入向量,以二维色谱系统的有效塔板数为输出值进行训练学习。为了便于与文献中的BP神经网络模型的预测效果进行直接比较,本研究完全按照文献中的训练样本和检验样本进行训练和预测,其中训练样本数为22个,检验样本数为2个(见表1)。建模时,首先利用22个训练样本数据对支持向量机进行回归训练学习,通过不断地训练、调整后得到的SVR最优参数子向量为(0.000925655,9.09848e+007,0.141523),然后利用所建模型对检验样本数据集进行预测计算。此外,还针对表1数据集中的24个样本,应用SVR对其进行留一交叉验证建模训练和预测研究。2.3.3模型预测性能评价除均方根误差(RMSE,式(11))外,还采用平均绝对误差(MAE)、平均绝对百分误差(MAPE)以及相关系数(R2)对所建模型的预测性能进行评价。MAE、MAPE以及R2分别定义如下:ΜAE=1nn∑j=1|ˆyj-yj|(12)ΜAΡE=1nn∑j=1|ˆyj-yjyj|(13)R2=n∑j=1(ˆyj-ˉy)2n∑j=1(yj-ˉy)2(14)式中,n是检验样本数,yj和ˆyj分别是第j个检验样本目标量的实验值和预测值,ˉy是检验样本目标量的实验平均值。3结果与讨论3.1svr-loocv预测的预测性能分析对于相同的训练样本和检验样本而言,SVR对检验样本的预测结果的平均绝对百分误差为13.3%,比BPNN(17.3%)的小,由此说明支持向量回归模型的预测结果优于BPNN。图1是经SVR-LOOCV建模的预测值与实测值的对比图。在所有24个样本中,绝大多数(23/24=95.8%)样本的绝对百分误差均<10%,最大绝对百分误差为22.9%,最小绝对百分误差为0,24个检验样本的整体平均绝对百分误差为1.6%,说明基于留一交叉验证法的支持向量回归具有较好的预测能力。其中第15号样本的绝对百分误差(22.9%)较大,可能是因实验和测量误差所致的个别异常点,这表明利用支持向量回归方法所建模型具有一定的过滤不良数据的能力,致使该异常点不影响整体的预测精度。在图1中还给出了SVR-LOOCV预测结果的相关系数(R2)为0.989。由此可见,基于留一交叉验证法的支持向量回归模型具有良好的拟合效果。表2是SVR-LOOCV与BPNN和SVR对检验样本的预测性能比较。从表2可以看出,SVR-LOOCV预测的平均绝对误差(196.79m-1)和平均绝对百分误差(1.6%)均为最小。同时,对SVR而言,训练样本越多,预测效果越好。因此,采集更多的实验数据可提高SVR预测模型的准确性。3.2svr预测结果的比较根据二维柱色谱在不同影响因素(预柱柱温、主柱柱温、柱间压差、主柱间的放空量)下的有效塔板数的实测数据集,应用基于粒子群寻优的支持向量回归方法进行了建模与预测研究,并与基于BP神经网络的预测模型的预测结果进行了比较.结果表明
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度劳动合同:某互联网公司与员工的就业协议
- 电影胶片显影机市场发展预测和趋势分析
- 2024年度智能家居系统研发与合作合同
- 2024年度带电器家具的个人租房合同:租金减免及优惠政策
- 2024年度版权出租合同标的及出租期限和租金
- 2024年度物联网技术在智慧物流中的应用合同
- 2024年度LED路灯驱动电源技术开发与合作合同
- 2024年度录像资料存储与处理安全合同
- 2024全新彩绘合同协议书下载
- 家庭日用纺织品市场发展现状调查及供需格局分析预测报告
- 2022宁夏共享集团公司校园招聘48人上岸笔试历年难、易错点考题附带参考答案与详解
- 基因扩增实验室常用仪器使用课件
- 2023年营养师、营养指导员专业技能及理论知识考试题库(附含答案)
- 肺功能万里行考试内容
- 男生青春期教育讲座-课件
- 《银行运营档案管理系统业务管理规定》制定说明
- 教育人力资源管理:绩效管理(二)教学课件
- 阳光少年实践活动心得感悟3篇
- 经典校园英语舞台剧剧本:皇帝的新装
- pep人教版英语六年级上册Unit2《Waystogotoschool》大单元作业设计(三)
- 全员育人导师制学生谈话记录
评论
0/150
提交评论