基于主成分回归残差神经网络校正的汽油辛烷值预测模型校正_第1页
基于主成分回归残差神经网络校正的汽油辛烷值预测模型校正_第2页
基于主成分回归残差神经网络校正的汽油辛烷值预测模型校正_第3页
基于主成分回归残差神经网络校正的汽油辛烷值预测模型校正_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于主成分回归残差神经网络校正的汽油辛烷值预测模型校正

1辛烷值非标准法预测数学模型目前,汽油是最常用的液体燃料,辛烷值是油耗最重要的品质指标。因此汽油辛烷值的检测在石油炼制工业中是十分重要的。汽油辛烷值检测的传统方法一般采用ASTM-CFR发动机对汽油进行离线采样分析。该方法的缺点是相当显著的,其机器结构复杂,操作和维护的费用高,因而检测成本高。尽管为适应在线分析也出现了在线化的仪器,但已经很难满足工业生产的需要。近年来发展起来的CCD近红外光谱分析方法具有检测快速、可用于在线分析、操作及维护简便和检测成本低等优点。近红外快速测定汽油辛烷值方法的本质在于利用汽油在近红外光谱区(700~2500nm)的C-H振动倍频信号提供的丰富信息,建立一个唯象的数学模型,并利用该模型的内插和外推能力根据未知样品的光谱对目标参数进行预测。化学计量学近年来的发展提供了很多强有力的训练算法用于建立这样的数学模型。这些算法通常可以分为线性校正算法和非线性校正算法两类。线性校正算法通常有PCR,PLS等,线性算法对具有内在线性关系的体系的校正能力是很强的,但对于存在非线性关系的体系就会出现预测误差远大于校验误差的现象。非线性校正算法主要有人工神经元网络方法(artificialneuralnetwork,ANN),非线性PLS,LWR(localweightedregression)方法等。其中较为常用的是ANN方法,其非线性逼近能力很强,但也存在一些局限性,如:训练速度很慢,容易陷入局部极小,也存在过拟合现象及当输入变量间存在线性关系时预测能力较差等。由于汽油的辛烷值与光谱信号之间的内在关系是非线性的,所以对于该体系非线性校正算法建立的模型的预测能力应当优于线性校正算法。但由于近红外光谱信号通常是在数百上千个波长通道处采集的吸收值,输入变量之间不可避免地存在共线性,所以有必要先利用PCR或PLS方法对输入数据变量矩阵进行正交化和降维处理。因此为了进一步提高模型的预测能力,有必要将线性校正算法和非线性校正算法结合起来用于预测数学模型的建立。本文采用的算法将PCR模型的主成分得分作为神经网络的输入变量,PCR校验残差作为神经网络的教师信号,结果证明该算法优于目前采用的经典的PLS,PCR以及非线性PLS算法。2神经网络预测模型建立本文采用的算法分为两个部分,即主成分回归算法(PCR)和神经网络算法两个部分。主成分回归先对经过预处理的近红外光谱数据矩阵进行降维和正交化处理,得到原始数据矩阵的主成分及相应主成分的得分(score),并利用PCR算法得到的预测模型计算汽油样本辛烷值的预测值,由此预测值得到PCR模型的残差。然后将主成分的得分作为神经网络的输入赋给输入层结点,同时将PCR模型的残差作为神经网络的目标信号用于对神经网络的训练。由此得到的预测模型由两部分组成,一部分为PCR的主成分和得分组成的矩阵(即PCR预测模型),另一部分为神经网络的联接权组成的矩阵。在预测时,输入未知汽油样本的近红外光谱数据,利用PCR预测模型计算PCR预测值。然后将对应于每一主成分的得分数值输入神经网络预测模型得到残差的预测值。将PCR预测值与残差的预测值相加即得该汽油样本辛烷值的最终预测值。本文的神经网络采用目前较为成熟的BP(误差反向传播)网络,以Sigmoid函数为激发函数。其原理近来已有很多文献述及,这里不再详细给出。3汽油全目标品的测定本文采用的汽油样本由镇海炼油化工有限公司研究中心提供,近红外光谱由美国UOP-NIR近红外光谱仪测定,所有40个样本均为重整化汽油,其辛烷值由ASTM-CFR标准方法测定,近红外光谱波长范围为600~1750nm。将汽油样本集中的30个样本作为校验集,剩余的10个样本作为预测集。首先利用校验集训练得到预测模型,然后将预测集作为未知样本根据预测模型进行预测,预测结果与ASTM-CFR方法给出的标准数据比较。3.1bp神经网络数据的生成光谱数据依次进行基线校正和5点移动平均处理。然后选择一定的波长范围内的数据,再对光谱数据和辛烷值数据进行数据中心化和标准化得到PCR的输入数据矩阵。由于采用Sigmoid函数作为激发函数,网络的输出永远在0~1之间,所以在将残差数据和PCR主成分得分数据输入BP神经网络之前,要将数据平移缩放至0.1~0.9范围以内。为得到最终预测结果,将BP网络的预测结果进行相应的逆处理再加上PCR的预测结果。3.2神经网络设计本文算法的神经网络部分采用三层(即单隐含层)误差反向传播BP网络模型算法。该算法是广泛使用并且比较成熟的一种ANN算法,但收敛速度很慢,本文采用的是改进的Vogl加速算法,提高了网络的收敛速度。经过多次尝试确定BP神经网络的训练参数:学习步长为0.2~0.5,动量项为0.5~0.8,取收敛判据为总体误差Etotal<0.001。网络的输入层结点数为PCR的主成分数(见表2附注);输出层结点数为1,即汽油样品的辛烷值;隐含层结点数取输入输出层结点数的几何平均数的两倍,即:NHidden=2*(NOut*NIn)1/2。这样就保证了神经网络避免由于输入层结点数超过样本数或隐含层结点数过多而出现过拟合现象。本文使用作为比较的线性PLS算法为Lindgren等改进的核心算法,其实质与经典的PLS算法完全相同,但大大简化了计算过程。非线性PLS为二次函数相关PLS算法。本文的所有算法程序均采用BASIC语言编制,在Pentium-MMX200MHz台式机Windows95环境下运行。4结果与讨论4.1波峰重叠和共线性问题的自动波长选择近红外光谱数据分析在早期通常采用全谱波长范围数据用于校正和预测,但是研究表明选择特定波长范围对于预测精度的提高有重要的作用。这是因为近红外光谱数据通常存在严重的波峰重叠和共线性现象。近年来,光谱波长的选择方法正逐渐成为化学计量学的一个较为活跃的研究领域,出现了很多有效的自动波长选择算法。本文采用的是半经验的方法。首先按波峰特征划分为若干连续波长区域(见表1),然后将每个区域的光谱数据作为输入信号,计算PCR校验残差平方和(PRESS)并进行比较,取PRESS较小的区域作为选定的波长范围。由表1中的结果可见选择800~1100nm波长范围较好,这一范围为包含较小吸收峰的平台区域。4.2基于pcr模型的预测算法仿真一般来说,学习步长和动量项越大,神经网络的收敛速度越快,但太大会出现网络的振荡。选取不同的网络初始连接权值,网络会收敛到不同的局部极小。本文使用作者编制的算法程序可以自动以一定范围内的随机数初始化网络连接权值,然后检验网络是否收敛到一个局部极小。若该局部极小的数值大于给定的标准,则重新初始化权值。直到网络的收敛达到满意为止。另外,隐含层结点数越多则网络陷入局部极小的可能性越小,但增加隐含层结点数会大大增加网络的计算量。本文取隐层结点数为输入和输出结点数的几何平均数两倍。PCR主成分数为11时,网络达到收敛经过15,361次训练。一般来说,PCR算法的主成分数越大,预测的结果越好。但是,当主成分数大于一定值时,会出现过拟合现象,使生成的预测模型对未知样本的预测偏差较大。本文中在选择波长范围时,由于利用PCR模型对检验集样本的预测结果作为评价标准,所以取主成分数较大,为20(见表1)。在建立模型的过程中,选取较为适中的主成分数,为11(见表2)。PCRRANN算法对预测集的预测结果随PCR主成分数的变化而变化,当完成分数大于15时,其预测误差明显上升。实验表明,当PCR主成分数取11时,对预测集的样本的预测结果最好。4.3辛烷值的比较表2为分别用PCR,PLS,NPLS(nonlinearPLS)和PCRRANN4种算法建立预测模型的Pc和Pp的值与ASTM-CFR方法测得的辛烷值的比较。由表中结果可以看出,PCRRANN方法建立的模型的校验结果和预测结果明显优于其它3种较正方法。表3为PCRRANN算法对预测集的预测结果与ASTM-CFR辛烷值的比较,由表可见PCRRANN算法的预测结果是令人满意的。图1为PCRRANN算法的预

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论