最常见的近红外光谱的预处理技术的综述样本_第1页
最常见的近红外光谱的预处理技术的综述样本_第2页
最常见的近红外光谱的预处理技术的综述样本_第3页
最常见的近红外光谱的预处理技术的综述样本_第4页
最常见的近红外光谱的预处理技术的综述样本_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

最常用近红外光谱预解决技术综述smundRinnan,FransvandenBerg,SørenBallingEngelsen摘要:预解决在近红外(NIR)光谱数据解决化学计量学建模中已经成为不可分割一某些。预解决目是消除光谱中物理现象在为了提高后续多元回归、分类模型或摸索性分析。最广泛使用预解决技术可以分为两类:散射校正办法和光谱间隔办法。综述和比较了算法基本理论和当前预解决办法以及定性和定量后果应用程序。其目是提供更好NIR最后模型建立,在此咱们通过对光谱预解决基本知识进行梳理。核心词:乘法散射校正;近红外光谱法;原则化;诺里斯威廉姆斯推导;预解决;Savitzky-Golay平滑;散射校正;光谱导数;原则正态变量;综述引言当前为止,没有可以优化数据来进行代替,但是通过恰当数据收集和解决将会起到优化效果,对光谱数据进行预解决是最重要一步(例如最优化之前叠层建模),惯用办法有主成分分析(PCA)和偏最小二乘法(PLS)。在大量文献中,多变量光谱应用食品、饲料和医药分析,比较不同预解决成果研究模型预测成果是不可分割构成某些。近红外反射/透射率(NIR/NIT)光谱光谱技术,到当前为止最多被使用和最大多样性在预解决技术,重要是由于入非线性光散射光谱可以引起明显影响。由于类似规模波长电磁辐射和粒子大小近红外光谱在生物样品,近红外光谱技术是一种不被广泛使用是由于存在散射效应(涉及基线转变和非线性),这将会影响样品光谱成果记录。然而,通过应用适当预解决,可以很大限度上消除这些影响。在应用研究中,比较了几乎完全不同定标模型(定量描述符和相应关系)。几乎没有浮现评估差别和相似性报道。代替技术即修正含义(例如,谱描述符数据)在研究中很少被讨论。本文旨在讨论建立了预解决办法对近红外光谱和模型之间关系,更详细地说,这些技术都是相应独立响应变量,因此咱们只讨论办法,不需要一种响应值。咱们同步关注预解决工艺理论方面和实际效果,这种办法合用于近红外光谱/NIT光谱。对固体样品,干扰系统差别重要是由于光散射不同和有效途径长度不同。这些不受欢迎变化经常构成了样本集总变异重要某些,可以观测到得转变基线(乘法效应)和其她现象称为非线性。普通来说,近红外光谱反射率测量一种示例将测量普及性反映和镜面反射辐射(镜面反射)。镜面反射普通由仪表设计和几何采样最小化,由于它们不含任何化学信息。这个diffusively反射光,这反映在广泛方向,是信息重要来源在近红外光谱。然而,diffusively反射光将包括信息化学成分不但示例(吸取)并且构造(散射)。重要形式光散射(不涉及能量转移与样品)瑞利和洛伦兹米氏。两者都是过程中电磁辐射是分散(例如,通过小粒子,泡沫,表面粗糙度,水滴,晶体缺陷,microorganelles、细胞、纤维和密度波动)。当粒子尺寸不不大于波长,由于普通状况下,NIR光谱,是重要洛仑兹米氏散射。相比之下,瑞利散射,是各向异性,洛伦兹米氏散射依赖形状散射粒子和不强烈波长依赖性。对生物样品,散射特性是过于复杂,因此软或自适应补偿,光谱预解决技术,正如咱们近红外光谱在本文中进行讨论,规定删除散射从纯粹、抱负吸取光谱。显然,预解决不能纠正镜面反射率(直接散射),自谱不包括任何精细构造。光谱重要由镜面反射率应当总是被移除之前为离群值多元数据分析,由于她们仍将是局外人,甚至在预解决。图1显示了一组13好蔗糖和样品不同粒径加一坏蔗糖例子展示如何(极端)镜面反射率体现比正常光谱。图1还演示了总体布局大多数数据在本文中。上部图,一种条形图显示了主成分得分值第一主成分(PC)后样本集数据意味着定心[1]。下面某些显示预解决效果数据集(或者,在这种状况下,任何预解决)。有关系数r平方值之间酒吧和一种选定参照变量包括(在本例中,已知平均粒径13蔗糖样本)。蔗糖数据集,这种关系应当是低,例如,当假设散射是一种阻碍粒子始发;尽量小信息粒度应当保持在对的预解决。图SEQ图表\*ARABIC1近红外光谱13蔗糖和样品不同粒径(最小粒子在底部,最大顶部;粒子尺寸范畴在20-540lm。黑色光谱显示了一种镜面反射率蔗糖样本。酒吧是分数值第一主成分13个蔗糖样品主成分分析模型在完整光谱。一种示例数据预解决蔗糖中可以看到图2,其中也包括一种其实一种示例数据预解决蔗糖中可以看到图2,其中也包括一种其实从当前起,在这篇文章中,咱们将演示效果不同预解决技术在小果胶数据集只包括7个样品有不同限度酯化(%德;范畴在0-93%)[2]。这些样品测定近红外光谱反射率模式在光谱范畴1100-2500海里(收集每2海里区间;图3)。咱们提供相应第一因素PCA样本得分后作为一种条形图意味着定心,连同集中吸光度值在波长2244纳米。咱们选取这个峰值,由于它在理论上应当描述%DE完美。对于本文,咱们假设信息在光谱相联系果胶粒子大小和形状应当被预解决技术,条形图应当显示一种线性行为与%德。为了阐明预解决影响在量化,咱们使用数据取自克里斯腾森etal。[3]。她们研究了一组32杏仁蛋白软糖混合物,基于不同食谱,九个不同数据都在互联网上可用(www。模型生活kudk)。所有杏仁蛋白软糖样品测定了六种不同近红外光谱仪器和化学参照分析了水分和糖含量。在构建一种定量回归模型,重要是要打扫预测数据从非系统性散射变化,由于她们可以产生重大影响预测模型性能和模型复杂性或吝啬。在本文中,咱们使用请预测这种定量响应信息[4]。预解决办法图2上图:数据被一种二阶蔗糖乘法散射校正;底:相应原则差每个波长,虚线是原始/未加工数据(见图1),固体是预解决数据。最广泛使用预解决技术在近红外光谱法(在两个反射和透射模式)可以分为两类:scattercorrection办法和光谱衍生品。第一群散射校正预解决办法涉及乘法散射校正(MSC),逆MSC,扩展MSC(EMSC),扩展逆MSC,de趋势,原则正态变量(SNV)和原则化。图3生/未加工光谱,7果胶样本。蓝线是一种示例有0%限度果胶酯化(DE),红色线是一种样本93%德。打开条批示主成分分析(PCA)评分值在第一种PC为完整光谱,意味着定心,关闭了酒吧后光谱值在波长2244纳米。光谱推导集团是为代表两种技术在本文中:诺里斯威廉姆斯(NW)衍生品和Savitzky-Golay(SG)多项式导数过滤器。这两种办法都使用一种平滑光谱导数计算之前,以减少有害影响,老式信噪比有限差分衍生品会。预解决环节目的可以三种:提高后续摸索性分析提高后续叠层校正模型(力数据服从兰伯特啤酒法律);或者,提高后续分类模型。朗伯比尔定律(方程(1))是经验对近红外光谱/NIT和显示成线性关系,吸取光谱和浓度(s)成分(s):(1)其中作为吸光度,依赖波长摩尔吸光系数,代表光通过容器有效途径长度,是成分浓度。朗伯比尔定律严格有效只有纯透射系统没有散射。在反射率测量,方程(1)是重新定义在类比透射率测量为:其中,是反射率。选取适当预解决应当总是被以为是相对于持续建模阶段。例如,如果数据集兴趣不遵守法律,额外因素兰伯特啤酒或组件在请回归普通可以弥补这一抱负行为光谱预测[5]。缺陷涉及额外因素是提高模型复杂性,反过来,最有也许减少对将来预测模型鲁棒性。所有预解决技术目的减少变化减少数据以增强特性谋求在光谱,经常一种线性(简朴)关系现象(例如,一种成分)兴趣。通过使用一种适当预解决技术,这可以实现,但总是有危险应用了错误类型或应用太严重预解决,将移除有价值信息。对的选取预解决是很难评估模型验证之前,但是,普通来说,执行几种预解决环节是不可取,作为最低规定,预解决应保持或减少复杂性有效模型。图4样品光谱(蓝色点)密谋反抗一种选定参照光谱。标量修正条款发现随着拦截和边坡黑色线条,就是发现从最小二乘回归适合通过所有点。散射校正依照散射校正办法,咱们考虑三个预解决概念:研究生,SNV和原则化。这些技术是为了减少(物理)可变性样本之间由于散射。所有三个也调节基线样本之间变化。3.1MSC乘法散射(或者,在普通状况下,信号)校正(MSC)也许是最广泛使用预解决技术对近红外光谱(紧随其后SNV和派生)。MSC其基本形式是由Martens初次引入等人1983年[6],并进一步阐述了通过Geladi等人1985年[7]。MSC背后概念是,工件或缺陷(如,不良散射效应)将被删除数据矩阵之前,数据建模。MSC包括两个环节:预计校正系数(加法和乘法贡献。(2)校正记录光谱(3)其中:代表近红外光谱仪器对一种原样品进行光谱测量,代表参照光谱用于预解决整个数据集,是减少一某些,代表了修正后光谱,其中和都是标量参数,这在每个样品中具备不同代表含义,这个在图4中进行阐明,对每个标量参数进行理解释。在大多数应用中,平均频谱校准设立用作参照光谱。然而,一种通用参照光谱也可以应用。在最初论文Martensetal。[6],这是建议只使用那些某些光谱轴,不涉及有关信息(基线)。而这使得好光谱意义上说,很难拟定这些地区在实践中,特别是在近红外光谱测量,信号从不同化学成分是强烈重叠和有关,很少或主线没有真正基线是发现。这是为什么,在大多数状况下,整个频谱用于查找标量校正参数在MSC。图5演示了应用程序原则MSC对果胶数据。光谱特性果胶粉是守恒,而背景偏移和斜坡基本上是删除(与图3)。线性关系光谱和%德是不错,但它并不完美。图5数据预解决乘法散射校正用一阶校正对平均频谱。基本形式MSC已经扩展成更复杂扩展(8-12)普通被称为EMSC。这个扩展涉及二阶多项式拟合参照光谱,拟合一种基线波长轴,和运用先验知识从光谱兴趣或光谱干扰物。在本文中,所有这些代替品被称为MSC为简朴起见,由于她们可以总结为一种单一方程:(4)其中,代表依赖波长轴修正向量,包括先验知识涉及了想要/不必要光谱信息(例如一种已知光谱干扰物种)。方程(4)可以容易地扩大到涉及任何其她任何具备恰当意义修正。代表了一组标量(校正系数)给出了方程(5)。(5)其中:偏差校正是依照修正改正对我是对校正订单波长轴依赖,是纠正第i已知信息吗相比喻程(2),它可以观测到方程(4)只是一种高阶扩张之一想法。在本文中将不再做进一步讨论,由于,在诸多实际状况,参照光谱对想要和不必要成分并没有现成可用。参照校正是最惯用办法只有一种一阶多项式。虽然没有数学限制扩大到高阶增长,有普通没有光谱参数这样做(除了也许如果重要瑞利散射是出当前短波长区域。图6显示了成果一种二阶多项式校正果胶数据。修正条款用于二阶多项式参照校正只是发现了拟合二阶(二次)多项式点在图4。只有边际改进获得了比一阶修正在图5。波长轴依赖是最常涉及作为一种二阶多项式拟合波长轴光谱。当没有参照校正涉及在内,这个简朴波长配件也名义光谱de趋势[13],它可以被视为一种基线校正。重要是要注意,涉及波长依赖性在完整校正方程(4)而不是让它作为一种单独环节会导致一种较小矫正效果。这是由于一种矩阵求逆操作同步执行所有校正参数在MSC,不同修正会互相影响最小二乘法拟合准则。当一种波长依赖是独立决定只有波长轴(而不是参照光谱)影响校正,这将导致一种趋平加工谱。这个效果可以看出通过比较无花果。7和8。正如前面提到,更加复杂修正(例如,高阶多项式或其她转换波长依赖性)可以很容易地纳入MSC。Thennadil和马丁[12]建议使用对数值波长,由于这是更多声音来判断光谱。然而,区别使用对数变换波长与使用一种一阶多项式校正是最小,使这两个办法相似所有实用目。彼得森指出,etal。[9],这是一种相称简朴过程,应用逆版本MSC,称为逆信号校正(ISC)[14]。预计校正参数,b系数,发现以类似方式来定期MSC:(6)请注意,xorg和xref已经互换了地方比喻程(4)。一种运用(扩展)ISC(EISC)是简朴修正方程:(7)图6乘法散射校正光谱使用二阶参照校正对平均频谱。在ISC和EISC,无论是预计校正系数和校正自身中执行可以被描述为一种迈进方式,使它能以便涉及附加条款和/或参照信号[9]。前面提到矩阵求逆操作所需参数预计在MSC可以很容易地成为数字坏脾气如果它涉及高阶多项式参照改正。这是一种论点支持ISC。然而,假设,ISC最小二乘法拟合,误差在记录光谱(纠正)不大于误差为参照光谱。在大多数实际应用,参照是平均谱计算样本数据集从n(例如,校准设立)。预期噪音水平数量级这个引用是不大于个人光谱(忽视了偏见由于散射差别集)。这是一种反对ISC,由于一种小错误在光谱预解决将会影响到更大限度比最初MSC。图8乘法散射校正(MSC)与一种一阶多项式参照校正对平均频谱,另一方面是一种单独MSC与二阶多项式波长校正(去趋势)。重要挑战是定义一种适当MSC参照光谱。正如前面提到过,这是最经常设立为普通校准光谱。加拉格尔等人[15]提供了一种天然变化来MSC通过包括一种加权方案在预解决环节。提出了两个选取:1)使用一种预定义权向量波长轴向2)迭代搜索最优权重向量迭代解决方案是通过给低体重发现变量或波长与高残留差别原始数据和修正解决方案。权重计算将继续,直到区别两个后续迭代修正光谱不大于假定数据中噪声水平。不幸是,这个相称简朴直接办法并不总是适合近红外光谱数据,自蔓延在更高波长范畴普通表白更分散,应当改正而不是权重小。图9显示了权重。用于最后修正给强调到shortwavelength地区,而长波长区域并不有助于校正在所有。另一种建议寻找参照校正在MSC都暗示了Windigetal。——所谓糊涂MSC[16]。这种办法发现平均频谱从msc修正数据集。接下来,MSC是多次重复更新参照光谱平均数据集纠正在每次迭代中环节。图10显示了成果糊涂MSC应用到果胶数据集——在这种状况下体现非常类似于呆头呆脑MSC单纯MSC。在呆头呆脑MSC,可以遵循增长模型记录信息,然后停止在收敛(两个迭代环节普通是足够)。叠加在图10变化参照光谱从原始光谱平均值。3.2原则正态变量(SNV)SNV预解决也许是第二个最散射校正应用办法NIR/NIT数据[13]。在本文中,规范化(也称为对象明智原则化)光谱将检查在同一种小节由于明显相似性两个原则。SNV基本格式和正常化修正与老式MSC:图9加权乘法散射校正,基于迭代重量决心。绿线显示了最后权向量(任意规模贡献)。(8)对于SNV,a0是平均值样品光谱需要修正同步,为原则化,a0设立等于零。对于SNV,a1是原则偏差样品光谱。图11演示了SNV校正果胶数据集。对于正常化,不同向量规范可以用于比例因子a1,最常用是总金额绝对值元素向量(都市街区或出租车规范)或平方根之和平方元素(欧几里得规范)。其她选项,有时也用正最大吸光度变量和正常化向着单一选定波长。这两个最后选项应当小心使用,由于她们可以有不良影响后续分析在例嘈杂数据。图12显示了效果。欧几里得正常化,迄今为止最惯用正常化,果胶数据集。这个信号校正背后概念SNV和原则化是相似MSC除了常用参照信号不是必须。相反,每个观测自己解决,孤立于剩余设立。缺少需要一种共同参照也许是一种实际优势。由于SNV和归一化不涉及一种最小二乘方拟合在她们参数预计,她们可以敏感嘈杂条目谱。相反,使用平均值和原则偏差作为校正参数,有人也许会考虑使用更健壮等价物这些记录时刻。郭etal。[17]建议使用中档或意味着内部四分位范畴和原则偏差内部四分位数预计为a0,a1,分别命名为“办法”健壮正常变量”。这将是特别适当状况下光谱很模糊(如。在超快在线近红外光谱应用程序,在强劲办法将会更受散射噪声(例如,波长选取性反射颗粒液体流)]。鲁棒预计影响她们演示郭etal。[17]对于模仿和实际数据。正如已经讨论了Dhanoaetal。[18],有一种明显相似性SNV和MSC。这种关系可以通过如下简朴近似提出:(9)其中:普通原则偏差光谱,大意味着在所有光谱,都发现了从原始/未修正光谱(参见图13)。图10呆头呆脑乘法散射校正与一种一阶参照校正。绿线显示了最后,差别开始参照光谱(任意规模贡献)。图11原则正态变量修正光谱图1SEQ图表\*ARABIC2欧几里得规范归一化光谱图1SEQ图表\*ARABIC3原则正态变量之间关系和乘法散射校正。蓝色和红色线条代表趋势线预计在图4。作为方程(9)表白,MSCandSNV相似到简朴旋转和抵消校正。对于本文中使用果胶数据,有关SNV预解决数据(图11)和基本MSC修正数据(图5)是0.9995后意味着中心。换句话说,MSC和SNV是相似对于大多数实际应用。导数光谱衍生品有能力清除两个添加剂和乘法效应在光谱和已经被用于分析光谱学了几十年。这个概念表白在无花果。14对于一种简朴高斯峰添加了基线和基线加上乘法效应。第一种衍生品只删除基线;二阶导数删除两个基线和线性趋势。在本文中,咱们将讨论两种不同办法:SG和西北。两个派生技术使用平滑为了不减少信噪比修正光谱太多。最基本办法,推导是有限差别:一阶导数是预计为区别两个后续光谱测量分;二阶导数是然后预计通过计算持续两个点之间区别一阶导数光谱:(10)(11)4.1诺里斯威廉姆斯推导西北推导是一种基本办法,以避免噪音通胀开发在有限差别。这种技术是在1983年提出诺里斯[19]和阐述了通过诺里斯和威廉姆斯在1984年[20]作为一种办法来计算导数近红外/NIT光谱。西北派生包括两个环节(见图15):平滑光谱,平均在一种给定点数量是执行:(12)其中,中点数平滑窗口环绕电流测量点对于一阶求导,以区别两个平滑值与一种给定她们之间缺口大小(不不大于零);对二阶求导,采用两倍平滑值点我和平滑值在一种间隙距离两边:图1SEQ图表\*ARABIC4派生影响在添加剂(绿色)和添加剂加上乘法(红色)影响。蓝色光谱是光谱没有任何补偿,黑色虚线是零线。(13)可以看到从方程(13),实际推导模仿一种有限差分(方程(10)和(11))。通过应用一种平滑之前计算,通过引入一种缺口大小问题,减少信噪比减少。在文学、NW推导往往是紧随其后正常化修正光谱。诺里斯和威廉姆斯[20]提出了规范化光谱强度相称于在一种选定波长,但更复杂归一化办法可以使用。使用一种缺口很难捍卫在近红外光谱。这个概念经常使用一种缺口,如果有一种(固定)频率分量在数据,大小地方缺口将相应于两峰之间距离值信号。然而,在光谱学,有普通没有这样背景频率贡献。西北衍生作品由于高度co变异和平滑近红外光谱和不一定由于光谱推理(见图16)。一种有趣注旨在西北存在推导几种设立(组合差距和平滑窗口),给相似预计导数。再会。数,三分差距有五个平滑等于一种四点平滑与一种缺口大小三个;类似地,一种threepoint平滑有缺口七是同样sixpoint平滑与一种缺口大小三个。这可以推广到m点平滑与一种缺口大小k等于一种k1点平滑和一种缺口大小m。4.2Savitzky-Golay推导Savtizky和戈利(SG)[21]推广一种办法推导数值一种向量,涉及一种平滑一步。为了找到导数在中心点我,一种多项式拟合在一种对称窗口原始数据(参见图17)。当参数对于这个多项式计算,任何顺序导数这个函数可以很容易地发现分析,这个值随后被用作导数估算出这个中心点(参阅图。18)。这个操作是应用于所有分光谱顺序。点数目用来计算多项式(窗口大小)和限度拟合多项式都决定要做,。最高衍生物,可以拟定取决于学位多项式拟合过程中使用(即一种三阶多项式可用于预计三阶导数)。图1SEQ图表\*ARABIC5预计一阶导数,诺里斯威廉姆斯。支持率窗口用于平滑,和一种缺口大小3应用于派生。咱们注意到有一种内在冗余层次构造SG推导。对于每个派生,随后两多项式适合将给相似预计系数。第一导数,一种一级多项式和二级多项式将给出同样答案(如将第三和第四度)。对二阶导数,第二和第三级别多项式将给出同样答案(如将第四和第五度),等。当这个办法是一方面引入了Savitzky和戈利[21],它依然是计算繁琐计算参数估算导数。出于这个因素,作者报道一组表列值几种不同类型衍生品和多项式组合。然而,错误在她们第一篇文章简介了,Steinieretal。[22]刊登一种修正和扩展版本原始表。这些餐桌是日后甚至进一步扩大,发狂[23]。然而,随着当代计算机,不再有任何真正需要为这些表。原始形式NW,SG推导使用对称窗口平滑,规定数据点数量在每一边中心点是相似。因而,忽视某些点技术在每一端在预解决。为NW推导,点数目失去了数等于分用于平滑加上差距大小减去一种。对于SG推导,点数目失去了数等于分用于平滑减一。因而吸取更多点NW推导比SG推导。如果谱向量是长(即超过500点),这个问题不重要,但是,对于较短光谱(例如,二极管阵列仪器),这个损失波长也许是重要。每天p和舍伍德在1980年[24]和[25]天呀在1990年提出一种解决方案,涉及使用一种基于非对称多项式拟合终端窗口。在实践中,这意味着米第一种得分谱预计从2m+1第一分光谱,和一种类似预计去年米点。然而,这样解决方案将简介,显然工件精度衍生品随距离中心点(m+1)。此外,预计端点并不拥有内在冗余提到:没有两个后续SG多项式秩序配件将给相似预计。此外,预计潜孔导数相等所有端点如果谱是平滑潜孔秩序多项式。NW推导类似于有限差别,但引入了平滑和缺口大小为counteractions在预计衍生物光谱保持信号-噪音比例。这两个环节在NW派生或多或少是独立。然而,SG推导使用更多常用过滤技术来估算导数光谱,而不是使用有限差分办法,适合一种多项式通过一系列点来维持一种可接受信噪比。普通来说,NW,SG派生不给相似预计。唯一一双设立,让相似成果是三个平滑分两,SG使用一阶多项式配合,在西北气隙大小等于1。然而,更复杂(和现实)设立为SG和/或NW自动导致(稍微)不同推导成果。图1SEQ图表\*ARABIC6诺里斯威廉姆斯二阶导数使用9点平滑和一种缺口大小3。间隔和联合版本提到预解决技术迄今为止,只有预计衍生品是由一种移动窗操作,只有一种本地某些(窗口)光谱用于任何时间预计校正。然而,所有其她办法同样可以在一种窗口明智方式执行。伊萨克松和科瓦尔斯基[26]建议这详尽分析,并将其命名为分段MSC(PMSC)。Andersson[27]预解决办法相比代替两个版本PMSC:移动窗或本地预解决(划提成几某些波长轴和执行预解决在每一种某些分别)。这个移动窗版本预解决技术获得了某些利益,从近红外光谱社区,也许是由于对的选取窗口大小是至关重要,它是远离琐碎要对的做到这点。过小窗口会导致引进大型工件在纠正光谱和减少信噪比。然而,更大窗口大小,较小完整和移动窗之间区别预处图1SEQ图表\*ARABIC7预计,Savitzky-Golay一阶导数。支持率窗户,一种二阶多项式是用来平滑理(见图19)。本地窗口预解决是有用,特别是在记录状况下测量光谱从视觉范畴或短波近红外光谱中期红外范畴。在这个宽光谱区,几种不同散射问题并存,和光谱应当相应分割,执行单独散射纠正在不同某些。然而,由于这不是本质上不同于在区域划分光谱预解决办法,应用独立,咱们不讨论它进一步。使用预解决办法组合是丰富文学,原则上,任何序列预解决是也许。然而,如下简朴规则可以作为最初指引方针。散射校正(除了原则化)应当被执行之前,分化。这些技术都是设计用于修正原始光谱,从未被以为是修正一种分化或基线纠正谱。可以使用规范化两端校正,尽管它是容易评估正常化影响如果是任何其他操作之前执行。SNV之间基本差别与随后消除趋势和MSC与参照和基线校正是,在MSC,同步应用两个修正,而不是持续。因而,普通会给一种较小MSC基线校正比SNV加德趋势。另一方面是SNV执行de趋势并不推荐Barnesetal。[13],基于以上因素,不推荐进行消除趋势第一。一种定量例子图1SEQ图表\*ARABIC8Savitzky-Golay预计二阶导数使用9分和一种二阶多项式平滑。当前咱们将应用所有预解决办法讨论到一种定量分光任务涉及32杏仁蛋白软糖样品测量六非常不同光谱分析仪作为预测变量两种不同响应变量:水分和糖含量。这些数据来自一项由克里斯腾森etal。[3]。图20显示了一种,光谱集。对于一种总结数据,见表1。在这里,咱们展示了pls回归模型,建立所有六个近红外光谱仪器,和响应分别(所谓PLS1模型[5])。杏仁糖近红外光谱数据集是不同预解决技术解决本文中描述。除了设立用于理论某些,某些更极端参数设立进行估算,以显示分段MSC使用合理选取重要性。没有样本被当作是例外,由于所有样本体现不错在最初摸索性分析。引导错误预计[28]被用作验证办法。共有1000引导图纸进行每种组合数据集、引用和预解决。同一套图纸是用于所有数据集,除了仪器1,只有十五32样品进行了测量。0.632引导预计预测误差进行了计算见方程(14),按照Wehrensetal。[28](14)其中预测误差预计并且和普通校准(样本每一种引导得出选取)和预测(不是每一种样本选取引导画)错误在所有引导图纸。最优数量因素,f,是决定基于0.632引导预计,选取第一种最低或地方RMSEf曲线作为函数因素变得平缓(RMSEf曲线斜率是常数)。

图1SEQ图表\*ARABIC9移动窗口原则正态变量使用129nm移动窗口(65测量分)。通过应用所有预解决技术相似样本集记录六个不同工具和/或光学测量几何图形(分散,干涉仪,反射、透射和光纤探针)使用两个不同响应(水分和糖),某些普通性性能差别是显示(见Tables2和3)。作为一种非常一方面观测,它是安慰,几乎所有预解决模型是简朴或更简约(例如,使用更少请因素)比全球模型、独立光谱仪建立和独立响应变量。第二个普通观测,过滤器仪器1在反射模式不是竞争在测量杏仁糖样品(RMSEmoisture=0.75、4潜变量(lv)和RMSEsugar=2.30,3lv;但咱们需要记住,只有1532样品测量)和预解决没有协助,让它回落到其他乐器水平。过滤器工具并不是真正兼容光谱派生技术,但其她预解决技术也未能达到预期性能。第三个普通评论可以在全息信息内容近红外光谱,在这种信息(泛音)会重复浮现多次。小光谱范畴850-1050海里(覆盖着仪器6),它包括第二泛音o-h和nh伸展和第三泛音从完全竞争延伸与更精密仪器覆盖完整或老式近红外光谱区域。此外,很有趣一点是,创立模型从光谱从传播基本仪器6普通是最简朴,甚至在预解决。显然,从密度波动散射测量样品传播方式不太苛求比反射散射测量反射模式。当谈到预解决,这是令人惊讶,与所有其她乐器,欧几里得规范工作得非常好,提供了最佳成果对仪表6(RMSEmoisture=0.38,3lv,RMSEsugar=1.39,5lv)。因素也许是,这小NIR区域包括所有氢键覆盖从示例和一种规范化办法从而相应于整合所有质子信号并设立质子密度样本之间平等。除了原则化办法,这似乎是一种较好预解决,衍生品方略对于这种类型数据,由于她们可以始终简化模型,特别明显对于糖预测。图表SEQ图表\*ARABIC2032杏仁蛋白软糖样品测量仪器2,在间隔1100-2500海里。对于剩余全地区近红外光谱仪器2-5,咱们发现某些有趣和强大差别取决于响应变量,大概是由于含水率是一种低辨别率光谱任务而糖含量是一种高辨别率问题。对于水分模型、色散仪器2和3几乎总是比模型基于傅里叶变换工具4和5。最佳整体模型为工具PSNVwindow-width发现2129预解决(RMSE=0.30、4lv)和最佳傅里叶变换模型是发现对仪表5用光纤运用MSC和secondorder参照校正(RMSE=0.37,5lv)。当添加一种光纤探针仪器2(=仪器3),模型复杂性增长(平均3lv)。这个大差别可以分派到更复杂光学几何后期系统。此外,性能没有预解决是相似(RMSE=0.42),但预解决性能仪器3是劣质(RMSE=0.37,10个lv使用SNV和MSC)最佳模型仪器2。对于糖模型,状况几乎是逆转。在这里,干涉仪基本仪器4显示始终最佳模型,但更复杂,大概是由于更好光谱辨别率仪器。最佳整体模型对仪表与MSC1st发现4订单ref,二阶波浪预解决(RMSE=0.92,9lv),远比最佳色散成果(RMSE=1.30、4lv对仪表2)但也复杂得多。再一次,对于糖模型,添加一种光纤探针仪器2(=仪器3)使得模型劣质和复杂得多(平均两个lv和增长最佳两个模型之间RMSE从1.22到1.81对于仪器仪表23)。这个移动窗版本SNV和MSC显示不同成果。普通来说,移动窗版本给成果类似于或比最佳剩余预解决办法。然而,顶多10%RMSE是比最佳正常预解决技术,但窗口选取也许很容易成为一种核心参数。相比之下,某些次优移动窗办法都包括在最后三行表2和3。差别有限差分办法,推导和更复杂办法是不明显预计第一导数某些测量(仪器2、3和6)。这很适合这些系统平稳行为,表白额外平滑是没有必要。这个干涉仪(仪器4和5)有一种更好光谱辨别率,给上升到一种更高限度精细构造,导致低信噪比在预计一阶导数有限差分法。这最后导致劣质模型。成果,使用有限差分第二衍生品普通是,她们都不如更复杂办法。这表白在信噪比7.总结显然,咱们定量例子并不能给出权威回答,例如哪些预解决使用在何种给定状况下。然而,它的确使用原则化在短波近红外透射光谱是明智和运用MSC(一阶参照校正)或原则SNV对于大多数其她某些状况。虽然很难找到最佳预解决,这确是可以使用错误预解决。这重要是由于不对的参数设立窗口大小和/或平滑函数预计衍生品和移动窗技术。最后,咱们强调任何预解决只是对模型进行一定量改进,全局建模大概25%在咱们研究中。25%降价,而也许是重要工业应用[29],这是几乎没有什么使区别在许多多元可行性研究蓬勃发展,在科学文献中,咱们可以推荐选取预解决,以实现最佳,最具备阐明模型。参照文献[1]S.Wold,K.Esbensen,P.Geladi,Chemom.Intell.Lab.Syst.2(1987)37.[2]S.B.Engelsen,E.Mikkelsen,L.Munck,Progr.ColloidPolym.Sci.108(1998)166.[3]J.Christensen,L.Nørgaard,H.Heimdal,J.G.Pedersen,S.B.Engelsen,J.NearInfraredSpectrosc.12()63.[4]S.Wold,H.Martens,H.Wold,Lect.NotesMath.973(1983)286.[5]H.Martens,T.Næs,MultivariateCalibration,Wiley,NewYork,USA,1989.[6]H.Martens,S.A.Jensen,P.Geladi,Multivariatelinearitytransformationsfornearinfraredreflectancespectroscopy,in:O.H.J.Christie(Editor),Proc.NordicSymp.AppliedStatistics,StokklandForlag,Stavanger,Norway,1983,pp.205–234.[7]P.Geladi,D.MacDougal,H.Martens,Appl.Spectrosc.39(1985)491.[8]H.Martens,E.Stark,J.Pharm.Biomed.Anal.9(1991)625.[9]D.K.Pedersen,H.Martens,J.P.Nielsen,S.B.Engelsen,Appl.Spectrosc.56()1206–1214.[10]H.Martens,J.P.Nielsen,S.B.Engelsen,Anal.Chem.75()394.[11]M.Decker,P.V

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论