P40914104_自动化 (2) 2_第1页
P40914104_自动化 (2) 2_第2页
P40914104_自动化 (2) 2_第3页
P40914104_自动化 (2) 2_第4页
P40914104_自动化 (2) 2_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 安徽大学本科毕业论文(设计、创作)题目: 多重红外光谱的基线校正 学生姓名: 学号: P40914104 院(系): 电气工程与自动化学院 专业: 自动化 入学时间: 2009 年 09 月导师姓名: 职称/学位:副教授/博士 导师所在单位:安徽大学电气工程与自动化学院 论文完成时间: 2013 年 6 月多重红外光谱的基线校正 摘 要红外光谱分析技术是指利用红外谱区包含的物质信息,主要用于有机物质定性和定量分析的一种分析技术。基线校正是光谱数据处理中一个不可或缺的重要步骤,本文介绍了红外光谱基本概念及发展概况,并给出了几种常用的基线校正方法。本文中,在不对称最小二乘法的基础上,采用了多重光

2、谱基线校正算法。 通过多重光谱之间的相似性,迭代的求解,得到最终基线。该算法速度快,可以同时输出多个基线。模拟数据和真实数据的实验结果表明该算法在保持峰位和峰形不变的同时,有效地消除了谱图的基线,具有较好的效果。关键词:多重红外光谱;基线校正;基线漂移;偏最小二乘法The Baseline Correction of Infrared Spectroscopy AbstractInfrared spectroscopy analysis technology is mainly used in the quality and quantity analysis of organisms by

3、the material information in the infrared spectroscopy area. Baseline correction is an indispensable procedure in the data processing of spectroscopy .this paper introduces the basic concept and development of infrared spectroscopy ,and provides several baseline correction methods. In this paper, bas

4、ed on asymmetric least squares smoothing, a new algorithm for multiple spectra baseline correction is useed. By means of the similarity among the multiple spectra, the algorithm estimates the baselines by penalizing the differences in the baseline corrected signals, which makes the algorithm possibl

5、e to eliminate scatter effects on the spectra. In addition, a relaxation factor which measures the similarity of the baseline corrected spectra is incorporated into the optimization model and an alternate iteration strategy is used to solve the optimization problem. The proposed algorithm is fast an

6、d can output multiple baselines simultaneously. Experimental results on both simulated data and real data demonstrate the effectiveness and efficiency of the algorithm. Keywords: infrared spectroscopy;baseline correction;baseline drift;asymmetric least squares 目 录1绪论11.1红外光谱的产生和红外光谱区间的划分11.2红外光谱技术的进

7、展21.3基线校正的意义32算法原理32.1非对称最小二乘算法32.2 改进的非对称最小二乘算法33试验结果及分析64结论10主要参考文献11致谢121 绪论1.1 红外光谱的产生和红外光谱区间的划分红外光谱(infrared spectroscopy,IR)是研究分子运动的吸收光谱,也称为分子光谱。通常红外光谱是指波长在22.5的吸收光谱,这段波长范围反映出分子中原子间振和变角运动。分子在振动运动的同时还存在转动运动,虽然转动运动所涉及的能量变化比较小,处在远红外区,但转动运动影响到振动运动产生偶极矩的变化因而在红外光谱区实际所测得的谱图是分子的振动与转动运动的加合表现,因而红外光谱又称分子

8、转动光谱。由于每一种分子中各个原子之间的振动形式十分复杂,即使是简单的化合物,其红外光谱也是复杂而有其特征的,因此可以通过分析化合物的红外光谱图获得许多反映分子所带官能团的信息,用于鉴定化合物的分子结构。采用傅里叶变换红外(Fourier transform infrared,FTIR)光谱仪测定样品的红外光谱时,使用的红外光源是连续波长的光源。连续波长光源照射红外样品后,样品中的分子会吸收某些波长的光。没有被吸收的光打到检测器,即可以得到样品的单光束光谱。为了得到样品的红外光谱,需要从样品的单光束光谱中扣除掉背景的单光束光谱,也就是需要测试红外光不经过样品的情况下得到的背景单光束光谱。这样得

9、到的背景单光束光谱中包含了仪器内部各种零部件和空气的信息,在测试样品的单光束光谱和测试背景的单光束光谱时,这些信息是完全相同的。所以,从样品的单光束光谱中扣除掉背景的单光束光谱后就得到样品的红外透射光谱。在红外光谱中,在被吸收的光的波长或波数位置会出现吸收峰。某一波长的光被吸收得越多,透射率就越低,吸收峰就越强。当样品分子吸收很多种波长的光时,在测得的红外光谱中就会出现许多吸收峰。红外透射光谱的纵坐标有两种表示方法,即透射率T(%,Transmittance)和吸收度A(Absorbance)。纵坐标采用透射率T的光谱称为透射率光谱,纵坐标采用吸光度A表示的光谱称为吸光度光谱。某一波长(或波数

10、)光的透射率是红外光透过样品后的光强和红外光透过背景(通常是空光路)的光强的比值。通常采用透射率(T)表示。 (1.1) 某一波长(或波数)光的吸收强度及吸光度是透射率倒数的对数 (1.2)透射率光谱和吸光度光谱之间可以相互转换。透射率光谱虽然能直观地看出样品对不同波长红外光的吸收情况,但是透射率光谱的透射率与样品的质量不成正比关系,即透射率光谱不能用于红外光谱的定量分析。而吸收度光谱的吸光度值A在一定范围内与样品的厚度和样品的浓度成正比关系,即吸光度光谱能用于红外光谱的定量分析,所以现在的红外光谱图大都采用吸光度光谱表示。光谱图的横坐标通常采用波数()表示,也可以采用波长()或(nm)表示。

11、 1=1000nm 1cm=10000波长和波数的关系为 波长(m)波数()=10000红外光谱工作者通常将红外光谱区间划分为三个区域,即近红外区、中红外区和远红外区。测试这三个区间的红外光谱所用的红外仪器或仪器内部的配置是不相同的,这三个区间所获得的光谱信息也不相同。表1-1列出了这三个红外区所对应的的波长和波数。表1-1:红外区所对应的的波长和波数区间 波长/m波数/近红外区0.782.5128004000中红外区2.5254000400远红外区25100040010这三个红外区之间的划分没有非常严格的界线。近红外区出现的是倍频峰和合频峰,但倍频峰和合频峰也会在中红外区出现。中红外区出现的

12、振动频率主要是基频频率和指纹频率。气体分子的转动光谱、氧化物的光谱主要出现在远红外区和中红外区的低频区。1.2 红外光谱技术的进展红外光谱由于必须制样测定,不论是固体压片还是液膜法都很难保证每一次测量的光程一致,定量测定会带来误差。另外制样过程中可能沾染上杂质,使测量谱图中出现杂质峰。混合物进行红外光谱测量时,普遍存在谱峰重叠现象。原位(在线)研究困难,只能在少数研究中应用。因此要求红外技术进一步发展,漫反射傅里叶变换红外光谱技术和衰减全反射傅里叶变换红外光谱等技术应运而生。1.2.1 漫反射傅里叶变换红外光谱技术(DRS)当光照射到疏松的固体样品表面,一部分光发生镜面反射;另一部分光在样品表

13、面发生漫反射,或在样品微粒间辗转反射并衰减,或射入样品内部再折回散射,入射光经过漫反射和散射后与样品发生了能量交换,光强发生吸收衰减,记录衰减信号,即得到漫反射红外光谱。与透射傅里叶变换红外光谱技术相比,漫反射傅里叶变换红外光谱技术具有以下优点:不需要制样、不改变样品形状,不污染样品,不要求样品有足够的透明度或表明光洁度,也不破坏样品,不对样品的外观和性能造成损害,可以进行无损测定。例如,可对珠宝、钻石、纸币、邮票的真伪进行鉴定。漫反射红外光谱可以测定松散的粉末,因而可以避免由于压片造成的扩散影响,很适合散射和吸附性强的样品,目前在催化剂的研究中得到了广泛应用,可以进行催化剂表面物种的检测及反

14、应过程原位跟踪技术研究。1.3 基线校正的意义傅里叶变换红外光谱学是一种有效的定量和定性分析红外光谱的方法。但是,谱图采集过程中会受到背景温度,湿度等外界环境以及仪器自身工作状况的影响,在得到的光谱图中产生连续的、不同程度的基线漂移。这些基线妨碍红外光谱的正确意义,另外基线从一个频谱到另一个频谱差异很大,甚至是截然不同的曲线。在定量分析红外光谱时,这些不连续的基线会降低光谱的简易性和稳定性。因此,在光谱分析中为建立一个稳定、可靠的定性或定量分析模型进行基线校正是十分必要的。所谓基线校正,就是将吸光度光谱的基线人为地拉回到0基线上。基线校正有人工校正和自动校正两种。人工校正通过人机交互式方式选取

15、谱图上的特征点,然后将这些特征点拟合成一条曲线。但这种方法费时费力。且由于人工选择随意选较大,此方法适用性不高。2 算法原理2.1 非对称最小二乘算法非对称最小二乘算法优化目标如下: (2.1)其中, 为权重因子,为二阶差分算子,是正则化参数。上式中第一项表示拟合函数与原始数据的非对称拟合程度;第二项是为了保证拟合函数的光滑性,折中因子起到平衡非对称逼近程度和光滑性的作用。 最小化式(1),可以导出下面的方程系统: (2.2)式中,W是由向量w 组成的对角阵,即W=diag( w),D是z的二阶导数矩阵,即 求解得到估计基线: (2.3)式中权重系数根据非对称的方式选择,当时,=p,而时,一般

16、p 取很小的值,其取值范围为 0 .0010.1。 一般取很大的值,其范围为。由于优化目标是凸函数,迭代过程会很快收敛。实际求解中,一般5 到10 次迭代即可收敛。 2.2 改进的非对称最小二乘算法7Analytica Chimica ActaVolume 683, Issue 1, 17 December 2010, Pages 6368 Asymmetric least squares for multiple spectra baseline correction.作者: An Jianga,Jiping Weib,Penga ,SilongPenga,Changwen Lib,Jie

17、Tana. 这种多重红外光谱基线校正算法的目标是基线模拟与之相对应的光谱,然后在非对称最小二乘法得到的基线校正不利方面基础上进行重新调整。假定m光谱,是一个长度为n的列向量,是相应的基线。多重红外光谱校正以下k=1,m的问题:(2.4)D表示二阶微分矩阵,每一个是一个对角线矩阵,表示调整参数。(2.4)式等号右边第一项反映校正光谱间的成对偏差,第二项表示依据非对称方法对应的数据误差,最后一项是基线的平滑约束。当所有的调整矩阵都与式1中矩阵一致,最优化模型实际上是一种可以提取多重红外光谱趋势的Hodrick-Prescott过滤算法。当提供恒定的m值,最优化问题相当于下面的问题:(2.5)上面的

18、模型表明乘法散射校正中的某些必然联系。从式(2.5)等号右边第一项我们可以看到每一个校正光谱与平均校正光谱很接近,MSC根据平均光谱曲线校正每一条光谱。这种算法可以同时校正分散效果和消除基线。定义式(2.4)中目标调整函数为: (2.6) 为求得的最小值,将对求导,得: (2.7)令,得: (2.8)定义,目标函数(2.5)可变换为: (2.9)将对求导可得: (2.10) 令 ,即得: (2.11) ,k=1,.,m 这种算法潜在假设模型1,2基线校正范围近似相同。然而,当该假设依于校正曲线中松弛因子,就会被推翻,因此将模型2扩展为下面形式: 是松弛因子,反映相应的校正光谱与平均校正光谱的相

19、似度。与式(2.5)不同,每一个校正光谱需要在规则因子的意条件下与平均校正光谱接近。定义,式(2.5)的解为: (2.12)E是n维矩阵,给定初始因子=0,权重系数=E,原始基线,多重光谱的第一条基线可以根据式(2.6)建立,之后权重系数重新定义为: ( 2.13) 该算法对实验中通常设置为恒定的光谱不敏感,在选择相应的频谱时应该选择最小的恒定值。权重参数p用于控制基线的位置,主要涉及到的光谱的质量。当噪音很低时,p可以选择为一个很小的值。在大噪声的情况下,应选择在没有信号时使基线处于噪音带的中间区域。校正参数可以简单的设定为u的值,它比的值大很多。参数对大值的选择会削弱的相似性约束,该算法将

20、或多或少地降低非对称最小二乘法的误差。最终基线可以依据式(2.6)通过更新的基线和迭代式方法估计。算法1描述了上述多重光谱基线校正算法: 算法1:给定和光谱,k=1,.,m. 估计基线 1:初始化:j=0, 2: 根据式(2.6)计算: 3:根据式(2.7)计算对角线矩阵 4:计算松弛因子: 5:令j=j+1,重复计算第二步直到收敛3 试验结果及分析运用matlab仿真软件,在有已知两条基线的情况下检验上述多重红外光谱基线校正算法是否正确。假设原始光谱有8个不同宽度的高斯峰,图1表示两条合成基线叠加到原始光谱以降低基线漂移的影响。图中仿真基线由不同的线性函数和二次函数组合而成。令参数,p=0,

21、依据算法1可得到两条校正基线。图2(a)给出了校正后的基线和原始基线的比较,有图可看出,二者之间的区别微乎其微,近似重合。图2(b)表明对应于两条校正基线的松弛因子。两个因子随着迭代次数的增加趋向于1,这就意味着在基线校正以后,两条光谱相互接近。 图1:合成基线叠加到原始光谱 图2(a)校正前后基线比较图 图2(b)两校正基线松弛因子图图2:基线校正前后对比图 变换参数值,用相同方法得到的不同光谱的基线校正如图3,图4。由图可知,不同频段的光谱都可以得到较好的校正效果。 图3:时合成基线叠加到原始光谱 图4:时校正基线图 图5:时合成基线叠加到原始光谱 图6:时基线校正图4 结论红外光谱技术在

22、短短10多年内,在众多领域得到广泛应用,进而在数据处理及仪器制造方面有及其迅速的发展,得益于其多方面的优势。比如可以用于样品的定性也可以得到准确度很高的定量结果;分析速度快、产出多;不破坏样品、不用试剂、不污染环境;投资少,操作技术低。当然每种技术都存在一定局限性,红外光谱技术也不例外,如分析时必须用相似的样品先建立一个稳健的模型才能快速得到分析结果,而模型需要投资一定人力财力和时间;物质一般在近红外的吸收系数系数比较小,因而有一定局限性。基线校正是光谱数据处理中一个不可或缺的重要步骤,要得到较高质量的红外光谱加以应用,就必须要进行基线校正,基线校正的方法也具有很多种,而对于论文中介绍的这种量学方法而言,具有高效性和准确性的优点。将各种方法联合使用,相互取长补短,将是今后发展的方向。主要参考文献:1陆婉珍.现代近红外光谱分析技术M.北京:中国石化出版社.20062邓芹英、刘岚、邓慧敏.波谱分析教程M.北京:科学出版社.20073严衍禄.近红外光谱分析基础与应用M.北京:中国轻工业出版社.20054陆婉珍、袁洪福、徐广通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论