遗传算法在近红外无创伤人体血糖浓度_第1页
遗传算法在近红外无创伤人体血糖浓度_第2页
遗传算法在近红外无创伤人体血糖浓度_第3页
遗传算法在近红外无创伤人体血糖浓度_第4页
遗传算法在近红外无创伤人体血糖浓度_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分析化学(FE NXI H UAX UE 研究报告第7期2002年7月Chinese Journal of Analytical Chemistry 779783第30卷遗传算法在近红外无创伤人体血糖浓度测量基础研究中的应用王宏李庆波刘则毅徐可欣12132(天津大学理学院数学系1, 精密测试技术及仪器国家重点实验室2, 天津300072摘要遗传算法(G A 应用在偏最小二乘法(P LS 校正模型的波长优化选择中具有显著的效果。将遗传算法作为模块循环运行, 能更快达到最优解, 有效提高测量精度, 减少建模所用波长数。本文将该方法应用于无创伤人体血糖浓度光学检测的基础研究中, 验证实验所用样品为:

2、葡萄糖水溶液; 包含牛血红蛋白和白蛋白的葡萄糖水溶液; 人血中的血浆(含葡萄糖 。结果表明:建模的波长个数可分别减少88%、86%、85%; 预测标准偏差(RMSEP 分别减少56%、64%、63%。这对无创伤人体血糖浓度光学检测理论的进一步研究具有指导意义。关键词近红外光谱, 无创伤, 人体血糖浓度, 遗传算法, 波长选择, 偏最小二乘1引言人体血糖浓度的无创伤检测方法可解除病人痛苦、实现血糖快速测量, 它对于改善现行用药方法, 精确控制血糖具有非常重要的现实意义。近红外光谱方法是实现无创伤检测的可行方法。近年来, 国外许多机构都在这一领域进行了不断的研究, 美国Ohio 大学G ary W

3、. Small 研究组、I owa 大学Mark A.1,2Arnold 研究组进行了大量血糖无创伤测量的基础性研究, 美国Futrex 公司、Bio 2control 公司、西德3,4Medscience 公司已进行了血糖无创测量的仪器开发, 日本三井金属、日立制作所和松下电器等公司也申报了大量专利。但在国内, 还未见到有关血糖浓度无创伤检测方面的研究报道。由于人体中血液成分复杂、各成分近红外光谱的谱带严重重叠及光信号微弱等诸多原因, 至今还没有任何公司或研究机构获得无创伤血糖浓度测量的成功。血糖无创伤检测一方面与仪器的精度有关, 另一方面与选用的波长及其数量密切相关。本文从无创伤血糖浓度测

4、量的基础研究入手, 尝试用遗传算法对建模波长进行优化选择, 提高血糖浓度的测量精度, 并探讨这种优化选择方法的适用范围。2基本原理目前偏最小二乘法(P LS 是最常用的光谱数据量化分析方法之一。P LS 能克服光谱数据间的共线, 对用于建模的波长数没有限制, 为了不丢失光谱的信息,P LS 甚至可用全部光谱数据建模。然而, 实验中发现, 用信噪比(S NR 高的波段比用信噪比低的波段建立P LS 校正模型的预测能力明显增强。为此提出了建立校正模型之前应该进行波长选择的问题。迄今为止, 已有许多方法用在波长选择上,9其中遗传算法以其全优、易实现的特点在其应用中作用明显。遗传算法是建立在自然选择和

5、进化概念基础上的一种非导数的随机优化方法, 将其应用在近红外光谱波长选择中的主要步骤为:(1 编码每个波长为一个基因, 对基因进行0-1二进制编码, 若基因编为1, 建模时包括此波长; 若为0, 不包括此波长。一种0-1编码组合称为一条染色体, 染色体长度为被编码的波长数。(2 选择初始群体假如初始群体包含N 个个体, 每一个体的染色体长度(波段的波长数 为m , 则初始群体的选择方法为随机产生N 个m 位的0-1二进制数作为初始群体。(3 适应值函数本文采用交互验证法5评价模型的预测能力。评价指标为预测标准偏差RMSEP , 如果RMSEP 值越小, 则校正模型的预测能力越好。为了使遗传算法

6、对适应值较高的个体有更多的生存。机会, 对评价指标变换得到适应值函数为:F =1+RMSEP2001209230收稿;2002201228接受本文系教育部科学技术研究重点项目685(4 复制复制的策略是以“轮盘赌”的方式进行正比选择。(5 交叉本文采用的交叉方式为普通单点交叉方式。(6 变异变异方式是以一定概率产生发生变异的基因数, 用随机方法选出发生变异的基因。如果所选的基因的编码为1, 则变为0; 反之编码为0, 则变为1。(5 、(6 最大繁殖代数停止。重复(4 、本文将研究这种方法用于无创伤血糖浓度检测基础研究时的有效性, 特别是当被测样品成分较复杂时的有效性。验证实验所用样品为葡萄糖

7、水溶液(简称二成分实验 ; 包含牛血红蛋白和白蛋白的葡萄糖水溶液(简称四成分实验 ; 人血中的血浆(含葡萄糖 (简称血浆实验 。这几种被测样品成分复杂性依次递增, 逐渐接近人体组织测量情况。3实验部分3. 1仪器与试剂采用美国Perkin 2Elmer 公司S pectrum G X 傅里叶变换红外光谱仪, 液态氮冷却的InSb 检测器, 光谱-1-1采集范围270015000cm , 扫描分辨率1cm ,1mm 石英样品池, 蠕动泵自动进样系统, 日本T BA30全自动生化分析仪。葡萄糖由天津化学试剂三厂, 牛红蛋白由上海丽珠东风生物技术有限公司提供, 牛白蛋白由T BD 生物技术发展中心提

8、供, 血浆由天津医院提供。3. 2实验步骤二成分实验样品的配置步骤:称取葡萄糖粉末, 放入100m L 容量瓶, 加去离子水至100m L , 制成葡萄糖标准水溶液样品; 四成分实验样品的配置步骤:分别称取葡萄糖、牛血红蛋白、白蛋白后放入100m L 的容量瓶, 加入生理盐水至100m L ; 血浆:在全血中加入肝素抗凝剂在离心机中经过1500转,10min 后分离出, 然后在血浆中加入葡萄糖, 用T BA30全自动生化分析仪和葡萄糖氧化酶法标定血糖值。3. 3样品制备二成分实验中有50个样品, 葡萄糖浓度范围为10500mg d L , 分布均匀, 浓度标准差为146. 1mg d L (除

9、奇异点第38样品 ; 四成分实验中有50个样品, 葡萄糖范围为10500mg d L , 分布均匀, 浓度标准差为146. 9mg d L (除奇异点第33样品 , 其中牛血红蛋白的浓度为01000mg d L , 牛血白蛋白的浓度范围为0360mg d L , 随机配比; 血浆实验中共有36个样品, 葡萄糖浓度范围为205. 2718. 2mg d L , 随机分布, 浓度标准差为140. 2mg d L 。本文采用交互验证法来评价模型的预测能力, 即将所有样品作为校正集的同时又作为验证集。3. 4光谱测量图1是二成分实验中葡萄糖浓度为100mg d L 、四成分实验中葡萄糖浓度为100mg

10、 d L , 血浆实验中葡萄糖浓度为543. 6mg d L ,3个样本的吸光度谱图都以空气为背景, 可以看出这3个谱图的形状相似, 而且前两个谱图的差别细微, 主要因为在样品中水的比例较大, 葡萄糖以及其它的成分含量较少 。图1吸光度谱图Fig. 1Abs orption spectraa. 范围(region 270010000cm -1;b. 范围(region 42004800cm -1。3. 5计算方法计算方法如第2部分所介绍, 其计算程序用Visual C +6. 0编写。4结果与讨论4. 1输入算法的光谱数据葡萄糖在4300、4400、4700cm 附近有3个吸收峰; 在3800

11、、5200cm 附近为水的强吸收峰,4500cm 附近水吸收较弱, 且随温度漂移较小, 由此可知波段42004800cm 的信噪比较高。本文用遗传-1-1-1-1算法在此波段间隔2cm 的波长进行选择。4. 2波长选择结果-1遗传算法的参数设定:初始群体100, 最大繁殖代数200, 交叉概率0. 5, 变异概率0. 005。表1、2、3列出了3个实验分别用遗传算法优选前的301个波长和用遗传算法第一、三次选择的波长建立P LS 校正模型(交互验证 的结果, 表中RMSEC 和RMSEP 分别用来评价模型的拟和能力和预测能力。结果表明:用遗传算法选波长后建立P LS 校正模型, 能使模型的预测

12、能力有很大提高。从表中看出,3个实验用遗传算法第一次优选后的波长建模所得RMSEP 值是用优选前建模RMSEP 值的54%、49%、47%, 所用波长数分别为125、136、142个, 约为整个波段波长数的12。可以看出遗传算法对波段进行波长选择后建模, 能使精度提高, 建模所用波长数减少。表1遗传算法选取前的校正和预测结果T able 1Calibration and predictive results before selecting wavelengths by the genetic alg orithms (G A 实验Experiment 波长数Number of wavelen

13、gths301301301RMSEC (mg d L 6. 1412. 4712. 92RMSEP (mg d L 8. 8628. 5930. 08二成分T w o com ponents 四成分F our com ponents 人血浆Human serumRMSEC :rootmean square error of calibration ; RMSEP :root mean square error of prediction表2遗传算法第一次选取后的校正和预测结果T able 2Calibration and predictive results after selecting w

14、avelengths by the first G A实验Experiment 波长数Number of wavelengths125136142RMSEC (mg d L 3. 567. 667. 4RMSEP (mg d L 4. 7814. 2314. 08二成分T w o com ponents 四成分F our com ponents 人血浆Human serum表3遗传算法第三次选取后的校正和预测结果T able 3Calibration and predictive results before selecting wavelengths by the third G A实验Ex

15、periment 波长数Number of wavelengths364245RMSEC (mg d L 3. 306. 146. 56RMSEP (mg d L 3. 9210. 4511. 23二成分T w o com ponents 四成分F our com ponents 人血浆Human serum把上述所选的波长作为遗传算法的被选波长, 继续选择, 结果得到的RMSEP 值优于第一次选择的RMSEP 值, 且波长个数又有所减少。让此选择循环进行下去, 直到选择的结果RMSEP 值不优于上一次, 结束计算。实验的结果见表3。3个实验中RMSEP 值分别减少到3. 92mg d L 、

16、10. 45mg d L 、11. 23mg d L , 与第一次选择的结果相比提高了10%、13%、10%; 所用的波长数分别为36、42、45个, 是第一次选择波长数的13。由此看出将遗传算法作为模块循环对波长进行优选, 能提高测量精度和减少所选波长的数目。从实验结果可以看出,3个实验RMSEP 值随着被测样品成分复杂性的增加亦增大, 所选的波长数亦增多。图2a 、b 、c 分别标出了所选波长在各自实验吸光度光谱上的位置, 可以看出3个实验所用的波长数 782分析化学第30卷图2被选波长在谱图上的位置Fig. 2P osition of the selected wavelengths o

17、n spectruma. 二成分实验(tw o com ponents experiment ; b :四成分实验(four com ponents experiment ; c :血浆实验(human serumexperiment 。不完全相同, 但所选用的波长数多集中在葡萄糖的3个吸收峰以及水吸收最低的区域附近, 与物理学期望一致。-1图3为分别用42004800cm 波段为进行优选的波长和遗传算法循环3次优选的波长建立P LS 校正模型的预测值和观测值之间的相关图, 可以看出用经过优选后的波长建模预测值和观测值相关性明显提高 。图3遗传算法优选波长前后预测值和观测值的相关图Fig. 3

18、C orrelations of the observed Y and the predicted Y before and after selecting wavelengths by G Aa1. 二成分实验优选波长前(before selecting wavelengths in tw o com ponents experiment ; b1. 二成分实验优选波长后(after selecting wavelengths in four com ponents experiment ; a2. 四成分实验优选波长前(before selectingwavelengths in four

19、 com ponents experiment ; b2. 四成分实验优选波长后(after selecting wavelengths in fourcom ponents experiment ; a3血浆实验优选波长前(before selecting wavelengths in human serum ; b3. 血浆实验优选波长后(after selecting wavelengths in human serum 。由于遗传算法为一种非导数的随机优化算法, 其中群体的选择、交叉、变异都带有很强的随机性, 所以每一次选择的波数组合不会完全相同, 其RMSEP 也有所不同, 但所选波

20、长的位置大体相同, 其结果相差很小。第7期王宏等:遗传算法在近红外无创伤人体血糖浓度测量基础研究中的应用7835结论遗传算法在组合优化问题上具有很大的搜索优势, 适应性很广。本文主要研究了在近红外无创伤人体血糖浓度检测基础实验中遗传算法作为模块进行循环优选波长的可行性。在三个被测样品成分渐进复杂的实验中用此方法优选波长, 结果表明:遗传算法优选的波长与样品中被测成分有关, 即使样品复杂程度发生变化这种有效性不变, 且葡萄糖浓度的预测精度随着被测样品成分复杂性的增加也有所降低。因此, 它可作为一种提高无创性人体血糖浓度检测精度的可行性方法应用在更复杂的研究中。R eferences1K evin

21、 H. Hazen , Mark A. Arnold , G ary W. Small. Appplied Spectroscopy , 1994, 48:4774832Shengtian Pan , H oeil Chung , Mark A. Arnold. Anal . Chem . , 1996, 68(7 :112411343R orbert D. R osenthal. US . Patent , 5028787, 19914Russell H. Barnes. US . Patent , 5070874, 19915Xu Lu (许禄 . Chemometrics Methods

22、 (化学计量学方法 . Beijing (北京 :SciencesPress (科学出版社 , 19976K alivas J H , R oberts N , Sutter J M. Anal . Chem . , 1989, 61:202420307Jouan 2Rimbaud D , Massart D , Leardi R , N oord O D. Anal . Chem . , 1995, 67:429543018Bangalore A S , Shaffer R E , S wall G W. Anal . Chem . , 1996, 68:420042129X ing Wen

23、xun (邢文训 , X ie Jinxing (谢金星 . Modern Algorithm for Optimization (现代优化计算方法 . Beijing (北京 :Publishing H ouse of Qinghua University (清华大学出版社 , 1999:140191Application of G enetic Algorithms in Fundamental Study ofN on 2invasive Measurement of H uman B lood G lucoseConcentration with N ear I nfrared Spe

24、ctroscopyWang H ong , Li Qingbo , Liu Z eyi , Xu K exin212132(Department o f Mathematics o f the Science 1, National K ey Laboratory o f Precision Measuring &Testing Techniques and Instruments , Tianjin Univer sity , Tianjin 300072Abstract G enetic alg orithms is an effective method in wavelengt

25、h selection applied in building multivariate calibration m odel based on partial least squares regression. I f genetic alg orithm is run repeatedly as a block , the optimal s olution is obtained faster , the numbers of wavelengths used to build calibration m odel is further reduced , the prediction precision is further im proved. T

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论