薏仁种类的近红外光谱技术快速鉴别_第1页
薏仁种类的近红外光谱技术快速鉴别_第2页
薏仁种类的近红外光谱技术快速鉴别_第3页
薏仁种类的近红外光谱技术快速鉴别_第4页
薏仁种类的近红外光谱技术快速鉴别_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第卷,第期光谱学与光谱分析年月Spectroscopy and Spectral Analysis Vol 畅,No 畅,pp May ,薏仁种类的近红外光谱技术快速鉴别刘星,毛丹卓,王正武倡,杨永健畅上海交通大学农业与生物学院食品科学与工程系,上海畅上海市食品药品检验所,上海摘要薏仁是一种药食两用资源,对其品质快速鉴别的需求也越来越多,近红外光谱技术(near infrared spectroscopy ,NIRS )作为一种快速、无损且环保的方法正适合这一需求。以不同产地和品种薏仁的近红外光谱为基础,结合化学计量学方法对薏仁种类进行鉴别。对原光谱用无监督学习算法主成分分析(p rincip

2、al component analysis ,PCA )和有监督学习算法学习向量量化(learning vector quantization ,LVQ )神经网络、支持向量机(support vector machine ,SVM )进行定性判别分析。由于不同地区和不同品种的薏仁营养物质组成复杂且含量相近,所选两类薏仁的特征变量很相似,因而PCA 得分图重叠严重,很难区分;而LVQ 神经网络和SVM 都能得到满意结果,LVQ 神经网络的预测正确率为畅,SVM 在经过惩罚参数和核函数参数优选后,分类准确率能达到。结果表明:近红外光谱技术结合化学计量学方法可作为一种快速、无损、可靠的方法用于薏仁

3、种类的鉴别,并为市场规范提供技术参考。关键词薏仁;近红外光谱;支持向量机;学习向量量化神经网络;定性判别中图分类号:O 畅文献标识码:A DOI :畅j 畅issn 畅()学计量学方法开展了这方面的研究,以期为薏仁市场的规范提供技术参考。由于近红外光谱含有的大量数据信息是来源于分子振动的倍频与合频,很难从光谱图中直接得出物质组成信息,必须依靠化学计量学方法。本研究采用了主成分分析、支持向量机,和学习向量量化神经网络三种方法分别进行薏仁品种的定性判别分析,取得了满意的结果。引言薏苡(Coix lachryma j obi L 畅var 畅ma y uen Stapf )为一年或多年生的草本植物,

4、主产于亚洲国家,如中国、泰国、缅甸、韩国、日本等,在我国福建、贵州、辽宁、河北、江苏等省都有广泛种植。其干燥成熟种仁称为薏仁,性甘、微寒、无毒。薏仁所含油脂和蛋白质都高于一般的谷物,且油脂含有抗肿瘤、免疫调节等多种药理作用的成分,蛋白质中含有其他谷物缺少的赖氨酸、蛋氨酸等实验部分1畅1仪器与试剂ASE 加速溶剂萃取仪(美国ThermoFisher 公司);,因此被誉为“世界禾本科植物之王”,在欧洲也被称为“生命健康之友”,被广泛用作药食两用资源。薏仁所含营养价值会因不同品种而有差异,最直观的品种差异即颗粒的大小,其市场价格也有悬殊,一般小薏仁的市场价格高于大薏仁。现在人们对饮食健康的追求超过以

5、往任何时代,对于薏仁的食用量也在逐年增加,出现各种的薏仁产品,如薏仁粉等产品。由于薏仁形态的改变,人们很难通过肉眼辨识薏仁品种,一些投机商家则乘机以大充小来获取更多的利润,而目前国内外对于大小薏仁的鉴别研究还处于空白,本工作借助近年来兴起的近红外光谱技术,结合化收稿日期:,修订日期:L 氨基酸分析仪(日本日立公司);Kjeltec 自动凯氏定氮仪(丹麦FOSS 公司);M PA 傅里叶变换近红外光谱仪(德国Bruker 公司),InGaAs 检测器,使用积分球模式采样系统和样品旋转器采样附件,采用OPUS 畅光谱分析软件,Matlab R a (Mathwork Inc 畅)为数据处理软件。丙

6、酮(分析纯,上海凌峰化学试剂有限公司),凯氏定氮催化剂(FOSS 公司),氨基酸标准溶液(日本日立公司);硫酸,盐酸,硼酸,甲基红,亚甲基蓝,乙醇,浓盐酸,苯酚,基金项目:国家自然科学基金项目(,)和科技部农业科技成果转化资金项目(GB C )资助作者简介:刘星,女,年生,上海交通大学农业与生物学院博士研究生e mail :liuxinglyg 畅com倡通讯联系人e mail :zhengw uw ang sjtu 畅edu 畅cn态改变后很难区分。Table 1Content of crude fat ,p rotein andamino acid in coix seed营养成分粗脂肪蛋

7、白质(g (g )赖氨酸(mg g 蛋氨酸(mg g 苏氨酸(mg g 茚三酮等均购于国药集团化学试剂有限公司,分析纯。1畅2方法畅畅样品采集所用样品个,其中包括个大颗粒薏仁品种和个小颗粒品种,这些样品分别采自贵州、福建、辽宁、山东、江苏、河北、云南、湖南、湖北、广西、四川、山西、陕西、浙江、安徽、宁夏、吉林、黑龙江个省和自治区,和泰国、缅甸。使用中药粉碎机粉碎样品并全部通过目标准筛。畅畅粗脂肪、蛋白质和氨基酸测定选取同一产地的一对大小薏仁,利用快速溶剂萃取仪提取粗脂肪,溶剂为丙酮,萃取条件为温度,时间小薏仁畅畅畅)畅畅畅)畅)大薏仁畅畅畅畅畅畅畅苯丙氨酸(mg g异亮氨酸(mg gmin 用

8、凯氏定氮仪来测蛋白质,循环次。按GB ;畅按枟GB T 食品中蛋白质的测定畅枟食品中枠,氨基酸的测定枠,用氨基酸分析仪来测必需氨基酸。畅畅近红外光谱采集近红外光谱采用漫反射检测系统,光谱扫描波数范围cm ,扫描次数次,光谱分辨率cm ,以内置背景为参照,扫描数据以吸光度形式存储。每个样品平行实验次,取其平均光谱作为最终样品光谱。整个实验过程保持室内温度约。畅畅近红外定性判别分析模型的建立用经典的无监督学习算法PCA 将样品分类;从个样品中用Kennard Stone (KS )法选取的样品作为训练集,作为校正集,由于常用的平滑、求导、多元散射校正等预处理方法没有很好的改善模型的效果,因此为了使

9、所建模型更具有通用性SVM 和LVQ 神经网络法来建立定性分析模型,在全波段范围内用有监督学习算法。结果与讨论2畅1粗脂肪、蛋白质和氨基酸的含量按照畅畅方法得到的粗脂肪、蛋白质、氨基酸(包括必需氨基酸和半必需氨基酸)的含量如表所示,由于色氨酸(T rp )在样品处理过程中被破坏,所以未能测得。由表可以看出,同一产地的大颗粒薏仁粗脂肪和蛋氨酸含量多于小薏仁,但蛋白质、其他必需氨基酸和半必需氨基酸含量均少于小薏仁,这些都证明了小薏仁的营养价值在一定程度上高于大薏仁,也是小薏仁价格高于大薏仁的主要原因。2畅2变量转化为少数综合变量PCA PCA 的主要目的是对数据进行降维处理无监督模式分类,且这些变

10、量能表征原变量信息。它是将多个,即综合变量保留原有变量的绝大部分信息且变量个数大大减少。综合变量又称为得分,相互正交,。PCA 得分图一定程度上能够反映数据集的分类。原光谱图和PCA 得分图分别见图和,得分图是利用PC 和PC 绘制的样品分类图。从图可以看出样品谱图相似,很难直接区分不同的薏仁品种。由图可以看出PCA 分类效果不好,两类样本之间重叠。说明该无监督学习法用来分类大小薏仁不可行。这也在很大程度上证明了两类薏仁物质组成复杂且成分相近,形亮氨酸(mg g )畅畅缬氨酸(mg g )畅畅组氨酸(mg g )畅畅半胱氨酸(mg g)畅畅酪氨酸(mg g )畅畅色氨酸(mg )倡倡“ ”me

11、ans no dataFig 畅1 NIR spectra of the samplesFig 畅2Principal component score for spectra2畅3LVQ 争层和线性输出层LVQ 神经网络是一种输入前向神经网络神经网络模型的建立和预测层神经元组成(见图),它是将自组织由输入层、竞特征映射法改良成有教师学习的一种算法。竞争层进行分类的依据是不同样品输入向量(即光谱矩阵)之间的距离,当两个输入向量非常接近时,就可能被分为一类,而不需要对光谱矩阵进行归一化或正交化处理。竞争层神经元的个数设为,学习速率为畅,LVQ 所建神经网络的测试集仿真测试结果见图。由图可知错判个,

12、一个小薏仁被误判为大薏仁,预测准确率达畅。这可能是由于薏仁产地不同, 小薏仁的物质组成和含量与其他产地的大薏仁相近。时,得到的最优c 为畅,g 为畅。表、图和图给出了不同的寻优方法下的c 和g 及其所对应的预测准确 率。Fig 畅3 Schematic depiction of LVQ neural networkFig 畅4Classification neural of learning networkvectorq uantization 2畅4SVM SVM 的建模思想是将一个分类超平面作为决策曲面定性模型的建立和预测使得正反例之间的隔离边缘被最大化。在用SVM 进行分类,预测时,先将

13、训练集和校正集归一化到,区间后,再对光谱矩阵进行建模处理,模型正确率的高低受建模参数的影响很大。其中主要是惩罚参数c (c 为回归误差的权重)和径向基核函数参数g ,因为当c 值太大时,会使样本数据出现过学习现象,而c 值太小,又会使样本数据出现欠学习现象,因此常需采用交互验证(cross validation ,CV )意义下的网格搜寻(g rid search )、遗传算法(g enetic algorithm ,GA )和粒子群优化算法(p article swarm optimization ,PSO )来获得最优的c 和g ,然后再建立模型。采用g rid search 选择参数时,

14、先让参数c 和g 在一个大范围内粗略搜寻,然后再根据粗略结果选择小范围内的最优c 和g ,结果如图。在图中c ,g 分别取以为底的对数后构成一个二维网格,等高线表示取相应的c 和g 后对应的CV 方法的准确率,最佳c 和g 即通过交互验证准确率的高低来确定。由图可知所得最优c 为,g 为畅。GA 选择参数时,将CV 方法的准确率作为GA 的适应度函数值。由图可知,当种群的进化代数为时,进化终止,得到最优c 为畅,g 为畅。PSO 选参数时,则将CV 意义下的准确率作为它的适应度函数值来进行寻优,结果见图。由图知当设定进化代数为,种群规模为Fig 畅5Schematic line diagram

15、 diagram or three of dimensional grid search diagram parameter )(contourFig 畅6Fitness (accuracy )curve of GA search parameter Table 2Model parameters and predictive accuracy of SVM寻参方法Best c Best 准确率任意给定畅()网格搜寻畅()遗传算法畅畅()粒子群优化算法畅畅()由表和图可以看出,当任意给定c 和g 值时,所建模型对测试集的预测错个,即个大薏仁样品被误判为小薏仁,此时的预测准确率为畅。当用g ri

16、d search ,GA 和PSO 选择出的最佳c 和g 来建模时,由图可知,所建模型对预测集的预测准确率为,说明这三种寻优方法能够明显的提高SVM 模型的稳健性和泛化性能,也说明了用SVM 法来定性判别大小薏仁是可行的。光谱学与光谱分析第卷Fig 畅9Classification result diagram ofSVM with optimal parametersFig 畅7Fitness (accuracy )curve of PSO search parameter结论基于不同地区和种类薏仁的近红外光谱,在全光谱范围内考查了无监督学习算法中的PCA 和有监督学习算法中的LVQ 神经网

17、络和SVM 对粉状大小薏仁分类的结果。由于不同产地的不同种类薏仁物质组成和含量相近,PCA 对不同样品所提取的特征变量很相似,所以通过PCA 根本不能区分大小薏仁粉,又选择了LVQ 神经网络,该方法因其结构简单、不需要对输入向量进行预处理就能实现快速的分类而被广泛的应用,预测准确率为畅。SVM 建模是通过核函数参数的优化来实现测试数据误差最小且同时缩小模型泛化误差的上界,从而提高模型的泛化性能,经过参数优化后,预测准确率可达。研究结果为薏仁种类的区分和市场规范提供一定的理论依据与技术途径。Fig 畅8Classification result diagram ofSVM with random

18、 parametersReferencesHu A J ,Zhao S N ,Liang H H ,et al Ultrasonics Sonochemistry ,():Chung C P ,Hsia S M ,Lee M Y ,et al J Agric Food Chem ,():M IAO Ming san (苗明三)Acta Chinese M edicine And Pharmacology (中医药学报),():Lin L J ,Hsiao E S L ,T seng H S ,et al J Agric Food Chem ,():LIA NG Yi zeng ,X U Qin

19、g song (梁逸曾,许青松)Instrumental Analysis of Complex Systems :White ,Gray and Black Analytical Sys tems and T heir M ultivariate M ethods (复杂体系仪器分析:白、灰、黑分析体系及其多变量解析方法)Beijing :Chemical Industry Press (北京:化学工业出版社),XIE Zhong hua (谢中华)Statistical Analysis and Application of M A T L AB :Cases Analysis (M A

20、T L AB 统计分析与应用:个案例分析)Beijing :Beijing U niversity of Aeronautics and Astronautics Press (北京:北京航空航天大学出版社),C H U Xiao li ,X U Yu p eng ,L U Wan zhen (褚小立,许育鹏,陆婉珍)Chinese J Anal Chem (分析化学),():S HI Feng ,W A NG Xiao chuan ,Y U Lei ,et al (史峰,王小川,郁磊,等)Neural Netw ork of M A T L AB :Cases Analysis (M A T

21、 ,L AB 神经网络:个案例分析)Beijing :Beijing U niversity of Aeronautics and Astronautics Press (北京:北京航空航天大学出版社),Kennard R W ,Stone L A T echnometrics ,():Z HA NG Ju hua ,Z H U Xiang rong ,LI Gao y ang ,et al (张菊华,朱向荣,李高阳,等)Chinese J Anal Chem (分析化学),():Ortiz A ,ó,í,et al Pattern Recognition Lett ,()

22、:第期光谱学与光谱分析Rapid Identification of Coix Seed Varieties by Near Infrared SpectroscopyLIU Xing ,M AO Dan zhuo ,WANG Zheng wu 倡,YANG Yong j ian Department of Food Science&Technology ,School of Agriculture and Biology ,Shanghai Jiaotong University ,Shanghai ,China Shanghai Institute for Food and Dru

23、g Control ,Shanghai ,ChinaAbstract Unsupervised learning algorithm p rincipal component analysis (PCA ),and supervised learning algorithm learning vec tor quantization (LVQ )neural network and support vector machine (SVM )were used to carry out qualitative discriminant analy sis of different varieties of coix seed from different regions Since nutrient compositions of different varieties coix seed samples from the While scores different plot origins of their be 畅satisfactory ,while the method up to to identify T

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论