基于主成分分析和bp神经网络的苹果品种鉴别_第1页
基于主成分分析和bp神经网络的苹果品种鉴别_第2页
基于主成分分析和bp神经网络的苹果品种鉴别_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于主成分分析和bp神经网络的苹果品种鉴别

品种鉴别的应用苹果是中国的主要水果之一。苹果的生产、加工和检测一直是农产品加工研究的重要课题。从苹果的大小、颜色、外观形状等外部品质到口感、糖分含量、酸度和维生素含量等内部品质,都得到了广泛重视。国内外学者利用近红外光谱技术在苹果糖分含量、酸度无损检测方面做过大量的研究,也研制出了基于高光谱技术的针对苹果大小、颜色等外部品质的自动分级机,但是对于苹果品种鉴别方面的研究还做得很少。随着水果产后处理技术的发展,品种鉴别将越来越突出它的必要性,所以研究一种简单、快速、非破坏的苹果品种鉴别技术是很有必要的,本文以光谱技术为基础研究了苹果的品种鉴别。现代近红外光谱分析技术,可充分利用全谱段或多波长下的光谱数据进行定性或定量分析。由于近红外光谱分析技术具有速度快、效率高、成本低、测试重现性好、测量方便等特点,已经被越来越多地应用于食品工业、石油化工、制药工业等领域。有学者研究利用近红外光谱技术区别道地山药、辣椒品种、红景天品种、桑白皮与易混淆品种等。BP神经网络模型是一个强有力的学习系统,能够实现输入与输出之间的高度非线性映射。目前使用最多的是多层结构的误差反向传播学习算法(BP),并且已经证明此种模型可以逼近任何连续的非线性曲线。主成分分析是多元统计中的一种数据挖掘技术。在不丢失主要光谱信息的前提下选择为数较少的新变量来代替原来较多的变量,解决了由于谱带的重叠而无法分析的困难。我们选用主成分分析(PCA)和基于误差反向传播算法(backpropagation,BP)多层前馈神经网络建立不同品种苹果的近红外光谱鉴别模型。通过平滑和MSC(multiplicativescattercorrection)的光谱预处理方法消除噪声,并优化光谱的波长范围。在主成分分析的基础上得到对于品种敏感的指纹图谱,即550~565nm和650~690nm波长区域;把该区域的光谱反射值作为多层前馈神经网络的输入,建立BP神经网络苹果品种鉴别模型。1材料和方法1.1采样波长及测量条件实验使用美国ASD(analyticalspectraldevice)公司的HandheldFieldSpec光谱仪,其光谱采样间隔(波段宽)1.5nm,测定范围325~1075nm,扫描次数30次,分辨率3.5nm,探头视场角为20°。光源是与光谱仪配套的14.5V卤素灯。光谱数据以ASCLL码形式导出进行处理,分析软件为ASDViewSpecPro,UnscrambleV9.1和DPS(dataprocessionsystemforpracticalstatistics)。1.2苹果近红外光谱仪距离变化及模型构建从超市买来三种苹果分别是水晶红富士(Fuji产地陕西)、RedDelicious(产地美国)、CopefrutRoyalGala(产地美国)各30个,选择大小均匀的个体,避免试验中苹果个体与近红外光谱仪之间的距离剧烈变化,共计90个样本。全部样本随机分成建模集和预测集,建模集有75个样本,预测集有15个样本。光谱仪置于苹果的上方,距离苹果表面200mm,探头视场角为20°,对每一个苹果扫描30次,从苹果的赤道部位等距的依次取三幅图谱,每幅图谱拍摄的苹果赤道部位相差约120°。1.3光谱预处理消除噪声为了去除来自高频随机噪声、基线漂移、样本不均匀、光散射等影响,需要进行光谱预处理来消除噪声。采用求平均平滑法,选用平滑窗口大小为9,此时能很好滤除各种因素产生的高频噪声,再进行MSC处理。由于系统误差样本光谱曲线在首端和末端有较大噪声如图1所示,所以只取400~960nm波段的光谱用于分析。1.4网络输入/输出层节点数建立了一个三层的人工神经网络结构,各层传递函数都用S型(Sigmoid)函数。网络输入层节点数为52、经多次实验确定隐含层节点数为39,输出层节点数为1。目标误差为0.001,网络指定参数中学习速率为0.2,设定训练迭代次数为1000次。2试验结果与分析2.1不同品种苹果的光谱特性三种品种苹果的典型近红外光谱曲线如1所示。图1中横坐标为波长,范围是325~1075nm,纵坐标为光谱漫反射率。从图1中可以看出,不同品种苹果的光谱曲线有明显区别,并具有一定的特征性和指纹性,这一差异为苹果的不同品种鉴别奠定了数学基础。我们从三个品种中随机各抽取25个,共75个作为建模样本,选择波长范围在400~960nm的光谱,应用ASDViewSpecPro软件,把同一个苹果三个不同部位的光谱曲线做平均处理,并转换成ASCⅡ码,形成反射率矩阵,用主成分分析法对其聚类。2.2聚类分析结果对三类苹果水晶红富士(Fuji),Reddelicious,Copefrutroyalgala各25个,共75个样本进行主成分分析聚类。前三个主成分的特征值及累计可信度如表1所示。由于前两个主成分的累计可信度已达98%,所以仅用前两个主成分就可以表示原始近红外光谱的主要信息。图2表示75个建模样本的主成分1,2得分图,图中横坐标表示每个样本的第一主成分得分值,纵坐标表示每个样本的第二主成分得分值。图2中水晶红富士(Fuji),Reddelicious,Copefrutroyalgala三个品种苹果明显分成三类,说明主成分1,2对三种苹果有较好的聚类作用。因此,本研究基于主成分1、2对于75个样本的得分图,对75个苹果样本进行聚类分析。从图2中可以看出,品种为Reddelicious的25个样本聚合度较好而且均位于x轴的下方,其他50个样本大部分位于x轴的上方。品种为Copefrutroyalgala的25个样本聚合度较好,紧密的分布在图2的第二象限,其他样本均处于第二象限之外。品种为水晶红富士(Fuji)的苹果样本聚合度不如另外两种,但是除了有两个样本位于第四象限其它全部分布在第一象限之内,而另两个品种均在第一象限之外。2.3主成分与苹果品种的相关性全波段从325~1075nm共有750个点,但是,采用全光谱计算时,计算量大,而且有些区域样品的光谱信息很弱,与样品的组成或性质间缺乏相关关系。所以在主成分分析的基础上,选取对苹果品种敏感的波段作为输入建立BP品种预测模型。图3表示主成分1和主成分2在整个波长范围的载荷图。从图3中可以看出主成分1,2与全波长变量的相关程度。图3中横坐标表示波长范围400~960nm,纵坐标表示各波长变量对于主成分的载荷值,即是各个波长变量与主成分的相关性大小。从图3(a)可以看出主成分1与波长650~690nm的相关性较大,即主成分1与波长650~690nm范围的反射值的相关性较强;从图3(b)可以看出主成分2与波长550~565nm范围的反射值的相关性较强。又从表1可知主成分1,2的累积可信度已达到98%,即主成分1,2几乎能完全解释所有原变量,而且从图2可以看出主成分1,2对三类苹果有较好的聚类作用,所以与它们紧密相关的波长550~565nm和650~690nm范围是对苹果品种极为敏感的特征波长。所以从400~960nm范围的561个采样点中选出波长在650~690nm和550~565nm范围的共计52个采样点的反射值作为BP网络的输入变量建立鉴别模型,通过调整隐含层的节点数来优化网络结构,经过反复试验得到最佳网络结构为52(输入)-39(隐含)-1(输出)三层BP神经网络模型,对75个建模样本的拟合残差为9.94365×10-5,对未知的15个样本进行预测,预测准确率为100%(见表2)。3苹果品种鉴别成功的验证应用主成分分析结合人工神经网络建立了苹果品种鉴别的模型,该模型的预测效果很好,识别率达到100%。说明运用近红外光谱技术可以快速、准确、无损的对苹果品种进行鉴别。以前的一些品种鉴别只给出了定性结果,没有建立模型定量鉴别。即使某些研究中建立了预测模型,模型的正确识别率也不高,如孙素琴,汤俊明等人对道地山药进行鉴别的正确识别率为70%。本文提出的主

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论