




已阅读5页,还剩61页未读, 继续免费阅读
(食品科学专业论文)中红外光谱用于茶叶种类判别的探索.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 本课题以茶叶为研究对象,将红外光谱法与化学计量学相结合,利用茶叶的 中红外光谱建立了一套基于投影显示法的茶叶种类的判别方法,实现了对茶叶种 类的鉴别。本课题共收集全国名茶4 0 种,其中绿茶3 2 种,红茶4 种,乌龙茶、 普洱茶、紧压茶和苦丁茶各1 种,产地遍及我国四大茶叶产区。利用漫反射技术 采集茶叶的光谱数据,采用随机采样方式抽取样本,通过实验确定扫描次数6 4 次,分辨率4 c m ,样品粉末粒度、 o ,即不同样本间距离大于o ; d ( x j ,x j ) = d ( x j ,x i ) ,即距离没有方向性; d ( x i ,x i ) d ( x j ,x d + d ( x k ,x j ) ,即两点问直线距离最短。 对于n 维空间的两个模式矢量x i 和x j 之间的距离,有如下两种常用的计算公式: 第一章绪论 岛删。= 【k - - x j k 阿9 式1 - 6 k = l 上式距离为m i n k o w s k i 距离,特别的,当p = 2 时,又称为欧氏距离( e u c l i d i a n 距离) : l ri1 i d * 。= k b 式1 - 7 l k = lj 1 3 3 2 特征抽取方法 选取合适的特征量,张成合适的特征空间,是模式识别工作成败的关键,特 征量的选取标准可分为化学的和数学的两个方面。化学的选取标准因所处理的信 息的本质不同而不同,取决于对具体问题的了解程度,因而无法指出普遍有效的 方法。然而有一点是肯定的,那就是在实际计算时,人们总是力图抛弃那些对分 类作用不大的特征量,使特征数目减到最小。这是因为:1 多余的特征量不但没 有多大好处,而且可能干扰分类过程;2 为了保证维数比例( 样本数和模式空间 维数之比) 大于3 ,最好使模式空间维数降至最小。上述说法似乎与维数越高, 模式识别方法识别能力越强的常理相悖。实际上,如果每个特征变量都具有一定 的判别能力且是相互独立的,这时维数提高将增强模式识别方法的能力,然而, 如果变量相互相关,此时,多余的变量不但没有多大好处,反而干扰了分类过程, 增加了运算量。所以,特征抽取是模式识别工作成败的关键1 3 3 1 。 1 3 3 3 常用的模式识别方法 模式识别方法分为无监督模式识别和有监督模式识别两种类型蚓。无监督的 模式识别是对一组未知类别的样本进行分类,它是利用样本数据本身的特点进行 一些操作,达到使不同类的样本分开的目的;有监督模式识别方法的总体思路就 是用一组已知类别的样本作为训练集,即用已知的样本进行训练,让计算机向这 些己知样本。学习”,这里的训练集就是老师,由这个训练集就可以得到判别模 型。 无监督模式识别方法的思路很简单,以“物以类聚”为原则,就是同类样本 应彼此相似,在多维空间中彼此的距离应小些,而不相似的样本在多维空间中彼 此的距离应大些。常用的无监督模式识别方法有系统聚类法、最小生成树法、 k 一均值聚类法等。 有监督的模式识别方法又可分为参数法和非参数法两类,其中参数法一般都 是由统计学家提出来的,其判别效果的好坏依赖于样本是否符合假设的统计分 布;而非参数判别分析法多由实验科学家或计算机模式识别专家提出,对样本分 布没有特殊要求。有监督的模式识别中,经常将己知类别的样本分为两组,一组 作为常规的训练集,另一组组成测试集( 亦称检验集) ,目的是用于检测由训练 集样本所得的判别模型的判别能力。有监督的模式识别方法很多,常用的有线性 9 江南大学硕士学位论文 学习机,s i m c a 法,判别偏最小二乘法、人工神经网络法等。 1 4 茶叶品质模式识别的研究现状 茶叶是公认的健康食品之一,饮茶有助于提神益智、保护牙齿、消食去腻, 滋补营养、减肥健身、解毒利尿、降胆固醇、抗癌等。我国不仅是世界上茶叶资 源最丰富的国家,也是世界上茶叶资源最大的生产国、消费国、贸易国。然而, 我国茶叶市场的现状却令人担忧,以次充好,以假乱真的现象比比皆是,这不仅 损害了广大消费者的利益,而且也严重阻碍了我国茶叶工业的发展,降低了我国 茶叶在国际市场上的竞争力。茶叶市场的混乱归根结底是由于缺乏行之有效的评 审方式。目前,茶叶的质量控制方法主要为感官审评法,有经验的专家通过茶叶 的外形与内质来进行种类的鉴别和品质的认定,这种评审模式无疑受到多方面条 件的制约而难以普及。研究客观、快速、准确的茶叶识别方法就显示出极大的现 实意义。随着近年来仪器分析伴随着化学计量学方法越来越快速的发展,各国科 学家开始尝试将仪器分析应用于农产品包括食品等的识别研究,包括咖啡品质、 产地识别,葡萄酒产地、品种识别,中草药产地识别、真伪鉴别,茶叶产地、品 质鉴别等领域。茶叶品质鉴别主要集中在微量元素分析和傅里叶变换红外光谱分 析两个方面。 1 4 1 微量元素分析的应用 众所周知,茶叶的品质与产地关系密切,然而除非有经验丰富的感官评定人 员,否则很难鉴定很多名贵茶叶的道地性。元素分析在这方面很有优势,因为茶 叶中的微量元素与产地的土壤成分有关,所以有可能利用茶叶中多种微量元素的 分析结果靠模式识别方法区别不同产地的茶叶。陈念贻p ”等采用电感耦合等离子 体原子发射光谱测定了乌龙茶和其它茶叶品种( 包括红茶和绿茶) 样品的z n , m n ,m g ,c u ,a i ,c a ,b a ,k 八种微量元素的含量,通过计算建立了区别乌 龙茶样品与其它茶种的判别数学模型。该文献中采用了一种近年来根据新发展的 统计学习理论建立的新算法支持向量机( s u p p o r tv c c t o rm a c h i n e ,简称 s v m ) ,其特点是能够最大限度防止统计预报中的过拟合现象。这种算法表现 了很好的预报能力,留一法交叉检验的正确率超过9 5 。h e r r a d o r ( 3 6 1 等采用电感 耦合等离子体原子发射光谱和电感耦合等离子体质谱测定了来自亚洲和非洲的 8 5 个茶叶样本( 其中3 6 个来自亚洲国家,1 8 个来自非洲国家,2 4 个商业混合 茶产品以及7 个未知产地的样本) 中的1 7 种金属元素的含量,包括a l ,b a , c a , c d , c o ,c r ,c u , c s ,m g ,m n ,n i ,p b ,r b ,s r ,t i ,v ,z n 。文献中采用主成分分析( p c a ) 和聚类分析( c a ) 作为解释方法,线性判别分析( l d a ) 和s i m c a 作为分类方 法。通过主成分分析( p c a ) 和聚类分析( c a ) 就可以将亚洲的茶种和非洲的 茶种区分,在5 的显著水平上,线性判别分析( l d a ) 对于亚洲茶种和非洲茶 种分类的正确率分别可以达到9 4 4 和1 0 0 ,而在同样的显著水平上,s i m c a 1 0 第一章绪论 的这两项指标分别为9 1 7 和1 0 0 ,然而前者在此显著水平上可将印度和斯里 兰卡的茶种区分,而后者不能。 1 4 2 傅里叶变换红外光谱技术的应用 红外光谱是研究样品分子中以化学键相连的原子之间的振动和分子转动的 吸收光谱,是鉴定有机化合物结构的有力工具。上世纪7 0 年代瑞典化学家s w o l d 开创化学计量学方法( c h e m o m e t d e s ) 后,红外光谱突破化合物定性检测 的传统范畴,在食品多组分定量分析3 7 娜1 、油脂氧化指数【3 9 】、葡萄酒品种鉴别【4 0 1 、 咖啡产地识别【4j j 等领域有了更广阔的应用。由于红外光谱技术制样简单、快速, 检测过程几乎不需要消耗化学品,与化学计量学相结合可实现快速、无损、在线 检测,因此红外光谱技术成为近年来研究的热点。我国在这方面的研究起步较晚, 孙素琴 4 2 - 4 4 】等人将红外光谱和模式识别方法相结合对多种中药材的道地性鉴别 进行了研究,取得了很好的效果。茶叶同中药材一样,是一个复杂的混合体系, 所含化合物的响应信号相互叠加使得其红外光谱具有难以解析的复杂性,但事实 上不同品种的茶叶、不同产地、不同加工工艺和贮存条件,导致茶叶产品在化学 组成及含量、各组成的相互配比之间存在差异,其红外光谱就具有细微的特征性。 借助这种差异,运用模式判别法对其红外光谱进行解析,就可以建立相关的模式 识别器,实现茶叶品质的快速识别。国内外科学家针对茶叶样品的红外光谱分析 进行了有效的探索,陈华才m j 等以高效液相色谱分析结果为参考值,建立了快速 测量茶多酚中总儿茶素含量的近红外光谱的定标模型,以4 8 个茶多酚样品组成 定标样品集,以1 0 0 0 - , 2 5 0 0 r i m 的近红外漫反射光谱为定标波长范围,比较了光 谱经一阶导数、二阶导数、标准归一化、多元散射校正处理后结合偏最d , - 乘回 归定标的结果,以及光谱经标准归一化( s n v ) 处理后,结合经典最小二乘法、 偏最小二乘法、主成分回归等方法定标的结果。结果表明,光谱经s n v 处理, 结合偏最d , - - 乘回归建模效果最好,模型的相关系数( c o 玎- c o e f f ) = o 9 9 7 ,校 正均方根( r m s e c ) = 1 7 1 ,这表明利用近红外光谱结合偏最d , - - 乘回归( p l s ) 可以实现茶多酚中总儿茶素含量的快速定量检测。s c h u l z i u l 等采用偏最小二乘法 ( p l s ) 建立模型测定了绿茶中的生物碱和酚类物质的含量,但没有应用独立的 检验集进行检验。l u y a e r t l 4 1 等用p l s 法建立数学模型测定绿茶的咖啡碱和茶多 酚( e g c g 和e c ) 的含量和总抗氧化能力。孙耀国1 4 8 l 等直接取茶叶完整叶进行 傅里叶变换近红外( f t - n i r ) 光谱分析测定绿茶中氨基酸、咖啡碱和茶多酚的 含量。该文献中将茶叶的近红外光谱划分为3 个波段:1 0 0 0 0 7 7 1 4 3 c m 一;7 1 4 3 5 3 7 6 e m ;5 3 7 6 4 0 0 0 c m 。偏最小二乘法建立每种成分的数学模型,对不同波 段的近红外分析结果进行讨论。在进一步优化波长范围的基础上获得了较好的数 学模型,氨基酸、咖啡碱和茶多酚的校正值与化学值之间的相关系数分别达到 0 9 9 4 ,0 9 2 和o 9 6 ,预测均方根误差分别为0 1 5 ,o 3 1 和1 6 7 。g b u d i n o v a l 4 9 江南大学硕士学位论文 等应用漫反射傅里叶变换红外光谱技术在中红外区实现了对1 2 种茶叶样本( 7 种红茶,两种绿茶,3 种半发酵茶) 的鉴别,识别模式的建立采用s i m c a 和线 性判别分析( l d a ) 算法。 此外,还有很多仪器分析技术介入茶叶这类传统食品的真伪、或者品质的鉴 别,比如说测色技术5 0 1 、液相色谱川、紫外光谱吲等等,并且也取得了很多令 人振奋的成果。但由于这些技术或者无法全面考察茶叶样品的本质,或者预处理 方法繁复、对环境有污染,不被研究人员青睐。 1 5 本课题的研究目的和主要内容 l - 5 1 研究目的 茶叶检验和审评的发展与饮茶的起源演变是紧密相联及互相促进的。中国早 在唐宋时期,就有对茶叶品质优劣、真伪鉴别的记述。茶圣陆羽的茶经、蔡 襄的茶录、黄儒的品茶要录等都对茶叶审评作了描述和总结。因为茶叶 具有生津止渴,提神益思,消炎解毒,醒酒强心等功效,所以现在越来越多的人 开始关注茶叶,茶叶的市场也愈加繁荣。然而经营者为获得高额利润,掺假作伪 之风盛行。为了对茶叶市场进行监督和约束,我国建立了茶叶品质标准,包括茶 叶的感官评审和理化评审两部分内容。由于茶叶色、香、味的形成是很复杂的, 茶叶品质的优劣和等级的高低并不和内含成分数量的多少简单地成正相关或负 相关,而往往是许多成分的适量适比,协调地综合作用的结果,而且其组合的比 例关系有些尚未被人们所认识。因此,对于茶叶品质优劣和等级的鉴定,仍采用 感官审评法,并辅助测定某些理化特性。然而,尽管茶叶感官审评的历史几乎与 茶叶制造和饮茶习惯一样长久,但由于感官审评是一项经验活动,既受到环境因 素的制约,更受到评审人员的生理条件和阅历的影响,因此茶叶审评很难完全做 到标准化和真正客观化。加大评审工作中仪器鉴定的比例无疑会有助于问题的解 决,前面很多的研究工作也证实了这一点。本课题的目的就是要将绿色、快捷、 无损的红外光谱分析技术应用于茶叶种类的识别,力求为我国茶叶的标准化进程 提出一些新的思路和方法。 1 5 2 主要内容 本课题选择了我国市售的四十种比较有代表性的茶叶作为研究对象,依据一 般红外光谱应用于鉴别分析的步骤,主要包括以下几个方面的内容: 1 依据茶叶样本的特质,选择合适的采样方法以及相应的样品预处理方法 和实验仪器的参数设置。 2 对所得到的原始光谱依据化学模式识别的要求进行必要的预处理和特征 压缩与提取。 3 采用比较常用的基于投影显示的模式识别方法建立判别模型,并依照相 应的规则评判模型的好坏。 第二章茶叶中红外光谱检测技术的基础性研究 第二章茶叶中红外光谱检测技术的基础性研究 2 1 试验茶叶的基本信息及其编码 本研究对我国人民较为熟悉的4 0 种茶叶品牌进行了模式识别的研究,根据 我国饮茶的习惯以及各类茶叶产量的不同,本研究以绿茶为主要研究对象,包括 3 2 种绿茶,4 种红茶、1 种乌龙茶、1 种普洱茶、1 种紧压茶( 普洱沱茶) 和1 种苦丁茶。所有茶叶样品均来自当地市售茶叶的商店,出产日期均为2 0 0 6 年春、 夏两季,茶叶样品一5 保存于冰箱中。如表2 1 所示,本研究所涉及的茶叶品 种分别来自四川、云南、贵州、福建、广东、河南、山东、福建、安徽、湖南、 湖北、江西、江苏、浙江各省,几乎遍及我国四大主要的茶叶产区。 表2 - i 茶叶编码及基本信息 注:茶叶编码方式为第一个英文7 母为茶叶产地所属肯份简称的汉语拼音的第一个英文字母,然后依次生 成随后的数字,若该省只有一种茶叶,则取该省简称的汉语拼音的前两个英文字母进行编码。 江南大学硕士学位论文 2 2 仪器设备及其检测技术的确定 。 2 2 1 仪器 本研究采用美国热电( t h e r m o e l e c t r o nc o r p o r a t i o n ) 公司的n i c o l e tn e x u s 研 究型傅里叶变换红外仪,其主要技术参数和规格如下: 最小分辨率:0 5 c m ; 最大波数范围:7 8 0 0 3 5 0 c m 。1 光源:e v e r g l 0 1 ”m i d i n f r a r e ds o u r c e 检测器:d t g s ( 氘代硫酸三苷肽) k b r 检测器; 计算机配置:c p ui n t e l ( r ) 42 0 g h z ,内存5 1 2 m ,操作系统m i c r o s o f t w i n d o w s 2 0 0 0 仪器的工作台通过安装在计算机上的w i n d o w s 2 0 0 0 系统下的f t i r 专用软件 0 m i n i c 操作。为了使仪器在测定过程中保持稳定,每次正式测量前先将仪器预 热3 0 分钟以上,并在测试第一个样品前反复扫描5 次以上,仪器工作稳定后, 进行正式扫描。环境温度控制在2 0 c 左右,相对湿度4 0 5 0 之间。 2 2 2 检测技术的确定 红外光谱是一种应用非常广泛的分析技术,不仅因为红外光谱在定性定量分 析方面有着不可替代的作用,更因为红外光谱分析技术有着灵活方便的各种制样 技术。不同的样品可采用不同的红外制样技术,而对于同一样品,也可以采用不 同的制样技术。不同制样技术测试同一样品得到的红外光谱是有差异的。因此, 要根据测试目的和要求采用合适的制样方法,以便得到准确可靠的测试数据。本 研究中,茶叶属于块状固体样品,且硬度较小,质地较脆,经粉碎机粉碎后可转 化为粉末样品。对于这类样品,常用的制样技术有常规透射光谱测试的压片法、 显微红外光谱法、漫反射红外光谱法、基于o m n i 采样器的单点全反射法等【5 引。 上述几种方法,除了漫反射红外光谱法,都无法适用于大批量样品的测试,因为 压片法制样过于烦琐,显微红外光谱法和单点全反射的采样面积过小,很难具有 统计学上的意义。相比之下,漫反射红外光谱法的制样方法简单,而且支持较大 批量的取样,所以本研究采用漫反射红外光谱法并采用相应的制样技术。 漫反射红外光谱法是随着漫反射附件的发展而发展起来的,根据测试条件的 不同,红外光谱仪漫反射附件分为常温常压漫反射附件、高温高压漫反射附件、 高温真空漫反射附件和低温真空漫反射附件四种类型,后三种附件主要用于化学 反应动力学和反应机理的研究,常温常压漫反射附件适用于高散射粉末样品的常 规红外光谱的检测,如本研究中的茶叶样品。 4 第二章茶叶中红外光谱检测技术的基础性研究 图2 - 1 漫反射附件光路图 图2 1 所示是本研究中所采用的常温常压漫反射附件的光路图。将粉末样品 装在漫反射附件的样品杯中,红外光束从右侧照射到漫反射附件的平面镜m i 上,反射到椭圆球面镜a ,椭圆球面镜a 将光束聚焦后射到样品杯中粉末状样 品表面。从样品表面射出来的漫反射光,经椭圆球面镜b 收集并聚焦后,射向 左侧平面镜m 2 上,再沿着原光路入射方向到达检测器。 图2 2 漫反射制样技术中红外光与样品作用示意图 当一束红外光聚焦到粉末样品表层上时,红外光与样品作用有两种方式:一 部分光在样品颗粒表面反射,这种反射和可见光从镜面反射一样,称为镜面反射。 由于镜面反射光束没有进入样品颗粒内部,未与样品发生作用,所以这部分镜面 反射光不负载样品的任何信息。另一部分光射入样品颗粒内部,经过透射或折射 或在颗粒内表面反射后,从粉末样品表面各个方向射出来,组成漫反射光,漫反 射光与样品内部分子发生了相互作用,因此负载了样品的信息。上述过程中红外 江南大学硕士学位论文 光束与样品相互作用见图2 2 。 2 3 实验材料及方法 理论上利用漫反射附件测试红外光谱时不需要对样品进行特别的处理,然而 漫反射制样技术中存在镜面反射与漫反射两种作用,尤其是在中红外光谱区,镜 面反射光的强度与样品的粒度、样品的浓度有关【堋。镜面反射光不携带样品的信 息,所以到达检测器的镜面反射光对测试是一种干扰。当镜面反射光成分过多时, 容易引起光谱畸变,在测得的光谱中出现r e s t r a h l e n 谱带( 形状像一阶导数光谱 的倒峰) 。要在样品预处理时对样品的粒度以及样品粉末的稀释质量百分比进行 优化,而在光谱采集时对扫描次数和分辨率合理选择,力求得到信噪比较好的漫 反射红外光谱图。 2 3 1 材料 茶叶见2 1 k b r 上海试剂公司 标准分样筛镇江科瑞制样有限公司 电子天平梅特勒一托利多公司 傅里叶变换红外光谱仪见2 2 2 3 2 实验方法 将茶叶粉碎至一定粒度,取该茶叶粉末与同样粒度的k b r 粉末混合均匀。 采用s m a r td i f f u s er e f l e c t i o n 附件,以同样粒度的k b r 粉末作为背景,扫描茶叶 样品的红外谱图。 2 3 2 1 粒度的确定 样品的粒度会影响其散射系数,粒度越小,散射系数越大,镜面反射所占的 比例就越小,漫反射成分越多,测量的灵敏度越高。然而,粒度越小,样品预处 理时间越长,此外由于k b r 粉末为稀释基质和背景,过高的粒度要求也会增加 k b r 粉末的准备时间,这会导致k b r 粉末吸潮严重,增加水分吸收的干扰。本 研究以太湖翠竹茶叶为例考察样品粒度对于样品光谱图的影响,将茶叶粉末分别 过4 0 目,8 0 目,2 0 0 目筛并测定其漫反射红外光谱图,样品粉末质量百分比为 5 ( w w ) ,扫描次数6 4 次,分辨率4 c m 一 2 3 2 2 茶叶粉末稀释质量百分比的确定 样品的浓度是影响漫反射红外光谱图优劣的另一个非常重要的因素。样品浓 度越大,镜面反射越严重,高浓度还会使谱带变宽,分辨率下降,甚至出现全吸 收现象。茶叶是一个复杂的混合物,其中很多成分都有很强的红外吸收,即使在 较低浓度下也有可能出现全吸收,所以实验中应选用尽量低的浓度,以降低对红 外光的吸收和增加光通量。一般采用将待测样品在合适基质中稀释的办法降低浓 度,稀释基质应选用在研究波数范围内对红外光无吸收且有较高反射能力的材 1 6 第二章茶叶中红外光谱检测技术的基础性研究 料。本研究选用最为常用的k b r 作为稀释基质,将其单吸收光谱作为背景光谱。 将太湖翠竹茶叶粉末样品过2 0 0 目分样筛,稀释质量百分比分别为1 0 0 、5 0 、 1 0 、5 、2 ( w w ) 时测定其漫反射红外光谱图,测定时扫描次数6 4 次,分 辨率4 c m 一,考察茶叶粉末稀释质量百分比对于光谱质量的影响。 2 3 2 3 扫描次数的选择 扫描次数是指光谱仪完成一张光谱的采集而对样品进行重复扫描的次数,是 光谱采集的一个重要的参数。其它条件不变时,扫描次数与光谱的信噪比有正比 例关系,扫描次数越多,光谱的信噪比越高。但在实际采样中,环境时刻在改变, 增加扫描次数又肯定会增加采样误差,而且也增加了实验的时间。因此适宜的做 法是在保证光谱具有较好信噪比的前提下采用较少的采样次数。设置采样次数分 别为1 6 ,3 2 ,6 4 ,1 2 8 时测定太湖翠竹茶叶粉末的漫反射红外光谱,茶叶粉末过 2 0 0 目分样筛,与k b r 混合时稀释质量百分比为5 ,仪器分辨率4 c m 。 2 3 2 4 分辨率的选择 采样分辨率是指红外光谱仪分开波长相近的两条谱线的能力,它直接影响光 谱图的精细结构,分辨率越高,光谱结构越详细,采样时间越长,数据量越大; 分辨率低,则采样时间缩短,数据量减少,但光谱结构较为粗糙。采用四种不同 分辨率2 c m 、4 c m 1 、8 c r n 一、1 6 c m “采集太湖翠竹茶叶粉末的漫反射红外光谱图, 茶叶粉末过2 0 0 目分样筛,与k b r 混合时稀释质量百分比为5 ,扫描次数6 4 次,以考察采样分辨率对谱图质量的影响。 2 4 结果与讨论 2 4 1 粒度对光谱质量的影响 幄: m一蠢r 一i ;i “矗” 图2 - 3 不同粒度样品粉末所测得的光谱图 ( a 过4 0 目筛;b 过8 0 目筛:c 过2 0 0 目筛) 图2 3 为太湖翠竹茶叶过4 0 目,8 0 目,2 0 0 目筛粉末的漫反射红外光谱图, 从图中可以看出,只有过2 0 0 目筛的粉末与适量k b r 粉末混合后才可以得到信 7 江南大学硕士学位论文 噪比较好的红外光谱图。降低粒度理论上可以增加信噪比,但由于在中红外区水 分的干扰较为严重,而且样品的稀释基质k b r 极易吸潮,所以为了获得较高的 分析效率,本研究确定样品粉末粒度为过2 0 0 目分样筛。 2 4 2 茶叶粉末稀释质量百分比对光谱质量的影响 图2 4 不同稀释质量百分比的样品粉末的光谱图 ( a 1 0 0 ;b5 0 :cl o :d5 ;e 2 ) 图2 4 就列出了太湖翠竹茶叶粉末稀释质量百分比分别为1 0 0 、5 0 、1 0 、 5 、2 ( w w ) 时的漫反射红外光谱图,从图中可以看出,当稀释质量百分比 为5 ( w w ) 时谱图已有很好的信噪比,继续降低稀释百分比,无疑会增加水 分的干扰,所以最终选择样品粉末稀释质量百分比为5 ( w w ) ,稀释基质k b r 。 2 4 3 扫描次数对光谱质量的影响 图2 - 5 不同扫描次数对谱图的影响 ( a 1 6 次:b3 2 次;c6 4 次:d 1 2 8 次) 图2 - 5 为设置采样次数分别为1 6 ,3 2 ,6 4 ,1 2 8 时茶叶粉末的漫反射红外光 谱,由图可知,扫描次数为6 4 次时,光谱己有较好的信噪比,再增加扫描次数 1 8 第二章茶叶中红外光谱检测技术的基础性研究 光谱信噪比的增加也不明显,所以本研究确定扫描次数为6 4 次。 2 4 4 分辨率对光谱质量的影响 面血o豳丽面。一一。面 帅_ - - - , 图2 - 6 不同采样分辨率对谱图的影响 ( a1 6 c m 一;b8 c m ;c 4 c m :d2 c m 。1 ) 图2 - 6 为采用四种不同分辨率2 c m 、4 c m 、8 c m 、1 6 c m “在4 0 0 0 4 0 0c m l 之间采集太湖翠竹茶叶粉末的漫反射红外光谱图,从图中可以看出,采样分辨率 为2 c m 1 时,光谱曲线的高频噪声较大,其它波数段的噪声也较大;采样分辨率 为4 c m 一、8 c m “和1 6 c m o 时,高频噪声依次减少,但分辨率为8 c m d 或1 6 c m o 时,光谱较4 c m 1 时显得过为平滑,光谱中一些有用的信息可能由于分辨率过低 而不能被检测到。经考虑,本研究中采用4 c m 1 的采样分辨率。 2 5 采样及样品预处理方法 任何分析测试都是从采样开始的,采样的好坏将直接影响分析测试结果的可 靠性,所以采样是分析工作中不可忽视的重要步骤。分析测试的目的就是获取有 关对象全体( 总体) 的准确信息,但实际的测试样本往往是从总体样本中采集的 局部试样( 样本) 。如何使局部试样尽量代表对象全体,或者说使局部采样在统 计意义上尽可能代表总体,是采样理论和方法所研究的内容。从统计意义上来看, 分析试样( 或称样本) 的采集应满足下述要求【5 5 】: 1 样本均值应能提供总体均值的无偏估计,随机采样是保证无偏性的基本 方法。 2 样本分析结果应能提供总体方差的无偏估计,这主要针对一些分析对象 可能随时间发生变化的情况。 3 在指定的时间和人力消耗下,采样方法应保证总体均值和总体方差的估 计尽可能精密,这主要针对大批量采样的情况。 由于本研究尚处在实验室范围内,各茶叶样本总体量较小,再考虑到茶叶样 9 江南大学硕士学位论文 品自身极为不均匀的特点,随机采样的设计方案是本研究主要关注的。其它两个 方面的采样要求,本研究假设样本不随时间变化,且采样成本很低。随机采样是 指等概率地从总体中采集试样。将分析对象全体划分成不同编号的部分,再根据 随机数表进行采样是常用的随机采样方式,这种采样方法亦称为概率采样。概率 采样是尽可能缩小目标总体( 欲根据采样与分析做出相应结论的目标对象) 与母 总体( 实际被采集试样的对象) 差别的一种有效的手段。 根据前述的确定的实验条件,本研究设计了如下的随机采样方案和样品预处 理方法【5 6 l : 取5 0 9 茶叶样本放入食品粉碎机粉碎,过4 0 目筛,将此过筛后的粉末平铺 于一敞口盒中,该盒子尺寸为:长宽高约为2 0 c m x 2 0 c m 5 e m ,盒子底面 分成1 0 1 0 的小格子,将长和宽的间隔依次编号,这样所有小格子都有了一个 二维坐标与之对应,该坐标为大小在l 到1 0 之间的自然数,由e x c e l 的随机数 字生成器来分别生成1 0 个坐标对,按坐标对指示的格子取样,每次取约l g ,取 1 0 次,每个茶叶样本取两组。将取得的约1 0 9 茶叶样本再放入食品粉碎机中粉 碎,过2 0 0 目筛,将过筛的粉末按四分法取样的原则,随机称取o 2 9 作为一个 样本,将此粉末与同样粒度的k b r 粉末3 8 9 在玛瑙研钵中混合均匀,重复取样 4 次,其中一个样本当做检验集样本,其余三个样本为训练集样本。采用s m a r t d i f f u s er e f l e c t i o n 附件,以同样粒度的k b r 粉末作为背景,扫描茶叶样品的红外 谱图。每份混合好的样品在3 个不同区域取样,每份样本扫描3 次取平均光谱作 为一张样品光谱。这样,对于每种茶叶样品一共获得2 x 3 3 = 1 8 张红外光谱图 作为训练集样本,而有2 x1x3 = 6 张红外光谱图作为检验集样本。 2 6 本章小结 1 根据茶叶产品质脆、粉末散射能力较强的特质,选用漫反射红外光谱的检测 技术,并且介绍了漫反射红外附件的工作原理。 2 漫反射红外光谱技术对于粉末的粒度和稀释质量百分比有较高要求。本章通 过实验确定了样品预处理的粉末粒度2 0 0 目标准分样筛,以k b r 为稀释基 质且茶叶粉末样品稀释的质量百分比为5 。 3 通过实验确定了仪器采样过程中的两个重要的参数设置,分别是扫描次数6 4 次。扫描分辨率4 c m 。 4 根据随机采样的原则和所确定的样本粉末的品质要求,确定了样品的预处理 方法,并且明确了本研究的检验集和训练集。 第三章光谱数据的预处理及其特征提取 第三章光谱数据的预处理及其特征提取 只要严格按照已定条件处理好样品,傅里叶变换红外光谱的测试是一件并不 困难的事情,将制备好的样品插入样品仓中的样品架或者放在样品台上,采集样 品的单光束谱,取出样品,采集背景的单光束谱,就能得到一张傅里叶变换红外 光谱。但是,要得到一张高质量的红外光谱并不是一件容易的事情。测试方法的 选择、扫描次数的确定、其它测试参数的确定等因素都会影响光谱的质量。而且 测试所得的红外光谱通常都要进行数据校正和处理。另外,由于将红外光谱图作 为样本的描述量,所以光谱中所包含的任何信息都可能影响最终模型的优劣,如 何尽量消除样本体系以外所附加的光谱信息就显得特别重要。 3 1 光谱的预处理 3 1 1 基线校正 雪 w m v e n m t q r u ( c n 1 ) 图3 - 1 各茶叶种类的平均光谱图 采用漫反射红外光谱法采集的粉末样品的光谱,一般都会出现光谱基线漂移 的现象。这是颗粒研磨的不够细而使镜面反射成分过多的缘故1 5 r l 。为了消除由于 基线漂移带来的误差,在建模之前要采用较为稳定的基准进行基线校正。图3 1 和图3 2 分别为茶叶原始漫反射红外光谱图和经基线校正后的光谱( 为了表示方 便,图3 1 和图3 2 均为各茶叶种类全部2 4 张光谱图的平均光谱) ,校正时采用 了单点基线校正,以1 8 2 0 c m 。作为校正基点。通过观察可以发现,这一点的吸 收位置在光谱基线漂移方向上处于较为稳定的最低点,如图3 1 所示,在指纹区 内所有的光谱图几乎都在该点开始出现吸收。 2 l 江南大学硕士学位论文 n h r u _ n 帅1 ) 图3 - 1 各茶叶种类的平均光谱图经基线校正后的结果 3 1 2 平滑 利用光谱平滑数据处理技术可以降低光谱的噪声,以达到改善光谱形状的目 的,通过平滑可以看清楚被噪声掩盖的真正的谱峰,同时也是后续校正工作的必 要基础。常用的光谱平滑方法有最简单的窗口移动平均法、窗口移动多项式最小 二乘拟合法和稳健的中位数法。稳健的中位数法主要用于有奇异点的波谱。本研 究中采用的是窗口移动多项式最小二乘平滑法。该方法最早由s a v i t z k y 和 g o l a y l 58 】共同提出,所以此法也称为s a v i t z k y g o l a y 多项式法。此法不像简单窗 口移动平均法只采用简单的平均运算,而是在窗口移动运算中引入多项式最小二 乘拟合。这样。既能去噪提高分析信号的信噪比,又可以较好的保持分析信号中 的有用信息。 窗口移动多项式最小二乘拟合法计算的基本思路是通过多项式来对移动窗 口之内的波数点进行多项式的最小二乘拟合,将窗口内n = 2 m + 1 个等距离点的 数据,拟合为( 七一1 ) 阶多项式: x := a o + a 1 j + a 2 j 。+ + 口 , 式3 - 1 ( ,= - m ,一所+ 1 ,m l ,m ;i = l ,聍) 式3 2 通过对上式进行最小二乘拟合就可以得到一个可以求得即窗口内中心点 的计算公式。然后通过移动窗口依次求得所有中心的计算公式,从而实现对波谱 的平滑。显然,窗口的宽度决定了上述平滑的力度,窗口越大,取的数据点越多, 光谱的范围越大,相连的平均值越接近,光谱也就越平滑。采用光谱平滑数据处 理对光谱进行平滑后,光谱噪声降低的同时,光谱的分辨能力也降低了,平滑的 第三章光谱数据的预处理及其特征提取 数据点数越高,所得光谱的表观分辨率越低。当平滑的点数达到一定程度时,光 谱有些肩峰会消失,而且随着光谱点数的增加,吸收峰也会变得越来越宽。所以 要选择适宜的平滑条件,尤其是窗口的宽度。 图3 3 所示为原茶叶漫反射红外光谱分别采用7 、“、1 3 、1 9 、2 3 点3 次平 滑后的谱图,茶叶粉末为太湖翠竹。由图可以看出,原红外谱图随着平滑点数的 增加,光谱的平滑程度逐渐提高。 然而,仔细观察可以发现,随着平滑点数的增加,有些峰的位置和强度发生 了变化,尤其在1 3 3 8 e m 1 和1 3 6 3 c m 1 两处最为明显,从图3 3 中就可以看出, 采用2 3 点平滑时这两处吸收已经看不到了,局部放大图3 4 更清楚地表征了这 两处吸收峰随平滑点数增加的变化情况,从图3 - 4 中可以看出,1 3 点平滑,即采 用1 3 个采样数据间隔的窗口宽度比较合适,该条件下,不仅较为真实的保持了 原图中这两处吸收,而且谱图也较为光滑。 d m “蠢一。一“一z h 。1 。,b “诲1 蠢 v w n _ t _ f c m l ) 图3 3 茶叶光谱图经不同平滑点数平滑后的结果 c a 、b 、c 、d 、e 、f 分别是原图和经7 、l l 、1 3 、1 9 、2 3 点平滑得到的光谱) 江南大学硕士学位论文 1 3 1 3 1 3 , 5 61 a 1 3 4 5 1 3 4 0 n t 一c - n 1 - 图3 4 图3 - 3 的局部放大图 3 2 光谱数据的压缩以及特征提取 在模式识别中,关键的一个步骤就是特征量的提取,因为只有合适的特征量 才能把样本真实的、主要的特征反映出来,才能简化模型的建立。特征量的选取 标准可分为化学( 或物理) 的和数学的两方面。化学( 或物理) 的选取标准基于 对所处理的信息的本质或主要因子的理解。这方面依赖于具体问题,没有普遍有 效的方法。由于对所处理的信息了解不深,而且有许多因素之间的相关关系及程 度也不能肯定,因此一般的做法是先根据化学( 或物理) 的选取标准尽可能把有 关又易于获得的因素( 特征量) 都提取出来,然后借助于数学方法,筛选出对分 类作用影响大的特征量,使特征量的数目( 在保证良好分类效果的前提下) 减到 最小。多余的特征量不会给分类带来多大益处,却有可能干扰分类过程。所以, 特征的抽取是模式识别工作成败的关键。 3 2 1 茶叶光谱数据的粗筛选 本研究一共涉及全国各地名茶四十种,各种茶叶训练集中样本的漫反射红外 光谱图如图3 5 所示。其中y i 、y 2 、y 3 、y 4 、g 3 、x 3 、d 2 、d 3 、d 4 、d 5 十 种茶叶的漫反射红外光谱图在1 8 0 0 9 0 0e m 。1 波数段内的吸收特征与其它3 0 种茶 叶的光谱图出现了较为明显的差异,已经可以将它们区分开来。如图3 5 所示, 其它3 0 种茶叶红外光谱图( 图中排列较为密集的部分) 在该波数段主要的吸收 峰出现在】6 4 2 c m 一、1 5 2 6 e m 、1 4 5 l c m 一、1 3 5 7 c m 、1 3 1 6 e m 、1 2 3 7 c m 、1 1 5 3 e m 、 1 0 3 9 c m 。1 几处,且只具有非常细微的差别;然而,y i 、y 2 、y 3 、y 4 、g 3 、x 3 、 d 2 、d 3 、d 4 、d 5 十种茶叶的漫反射红外光谱图在这一波数段的吸收峰同这3 0 种茶叶的红外谱图相比,或者轮廓不同,或者出现了其它吸收,局部放大图3 - 6 2 4 第三章光谱数据的预处理及其特征提取 更加明显地反映了这些不同。 定 雪 窖 雪 图3 - 5 五种茶叶种类的漫反射红外光谱图 伽1 瑚彻姗1 枷1 3 r c o1 1 伽卸 v t _ 1 m _ ( c m - i l 图3 - 6 五种茶叶漫反射红外光谱对比图( 局部放大图) 从图3 - 6 中可以看出,苦丁茶与其它茶叶光谱的图的差异最为突出,在图中 所示波数段内,苦丁茶的漫反射红外光谱图的轮廓有着显著的特点:1 7 2 8 c m 、 1 6 8 5 c m 。和1 5 9 9 c m 。三处强吸收是在其它茶叶的光谱图上看不到的,它们的吸 收甚至掩盖了在其它茶叶光谱图上较强的1 6 5 0 c m o 处的吸收峰;另外,在其它 波数段内,其它茶叶较为明显的吸收在苦丁茶的光谱图上也几乎被掩盖了,而且 在1 2 7 1c m 1 处还出现了其它茶叶光谱图上见不到的较强吸收峰。上述几点已经 江南大学硕士学位论文 可以作为苦丁茶光谱的特征使得它与其它茶叶分别开来了。苦丁茶1 5 9 】从狭义上来 讲,其实并不是“茶叶”,茶树属多年生木本植物,苦丁茶属冬青苦丁茶冬青植 物,只是因其成品的外形与茶叶相似而被称为“茶”。苦丁茶也有很多品种,本 研究中所选用的是产自广东的冬青大叶苦丁茶。苦丁茶含有2 0 0 多种化学成份, 其中只有部分与茶叶相似,如含有叶绿素、多酚类物质、游离氨基酸、维生素和 少量生物碱等有益成份,但由于树种不同,苦丁茶和茶叶在生长过程中具有不同 的代谢类型,所以它们在很多成分的组成和含量上存在较大差异,尤其是儿茶素 和咖啡碱的含量远低于茶叶种类,约为茶叶的l 不到,而黄酮类物质却远远高 于茶叶,这可能是造成它们红外谱图差异的主要原因。 除了上述苦丁茶这种非茶树种茶叶可以由红外光谱使其与其它茶叶区别外, 在本研究所涉及的茶叶产品中,另外两种茶叶的红外光谱图也出现了较为明显的 特征。如图3 - 6 所示,它们就是普洱茶和沱茶。由于本研究所选用的沱茶是由普 洱茶制得的紧压茶,所以这两种茶叶光谱图几乎完全相似。然而,这两种茶叶与 其它茶叶的区别从漫反射红外光谱图上还是有了非常清晰地反映。就如图3 石所 示的波数段而言,普洱茶与其它茶叶的红外吸收大体上还是相同的,如1 6 5 0 e m 1 、 1 5 2 6 c m 一、1 4 5 1 e m 、1 3 6 9 c m l 、1 3 2 9 e m 、1 2 3 9 e m 1 、1 2 1 2 c m - 1 、1 1 4 5 c m l 等几 处较为尖锐的吸收峰在普洱茶的红外图上也可以看到,虽然相对的强度有所不 同。然而,普洱茶的红外光谱图在1 3 6 9 c m l 、1 3 2 9 c m 。1 处的吸收明显强于其它茶 叶,而且两峰之间的分离度明显好于红茶和绿茶的光谱图,普洱茶上这两峰之间 有明显的下凹;另外,普洱茶的光谱图上1 2 8 4 e m “处出现了较强的吸收峰,而 在其它茶叶的红外光谱图上,该处的吸收或是很不明显,或仅是一个肩峰,相反, 在1 1 4 5 c m “处,普洱茶的红外谱图却仅是一个较为明显的肩峰,这是在它附近 1 1 l o e m 。1 处出现了更强的吸收而将它掩盖的缘故。上述几处不同已经使得普洱茶 及其紧压茶一沱茶在1 4 0 0 c m 4 1 0 0 0 c m 。1 波数段出现了与众不同的轮廓,从而仅 通过此区域红外光谱同标准( 本研究中则为训练集样本的平均光谱) 的比对就可 以将预测集样本中的普洱茶与沱茶判别出来。 更进一步讲,普洱茶之所以在红外谱图上有如此明显的特征也是同其特殊的 化学成分的组成息息相关的。普洱茶有很多品种1 6 0 ,本研究选用的是云南普洱茶。 它的原料是云南大叶种茶叶,这种生长在红土高原的大叶种茶有着它固有的生长 环境和固有的成分;另外普洱茶制造工艺较为特殊是晒青毛茶经过多次后发 酵,在一定温度条件下完成茶叶杀青、干燥,使其保有生命活性,所以在随后的 多次发酵和贮存过程中实现了复杂的转化。其中较为显著的是普洱茶的多酚类成 分组成的改变,简单的儿茶素衍生物大量消失,形成大量的多聚体和氧化产物。 在没食子酸的含量显著增加的同时,以普洱茶素为代表的新类型的儿茶素衍生物 成为普洱茶的特征成分。这些也是造成其红外谱图特征的主要原因。 虽然红茶的制作从原料到工艺上同绿茶有很大差别 6j l ,但在红外光谱图上只 第三章光谱数据的预处理及其特征提取 能看到一些不太显著的差异。总体上看,红茶的红外光谱图在图3 - 6 所示区域内 较绿茶更为缓和一点,各强吸收之间的下凹幅度不像绿茶那么大,在1 4 0 0 c m 1 1 0 0 0 c m 。1 波数段内,红茶看起来似乎处于绿茶与普洱茶的“过渡状态”,既保持 了绿茶红外光谱的特征,又同普洱茶有几分相似。 综上所述,本研究将全部四十种茶叶进行粗筛选,发现苦丁茶( 编号为y 3 ) 、 普洱茶( 编号为d 4 ) 、沱茶( 编号为d 5 ) 三种茶叶的原始漫反射红外光谱图具 有人眼可以识别的特征,不需要借助计算机就可以将其同本研究中的其它种类的 茶叶区分。在后面的工作中,为了简化模型,减小计算量,就不再包括这三种茶 叶的判别模型了。 3 2 2 光谱波数段的选择 在有些光谱区域,样品的有效光谱差异很小,即光谱信息很弱,或者样品光 谱与样品的性质或组成之间缺乏线性相关关系,不能提供样品结构的信息。另外, 由于光谱仪器噪声的影响,一些波段的样品光谱信噪比( s n ) 较低,光谱质量 较差。因此光谱波段的选择对于提高模型的分类判别效果极为重要。 : 口 3 w a v e n u m b e r s ( c r n - 1 ) 图3 - 7 茶叶平均光谱与一阶、二阶导数光谱 ,i 图3 7 为剩余3 7 种茶叶光谱的平均光谱及其一阶导数谱和二阶导数谱。从 j 平均光谱图上可以看出,茶叶漫反射红外光谱主要有两个波数段的吸收一 “3 7 0 0 c m 1 2 2 0 0 c m q ( 以下称区域i ) 和1 8 0 0 c m 。1 l 9 7 吵m 。1 ( 以下称区域i i ) 。区 。域i 内3 7 0 0 c m 。1 3 0 0 0 c m 1 在原始光谱中出现很明显的吸收,主要为o h 的伸 2 7 s1|c3j鱼qj ”gcj巴!cu 江南人学硕1 :学位论文 缩振动,在一阶导数谱中只出现了一个吸收且基线不平,而在二阶导数谱中只看 到明显的类似噪声的波动
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 项目管理过程中的反馈与改进策略试题及答案
- 宁夏中卫市本年度(2025)小学一年级数学统编版专题练习((上下)学期)试卷及答案
- 小学课题申报书范例
- 项目管理学术评价试题及答案
- 注会考生个性的试题与答案
- 2025年证券从业资格证考试关键考点试题及答案
- 2025年证券从业资格考试的练习题试题及答案
- 四川省泸州市龙马潭区2025年中考语文一模试卷(含答案)
- 准确识别项目管理考试的题型和难度试题及答案
- 关于课题申报书字号
- 压力管道安装质量证明书及汇总表最新
- 武汉市控制性详细规划编制技术规程610
- 电子显微分析试题集1
- ANCA相关性小血管炎
- 服装面料采购合同
- 斯伦贝谢定向钻井和旋转导向
- 自动扶梯单台用册
- 安全工器具检测报告.doc
- 大学语文(高职版) 教学课件 ppt 作者 徐中玉 44 论读书 第四十四课 论读书
- 食品安全管理制度(企业)食品安全管理制度
- 人教版七下英语新课堂答案青岛出版社
评论
0/150
提交评论