基于红外光谱数据的中药药性识别研究_第1页
基于红外光谱数据的中药药性识别研究_第2页
基于红外光谱数据的中药药性识别研究_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于红外光谱数据的中药药性识别研究                          作者:刘进,邓家刚,覃洁萍,冯旭,王丽丽,罗祖良,韦日伟【摘要】  目的探讨中药红外光谱与药性的相关性。方法以红外光谱数据为分类指标,用主成分分析提取主成分,然后采用交叉验证法对不同药性中药进行交叉训练,建立中药药性的预测模型。结果该模型对预测集中平性药的识别正确

2、率为83.33%,对非平性药的识别正确率为82.5%,总正确率82.89%,结论中药红外光谱与药性具有一定的相关性。 【关键词】  主成分分析; 支持向量机; 红外光谱; 中药药性Abstract:ObjectiveTo explore the relationship between the properties of traditional Chinese medicine (TCM) and infrared spectrum data.MethodsThe infrared spectrum data of TCM were selected as indexes, and

3、the principal components of the data were found out through PCA and trained with cross validation method through SVM, so as to establish the neutral and non-neutral property of TCM prediction model. ResultsThe model recognition accuracy for the neutral medicine in prediction set was 83.33%, and 82.5

4、% for non-neutral medicine,which made up an accuracy of 82.89% in average.ConclusionThe infrared spectrum and properties of TCM have some relevance.Key words:PCA; SVM; Infrared spectrum; TCM property recognition红外光谱是利用物质分子对红外辐射的选择性吸收,用红外分光光度计测得的包含物质分子结构信息的光谱图。由于红外光谱具有特征性强、取样量小、简便迅速、准确等特点,近年来其应用得到较快的

5、发展,各国药典都将红外光谱作为法定的药物鉴别的主要方法,与此同时也越来越多地应用于中药材的识别研究。中医药是我国的传统医学宝库,中药药性理论是中国传统医药的核心理论之一,是中华医学理论体系中的一个重要组成部分。对中药药性的研究自古有之13,并已成为指导中医用药的指导原则4。然而,中药药性的机理至今尚未被人们所彻底了解,一般认为,中药中的化学成分或某些药效团是中药药性的物质基础5,6,但其与药性的相关性目前尚不为人知;由于红外光谱是利用物质的分子对红外辐射的吸收得到的与分子结构相应的红外光谱图,因此,如果中药中的化学成分或药效团确实与药性相关,那么其红外光谱与药性应具有一定的相关性。正是基于这种

6、想法,本文尝试将主成分分析技术与支持向量机方法相结合,利用中药红外光谱数据进行建模分析,探讨中药红外光谱数据与药性的相关性,取得了较好的效果。现报道如下。1 基本原理简介1.1 支持向量机分类原理支持向量机7(Support Vector Machine,SVM) 是从统计学习理论发展起来的一种机器学习方法, 该方法不仅支持小样本情况下的识别分类,而且具有较好的泛化性,从上世纪90年代初提出以来已成为模式识别的一个重要方法,目前已广泛应用于生产实践与科学研究的各个领域,例如文本的分类与识别8,9、蛋白质功能的预测10和药材的分类与识别11等,其分类原理是通过定义适当的内积函数(·)将

7、数据从输入空间映射到高维解空间,然后在这个高维解空间中构造超平面·(x) + b = 0再利用结构风险最小化原则,及Karush-Kuhn-Tucher条件,建立最优分类判别函数y(x) =signxiSViyiK(xi,x) + b这里K(xi,x) =(xi)T(x)称为核函数,xiSV称为支持向量。通过判别函数即可实现数据的分类。1.2 主成分分析将红外光谱原始数据作为支持向量机的输入,通常存在两个问题,第一,红外光谱数据一般都是高维向量,维数从几十到上千不等,导致向量变量与样本数的比值过大,直接影响支持向量机建模的可靠性;第二,红外光谱数据往往包含有大量的重叠信息,数据矩阵存

8、在大量线性相关的变量向量。因此利用支持向量机进行建模前,首先要对红外光谱数据进行压缩或降维,在保证不丢失光谱主要信息特征的前提下,将高维的光谱数据转化为低维数据,以作为支持向量机的输入。主成分分析法12(principal component analysis, PCA)是目前使用最广泛的线性降维方法之一,该方法的最大特点是对原数据进行线性变换,保留方差大、包含信息量多的变量,丢掉方差较小、包含信息量少的变量,然后通过重新线性组合求出新的分量,达到降低光谱数据维数的目的,其基本原理13是将被分析的数据矩阵Xm×n分解成下面形式:X = TPT + E其中Tm×a称为得分矩阵

9、,Pn×a称为载荷矩阵,Em×n为残差矩阵,T、P均为正交矩阵。在所能容忍的残差范围内,X近似地表示为X = TPT将式得分矩阵T移至左边,得T = XP从式可以看出,通过载荷矩阵P可以将原数据矩阵X投影到一个a维子空间,一般情况下,a远远小于原向量的维数n,于是实现了数据的降维。通常,a称为主成分数。2 方法2.1 药材本研究使用的76味中药的药材名称、产地及药性见表1。其中,平性药36味,寒凉药20味,温热药20味。表1 76味中药材药名、产地、药性列表药名产地药性药名产地药性药名产地药性蒲黄山东平桑寄生广西 平细辛吉林温热桃仁河北平牛膝河南 平花椒四川温热合欢皮四川平

10、秦艽甘肃平丁香广东温热川牛膝四川平仙鹤草浙江平高良姜广东温热血竭广西平大血藤河南 平丹皮安徽寒凉三棱江苏平矮地茶广西平赤芍湖南寒凉王不留行江苏平大血藤江西平大黄甘肃寒凉苏木广西平大血藤湖南平丹参河北寒凉银杏叶广西平藕节湖南平益母草广西寒凉肿节风广西平丝瓜络江苏平薄荷湖南寒凉甘草内蒙古平川芎四川温热桑叶安徽寒凉红景天湖南平桂枝广西温热葛根河南寒凉卷柏广西平当归甘肃温热柴胡河北寒凉两面针广西平三七广西温热知母河北寒凉路路通广西平红花河南温热栀子江西寒凉木贼陕西平麻黄内蒙古温热夏枯草湖北寒凉芡实安徽平紫苏湖南温热板蓝根河北寒凉山药广西平荆芥江苏温热金银花湖南寒凉香附湖南平防风东北温热蒲公英河北寒凉仙

11、鹤草广西平苍术河北温热大青叶湖南寒凉茯苓云南平厚朴四川温热穿心莲广东寒凉香附山东平砂仁云南温热龙胆草内蒙古寒凉太子参江苏平豆蔻广西温热苦参山西寒凉山药河南 平附子四川温热玄参浙江寒凉枸杞宁夏平干姜四川温热半边莲安徽 平吴茱萸湖南温热2.2 仪器与实验参数设置2.3 样品制备与测试在本研究的前期工作中,曾对20种不同药性中药的石油醚、醋酸乙酯、乙醇、水不同溶剂提取部位的提取物红外光谱与药性的相关性进行过初步分析,结果显示醋酸乙酯部位的提取物红外光谱与药性相关性最好,因此本实验主要对醋酸乙酯提取物的红外图谱进行分析,具体制样方法如下:取表1所示76种中药样品粉末各2 g, 分置于50 ml锥形瓶中,分别加入醋

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论