下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学数据挖掘期末论文数据挖掘技术在中医方剂研究中应用的探讨学生姓名专业学院2016年6月数据挖掘技术在中医方剂研究中应用的探讨湛薇摘要:现有的中医方剂数据存在冗余大的、不一致的、无效的噪声数据,降低了中医方剂数据的利用,且其方剂数据需要更加高效的存储、查询以及共享。而数据库技术融汇了人工智能、模式识别、模糊数学、数据库、数理统计等多种技术方法专门用于海量数据的处理1,从而解决中医方剂研究中所存在的问题,提高利用效率并且发掘潜在信息。本文利用关联规则、聚类分析、分类模式等数据挖掘方法,揭示方剂配伍规律的研究,对中医方剂信息的问题进行探讨。关键词:中医方剂;数据挖掘技术;关联规则;聚类分析;分类模
2、式DataminingtechnologyappliedinthestudyofprescriptionoftraditionalChinesemedicineZhanWei【Absract:ExistingintraditionalChinesemedicineprescriptiondataredundancy,bignoise,inconsistent,invaliddata,reducestheuseoftraditionalChinesemedicineprescriptiondata,andtheprescriptiondataneedtobemoreefficientstorag
3、e,queryandsharing.Andthedatabasetechnologyofartificialintelligence,patternrecognition,fuzzymathematics,database,mathematicalstatisticsandsoonthemanykindsoftechnicalmethodsspecificallyformassdataprocessing1,soastosolvetheproblemsintheresearchofTCMprescriptionsandimprovetheutilizationefficiencyandexpl
4、orepotentialinformation.Basedonassociationrule,clusteringanalysisanddataminingmethodssuchasclassificationmodel,revealsthelawofherbalresearch,discussestheproblemofprescriptionoftraditionalChinesemedicineinformation.Keywords:PrescriptionsoftraditionalChinesemedicine;Dataminingtechnology;Associationrul
5、es;Clusteringanalysis;Classificationmodel1引言中医学信息化在这几年来发展迅速,大量中医方剂数据库已被构建与完善,但中医方剂的数据挖掘方面依然有很多亟待解决的问题。虽然众多已经构建的方剂数据库都是经过一系列的校正后的结构化数据库,但由于在浩瀚的中医历史之中,其年代跨度实在太大、朝代变更下使用的文字、记叙方式与特点的差异悬殊,使得方剂信息依然不可避免的会出现方剂数据不一致、错误、冗余等问题。数据挖掘技术在数据中正规地发现有效的、新颖的、潜在有用的,并且最终可以被读懂的模式的过程。具有善于挖掘超大型数据库、非手工地发现隐含知识、增进人类知识的特点2,因此,数
6、据挖掘技术对于中医方剂研究所存在冗余的、不一致的、错误的等一系列噪声数据的解决具有重大意义。另一方面,而中医方剂配伍从本质上来说表现在方与方、药与药、方与药、药与剂量,以及方药与病、症之间的交叉错综的关联与对应。数据挖掘正是通过数据特征、关系、聚类、趋向、偏差和特例现象深层的多维分析,来揭示数据间复杂特殊的关系,发现隐含规则模式和规律。2方剂配伍研究中的数据挖掘方法2.1 关联规则关联规则是数据挖掘中的一项重要技术,反映大量数据中项目集之间的关联和相关联系。关联规则也是目前用于中医方剂配伍研究中最经典的一种方法,一般通过降维处理将复杂的病、症、方、药关系分解,研究药与药、方与方、药与症状等两者
7、之间的关系。基于关联规则的研究呈现如下特点:主要研究药与药之间的关联关系,其他病症、病方之间的关系研究得较少,研究对象包括某一类方或者治疗某一病症的方剂。研究方法不能证明具有普遍适用性;关联规则的算法参数,即最小支持度大部分为10%£右,支持度偏小,使得发现的关联关系的可信度不高。2.2 聚类分析聚类分析即按照相似性和差异性的分布,将数据对象按照不同的属性特征聚集为不同的类,然后结合领域知识对方剂的配伍规律进行分析。聚类分析的算法有很多种,如基于划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法、基于网格的聚类算法等,不同算法在不同领域以及数据集上得到应用。在方剂配伍规律分析领域
8、,使用较多的事层次聚类方法,也可采用模糊聚类方法建立模糊相似矩阵类分析药物之间的相似度。模糊聚类方法以模糊数学中的聚类方法为理论基础,通过建立模糊矩阵最终获得聚类结果,其方法简单易行,在处理小数据量上可以收到较好效果。层次聚类算法可以对给定的数据集进行层次的分解,直到某种条件满足为止,具体分为凝聚和分裂两种方法。该算法简单快捷而且能有效地处理大数据集,但是合并或者分裂点的选择至关重要,直接决定了聚类结果的质量。采用模糊聚类的研究对象多是古代经典名方,研究内容是具体方剂的组成原则,即方中君臣佐使药物的确定,验证结果的方法是中医方剂的传统理论,此种研究尚处于探索阶段。而其结果的准确性未被广泛验证,
9、但是该方法对于方剂配伍规律的理解以及配伍规范化具有重要作用。层次聚类算法的研究对象为治疗某一病症的复方,依据单味药功效进行聚类,获得若干个药物组合类别,结合病的临床症状推断证型和用药,这种研究方法在一定程度上研究了药证与药方之间的关系,并对临床治疗疾病具有指导意义。2.3 分类模式分类模式是根据数据集的特点构造一个分类器,利用分类器对未知的样本赋予类别的一种技术。分类算法主要有决策树、人工神经网络、贝叶斯网络等。不同分类方法会产生不同的分类器,分类器的优劣直接影响数据挖掘的效率与准确性。通过分类模式可以实现多角度的方剂分类和方剂功效的判定。在方剂的分类模式研究当中,目前常用的分类算法有人工神经
10、网和支持向量机方法。运用这些方法基于已知的方剂分类标准,可以将大量方剂按照组方药物的功效、性味或归经等众多维度、多角度分成若干类,或判定单个方剂的功效,从而对理解方剂中药与药、药与法、药与证等之间的关系奠定研究基础。着方面的研究虽然取得某些成果,形成了多个方剂分析系统,但是涉及的训练集仅是治疗某些病症或者一部著作记载的方剂,缺乏选取大量数据对这些系统的分析结果进行验证。因此分类模式研究方剂配伍规律有待选择多种算法开展深入研究。2.4 研究方法的分析首先,从采取的数据来源看,主要有三类。一类是以现有的中医文献数据库或者辞典为基础选取治疗某类疾病的方剂作为研究的数据;一类是以某段时期的文献为基础选
11、取治疗某类疾病的方剂作为研究的数据;还有一类是以一些名医的临床治疗处方作为研究数据。总体来看,方剂文献的来源趋向于多样性,这给方法的有效性和深入性地研究带来了难度。其次,基于当前的文献研究,可以依据拟解决的问题对前面提到的三种数据挖掘方法的适用范围归类。关联规则所解决的问题包括:治疗某一病症的用药规律,即药物间的关系;症状间的关系;药和症状的关系;药和证的关系。聚类分析所解决的问题包括:方剂中药物君臣佐使的配伍关系;治疗某一病或证的基础方法。分类模式所解决的问题包括:方剂的功效归纳,方剂的属性归纳。最后,从挖掘对象来看,呈现多样性。从单味药到一类药;从单个复方剂或治疗某一病症的复方。其中关联规
12、则挖掘的对象包括治疗某一病症的复方、某一类复方、某一类药等,分类模式挖掘的对象包括某一类方网。3数据挖掘以分类关联规则为例,在分类关联规则挖掘中,支持度和置信度是描述分类关联规则兴趣度的两项重要指标。支持度反映规则的普遍性,置信度反映规则的可靠性4。若最小支持度阈值取2%犹豫伤寒杂病论中的方剂数量为286首,286X2%>5,意味着要选择频次大于5的要不进行分析。综合仲景标准DB数据库,认为此最小支持度阈值的取值对研究可行。置信度白公式Confidence(A->B)=P(AIB),揭示了A出现时,B是否也会出现或有多大的概率出现。如果置信度为100%W说明A出现时B必定会出现;如
13、果置信度太低,则说明A的出现于B是否出现关系不大,故最小置信度阈值为50%数据挖掘部分结果如表1至3所示。技1Zf西己IHlhl内关打工W见Ml表守趣则削忤次Mg后ft里归度现刈中各类n一(h-配伍(哂性(X>bAUtic"-'-5H令人什皎A杯桢)一131旧T-一»-+-*»*H7(为疗八随比)*1M1IOUMK11M3aa.-4口一105(人电八广1术一<-*1<X)心<>13一一-F-r-.八21CM<'1A口l1ft卜一回|IM1机*1125-*-a-*-a-表之方剂配伍与炳仁E关联现则较庠琳则面杵现M后
14、件M值度理则迎叫加件号t方刑配伍(病t毋)w散领政力剂数,P-F«.»*-,pn*31H-卓门H8小蟀帧】一iMSQ714ISa-««WT+a+«a«««*s7半鸵卿华A短咏户1iM比5710721-M-*a*-*-»-12ri.空八人跟四黄萼卜一<MUXIONBB24*a*-*-NBB-u-22f1&A附子>一(4>)72.7,K1155-X=-*-*-H4=-2Sf半旦人十美"儿荽f(哄门)HHk775K-上-*-*-*-»a-表3方刑配伍L同於左联觇则表
15、仔规则的件规则后件置信度MM战婚前件各类号方剂配伍)f耦箝)(惴i二款颐数方剂粗111T草丸也枝儿大学立大黄ItL诩iao66他27,麻黄人细辛A黄连1一南明心100'1FTII回附于上耳朴1*1少用病】LOO66fi511自芍A人器人黄茶J一19同病1100I2.17)=+B-14-F*WPFIB»-i-P-F桂枝A阿腹1f【厥阴病1100447通过数据挖掘,发现以下规律:按病性归类时,多选用麻黄、桂枝、生姜、大葱等辛热之品来治疗寒证;多选用黄苓与其他补虚或泻火实药配伍来治疗热证;多用茯苓、甘草、附子、白术等来治疗虚证;多用甘草、麻黄、杏仁等药来治疗在表的疾病;病位在里的疾病,如治疗病位在脾胃的疾病则多选用细辛、五味子、半夏、干姜等;治疗病位在胆的则多选用柴胡、黄苓等。按病势归类时,发现治疗太阳病时一般选用桂枝、生姜、甘草、大枣、大黄;治疗阳明病一般选用黄连、柴胡等;治疗少阳病一般选用桂枝、白芍、大枣、甘草、厚朴等;治疗少阴病一般选川乌、人参、白芍、黄茂等。综上,得出伤寒杂病论中的条文在治疗疾病时。多根据所治疾病的病性、病位和病势的不同来选择、搭配使用不同药物。4总结本文分析了数据挖掘技术在中医方剂研究中应用的探讨,对几种方剂配伍研究中的数据挖掘方法进行详细的分析,也利用数据挖掘技术研究伤寒杂病论中的方剂药物配伍规律,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《卵巢巧克力囊肿》课件
- 《再生纸产品碳足迹量化评价与通报要求》
- 秋学期思想政治理论课程《思想道德修养与法律基础》-第三章-课件编号-07
- 2025房屋转让协议合同书
- 川省消防支队聘用合同
- 二零二五年抚养权变更与子女抚养费调整合同3篇
- 2025聘用书合同范本范文
- 酿酒公司法务聘用合同
- 沈阳市二手房评估合同
- 2025保险代理合同书样本
- 自身免疫性脑炎课件
- 人力资源管理各岗位工作职责
- 信阳农林学院《新媒体传播学》2023-2024学年第一学期期末试卷
- 2024建筑公司年终工作总结(32篇)
- 信息安全意识培训课件
- 2024年项目投资计划书(三篇)
- 配电安规课件
- 中国高血压防治指南(2024年修订版)解读课件
- 沥青路面施工安全培训
- 机电设备安装施工及验收规范
- 仓库安全培训考试题及答案
评论
0/150
提交评论