




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学数据挖掘期末论文数据挖掘技术在中医方剂研究中应用的探讨学生姓名专业学院2021年6月数据挖掘技术在中医方剂研究中应用的探讨湛薇摘要:现有的中医方剂数据存在冗余大的、不一致的、无效的噪声数据,降低了中医方剂数据的利用,且其方剂数据需要更加高效的存储、查询以及共享.而数据库技术融汇了人工智能、模式识别、模糊数学、数据库、数理统计等多种技术方法专门用于海量数据的处理1,从而解决中医方剂研究中所存在的问题,提升利用效率并且开掘潜在信息.本文利用关联规那么、聚类分析、分类模式等数据挖掘方法,揭示方剂配伍规律的研究,对中医方剂信息的问题进行探讨.关键词:中医方剂;数据挖掘技术;关联规那么;聚类分析;分
2、类模式DataminingtechnologyappliedinthestudyofprescriptionoftraditionalChinesemedicineZhanWei【Absract:ExistingintraditionalChinesemedicineprescriptiondataredundancy,bignoise,inconsistent,invaliddata,reducestheuseoftraditionalChinesemedicineprescriptiondata,andtheprescriptiondataneedtobemoreefficientstor
3、age,queryandsharing.Andthedatabasetechnologyofartificialintelligence,patternrecognition,fuzzymathematics,database,mathematicalstatisticsandsoonthemanykindsoftechnicalmethodsspecificallyformassdataprocessing1,soastosolvetheproblemsintheresearchofTCMprescriptionsandimprovetheutilizationefficiencyandex
4、plorepotentialinformation.Basedonassociationrule,clusteringanalysisanddataminingmethodssuchasclassificationmodel,revealsthelawofherbalresearch,discussestheproblemofprescriptionoftraditionalChinesemedicineinformation.Keywords:PrescriptionsoftraditionalChinesemedicine;Dataminingtechnology;Associationr
5、ules;Clusteringanalysis;Classificationmodel1引言中医学信息化在这几年来开展迅速,大量中医方剂数据库已被构建与完善,但中医方剂的数据挖掘方面依然有很多亟待解决的问题.虽然众多已经构建的方剂数据库都是经过一系列的校正后的结构化数据库,但由于在浩瀚的中医历史之中,其年代跨度实在太大、朝代变更下使用的文字、记叙方式与特点的差异悬殊,使得方剂信息依然不可防止的会出现方剂数据不一致、错误、冗余等问题.数据挖掘技术在数据中正规地发现有效的、新奇的、潜在有用的,并且最终可以被读懂的模式的过程.具有善于挖掘超大型数据库、非手工地发现隐含知识、增进人类知识的特点2,因此
6、,数据挖掘技术对于中医方剂研究所存在冗余的、不一致的、错误的等一系列噪声数据的解决具有重大意义.另一方面,而中医方剂配伍从本质上来说表现在方与方、药与药、方与药、药与剂量,以及方药与病、症之间的交叉错综的关联与对应.数据挖掘正是通过数据特征、关系、聚类、趋向、偏差和特例现象深层的多维分析,来揭示数据间复杂特殊的关系,发现隐含规那么模式和规律.2方剂配伍研究中的数据挖掘方法2.1 关联规那么关联规那么是数据挖掘中的一项重要技术,反映大量数据中工程集之间的关联和相关联系.关联规那么也是目前用于中医方剂配伍研究中最经典的一种方法,一般通过降维处理将复杂的病、症、方、药关系分解,研究药与药、方与方、药
7、与病症等两者之间的关系.基于关联规那么的研究呈现如下特点:主要研究药与药之间的关联关系,其他病症、病方之间的关系研究得较少,研究对象包括某一类方或者治疗某一病症的方剂.研究方法不能证明具有普遍适用性;关联规那么的算法参数,即最小支持度大局部为10%£右,支持度偏小,使得发现的关联关系的可信度不高.2.2 聚类分析聚类分析即根据相似性和差异性的分布,将数据对象根据不同的属性特征聚集为不同的类,然后结合领域知识对方剂的配伍规律进行分析.聚类分析的算法有很多种,如基于划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法、基于网格的聚类算法等,不同算法在不同领域以及数据集上得到应用.在方剂
8、配伍规律分析领域,使用较多的事层次聚类方法,也可采用模糊聚类方法建立模糊相似矩阵类分析药物之间的相似度.模糊聚类方法以模糊数学中的聚类方法为理论根底,通过建立模糊矩阵最终获得聚类结果,其方法简单易行,在处理小数据量上可以收到较好效果.层次聚类算法可以对给定的数据集进行层次的分解,直到某种条件满足为止,具体分为凝聚和分裂两种方法.该算法简单快捷而且能有效地处理大数据集,但是合并或者分裂点的选择至关重要,直接决定了聚类结果的质量.采用模糊聚类的研究对象多是古代经典名方,研究内容是具体方剂的组成原那么,即方中君臣佐使药物确实定,验证结果的方法是中医方剂的传统理论,此种研究尚处于探索阶段.而其结果的准
9、确性未被广泛验证,但是该方法对于方剂配伍规律的理解以及配伍标准化具有重要作用.层次聚类算法的研究对象为治疗某一病症的复方,依据单味药成效进行聚类,获得假设干个药物组合类别,结合病的临床病症推断证型和用药,这种研究方法在一定程度上研究了药证与药方之间的关系,并对临床治疗疾病具有指导意义.2.3 分类模式分类模式是根据数据集的特点构造一个分类器,利用分类器对未知的样本赋予类别的一种技术.分类算法主要有决策树、人工神经网络、贝叶斯网络等.不同分类方法会产生不同的分类器,分类器的优劣直接影响数据挖掘的效率与准确性.通过分类模式可以实现多角度的方剂分类和方剂成效的判定.在方剂的分类模式研究当中,目前常用
10、的分类算法有人工神经网和支持向量机方法.运用这些方法基于的方剂分类标准,可以将大量方剂根据组方药物的成效、性味或归经等众多维度、多角度分成假设干类,或判定单个方剂的成效,从而对理解方剂中药与药、药与法、药与证等之间的关系奠定研究根底.着方面的研究虽然取得某些成果,形成了多个方剂分析系统,但是涉及的练习集仅是治疗某些病症或者一部著作记载的方剂,缺乏选取大量数据对这些系统的分析结果进行验证.因此分类模式研究方剂配伍规律有待选择多种算法开展深入研究.2.4 研究方法的分析首先,从采取的数据来源看,主要有三类.一类是以现有的中医文献数据库或者辞典为根底选取治疗某类疾病的方剂作为研究的数据;一类是以某段
11、时期的文献为根底选取治疗某类疾病的方剂作为研究的数据;还有一类是以一些名医的临床治疗处方作为研究数据.总体来看,方剂文献的来源趋向于多样性,这给方法的有效性和深入性地研究带来了难度.其次,基于当前的文献研究,可以依据拟解决的问题对前面提到的三种数据挖掘方法的适用范围归类.关联规那么所解决的问题包括:治疗某一病症的用药规律,即药物间的关系;病症间的关系;药和病症的关系;药和证的关系.聚类分析所解决的问题包括:方剂中药物君臣佐使的配伍关系;治疗某一病或证的根底方法.分类模式所解决的问题包括:方剂的成效归纳,方剂的属性归纳.最后,从挖掘对象来看,呈现多样性.从单味药到一类药;从单个复方剂或治疗某一病
12、症的复方.其中关联规那么挖掘的对象包括治疗某一病症的复方、某一类复方、某一类药等,分类模式挖掘的对象包括某一类方网.3数据挖掘以分类关联规那么为例,在分类关联规那么挖掘中,支持度和置信度是描述分类关联规那么兴趣度的两项重要指标.支持度反映规那么的普遍性,置信度反映规那么的可靠性4.假设最小支持度阈值取2%犹豫?伤寒杂病论?中的方剂数量为286首,286X2%>5,意味着要选择频次大于5的要不进行分析.综合仲景标准DB数据库,认为此最小支持度阈值的取值对研究可行.置信度白公式Confidence(A->B)=P(AIB),揭示了A出现时,B是否也会出现或有多大的概率出现.如果置信度为
13、100%W说明A出现时B必定会出现;如果置信度太低,那么说明A的出现于B是否出现关系不大,故最小置信度阈值为50%数据挖掘局部结果如表1至3所示.技1Zf西己IHlhl内关打工W见Ml表守趣那么削忤次Mg后ft里归度现刈中各类n一h-配伍哂性(X>bAUtic"-'-5?H令人什皎A杯桢一131旧T-一»-+-*»*H7为疗八随比*1M1IOUMK11M3aa.-4口一105人电八广1术?一<-*1<X)心<>13一一-F-r-.八21CM<'1A口l1ft卜一回|IM1机*1125-*-a-*-a-表之方剂配伍
14、与炳仁E关联现那么较庠琳那么面杵现M后件M值度理那么迎叫加件号t方刑配伍?病t毋)w散领政力剂数,P-F«.»*-,pn*31H-卓门H8小蟀帧】一iMSQ714ISa-««WT+a+«a«««*s7半鸵卿华A短咏户1iM比5710721-M-*a*-*-»-12ri.空八人跟四黄萼卜一<MUXIONBB24*a*-*-NBB-u-22f1&A附子>一(4>)72.7,K1155-X=-*-*-H4=-2Sf半旦人十美"儿荽f哄门HHk775K-上-*-*-*-
15、7;a-表3方刑配伍L同於左联觇那么表仔规那么的件规那么后件置信度MM战婚前件各类号?方剂配伍f耦箝(惴i二款颐数方剂粗111T草丸也枝儿大学立大黄ItL诩iao66他27,麻黄人细辛A黄连1一南明心100'1FTII回附于上耳朴1*1少用病】LOO66fi511自芍A人器人黄茶J一19同病1100I2.17)=+B-14-F*WPFIB»-i-P-F桂枝A阿腹1f【厥阴病1100447通过数据挖掘,发现以下规律:按病性归类时,多项选择用麻黄、桂枝、生姜、大葱等辛热之品来治疗寒证;多项选择用黄苓与其他补虚或泻火实药配伍来治疗热证;多用茯苓、甘草、附子、白术等来治疗虚证;多用甘
16、草、麻黄、杏仁等药来治疗在表的疾病;病位在里的疾病,如治疗病位在脾胃的疾病那么多项选择用细辛、五味子、半夏、干姜等;治疗病位在胆的那么多项选择用柴胡、黄苓等.按病势归类时,发现治疗太阳病时一般选用桂枝、生姜、甘草、大枣、大黄;治疗阳明病一般选用黄连、柴胡等;治疗少阳病一般选用桂枝、白芍、大枣、甘草、厚朴等;治疗少阴病一般选川乌、人参、白芍、黄茂等.综上,得出?伤寒杂病论?中的条文在治疗疾病时.多根据所治疾病的病性、病位和病势的不同来选择、搭配使用不同药物.4总结本文分析了数据挖掘技术在中医方剂研究中应用的探讨,对几种方剂配伍研究中的数据挖掘方法进行详细的分析,也利用数据挖掘技术研究?伤寒杂病论?中的方剂药物配伍规律,通
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025在线咨询服务合同
- 2025年上海市农产品买卖合同范本
- 2025法律顾问审核版工程活动隔断合同
- 发电机租赁合同
- 上海市买卖合同范本
- 彩钢围挡制作安装合同范本
- 劳动合同法(本科)形考任务1-4
- 2025授权产品合同模板版本
- 产品授权经营协议书
- 2025年03月咸阳事业单位研究生公开招聘(90人)笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 贵州国企招聘2025六盘水市公共交通有限公司招聘合同制驾驶员30人笔试参考题库附带答案详解
- 贵阳语文初一试题及答案
- 机器人舞蹈表演行业深度调研及发展战略咨询报告
- 山西省晋中市榆次区2025年九年级中考一模数学试卷(原卷版+解析版)
- 2025年广东省佛山市南海区中考一模英语试题(原卷版+解析版)
- 论公安机关刑事立案制度:现状、问题与优化路径
- 2023-2024学年广东省广州市越秀区执信中学七年级(下)期中数学试卷(含答案)
- 全国职业院校技能大赛高职组(建筑信息模型建模与应用赛项)备赛试题库(含答案)
- 上海市农村房地一体宅基地确权登记工作实施方案
- 硬脊膜动静脉瘘的护理查房
- CNAS-SC170:2024 信息安全管理体系认证机构认可方案
评论
0/150
提交评论