综述与讲座数据挖掘技术在中医药研究中的应用_第1页
综述与讲座数据挖掘技术在中医药研究中的应用_第2页
综述与讲座数据挖掘技术在中医药研究中的应用_第3页
综述与讲座数据挖掘技术在中医药研究中的应用_第4页
综述与讲座数据挖掘技术在中医药研究中的应用_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、综述与讲座数据挖掘技术在中医药研究中的应用姜兆顺,倪青,林兰中图分类号R203文献标识码A 文章编号16816676(2006)11124003随着医学机构积累的数据越来越多,促进了医学信息包括中医药信息的数字化;如何利用海量信息为防控疾病提供科学依据,总结优化各种诊治方案,已引起业内专家的高度关注。于是数据挖掘技术在中医药研究被日益重视,它将有力促进中医药的现代化进程。1数据挖掘的概念、步骤及常用方法11数据挖掘概念、步骤数据挖掘(,)即数据库中的知识发现,是从大型数据库的海量数据中提取人们感兴趣的知识,这些知识是隐藏的、事先未知的、潜在有用的信息,挖掘的知识表现为概念、规则、规律、模式等形

2、式。数据挖掘的目的在于使用所发现的模式帮助解释当前的行为或预测未来的结果。挖掘步骤大致有:问题定义、数据提取、数据预处理、数据挖掘、知识评估、结果应用这六步。12数据挖掘常用方法121描述统计数据总结的目的是对数据进行从低层次抽象、浓缩到高层次,得出它的紧凑描述。最简单的数据总结方法是描述统计,它包括平均数、中位数、分位数等,它常和统计图配合应用。122关联规则关联规则从本质上讲是条件概率,即当发生时、同时出现的概率有多大?只要离较远就有意义。数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联包括简单关联、时序关联、因果关联。关联分析的

3、目的是找出数据库中隐藏的关联网。有时我们并不知道数据库中数据的关联函数,即使知道也不确定。因此关联分析生成的规则带有可信度。123分类和聚类这是最常用的技术。分类方法主要有:回归、决策树、神经网络。分类分析在数据挖掘中是一项重要任务。分类器的构造方法有统计方法、机器学习方法、神经网络方法等。聚类是根据事物本身潜在的特性研究对象分类的方法。通过聚类把一个数据集合中的个体按照相似性归成若干类别,使其“物以类聚”,将数据库中的记录划分为一系列有意义的子集。聚类要解决的就是实现满足这种要求的类的聚合。在进行聚类前,这些类别是潜在的,可分割的类的个数(聚类数)也是未知的。聚类大致分为统计方法、机器学习方

4、法、神经网络方法和面向数据库的方法等。124偏差检测数据库中的数据可能有一些异常记录,基金项目:北京市科委重大项目课题(编号:)作者单位:山东济南,济南军区总医院内分泌科北京,中国中医科学院广安门医院内分泌科检测这些偏差很有意义。偏差检测的基本方法是寻找观测结果与参照值之间有意义的差别。2中医病历中医学数据挖掘的特点目前中医病历中采集的中医学信息具有如下特点。21症状的模糊性中医学对疾病的诊断是通过望、闻、问、切的四诊合参,获取有用信息,再结合医生的经验,对疾病做出诊断。症状的模糊性不仅表现在获得信息的形式多样,而且因中医症状存在着一症多名,或多症一名的现象,因此不同医生即使对同样的症状,可能

5、会用不同的文字加以描述,比如对“患者不欲进食”的记录,可能会有纳差、食欲不振、纳呆等的不同。这种模糊性模式加大了中医学数据挖掘的难度。22症状的不完整性病例和病案的有限性使医学数据库不可能对任何一种疾病信息都能全面地反映出来,表现为医学信息的不完全性。同时,许多医学信息的表达、记录本身就具有不确定和模糊性的特点,这方面在中医症状未做出标准量化方法并推行应用之前,尤为突出。疾病信息体现的客观不完整和描述疾病的主观不确切,形成了中医病历中医学信息的不完整性。23证候的复杂性著名的王永炎院士指出了证候具有动态时空、内实外虚、多维界面的特点,简明扼要的描述了证候的复杂性。中医证候的复杂性给数据挖掘增加

6、了难度,但这也恰好是数据挖掘发挥效力的用武之地。24治疗信息的个体化特性中医治病之本是辨证论治,体现在“三因治宜”、“同病异治、异病同治”等方面。即使针对同一疾病相同的证,医生的处方用药也可能会有差异。这种个体化的治疗,充分体现了中医治病的精髓,而其中所蕴涵的深奥哲理和规律,用一般的研究方法难以全面发掘。数据挖掘在这方面很可能会有很高的应用价值。25挖掘过程的复杂性中医药领域中的数据属性有离散型的,也有连续型和混合型的,对这些数据的噪声处理等预处理相当复杂,挖掘过程还需要人机交互、多次反复,其中任何一个环节都不能缺少专业人员。只有靠中医药专家的引导,针对具体问题,选择合理的挖掘方法,才能挖掘出

7、真正有价值的知识。在中医学数据挖掘中,应针对上述数据特点和挖掘目标,结合运用不同的挖掘方法,对非线性、不完全的信息进行智能处理,发挥各自的技术及其整合优势。3数据挖掘在中医药研究中的应用近年来,数据挖掘技术在中医药研究中已得到应用。有学者认为中医药数据挖掘是中医药现代化研究的重要组成部分。31中医药信息化研究姚氏等综合文献指出对中医药理论和实践进行信息化、数字化、知识化,能够克服中医名词术语过于繁杂造成的中医发展障碍,对于中医药信息进行文本数据挖掘是促进中医药信息结构化的途径之一,该问题的解决,能极大促进中医药现代化发展的进程。32中药研究陈凯先等认为对大量中药化学成分进行药效基团的建模研究,

8、并对中药化学成分数据库进行柔性搜索,能够为更充分利用中药化学成分所含的化学信息提供技术支持。冯雪松等对中药指纹图谱的特点及数据挖掘技术在其中的应用做了综述,指出中药指纹图谱由于反映了药用植物的“共有特征”,又由于地域、生长环境、采收等多种因素影响,具有统计数学中多元随机分布的模糊性”,利用模糊数学、统计学、计算机技术等建立一种同时反应这两种特征数据库,存储中药指纹图谱信息,应用数据挖掘技术发现和解析其中潜在的信息,以评价和控制中药质量及研究中药定量组效关系。33方剂研究乔延江等综述了在中药研究开发中的意义。乔氏等认为中药(复方)的研究是在中医理论指导下,以数据挖掘技术作为知识发现的主要环节,对

9、中药研发、设计、中医组方理论及规律、中药作用机制、构效关系、中药药效集团群的确认、化学成分及药理指标的预测等进行多方位、多学科、系统的现代化研究,是一个高度复杂的系统。其目的是建立传统中医理论同现代中药的科学化、系统化、可描述化的关系,是中医药现代化的重要组成部分。杨林等阐述了数据库技术与结合实现网上中医方剂的信息挖掘。将方剂文献资料进行全方位解析,设计内容详细的数据库与技术结合,通过开发了网上中医方剂信息分析处理系统,选择支持的数据库管理系统作为系统开发和运行平台。经过数据预处理、选择和筛选数据、确定分析目标、信息挖掘结果显示等阶段,完成对一批方剂数据的信息挖掘。姚美村等应用数据挖掘技术对治

10、疗消渴病的中药复方配伍的内涵进行探索性研究。以文献收录的个治疗消渴病的中药复方为对象,经解析后建立复方特征数据库;以数据挖掘系统为平台,在单味药层次上进行消渴病复方组成药味之间的关联规则分析研究,结果显示单味药、两味药组合、三味药组合的应用规律与历代中医在消渴病治疗用药方面的论述一致。挖掘结果的可信度可达到或接近中医专家的分析能力。秦首科等在构建方剂、中药和病症数据仓库的基础上,通过对数据仓库内部各种关联和映射关系的定义,利用中药和病症数据仓库的联机分析功能,探讨了方剂和其针对症状之间的联系。蒋永光等对从中医大辞典方剂分册中筛选出首脾胃方中的种药物,经用聚类分析、对应分析和频繁集方法,从功效、

11、归经、药性和药味等方面进行了分类特征分析,并就脾胃方的核心药物、方剂结构、“药对药”组和“方药证”的对应关联方面形成了有关技术规则和处理程序。34中医证候研究张世筠等应用流行病学和变量聚类分析的数理统计方法,对例中医肝证患者进行了初步研究。由调查组采集核对中医四诊资料,按肝证辨证记分标准记分,分为个证型。经过聚类分为实证、风证、虚证类,解决了中医各肝证的归属问题,本研究还定量地阐明肝的实证、虚证、风证的相互关系。白云静等在充分阐释证候系统的非线性、复杂性特征的基础上,探析了人工神经网络方法用于证候研究的可行性,并介绍了基于人工神经网络的证候研究方法。徐蕾等采用方法对例样本进行扩增以满足数据挖掘

12、对样本量的要求,采用基于信息熵的决策树算法建立中医辨证模型。通过决策树算法筛选出对辨证分型有意义的个因素,按其重要程度排序;产生出清楚易懂可用于分类的决策规则,建立辨证模型,模型分类符合率为:训练集,验证集,测试集;模型区分各类证型的灵敏度和特异度也较高。认为决策树算法建立的模型效果较好,可用于慢性胃炎中医证型的鉴别诊断。吴斌等探讨了肾阳虚证的辨证因子分布规律。以肾阳虚证量表为基础,从定性、定量角度收集资料。以定性评分计算各辨证因子的出现频率,用定量评分进行分层聚类分析。发现:畏寒、肢冷、夜尿、腰背发冷等辨证因子出现频率高,聚类分析提示肾阳虚主证、舌象、脉象分布较有规律。认为根据数理统计结果对

13、肾阳虚证的辨证因子进行初筛,为肾阳虚证的量化研究奠定了基础。4小结与展望利用数据挖掘技术探求中医药诊治疾病的规律,形成用数字描述和表达的中医药内容,能有力推动中医药研究的规范化进程。但由于中医药信息的复杂性和特殊性,中医药数据挖掘在挖掘对象的广泛性、挖掘算法的高效性和鲁棒性、提供知识或决策的准确性方面有更高的要求。目前中医药数据库资源已较丰富。数据挖掘技术将成为中医药现代化的重要组成部分。但从目前应用数据挖掘技术进行的中医药研究来看,中医数据挖掘尚处于起步阶段,多数是对古文献数据的整理挖掘,缺乏用于探求中医诊治疾病规律和复方用药规律的研究。这可能与中医数据的复杂性所致的数据预处理繁琐有关;如能

14、通过建立结构化数据库,采用结构化的临床信息采集系统收集数据,将能提高中医学数据挖掘的效率及可信度。有助于发现中医的诊治规律,并创新诊治模式,提高诊疗与科研教学水平。参考文献,:,翁敬农(译)数据挖掘教程北京:清华大学出版社,():乔延江,李澎涛,苏钢强,等中药(复方)研究开发的意义北京中医药大学学报,():姚美村,袁月梅,艾路,等数据挖掘及其在中医药现代化研究中的应用北京中医药大学学报,():陈凯先,蒋华良,嵇汝运计算机辅助药物设计原理、方法及应用上海:上海科技出版社,冯雪松,董鸿晔中药指纹图谱的数据挖掘技术药学进展,():“杨林,徐慧,任廷革,等数据库技术与结合实现网上中医方剂的信息挖掘中国

15、中医药信息杂志,():姚美村,艾路,袁月梅,等消渴病复方配伍规律的关联规则分析北京中医药大学学报,():秦首科,牛孺子利用数据仓库分析处理中医方剂评析中医药学刊,():蒋永光,李力,李认书,等中医脾胃方剂配伍规律数据挖掘试验世界科学技术中医药现代化,():张世筠,沈明秀,王先春,等中医肝证的变量聚类分析中国中西医结合杂志,():白云静,申洪波,孟庆刚,等中医证候研究的人工神经网络方法探析中医药学刊,():徐蕾,贺佳,孟虹,等基于信息熵的决策树在慢性胃炎中医辨证中的应用第二军医大学学报,():吴斌,高峰,严石林,等肾阳虚证的辨证因子规律初探现代中西医结合杂志,():(收稿日期:)(编辑:周蕊)老

16、年高血压病的中医研究现状苑志军,董建栋中图分类号R25文献标识码A 文章编号16816676(2006)11124202高血压是老年人最常见的心血管疾病之一,它是导致心脑血管疾病的首要危险因素,又是导致慢性肾病、心肾功能衰竭及引起致残、致死的主要危险因素之一,严重影响老年人的身心健康和生存质量。大量的研究资料证明,对老年高血压患者进行积极合理的综合治疗,可使血压得到控制,显著降低脑卒中及心血管疾病的发病率和死亡率。特别是中药治疗老年高血压病具有疗效好、副作用小的特点,因而成为治疗老年高血压病的重要手段。本文仅就老年高血压病中医研究的现状做一综述。1病因病机研究中医典籍中并无高血压病的记载,常以

17、“眩晕”、“头痛”“中风”、等病论述。其中以“眩晕”论述最多,眩是眼花,晕是头晕,二者常同时并发,故统称为“眩晕”。老年高血压病的形成是一个长期的病理过程,不是由单一因素,而是由体质、精神、饮食、七情、劳欲等多种因素交互作用所致。体质的阴阳偏衰,禀赋不足、脏腑亏损等为发病的最常见原因,高度精神紧张,劳倦过度或强烈的精神刺激等也是发病的常见因素,恣食肥甘或烟酒过量、或嗜食咸味而聚湿生痰,以致助阳化火也是不可忽视的发病因素。总的来讲,老年高血压病的基本病因病机为本虚标实,本虚则为正气虚,责于肝肾阴虚,水不涵木;心脾两虚、气血不充;肾精不足、髓海失荣。标实则为邪气实,责之于肝阳上亢,阳化风动,气血上

18、冲;或痰浊中阻,阻塞脉道,上蒙清窍;或瘀血内生,涩滞血脉,气滞血瘀,遏伤脏腑。老年高血压病患者心营过劳,心气不足,无力鼓动血脉,气机不畅,或火热内生,或痰湿阻滞,脉络不通,瘀血内停,痹阻心脉发为心痹,日久热盛伤津,阴损及阳、阴阳两虚,致痰湿更甚,血脉更加不畅,脑脉阻滞则发为中风偏瘫。总之,整个病机过程是由实转虚,虚实夹杂,病在脉络,病位以肝肾为主,涉及心、肝、脾、肾四脏。2辨证分型研究为了适应高血压病研究不断深入的需要,卫生部药政作者单位:江苏南京,江苏省中医院(南京中医药大学研究生)局于年制定了“中药治疗高血压病临床研究指导原则”,将高血压病的中医辨证分型确定为:肝火亢盛型、阴虚阳亢型、阴阳两虚型、痰湿壅盛型个证型。吴奕强等将高血压病分为肝阳上亢、阴虚阳亢、肝肾阴虚、阴阳两虚型。刘凤君将高血压病分为肝火炽盛、肝阳上逆、肾阳不足、肝肾不足、阴阳两虚个证型。郭振球教授认为,将传统中医思辨性、宏观性描述过渡到实验研究,进而运

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论