中医证候研究数据挖掘新进展_第1页
中医证候研究数据挖掘新进展_第2页
中医证候研究数据挖掘新进展_第3页
中医证候研究数据挖掘新进展_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中医证候研究数据挖掘新进展

随着数据库技术的快速发展和数据服务的多样化,人类拥有的数据急剧增加。与此同时,人工智能领域的发展也为数据处理的产生创造了条件。由于传统的数据信息处理方法难以满足解决中医药研究领域中涉及的数据信息处理问题。因此,数据挖掘(DataMining,DM)技术在中医药研究被日益重视,并具有明显的前景。本文就近20年来数据挖掘技术在中医药研究领域的应用研究进行综述,并对有关问题进行讨论。1基于数据挖掘的研究方法DM(数据挖掘)是揭示存在于数据里的模式及数据间的关系的学科,它强调对大量观测到的数据库的处理。它是涉及数据库管理,人工智能,机器学习,模式识别,及数据可视化等学科的边缘学科。用统计的观点看,它可以看成是通过计算机对大量的复杂数据集的自动探索性分析,从大型的、复杂的、信息丰富的、随机的实际应用的数据中,提取出隐含在其中的、人们事先不知道的、有用的信息和知识的过程。麻省理工学院的《科技评论》杂志提出未来5年对人类产生重大影响的10大新兴技术中,“数据挖掘”位居第三。数据挖掘的过程包括陈述问题和阐明假设、数据收集、数据预处理、模型评估、解释模型和得出结论等。2法律及人工智能技术的应用,使中医证候中医证候的研究关键是方法学的合理应用。现代科学技术的发展和计算机的应用将为证侯的研究提供强有力的技术支持平台,通过文献整理发现,数据挖掘方法应用于中医证候的研究报道迅速增多,主要体现在以下几个方面:2.1抑郁症患者bp训练算法的临床应用樊小平研究了用于抑郁症中医证候分类的一类MLPANN;设计了一种基于自定义网络结构及其他参数的BP训练算法分类系统并应用在抑郁症的中医证候分类研究中。胡随瑜等将1731例抑郁症患者随即分成两组,轮流进行训练和测试,结果BP网络训练总体阳性率为97.7%,测试阳性率为72.5%。结论是BP网络能较好的区分抑郁症5类中医证型,在中医证型分类识别中有一定的价值。2.2中医证候诊断标准研究的可行性方李建生等分别采用多种数据挖掘方法用于中医证候诊断模型的研究,通过检验,模型的鲁棒性好,为中医证候诊断标准的研究提供可行性方法。徐蕾等采用基于信息熵的决策树C4.5算法建立中医辨证模型,探讨在慢性胃炎中医辨证分型中的应用。2.3冠心病证候诊断标准模型杜文斌以病证结合为前提,以名老中医的病案为数据源,开展人工神经网络用于冠心病证候诊断标准的模型研究,提出了证候诊断标准建立的方法学,通过模型检验证明了该方法的可行性。3中医数据的特征3.1词同义和狭义模糊1)一词多义,如症状描述中的“眩晕”即指头昏、头晕,又指目眩。2)多词同义,如“消瘅”、“消渴”属同一词义。又如“食欲减退”、“食欲不振”、“胃纳不佳”、“胃纳欠佳”等也表示同一个意义。3)词义模糊,如“面白”可理解为面色淡白、面色苍白又可指面色胱白。这种模糊性模式加大了中医学数据挖掘的难度。3.2传统证候整理的认识基础陈小野提出了“证候多态性”这一概念,指出证候多态性是在中医的一个基本证候中,包含着若干可分辨的、有意义的不同病理状态。它来源于医家的认识差异及证候整理过程中循名重于责实的传统方法。证候多态性研究对推进证候规范化,证候实质研究工作具有重要意义,是证候研究的一个发展方向。3.3中医证候诊断标准的发展多年来对证的研究思路和方法主要集中在实验研究、临床观察、文献整理、专家经验上。近年来统计学用于证候研究渐渐暴露出其弱点——线性还原法无法解决证候与症状间的非线性关系,特别是中医证候诊断标准的研究,需要寻找更合理的方法,人工智能等多学科交叉研究是目前中医证候诊断标准的研究的一个热点,其中数据挖掘在这方面会有很高的应用价值。3.4必须坚持中医的指导下进行应用实践中医药领域中的数据属性有离散型的,也有连续型和混合型的,对这些数据的噪声处理等预处理相当复杂,挖掘过程还需要人机交互、多次反复,其中任何一个环节都不能缺少专业人员。只有坚持中医理论的指导下并切合临床实际,针对具体问题,选择合理的挖掘方法,才能挖掘出真正有价值的知识。在中医学数据挖掘中,应针对上述数据特点和挖掘目标,结合运用不同的挖掘方法,对非线性、不完全的信息进行智能处理,发挥各自的技术及其整合优势。4中医发掘的科学研究4.1证候研究的标准建立在现有研究的基础上,根据挖掘的对象及目的,以符合证候诊断标准建立的要求(证候概念的模糊性、证候研究的客观性、证候及证候因子间的非线性关系)为主线,选取既能体现证候的模糊性,又能体现出证候研究的客观性的数据挖掘方法及建模思路。4.2模型研究流程4.2.1临床流行病学分析综观近年文献而言,很多文献中采用了数据挖掘方法如神经网络、模糊理论、决策树、关联规则等挖掘方法进行中医证候规范化的研究。这些方法的使用归根到底都离不开一个前提:收集的数据必须具有合理性、完备性。数据收集影响它的理论分布。由于中医学数据的冗余性特征及数学模型建立的需要,采取相应的数据预处理方法。数据准备是整个中医学数据挖掘结论正确与否的关键性步骤。本文通过临床流行病学方法收集的数据信息与数据挖掘技术有机结合,一方面,应用临床流行病学的科研思路与方法能提高数据挖掘技术应用中数据的准确性和完备性;另一方面,运用数据挖掘技术改进了临床流行病学中数据处理和数学模型建立方法的局限性即线性还原法无法解决非线性关系的问题及高维数据引起的“维数灾难”问题。再结合国际通用的模型检验数据Fisher-iris数据进行建模和模型检验,更进一步验证模型的可靠性。4.2.2ohwellwellen网络模型这是医学知识发现过程中的另一个关键性步骤。本文选择了神经网络和模糊理论融合方法,先构建动态Kohonen网络模型,即在Kohonen网络此基础上,通过增加动态神经元形成一种动态自适应神经网络。待动态层神经元稳定后,把输入层与动态层间的权值转换为模糊推理系统相应规则的属性隶属函数中心,通过与神经网络辨识率比较,不断调整模糊规则及相应的函数参数,最终获得最优模糊规则。4.2.3内在定量说明根据中医学与数据挖掘的特点,寻找其中的衔接点,如把数据定性信息转换为定量信息,通过动态科荷伦网络挖掘出数据规律性的定量信息,再用模糊理论定性说明,体现出:定性→定量→定性,体现出中医证候研究的客观性、模糊性。4.2.4诊断符合率结论的临床合理性。首先结论要与临床实际基本吻合,不能相矛盾。例如2型糖尿病气阴两虚证、肾阴亏虚证诊断符合率偏小,而血瘀证、胃热炽盛证、湿热中阻证及肺燥津伤证诊断符合率偏大。结合临床实际而言,2型糖尿病患者大多为老年患者,而且气阴两虚证、肾阴亏虚证多为病程较长的患者,这样的患者往往临床症状相对不甚明显,或并发症较多,且多兼血瘀,故诊断符合率较低。5进一步的研究范围与方法数据挖掘技术在中医药领域的应用,有力地推动中医药研究的规范化进程。同时,由于中医药数据信息的复杂性和特殊性,数据挖掘在挖掘对象的广泛性、挖掘算法的高效性和鲁棒性、提供知识或决策的准确性方面提出了更高的要求,这又促进了数据挖掘等智能技术的应用要更符合中医证候研究的要求。目前中医药数据库资源已较丰富,但中医特色的数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论