基于数据挖掘技术的中医诊断研究实验平台构建_第1页
基于数据挖掘技术的中医诊断研究实验平台构建_第2页
基于数据挖掘技术的中医诊断研究实验平台构建_第3页
基于数据挖掘技术的中医诊断研究实验平台构建_第4页
基于数据挖掘技术的中医诊断研究实验平台构建_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于数据挖掘技术的中医诊断研究实验平台构建

1基于数据挖掘技术的中医诊断研究中医临床积累了丰富的信息,数据和相关性复杂。在研究某些问题时,只有在没有相应的支持技术的情况下,才能取得更大的困难和过程,并更多地预测结果。例如:要从大量的临床病历数据中归纳出一些知识,以表达症状与疾病关系的密切程度,如果不采用合理的数据库技术、高效的分析算法和完善的自我学习机制,则工作的开展过程就象一盘散沙,结果将经不起考验。到底如何更好地研究中医诊断呢?笔者认为数据挖掘技术的应用,对中医诊断学科研究具有举足轻重的作用。基于数据挖掘技术的中医诊断研究,最大的问题就是需要相关的数据挖掘工具,使用好的数据挖掘算法。目前中医药专业应用的专用数据挖掘工具还没有,虽然有许多通用的数据挖掘工具可以选择,可做多种模式的挖掘,挖掘什么、用什么来挖掘,都由用户根据自己的应用来选择,但这些东西要融合到中医诊断学的研究当中还存在很多问题。这些问题直接影响数据挖掘及其相关技术在中医当中的应用,主要问题如下。1.1数据的前期处理通常原始的病历数据是不能直接进行挖掘处理的,需要通过一定的方法,将其表达为符合算法格式要求的数据,即需要有数据清洗、转换等数据预处理的配合,才能得出有价值的模型,因此数据的前期处理工作占的时间很多,因为对每一个不同的算法,均需要采用不同的数据格式进行操作。1.2结果的可及性许多数据挖掘方法中输出的数量往往很大,几乎难以处置。中医诊断专业人员很难评估大量的关联规则。1.3参数调整算法参数是困难的1.4实践过程的挑战许多最优的数据挖掘方法在实际应用上与用户交互作用并不理想,一种理想的方法要比试探式的方法需要设置的参数要少,但是往往费时很多。在实践中,数据挖掘是一个用户交互过程,因此有效性非常重要。然而许多数据挖掘方法尚需要改进。虽然使用数据挖掘工具可以不必掌握艰深的统计分析技术,但仍然需要知道所选用的数据挖掘工具是如何工作的,其所采用的算法的原理是什么,所选用的技术和优化方法会对发现模型的准确度和生成速度产生很大影响。以上问题直接影响到中医研究的工作效率与结果。鉴于上述对数据挖掘在中医诊断研究中的应用认识,笔者认为,以证素辨证研究为切入点,以信息科学为指导,建立基于数据挖掘技术的中医诊断研究实验平台,为宏观中医辨证科研体系加入科学的实验工具,将能在很大程度上提升中医诊断研究的科学水平。2证素的确认证素辨证是中医诊断的一种方法。所谓证素,即辨证的基本要素,“证素”是通过对“证候”(症状、体征等)的辨识,而确定的病位和病性,是构成“证名”的基本诊断单元。证素辨证研究的核心问题是证素的确认,它是通过对临床信息的认识寻找构成证的基本元素,它需要把握的是临床信息基元,也就是当一组症状群呈现出稳定的相互关系,它所反映的是病位与病性的最小单位。而这种稳定的相互关系的发现与确定。2.1辅助医生决策的信息系统证素辨证方法的好坏,取决于其是否方便临床使用。临床使用的对象主要有两种,一种是医生,另一种是辅助医生决策的信息系统。要快速、准确地对疾病的病性与涉及的病位作出判断,是中医诊断中的难点,因此,对证素决策方法的研究非常重要,已有从统计学、模糊数学、神经网络等方法开展研究的,但由于方法的局限性,结果还不能为临床所接受,需要综合各种方法,进一步地研究。2.2证候与证素的关联程度可以提高医生早发现病位和病性证素辨证中的关系主要包括证素与证候、证素之间、症状之间的关系。深入了解证素辨证中的各种关系,对疾病的诊断、病情转归的预测等有着举足轻重的作用。临床中,对疾病变化的认识体现在对证的认识上,而对证的认识又是通过对证候的观察,判断疾病的病位与病性,病位与病性是与疾病密切相关的两大要素,研究证候与证素在不同时间、不同条件下的关联程度,可以让医生及早把握病病发展的方向。如:有两个病人,开始时,病人A、B都是为脾阳虚证,一段时间后,病人A被诊断为脾肾阳虚证,病人B被诊断为心脾阳虚证,那么,是否在病人发病初期就能预测到呢?又如:脾与阳虚、肺与痰,在某一种疾病发生时,它们之间同时存在的可能性有多大?这些关系研究的实质是:在一定的约束条件下,测定某两个变量的关联程度,以反映疾病发展的趋向与规律,这种关系不仅包含静态关系,还包含动态关系;通常可用计算机仿真技术,通过数学建模来完成。3研究平台通过对证素辨证研究要点的分析,本研究设计了一个基于数据挖掘技术的中医诊断研究实验平台。3.1基于医院临床信息的数据库建立通用病历信息文件结构,整合数据挖掘工具,为开展基于信息科学的中医诊断宏观辨证研究搭建一个平台。针对数据仓库,整合多种类型的数据挖掘算法,并将数据清洗、转换等预处理工作规范起来,为解决中医领域问题的多样性提供技术条件。通过这个技术平台,将会让研究人员在高度共享的临床信息的基础上,应用最新最科学的数据挖掘方法,解决好辨证论治的问题。同时,密切与计算机科学、数学、统计学学科人员的交流,促进中医诊断学研究水平的快速提升。3.2医疗信息的编码结构化的中医电子病历系统,可有效地管理病历数据,并方便数据挖掘;基本的统计功能,可支持研究者对数据库的资料有一个总体的认识;经典算法集,通过整合各类优秀的挖掘工具达到要求;方便的病历数据筛选,以支持研究者快速获取特定目标的数据;方便的可扩展算法接口,可支持研究者自行加入针对中医诊断专业的有效算法;方便的数据格式转换,以支持各类整合进来的数据挖掘工具。其中,病历信息文件结构设计如下:一行为一个病人的记录,每条记录由8个字段构成,字段之间以空格分开:标志:a_;病人身份信息:身份号码标志:b_;望闻问切诊收集的病状信息:症状字符串,长度为4的倍数(每一个症状信息为4位编码)标志:c_;仪器检查信息:标识码为区间中的任一个,后接实际测量数据串,每一个数据由数据类型编号+数据实测值,数据之间一以“#”号隔离开字符号标志:d_;中医诊断结果:辨证结果,为证型术语的编码(有标准按标准,无标准要建立标准);标志:e_;西医诊断结果:按ICD-10疾病编码标志:f_;处方:一位处方识别码:0标准中药方剂+/-中药,1中成药、2西药标志:g_;初复诊标志:两位,00:表示初诊,01~99表示复诊的次数。标志:h_;医生:身份号码。通过上述结构的病历信息文件,便于数据交换,如,生成中间文件,供SVM或ROUGHSETS程序使用:根据用户需求自动建立LIBSVM用训练集与测试集、根据用户需求自动建立ROSETTA软件用决策表、调用LIBSVM和ROSETTA软件的接口函数等。3.3比关系数据库以CachR数据库作为技术支持进行设计,因为它将比关系数据库(如:orecal,sqlserver等)能更好地表达复杂的中医信息。下面给出利用CACHE’技术初步设计的数据库(参见图2),主要内容如下。3.3.1电子疾病的主要类别“err”以一个类别为核心3.3.2医生的“门诊”和疾病患者的“patint”这两个类继承于人类“Person”,人类里面嵌入了地址类“Address”。3.3.4字典型ddosrule、dresil、net、sdyp和dw3.3.5工具类utiliyi包括两种方法4基于数据挖掘技术的实验方法对于中医诊断目前中医诊断学研究的核心问题是如何科学地辨证,它涉及规范化研究、诊断的量化研究,病—证关系研究等。这些研究无论是从宏观还是微观的角度,都不可避免地要开展对获取数据的分析处理。许多研究都有这样一个过程:设计一个实验→收集许多数据→统计分析→结果。这些研究存在的一个最大问题是:数据获取阶段是在假设的基础上开展的,收集的数据都有针对性,而且数据量不可能很多,因而反映的问题也不可能很全面。另外,在数据的筛选上,往往是通过人工方式从临床收集,工作量大。引入数据挖掘技术,建立中医诊断研究实验平台,将会彻底改变这样的局面。这是由于数据挖掘的工作是建立在数据库或数据仓库基础上的,因此,为了采用数据挖掘技术必定会促使研究人员考虑科研数据的快捷收集与积累的方法,这势必促进临床诊疗数据的规范研究。当数据积累到一定程度时,研究人员既可以利用计算机技术对各类所需的数据进行筛选,也可以应用各类挖掘工具开展诸如:症状—症状的相关性研究;证素与证素的相关性研究;病—证的相关性研究;证—西医检查数据的对应分析、数字化中医诊断建模、诊断指标量化研究等。中医数据挖掘和通常的数据挖掘相比,无论在数据的复杂程度、数据量还有分析和建立模型的算法而言,都要复杂得多。许多试探式的快速数据挖掘方法需要做很多的参数调整,用户在使用上感到困难。本着方便、实用、可扩展性强的设计理念,系统主要包括如下功能(如图1所示)。一条记录为某人一个时间的病人诊疗信息的记录。3.3.3数据库设计优势病状类“Symptoms”,证素类“Items”,中医诊断结果类“CResults”,中医治则类“CRules”,西医治则类“WRules”:这5个类属于中间类,Emr和他们建立1对多的关系,EMR为1方,他们为多方。他们自身不保存任何值,每一个对应要素的值和代码都是引用到相应的字典类的具体的值。所以,这5个类里面存的是2个指针,一个是指向Emr类,一个是指向对应的字典类。统计的时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论