绝经综合征中医证候规律探讨_第1页
绝经综合征中医证候规律探讨_第2页
绝经综合征中医证候规律探讨_第3页
绝经综合征中医证候规律探讨_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

绝经综合征中医证候规律探讨

中医学在世界卫生体系中的地位相当普遍。绝经综合征是一个多因素所致,涉及多系统改变的身心同病的疾患,应时而生的“社会-心理-生物-医学模式”为多因素、多环节、多靶点的现代疾病找到了思维的突破口,然而寻求一种符合上述模式医学的合理途径又成为医学领域深入思考的难题。数据挖掘技术善于从海量数据中发现隐含的有意义的知识,预测未来趋势及行为,做出前瞻性的决策,正是这种优势使得数据挖掘技术在分析中医证候的研究中被广泛地采用并取得了许多有价值的成果。1数据来源及处理本文根据各种算法的特点,并结合前提研究成果-国家科技“十五”攻关课题“妇女更年期综合征中医证治规律研究”所建立的数据库的特点:该数据库主要以国际公认的疗效评价指标KuppermanIndex(KI)症状评分标准,更年期生存质量量表(Menopause-SpecificQualityofLife,MENQOL)和国内中医药行业公认的中医证候评分及相关的生化指标为基础,数据维数高,含近200个变量指标,数据类型为字符型、日期型、布尔型、整型、数值型。因此采用如下方法进行挖掘:第一、按距离或相似程度大小进行归类,对属性(指标)进行约简,去掉一些影响较小的属性,并进一步做主成分分析;第二、运用改进的关联规则挖掘各种症状之间、证与症状之间等的关联关系;第三,运用粗糙集方法,对挖掘出的关系规则进行压缩和提炼;第四,将提炼后的规则进行比较分析和临床评价。同时,对经过聚类分析及主成分分析的数据,规则提炼后的数据分别构建序列进行对照分析可以起到相互验证的作用;其技术路线如图1:1.1聚类法聚类分析通过系统聚类可以把证候变量按相似程度大小进行归类,使具有共线性关系的变量经聚类分析后归到一类,从而达到降维的目的,可根据变量的情况选择具有代表性的指标进行下一步研究。距离含义很广,如欧氏距离、马氏距离…,相似系数也可看作为距离。本文设计得系统聚类方法如下:设有指标X和Y,取n个病例,其指标X和Y的对应值分别为X(x1,x2,x3,…,xn)和Y(y1,y2,y3,…,yn)为两个指标,其中则X与Y的相异度定义为DF(X,Y)=∑ni=1(Xi-Yi)。对指标进行两两相异度计算,将结果进行从小到大进行排列,并设定一个阈值(如为0.01),如相异度小于阈值(0.01),则将这两个指标进行合并。1.2病例n列矩阵所占的权重主成分分析方法可以进一步降低指标的维度。其基本算法如下:设有N个指标q1,q2,q3,…,qn和M个病例。这M个病例的N个指标值便构成一个M行N列矩阵Q=(qij),其中i=1,2,…,m,j=1,2,…,n。指标qj所占的权重系数(%)定义为:σ(qj)=((∑mi=1qij)/(∑nj=1∑mi=1qij))×100。设定一个阈值σ(如为5%),如权重系数大于阈值σ(5%),则将这些指标作为主成分,以进行进一步处理。1.3经济指标关联规则挖掘(1)首先计算置信度(Confidence),其中条件概率用项集支持度计数(Suppor_count)表示。其中,定义项集A与项集B,support_count(A∪B)是包含项集AB的事务数,support_count(A)是包含项集A的事务数。(2)根据(1-1)式,关联规则可以产生如下:①对于每个频繁项集L,产生L的所有非空子集。本文研究根据数据的属性,主要挖掘如以下的关联规则:(1)中医症状与证候之间的关联规则:中医症状(X,Ai)→证候(X,Bj)(2)中医症状与西医症状之间的关联规则:中医症状(X,Ai)→西医症状(X,Cj)(3)证候与生存质量之间的关联规则:证候(X,Bj)→生存质量(X,Cj)(4)中医症状与检验指标值之间的关联规则:中医症状(X,Ai)→检验指标值(X,Dj)绝经综合征关联规则挖掘还要注意以下特点:(1)规则的条件与结论所包含的属性有约束,条件的属性必须是症状(有时包括检验指标)的组合,结论则必须是证的组合;(2)对置信度的要求更高;(3)规则的条件与结论中,各属性要计算其权重属性。1.4常用的等价关系粗糙集分析基本算法如下:数据S是一个四元组S=(G,M,W,I),论域G的元素称为对象;M称为属性集,它的元素称为属性;G与M是有限的非空集合,称为属性值域,W=Um∈MWm,Wm为属性m的值域,I为G×M到W的一个映射,对任意的g∈G,m∈M,I(g,m)∈Wm,通常称I为信息函数或描述函数。设S=(G,M,W,I)为本文研究的数据信息,B⊆M为一个属性子集,g,h∈G,即等价关系:IND(B)={(g,h)|∀m∈B,I(g,m)=I(h,m)}称为B不可分辨关系。令[g]B={h∈G|(g,h)∈IND(B)},我们称[g]B为由g决定的B等价类,此时,G/B={[g]B|g∈G}为G的一个划分。2成果数据库的建立本研究在WingdowsXP+Access2003+Delphi7.0平台下,将成果数据库建立基于数据挖掘的数据仓库;设计和实现系统聚类算法、主成分分析算法、关联规则算法和粗糙集算法,开发包含以上算法程序的数据挖掘模型,提供从数据仓库中随机选择不同病例样本,并进行参数调整及算法修改功能。3挖掘过程3.1并发症及其清洗尽管数据采集过程中严格按照GCP规范进行试验全过程的质量控制,但由于采集过程中出现的各种因素,如个别病人状态不稳定,或不能按时前来进行检测,或中途退出等,导致个别数据不精确,出现缺失值、不一致等情况,因此要先对绝经综合征数据进行清洗。例如设定一个缺省阈值,凡病例的数据缺省在阈值以内的,对缺失值进行填充,在阈值以上的则过滤掉。3.2关联规则分析本文以症状与证候之间的关联规则:中医症状(X,Ai)→证候(X,Bj)为例进行实验:(1)数据预处理。对424例病例数据进行数据预处理,设定病例数据缺省阈值为7%。凡病例的数据缺省在阈值7%以内的(有6个病例),对缺失值进行了填充,阈值在7%及以上的19个病例则被过滤掉,剩余381个病例用于进一步实验。(2)执行聚类与主成分分析。得到下面的结果,见表1,(注“烘热2”中的2表示程度,从轻到严重对应为0-3,余同):(3)关联规则分析。本文以症状与证候之间的关联规则:中医症状(X,Ai)→证候(X,Bj)为例,将置信度从高到低进行排序,见表2:表中置信度为100%,可以这样认为:当“烘热3汗出3手足心热1面色晦暗3”这4种症状同时出现且程度一致时,可以确诊为“肾阴虚证”;置信度为88%,即当“肢冷2口干2便秘1面色晦暗3耳鸣1腰酸1夜尿1膝软2”这8种症状同时出现且程度相当时,有百分之八十八的可能性确诊为“肾阳亏虚证”,等等。(4)运用粗糙集方法,对挖掘出的关系规则进行压缩和提炼,得表3:由表3可以看出,当出现“烘热3汗出3面色晦暗3”3种症状且程度都较为严重时,百分之百确诊为“肾阴虚证”。(5)对照分析,相互验证。根据以上结果,建立如下对照表4。由表4看出,在89%的肾阴虚证中,64%出现烘热1,42%有汗出;在11%的肾阳亏虚证中,有40%出现肢冷1,40%出现肢冷2,也就是如果出现肢冷很可能是肾阴虚证;这与关联规则分析的实验结果一致。(6)将提炼后的规则进行比较分析和临床评价。将提炼后的规则进行比较分析并提交有关专家进行临床评价,发现实验结果基本符合中医药理论与专家的临床经验基本一致。4中医证候规律的挖掘运用数据挖掘技术进行中医证候规律的研究,对促进中医药事业的科学发展具有重要意义。中医研究中积累的大量规范病例数据为挖掘研究打下了良好的基础,同时,中医复杂的症状间关系和证候变化也为挖掘研究提出了挑战。中医证候

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论