中医健康状态辨识模型算法研究_第1页
中医健康状态辨识模型算法研究_第2页
中医健康状态辨识模型算法研究_第3页
中医健康状态辨识模型算法研究_第4页
中医健康状态辨识模型算法研究_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中医健康状态辨识模型算法研究

健康状态是指人们在生活过程中受到自然和社会因素的影响,以及内脏、经络和血液的适应和调节所形成的状态。中医健康状态辨识是根据中医学理论,对采集的宏观、中观、微观等表征参数进行综合分析,辨别程度、位置、性质等状态要素,而对相应的状态作出判断的思维认识过程。借助现代计算机技术及信息处理技术能够为中医状态理论研究和辨识工具的研发提供方法学支持,模型和算法的合理应用是中医健康状态辨识研究的核心,也是中医辨证思维的集中体现。广义的模型(model)是指所研究的系统、过程、事物或概念的一种表达形式,狭义模型则指根据实验、图样放大或缩小而制作的样品,本研究中笔者以讨论中医健康状态辨识的广义模型为主。算法(algorithm)是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制,即能够对一定规范的输入,在有限时间内获得所要求的输出。通常模型比算法居于更高的抽象层面,相同的问题模型可以由不同的算法用不同的时间、空间或效率来解决。状态识别与中医的辩证思维状态表征参数的集合筛选是中医健康状态辨识的前提和依据,模型算法除了实现表征参数对状态要素贡献度的计算外,还必须解决以下3个问题。1.参数的表达和分类计算2.计算隐藏参数和验证器的验证密码3.状态因素的混合和缓慢基于环境的模型算法将个体人健康态区分为未病态、欲病态(前证)、已病态(显证),这是一个常规的分类问题。该类问题的解决在人工智能、数据挖掘、机器学习等领域都有深入的涉及,但各有偏重。早期建立的中医专家系统多围绕某一位或某几位专家的辨证论治思维,以建立单病种诊疗系统为主体,实现一个基于规则推理的名老中医诊断和治疗某病证或某几种病证的“专家系统”,如:1979年关幼波名老中医诊治肝炎专家系统、姚贞白妇科专家诊疗系统等。之后陆续开发的中医专家系统不下300个,遍及中医内、外、妇、儿等临床各科。后期,一些比较先进的推理技术和方法开始逐步得到应用,如近似推理、不确定性推理及分级推理等。该类系统最大的“瓶颈”就是不具备灵活、准确、动态的专家知识获取和修正机制。因此提出了对机器学习领域各种较为成熟的知识获取模型算法的极大需求。一个机器学习系统至少应该由环境、知识库、学习环节和执行环节,4个模块组成,如图1所示。环境主要指信息环境,如从患者身上采集的四诊信息。学习环节是模型算法应用的主要环节,通过对环境信息的分析、综合、类比、推理等思维学习过程获取知识,并存入知识库。在学习环节常用到的分类模型算法与数据挖掘中的分类模型基本保持一致,唯一不同的就是机器学习是一个循环往复的过程,能实现对知识库的不断的更新和修正,而数据挖掘过程往往得到一个阶段性的知识规则成果。知识库是存储知识的物理容器。执行环节用于处理系统面临的决策问题,如输入某人的四诊信息,经执行环节运算得出证,并对证的判定结论的准确性作出评价。当较差的状态判定评价结果反馈到学习环节,则会激活新一轮学习过程。模糊数学模型善于解决现实世界中存在的各种模糊现象和关系。如解决在中医病证诊断中存在的体质(强、弱)、咳嗽(轻、中、重)、疼痛程度(很疼、比较疼、有点疼、不太疼)、肝肾阴虚诊断(像、很像、不太像)等这类模糊概念的判别问题。该模型的最大缺点就是很难根据中医辨证思维规律设计适合的隶属函数。人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。神经网络是由大量的节点(或称“神经元”,或“单元”)和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activationfunction)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重(weight),这相当于人工神经网络的记忆。在学习阶段,通过调整神经网络的权,依据更准确的预测输入样本的类标号来学习。该模型的最大缺点就是网络拓扑和大量模型参数均凭工程人员的经验产生且构建的网络模型很难找到好的领域解释。贝叶斯网络是一个图形模型,能描述属性子集间的依赖关系,是针对不确定性知识表达和推理的方法。通常贝叶斯网络由一个有向无环图和针对图中每一个节点的条件概率表两部分组成。有向无环图中每个节点代表一个随机变量,每条弧代表一个概率依赖。如果一条弧由节点Y到Z,则Y是Z的双亲或直接前驱,而Z是Y的后继。给定其双亲,每个变量条件独立于图中的非后继。该模型将概率推理和网络结构有效结合起来,能充分利用训练案例中归纳出来的统计知识开展概率推理,而生成的网络结构则能将专家头脑中极其复杂且高度非线性的知识清晰地表达出来。因此,在中医病证诊断领域得到了较为普遍的应用。该模型最大的缺点就是当模型的学习样例数比较少即案例的分布较为片面时,或案例的缺失信息较多时往往无法得到很好的分类判定模型。综上所述,经典中医专家系统面临的自动知识获取难题和数据挖掘分类算法模型仅能获取阶段性知识发现的局限,提出了对循环往复不断提高判定精度的机器学习模型算法的迫切需求。在新一轮研究中,一个融合专家系统、数据挖掘分类算法、机器学习系统模型等的研究框架的提出,将为中医健康状态辨识模型算法研究提供良好的基础和有益的经验。原证素辨证模型的不足以状态为中心的健康理论为依据,基于证素辨证的原理,是中医健康状态辨识模型算法研究的立足点,核心是最大限度地体现中医的辨证思维。该模型最大的优点在于“根据证候,辨别证素,组成证名”辨证思维的提出符合中医诊断的传统思维规律,在对问题做出简化的同时亦兼顾了中医证的兼杂等普遍存在的现象,达到了执简驭繁的目的。因此,证素辨证的基本原理成为我们开展中医健康状态辨识模型算法研究的核心原理,即“任何一个证都是由病位、病性等要素构成的”。但是,原有的证素辨证模型依然存在一些不足:(1)统涵盖的个体人健康状态参数(症)十分有限,大多局限于中观层面的四诊参数,远不能全面反映个体人整体健康状态全貌;(2)证候对证的贡献度以及采用“双层频权剪叉法”解决权值的学习问题尚有待进一步完善,且模型的诊断准确率未经过大样本临床数据的验证与校正。应用系统科学的原理和方法,开展中医健康状态辨识的模型算法研究,是中医基础理论研究领域重大的科学问题,一方面来自于中医原创思维和健康认知理论的指导;另一方面又推动了中医健康理论的丰富与发展。与此同时,相关的研究成果又将为健康状态辨识系统的研发提供方法学平台。从状态辨识角度开展涉及广泛参数及病证域判定结果的模型算法研究,目前尚属起步阶段,因此全面准确把握中医整体思维、高起点设计健康状态辨识模型算法研究的基本框架,对于本领域的研究是极其重要的。1.1要素“痰”与量值的计算由于表征参数涉及宏观、中观、微观3个方面的资料,因此,同一症状可能有不同的表达形式,而每一种表达形式作为单一的表征都对相应的状态要素判断有一定的贡献度,如“肥胖”可表现为形体肥胖、体质量超标、腰围超过正常值,3个表征参数均对要素“痰”的判断有相应的贡献度,如果3个参数同时采集就必然导致相应的状态要素贡献度的量化值增高,反之如果仅采集一个或两个参数就可能导致相应的量化值降低。此外,在临床辨证中,一个证可能有十几个甚至几十个症(表征),医生通过采集几个主要的症即可作出诊断,所采集到的症的多寡主要影响证的准确性,而对于程度判断的影响相对较少,但是如果进行加权计算就可能导致状态要素量化值的变化。1.2部分定量与定性结合的信息由于采集的手段和方法不同,健康状态表征参数的性质也有所区别,传统四诊采集的主要是定性信息,如头痛、咳嗽、恶寒等,也有部分定量与定性结合的信息,如脉来一息六至等。随着健康认知理论研究的深入和现代技术的广泛应用,健康状态参数的范围涵盖了宏观、中观、微观3个方面,因此参数的性质已不再局限于原有的定性为主,所采集的参数有精确的、模糊的、计量的、计数的、形态学的、影像的等等,因此,对于不同类型的参数的识别和轻重分析以及它们对特定状态要素的贡献度,需要借助不同的算法工具。2.1隐性参数的贡献度隐性参数如环境、居住条件等,可能长期作用于人体而对状态产生影响,但是在疾病发作之前这些因素对特定证的影响程度可能难以被准确描述,只有当相应的表征出现之后,这隐性参数的贡献度就显露出来。如久居湿地,可能产生湿证,但是在患者出现关节沉重、酸痛等湿症之前,湿的因素常被忽略,而当湿症出现之前,对因素“湿”的判别就显得十分重要,因此,在模型算法设计时必须考虑隐性因素“发”与“未发”,“发前”与“发后”在健康状态辨识中的不同意义。2.2身热证的识别真假的判断是一个综合分析的过程,临床医生可以通过症状的具体表现和出现部位以及症状之间关系等判定疾病的本质或假象。所谓“假象”一种是症状本身是“假”的,如“身热”但体温不高、不喜加衣被,这究竟是不是“真热”可以在症状采集过程中先予以识别,也可通过领域专家(知识库)予以限定。另一种“假象”其症状是“真”的,只是与疾病的本质不相符合,如“至虚有盛候”、“大实有羸状”,在这种情况下,如何从表征之间建立参数“真假”综合判断的关系模型及如何教会计算机进行症状与疾病本质的关联,将直接影响到证候真假的辨识。3.1主要者为程度弱者理论上说,状态要素的程度(轻重)可以通过量化值进行表示,但是除了轻重外,各要素间还存在着主次和缓急的关系,而这种主次和缓急有时难以通过量化值表达。因为急者不一定都是程度重者,也不一定都是主要矛盾,而程度重者并非都是本证,也未必都是当前的主要矛盾,当前的主要矛盾可能是标也可能是本。临床上借助对病机和演变规律的认识,能够比较容易地实现从思维角度区分各要素的主次和缓急,但是,如何在计算机识别中体现这种区别和组合,这也是模型算法设计中必须解决的问题。3.2通过合并证名形成证名状态可根据状态要素积分的不同分为未病态、欲病态和已病态,证可根据证素积分的不同而分为显证和前证,通常情况下,通过对已确立的病位和病性证素的组合可以形成证名。因此,临床诊断过程常常是显证与前证的叠加,但是,多个显证、前证中如何选择匹配,得出最终结论?如证素有肝、脾、肾、阴虚、气虚、气滞等,甚至更多,组合有多种,肝郁可致气滞,气虚亦可致气滞,那么气滞的形成是肝郁为主,还是气虚为主,或两者共同影响的结果?又如:肝郁为显证,而脾虚为前证,若在临床即可诊断为肝郁脾虚,但模型设计时对于这种组合是完全考虑、选择性考虑或完全不考虑,这些都必须通过相应的算法才能得以实现。3.3要素相对轻重程度的判定由于构成个体人健康状态的要素很多,在生命进程中各个要素的形成并不是同步的,这不仅与先天因素、个体差异等有关,也与环境因素、季节、气候以及感邪性质等密切相关。因此,不同部位要素或性质要素的程度是不同的,这点在辨证过程尤为如此,例如经加权求和计算证素积分后出现肝110分、肾140分、阴虚100分;或肝140分、肾110分、阴虚100分;或肝110分、肾110分、阴虚110分3种情形;按照现有阈值判定标准,积分大于等于100分则证素的诊断成立,故模型设计应统一将上述3种情形诊断为“肝肾阴虚”,但在中医传统辨证思维中对要素相对轻重程度的判定是具有很高应用价值的。所以,抛开对要素轻重程度的判定仅用单一的要素或证名概括个体人的状态,本身并不符合中医的思维特点。1.中医专家系统人工智能领域侧重于人类思维特征的总结、知识表达、逻辑推理等,借用该领域经典的专家系统理论与技术,各类中医专家系统的实现及应用在计算机尚未得到普及的上个世纪70年代曾经做出了斐然的成绩。2.定义挖掘所引定义数据挖掘侧重于“从数据中获取有效、新颖、有潜在应用价值和最终可理解模式的非平凡过程”,这是1996年Fayyad等对数据挖掘给出的定义。因此数据挖掘方法的应用更强调一个从数据的集成、清理、转换到分类模型建立、知识评价等的整个过程。近期在中医病证状态的辨识领域,越来越多的开始采用复杂、多元的数据挖掘算法构建中医诊断模型,所用方法涉及模糊数学、粗集理论、贝叶斯网络、贝叶斯分类、基因表达编程、决策树、相关分析、回归分析等,而尤以模糊数学、人工神经元网络、贝叶斯网络等方法最为普遍。1.中医数字辨证证机证素辨证是朱文锋教授提出的,该模型核心思想是“根据证候,辨别证素,组成证名”,实现模型的基本算法为“加权求和浮动阈值”,基于此研制了“中医数字辨证证机”。辨证知识库则采用“双层频权剪叉法”挖掘临床案例,并结合文献调研、专家咨询等方法获取,最终分别提取了证候对证素和证型的诊断权值,构建了中医辨证量化统一体系,这为中医一体化量化诊断模型的研究开辟了新天地。2.中医健康状态辨识的功能特点基于上述对健康状态辨识需求及对相关辨证模型研究现状的分析,在继承证素辨证原理的基础上,未来的中医健康状态辨识的模型算法研究应着重体现:(1)立足于中医健康认知理论的创新,充分体现中医辨证思维,而非局限于中医辨证系统的开发;(2)根据整体状态辨识的不同需求,建立不同的模型,如健康态辨识模型、辨证模型、辨病模型等,所

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论