基于rbf神经网络的中医证候诊断模型的优化研究_第1页
基于rbf神经网络的中医证候诊断模型的优化研究_第2页
基于rbf神经网络的中医证候诊断模型的优化研究_第3页
基于rbf神经网络的中医证候诊断模型的优化研究_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于rbf神经网络的中医证候诊断模型的优化研究

综合征是中医临床诊断与治疗的重要因素,是中医疗效评价的依据之一。多年来对证的研究思路和方法主要集中在实验研究、临床观察、文献整理和专家经验上。尽管上述方法很重要,但由于对“证”这种群体集合现象缺乏全面把握,还仅仅停留在经验积累层面,其理论结果常有时引起质疑,而临床流行病学和计算智能的发展为中医“证”的研究提供了重要的方法和希望。人工神经网络(ArtificialNeuralNetworks,ANN)作为计算智能的一部分,日益受到包括中医学者在内的多学科学者的关注。当前人工神经网络中前馈神经网络,尤其是BP(Back-PropagationNetwork)网络在实际应用中是最为广泛的一类。但大部分基于反向传播的前馈神经网都有两个共同的缺点,即网络收敛速度慢,易于陷入局部极小。RBF神经网络避免了反向传播那样繁琐、冗长的计算,且在逼近能力、分类能力等方面都优于BP网络。RBF神经网络是三层网络,即输入层、径向基层(也称隐层)和线性层。RBF神经网络具有可以逼近任意非线性映射的能力,且算法简单、实用,因而成为人们研究的热点。近年来,RBF网络在信号处理、系统建模、过程控制和故障诊断等领域得到了成功的应用。基于聚类分析的RBF神经网络能够克服以往RBF网络存在的学习训练的难题,即高维数据问题。因此,基于聚类分析的RBF神经网络可用于大数据、多样本、无明确函数关系的复杂问题。本文首先介绍了径向基神经网络结构,其次建立了基于聚类分析的RBF神经网络模型,最后通过模型检验验证了基于聚类分析的RBF神经网络用于中医证候诊断的有效性和实用性。1rbf神经网络RBF神经网络有三层组成,即输入层、隐层和输出层,其结构如图1所示。输入层节点只传递输入信号到隐层,隐层单元的作用相当于对输入模式进行一次变换,将低维(或高维)的模式输入数据变换到高维(或低维)空间内,以利于输出层进行分类识别。设输入层节点、隐层节点和输出层节点数分别为N,L,M,隐层单元为高斯函数即ri(x)=exp(−∥x−ci∥22a2i)1≤i≤Lri(x)=exp(-∥x-ci∥22ai2)1≤i≤L其中,x=(x1,x2…xN),Ci=(ci1,ci2…ciN)是隐层第i个单元的变换中心矢量,ai是对应第i个中心矢量的形状参数,它决定了该基函数围绕中心点的宽度。‖x-ci‖表示x和ci之间的距离,x越靠近ci,xi(x)的值越大,ri(x)的值在0到1之间。径向基神经网络的输出层节点为线性处理单元,其中第i个单元对应的输出为:yj=∑i=1Lwjiri(x)+bj1≤j≤Mj为输出层的节点数yj=∑i=1Lwjiri(x)+bj1≤j≤Μj为输出层的节点数在RBF神经网络中,隐层RBF中心的数量和宽度直接影响着网络的逼近能力,而且要求RBF中心应能覆盖整个输入空间,但如果RBF中心的数量过多,将使网络的计算量显著增加,而且还会导致网络的泛化能力降低。因此,建立RBF网络模型的关键在于选择合适的RBF中心。2基于聚类分析的径向神经网络模型2.1聚类分析算法聚类分析是依据样本间关联的量度标准将其自动分成几个群组,且使同一群组内的样本相似,而属于不同群组的样本相异的一种方法。一个聚类分析系统的输入是一组样本和一个度量两个样本间相关联的度量标准。聚类分析的输出是数据集的几个类,这些类构成一个分区或几个分区,聚类分析是无指导学习且分析的对象是数据而非变量。聚类分析大致分为三个类型,即层次聚类(SPSS11.0软件称为系统聚类)、分区聚类(SPSS11.0软件称为K-means聚类)、增量聚类(incremental-cluster)。大多数聚类算法多采用层次聚类分析和分区聚类分析。本文采用的聚类算法是分区聚类分析方法,分区聚类通常利用对一个局部定义(样本子集定义)或全局定义(整个样本集定义)的准则函数(CriterionFunction)(即度量标准)进行优化生成类。常用的全局准则函数,如欧氏平方误差度量标准则。常用的局部准则函数,如互近邻距离(MutualNeighborDistance,MND)。分区聚类最常用的是K-平均分区聚类。2.2基于分区聚类的降阶模型本文RBF网络的建模过程分为两个阶段。即第一阶段利用分区聚类确定隐层各节点的高斯函数的中心矢量Ci和ai。第二阶段利用最小二乘原则,求出输出层的权值Wik。2.2.1类内误差及收敛分区聚类方法基于方差标准的方法,其总的目标是根据固定的类数生成一个总体方差最小的分区。其目标函数为:E2k=∑k=1Ke2k(1)e2k=∑i=1nk(xik−Xk)2(2)Xk=(1/n)∑i=1nkxik(3)Ek2=∑k=1Κek2(1)ek2=∑i=1nk(xik-Xk)2(2)Xk=(1/n)∑i=1nkxik(3)其中,e2kk2为类内误差,Xk为均值向量,n表示n维空间上的n个样本集,K表示分类数{C1,C2…Ck},k=1,2…K。nk表示每个类Ck包含的样本数。xik属于类Ck的第i个样本。通常情况下,当样本从一个类分配到另一类时,如果总体误差不减小,则满足收敛标准。基本步骤:(1)选择一个设定为K类的初始分区,计算重心。(2)把样本分配给与其重心距离最近的类形成新分区。(3)用类的重心来计算新类的中心距离。(4)重复步骤(2)和(3)直到满足收敛标准则中止。2.2.2输出层节点数x为表达twj1jmj为输出层节点数yj1ix选取合适的表达RBF网络模型的后件表达式为:yj=∑i=1Lwjiri(x)+bj=∑i=0Lwjiri(x)=R(x)TWji1≤j≤Mj为输出层节点数yj=∑i=1Lwjiri(x)+bj=∑i=0Lwjiri(x)=R(x)ΤWji1≤j≤Μj为输出层节点数其中,wj0=b0,r0(x)=1,Wji=(wj0,wj1…wjM)T,R(x)=(r0(x),r1(x)…rM)T3基于聚类分析的rbf神经网络的学习算法本文将300份具有明确证候分型、症状的2型糖尿病文献资料参照国家标准《中医证候诊疗术语证候部分》规范证候名,并对症状(包括体征)进行赋值量化,有者为1,无者为0。然后将数据输入SPSS11.0软件进行数据管理,建立相关数据库,运用SPSS11.0软件功能进行数据调整和统计分析,根据频次大小,结合主成分分析,通过对KMO值、特征根大小及主成分的累积贡献率的大小综合判断,最后选取了41个症状,同时选取了常见的6类证候。6类证候分别为:气阴两虚证、阴虚证、气虚证、阴阳两虚证、血瘀证、燥热证。从263个样本中随即分配200个样本为学习训练样本,另63个样本作为检验样本。首先,让200个样本进行反复聚类和调整(由于6类证候间有些相互重叠,如气阴两虚证与阴虚证、阴阳两虚证、燥热证都有阴虚方面的重叠),最后得到6个聚类中心值为:把聚类中心值作为径向基层的第i个单元的变换中心矢量Ci,Ci与输入矢量同维。把每一类中与中心点相距最远的自变量到中心点的距离值作为第i个中心矢量的形状参数ai,ai=[3.1253.032.5343.8462.52.0]。其次,利用最小二乘算法求出输出层的权值Wji。最后,建立一个输入层节点数为41,隐层节点为6,输出层节点为6的RBF神经网络模型。本文又建立一个BP网络(略),让BP网络也学习训练这200个相同的样本。用63个测试样本对两个网络进行检验,检验的结果是基于聚类分析的径向基神经网络的证候诊断准确率为94.4%,BP网络的证候诊断准确率为61.1%,前者远高于后者。而且基于聚类分析的RBF神经网络的学习速度比BP网络的学习速度快103~104倍。把气阴两虚证、阴虚证、气虚证三者的聚类中心值做一个交叉回归图,图中显示气阴两虚证=0.11+0.39*阴虚证+0.3*气虚证(图略)。因此,基于聚类分析的RBF神经网络优化了中医证候诊断模型,解决了以往BP网络所遇到的难题:即高维数据的计算量大和泛化能力低,拓宽了RBF神经网络的应用。同时,证明了气阴两虚证≠阴虚证+气虚证,气阴两虚证与阴虚证、气虚证是二元线性关系。4基于聚类分析的rbf神经网络的中医诊断有效性验证中医证候和症状之间没有明确的函数关系,只有通过大量的文献资料、临床流调资料进行数据挖掘,客观如实地寻找中医证候和症状之间的内在关系,是中医证候研究的一种新思维、新方法。近年来,多学科交叉尤其AN

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论