




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选优质文档-倾情为你奉上肿瘤的诊断模型摘要 本文对肿瘤的诊断问题,应用神经网络与模糊数学的理论,给出了几种乳房癌的量化诊断方案首先,建立了LVQ神经网络模型,使用500组数据的前400组作为训练样本,用后100组数据对网络性能进行检测,诊断正确率达98%然后对这500个特征向量进行了回归分析,从30个特征中筛选出了6个特征,它们分别是:细胞核直径均值、标准差和最坏值、紧密度的均值、面积的最坏值、周长的均值并将以上6个特征用于LVQ网络,诊断正确率达95%进一步考虑到神经网络与模糊数学各自的特点,将二者有机结合构造了神经模糊系统,并用以上的6个特征对系统进行训练,诊断正确率达96%本文构造的模
2、型具有良好的稳定性,对于模式识别问题具有很强的实用价值,最后本文提出了神经网络和模糊数学深层次结合的方向一. 问题的重述肿瘤通过穿刺采样进行分析可以确定其为良性或恶性医学研究发现乳房肿瘤病灶组织的细胞显微图像的10个量化特征:细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度与该肿瘤的性质有密切关系现有500个已确诊病例,每个病例的一组数据包括采样组织中各细胞核的这十个特征量的平均值,标准差和“最坏值”(各特征的3个最大特征的平均值)共30个数据根据这500组数据建立诊断模型,并将其用于另外69名已做穿刺采样的患者为节省费用发展一种只用此30个特征数据中的部分特征来
3、区分乳房肿瘤是良性还是恶性的方法 二. 问题的假设1所给的500组病例具有广泛的代表性 2500组病例所反映的良性与恶性的概率分布符合病例的自然分布三. 问题的分析 本问题是一个典型的模式识别问题,要求根据它的特征量来进行分类 对于模式识别问题,现今有两类解决办法一类是传统的线性模型另一类是近年来发展起来的非线性模型本题是一个典型的非线性问题,用传统的线性模型解决有一定的困难,而且识别率不高所以非线性模型是解决此类问题的首选现今常用的非线性模型有神经网络模型和模糊系统模型神经网络由许多并行运算的简单单元组成,单个神经元的结构及其简单,但大量神经元相互连接组成人工神经元网络显示出人脑的某些特征:
4、1) 分布存储和容错性;2) 大规模并行处理;3) 自学习、自组织和自适应性;4) 它并不是各单元行为的简单相加,而表现出一般复杂非线性动态系统的特性 神经元可以处理一些环境信息十分复杂、知识背景不清楚和推理规则不明确的问题,如乳房癌诊断问题 模糊集打破了传统的分明集只有0和1的界限,任意元素可同时部分地属于多个模糊子集,隶属关系用隶属的程度来表示这更接近人的表述方式模糊规则是定义在模糊集上规则,常采用“If-then”(若则)的形式,可用来表示专家的经验、知识等由一组模糊规则构成的模糊系统可代表一个输入、输出的映射关系从理论上说,模糊系统可以近似任意的连续函数模糊系统除了模糊规则外,还包括模
5、糊逻辑推理和去模糊化的部分由于模糊集能处理非定量的信息,因此在模式识别(尤其是具有模糊特点的识别问题)中模糊系统具有很大的优势,本题肿瘤的良性、恶性正是模糊概念,所以用模糊系统进行模式识别会得到很好的效果为了避免量纲的影响,在应用数据之前对数据经行了标准化标准化方法:用每个数据与整体均值的差除以整体标准差四. 模型的建立与求解(一)神经网络模型学习向量量化(LVQ)是在监督状态下对竞争层进行训练的一种学习算法LVQ网络由一个竞争层和一个线性层组成竞争层的神经元将输入向量分成组,由现行层组合到期望的类中在任何给定的时刻,线性层的输出神经元只有一个非零输出1,该神经元就是竞争中得胜者假定获胜的元为
6、,它之所以获胜的原因是它受到了最大的输入刺激,那么, 的总加权输入为 其中,表示的状态,表示第个元到第个元的权值,表示第个输入分量其矩阵形式为 若元 获胜,就意味着 若连接到每个输出层神经元的权向量 都是规范化的,上式等价于 网络输入模式为时,具有权向量与最近的元将获得竞争的胜利若元竞争获胜,将权值作如下调整 (1) 使获胜者的权向量向输入向量移近一小段距离,这使网络在遇到或与接近的模式时,元可以有更大的获胜可能性若在竞争中失败,将权值作如下调整 (2) 使权向离开样品的方向移动,这样就减小了错误分类的机会在(1)、(2)式中,表示学习率 在本模型中取为0.01,取隐竞争层的神经元数为60,取
7、输出层神经元数为2,并规定输出(0,1)为良性,输出(1,0)为恶性用前400组数据作训练样本,经过15000次迭代,两类样本的聚类情况如下图:用后100组数据对训练进行检测,诊断正确率达98%对69组待定病例的诊断结果如下表: 病例号类别 病例号类别 病例号类别 病例号类别 B B B B91504 M B B B91505 B B B B M M B B B91789 B B B B B B B B B B B B91805 B B B B B B M M B B M91550 B B B M B B B M M91858 B B M B B B M B B B92751 B B M B
8、M B B M M B为了节省费用,增加网络训练速度,考虑将所给的数据降维,用多元回归分析的逐步回归法对数据进行了回归分析,把30个特征做为自变量,因变量采用良性病例取值为0,恶性病例取值为1逐步回归法避免了只将变量剔除就不再选入的缺点,它可以将变量反复选入、剔除,最终可得到一组最优权值,结果如下图所示: 从30个特征中筛选出了6个特征,它们分别是:细胞核直径均值、标准差和最坏值、紧密度的均值、面积的最坏值、周长的均值只用以上6个特征对网络进行训练,仍使用前400组数据作为训练,用后100组数据检验,诊断正确率达95%对69组待定病例的诊断结果如下表:病例号类别 病例号类别 病例号类别 病例号
9、类别BBBB91504BBBB91505BBBBMMBBB91789BBBBBBBBBBBB91805BBBBBBMMBBM91550BBBMBBBMB91858BBMBBBMBBB92751BBMBMBBMMB五. 神经模糊系统模型 从映射角度看,模糊系统和神经网络都具有(非线性)函数近似的能力它们有着以下的共同之处:(1)它们均可以从给定的系统输入/输出信号(数据)中,建立系统的(非线性)输入/输出关系 (2) 从数据处理的形式上看,它们均采用并行处理的结构 但是,模糊系统和神经网络有着明显的不同之处神经网络虽然对环境的变化具有较强的自适应学习能力,但是从系统建模的角度而言,它采用的是典型
10、的黑箱型的学习模式因此当学习完成后,神经网络所获得的输入/输出关系无法用容易被人接受的方式表示出来相反,模糊系统是建立在被人容易接受的“如果-则”表达方法之上,但如何自动生成和调整隶属度函数和模糊规则,则是一个很棘手的问题因此,将模糊理论和神经网络有机结合起来,取长补短,提高整个系统的学习能力和表达能力,是目前这一领域最受人注目的课题之一 神经网络和模糊系统的等价性: Kolmogorov定理 给定任意连续函数,这里是单位闭区间0,1,可以精确地用一3层前向网络实现,此网络的中间层(隐层)有2n+1个处理单元 BP定理 给定任意和任意函数,存在一3层BP网络,它可在任意平方误差精度内逼近. 模
11、糊系统的存在定理 给定任意连续函数和任意,存在由(1)式定义的使 神经网络和模糊系统各自本身就是一个非线性的输入/输出映射,因此模糊系统可以用一等家的神经网络来表示,同样,神经网络也可以用一等价的模糊系统来表示 基于神经网络的模糊系统: 模糊系统采用高木-管野(Takagi-Sugeno Model)(简称TS模型): 如果为,和为,和为,则 输入变量的联合隶属函数和结论部的函数fj(x)都用神经网络来求得模糊规则的个数由减法聚类方法得到,聚类参数如下: Range of influence: 0.3 Squash factor: 1.1 Accept factor: 0.6 Reject r
12、atio: 0.15 神经网络采用前向的BP网络,神经元的传递函数为Sigmoid函数,输出层采用线性函数网络结构如下图所示: 由于系统的结构比较复杂,用30维的数据进行训练十分缓慢,只用了前面已提取出的6个特征对系统进行了训练,得到了神经模糊系统用后100组数据进行检验,诊断正确率达96%病例号类别 病例号类别 病例号类别 病例号类别BBMB91504BBBB91505BBBBMMBBB91789BBBBBBBBBBBB91805BBBBBBMMBBM91550MBBMBBBMM91858BBMBBBMMBB92751BBMBMBBMMB六. 模型的进一步讨论神经网络和模糊系统的融合大致有两种形式:一种是用神经网络生成模糊系统的隶属函数和模糊规则来构造模糊系统,一种是使用模糊系统来初始化神经网络的初始权值来构造神经网络二者都可用于模式识别,并都有良好的效果但二者的特点又各不相同,第一种形式具有更加人性化的输出,便于构造专家系统,第二种形式有更好的自适应性对于模型的进一步讨论可以考虑二者的进一步结合,可以让两种系统按并行或串行的方式结合到一起,前一种系统的输出作为后一种系统的输入,这样二者接替使
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论