人工神经网络在医学研究中的应用_第1页
人工神经网络在医学研究中的应用_第2页
人工神经网络在医学研究中的应用_第3页
人工神经网络在医学研究中的应用_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、人工神经网络在医学研究中的应用                 作者:李丽霞 张敏 郜艳晖 张丕德 周舒冬【摘要】  人工神经网络由于其具有高度的自适应性、非线性、善于处理复杂关系的特点,在许多研究领域得到了广泛应用,并取得了令人瞩目的成就。对其目前在医学研究领域中的应用做一简单综述。 【关键词】  人工神经网络; 应用人工神经网络(Artificial Neural Network,ANN)方法自从本世纪40年代被提出以来,

2、许多从事人工智能、计算机科学、信息科学的科学家都在对它进行研究,已在军事、医疗、航天、自动控制、金融等许多领域取得了成功的应用。目前出现了许多模仿动物和人的智能形式与功能的某个方面的神经网络,例如,Grossberg提出的自适应共振理论(Adaptive Resonance Theory,ART),T-Kohenen的自组织特征映射网络(Self-Organizing feature Map,SOM),径向基函数网络(Radial Basis Function,RBF),Hopfield网等。进入90年代以后,由于计算机技术和信息技术的发展,以及各种算法的不断提出,神经网络的研究逐渐深化,应用

3、面也逐步扩大,本研究对常用的神经网络方法及其在医学领域中的应用做一简单综述。    1  自组织特征映射网络(self-organizing feature map,SOM)在基因表达数据分析中的应用   1.1   方法介绍   脑神经学的研究表明,人脑中大量的神经元处于空间的不同区域,有着不同的功能,各自敏感着各自的输入信息模式的不同特征。芬兰赫尔辛基大学神经网络专家T.Kohonen根据大脑神经系统的这一特性,于1981年提出了自组织特征映射网络,它模拟人的大脑,利用竞争学习的方式进行网络

4、学习,具有很强的自组织、自适应学习能力,鲁棒性和容错能力,其理论及应用发展很快,目前已在信息处理、模式识别、图像处理、语音识别、机器人控制、数据挖掘等方面都有成功应用的实例。   Kohonen网络由输入层和竞争层组成,网络结构见图1。输入层由N个神经元组成,竞争层由M个输出神经元组成,输入层与竞争层各神经元之间实现全互连接,竞争层之间实行侧向连接。设输入向量为x=(x1,xd)T ,输出神经元j对应的权重向量为wj=(wj1,wjd)T ,对每一输出神经元计算输入向量x 和权重向量wj 间的距离,据此利用竞争学习规则对权向量进行调节。在网络的竞争层,各神经元竞争对输入模式

5、的响应机会,最后仅一个神经元成为胜利者,并对与获胜神经元有关的各权重朝着更有利于它竞争的方向调整,这样在每个获胜神经元附近形成一个“聚类区”,学习的结果使聚类区内各神经元的权重向量保持与输入向量逼近的趋势,从而使具有相近特性的输入向量聚集在一起,这种自组织聚类过程是系统自主、无教师示教的聚类方法,能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变。网络通过对输入模式的学习,网络竞争层神经元相互竞争,自适应地形成对输入模式的不同响应,模拟大脑信息处理的聚类功能、自组织、自学习功能,实现用低维目标空间的点去表示高维原始空间的点,其工作原理和聚类算法及改进方法参见相关文献1。&

6、#160;  1.2  应用   基因芯片技术的应用使得人们可以从基因水平探讨疾病的病因及预后,而基因芯片产生的数据具有高维度(变量多)、样本量小、高噪声的特点,样本量远小于变量数,如何从海量的数据中挖掘信息或知识成为重大课题。聚类分析是数据挖掘中的一类重要技术,传统方法主要有系统聚类、k-means聚类等,但在处理复杂非线性关系及变量间的交互作用时效果较差,受异常值影响较大。近年来神经网络技术法成为聚类领域的研究热点,其中自组织特征映射网络由于其良好的自适应性,其算法对基因表达数据的聚类有较高的稳定性和智能性,尤其在处理基因表达中有缺失数据及原始空间到

7、目标空间存在非线性映射结构时有较好的体现,适用于复杂的多维数据的模式识别和特征分类等探索性分析,同时可实现聚类过程和结果的可视化2。目前Kohonen网络已被成功用到许多基因表达数据的分析中,Jihua Huang等3设计6×6的网络对酵母细胞周期数据进行分析,总正确率为67.7%;曹晖等4将其算法改进后用在酵母菌基因表达数据中,总正确率高达84.73%,有较高的聚类效能;邓庆山5将该模型与K平均值聚类方法结合用于公开的结肠基因表达数据集和白血病基因表达数据集,聚类的准确率分别为94.12%和90.32%。目前Kohonen网络在医学领域中主要应用前景有: 发现与疾病相关的新的未知基

8、因,对目标基因进一步研究,提高诊断的正确率,并对药物的开发研究提供重要的线索; 对肿瘤组织的基因表达谱数据聚类,以期发现新的、未知的疾病亚型(肿瘤亚型),以便提出更加有针对性的治疗方案,为从分子水平对疾病分型、诊断、预后等提供依据; 发现与已知基因有相似功能的基因,为推断未知基因的可能功能提供线索。   2  BP神经网络在医学研究中的应用   2.1  BP神经网络在疾病辅助诊断中的应用   BP神经网络是目前应用最多的神经网络,一般由一个输入层(input layer)、一个输出层(output layer)、

9、一个或几个中间层(隐层)组成。每一层可包含一个或多个神经元,其中每一层的每个神经元和前一层相连接,同一层之间没有连接。输入层神经元传递输入信息到第一隐层或直接传到输出层,隐层的神经元对输入层的信息加权求和,加一个常数后,经传递函数运算后传到下一个隐层(或输出层),常用的传递函数是logistic函数,即h=1/(1+exp(-z) ,输出层神经元对前一层的输入信息加权求和经传递函数0 (线性或logistic函数或门限函数)运算后输出,BP神经网络一般采用BP算法训练网络,关于BP算法及改进可参考相关文献1。   人工神经网络具有强大的非线性映射能力,含一个隐层的网络可以实

10、现从输入到输出间的任意非线性映射,是典型的非线性数学模型,建立BP神经网络模型的一般步骤为: BP网训练集、校验集、测试集的确定; 输入数据的预处理:使输入变量的取值落在0到1的范围内,如果是无序分类变量,以哑变量的形式赋值; 神经网络模型的建立及训练:学习率、传递函数、隐层数、隐单元数的选择,注意防止过度拟合。一般使用灵敏度、特异度、阳性预测值、阴性预测值、ROC曲线对模型的预测性能进行评价。   BP神经网络已广泛用于临床辅助诊断中,白云静等6用于中医证候的非线性建模,建立了RA证侯BP网络模型和DN证侯BP网络模型,结果显示平均诊断准确率分别为90.72%、92.21

11、%,具有较高的诊断、预测能力。曹志峰7采用PROBEN1中的甲状腺疾病数据库用于甲状腺疾病(甲亢、甲减、正常)的诊断,结果显示训练样本的正确识别率为99.3% ,测试样本的正确识别率为98.2%,提示对临床诊断甲状腺疾病提供有益的帮助;还有学者用于急性心肌梗塞、甲状腺功能紊乱、乳腺癌、前列腺癌、宫颈癌、肺癌、卵巢癌、急性肺梗塞等的辅助诊断等8。   2.2  BP神经网络在生存分析中的应用   传统的生存分析方法有非参数、半参数、参数模型,参数模型主要有指数回归模型、Weibull回归模型,都要求对基线风险做一定的假设,但实际资料常常不符合条件

12、,生存分析中应用最为广泛的半参数模型:Cox比例风险模型,但它要求满足比例风险的假定,在很多情况下也难以满足。基于神经网络的生存分析模型可以克服这些困难,可以探测复杂的非线性效应,复杂的交互效应,模型中协变量的效应可以随时间变化,对数据的分布不做要求。目前一些策略被用到神经网络预测方法中分析含有删失的生存数据,主要有Faraggi-Simon(1995)法、Liestol-Andersen-Andersen(1994) 法、改良uckley-James(1979)法等。   BP神经网络建立生存分析模型常用的方法有9:连续时间模型(continuous time model

13、s)与离散时间模型(discrete time models)。常用的Faraggi和Simon10提出的连续时间模型扩展了Cox回归模型,允许非线性函数代替通常的协变量的线性组合,这种方法既保持了Cox回归模型的比例风险的特点,又提供了处理复杂非线性关系、交互作用能力的好方法。   离散时间模型常用的模型有: 输出层为单个结点:模型的输出层只有一个神经元结点,是最简单的神经网络模型,生存时间被分成两个区间,当研究者仅仅对某一时间点的预后感兴趣时,例如预测癌症患者的5年生存情况,如欲预测多个时间点,则需建立多个神经网络模型(每个模型对应一个时间区间); 输出层为多个结点:生

14、存时间被分成几个离散的区间,估计某个时间区间事件发生的概率,Liestol法是常用的离散时间模型。还有研究者在建立多个时间区间模型时将时间也做为一个输入变量,也有学者将神经网络纳入Bayes方法的研究框架。   一般采用灵敏度、特异度、一致性指数C(Concordance index)作为预测准确性的评价指标,神经网络在生存分析中的应用主要在于11:个体患者预后的预测,研究预后因子的重要性,研究预后因子的相互作用,对于预测变量的影响力强弱及解释性,还有待进一步探讨。            国外Ruth M.Ripley等等还将神经网络用于ECG、EEG等信号的识别和处理、医学图像分析中,取得了较好的结果。   人工神经网络是在研究生物神经网络的基础上建立的模型,迄今为止有代表性的网络模型已达数10种,人工神经网络不需要精确的数学模型,没有任何对变量的假设要求,能通过模拟人的智能行为处理复杂的、不确定的、非线性问题。在医学研究领域,变量间关系往往非常复杂,为了探测变量间的复杂模式,神经网络正逐渐变成分析数据的流行工具。目前国际上已出现许多着名的神经网络专业杂志:Neur

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论