【毕业设计】基于bp网络的精神分裂症预测_第1页
【毕业设计】基于bp网络的精神分裂症预测_第2页
【毕业设计】基于bp网络的精神分裂症预测_第3页
【毕业设计】基于bp网络的精神分裂症预测_第4页
【毕业设计】基于bp网络的精神分裂症预测_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学号4109005029泰山医学院毕业设计(论文)题目基于BP网络的精神分裂症预测院(部)系放射学院所学专业生物医学工程年级、班级2009级1班完成人姓名高赞指导教师姓名专业技术职称张勇副教授2013年6月1日论文原创性保证书我保证所提交的论文都是自己独立完成,如有抄袭、剽窃、雷同等现象,愿承担相应后果,接受学校的处理。专业生物医学工程班级2009级1班签名2013年6月1摘要随着技术的进步,计算机与其他领域的合作越来越密切,解决了很多其他领域以前无法解决的难题。与此同时,随着生活水平和受教育程度的提高,健康问题越来越受到人们关注,将计算机应用于医疗领域进行疾病预测是当前研究的热点之一,正逐渐受到人们关注。目前,对疾病预测的研究存在下面两个问题其一,在医疗方面,计算机等设备绝大多数还是被用于疾病的检测而不是预测,此时计算机的作用仅仅是图像处理,在显示器上成像,甚至最终的结果还是需要医生来人工进行判断。在疾病诊断上医疗设备、计算设备只是作为辅助工具发挥着检测数据等最为基本的作用,医生作为整个过程的核心不可或缺。其二,很多疾病发病前的征兆或者发病时的症状具有相似之处,由于专家所研究领域的不同,专家根据所掌握的知识以及个人的经验,再结合病人的其他症状,所得出来的诊断结果可能有所不同,这样会造成严重的后果。针对以上提出的问题,本文将BP神经网络应用于精神分裂症预测,利用神经系统的并行性,对精神分裂症进行预测,降低预测的失效率,充分利用了这些疾病预测的相同数据部分,提高数据利用效率;预测结果具有节省时间,并且可信度高的特征。是将计算机技术应用于医疗领域的有效尝试,计算机不在仅仅用于医疗上的检测,更多的应用于预测。同时,由于计算机的精确性,能够尽量避免人为导致的误差,提高预测的精确度。关键字BP神经网络;疾病预测;精神分裂症预测ABSTRACTWITHTHEDEVELOPMENTOFTECHNOLOGY,THECOOPERATIONOFCOMPUTERSCIENCEANDOTHERSTUDYINGFIELDSAREGETTINGCLOSERANDCLOSER,THISTECHNOLOGYHAVESOLVEDALOTOFPREVIOUSUNSOLVABLEPROBLEMSATTHESAMETIME,WITHTHEIMPROVEMENTOFLIVINGCONDITIONSHEALTHPROBLEMSGRADUALLYATTENTION,THECOMPUTERSCIENCEUSEDINDISEASEPREDICTIONISONEOFTHEHOTPOTS,ANDISOFGREATSIGNIFICANTCURRENTLY,FORTHEDISEASESPREDICTION,THEREARETWOMAINPROBLEMSFIRSTLY,THECOMPUTEREQUIPMENTHAVENOTBEENWIDELYUSEDINDISEASESPREDICTION,BUTONLYUSEDINDETECTIONWHICHCANNOTWITHOUTTHEDOCTORSPARTICIPATIONSECONDLY,SOMETYPICALDISEASESHAVETHECOMMONSYMPTOMS,ANDMISDIAGNOSEDISALWAYSEXISTCONSIDERINGABOUTTHEPROBLEMS,INTHISPAPER,WEUSEBPNEURALNETWORKTOPREDICTDELIRATIONUSINGTHEPARALLELISMOFTHENEURALSYSTEM,TOPREDICTDELIRATION,REDUCINGTHEPREDICTEDFAILURERATE,ANDIMPROVEDATAUTILIZATIONEFFICIENCYEXPERIMENTSSHOWSTHEPREDICTIONRESULTSHAVETIMELINESS,ANDHIGHRELIABILITYINVIEWOFTHIS,THEDISEASEPREDICTIONBASEDONBPNEURALNETWORKWILLHAVEGOODAPPLICATIONPROSPECTSKEYWORDSBPNEURALNETWORK;DISEASEPREDICT;DELIRATIONPREDICTION目录第一章绪论111课题研究背景及意义112精神分裂症的危害2第二章BP神经网络421神经网络4211人工神经元5212激活函数6213神经网络模型7214神经网络工作方式822BP学习算法9221三层BP神经网络9222网络误差与权值调整10第三章BP网络的建模过程及精神病预测模型设计1131模型的设计11311确定训练样本11312变量值的归一化处理11313BP网络的初始化12314输入层的设计12315隐含层的设计12316输出层的设计1232其他需要注意的问题1233精神病模型拟合实例13311确定训练样本及测试样本13312设计合适的神经网络参数13313编写程序14314训练结果15315测试样本的前瞻性考核154讨论15参考文献16致谢17第1章绪论目前世界上精神病人的数量在不断增加,据世界卫生组织预测,到2020年精神病将成为使人丧失劳动能力的五大疾病之一,将严重影响世界的发展1。11课题研究背景及意义据新消息报30报道,目前,中国的精神病人数位居世界前列,患病使人失去就业能力,从而造成许多家庭贫困不堪。俄罗斯精神病专家波列耶夫表示,在世界各国这种疾病正以每年01的速度增长,而在中国这种情况更为严重2。目前在世界各国居民中有15至20的人需要得到精神和心理疾病医生的帮助,而在中国这一比例则高达20至25。患上这种病的原因主要有两种一是遗传,二是心理压力过大。近几年,各国居民生活、工作压力越来越大,造成许多人失业、穷困潦倒,巨大的心理压力是造成人精神失常的主要原因。另外,不良的社会生活环境也给人造成较大的精神压力。据统计,目前北京有1/8的居民害怕乘地铁,1/12的人不敢乘电梯,他们担心发生爆炸事件,因此处处小心谨慎。这种不良的社会环境最容易给居民造成心理障碍,心理承受能力差的人就容易患上精神病。目前,中国精神病方面的医生严重不足,如这一状况得不到改善,将对中构成巨大威胁。这些病人不仅不能为社会创造财富,还加重了社会负担。据欧盟统计,每年欧盟有5万人自杀,57是因为精神方面的问题,其中27是成年劳动力。精神病问题给欧盟各国经济发展造成了严重影响。专家指出,要解决这一问题,首先要改善目前的社会环境,减轻人们的心理压力。同时培训更多的心理医生,采取有效的手段来预防,诊断精神病,为他们提供心理帮助。精神分裂症SCHIZOPHRENIA是一种常见的精神病,据世界卫生组织估计,全球精神分裂症的终身患病率大概为3884,美国的研究,终身患病率高达13;我国1994年调查数据,城市地区患病率711,农村426。精神分裂症病因复杂,尚未完全阐明。多起病于青壮年,表现为感知、思维、情感、意志行为等多方面障碍,精神活动与周围环境和内心体验不协调,脱离现实。一般无意识障碍和明显的智能障碍,可有注意、工作记忆、抽象思维和信息整合等方面认知功能损害。病程多迁延,反复发作,部分患者发生精神活动衰退和不同程度社会功能缺损。综上可以看出,疾病的预测意义重大,也逐渐受到人们关注,关于好的预测算法的研究也越来越迫切。然而,现阶段关于疾病的预测还存在着以下两个问题第一虽然如今计算机的发展日新月异,不断取得新的突破,机器制造技术也日益精良。但是在医疗方面,计算机等设备绝大多数还是被用于疾病的检测,例如应用CT来做脑部肿瘤扫描,此时计算机的作用仅仅是图像处理,在显示器上成像,甚至最终的结果还是需要医生来人工进行判断。由此看出,在疾病诊断上医疗设备、计算设备只是作为辅助工具发挥着检测数据等最为基本的作用,医生作为整个过程的核心不可或缺。而在疾病预测方面的应用更是一片空白,不仅通过计算机进行疾病预测的例子十分罕见,甚至医生也只是进行疾病诊断、确诊,极少有从事疾病预测工作的,只是在疾病预防方面给出建议,例如建议人们合理的安排工作娱乐时间以减少精神压力,通过和朋友聊天到户外旅游等进行放松,然而这些只是最理想的,一旦人的健康状态发生改变,从健康转为亚健康状态,那么疾病预防也就失去了作用,该阶段却正是疾病预测的最佳时期,遗憾的是正如前面所述,疾病预测还没有在广泛应用。由此可见,疾病预测虽然收到了人们的广泛关注,但真正在医学上应用还处于起步阶段,需要探索。第二很多疾病发病前的征兆或者发病时的症状具有相似之处,例如某人表现症状为头晕,然而神经系统病变、耳部疾病、感冒、贫血、脑动脉硬化等都有可能导致这一现象的产生,由于专家所研究领域的不同,专家根据所掌握的知识以及个人的经验,再结合病人的其他症状,所得出来的诊断结果可能有所不同,严重情况下,甚至会产生相矛盾的结果,使病情恶化。事实上,现实生活中,由于误诊导致病人恶化的情况也时有发生。于此相似,疾病的诊断也存在着相同的问题,也需要避免由于知识不全、研究领域的差异、个人经验而导致预测失败甚至预测误导的结果。另一方面,如今很多研究者研究的预测算法只是做到预测是否为某一疾病,一旦预测结果不是所预测的目标疾病,将会导致预测失败,而不会考虑其他相似症状的疾病的可能性,这样使得预测的命中率降低,一旦预测失败,前面的数据将会失去价值,使得数据没有得到充分利用。利用现有数据进行算法预测是计算机科学研究的热门,疾病预测更是研究的重要领域。在这样的研究背景下,作者提出了基于BP神经网络心脏病预测方法,对上面提到的问题进行了深入的研究。12精神分裂症的危害疾病危害如未获得及时治疗,疾病症状给患者带来极大痛苦,患者日常学习、工作、生活能力受损,学生因学习能力下降而退学、休学,成人因工作能力受损而失去工作,对家人不知关心照顾,不能承担家庭的责任。有的发展到精神衰退状态,造成精神残疾。有时受幻觉、妄想、逻辑障碍、情绪障碍等精神症状的影响,患者可能出现伤害自己和他人的行为。需要特别指出精神分裂症得到及时、规范的治疗,绝大部分症状都可以缓解,可以避免发生不良的结第2章BP神经网络本章主要对本文所要使用的BP神经网络算法进行介绍,其中BP神经网络算法包括神经元、激活函数、神经模型、工作方式、学习方式、误差调整、算法推倒等的具体介绍。21神经网络人工神经网络(ARTIFICIALNEURALNETWORKS,简写为ANNS)也简称为神经网络(NNS)或称作连接模型(CONNECTIONMODEL),它是一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型3。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。人工神经网络是以人类的生理结构为出发点,探讨人类只能活动的相关机理。它是机器学习和人工智能计算方面最为活跃的分支之一。从PITTS在1943年首先提出了MP神经元数学模型开始,神经网络的研究大致上可以分为以下几个阶段19471969年是神经网络发展的初始阶段,然后经过19701986年的低潮过渡期,最后神经网络从1987年开始至今迎来了它的蓬勃发展时期4。特别是近二十年以来,神经网络不仅再一次从计算概念的内涵上进行了扩展,而且对认知与智能本质上的基础研究乃至整个计算机产业都产生了空前的刺激和巨大的推动作用,同时也使得神经网络无论是从理论、实践技术还是应用研究等各个方面都取得了引人注目的进展。可以说,现今阶段正式神经网络发展的一个鼎盛时期。现代科学技术发展的一个显著特点是学科之间的相互交叉,而信息科学与生命科学的相互交叉、相互渗透和相互促进正式最好的体现,因而将各种智能信息处理方法与人工神经网络结合起来研究具有很大的发展前景5。事实上,人工神经网络不仅具有并行处理、分布式处理和容错性的结构特征,还具备自学习、自组织、自适应的功能特征,具有联想记忆、非线性映射、分类和识别、优化计算、知识处理等方面的能力,使得他与其他人工智能方法或技术结合以及由此衍生的融合方法和融合系统成为了研究的一大热点。例如人工神经网络与遗传算法、模糊集理论、灰色系统、证据理论等融合方法的相关研究,正是人工智能和机器学习领域研究热点中的重点,并被应例如信息领域、自动化领域、工程领域、医学领域、经济领域等众多领域和各行各业中。目前,人工神经网络的研究内容主要集中在以下几个方面6(1)生物原型研究从生理学、心理学、解剖学、脑科学、病理学等生物科学方面研究神经细胞、神经网络、神经系统的生物原型结构及其功能机理。(2)建立理论模型根据生物原型的研究,建立神经元、神经网络的理论模型。其中包括概念模型、知识模型、物理化学模型、数学模型等。(3)网络模型与算法研究在理论模型研究的基础上构作具体的神经网络模型,以实现计算机模拟或准备制作硬件,包括网络学习算法的研究。这方面的工作也称为技术模型研究。(4)人工神经网络应用系统在网络模型与算法研究的基础上,利用人工神经网络组成实际的应用系统,例如完成某种信号处理或模式的功能。211人工神经元人工神经网络是由大量的简单基本元件神经元相互联接而成的自适应非线性动态系统。每个神经元的结构和功能比较简单,但大量神经元组合产生的系统行为却非常复杂。人工神经网络反映了人脑功能的若干基本特性,但并非生物系统的逼真描述,只是某种模仿、简化和抽象。与数字计算机比较,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制7。人工神经元是人工神经网络的基本元素,其原理图如下图所示图21人工神经元模型前面提到人工神经网络是模仿人类神经网络的工作原理运行的,所以,人工神经元和生物神经元人工神经元相似,也有多个激励输入,图中的X1,X2,XN表示其他神经元传来的神经元输入信号,他们同时输入神经元。生物神经元具有不同的突出性质和突触强度,这样使得不同的激励输入对神经元产生脉冲输入的影响的大小一不一样,在人工神经网络中用WIJ表示从神经元J到神经元I的连接权值,在一些神经元中权值还分为正负两种类型,为正时,模拟了生物神经元的突触的兴奋,为负时,模拟了生物神经元的突触抑制,权值大小表示突触兴奋或则抑制的强度。表示一个阈值THRESHOLD,或称为偏置BIAS,神经元的激活与否取决于某一阈值电平,即只有当神经元受到的突触兴奋或抑制达到这个阈值时神经元才被激活而产生脉冲输出,否则不会产生输出。F称为激活函数(ACTIVATIONFUNCTION)或则转移函数(TRANSFERFUNCTION),激活函数一般都是非线性的。根据图21神经元I的输入和输出的关系可以用数学表达式表示成21NXJWETI其中YI表示神经元的脉冲输出,NETI称为神经元I的净激活NETACTIVATION。如果将阈值看作是神经元I的一个输入X0的一个权值WI0,那么上述表达式可以简化为JTI22TEFY用X表示神经元ID的输入组成的向量,W表示对应权值所组成的向量(2,21XNO,210TNTW3)于是可以将神经元的输入输出表示为向量的形式(24)于是当神经元I的净激活为正时,表明神经元处于激活状态或兴奋状态FIRE,当神经元I净激活为负时,表明神经元处于抑制状态。图21中的神经元模型就是前面提到的MP模型MCCULLOCHPITTSMODEL,也称为神经网络的一个处理单元PE,PROCESSINGELEMENT,其特点是“阈值加权和”。212激活函数激活函数的选择是构建神经网络过程中的重要环节7,下面简要介绍常用的几种激活函数。(1)线性函数LINERFUNCTION(25)(2)阈值函数THRESHOLDFUNCTION(2,01CXF6)(3)斜面函数RAMPFUNCTIONKXFTTNEFYXFETFYTXWNET(2CXTKF,7)(4)S形函数SIGMOIDFUNCTION(210FEFAX8)双极S形函数(BIPOLARITYSFUNCTION)292X以上就是常用的五种激活函数,其中前三种为线性激活函数,而S形函数和双极S形函数为非线性激活函数,可以看出S形激活函数的值域为0,1,而双极S形函数的值域为1,1。由于BP神经网络要求激活函数是连续、可倒的,因此根据需要,一般采用S形函数和双极S形函数作为激活函数。213神经网络模型神经网络模型9是有大量的神经元互联形成的网络,可以根据神经元互联的形式对神经网络进行分类,常见的神经网络结构主要由以下三类(1)前馈神经网络FEEDFORWARDNEURALNETWORKS前馈神经网络又称前向神经网络。这种网络只在训练过程会有反馈信号,而在分类过程中数据只能向前传送,从输入层到隐含层,再从隐含层传输到输出层,整个过程中层间并没有没有向后反馈信号,因此被称为前馈网络,前馈网络通过引入隐层以及非线性激活(转移)函数,使得网络具备了复杂的非线性映射能力。(2)反馈神经网络FEEDBACKNEURALNETWORKS反馈神经网络相比于前馈神经网络而言,它具有从输出到输入的反馈连接,并且反馈神经网络还考虑到输出与输入之间在时间上的滞后性,因此需要用到微分方程和差分方程来描述神经网络的动态数学模型。(3)自组织网络SOM,SELFORGANIZINGNEURALNETWORKS自组织神经网络是一种无导师学习网络。它通过自动寻找样本数据内在规律来不断调整响应的神经网络参数,即所谓“无师自通”。自组织网络在结构上属于层次性网络,最简单的自组织神经网络结构具有一个输入层和一个竞争层,输入层负责接受输入信息并将输入模式向竞争层传递,起到了“观察”作用,竞争层主要负责对该模式进行“分析比较”,找出规律以正确归类。这种功能是通过竞争机制实现的。214神经网络工作方式人工神经网络的运行过程分为学习和工作两个状态。人工神经网络的学习状态神经网络的学习主要是指使用相关学习算法来不断的调整神经元之间的连接权值,最终使得神经元的输出更加符合实际要求。神经网络的学习算法又可以分为有导师学习和无导师学习两种。有导师学习的方法时先给出一组训练集(TRAININGSET)作为输入送入神经网络中,然后根据预期结果与实际输出结果的差值情况来调整神经网络中神经元的连接权值。有导师学习的主要步骤为1从给出的训练集合中选定一个样本为输入向量,表示期望的结果;2运行神经网络,获得实际输出O;3求出期望结果与实际输出的差值D;4根据D调整权值矩阵W。5对每个样本重复上面的过程,直到对每个样本误差都在允许的范围内是停止学习。无导师学习首先抽取出样本集合中所蕴含的统计特性,然后以神经元之间的联接权的形式存于网络中。2人工神经网络的工作状态人工神经网络的工作状态就是整个过程中神经元之间的权值不再做改变,神经网络作为分类器或者预测器等实用。22BP学习算法BP网路模型是目前应用最广泛的神经网络模型之一,也是全文的基础所在。221三层BP神经网络BP(BACKPROPAGATION)网络是1986年由RUMELHART和MCCELLAND为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。如果前馈神经网络采用了BP算法,则称之为BP神经网络。BP神经网络自提出至今,至今已经有26年的历史,已经成为应用最为广泛并且最具有代表性的神经网络模型之一10。BP网络能学习和存贮大量的输入输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(INPUT)、隐层HIDELAYER和输出层OUTPUTLAYER。BPBACKPROPAGATION神经网络,即误差反传误差反向传播算法的学习过程,由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经进一步处理后,完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练的过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。一个典型的3层BP神经网络模型如图22所示11图22神经网络序列图如图22,三层BP神经网络中其中列向量表示隐层第J个神经元对应的权值向量,表示输出层神经元J与隐层神经元K的连接权值。下面将分析BP神经网络中各层信号之间的数学关系对于神经网络输出层有210对于神经网络隐层有211MJNETFYI,21(2XVROF12)在上面的两个式子中的激活函数(或转移函数)根据应用需要可以均为S形函数函数,或者均为双极S形函数。以上式以及激活函数共同构成了三层前馈网的数学模型。LK222网络误差与权值调整当神经网络的输出与期望的输出差距较大或则不在可接受范围之内时,即存在输出误差,其定义如下213212KODE将上面的误差定义表达式展开,带入隐层数据则有2141KKNETF将表达式展开到输入层,则有22RMCRTHKWD(21OJF15)根据上市可以看出,神经网络输出的误差E是关于各层权值的函数,因此可以通过调整各层的权值来改变误差E的大小。显然,进行权值调整的目的是不断减少误差E的大小,使其符合具体的要求。因此,要求权值的调整量与误差的负梯度成正比,即LKMJWNFKJ,21,0(2FRVFRJ16)上式中,负号表示梯度下降,比例系数用常数表示,它就是神经网络训练中的学习速率。神经网络可以用作分类、聚类、预测等。神经网络需要有一定量的历史数据,通过历史数据的训练,网络可以学习到数据中隐含的知识。在你的问题中,首先要找到某些问题的一些特征,以及对应的评价数据,用这些数据来训练神经网络。虽然BP网络得到了广泛的应用,但自身也存在一些缺陷和不足,主要包括以下三个方面的问题。首先,由于学习速率是固定的,因此网络的收敛速度慢,需要较长的训练时间。对于一些复杂问题,BP算法需要的训练时间可能非常长,这主要是由于学习速率太小造成的,可采用变化的学习速率或自适应的学习速率加以改进。其次,BP算法可以使权值收敛到某个值,但并不保证其为误差平面的全局最小值,这是因为采用梯度下降法可能产生一个局部最小值。对于这个问题,可以采用附加动量法来解决。再次,网络隐含层的层数和单元数的选择尚无理论上的指导,一般是根据经验或者通过反复实验确定。因此,网络往往存在很大的冗余性,在一定程度上也增加了网络学习的负担。最后,网络的学习和记忆具有不稳定性。也就是说,如果增加了学习样本,训练好的网络就需要从头开始训练,对于以前的权值和阈值是没有记忆的。但是可以将预测、分类或聚类做的比较好的权值保存。第3章BP网络的建模过程及精神病预测模型设计在流行病学中,可以应用BP网络建立疾病的预测模型,建模的基本过程如下首先收集导致疾病发生的主要影响因素及疾病发生的结果然后把影响因素及疾病结果输入到设计好神经网络模型中进行反复训练,直到网络收敛即达到预期的训练误差,在训练过程中可适当采用一定的技巧使网络的训练速度最快、误差最小、模型最优最后用建立好的模型进行疾病预测。下面具体探讨网络模型的设计要点。31模型的设计311确定训练样本训练样本应来源于研究总体的一个随机无偏样本,并且按随机、对照、重复及盲法等原则收集资料、整理资料、分析资料,保证训练结果的无偏性。训练样本含量适宜,含量过大会造成训练速度偏慢,训练结果过分逼近训练集或者说是该研究的外部真实性较差,使得网络的推广泛化能力降低,况且,大样本的收集大大增加了工作量样本过小其代表性不够,使训练结果不够可靠或者说是该研究的内部真实性较差。一般来说,网络的结构越复杂,所需样本越多,结构越简单,所需样本可相应减少。对于单层BP网络可参照LOGISTIC回归对样本含量的一般要求,当样本含量与连接权的个数比为101时,就基本能够满足要求,多层BP网络的样本量应在此基础上根据网络的复杂程度适当增加。312变量值的归一化处理归一化处理的目的是把变量值归一到区间1,1内,此原因大致有两个一是因为BP网络中非线性传递函数的值域一般在区间1,1内,因此输入及输出变量的取值都限于这个区间之内。二是为了使输入值特别是那些比较大的输入值均落在SIGMOID传递函数变化较大的区间,使网络的训练速度最快,改善网络的性能,当然如果输入及输出值原本就位于0,1区间内,可不进行的归一化处理,归一化处理可采取以下两种形式(3/MIN,AX,JJIBJI1)(3A,JIJIJI2)上式中为归一化后样本中第J个样品的第I个输入变量,为原始资料第J个BJIXJIX样品的第I个输入变量XJI,MAX与XI,MIN为原始资料第J个样品的第I个输入变量的最大值和最小值。313BP网络的初始化开始训练时,首先进行网络权值的初始化,这是因为如果初始权值选择不当,有可能造成训练时间过长,误差平面陷入局部极小12,甚至不收缩。所以网络的初始权值一般取11之间的随机数,这样可保证每个神经元的权值都能够在型传递函数变化梯度最大的地方进行调节。314输入层的设计输入层仅设一层,输入神经元的个数与输入变量的个数相同。315隐含层的设计一是隐含层的层数,对BP网络而言,一个三层BP网络就可以完成任意的N维到M维的映射,一般情况下,采用单隐层的网络就可满足要求二是隐含层神经元的个数,隐单元数目的确定比较复杂,与资料的特点、输入输出单元的数目都有关系,往往根据设计者的经验和多次试验来确定,本文采取类似于统计学中建立“最优”多元回归方程中逐步向前法和向后法的方式来确定隐单元的数目,该方法如下先根据以下公式确定一个隐单元数的范围(33)式中N为输入单元数,M为输出单元数,A为1,10之间的常数。然后放入足够多的隐单元,通过训练将那些不起作用的隐单元逐步剔除,直到不收缩为止此即灵敏度修剪算法或者在开始时放入比较少的神经元,逐步增加隐单元的数目,直到达到比较合理的隐单元数目为止。316输出层的设计输出层仅有一层,输出层神经元的个数与所希望得出的预测变量数目相等。32其他需要注意的问题如何提高网络的泛化能力。网络的泛化能力,通俗的说就是网络对新样本的预测能力。网络的泛化能力与网络的结构和训练样本的特性有关,一般说来,网络的隐节点数与隐层数越少,网络的泛化能力越强,因此在实际应用时尽可能采用较少的隐节点数和隐层数来得到较优的网络,另外,加入噪声等也可以提高网络的泛化能力。如何提高网络的训练速度与收敛速度。为提高训练速度,可采用变化的学习速率或自适应的学习速率。如何克服局部极小。BP算法可以使权值收缩到某个值,但并不能保证其误差平面的全局最小值,这是因为采用梯度下降发可能会产生一个局部最小值。对于这个问题,可采用附加动量法、遗传算法等。AMN133精神病模型拟合实例某市通过随机抽样、多因素逐步LOGISTIC回归分析该市的4所精神病医院的精神分裂症新发病例及其对照各131例,筛选出影响精神分裂症发病的主要因素共10个X1本人学历、X2母亲学历、X3婚姻状况、X4事件经历史、X5性格、X6工作学习压力、X7母亲孕龄、X8出生体重、X9家族史、X10非双亲抚养史。变量赋值如表1。311确定训练样本及测试样本以上述131对样品作为训练样本,另外选取精神分裂症患者及正常人各20例作为测试样本。312设计合适的神经网络参数输入神经元10个,单层隐含层,隐含层神经元数目413个之间,通过灵敏度修剪算法确定隐含层的最佳神经元个数,输出层神经元个数为1训练次数1000次,训练目标001,学习速率01隐含层采用型正切函数TANSIG,输出层采用型对数函数LOGSIG,网络训练的函数设定为TRAINLM。表1精神分裂症发病影响因素及量化编号因素赋值X1本人学历0小学及以下1初中2高中及中专3大学4硕士及以上X2母亲学历0较低1中等2较高X3婚姻状况0已婚1未婚X4事件经历史0否1是X5性格0内向1一般2外向X6学习及工作压力0很轻1一般2很大X7母亲孕龄0小于37周或大于42周137到42周X8出生体重0小于2500克12500到4000克2大于4000克X9家族史0无1三代以内旁系2三代以内直系X10非双亲抚养0否1是Y是否发病0否1是313编写程序应用MATLAB70编写BP神经网络程序如下P【0131003010;0112214121;】输入训练样本的输入变量PFORI110PI,(PI,MINPI,)/MAXPI,MINPI,输入变量的归一化处理END输入训练样本的输出量TT1111111THRESHOLD01010101010101010101限定输入变量的最大值与最小值NO4567891011121314隐含层神经元的个数FORI111NETNEWFFTHRESHOLD,KNOI,1,TANSIG,LOGSIG,TRAINLM设定网络训练函数NETTRAINPARAMEPOCHS1000设定训练次数NETTRAINPARAMGOAL001设定训练目标LPLR01设定学习速率NETINITNET网络的初始化NETTRAINNET,P,T网络训练P_TEST01310030100112214121输入预测样本的输入变量FORI110P_TESTI,P_TESTI,MINP_TESTI,/MAXP_TESTI,MINP_TESTI,归一化处理ENDOUTSIMNET,P_TEST输出预测变量X11111111输入预测样本结果PLOT140,XOUT绘制预测误差曲线314训练结果通过反复训练发现,当隐含层神经元个数为8时,网络的训练速度最快,仅需要9次训练便达到到了预期的训练误差,训练的速度也比均匀,网络振荡最小。315测试样本的前瞻性考核把40个测试样本的调查资料输入上述训练好的BP神经网络模型进行前瞻性考核,如果按照预报误差大于005时为预测错误的标准,则病例中有2例预测错误,正常人有3例预测错误,灵敏度及特异度分别为90、85,预测的一致率为875,前瞻

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论