已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
a b s t r a c t u n d e rt h ec i r c u m s t a n c e so fp u t t i n gn e wr m l w a yl i n e si n t ou s eo ri m p r o v i n g p a s s e n g e rt r a i ns p e e do ri n c r e a s i n gf r e i g h t t r a i nt o n n a g eo rr e f o r m i n gd r i v i n g s y s t e m ,l o c o m o t i v et r a c t i v ec h a r a c t e r i s t i ct e s th a sb e c o m e af o u n d a t i o n a lt e c h n i c a l i o b i tp r o v i d e ss c i e n t i f i cd a t af o rr a i l w a ya d m i n i s t r a t i o nt om a k em a n a g e m e n t d e c i s i o na n dt r a n s p o r t a t i o n sp l a n ,t od i gp o t e n t i a la n di n c r e a s ep r o f i t t h er e a l t i m ec a l c u l a t i o n o ft r a c t i v ef o r c ea n db r a k i n gf o r c ei st h ec o r eo ft h es y s t e m a i m i n ga tt h ed i s a d v a n t a g e so ft r a d i t i o n a lc a l c u l a t i o n so f l o c o m o t i v et r a c t i v ea n d b r a k i n gf o r c e ,t h em e t h o do fa r t i f i c i a l n e u r a ln e t w o r km o d e li sp r o p o s e d t h e s t r u c t u r ed e s i g no ft h en e u r a ln e t w o r ki s e l a b o r a t e d t h e p a p e r f i n d so u tt h ed i s a d v a n t a g e so f t r a d i t i o n a lm e t h o d a tt h e m e a n t i m e ,b yr e s e a r c h i n gt h e o r y a n dc h a r a c t e r i s t i co ft h ea r t i f i c i a ln e u r a l n e t w o r ka n da n a l y z i n gi t sn o n l i n e a ra p p r o a c h i n gc a p a c i t y , t h ew r i t e rp r o b e si n t o t h ef e a s i b i l i t yo ft h ea p p l i c a t i o no fa r t i f i c i a ln e u r a ln e t w o r ka p p l y i n gt ot h e l o c o m o t i v et r a c t i v ec h a r a c t e r i s t i ct e s t ac a l c u l a t i o no ft r a c t i v ef o r c ea n db r a k i n g f o r c em o d e lu s i n ge r r o r b a c k p r o p a g a t i o nt r a i n i n gn e u r a ln e t w o r k ( u pn e t w o k ) i sp r o p o s e d t h es t r u c t u r e d e s i g no ft h en e u r a ln e t w o r ki s e l a b o r a t e d t h ep r o b l e m ss u c ha sc h o i c ea b o u tt h e n o d en u m b e ro fh i d d e nl a y e r ,d a t ap r e t r e a t m e n t ,a n ds oo na r ed i c u s s e d ;i na l l u s i o n t ot h es h o r t a g e so fb pa r i t h m e t i cs u c ha se a s yt of a l li n t ol o c a ls m a l l n e s sa n ds l o w c o n s t r i n g e n c ys p e e d ,t h ep a p e rb r o u g h tf o r w a r dt h ea m e l i o r a t i nm e a s u r e s i nt h ee n d ,t h es i m u l a t i o ni sc a r r i e do u tw i t hm a t l a b6 5u s i n gt h e d a t a p r o v i d e db yc h e n g d ur a i l w a yb u r e a ua n d t h e s er e s u l t sa r ep r e s e n t e d i tw a s s h o w nt h a tt h ea c c u r a c yo ft h er e s u l ti si n c r e a s e d k e yw o rds :t r a c t i v ef o r c e ;b r a k i n gf o r c e ;b pn e t w o r k 西南交通大学学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使耀学位论文斡援定,同意学校 保甓并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅 和借阅。本入授权两南交通大学可以将本学术论文编入有关数据库进行检索, 可以采用影印、缩印或摆描等复裁手段保存和汇编本学篷论文。 本学位论文属于 1 保密口,在年解密后适用本授权书; 2 。不保密囤,适用本授权书。 学位论文作者签名; 锨缎磐, b 期洳黾 、 , 、 一、 、- - 止 鬣 、 - - f , l 图2 1z q 8 0 0 1 牵引电动机特性曲线 韶山3 b 型电力机车采用的方法是在牵引电动机励磁绕组两端并联分路 电阻来进行磁场削弱。磁场削弱共分3 级:= 7 0 ;矽- - _ 5 4 ;= 4 5 。 为了避免脉动电流分量对电机换向的影响,在励磁绕组旁还并联一个固定分 路电阻,使励磁绕组中流过励磁电流的交流分量相应减小,从而改善电机换 向。固定分路磁场削弱系数为- - 9 5 。 磁场削弱时:当电枢电流为,时,其转速降近似等于在满磁场情况下当电 枢电流为,时的转速。在满磁场情况下,当负载电流为,速度为y 时, 牵引力为最。在磁场削弱情况下,当负载电流为,速度为y 时,牵引力为 = 等 ( 2 - 8 ) p 即磁场削弱后,在相同的速度下,牵引力将增加为原来的l 夕【8 】 2 阻力的计算 列车运行阻力可以分为两大类:基本阻力和附加阻力。 影响基本阻力的因素复杂,难以用纯理论公式求算,只能通过大量的实验 综合得出的实验公式来计算。这些公式都用单位阻力的形式表达。单位阻力 是平均到机车、车辆、或列车每k n 重力上的阻力,分别称为机车、车辆或列 车单位阻力,用w 表示。单位是n k n f 引。 总阻力和单位阻力的关系是: w :掣( 2 - 9 ) 赢 撇 西南交通大学硕士研究生学位论文第10 页 机车基本阻力的计算 对于s s 3 b 机车: w o = 2 2 5 + 0 0 1 9 v + o 0 0 0 3 2 0 v 2 ( n l 洲) ( 2 1 0 ) 二、制动力的计算 机车电阻制动特性在励磁电流各定值、制动电流限值4 2 0 a 时,其制动力 与机车速度的关系式: 反= k 1 0 f v ( m )( 2 - 1 1 ) 式中 k ,系数 吮励磁磁通( w b ) v 机车速度( 1 l l s ) 在进行韶山3 型电力机车制动力与机车速度关系计算时,系数巧值为 1 1 8 8 ,丸值由电机空载特性查出。 韶山3 b 型电力机车的牵7 1 电机空载特性曲线i l = ( 矽) ,如图2 - 2 所示。 磁通以矽符号表示,其标准计量单位为w b ( 韦伯) 。 甲0 一一 , , , f t l j | , , 圈l 一7 幸引电机空t 特性由墁“一,( ) 图2 - 2 牵引电机空载特性曲线 西南交通大学硕士研究生学位论文第11 页 三、计算结果分析 我们采用成都铁路局试验车的数据,运用此方法进行牵引力与制动力的 计算,来检验此方法的可行性。 在m a t l b 6 5 环境下,随机挑选一组数据进行分别计算牵引力与制动力, 并于试验值相比较,结果如下图所示。图2 3 表示采用牵引特性计算得到的牵 引力与牵引试验得到的牵引力试验值的对比。图2 - 4 表示计算得到的制动力与 试验得到的制动力试验值的对比。 计算值与试验值相差甚至能达到几倍。效果并不理想。分析其原因,据 牵引特性计算公式计算方法存在以下问题: 1 涉及到电气、机械等多种参数,且大多数是非线性的,所以难以确定一个 精确的数学模型,因此计算结果误差大。 2 计算中所涉及的公式,比如s s 3 b 机车的特性控制函数等,都是在理想状 况下的公式,在实际中,受线路条件等的限制,往往无法在理想状况下运 行。 3 速度、电压、电流的采集具有延时性,所采集到的量不能保证是同一时刻 下量。 4 牵引力与制动力的大小不仅受到机车本身的影响,还要受到供电系统、线 路条件、机车操纵等各方面的影响。 因此,这种牵引力与制动力的计算方法实际效果不好,应用于实践还有 待于改进。 图2 3 牵引力的计算值与试验值比较 西南交通大学硕士研究生学位论文第12 页 雾l 船一蜚i o 笮;纯彩铎孵7 彩髯锄獭二鬻二哆:缈7 奄捌辔缆掣蚴僦绎搿蠛拶 o j 、一“。 , 。, i 二。r 二。 二二二。1 二, a 摩船,一 图2 - 4 制动力的计算值与试验值比较 2 4 应用人工神经网络计算的可行性 针对以上问题,本文提出采用人- 1 - * * 经网络进行牵引力与制动力的计算。 人工神经网络实际上是由大量简单元件相互连接而成的复杂网络,具有 高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统。神经网 络是模仿人脑工作方式而设计的一种机器,它可用电子或光电元件实现,也 可用软件在数字计算机上仿真;或者说神经网络是一种具有大量连接的并行 分布式处理器,它具有通过学习获取知识并解决问题的能力,而且知识是分 布存储在连接权值中。由于神经网络的结构特征和神经元的学习能力,使得 神经网络具有下列特点: 一、非线性映射逼近能力 一个由非线性神经元互联而成的神经网络自身是非线性的,并且非线性 是一种分布于整个网络中的特殊性质。有理论证明,任意的连续非线性函数 映射关系都可由某一多层神经网络以任意精度加以逼近。 二、对信息的并行分布式综合优化处理能力 神经网络的大规模互连网络结构,使其能很快的并行实现全局的实时信 息处理,并很好的协调多种输入信息之间的关系,兼容定性和定量信息。 三、高强的容错能力 神经网络的并行处理机制及冗余结构特性使其具有较强的容错特性,提 一一埘弘;j 一 _ 、 一, 。矿唧。,断i弘。,舭:小丫。,哼 制动力( k = 西南交通大学硕士研究生学位论文第13 页 高了信息处理的可靠性和鲁棒性。 四、对学习结果的泛化和自适应能力 经过适当训练的神经网络具有潜在的自适应模式匹配功能,能对所学信 息加以分布式存储和泛化,这是其智能特性的重要体现。便于集成电路实现 和计算模拟。 由于机车结构复杂,牵引装置和制动装置是一个复杂的非线性系统,人 工神经网络在解决非线性系统问题上由良好的效果。同时以往的牵引试验积 累了大量的数据,几乎包含了机车运行中的各种工况,为设计人工神经网络 提供了完整的训练样本,可以利用大量的试验数据以及人工神经网络非线性 非线性逼近能力计算出机车在各种运行情况下的牵引力与制动力。因此,利 用神经网络计算是可行的方案。 西南交通大学硕士研究生学位论文第14 页 第3 章人工神经网络的基本理论 3 1 人工神经网络的发展历史和现状 人类关于认知的探索由来已久。早在公元前4 0 0 年左右,希腊哲学家柏拉图 ( p l a t o ) $ d 亚里士多德( a r i s t o t l e ) 等,就曾对人类认知的性质和起源进行过思考, 并发表了有关记忆和思维的论述。在此及以后很长的一段时间内,由于科学技 术发展水平所限,人们对人脑的认识主要停留在观察和猜测的基础之上,缺乏 有关人脑内部结构及其工作原理的科学依据,因而进展缓慢。直到2 0 世纪4 0 年代,随着神经解剖学、神经生理学以及神经元的电生理过程等的研究取得突 破性进展,人们对人脑的结构、组成及最基本工作单元神经元有了越来越充分 的认识,才使得神经网络的研究成为可能。1 9 4 3 年,神经生物学家m c c u l l o c h 和青年数学家p i t t s 合作,提出了第一个人工神经元模型,并在此基础上抽象出 神经元的数理模型,开创了神经网络的研究。纵观神经网络的发展历史,其发展 过程大致可以概括为如下4 个阶段。 一、第一阶段 这是神经网络理论研究的奠基阶段,以m c c u l l o c h 和p i t t s 提出人工神经元 的数理模型( 即神经元的阈值模型,简称m p 模型) 为标志,神经网络拉开了研究 的序幕。为了模拟起连接作用的突触的可塑性,神经生物学家h e b b 于1 9 4 9 年 提出了连接权值强化的h e b b 法则。这一法则告诉人们0 申经元之间突触的联 系强度是可变的,这种可变性是学习和记忆的基础。h e b b 法则为构造具有学习 功能的神经网络模型奠定了基础。1 9 5 2 年,英国生物学家h o d g k i n 和h u x l e y 建立了著名的长枪乌贼巨大轴索非线性动力学微分方程,即h h 方程。这一方 程可用来描述神经膜中所发生的非线性现象如自激振荡、混沌及多重稳定性 等问题,所以有重大的理论与应用价值。1 9 5 4 年,生理学家e c c l e s 提出了真实 突触的分流模型,这一模型由于通过突触的电生理实验得到证实,因而为神经 网络模拟突触的功能提供了原型和生理学的证据。1 9 5 6 年,u t t l e y 发明了一种 由处理单元组成的推理机,用以模拟行为及条件反射现象。7 0 年代中期他把该 推理机用于自适应模式识别,并认为该模型是能反映实际神经系统工作原理 的。 二、第二阶段 西南交通大学硕士研究生学位论文第15 页 l9 5 8 年,r o s e n b l a t t 在原有m p 模型的基础上增加了学习机制。他提出的 感知器模型,首次把神经网络理论付诸工程实现,他的成功之举大大激发了众 多学者对神经网络的兴趣。r o s e n b l a t t 证明了两层感知器能够对输入进行分类, 他还指出了带隐含层处理元件的三层感知器这一重要的研究方向。r o s e n b l a t t 的神经网络模型包含了些现代神经计算机的基本原理,从而形成神经网络方 法和技术的重大突破。神经网络的研究迎来了第一次高潮期。1 9 6 0 年,w i d r o w 和h o f f 提出了a d a l i n e 网络模型,这是一种连续取值的自适应线性元神经网 络模型,可以用于自适应系统。他们针对输入为线性可分的问题进行了研究, 得出期望响应与计算响应的误差可能搜索到全局最小值。日本科学家a m a r i 注重把生物神经网络的行为与严格的数学描述相结合,尤其是对信任问题数学 求解研究得出一定成果;w i l l s h a w 等人提出了一种称为全息音的模型,为利用 光学原理实现神经网络奠定了理论基础;n i l s s o n 对多层机即有隐含层的广义 认知机作了精辟的论述等等。上述成果足以表明神经网络研究己获得了广泛 的成功。 三、第三阶段 正当一些科学家怀着极大的热情追求神经网络那遥远但并非远不可及的 目标时,m i n s k y 和p a p e r t 于1 9 6 9 年在p e r c e p t r o n s 著作中,指出简单的线性感知 器的功能是有限的,它无法解决线性不可分的两类样本的分类问题,如简单的 线性感知器不可能实现“异或”的逻辑关系等。这一论断给当时人工神经元 网络的研究带来了沉重的打击,以致美国及前苏联的一些科研机构纷纷停止对 此类项目提供资助,而使得这个领域的学者不得不转向其它课题的研究。神经 网络理论的发展一时间步入了低潮期。也许m i n s k y 的评论是过于苛刻了,不过 这一评论一定程度上暴露出当时神经网络研究的局限性,因而有一定的启发 性。那以后人们很快对如何解决非线性分割问题有了明确的认识,但那时的科 学界已投向其它热点。可喜的是,仍有少数具有远见卓识的科学家持之以恒地 继续这一领域的研究,另有一些科学家在此期间从新投入到这一领域中。1 9 7 6 年,g r o s s b e r g 提出了自适应共振理论( a r t ) ,他与c a r p e n t e r 一起研究的a r t 网 络,有a r t l 和a r t 2 两种结构,能够识别或分类任意多个复杂的二元输入图像, 其学习过程有自组织和自稳定的特征。m a r r 关于小脑、海马和大脑皮层学习 网络进行了模拟研究。w e r b o s 提出了有一定实用价值的b p 理论及反向传播 原理。f u k u s h i m a 提出了用于视觉图像识别的n e o c o g f i t r o n 模型,他在r o s e n b l a t t 知觉器网络基础上增加了隐层,构成多层认知器,实现着可塑的反馈联系和更 为普遍的前馈联系。k o h o n e n 在一本专著中阐述了全息存储器与联想存储器 西南交通大学硕士研究生学位论文第16 页 的关系,后来他又提出了自组织映射网络模型。他们的工作为日后神经网络理 论研究的又一次高涨打下了坚实的基础。 四、第四阶段 这是神经网络理论研究的主要发展时期。1 9 8 2 年,美国国家科学院的刊物 上发表了著名的h o p f i e l d 模型的理论。其主要内容是,建议收集和重视以前 对神经网络所做的工作,他指出了各种模型的实用性。h o p f i e l d 的模型不仅对 人工神经网络信息存储和提取功能进行了非线性数学概括,提出了动力方程和 学习方程,还对网络算法提供了重要公式和参数,使人工神经网络的构造和学 习有了理论指导,在h o p f i e l d 模型的影响下,大量学者又激发起研究神经网络的 热情,积极投身于这一学术领域中,神经网络理论研究很快便迎来了第二次高 潮。另一个代表1 6 人组成的“并行分布式处理( p d p ) 研究组”1 9 8 6 1 9 8 8 年出版了三卷著作,取得了许多成果,其中也证明了多层次感知器可以解决 非线性问题。从那时至今,人工神经网络发展进入了新的高潮时期,人工神 经网络的研究在世界各国都受到格外重视。国际电气工程师协会( i e e e ) 和 新的国际神经网络协会( i n n s ) 每年组织神经网络的国际学术年会;欧洲、 美国和日本的大学开设有关人工神经网络课程;大量研究生选择人工神经网 络的研究课题;许多出版社汇集论文集或出版专著;许多公司也关注人工神 经网络的软硬件产品并使之成为他们经营项目;各国政府和部门均投入大量 资金支持人工神经网络的研究;全世界每年发表关于人工神经网络的文章在 千篇以上;人工神经网络的研究从新进入新高潮。我国人工神经网络的研究 也在努力跟上国际发展的步伐。1 9 9 0 年召开了首届全国神经网络学术年会, 并由中华医学会、中国心理学会、中国电子学会、中国机电学会、中国光学 学会、中国物理学会、中国计算机学会、中国自动化学会、中国通信学会和 中国数学学会等十三个以及学会支持,负责组织全国学术会议和于国际同行 联系。现已召开过四届全国学术会议和两届在北京召开的国际会议。国内也 出版了不少有关著作。并有数百人的队伍从事人工神经网络的研究【l2 1 。 3 2 人工神经网络的结构模型 一个人工神经网络的神经元模型与结构描述了一个网络如何将它的输入 矢量转化为输出矢量的过程。这个转化过程从数学角度来看就是一个计算过 程。也就是说,人工神经网络的实质体现了网络输入和其输出之间的一种函 数关系。通过选取不同的模型结构与激活函数,可以形成各个不同的人工神 西南交通大学硕士研究生学位论文第17 页 经网络,得到不同的输入输出关系式,并达到不同的设计目的,完成不同的 任务。所以在利用人工神经网络解决实际应用问题之前,必须首先掌握人工 神经网络的模型结构及其特性以及对其输出矢量的计算。 神经元是人工神经网络的基本处理单元,它一般是一个多输入单输出的 非线性元件。神经元输出除受输入信号的影响外,同时也受到神经元内部其 他因素的影响,所以在人工神经元的建模中,常常还加入个额外输入信号, 称为偏差( b a i s ) 有时也称为阈值或门限值。 一个具有r 个输入分量的神经元如图3 1 所示。其中,输入分量p ( j = 1 ,2 ,r ) 通过与它相乘的权值分量w ,( j = 1 ,2 ,r ) 相连,以w ,只的形式求和 。 百。 后,形成激活函数f ( ) 的输入。激活函数的另一个输入是神经元的偏差b 。 p i p 2 p r a 图3 1 神经兀结构模型 权值w 和输入尸的矩阵形式可以由形的行矢量以及尸的列矢量来表示: 矿= w lw 2 哗】( 3 1 ) p = 曰昱e 】7( 3 - 2 ) 神经元模型的输出矢量可表示为: a = f ( w 宰尸+ 6 ) = 厂( 吩弓+ b ) - - f ( n ) ( 3 3 ) j = l 可以看出偏差被简单地加上w 木p 上作为激活函数的另一个输入分量。实 际上偏差也是一个权值,只是它具有固定常数l 的输入。在网络的设计中, 偏差起着重要的作用,它使得激活函数的图形可以左右移动而增加解决问题 的可能性。 激活函数( a c t i v a t i o nt r a n s f e rf u n c t i o n ) 是一个神经元及网络的核心。网络解 西南交通大学硕士研究生学位论文第18 页 决阀题的能力与功效除了与网络结构有关,在很大程度上取决于网络所采用 的激活函数【1 3 】。 激活函数的基本作用是: ( 1 ) 控制输入对输出的激活作用; ( 2 ) 对输入、输出进行函数转换; ( 3 ) 将可能无限阂的输入变换成指定的有限范围内的输出。 一般地,称一个神经网络是线性或者非线性是由网络神经元中所具有地 激活函数的线性或非线性来决定的。 下面是几种常用的激活函数。 l 。阈值型( 硬限制型) 这种激活函数将任意输入转化为o 或1 的输出,将函数坟) 为单位阶跃函 数,如图3 2 所示。具有此函数的神经元的输入输出关系为: 彳= f ( w ep + b ,= 嚣 ( 匐 l 孽 l i l w e p + b _ o ( 3 - 4 ) w p + b 0 和任意厶函数f : 0 ,l 】”一尺,存在一个三层b p 网络,他 可以在任意占平方误差京都内逼近f 。 因此,我们在牵引力计算模型和制动力计算网络模型中,都采用单隐层。 二、隐层神经元选择 隐含层神经元数目的选择是一个十分复杂的问题,它与问题的要求、输 入输出单元的数目都有着直接关系。隐蔽层的节点数目设置多少为好,在理 论上尚无规律可遵循。从神经网络的原理来说,它的信息处理是在大量神经 元中并行而又有层次地进行的。另外作为神经网络训练后所记住的知识,就 是以权的形式保持在节点与节点之间的联系中。从这个角度上看,似乎节点 数越多越好。从网络的结构上看,隐蔽层节点数多意味着网络的联结权多, 从而使网络训练时涉及到的调节变量增加。从经验上讲,变量多的函数优化 要难于变量少的函数。 因此在实际应用中,往往需要根据设计者的经验和多次实验来确定,因 而不存在一个理想的解析式来表示。隐含层神经元的数目太多会导致学习时 间过长、误差不一定最佳,也会导致容错性差、泛化能力弱,因此一定存在 一个最佳的隐含层单元数。以下4 个公式可用于选择最佳隐含层单元数时的 参考公式: 西南交通大学硕士研究生学位论文第3 5 页 一 q 七 i = 0 ( 4 2 1 ) 式中,k 为样本数,啊为隐含层的单元数,z 为输入单元数。如果i , q = 0 。 ( 4 2 2 ) 式中,朋为输出神经元数,以为输入单元数,口为【l ,lo 之间的常数。 _ ,z l = l 0 9 2 刀 ( 4 2 3 ) 式中,刀为输入单元数【3 5 】 :043mn+o12m2+254n+077m+035+051( 4 2 4 ) 啊为隐含层的单元数,z 为输入单元数,m 为输出神经元数2 ”。 本文在确定隐含层神经数目时,综合考虑上述公式的计算值,并采用试 验比较的方法来确定。 在牵引力的计算网络中,隐层神经元数目不同取值时的平均绝对误差和 训练步数的比较见表4 2 。 表4 2 牵引力计算网络隐含层不同神经元数目时的比较 隐含层神经元数日平均绝对误差训练步数 l0 1 09 20 1 37 3o 1 64 40 0 85 5 0 2 l1 0 6 o 1 3l l 70 1 26 80 1 71 9 90 1 56 1 0 0 2 13 西南交通大学硕士研究生学位论文第3 6 页 由表可以看出,因为牵引力计算的网络结构比较简单,训练步数差别不 大,但是相比之下,隐层神经元为4 时,误差和训练步数都更理想,因此我 们选择隐层神经元数为4 。 在制动力计算网络中,隐层神经元数目不同取值时的平均绝对误差和训练 步数的比较见表4 3 。 表4 3 制动力力计算网络隐含层不同神经元数目时的比较 隐含层神经元数目平均绝对误差训练步数 4o 0 71 0 5 5 0 0 77 3 60 0 3 5 1 0 3 70 0 5 8 4 80 0 92 9 9o 0 81 0 l o0 0 93 5 1 10 1 22 6 1 2 0 1 36 , 1 4o 1 93 由于制动力计算网络输入量比较多,因此可以看出,训练步数相比牵引 力计算网络要多,由表中数据可以看出,神经元数为9 时,误差和训练步数 最为理想。因此隐层神经元数目确定为9 。 4 3 算法选择 最速下降法是基本的b p 算法,它采用的是增量式的处理模式,即每训练 一个样本就改变一下权值,如果数据量较大的话,他的收敛速度将非常慢, 而其易陷入局部极小值。因此,在实际应用中,为了克服常规b p 学习算法的 缺陷,卜1 a t l a b 神经网络工具箱对常规b p 算法进行了改进,并提供了一系 列快速学习算法,以满足解决不同问题的需要。快速b p 算法从改进途径上可 分为两大类:一类是采用启发式学习方法,如引动量因子的学习算法 ( t r a i n g d m 函数) 、变学习速率学习算法( t r a i n g d a 函数) 、“弹性”学习算法 ( t r a i n r p 函数) 等,1 另一类则是采用更有效的数值优化方法如共扼梯度学习算 法( 包括t r a i n c g f 、t r a j n c g p 、t r a i n c g b 、t r a i n s c g 等函数) 、q u a s i - n e w t o n 算法( 包括t r a i n b f g 、t r a i n o s s 等函数) 以及l e v e n b e r g m a r q u a r d t 优化方 西南交通大学硕士研究生学位论文第3 7 页 法( t r a i n l m 函数) 和贝叶斯归一化法( t r a i n b r ) 等。改进后的b p 网络的训练收 敛速度比标准梯度下降法快数十乃至数百倍。 表4 4 罗列了m a t l a b 神经网络工具箱内含的几种学习i j i l 练算法的比 较。 表4 - 4 神经网络训练参数及其含义 适用 占用 算法类型函数名收敛性存储 其他特点 类型 空间 l e v e n b e r g - m a r t r a i n l m 函数收敛快,收 大 性能随网络规模增大 q u a r d t 规则算法拟合敛误差小而变坏 弹性学习算法 t r a i n r p 模式性能随网络训练误差 分类 收敛很快较小 减小而变差 t r a i n c g f , 共扼梯度法 t r a i n c g p , 函数收敛快,性 中等 尤其适用于网络规模 t r a i n c g b , 拟合 能稳定较大的情况 t r a i n s c g q u a s i - n e w t o n t r a i n b f g , 函数 收敛快较大 计算量随网络规模呈 算法 t r a i n o s s 拟合 几何成长 梯度下降算法 t r a i n g d 模式收敛速度 分类 慢 较大 性能不稳定 自调整学习速率模式 的梯度下降法 t r a i n g d a 分类 收敛较快中等 有效避免局部最小值 引动量因子的学模式 收敛较快较小 可用于增量模式训练 习算法 t r a i n g d m 分类 自适应动量梯度模式 下降算法 t r a i n g d x 分类 收敛较快较小适应于提前停止法 我们的目标要从训练样本中训练网络,对测试样本的牵引力与制动力值 进行计算,因此属于函数拟合问题。要选择在函数拟合方面表现优秀的算法。 从表中可以看出,l e v e n b e r g m a r q u a r d t 算法( l m ) 是多层神经网络训练 算法训练,适合于函数拟合,采用批处理模式,且该算法能获得比其他任何 一种算法更小的均方误差。 l m 算法是一种利用标准的数值优化技术的快速算法,它是梯度下降法与 高斯一牛顿法的结合,也可以说成是高斯一牛顿法的改进形式,它既有高斯 一牛顿法的局部收敛性,又具有梯度下降法的全局特性。 由于l m 算法利用了近似的二阶导数信息,它比梯度法快得多。以下对 l m 算法作简单的介绍:在前向型神经网络中,设表示第k 次迭代的权值和 阈值所组成的向量,新的权值和阈值组成的向量x i “。 x “1 可根据下面的规则求得 i “。1 = 工+ 缸 ( 4 2 5 ) 西南交通大学硕士研究生学位论文第3 8 页 对于牛顿法则则有: a x = - i v 2 e ( x ) 】- l v 2 e ( x )( 4 - 2 6 ) 式中v e ( x ) 梯度 v 2 e ( x ) 误差指标函数e ( x ) 的h e s s i a n 矩阵。 设误差指标函数为: e i x ) :i 1 a , 芎( x ) ( 4 - 2 7 ) v e ( x ) = j 1 ) p )( 4 - 2 8 ) v 2 e ( x ) = j r ( 工) p ( x ) + s i x )( 4 2 9 ) 式中:q ( 工) 为误差,:( 掣) 为j a c 。b i a n 矩阵:s i x ) :ne j o ) v 2 e j o ) 。 班ji = 1 则: a x = - j 7 ( x ) j ( x ) + l d 一j ( x ) e ( x ) ( 4 30 ) 式中:比例系数 0 为常数;i 为单位矩阵 由于 j r 伍) ,( 工) + g i 一是正定的,解总是存在的。因此l m 算法也优于高 斯牛顿法。l m 算法的计算复杂度为o ( m 3 6 ) ,这里m 为网络权值的数 目,若m 很大,则计算量和存储量都非常大。然而,每次迭代的效率显著提 高,大大改善其整体性能,特别是在精度要求高时。 l m b p 算法的迭代过程: 1 计算相应的网络输出及误差指标函数e ( x ) 2 计算j a c o b i a n 矩阵j ( x ) 3 按照4 3 0 计算血 4 若e ( x ) 占,则停止,否则,按4 2 5 计算x “。并以x 似+ ”为权值和 西南交通大学硕士研究生学位论文第3 9 页 阈值,计算误差指标函数e ( x “1 ) ,若e ( x 川) e ( x 。) ,则权值和阈 值就更新为e ( x “1 ) ,= l i p 。回到式4 - 2 5 ;若e ( x “1 ) e ( x ) , 则令肛= ,回到式4 2 7 。 为了验证l m 算法在牵引力与制动力网络中算法的优越性,我们在 m a t l a b 6 5 下,对各种算法的i j i i 练做了比较,结果如表4 5 所示。 通过对各种训练方法的结果进行对比,综合考虑训练的速度和i :i f 练精度, 结果表明l m 算法在各种算法当中都是最优的。因此,本文确定采用l m 算 法。 表4 - 5 各种算法训练效果比较 训练方法误差训练步数 l e v e n b e r g - m a r q u a r d t b 算法 0 0 52 弹性学习算法0 1 25 0 f l e t e r - p o w e r 连接梯度b p 算法 o 1 02 5 p o l a k r i b i e r e 连接梯度b p 算法0 1 43 3 p o w e l l b s a l e 连接梯度b p 算法 0 1 1 2 9 量化连接梯度b p 训练算法 o 0 9 4 6 b f g s 准牛顿b p 算法0 1 l4 9 一步正切b p 算法 0 1 9 7 8 梯度下降b p 算法0 5 63 0 0 0 变学习速率学习算法0 1 92 0 6 引动量因子的学习算法0 7 23 0 0 0 b a y e s 规范化b p 算法 0 0 5 3 5 4 循环顺序渐增训练算法o 1 27 3 自适应动量梯度下降算法 0 2 02 1 0 4 4 样本数据处理 4 4 1 样本数据选择 本文中所采用的所有数据来源是从成都铁路局试验车采集到的数据。经 西南交通大学硕士研究生学位论文第4 0 页 过变换处理,在e x c e l 2 0 0 0 中,制成数据表,数据格式如图4 4 所示,一共有 两万余组数据。 bcdef6hi j e j 牵引力缓冲力速度副风缸制动缸列车管电压电流励磁电流网压牵 i 电制转换 2k nl c n 公里小日寸k p a k p ak p a 3 4 9 9 5 30 3 2 8 0 5 2 75 9 0 7 6 85 6 3 46 0 8 5 2 92 8 5 4 4 51 3 5 1 4 7 51 8 3 1 12 2 3 8 30 2 6 2 51 3 7 6 6 0 3 2 90 6 1 95 9 1 7 0 45 8 2 86 0 9 2 6 72 9 6 0 21 3 5 2 4 91 7 7 8 42 2 3 7 8 50 2 4 8 5 6 1 5 4 5 7 0 2 6 80 7 2 25 9 2 2 4 35 7 5 36 0 9 1 5 53 2 0 1 3 51 4 0 7 4 31 7 8 9 6 52 2 3 1 60 2 8 4 71 9 0 5 70 2 90 8 7 45 9 3 4 4 75 86 0 9 1 43 5 f 1 5 6 51 4 7 8 5 8 51 8 2 5 0 52 2 2 6 9 50 2 8 9 82 0 4 9 20 3 2 31 0 0 75 9 3 4 6 45 6 9 16 0 9 2 0 83 7 3 7 1 7 51 4 9 9 5 6 ( 51 8 2 6 2 52 2 2 5 9 50 2 4 4 91 9 3 6 30 3 5 71 1 5 85 9 3 9 8 45 7 8 56 0 9 q 1 64 0 2 5 11 5 0 6 8 51 7 6 1 9 52 2 3 0 50 2 8 8 5 1 02 0 9 2 20 3 1 81 3 0 45 9 4 3 4 25 7 2 36 0 9 2 9 44 2 8 6 2 51 5 0 6 6 7 2 51 7 7 5 32 2 3 0 40 2 8 8 1 12 0 4 0 50 3 1 21 4 6 35 9 4 6 0 25 9 3 26 0 9 1 1 9 4 4 0 6 3 5 1 5 0 5 1 7 1 7 9 9 0 52 2 2 8 40 3 3 2 1 22 0 3 2 10 2 5 91 6 2 25 9 5 6 3 85 6 2 46 0 9 4 4 14 7 2 3 9 2 51 5 0 6 2 81 7 7 9 7 52 2 2 8 2 50 2 7 3 1 31 9 3 3 10 3 0 61 7 8 55 9 5 3 5 15 6 6 16 0 9 4 0 54 9 0 0 2 2 51 5 0 4 2 3 5 1 8 2 1 9 52 2 2 5 7o 2 6 3 1 41 9 7 8 20 3 0 2 1 9 1 85 9 6 4 0 15 7 6 66 0 9 5 0 75 0 4 3 21 5 0 6 6 0 7 51 8 0 6 2 52 2 2 9 60 2 5 4 1 52 1 8 1 40 3 5 4 2 0 9 4 5 9 6 3 4 3 5 8 7 26 0 9 1 1 75 2 8 7 71 5 4 0 13 7 51 7 0 5 9 52 2 5 5 3 50 2 4 9 1 6 2 4 2 9 50 3 4 12 2 6 15 9 7 1 1 15 7 1 36 0 9 9 7 45 6 2 0 91 5 8 1 3 6 2 51 7 2 9 32 2 5 3 0 5o 2 4 6 5 1 72 5 1 80 2 9 42 4 5 85 9 7 3 5 55 66 1 0 1 6 46 0 2 9 11 6 4 3 2 6 2 51 7 5 6 8 52 2 4 9 0 50 2 6 7 1 82 8 9 0 30 3 1 52 6 55 9 7 3 9 85 7 5 26 1 0 3 5 26 3 9 7 0 2 51 6 7 5 4 0 51 7 7 0 8 52 2 4 9 70 2 6 0 5 1 92 8 5 1 50 3 2 82 8 3 25 9 7 8 0 25 6 1 36 1 0 4 3 76 6 8 7 1 7 51 6 1 5 0 11 7 4 9 8 52 2 4 8 7 50 2 5 4 2 02 7 6 5 10 3 0 7 3 0 2 5 5 9 7 6 8 2 5 6 4 86 1 0 2 5 57 0 1 5 5 2 51 6 7 2 3 41 7 1 5 32 2 4 5 70 2 7 8 5 2 13 0 4 6 70 3 4 93 2 55 9 1 1 1 0 6 5 7 3 36 1 0 1 3 67 3 9 3 9 2 51 7 1 1 6 9 2 51 7 8 7 1 52 2 4 1 7 50 2 6 3 2 23 3 9 0 80 3 3 7 3 4 6 55 9 8 0 6 25 7 9 36 1 0 6 2 47 8 2 3 31 7 8 4 5 7 7 51 8 1 5 3 52 2 4 2 5 s0 2 4 1 5 2 33 7 0 4 0 2 9 43 7 15 9 8 5 55 5 5 16 1 0 6 1 68 4 8 9 8 7 51 8 4 2 8 21 7 6 7 32 2 4 0 20 2 7 5 2 43 9 1 4 40 2 6 2 3 9 6 3 5 9 8 8 7 5 6 1 76 1 0 5 8 29 0 5 8 2 51 8 7 8 3 41 7 6 8 f t 52 2 3 8 9 50 2 9 9 2 54 0 4 5 40 2 6 94 2 1 25 9 9 0 2 35 5 9 86 1 0 3 6 79 6 5 6 1 51 9 0 2 8 4 7 51 7 3 22 2 3 8 4 50 2 4 8 5 2 64 7 8 50 3 4 94 5 3 35 9 8 8 7 35 5 7 76 1 0 3 2 21 0 6 1 8 0 7 52 0 0 4 2 3 7 51 7 2 4 62 2 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2030年自行车头盔行业发展分析及投资价值研究咨询报告
- 2024-2030年腹肌轮行业市场现状供需分析及投资评估规划分析研究报告
- 2024-2030年能源产业政府战略管理与区域发展战略研究咨询报告
- 2024-2030年肾上腺素B型受体4行业市场现状供需分析及投资评估规划分析研究报告
- 2024-2030年职业装产业规划研究报告
- 2024-2030年粉底液行业市场深度分析及竞争格局与投资价值研究报告
- 2024-2030年第三方支付行业发展分析及投资战略研究报告
- 临沂影视科技行业劳动合同模板
- 临时工福利待遇合同样本
- 企业环境保护策划合同样本
- 四年级上册美术课件-第10课 我的留言夹 丨赣美版 (14张PPT)
- 备用金使用表
- 圆二色谱原理
- 《油气田开发方案设计》-1-5
- 连续性肾脏替代治疗(CRRT)质量控制标准
- Aspen工业优化控制软件龙头启示
- 细胞膜的结构课件
- 第七章脆弱性及风险评模型估(版本)详解
- 专利技术交底书的撰写PPT课件
- Q∕GDW 46 10045-2020 抽水蓄能电站斜井导井定向钻机及反井钻机施工技术导则
- 统一登陆认证平台软件设计方案(纯方案114页)
评论
0/150
提交评论