




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基础研究、应用研究、试验发展区别(完整版)资料(可以直接使用,可编辑优秀版资料,欢迎下载)
基础研究、应用研究、试验发展区别(完整版)资料(可以直接使用,可编辑优秀版资料,欢迎下载)基础研究、应用研究与试验发展之间的区别基础研究与应用研究的主要区别是:基础研究是为了认识现象,获取关于现象和事实的基本原理的知识,以便解读它们;应用研究在获得知识的过程中具有特定的应用目的,主要是为在实践中有目的地利用自然界的规律开辟各种可能的途径,为解决实际问题提供科学依据。基础研究在进行研究时对其成果的实际应用前景并不很清楚,或者虽然确知其应用前景但并不知道达到应用目标的具体方法和技术途径。应用研究虽然也是为了获得科学技术知识,但是,这种新知识是在开辟新的应用途径的基础上获得的,是对现有知识的扩展,为解决实际问题提供科学依据,对应用具有直接影响。基础研究获取的知识必须经过应用研究才能发展为实际运用的形式。例如,对金属和非金属结构与性质的研究,其直接目的是探索金属和非金属结合的基本规律以及结构与性质的关系,属于基础研究。在不同的温度压力条件下,研究各种金属和非金属复合的可能性,以及所形成的复合物的物理化学性质,以便为获得高性能的金属、非金属复合材料提供科学依据和实验数据,是应用研究。这二项研究,前者目的是认识现象、解释物质运动规律;而后者是为获得金属和非金属高性能复合材料寻找方法和途径。基础研究、应用研究与试验发展的主要区别是:基础研究和应用研究主要是扩大科学技术知识,而试验发展则是开辟新的应用即为获得新材料、新产品、新工艺、新系统、新服务以及对上述各项作实质性的改进。虽然应用研究和试验发展所追求的最终目标是一样的,但它们的直接目的或目标却有着本质的差别。应用研究是为达到实际应用提供应用原理、技术途径和方法、原理性样机或方案,这是创造知识的过程;试验发展并不增加科学技术知识,而是利用或综合已有知识创造新的应用,与生产活动直接有关,所提供的材料、产品装置是可以复制的原型,而不是原理性样机或方案,提供的工艺、系统和服务是可以在实际中采用。下表是自然科学领域中基础研究、应用研究、试验发展三类活动的例子。表1自然科学领域基础研究、应用研究和试验发展三类活动的案例基础研究应用研究试验性发展1.微分方程数值解研究用于说明波动(如说明无线电波传送的强度和速度)的微分方程数值解研究为说明波动的微分方程数值解设计计算机程序2.气流中的压力条件和固体颗粒的浮力的研究流动气体中的压力条件和固体颗粒的浮力研究,以取得制造火箭和飞机所需要的气体动力学数据研制飞机样机的机身(外壳)3.地热场和地热过程的地质背景研究,以获得地热起源的基本知识地热源研究,以了解利用天然蒸气和热水资源的可能性发展利用地热蒸气或热水的工艺,以生产电力,用于取暧或作为提取矿物质的来源4.微生物抗辐射性的生物化学和生物物理的机理研究关于热和辐射的联合过程对酵母生存的影响的微生物学研究,以获得制定一种储存水果汁所需要的方法的资料发展利用伽玛射线储存水果汁的工艺5.关于利用乳糖酶消化分解乳糖的过程的研究研究成人不能耐受乳糖的普遍现象,为发展一种确定这种不耐受性的试验方法取得所需要的资料为确定乳糖的不耐受性(在乳糖吸收之后测量血糖)而发展一种试验方法6.关于活的有机体区分自身的细胞和外来细胞(基因、抗基因和生物个体标志)的机理研究对导致排斥异体组织的免疫学机理进行研究,以便找到一种在组织移植时抑制这种机理的方法发展一种用药物抑制这种排斥机理的技术,从而使移植(指皮、肉等组织)得以存活,或使器官移植成为可能7.关于心理因素对疾病影响的研究研究引发胃溃疡心理因素(过度紧张等),以便取得发展有效的治疗方法所需要的资料发展一种治疗由心理因素引起的胃溃疡的新方法8.关于从马铃薯组织培养中获得的同功酶的等电位类型的研究关于在各种营养基中马铃薯组织培养成长的研究发展一种通过组织培养生产无病毒马铃薯的技术9.关于植物的蛋白生物合成与光合率的关系的研究研究谷物的抗病力的遗传特性,以便获得关于培植更能抗病的谷物新品种的知识培植更能抗病的谷物新品种10.关于树种之间的杂交的内在障碍的研究研究利用溶剂和蒙导花粉消除内在障碍,使杨树之间实现异种杂交的可能性发展一种消除不同杨树树种进行杂交的内在障碍的技术,以产生更具特点的、用于种植的无性系植物11.空气中的污染物的化学变化的研究为确定和测量空气中的二氧化硫进行分析方法的研究发展物理化学技术,减少燃烧过程中(如供热工厂)二氧化硫的发散12.应用有关数学、力学的理论和方法,研究蜗杆传动中啮合点的行为规律和运动轨迹根据啮合点运动轨迹理论和机械工程学的原理,推演多头蜗杆传动的数学关系式借助计算机仿真,掌握合理传动的实用参数,研制蜗杆传动创新样品13.相变与扩散理论研究钢在热处理过程中组织与结构变化及性能的研究确定得到良好综合性能的热处理工艺14.金属和非金属结构与性质的研究高温金属陶瓷复合材料结构与性能的研究,以探寻高温金属一陶瓷制备与成型的技术途径研制在600-800℃15.研究金属的形变规律和“超塑性”现象通过不同组织结构的材料与形变条件的研究,确定具有超塑性的材料及条件利用具有超塑性能的材料制造形状复杂的合金,解决成型问题16.高磁能和磁体微观结构及性质的研究根据高磁能各磁体的原理和规律,探讨用快淬、热压制作磁体的最优化的机理和规律,从而提出产生ND—FE—B磁体原理模型根据已有的原理性模型,探求制作高磁能积ND—FE—B磁体的快淬、热压工艺17.食管致癌机理研究真菌霉素、亚硝胺对人胃、食管等上皮的致癌作用机理研究食管上皮重度增生的阻断性治疗方法18.研究水稻远缘杂交和异源植物基因导入引起水稻变异的机理研究水稻育种新技术、新方法及其遗传变异规律培育水稻高产、优质、多抗新品种、新组合19.汽液平衡热力学研究方程式的建立某些化工产品的分离过程中各组汽液平衡关系的确立确定该化工产品的分离流程及分离条件20.研究长江流域梅雨的细致结构和一些重要的物理因子间的关系研究找出梅雨暴雨预报的一些指标和预报依据将梅雨暴雨的预报指标和依据提供给气象台预报,并将所得结果在实际预报工作中试用检验。注:摘自《科技统计实用手册》(科学技术部发展计划司、中国科学技术指标研究会编,科学技术文献出版社2021年)。倒立摆系统的研究现状及发展1绪论1.1课题的来源与意义自动控制自从其产生以来,广泛地应用在工业、农业、交通运输和国防各个方面,凡是控制性能要求较高的场合,都离不开自动控制。倒立摆系统作为研究控制理论的一种典型的实验装置,具有成本低廉,结构简单,物理参数和结构易于调整的优点。然而倒立摆系统本身所具有的高阶次、不稳定、多变量、非线性和强耦合特性,是一个绝对不稳定系统,必须采用十分有效地控制策略才能使之稳定。倒立摆系统是研究变结构控制,非线性控制,目标定位控制,智能控制等控制方法理想的试验平台[1]。研究倒立摆系统除了较强的理论意义,同时还具有广泛的实践意义。控制理论中许多抽象的概念如稳定性,能控性,快速性和鲁棒性,都可以通过倒立摆系统直观的表现出来,同时其动态过程与人类的行走姿态类似,其平衡与火箭的发射姿态调整类似,因此倒立摆在研究双足机器人直立行走、火箭发射过程的姿态调整和直升机飞行控制领域中有重要的现实意义,相关的科研成果已经应用到航天科技和机器人学等诸多领域。1.2国内外研究现状对倒立摆的控制研究主要是稳定问题和起摆问题的研究,目前对稳定问题的关注比较多。倒立摆稳定问题的研究倒立摆稳定的研究就是设计控制器使倒立摆系统在稳定点保持稳定,并且在一定限度内的干扰下可以回复到稳定状态。倒立摆系统的最初研究开始于二十世纪50年代,麻省理工学院(MIT)的控制论专家根据火箭发射助推器原理设计出一级倒立摆实验设备。控制目的一般是使摆杆在垂直位置倒立。而后世界各国都将一级倒立摆控制作为验证某种控制理论或方法的典型方案。后来人们参照双足机器人控制问题研制二级倒立摆控制设备。最常见的典型倒立摆有三种:它们是直线型倒立摆,平面型倒立摆,环型倒立摆等,它们是目前国内外广泛采用的模型,这也是研究各种控制算法的基础,分别简述如下:(l)直线型倒立摆它是最常见倒立摆系统,也称车摆装置,根据目前的研究它又分为1、2、3、4级车摆,典型结构图如图1一1所示,图中以一级车摆为例,它是由可以沿直线导轨运动的小车以及一端固定于小车之上的匀质长杆组成的系统,小车可以通过转动装置由力矩电机、步进电机、直流电机或者交流伺服电机驱动,车的导轨一般有固定的行程,因而小车的运动范围都是受到限制的。(2)环型倒立摆环型倒立摆也称摆杆式倒立摆,如图1一1所示,图中以二级为例,一般是由水平放置的摆杆和连在其端接的自由倒摆组成,原理上也可以看成是车摆的轨道为圆轨情况,摆杆是通过传动电机带动旋转的。此摆设计好了可以摆脱普通车摆的行程限制,但是同时带来了一个新的非线性因素:离心力作用。(3)旋转式倒立摆环型摆也叫旋转式倒立摆,但是这里的旋转式倒立摆不同于第二种的环型摆,它的摆杆(旋臂)是在竖直平面内旋转的,而环型摆摆杆是在水平面旋转的。(4)复合倒立摆系列复合倒立摆为一类新型倒立摆,由运动本体和摆杆组件组成,其运动本体可以很方便的调整成三种模式,一是(2)中所述的环形倒立摆,还可以把本体翻转90度,连杆竖直向下和竖直向上组成托摆和顶摆两种形式的倒立摆。图1-1各种倒立摆系统国外对倒立摆系统的研究可以追朔到六十年代,1966年,Scheafer和Cannon应用Bang-Bang控制理论首先将一个曲轴稳定于倒置位置上。在60年代后期,作为一个典型的不稳定、严重的非线性证例提出了倒立摆的概念,并将其用于对一类不稳定、非线性和快速性系统控制能力的检验。由于倒立摆系统的典型性,对它的控制引起了各国科学家的普遍重视,从而使得用多种方法对倒立摆的控制成为具有挑战性的世界性课题。当时主要集中在直线倒立摆系统的线性控制上面。到70年代初,各国学者用状态回馈理论对不同类型的倒立摆控制问题进行了广泛的研究,1976年Morietc[2]发表的研究论文,首先把倒立摆系统在平衡点附近线性化,利用状态空间方法设计比例微分控制器,实现了一级倒立摆的稳定控制。1980年,Furutaetc[3]等人基于线性化方法,实现了二级倒立摆的控制。1984年,Furuta等人首次实现双电机三级倒立摆实物控制[4]。1984年,Wattes研究了LQR(LinearQuadraticRegulator)法控制倒立摆[5]。LQR方法主要基于系统的线性模型和二次性能指针:(1.1)实际上是寻找一个最优的状态回馈向量K,从而设计一个最优回馈控制器。Wattes验证了改变权重矩阵可以得到不同的状态回馈向量,从而产生不同的控制效果。八十年代后期开始,倒立摆系统中的非线性特性得到较多的研究,并且提出了一系列基于非线性分析的控制策略。1992年,Furuta等人[6]提出了倒立摆系统的变结构控制。1995年,Fradkov等人[7]提出的基于无源性的控制。另外Wiklund等人[8]应用基于李亚普诺夫的方法控制了环形一级倒立摆,Yamakita等人[9]给出了环形二级倒立摆的实验结果。近年来随着智慧控制方法的研究逐渐受到人们的重视,模糊控制、神经网络、拟人智能控制、遗传算法和专家系统等越来越多的智能算法应用到倒立摆系统的控制上。1997年,等[10]设计了类PI模糊控制器应用于一级倒立摆控制,具有系统结构简单对硬件依赖小的特点。1995年,Li[11]利用两个并行的模糊滑模来分别控制小车和摆杆偏角。1996年张乃尧等[12]采用模糊双死循环控制方案成功地稳定住了一级倒立摆。Deris[13]利用神经网络的自学习能力来整定PID控制器参数。1997年,Gordillo[14]比较了LQR方法和基于遗传算法的控制方法,结论是传统控制方法比遗传算法控制效果更好。1993年,Bouslama[15]利用一个简单的神经网络来学习模糊控制器的输入输出数据,设计了新型控制器。1994年,北京航空航天大学张明廉教授[16]将人工智能与自动控制理论相结合,提出“拟人智慧控制理论”,实现了用单电机控制三级倒立摆实物。北京师范大学李洪兴[17]教授采用变论域自我调整模糊控制理论研究四级倒立摆控制问题,成功实现了四级倒立摆实物系统控制[18]。对倒立摆这样的一个典型被控对象进行研究,无论在理论上和方法上都具有重要意义。不仅由于其级数增加而产生的控制难度是对人类控制能力的有力挑战,更重要的是实现其控制稳定的过程中不断发现新的控制方法、探索新的控制理论,并进而将新的控制方法应用到更广泛的受控对象中。各种控制理论和方法都可以在这里得以充分实践,并且可以促成相互间的有机结合。随着控制理论的不断向前发展,越来越多的理论被成功运用于倒立摆系统的控制:如基于状态空间极点配置、二次型最优控制[19~21]、基于能量的控制[22]、基于滑模控制的方法[23]、基于模糊逻辑的控制[36~46]、基于神经网络理论[24~25]、模糊逻辑与神经网络相结合的控制[26]、基于遗传算法的控制[27]以及基于遗传算法的神经网络控制[28]等等。常见的控制策略与算法有以下几种:状态回馈H∞控制方法智慧控制理论的方法鲁棒控制方法起摆问题的研究倒立摆起摆问题是指设计控制器,能够将摆杆从竖直向下的自然状态摆动到竖直向上的位置。对于倒立摆起摆问题的研究主要方法有能量控制、启发式控制、拟人智慧控制等。较早研究起摆问题的文献有:1976年,Mori[2]等人提出包含两个控制器,一个控制器用来自起摆,另一个控制器用来使摆杆稳定在平衡态附近。1996年,研究了用能量控制策略,实现了一级倒立摆的起摆。朱江滨等人提出了一种基于专家系统及变步长预测控制的实时非线性控制方法,仿真实现了二级倒立摆的摆起及稳定控制[33]。李祖枢等人利用拟人智慧控制理论研究了二级倒立摆的起摆和控制问题[34]。目前用于倒立摆起摆的控制方法主要有:能量控制,启发式控制,拟人智慧控制等。社会化的大生产使工业生产规模越来越大,生产装置越来越复杂,工业对象成为高阶次、非线性、多输入多输出的复杂对象,而且控制精度要求越来越高。这就对控制理论提出了新的更高的要求。倒立摆系统是一个典型的多输入多输出、非线性、高阶次的不稳定系统。研究倒立摆的精确控制对复杂工业对象的控制有着不可估量的工程应用价值。倒立摆控制存在的主要问题倒立摆系统是一个非线形、不稳定、单输入多输出的多变量系统,对它进行稳定控制,其控制方法大致可分为两类:(1)现代控制理论方法:在非线形模型的平衡点附近对其进行线性化,再根据近似线性模型,设计出控制规律。常见的有状态回馈的极点配置法,二次型性能指针的最优控制和基于非线性观测器的控制方法等。(2)智慧控制方法:其主要特点是不依赖于系统数学模型,通过模拟人的智慧或利用专家的经验较为直接地对倒立摆进行控制。有模糊控制、神经网络控制、规则控制和模糊神经网络控制等。应用现代控制理论方法设计出的倒立摆的控制规律存在以下几个问题:(1)由于系统本身是一个非线性系统,经过线性化后,所得到的模型与原模型只能在很小的范围内接近,从而限制了系统的稳定范围;(2)对于二级倒立摆系统来说,线性化后得到一个六阶的状态方程,如果采用状态回馈的方法,则必须测量出系统的六个状态变量,由于其中三个速度变量测量起来很困难,这样就必须设计状态观测器,而状态观测器的引入对系统的稳定性和鲁棒性都有一定的不良影响;(3)倒立摆系统是一个灵敏度很高、变化很快的系统,要求控制器有很决的响应速度。据计算倒立摆系统的采样周期应在5ms左右,因此,不能进行在线控制规律的适应性调整,也就是说,只能预先根据系统模型求出一个不变的控制规律固定在控制器中,这样就对系统的模型精度要求很高。而模型参数中的一些非线性因素是容易变化的,例如转动摩擦系数,水平摩擦系数及皮带的滞后,使基于模型的控制规律难以严格符合系统实际模型,这会导致系统的鲁棒性和稳定性较差。智慧控制可以部分地解决上述问题。首先智能控制不依赖系统数学模型,所以就不存在因简化模型所带来的稳定范围减小的问题。其次智慧控制规律的建立并不以预先确定的系统模型为基础的,而是基于专家的经验或人们的常识,只要该经验或常识基本反映系统的特性,那么被控对象的参数变化对控制系统的收敛问题的影响就很小。最后,智能控制规律的修改要方便得多,要修改基于数学模型的控制规律,整个算法结构都得变动,而修改智能控制中的规则只需修改某一或某几个规则,便可达到修改的目的。因此,智能控制系统维护起来较为简单易行,其稳定性和鲁棒性较好。另外,倒立摆在实现方面还需要解决许多具体控制问题,如传感器的线性度执行电机的死区、外围电路的零点漂移、信号采集的速度和精度等问题,这些问题的解决是成功地稳定倒立摆的关键。2倒立摆系统数学模型系统建模可以分为两种:机理建模和实验建模。实验建模就是通过在研究对象上加上一系列的研究者事先确定的输入信号,激励研究对象并通过传感器检测其可观测的输出,应用数学手段建立起系统的输入-输出关系。这里面包括输入信号的设计选取,输出信号的精确检测,数学算法的研究等等内容。机理建模就是在了解研究对象的运动规律基础上,通过物理、化学的知识和数学手段建立起系统内部的输入-状态关系。对于倒立摆系统,由于其本身是自不稳定的系统,实验建模存在一定的困难。但是忽略掉一些次要的因素后,倒立摆系统就是一个典型的运动的刚体系统,可以在惯性坐标系内应用经典力学理论建立系统的动力学方程。下面我们采用其中的牛顿-欧拉方法和拉格朗日方法分别建立直线型一级倒立摆系统的数学模型。采用拉格朗日法建立二级倒立摆系统的数学模型。2.1直线一级倒立摆的数学模型运动方程的推导.1牛顿力学方法在忽略了空气阻力和各种摩擦之后,可将直线一级倒立摆系统抽象成小车和匀质杆组成的系统,如图2-1所示。图2.1直线一级倒立摆模型为了建立倒立摆系统的数学模型,做以下假设:M小车品质m摆杆品质b小车摩擦系数l摆杆转动轴心到杆质心的长度I摆杆惯量F加在小车上的力x小车位置图2-2和2-3是系统中小车和摆杆的受力分析图。其中,N和P为小车与摆杆相互作用力的水平和垂直方向的分量。在实际倒立摆系统中检测和执行装置的正负方向已经完全确定,因而向量方向定义如图2-2所示,图示方向为向量正方向。分析小车水平方向所受的合力,可以得到以下方程:(2.1)由摆杆水平方向的受力进行分析可以得到下面等式:(2.2)把这个等式代入式(2.1)中,就得到系统的第一个运动方程(2.3)即(2.4)为了推出系统的第二个运动方程,对摆杆垂直方向上的合力进行分析,得到下面方程(2.5)即(2.6)力矩平衡方程如下(2.7)合并方程(2.6)和(2.7),约去P和N,得到第二个运动方程(2.8)线性化后两个运动方程如下(2.9)对(2.9)进行拉普拉斯变换,得到(2.10)假设初始条件为0。由于输出为角度,求解方程组的第一个方程,可以得到(2.11)(2.12)如果令,则有(2.13)把上式(2.13)代入方程组(2.10)的第二个方程,得到(2.14)整理后得到传递函数(2.15)设系统状态空间方程为(2.16)方程组(2.16)对求解,得到解如下(2.17)整理后得到系统状态空间方程(2.18)(2.19)对于质量分布均匀的摆杆有(2.20)由式(2.9)的第一个方程可以得到(2.21)设,则有(2.22)(2.23).2拉格朗日方法下面采用拉格朗日方程对单级倒立摆系统建模。拉格朗日方程为(2.24)其中L为拉格朗日操作数,q为系统的广义坐标,T为系统的动能,V为系统的势能(2.25)其中,为系统在第个广义坐标上的外力,在一级倒立摆系统中,系统的广义坐标有二个广义坐标,分别为。首先计算系统的动能(2.26)其中分别为小车和摆杆1的动能小车的动能(2.27)摆杆的动能(2.28)其中分别为摆杆的平动动能和转动动能。设以下变数:------摆杆质心横坐标------摆杆质心纵坐标则有(2.29)摆杆的平动动能和转动动能分别为(2.30)于是有摆杆的总动能(2.31)系统的势能为(2.32)由于系统在φ广义坐标下没有外力,所以有(2.33)对直线一级倒立摆,系统的状态变量为:QUOTE求解状态方程:QUOTE(2.34)则有(2.35)可以看出,利用拉格朗日方法和牛顿力学方法得到的状态方程是相同的,不同之处在于,输入u′为小车的加速度x′,而输入u为外界给小车施加的力,对于不同的输入,系统的状态方程不一样,对比较简单的直线一级倒立摆,利用牛顿力学的方法计算比较方便和快捷,但对于多级倒立摆,利用拉格朗日方法程序设计计算会比较方便。二级倒立摆系统数学模型二级倒立摆系统结构二级倒立摆系统如图所示。二级倒立摆装置由沿导轨运动的小车和通过转轴固定在小车上的摆体组成。在轨道一端装有用来测量小车位移的光电编码器。摆体与小车之间、摆体与摆体之间由转轴连接,并在连接处有2个光电编码器分别用来测量一级摆和二级摆的角度。一摆、二摆可以绕各自的转轴在水平导轨所在的铅垂面内自由转动而小车则由交流伺服电机、皮带轮、传动带带动在水平导轨上左右运动,从而使倒立摆稳定在竖直位置并且可以沿着导轨倒立行走。二级倒立摆系统的微分方程本文采用分析力学中的Lagrange方程建立二级倒立摆系统的微分方程。首先,对系统作如下假设:1)小车、一级摆杆和二级摆杆都是刚体。2)皮带轮与皮带间无相对滑动,皮带不能拉伸变长。3)小车与导轨之间的摩擦力与小车速度成正比。4)各级摆杆与转轴间的转动摩擦力矩与摆杆的角速度成正比。数学模型推导:系统总动能:小车的动能:一级摆动能:二级摆动能:=b)系统总势能:V=V0+V1+V2 小车势能:,一级摆势能:二级摆势能:;C)系统总耗散能:,小车耗散能:,一级摆耗散能:二级摆耗散能:;由Lagrange函数和Lagrange函数设时:(2.36)时:(2.37):(2.38)将L=T一v和D代入式(2一36)、式(2一37)、式(2一38),并进行化简的到:(2.40)(2.41)令根据上面3个微分方程式(mohu)……………….3神经网络控制3.1神经网络发展现状人工神经网络(ArtificialNeuralNctwork,ANN)是80年代之后迅速发展起来的一门新兴学科。它是模仿生物神经系统的信息传递和反射功能来获得处理事物的一种“智能”信息处理系统。人工神经网络从理论探索到进入大规模工程实用阶段,到现在也只有短短10多年的时间。美国神经网络学家HechtNielsen曾为人工神经网络给出以下定义:人工神经网络是由多个非常简单的处理单元彼此按某种方式连接而成的计算机系统,该系统是靠其状态对外部输入信息的动态响应来处理信息的。可见人工神经网络的信息处理功能是依靠计算机的强大处理能力来实现的,但它又不同于一般的计算机系统。它没有预先确定的、串行的运算操作,也没有确定的内存。它由许多互连的简单处理单元组成,学习达到平衡后,由各个神经元的权值组成的整个网络的分布状态,就是所求的结果。网络学习的过程也就是各神经元权值的调整过程[]。1958年美国计算机学家罗森布拉特(FrallkRosenblatt)提出了一种具有三层网络特性的神经网络结构,称为“感知机”(PercePtion),这或许是世界上第一个真正优秀的人工神经网络。在此以后的一段时间内,神经网络引进了许多人的兴趣,同时也引起了很大的争议。1969年,美国著名人工智能学者Minsky和PaPert写了一本评论人工神经网络的书《感知机》(PercePtion)。称感知机不能解决“阂值”这一问题,这本书引起了人们对60年代后期神经网络发展面临过热现象的争议。此书的发表为刚燃起的人工神经网络之火,泼了一大盆冷水。加以那时人工智能以功能模拟为目标的另一分支出现了转机,产生了以知识信息处理为基础的知识工程,给人工智能从实验室走向实用带来了希望。这使神经网络的研究进入低潮时期。70年代后期,在人的智慧行为机器再现上,由于传统模型距离人类自身的真实模型较远,表现出了极大的局限性。对于那些还找不到有效计算方法和明确的计算方法的问题,如:在人工智能、模糊识别、动力学过程模拟等方面,就碰到了有限时间和空间的障碍,对于人脑所具有的直觉感知、创造性思维、联想功能等,这些迫使人工智能和计算机科学家必须另外寻找发展智能计算机的途径,并把注意力重新转向人脑的信息处理模式。难能可贵的是,在此期间,仍由不少学者在极端艰苦的条件下致力于人工神经网络研究。1982年,Hopfield将人工神经网络成功地应用在组合优化问题,提出了HNN模型从而有力地推动了神经网络的研究。他引入了“计算能量函数”的概念,给出了网络定性判据。它的电子电路实现为神经计算机的研究奠定了基础,同时开拓了神经网络于联想—记忆和优化计算的新途径。1985年,Rumelhart提出了误差反向传播算法,即BP算法,把学习的结果回馈到中间层的隐含单元,改变它们的权系数矩阵,从而到预期的学习目的,它是至今为止最普遍的网络。这一算法的出现,使神经网络获得一个比较实用和有效的训练方法。由于它具有节后化、全息性、鲁棒性、并行性、非线性等突出的特点,在许多领域如工况监测和控制、故障诊断、结构分析、高智商机械设计、多传感器信息集成和融合、系统识别与智能控制、制造过程中作业计划的优化等面得到了成功的应用[9][10]。它的应用和发展不但会推动神经动力学本身,而且将影响一代计算机的设计原理,有可能为新一代计算机和人工智能开辟一条崭新的途径。同时它为学习识别和计算提供了新的途径,有可能给信息科学带来革命性的变化。目前已经建立了多种神经元与网络的模型,尤其在自动控制领域神经网络技术得到了巨大发展。神经网络对控制领域有着巨大吸引力,是由它本身的一些重要特点和性质决定的:1.人工神经网络是从输入到输出的高度非线性映像,任意的连续非线性函数映像关系都可由某一多层神经网络以任意精度加以逼近,便于解决非线性控制问题。2.具有分布式存储信息的特点,即一个信息不是存在一个地方,而是分布在不同的位置,当局部网络受损时,能恢复原的信息。3.对信息的处理及推理过程具有并行的特点。大规模互联网络结构能很快实现全局性的实时信息处理,并很好地协调多种输入信息之间的关系,同时人工神经网络模型具有自动搜索能量函数极值点的功能,这种优化计算能力在自我调整控制设计中十分有用。4.神经网络具有自组织、自学习、自适应等特点。对信息处理过程中具有很强的泛化能力。同时它还具有较强的容错特性,提高了信息处理的可靠性和鲁棒性。5.神经网络的结构是相同神经元的大规模组合,可处理多输入信号并具有许多输出,适合用于多变量系统;适合用大规模集成电路实现;也适合于用计算技术进行模拟实现。3.2神经网络原理和模型1神经网络基本结构单元神经网络的基本单元是神经元,它类似于生物体的神经系统基本单元,神经元是一个多输入单输出结构,其功能为模拟生理神经元的最基本特征。其结构示意图如图2一1所示。图中,QUOTE为神经元输入信号,QUOTE为平移信号,QUOTE为神经元闭值,QUOTE为QUOTE到QUOTE连接的权值。对图示神经元,其输入可表示为:QUOTE+QUOTE-QUOTE输出为:QUOTE=f(QUOTE)其中,f是神经元转换函数,又称为神经元启动函数。神经网络是由大量神经元的关联而构成,它是一个非线性动力学系统,其特点在于对信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其强大。神经网络的基本结构可以描述为具有下列性质的有向图:(l)每个节点有一个状态向量QUOTE,;(2)节点i到节点j有一个连接权系数QUOTE;(3)每个节点有一个阂值QUOTE;(4)每个节点定义一个变换函数fQUOTE最基本形式为f(QUOTE)神经网络模型各种各样,它们是从不同的角度对生物神经系统不同层次的描述和模拟。代表性的网络模型有感知器、多层前馈B一P网络、RBF网络、双向联想记忆(BAM)、Hopfield网络等.3.3神经网络在控制系统中的应用神经网络在非线性系统控制中有着广泛的应用,迄今为止己经有了十几种控制案,但总体上仍可归结为以下几类:(l)在基于模型的各种控制结构中充当对象的模型;(2)充当控制器;(3)在控制系统中起优化计算的作用;(4)与其它智能控制方法,如专家系统、模糊控制相融合,为其提供非参数化对模型、推理模型等。下面给出几种典型的神经网络控制(1)神经网络直接逆控制直接逆控制是使系统的一个逆模型与受控系统串联,直接作为系统的前馈控制器使受控系统的输出等于期望输出。该方案很大程度上依赖于逆模型的精确程度。逆系的输入必须与训练时的输出足够接近,系统方能正常工作,因此无法有目的地选择训信号。(2)神经网络自适应控制神经网络具有逼近任意连续有界非线性函数的能力,将神经网络与常规的自适应制方案相结合,产生了神经网络自适应控制的两种类型,即神经网络自校正控制系(NeuralNetworkSelf-TuningControl,简称NNSTc)和神经网络模型参考自适应控制(3)神经网络PID控制利用神经网络所具有的自适应能力和非线性映像功能,通过实际系统性能的学来实现具有最佳组合的PID控制。(4)神经网络内模控制在内模控制结构中,系统的正向模型与实际系统并联,两者输出之差被用做回馈号,此回馈信号又由前馈信道的滤波器及控制器进行处理。由内模控制性质知,该控器直接与系统的逆有关。引入滤波器是为了获得期望的鲁棒性和跟踪响应。(5)神经网络预测控制预测控制的特征是预测模型、滚动优化和回馈校正。其中神经网络预测控制器建了非线性被控对象的预测模型,可在线学习修正。利用此预测模型就可以由目前的控太原理土大学硕士研究生学位论文输入,预测出被控系统在将来一段时间范围的输出值。(6)神经网络解耦控制神经网络解祸通常基于逆系统控制的思想,一般采用三层前向静态网络;除直接逆控制解祸方法,还有基于自我调整解祸思想的神经网络解棍方法和PID神经网络解祸方法。神经网络解祸控制的难点是难以确定通用的解藕条件判据,目前的解祸策略都带有尝试性,主要依靠模拟试验来进行研究。(7)神经网络专家系统控制这是一种将神经网络与专家系统相结合的控制方式。由于专家系统善于表达知识和逻辑推理,神经网络善于非线性映像和直觉推理,将二者相结合发挥各自的优势,就会获得更好的控制效果。(8)神经网络模糊控制神经网络和模糊逻辑相结合的方式有:1.用神经网络驱动模糊推理的模糊控制;2用神经网络记忆模糊规则的控制;3.用神经网络优化模糊控制器的参数。(9)神经网络与遗传算法的结合遗传算法与神经网络的结合主要体现在三方面:1.网络连接权值的进化;2,网络结构的进化;3.学习算法的进化。基于进化计算的神经网络设计和实现己在众多领域得到应用,但总体上看,理论方法有待于完善规范,应用研究有待于加强提高。3.4神经网络控制的不足在智能控制领域中,BP网络是一类有力的学习系统,其结构简单,易于程序设计,因此在控制领域中得到广泛的应用。但实际应用中还存在一些问题。1,需要较长的训练时间对于一些复杂的问题,BP算法可能要进行几小时甚至更长的时间训练。这主要是由于学习速率所造成的,针对这一问题可采用变化的学习速率或自适应的学习速率来加以改造。2、未成熟饱和在网络的训练过程中,当其权值调得过大,可能使得所有的或大部分神经元的权总和值n偏大,这使得启动函数的输入工作在S型转移函数的饱和区,从而导致其导数f(n)非常小,从而使得对网络权值的调节过程几乎停顿下来。通常为了避免这种现象的发生,一是选取较小的初始权值,二是采用较小的学习速率,但这又增加了训练时间。3、局部极小值BP算法可以使网络权值收敛到一个解,但它并不能保证所示为误差超平面的全局最小解,很可能是一个局部极小解。这是因为BP算法采用的是下降法,训练是从某一起始点沿误差函数的斜面逐渐达到误差的最小值。对于复杂的网络,其误差函数为多维空间的曲面,就像一个碗,其碗底是最小值点。但是这个碗的表面是凹凸不平的,因而在对其训练过程中,可能存在某一小谷区,而这一小谷区产生的是一个局部极小值。由此点向各方向变化均使误差增加,以致于使训练无法跨出这一局部极小值。通常的作用是采用多层网络和较多的神经元,有可能使结果得到改善。然而,增加神经元或者增加同层神经元的个数,同时增加了网络的复杂性以及训练的时间。在一定的情况下可能是不明智的。因此可通过选用几组不同初始条件对网络进行训练,然后再从中挑选出最好的结果。3.5倒立摆神经网络理论的应用早在1983年,Barto等【15】就设计了两个单层神经网络,采用AHC(Adantiveheuristiccritic)学习算法实现状态离散化的倒立摆控制。而在1989年,Anderson【16】进一步用两个双层神经网络和AllC方法实现了状态未离散化的倒立摆系统平衡控制。但这两种算法都只能针对一类模型。蒋国飞等【17】通过训练BP网络来逼近口值函数,并利用BP网络的泛化能力,实现了基于口学习算法的状态未离散化的确定和随机倒立摆的无模型学习控制,不仅处理的模型对象更广泛,而且相对前两种算法而言,该算法具有更好的学习效果。单波等[18]利用神经网络建立倒立摆系统模型,以此来描述被控对象的输人输出关系,并由此计算出系统在未来若干时刻的误差。然后由误差确定系统的目标函数,通过滚动优化、反馈校正来实现对系统的实时控制。运用该算法不仅可以避免对被控对象做复杂的数学分析,而且还具有较快的收敛速度以及较强的鲁棒性。为了克服神经网络控制器结构不能改变的缺点,si等【19]将神经网络理论与增强式学习基本原理相结合,提出了一种在线学习控制系统。该实时学习系统能随着时间的推移而在两方面逐步提高它的性能:通过自身偏差不断学习;系统状态通过神经网络学习过程被储存。应用于倒立摆系统的神经网络控制算法一般都需要倒立摆系统的输人输出数据以及各种提示信息。而Houge等【】利用参数均取整数值的SONNET(Self-organizingneuralnetworkeligibilitytrace)网络模型[],无需预先分开输人空间,不必依赖系统输出数据,而仅仅只需知道倒摆系统的失败信号和系统的当前状态,即可对倒立摆进行有效的控制将神经网络理论应用于倒立摆系统的控制还有许多成功的例子,但由于神经网络理论本身的缺陷,有一些问题需要解决。如在如何有效地获取神经网络控制器的初始结构和参数值等方面就有许多间题值得探讨。有许多学者已经在这一方面做了有益尝试并取得了一些成果【】例如,Pasemann等〔提出了一种ENS(Evolutionofneurlsystembystochasticsynthesis)算法来获取神经网络的内部结构和权值。运用该控制算法,系统各状态变量不必量化,可以连续取值,且系统具有很强的鲁棒性。4遗传算法4.1遗传算法的发展概述遗传算法(GeneticAlgorithms,简称GAs)是一种基于生物界中的自然选择原理和自然遗传机制的随机搜索算法[39]。它模拟了生物界中的生命进化机制,并用在人工系统中实现特定目标的优化。这是一种在思想和方法上别开生面的全新优化搜索算法。传统的优化搜索算法往往要求所求解的函数具有连续、可微的性质,有要求搜索空间及噪声相对较小的限制。而遗传算法不受问题性质的限制,可以在巨大的空间上实行概率性搜索,能在搜索的过程中自动获取和积累有关搜索空间的指示,并自我调整地控制搜索过程,以求得最优解或较优解。遗传算法的这种特点使得它能够处理许多复杂问题,具有广泛的适用性和鲁棒性。在自动控制、组合优化、模式识别、机器学习、人工生命、管理决策等许多领域都得到了广泛的应用[40][41]。近年来,自动控制己成为遗传算法最活跃的研究领域之一,包括PID控制、最优控制、自我调整、鲁棒控制、模糊控制、神经网络控制及系统辨识等许多分支[42][43]。越来越多的研究人员开始研究用遗传算法及其改进算法解决控制领域中的难题。在科技高速发展的今天,对大规模的、复杂的、不确定性的系统进行有效控制的要求在不断提高,如何准确方便地优化各种控制方法中控制器的结构和参数己成为迫切需要解决的问题。尽管遗传算法经过几十年的理论及应用研究已获得了大量的成果,但其理论基础仍较薄弱,一些参数的选取还要依靠实验经验的积累。因此,对遗传算法本身及其解决控制问题的能力的深入研究具有重要的现实意义。从本世纪40年代,生物模拟就成为了计算科学的一个组成部分,如早期的自动机理论就是假设机器是由类似于神经元的基本元素构成的。近几十年来,人们关注着如:机器能否思维、基于原则的专家系统是否胜任人类的工作、以及神经网络可否使机器具有看和听的能力等等这些有关生物模拟的问题。自从人们接受了达尔文的生物进化理论之后,科学家们就对生物的进化机制产生极大的兴趣。自然进化特征在60年代就引起了美国Michigan大学的JohnHolland的极大兴趣,那时Holland从事如何建立能学习的机器研究。他注意到学习不仅可通过单个生物体的适应,而且可通过一个种群的许多代进化适应实现。他受达尔文进化论—“适者生存”的启发,逐渐认识在机器学习的研究中,为获得一个好的学习方法,仅靠单个策略的建立和改进是不够的,还要依赖于包含许多候选策略的群体繁殖。这种研究思想起源于遗传进化,Holland就将这个研究领域取名为遗传算法。从1985年到1993年,召开了五届国际遗传算法学术会议,遗传算法己经有了很大的发展,并开始渗透到人工智能、神经网络、机器人和运筹学等领域。遗传算法是多学科相互结合与渗透的产物,它已经发展成一种自组织、自适应的综合技术,广泛用在计算机科学、工程设计、管理科学和社会科学等领域。4.2遗传算法的概念、特点及应用遗传算法的基本步骤遗传算法GA是建立在自然选择和群体遗传机制基础上的随机迭代、进化,具有广泛适应性的概率搜索寻优算法。对于某个给定的优化问题,目标函数为:H=f(x,y,z,QUOTE〕(x,y,z…QUOTEHQUOTER要求(QUOTE…)使H为极大值和极小值,以适应优化的需要。此处,QUOTE是(x,y,z…)的定义域,H为实数,f为解空间(x,y,zQUOTE)QUOTE到实数域HQUOTER的一种映射。GA要根据目标函数H设定一个适应性函数F,用以判别某个样本的优劣程度。遗传算法的基本步骤如下:(1)编码采用二进制编码方案对优化变量进行编码。采用二进制编码的策略是将各优化分量分别进行编码然后合并成l个二进制位串,就代表了优化问题的1个可能解。如自变量X、Y、Z的1组取值用12个比特的二进制代码串表示为:100010011100XY Z(2)初始群体的生成通过随机方法产生出给定数量初始群体的个体,这些个体就是一批二进制代码串。首先,对每个个体计算其相应的适应度QUOTE,按QUOTE的大小评价该个体染色体的素质。QUOTE愈大表示第i个个体的素质愈好,优化的目标是找到QUOTE最大时所对应的个体。初始种群的素质一般还比较差,GA操作数的任务就是从这些初始群体出发,模拟进化过程择优去劣,逐次迭代,选出优秀的种群与个体,以达到优化的目的。(3)选择根据各个个体的适应度,按照一定的规则和方法,从第t代群体P(t)中选择出一些优良的个体遗传到下一代群体P(t+1)中。一般选择的规则是适应度QUOTE越大的个体,赋予更大的选择概率QUOTE,通常QUOTE,即适应度值高的个体有更多的繁殖后代的机会,以使优良特性得以遗传和保留。(4)交叉将群体P(t)内的各个个体随机搭配成对,对每一对个体,以交叉概率QUOTE交换他们之间的部分染色体。交叉的方法是随机选取一个(或两个)截断点,将双亲的二进制代码串在截断点处切开,然后交换其尾部(或中间部分)以产生新的一代如:双亲后代A10010110A’10011001B11001001B’11000110(5)变异对群体P(t)内的每个个体,以变异概率QUOTE改变某一个或某一些基因串上的基因值为其他的等位基因。对于二进制基因串就是将1改为0或将0改为1,如:变异A11001101——110101101重复上述过程,各代种群的优良基因逐渐积累,种群的平均适应度和个体适应度不断上升,直到迭代收敛,即找到最优解为止。虽然在目前的技术条件下,关于整个进化的机制还没有完全弄清楚,但通过许多实验和在微观世界里面进行的科学研究,人们逐渐认识了它们的许多特征。生物体的生成是染色体译码的结果,所以生物体结构编码的染色体变化是进化发生的根本原因。染色体的编码和译码过程的细节人们并不是完全了解,但下面几个关于进化理论的一般特性己广为人们所接受,(这些特性往往又作为遗传算法的基本法则):①进行过程发生是在染色体上,而不是发生在它们所编码的生物体上;②自然选择把染色体以及由它们所译成的结构的表现联系在一起,那些适应性好的个体的染色体经常比差的个体的染色体有更多的繁殖机会;③变异可以使生物体子代的染色体不同于它们父代的染色体。通过结合两个父代染色体中的物质,重组过程可以产生有很大差异的染色体;④生物进化没有一记忆。有关产生个体的信息包含在个体所携带染色体的集合以及染色体编码的结构之中,这些个体会很好地适应它们的环境。遗传算法的一般流程与自然界的生物进化过程相类似,遗传算法的运算过程也是一个反复迭代的过程,第t代群体记做P(t),经过一代遗传和进化后,得到第t+l代群体,它们也是由M个个体组成的群体,记做P(t+l)。这个群体不断地经过遗传和进化操作,并且每次都按照优胜劣汰的规则,将适应度值较高的个体更多地遗传到下一代。这样最终在群体中将会得到一个优良的个体C*,它所对应的表现型X将达到或接近于问题的最优解X*。遗传算法的主要计算过程如下:(1)对问题的可行解进行染色体编码;(2)产生初始种群;(3)对种群内的各个个体进行适应度评价;(4)根据个体的适应度进行选择操作,然后交叉、变异产生新的群体;(5)返回到(3),对该组群体译码进行新的评价;(6)若当前解满足要求或进化过程中达到一定的进化代数,计算结束,否则转(3),继续进行。遗传算法的基本流程如图2.4所示图2.4遗传算法基本流程图4..2.3遗传算法的特点与其他优化算法相比,遗传算法具有如下优点:(1)将搜索过程作用在编码后的字符串上,不直接作用在优化问题的具体变量上,在搜索中用到的是随机的变换规则,而不是确定的规则。它在搜索时采用启发式的搜索,而不是盲目的穷举,因而具有更高搜索效率。(2)现行的大多数优化算法都是基于线性、凸性、可微性等要求,而遗传算法只需要适合度信息,不需要导数等其他辅助信息,对问题的依赖性较小,因而具有高度的非线性,适用范围更广。此外还可以写出一个通用算法,以求解许多不同的优化问题。(3)遗传算法从一组初始点开始搜索,而不是从某一个单一的初始点开始搜索。而目_给出的是一组优化解,而不是一个优化解,这样可以给设计者更大的选择余地。它能太原理}_大学硕十研究生学位论文在解空间内充分搜索,具有全局优化能力。(4)遗传算法具有很强的易修改性。即使对原问题进行很小的改动(比如目标函数的改进),现行的大多数算法就有可能完全不能使用,而遗传算法则只需作很小的修改就完全可以适应新的问题。(5)遗传算法具有很强的可并行性,可通过并行计算来提高计算速度,因而更适用于大规模复杂问题的优化。正是基于以上优点,遗传算法对优化工作者来说充满了吸引力。但是由于遗传算法是一种较新的算法,在实际运用中也还有许多地方有待进一步地深入和改进,主要集中在以下几个方面:(1)遗传算法的理论研究比较滞后。由于遗传算法本身也是一种仿生的思想,尽管实践效果很好,但理论证明比较困难。而且这种算法提出来的时间还不是很长,因此其理论和实践的研究几乎是平行进行的。(2)GA算法本身的参数还缺乏定量的标准,目前采用的都是经验数值,而且不同的编码、不同的遗传技术都会影响到遗传参数的选取,因而会影响到算法的通用性。(3)GA对处理约束化问题还缺乏有效的手段,传统的罚函数法中对惩罚因子的选取还是一个比较困难的技术问题。4.3遗传算法的应用由于遗传算法具有上述的众多特点,所以它广泛应用于很多学科。而且它不依赖于问题的具体领域,它具有自我调整性、全局优化性和隐含并行性,体现出很强的解决问题的能力。(1)函数优化和组合优化人们构造各种各样的函数来检测遗传算法的性能,通过对各种几何特性不同的函数计算,结果表明遗传算法均具有较好的性能。而且对于一些非线性、多模型、多目标的函数优化问题,遗传算法也能得到较好的结果。同时对于大规模的组合优化问题,传统的枚举法很难得到其精确最优解。而遗传算法则是寻求这种满意解的最佳工具之一。实践证明,遗传算法对于组合优化问题的NP完全问题非常有效。例如,遗传算法已经在求解旅行商问题背包问题、装箱问题、图形划分问题等方面得到成功的应用。(2)生产调度问题生产调度问题在许多情况下所建立起来的数学模型难以精确求解,即使经过一些简太原理}大学硕十研究生学位论文之后可以进行求解,也会因为简化太多而使得求解结果与实际相差甚远。而遗传算法已成为解决复杂调度问题的有效工具,在单件生产车间调度、流水线生产车间调度、生产规划、任务分配等方面遗传算法都得到了有效的应用[23一25]。比如cartwright关于化工厂生产计划的优先安排,Syswerda关于飞行支持设备调度问题,Hiiliard运输军队及其装备多目标通路的作业调度,Gabbert关于铁路网络复杂运输调度等问题,采用遗传算法均取得了明显的效果。(3)自动控制在自动控制领域中有许多与优化相关的问题需要求解,遗传算法的应用日益增加,并显示了良好的效果。例如遗传算法进行航空控制系统的优化、基于遗传算法的模糊控制器优化设计、基于遗传算法的参数辨识,都显示了遗传算法在这些领域的应用。例如:Maclay等人用遗传算法求解电车模型参数辨识问题[26],Freeman等人提出应用遗传算法精调控制中的由人定义的模糊逻辑集合概念,取得了显著的效果[27]。(4)人工智能与计算机科学人工智能是计算机等人工媒体模拟或构造出具有自然生物系统特有行为的人造系统。人工智能与遗传算法有着密切的关系,基于遗传算法的进化模拟是研究人工智能的重要理论基础。遗传算法在人工智能与计算机科学中的应用包括:数据挖掘与知识获取[28]、数据库查询优化、人工神经网络结构与参数优化[30]、模式识别、专家系统等。4.4遗传算法的收敛性分析遗传算法是一种全局性的概率搜索算法,初始种群的选取、选择、交叉、变异操作都带有随机性。这种随机性的搜索迭代过程中所产生的解或函数序列的极值,最终是否会收敛到全局最优解?因此研究GA的全局性收敛问题。不仅具有理论指导意义,而且也有重要的实践价值。对于遗传算法的全局收敛性,取得了许多研究成果:(l)模式定理:遗传算法中,在选择、交叉和变异操作数的作用下,具有低阶,短定义长度,并且平均适应度高于群体平均适应度的模式将按指数级增长。模式定理阐述了遗传算法的理论基础,它说明了较优模式(遗传算法的较优解)的样本数呈指数级增长,满足了寻找最优解的必要条件,即遗传算法存在着寻找全局最优解的可能性,但是它并没有说明遗传算法一定能够寻找到最优解。(2)积木块假设:低阶,短矩,高平均适应度的模式(积木块)在遗传操作数的作用下,相互结合,能生成高阶、长矩、高平均适应度的模式,可最终生成全局最优解。遗憾的是,上述结论并没有得到证明,但目前己经有大量的实践支持积木块假设,它在许多领域的应用都取得了成功,例如平滑多峰问题,带干扰多峰问题以及组合优化问题等。Goldberg和Segrest是首次使用马尔可夫链分析了遗传算法阴;Eiben等人用马尔可夫链分析证明了保留最佳个体的GA以概率1收敛到全局最优解[36];Rudolph用齐次有限马尔可夫链分析证明了带有复制、交叉、变异操作的标准遗传算法收敛不到全局最优解[37];Qi和Palmieri对浮点数编码的遗传算法进行了严密的数学分析,但是其结果是基于群体数为无穷大这一假设[38]。挥为民和席裕庚利用齐次有限马尔可夫链对基本遗传算法的全局收敛性和计算效率进行分析I39];徐总本和聂赞坎等人开始利用鞍理论分析遗传算法的收敛性,该文首次尝试用鞍理论证明遗传算法在保留最佳个体策略时,遗传算法在有限步内几乎必然强收敛于最优解[40]。王霞和周国标利用下鞍理论证明分析遗传算法的收敛速率,并给出保留最佳个体策略的遗传算法收敛速率的概率形式[4]。本文则是利用下鞍理论分析遗传算法在非保留最佳个体策略时,遗传算法强收敛到全局最优解的充分条件,这为用鞍理论分析遗传算法做了有益的尝试,同时也补充证明遗传算法的转移概率矩阵是不可约非周期的马尔可夫链。4.5遗传算法面临的问题随着科学技术的迅速发展,遗传算法也应用到更多的领域。由于遗传算法来源于进化论和群体遗传学,缺乏严格的数学基础,收敛性证明比较困难,虽然可以利用马尔可夫链的性质证明在保留最优值情况下,遗传算法可以收敛到全局最优解,但是对其收敛速率估计是当前需要深入研究和讨论的问题。因为它能从理论上对遗传算法的任何修正形式提供评判标准,指明改进算法性能的正确方向。另外,利用马尔可夫链分析对遗传算法的具体应用和参数设计所提供的指导信息非常少。如何选择遗传算法的参数,才一能得到最优结果,到目前还没有理论指导。以上这两个方面还需要寻求更有效的分析手段和严格的数学证明。作为一种搜索算法,遗传算法通过对编码、适应度函数、复制、交叉和变异等主要操作的适当设计和运行后,可以做到兼顾全局搜索和局部搜索的特点。然而,遗传算法虽然可以实现均衡搜索,并在许多复杂问题的求解中表现很好的效果,但是该算法的全局收敛性的理论分析尚待解决。简单遗传算法并不能保证全局最优收敛,即出现通常所说的早熟现象或者根本不收敛。导致GA早熟的原因可以归结为以下几个方面:1群体规模:群体规模与很多因素有关。当群体规模太小时,造成有效等位基因先天缺失,即使采用较大概率的变异操作数,生成具有竞争力的高阶模式的可能性还是较小,况且大概率变异算法对己有模式的破坏作用显著增大。同时,由于GA操作数存在着随机误差,即模式采样误差,妨碍小群体中有效模式的正确传播,因而使得群体进化不能按模式定理产生所预测的期望数量。当群体规模太大时,又造成计算量急剧增大。2选择压力:当群体中的最优个体期望抽样较大时,个体的选择压力太大,导致群体的多样性迅速减低;相反,当群体的最优个体期望抽样较小,个体的选择太小,导致模式竞争减弱,遗传操作数重组生成高阶模式的能力降低,也会出现进化停滞现象。3变异概率:当变异概率比较小时,群体多样性下降太快,容易导致有效基因的迅速丢失且难以恢复;当变异概率比较大时,尽管群体多样性可以保持在较高的水平,但是高阶模式被破坏的概率也随之增大。4适应函数性质:当适应函数高度非线性,染色体基因位之间高度相关,有效模式更容易被破坏,或者当最优解附近为非常平缓的超平面时,高阶竞争模式适应度值之间的差异非常小,在适应度值比较选择方式下的模式竞争激烈,导致当前最佳个体适应度值的改进出现停滞。5群体初始化:初始群体分布在编码空间的局部区域,导致GA的搜索范围受到限制。6参数区间设定:如果编码空间选择不当,即最优参数落在区间之外,则无论如何寻优,也是无法找到全局最优解的。针对上述情况,需要在编码方式、适应度函数的选择和遗传操作操作数的设计等方面对GA进行改进,从而抑制早熟现象的发生。SGA由于算法简单,实现容易,因而目前己得到广泛应用,但有理论证明,SGA在任意初始化,任意交叉操作数以及任意适应度函数下,无法收敛到全局最优解,而通过改进的遗传算法却能够最终收敛到全局最优解。5模糊控制方法5.1模糊逻辑技术的研究现状与特点美国著名控制论学者L.A.查德(Zadeh)教授在20世纪60年代初期认为经典控制论过于强调精确性而无法处理复杂的系统,他认为“在处理生物系统时,需要一种彻底不同的数学一一关于模糊量的数学,该数学不能用概率分布来描述”,他的这些思想形成了模糊集合理论,并于1965年发表了《Fuzzyset》这一开创性论文,为处理客观世界中存在的模糊性问题提供了有力的工具。20世纪60年代后期,许多新的模糊方法被提出,如Zadeh于1968年提出了模糊算法的概念,1970年提出了模糊决策等,并于1973年发表了另一篇开创性的文章《分析复杂系统和决策过程的新方法纲要》,该论文建立了研究模糊控制的基础理论,在引入语言变量的概念的基础上,提出了用工F一THEN的规则来量化人类的知识。在1975年英国的马丹尼(Mamdani)创立了模糊控制器的基本框架,并将模糊控制用于控制蒸汽机〔24’,发现模糊控制器非常易于构造且运作效果较好,他们的研究成果发表在文章《带有模糊逻辑控制器的语言合成实验》中。进入20世纪80年代初这一领域进展缓慢,没有新的概念和方法被提出,到90年代初有许多的模糊产品大量出现,因此可说实践是模糊系统和模糊控制理论发展的驱动力。我国的模糊控制理论及其应用研究工作是从20世纪70年代开始的,至今快有30模糊控制理论应用的进展1965年美国加利福尼亚大学的教授创建模糊集理论来描述模事物。1974年英国的首先利用模糊控制语句组成模糊控制器。并功地将模糊控制应用于锅炉和蒸汽机控制,这一开拓性的工作,标志着模糊制理论的诞生。1975年,英国的Fing及Mandani利用模糊控制器控制一个反应炉搅拌池温度,并获得成功。1976年,荷兰Kichert等研究了热水站的模糊控制,使这个用传统方法难以进行控制的多变量非线性对象实现了稳定可靠的运行。丹麦Storgard利用模糊控制器对双输入双输出的热交换过程进行了模糊控制,英国学者Tong对压力容器内部的压力和液位进行了模糊控制,也得到了传统控制方法难以达到的控制效果。1979年,英国的PappiS利用模糊控制对十字路口的交通管理进行试验,取得了成功。1985年,世界上第一块模糊逻辑芯片在美国著名的贝尔实验室问世,这是模糊技术走向实用化的又一里程碑。1990年来以来,模糊控制的应用得到了进一步的推广,模糊家电开始出现在我们的日常生活中。虽然模糊理论的提出只有短短30多年的时间,但其发展速度却十分的惊人。大量对模糊理论进行研究的文献论文不断发表,并且数量呈几何趋势增长。这充分体现了模糊理论的发展速度[25],而且显示了模糊控制理论巨大的发展潜力。随着科学技术的不断进步,自动控制系统被控对象也朝着复杂化的方向发展,主要表现在多输入一多输出的强耦合性、参数时变性和严重的非线性等特点上。然而就在这样复杂的多变量、非线性、时变的系统中,对控制质量的要求却越来越高。正是由于模糊控制具有突出的优点,并且在解决控制系统中的复杂问题上有着特别的优势,所以对模糊控制理论的深入研究对控制理论的发展来说是十分重要的,并且很有实际意义。模糊逻辑应用最有效、最广泛的领域就是模糊控制,它在许多领域成功解决了传统控制方法无法或难以解决的问题,模糊控制是以人的控制经验作为控制的知识模型,以模糊集合、模糊语言变量及模糊逻辑推理作为控制算法的数学工具,使用计算机来实现的一种智能控制。模糊控制技术的理论基础的核心是模糊推理理论。模糊控制技术之所以得到广泛应用是由于它具有以下一些突出特点:1.直接采用语言型控制规则,设计中不需要建立被控对象的精确数学模型,使得控制机理与策略易于接受,便于应用。2.系统语言控制规则具有相对的独立性,利用这些控制规律间的模糊连结,容易找到折中的选择,使控制效果优于常规控制器。3.有利于模拟人工控制的过程和方法,增强控制系统的适应能力,使之具有一定的智慧水平。4.鲁棒性强,干扰和参数变化对控制效果的影响被大大减弱,尤其适合于非线性、时变及纯滞后系统的控制。模糊控制理论落后于应用的发展,所以目前模糊控制研究应集中在理论上的挖掘。模糊控制理论是建立在模糊集合论、模糊语言变量及模糊逻辑推理基础上的一种计算机数字控制理论。它因在设计系统时不需要建立被控对象精确的数学模型而得到了日益广泛的应用。模糊控制在研究像倒立摆这样的高度非线性系统上有很大的优势。但是,在用模糊控制理论解决倒立摆这样多变量系统控制问题时,不可避免会遇到规则爆炸(RuleExplosion)问题,本章研究了运用最优控制方法设计融合函数以降低模糊控制器的输入变量维数,大大减少模糊控制的规则数,成功解决了规则爆炸问题;并研究了量化因子对控制效果的影响,通过设置阈值使量化因子可以自动调节,进而提升了模糊控制器的性能质量。模糊控制相对于常规控制,对于被控对象的非线性和时变性具有一定的适应能力,然而它也存在一定的缺陷:1.精度不太高。这主要是由于模糊控制表的量化等级有限而造成的,通过增加量化等级数目虽然可以提高精度,但是查询表将过于庞大,须占用较大空间,使运算时间增加。实际上,如果模糊控制器不引入积分机制,原则上误差总是存在的。2.自我调整能力有限。由于量化因子和比例因子是固定的,当对象参数随环境的变化而变化时,它不能对自己的控制规则进行有效的调整,从而使其良好的性能不能得到充分的发挥。3.易产生振荡现象。如果查询表构造不合理或者量化因子和比例因子选择不当,都会导致系统振荡。5.2模糊控制理论简介模糊控制是以模糊集合、模糊语言变量及模糊逻辑推理为基础的一种计算机数字控制。从线性控制与非线性控制的角度分类,模糊控制是一种非线性控制;从控制器的智慧性看,模糊控制属于智慧控制的范畴,而且它已经成为目前智慧控制的一种重要而有效的形式[35~36]。模糊控制系统组成模糊控制属于计算机数字控制的一种形式,因此,模糊控制系统的组成类似于一般数字控制系统,其框图如图4-1所示。图5-1模糊系统框图(1)模糊控制器:这是模糊控制系统的核心部分,采用基于模糊控制知识表示和规则推理的语言型“模糊控制器”,这也是模糊控制系统区别于其他自动控制系统的特点所在。(2)输入/输出接口:模糊控制器通过输入/输出接口从被控对象获取数字信号量,并将模糊控制器决策的数字信号经过数模转换,将其转变为模拟信号,然后送给被控对象。在I/O接口装置中,除A/D,D/A转换外,还包括必要的电平转换电路。(3)执行机构:包括交、直流电机,伺服电机,步进电机,气动调节阀和液压电动机、液压阀等。(4)被控对象:这些被控对象可以是确定的或者模糊的、单变量的或者多变量的、有滞后的或者无滞后的,也可以是线性的或者非线性的,定常的或者时变的,以及具有强耦合和干扰等多种情况。对于那些难以建立精确数学模型的复杂对象,更加适合采用模糊控制。(5)传感器:是将被控对象或者各种过程的被控量转换为电信号(模拟或者数字)的一类装置。被控制量往往是非电量,如位移、速度、加速度、温度、压力、流量、浓度、湿度等。传感器在模糊控制系统中占有十分重要的地位,它的精度往往直接影响整个控制系统的精度,因此,在选择传感器时,应该选择精度高且稳定性好的传感器。模糊控制器设计的基本方法图5-2模糊系统结构图模糊控制系统的核心是模糊控制器(FuzzyController),其组成见图5-2模糊控制器一般是可以靠软件程序设计来实现的,实现模糊控制的一般步骤如下:(1)确定模糊控制器的输入变量和输出变量(即控制量);(2)设计模糊控制器的控制规则;(3)进行模糊化和去模糊化;(4)选择模糊控制器的输入变量及输出变量的论域,并确定模糊控制器的量化因子、比例因子);(5)编制模糊控制算法的应用程序;(6)合理选择模糊控制算法的采样时间。5.3倒立摆的模糊控制方法简介在研究倒立摆这类多变量非线性系统的模糊控制时,一个难题就是规则爆炸(RuleExplosion),比如一级倒立摆的控制涉及的状态变量共有4个,每个变量的论域作7个模糊集的模糊划分,这样,完备的推理规则库会包含2401个推理规则;而对于二级倒立摆有6个状态变量,推理规则会达到117649,显然如此多的规则是难以实现的。为了解决这个问题,张乃尧等提出双死循环的倒立摆模糊控制方案,内环控制倒立摆的角度,外环控制倒立摆的位移[12]。范醒哲等人将这一方法推广到三级倒立摆控制系统中,并提出两种模糊串级控制方案,用来解决倒立摆这类多变量系统模糊控制时的规则爆炸问题[37]。ShuliangLei和RezaLangari应用分级思想将四个状态变量分成两个子系统,分别用两个模糊控制器控制,然后再设计一个上层模糊控制器来协调子系统之间的相互作用[38]。文献[39,40]提出参变量模糊控制方法解决规则爆炸问题。这种控制器结构如图4-3所示。图5-3二级倒立摆模糊控制结构5.4融合技术和融合函数融合技术从理论上讲,小车位移x以及速度与摆杆角度QUOTE及摆杆角速度
存在很大的藕合关系。既要将小车运动控制在零点位置范围内,又要使摆不倒,就要综合考虑摆杆和小车的力学关系以及各自所处的状态。对于多因素问题,采用分步处理的方法能简化问题的解决过程,这一思想可以应用到多输入模糊控制器的设计过程中。假设要设计高维输入变量X映像到输出变量Y的模糊控制器,鉴于直接设计由X到Y的单级模糊控制策略比较困难,因而可以采用多级控制方式,将单一的模糊控制策略转化为多级控制策略嵌套:Y=F2[F1(X)](5-1)即先使用算法F1(X)对输入变量进行初步处理,再利用算法F2(X)根据前级算法的输出进行控制。如果算法F1(X)的输出维数小于X的维数,那么算法F2(X)所要完成的控制工作就得到了简化。可以看出,算法F1(X)利用系统状态的相关性和输入信息的可融合性完成了组合、提取问题信息的过程,可称为“融合函数”。而算法F2(X)实现了根据约简因素进行模糊推理的功能,可以称为模糊作用函数。基于信息融合的多输入模糊控制器设计方法就是通过融合函数进行信息、合并与提取,从而实现控制问题的逐步简化。融合函数设计二级倒立摆是典型的多输入单输出(MISO)系统,已经得到二级倒立摆系统近似线性状态方程,因此利用线性系统的输出信息具有可直接融合的特点,我们构造了一个线性融合函数,把二级倒立摆6维状态变量融合成综合误差E和综合误差变化EC。构造融合函数的步骤:利用最优控制理论计算出一组可以让二级倒立摆系统的线性模型基本稳定的状态回馈矩阵K利用状态反馈矩阵K构造融合函数F1(X)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 爱惜校内环境活动方案总结
- 大学生座谈会方案
- 儿童线描未来城市课件
- BD测试包市场前景及投资研究报告(2025-2027)
- 学校校本培训方案
- 2020-2025年中国大飞机制造行业竞争格局分析及投资战略咨询报告
- 重阳节教学设计方案
- 中国计量校准仪行业投资分析及发展战略咨询报告
- 学校重阳节活动方案模板
- 员工个人岗位阶段性方案
- 龋病的概述讲解
- 蔬菜采购技巧培训课件
- 护理继续教育培训课件
- 技术团队管理培训课件模板
- 汇能集团招聘试题
- 培养小学生的逻辑思维能力
- 电磁铁实验:探索电磁铁的吸附力和工作原理
- 腹膜透析健康宣教说课课件
- 2020年四川省绵阳市中考语文试卷(附答案详解)
- 急性淋巴结炎的护理查房
- 北京开放大学《现代管理专题》终结性考试复习题库(附答案)
评论
0/150
提交评论