安徽建筑大学智能控制第四章课件_第1页
安徽建筑大学智能控制第四章课件_第2页
安徽建筑大学智能控制第四章课件_第3页
安徽建筑大学智能控制第四章课件_第4页
安徽建筑大学智能控制第四章课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第4章 神经控制主要内容:1、人工神经网络的初步知识2、神经网络控制的结构3、神经网络控制系统的设计1、神经网络原理 神经生理学和神经解剖学的研究表明,人脑极其复杂,由一千多亿个神经元交织在一起的网状结构构成,其中大脑皮层约140亿个神经元,小脑皮层约1000亿个神经元。 人脑能完成智能、思维等高级活动,为了能利用数学模型来模拟人脑的活动,导致了神经网络的研究。4.1 人工神经网络的初步知识 神经系统的基本构造是神经元(神经细胞),它是处理人体内各部分之间相互信息传递的基本单元。 每个神经元都由一个细胞体,一个连接其他神经元的轴突和一些向外伸出的其它较短分支树突组成。 从生物控制论的观点来看

2、,神经元作为控制和信息处理的基本单元,具有下列一些重要的功能与特性: 时空整合功能 兴奋与抑制状态 脉冲与电位转换 神经纤维传导速度 突触延时和不应期 学习、遗忘和疲劳 人工神经网络(Neural Network)是模拟人脑思维方式的数学模型。神经网络是在现代生物学研究人脑组织成果的基础上提出的,用来模拟人类大脑神经网络的结构和行为。神经网络反映了人脑功能的基本特征,如并行信息处理、学习、联想、模式分类、记忆等。 神经网络的发展历程经过4个阶段。 (1)启蒙期(1890-1969年) 1890年,W.James发表专著心理学,讨论了 脑的结构和功能。 1943年,心理学家W.S.McCullo

3、ch和数学家W.Pitts提出了M-P模型(第一个神经网络模型)。 1949年,心理学家Hebb实现了Hebb学习法则。 1958年,E.Rosenblatt提出了著名的感知机模型(Perceptron)。 1962年,Widrow和Hoff提出了自适应线性神经网络。2、 神经网络发展历史3、人工神经元模型 人工神经元是对生物神经元的一种模拟与简化。它是神经网络的基本处理单元。如图所示为一种简化的人工神经元结构。它是一个多输入、单输出的非线性元件。其输入、输出关系可描述为其中, 是从其他神经元传来的输入信号; 表示从神经元j到神经元i的连接权值; 为阈值; 称为激发函数或作用函数(一般具有非线

4、性特性)常用的神经元非线性特性有以下三种:(1)阈值型阈值型函数(1)前馈型神经网络 前馈型神经网络,又称前向网络(Feed forward NN)。如图所示,神经元分层排列,有输入层、隐含层(亦称中间层,可有若干层)和输出层,每一层的神经元只接受前一层神经元的输入。输入模式经过各层的顺次变换后,由输出层输出。在各神经元之间不存在反馈。感知器和误差反向传播网络采用前向网络形式。 (2)反馈型神经网络 反馈型神经网络(Feedback NN)的结构如图所示。在输出层到输入层存在反馈,即每个输入节点都有可能接受来自外部的输入和来自输出神经元的反馈。这种神经网络是一种反馈动力学系统,它需要工作一段时

5、间才能达到稳定。Hopfield神经网络是反馈网络中最简单且应用最广泛的模型。(3) 自组织网络 Kohonen网络是最典型的自组织网络。当神经网络在接受外界输入时,网络将会分成不同的区域,不同区域具有不同的响应特征,即不同的神经元以最佳方式响应不同性质的信号激励,实际上是一种非线性映射。这种映射是通过无监督的自适应过程完成的,所以也称为自组织特征图。1、有监督学习方式特点:不能保证得到全局最优解;要求大量训练样本,收敛速度慢;对样本地表示次序变化比较敏感 神经网络根据实际输出与期望输出的偏差,按照一定的准则调整各神经元连接的权系数,见下图。期望输出又称为导师信号,是评价学习的标准,故这种学习

6、方式又称为有导师学习。5、神经网络的学习方法 学习方法是体现人工神经网络智能特性的主要标志。按有无导师来分类。6、典型的神经网络 (1)BP神经网络 误差反向传播神经网络,简称BP网络(Back Propagation),该网络是一种单向传播的多层前向网络。 误差反向传播的BP算法简称BP算法,其基本思想是梯度下降法。它采用梯度搜索技术,以期使网络的实际输出值与期望输出值的误差均方值为最小。BP网络特点 (1)是一种多层网络,包括输入层、隐含层和输出层; (2)层与层之间采用全互连方式,同一层神经元之间不连接; (3)权值通过学习算法进行调节; (4)神经元激发函数为S函数; (5)学习算法由

7、正向传播和反向传播组成; (6)层与层的连接是单向的,信息的传播史双向的。 BP网络具有很好的逼近非线性映射的能力,该网络在模式识别、图像处理、系统辨识、函数拟合、优化计算、最优预测和自适应控制等领域有着较为广泛的应用。 由于BP网络具有很好的逼近特性和泛化能力,可用于神经网络控制器的设计。但由于BP网络收敛速度慢,难以适应实时控制的要求。(2)RBF神经网络 径向基函数(RBF-Radial Basis Function) 具有单隐层的三层前馈网络。由于它模拟了人脑中局部调整、相互覆盖接收域(或称感受野-Receptive Field)的神经网络结构,因此,RBF网络是一种局部逼近网络,已证

8、明它能任意精度逼近任意连续函数。RBF网络结构 RBF网络是一种三层前向网络,由于输入到输出的映射是非线性的,而隐含层空间到输出空间的映射是线性的,从而可以大大加快学习速度并避免局部极小问题。RBF网络特点 (1) RBF网络的作用函数为高斯函数,是局部的,BP网络的作用函数为S函数,是全局的; (2) 如何确定RBF网络隐层节点的中心及基宽度参数是一个困难的问题; (3) 已证明RBF网络具有唯一最佳逼近的特性,且无局部极小。7、神经控制的基本原理传统控制模式根据被控对象的数学模型及对控制系统要求的性能指标设计控制器,并对控制规律加以数学解析描述。模糊控制模式基于专家经验和领域知识总结模糊控

9、制规则显式表达知识神经控制不善于显式表达知识 具有很强的逼近非线性函数 能力(非线性映射能力)神经网络在控制中主要起以下作用: (1)在基于精确模型的各种控制结构中充当对象的模型; (2)在反馈控制系统中直接充当控制器的作用; (3)在传统控制系统中起优化计算作用; (4)在与其它智能控制方法和优化算法相融合中, 为其提供对象模型、优化参数、推理模型及故障诊断等。 一般说来,神经网络用于控制有两种方式:一种是利用神经网络实现系统建模,有效地辨识系统;另一种就是将神经网络直接作为控制器使用,以取得满意的控制效果。4.2 神经网络控制的结构1、基于神经网络的系统辨识(1)系统辨识的基本概念 L.

10、A. Zadeh曾给辨识下过定义:“辨识就是在输入和输出数据的基础上,从一组给定的模型中,确定一个与所测系统等价的模型。”其中,L为数据的长度,f()是e(k)的函数,一般选平方函数,即根据图可知 由于e2(k)通常是关于模型参数的非线性函数。因此,在这种误差准则意义下,辨识问题可归结为非线性函数的最优化问题。 误差准则的选择原则 作为衡量模型是否接近实际系统的标准,误差准则通常表示为一个误差的泛函,记作被辨识系统辨识模型(2)基于神经网络的系统辨识正向模型辨识 所谓正向模型是指利用多层前馈神经网络,通过训练或学习,使其能够表达系统正向动力学特性的模型。下图给出了获得系统正向模型的网络结构示意

11、图。其中神经网络与待辨识系统并联,两者的输出误差e被用作网络的训练信号。显然,这是一个典型的有监督学习问题,实际系统作为教师,向神经网络提供学习算法所需的期望输出。一般可选BP及其改进算法对网络进行训练。动态系统NN正向模型2. 逆模型辨识 (1)直接逆建模 直接逆建模也称为广义逆学习,其结构如图动态系统NN 从原理上说,这是一种最简单的方法。拟辨识动态系统的输出作为网络的输入,将网络输出与系统输入进行比较后的误差作为训练信号,因而网络将通过学习建立起拟辨识动态系统的逆模型。(2)正逆建模 正逆建模也称为狭义逆学习,其结构如图动态系统NN正向模型 此时待辨识对象的逆模型(NN)位于动态系统前面

12、,并与之串联。网络的训练误差或者为系统期望输出yd(k)与系统实际输出y(k)之差,或者为系统期望输出yd(k)与已建神经网络正向模型的输出yN(k)之差,即或2、基于神经网络的控制 在现代控制系统中,随着工程研究的深入,控制理论所面临的问题日益复杂多变,主要表现在控制对象、控制任务的日益复杂化,系统的数学模型难以建立。神经网络由于其强大的非线性映射能力、自学习自适应能力、联想记忆能力、并行信息处理能力以及优良的容错能力,使得其非常适用于复杂系统的建模与控制,特别是当系统存在不确定因素时,更体现了神经网络方法的优越性,它使模型与控制的概念合二为一。(1)基于神经网络控制的基本原理神经网络用于控

13、制的优越性主要表现在以下几个方面: 采用并行分布信息处理方式,具有很强的容错性。 神经网络的本质是非线性映射,它可以逼近任意非线性函数。 通过对训练样本的学习,可以处理难以用模型或规则描述的过程和系统。 硬件实现发展迅速,为提高神经网络的应用开辟了广阔的前景。 神经网络自身所具有的自学习和自适应、自组织以及大规模并行信息处理等特点,使其在自动控制领域具有广阔的应用前景。()神经网络前馈控制的基本原理一般反馈控制系统的原理图:控制器被控对象神经网络被控对象采用神经网络作为前馈控制器的系统如图:神经网络被控对象 设被控对象的输入u和系统输出y之间满足如下非线性函数关系 控制的目的是确定最佳的控制量

14、输入u,使系统的实际输出y等于期望的输出r。在该系统中,可把神经网络的功能看作输入输出的某种映射,或称函数变换,并设它的函数关系为 为了满足系统输出y等于期望的输出r,由以上两式可得 显然,当 时,满足y=r 的要求。 利用神经网络所具有的逼近任意非线性函数的能力来模拟 。通过系统的实际输出y与期望输出r之间的误差来调整神经网络中的连接权值,即通过神经网络学习,使误差趋近于零的过程,实际上就是神经网络模拟 的过程,它实际上是对被控对象的一种求逆过程,由神经网络建立被控对象的逆模型,就是神经网络实现直接控制的基本原理。()神经网络在控制系统中的作用 神经网络在控制系统中的作用分为以下几种: 在基

15、于精确模型的各种控制系统中充当对象的模型; 在前馈(或反馈)控制系统中直接充当控制器; 在传统控制系统中起优化计算作用; 在与其它智能控制方法的融合中,实现参数优化、模型推理及故障诊断等功能。 ()神经网络控制的基本结构 神经网络在控制器中的应用一般分为两类: 一类是直接神经网络控制,它以神经网络为基础形成独立的智能控制系统; 另一类称为混合神经网络控制,它利用神经网络的学习和优化能力来改善其它控制方法的控制性能。 神经网络PID控制 它是在实际控制系统中使用最为广泛的一种控制方式。首先利用神经网络辨识器(NNI)对被控对象进行在线辨识,然后利用神经网络控制器(NNC)模拟PID调节器进行控制

16、,其结构如图所示。NNC(PID)对象NNI神经网络PID控制 直接逆控制 属于前馈控制,也称直接自校正控制,其控制结构示意图如图所示,图中EF为评价函数。 神经网络训练的目的就是为了逼近系统的逆动力学模型。这种控制方案的优点是能够在线调整控制器参数,实现对设定值的实时跟踪。 NNC对象EF 模型参考自适应控制(MRAC) 利用NNC和NNI跟踪对象的参考模型,使其输出为期望输出,根据神经网络的自调整功能实现在线辨识控制,使y跟踪yM。其结构图如图所示。NNC对象NNI参考模型模型参考自适应控制 内模控制 神经网络内部模型控制(IMC)先利用NNI对被控对象进行在线辨识,然后利用NNC实现对象

17、的逆模型,再利用滤波器进一步提高系统的鲁棒性能。其控制器输出由被控对象与内部模型的输出误差来调整。内模控制以其较强的鲁棒性和易于进行稳定性分析等特点在过程控制中得到了广泛的应用。下图为其结构图,其中d为对象的扰动值。NNC对象NNI滤波器内模控制 预测控制 预测控制是一种基于模型的控制,其算法主要通过模型预测、滚动优化和反馈校正三部分组成。利用神经网络的非线性函数逼近能力,可以实现对非线性对象的预测,从而保证优化目标的实现。下图为其结构图,NNP为神经网络预测器。优化控制器对象NNP滤波器预测控制 单神经元自适应PID控制 自适应PID控制的基本思想是将自适应控制和PID控制两者结合起来,在线

18、自动调整PID参数,从而增强控制器的自适应能力,使控制系统性能达到最佳。 自适应PID控制器的类型很多,最简单而且有较强鲁棒性的自适应PID控制器主要有模型参考自适应PID控制器和单神经元自适应PID控制器两种,这里只介绍后者。传统的增量式PID控制规律可以用如下的差分方程来描述: 式中,KI为积分系数;KP为比例增益;KD为微分系数。 结合传统的PID控制机理构成的单神经元自适应PID控制器的具体结构框图如图所示。 图中:yr(k)、y(k)分别表示设定值和输出值;x1(k)、x2(k)、x3(k)和w1(k)、w2(k)、w3(k)分别为神经元的输入量及其相应的权值;Ku为神经元的比例系数

19、。其中, x1(k)、x2(k)、x3(k)的表达式如下所示。状态转换器Ku被控对象z -1 为保证单神经元自适应PID控制算法的收敛性与鲁棒性,对输出进行规范化处理后,有 这样,单神经元自适应PID控制算法可以表示为 由以上算法可见,单神经元自适应PID控制器本质上仍是PID算法,但3个系数w1(KI),w2(KP),w3(KD)均可以在线加以调整,因此具有较强的自学习和自适应能力,以适应环境变化和模型的不确定性,增强系统的鲁棒性。其中 根据有监督Hebb学习算法,神经元三个权值的调整算法如下: 神经网络学习控制 神经网络学习控制系统将神经网络与常规误差反馈控制结合起来,首先用NN学习对象的逆动力学模型,然后用NN作为前馈控制器与误差反馈控制器构成复合控制器来控制对象。系统以反馈控制器的输出作为评价函数来调节神经网络的权值。这样,在控制之初,反馈控制器的作用较强,而随着控制过程的进行,NN得到越来越多的学习,反馈控制器的作用越来越弱,NN控制器的作用越来越强。 问题描述: 利用摄像机观测目标小球与机器人末端手爪之间的相对位置

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论