智能控制技术(第6章-神经网络控制)课件_第1页
智能控制技术(第6章-神经网络控制)课件_第2页
智能控制技术(第6章-神经网络控制)课件_第3页
智能控制技术(第6章-神经网络控制)课件_第4页
智能控制技术(第6章-神经网络控制)课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、神经网络控制2神经网络辨识基础 所谓系统辨识,就是根据系统的输入和输出数据,在指定的一类系统中选择一个系统,这个系统和所研究的实际系统等价。6.2 神经网络辨识由于实际上不可能找到一个与实际系统完全等价的模型。因此,从实用角度看,辨识就是从一组模型中选择一个模型,按照某种准则,使之能最好的拟合所关心的实际系统动态或静态特性。36.3 神经网络辨识神经网络对非线性函数具有任意逼近和自学习能力,为系统的辨识,尤其是非线性动态系统的辨识提供了一条十分有效的途径。 神经网络系统辨识实质上是从神经网络模型中选择一个适当的模型来逼近实际系统的数学模型。 神经网络系统通过直接学习输入输出数据,使所要求的误差

2、函数达到最小,来归纳出隐含在系统的输入输出数据中的关系。46.3 神经网络辨识逼近理论是一种经典的数学方法。多项式函数和其它逼近方法都可以逼近任意的非线性函数。但由于其学习能力和并行处理能力不及神经网络,从而使得神经网络的逼近理论研究得到迅速发展。 56.3 神经网络辨识神经网络系统辨识的原理 在神经网络系统辨识中,神经网络用作辨识模型,将对象的输入输出状态u、y看作神经网络的训练样本数据,以J=e2/2作为网络训练的目标,则通过用一定的训练算法来训练网络,使J足够小,就可以达到辨识对象模型的目的。 系统辨识的原理系统辨识的原理:给对象和辨识模型施加相同的输入,得到对象的输出y和模型的输出 ,

3、通过调整辨识模型的结构来使对象的输出y和模型的输出 之间的误差最小。 76.3 神经网络辨识输入信号的选择 为了能够精确有效的对未知系统进行辨识,输入信号必须满足一定的条件。从时域上来看,要求系统的动态过程在辨识时间内必须被输入信号持续激励,即输入信号必须充分激励系统的所有模态;从频域来看,要求输入信号的频谱必须足以覆盖系统的频谱。通常在神经网络辨识中可选用白噪声或伪随机信号作为系统的输入信号。对于实际运行系统而言,选择测试信号需考虑对系统安全运行的影响。86.3 神经网络辨识3. 误差准则的选择 误差准则是用来衡量模型接近实际系统的标准。它通常表示为一个误差的泛函,记作其中 是误差适量e(k

4、)的函数,用得最多的是平方函数,即这里的误差e(k)是广义误差,即既可以表示输出误差又可以表示输入误差甚至是两种误差函数的合成。6.3 神经网络自适应控制 构造一个参考模型,使其输出为期望输出,控制的目的是使y跟踪r。神经网络自适应控制构造一个参考模型,使其输出为期望输出,控制的目的,是使y跟踪r。对象特性非线性、不确定、不确知时采用。 神经网络自适应控制3.4.1 基于BP神经网络控制参数自学习PID控制 BP神经网络具有逼近任意非线性函数的能力,而且结构和学习算法简单明确。通过神经网络自身的学习,可以找到某一最优控制律下的P,I,D参数。基于BP神经网络的PD控制系统结构如图所示,控制器由

5、两个部分组成:经典的PID控制器:直接对被控对象进行闭环控制,并且KP,KI,KD三个参数为在线整定;神经网络NN:根据系统的运行状态,调节PID控制器的参数,以期达到某种性能指标的最优化。即使输出层神经元的输出状态对应于PID控制器的三个可调参数KP,KI,KD,通过神经网络的自学习、调整权系数,从而使其稳定状态对应于某种最优控制律下的PID控制器参数。3.4.2 改进型BP神经网络控制参数自学习PID控制将神经网络用于控制器的设计或直接学习计算控制器的输出(控制量),一般都要用到系统的预测输出值或其变化量来计算权系数的修正量。但实际上,系统的预测输出值是不易直接测得的,通常的做法是建立被控

6、对象的预测数学模型,用该模型所计算的预测输出来取代预测处的实测值,以提高控制效果。1采用线性预测模型的BP神经网络PID控制器 采用线性预测模型的BP神经网络PID控制系统算法归纳如下: 1). 事先选定BP神经网络NN的结构,即选定输入层节点数M和隐含层节点数Q,并给出权系数的初值w(2)ij(0), w(3)li(0),选定学习速率和平滑因子,k=1; 2). 用线性系统辨识法估计出参数矢量(k),从而形成一步预报模型式; 3). 采样得到r(k)和y(k),计算e(k)=z(k)=r(k)-y(k); 4). 对r(i),y(i),u(i-1),e(i)进行归一化处理,作为NN的输入;

7、5). 前向计算NN的各层神经元的输入和输出,NN输出层的输出即为PID控制器的三个可调参数KP(k),KI(k),KD(k); 6). 计算PID控制器的控制输出u(k),参与控制和计算; 7).计算 和 ; 8). 计算修正输出层的权系数w(3)li(k); 9). 计算修正隐含层的权系数w(2)ij(k); 10). 置k=k+1,返回到“2)”。 2采用非线性预测模型的BP神经网络PID控制器基于BP神经网络的PID控制算法可归纳如下: 1). 事先选定BP神经网络NN的结构,即选定输入层节点数M和隐含层节点数Q,并给出权系数的初值w(2)ij(0), w(3)li(0),选定学习速率

8、和平滑因子,k=1; 2). 采样得到r(k)和y(k),计算e(k)=z(k)=r(k)-y(k); 3). 对r(i),y(i),u(i-1),e(i)进行归一化处理,作为NN的输入; 4). 前向计算NN的各层神经元的输入和输出,NN输出层的输出即为PID控制器的三个可调参数KP(k),KI(k),KD(k); 5). 计算PID控制器的控制输出u(k),参与控制和计算; 6).前向计算NNM的各层神经元的输入和输出,NNM的输出为 ,计算修正隐含层和输出层的权系数; 7).计算 ; 8). 计算修正输出层的权系数w(3)li(k); 9). 计算修正隐含层的权系数w(2)ij(k);

9、10). 置k=k+1,返回到“2)”。单神经元自适应控制系统结构系统对象:仿真示例系统输入:MATLAB程序%Single Neural Adaptive Controllerclear all;close all;x=0,0,0;xiteP=0.40;xiteI=0.35;xiteD=0.40;%Adjusting Weight Value by hebb learning algorithmM=4;if M=1 %No Supervised Heb learning algorithm wkp(k)=wkp_1+xiteP*u_1*x(1); %P wki(k)=wki_1+xiteI*

10、u_1*x(2); %I wkd(k)=wkd_1+xiteD*u_1*x(3); %D K=0.06; elseif M=2 %Supervised Delta learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1; %P wki(k)=wki_1+xiteI*error(k)*u_1; %I wkd(k)=wkd_1+xiteD*error(k)*u_1; %DK=0.12; elseif M=3 %Supervised Heb learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1*x(1);

11、%P wki(k)=wki_1+xiteI*error(k)*u_1*x(2); %I wkd(k)=wkd_1+xiteD*error(k)*u_1*x(3); %D K=0.12; elseif M=4 %Improved Heb learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1*(2*error(k)-error_1); wki(k)=wki_1+xiteI*error(k)*u_1*(2*error(k)-error_1); wkd(k)=wkd_1+xiteD*error(k)*u_1*(2*error(k)-error_1); K

12、=0.12; endx(1)=error(k)-error_1; %P x(2)=error(k); %I x(3)=error(k)-2*error_1+error_2; %D wadd(k)=abs(wkp(k)+abs(wki(k)+abs(wkd(k); w11(k)=wkp(k)/wadd(k); w22(k)=wki(k)/wadd(k); w33(k)=wkd(k)/wadd(k); w=w11(k),w22(k),w33(k);u(k)=u_1+K*w*x; %Control lawif u(k)10 u(k)=10; endif u(k)-10 u(k)=-10;enderr

13、or_2=error_1;error_1=error(k); u_3=u_2;u_2=u_1;u_1=u(k);y_3=y_2;y_2=y_1;y_1=yout(k); wkp_1=wkp(k);wkd_1=wkd(k);wki_1=wki(k);endfigure(1);plot(time,rin,b,time,yout,r);xlabel(time(s);ylabel(rin,yout);figure(2);plot(time,error,r);xlabel(time(s);ylabel(error);figure(3);plot(time,u,r);xlabel(time(s);ylabel(u);假设系统第k + 1 个采样时刻的期望输出值为d k+ 1, 则变学习因子自适应神经网络控制系统考虑到实际系统的制约, 对控制量u 加了限幅处理, N 1 为一BP 网络, g 为比例环节。如果f 对u 为非线性的, 则g 亦为BP 网络。学习算法为了对网络权值进行在线学习, 取输出偏差并定义学习误差式中 为网络输出的对象输出预测值, yk+ 1 为对象实际输出值。则于是由梯度法得到权值调整规则为如果P 含有纯滞后为T d = L T 的滞后环节时, 相应的权值调整规则为在实际应用中, 可以先估计一个滞后时间。运行时,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论