




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西安电子科技大学智能控制读书报告学 院 机电工程学院 姓 名 学 号 课题分组 智能控制读书报告机电工程学院 概述通过本学期对智能控制理论尤其是专家控制的学习,让我接触并了解了一个新的领域。智能控制作为当今多学科交叉的前沿领域之一,是应用人工智能的理论与技术和运筹学的优化方法,并将其同控制理论方法与技术相结合,在未知环境下,仿效人的智能,实现对系统的控制。1985年IEEE在美国纽约召开了第一届智能控制研讨会,随后成立了IEEE智能控制专业委员会。1987年在美国举行第一届国际智能控制大会,标志着智能控制领域的形成。20世纪90年底至今,智能控制进入了新的发展时期,随着对象规模的扩大以人工智能技术、信息论、系统论和控制论的发展,人们试从高层次研究智能控制,这不仅形成了智能控制的多元化,而且在应用实践方面取得了重大进展。我国智能控制也兴起于这一时期。纵观智能控制产生、发展的历史背景与现状,其研究中心始终是解决传统控制理论、方法(包括古典控制、现代控制、自适应控制、鲁棒控制、大系统方法等)所难以解决的不确定性问题。控制学科所面临的控制对象的复杂性、环境的复杂性、控制目标的复杂性愈益突出,智能控制的研究提供了解决这类问题的有效手段,集中表现在控制工程中运用智能方法解决复杂系统的控制已取得了相当多的成功。智能控制通常被理解为智能化的自动控制系统,其研究的主流在自动控制界,将人工智能看作自动控制的技术服务学科,运用已有的人工智能方法、技术解决自动控制系统的部分问题;基于工程控制的观念,把智能控制系统理解为高度自治的自动控制系统;在智能控制方法上,运用已有控制算法作低层次的组合;智能控制已不是一个学科所能独自完成得了的,应结合多种学科知识来解决复杂系统的控制问题,这一点已得到专家的共识。基于这种认识,人们将各种学科大胆地应用于控制中引出了许多新理论和新方法。随着信息技术的发展,许多新方法和技术进入工程化、产品化阶段,这对自动控制技术提出更新的挑战,促进了智能理论在控制技术中的应用,以解决用传统的方法难以解决的复杂系统的控制问题。当前国际最新智能控制主要方法有: 模糊控制;神经网络控制;专家控制;分层递阶控制;学习控制等。在本篇读书报告中,我主要从控制方法方面依次介绍了专家控制,模糊控制,神经网络控制,学习控制,分层递阶控制,并着重介绍了自己所选的课题专家控制。在内容上,我主要是介绍了五种控制的概述,核心思想方法,以及自己的心得体会和个人总结。一 专家控制1概述专家控制(Expert Control)是智能控制的一个重要分支,又称专家智能控制。所谓专家控制,是将专家系统的理论和技术同控制理论、方法与技术相结合,在未知环境下,仿效专家的经验,实现对系统的控制。由人工智能领域发展起来的专家控制是一种基于知识的智能计算机程序的技术,专家控制的实质是基于控制对象和控制规律的各种知识,并且要以智能的方式利用这些知识,以求得控制系统尽可能的优化和实用化。一般的专家控制系统由三部分组成,一是控制机制,它决定控制过程的策略,即控制哪一个规则被激活以及什么时候被激活等。二是推理机制,它实现知识之间的逻辑推理以及知识库的匹配。三是知识库,包括事实、判断、规则、经验以及数学模型。传统的控制系统的设计和分析是建立在精确的系统的数学模型基础上的,而实际系统由于存在复杂性、时变性、不确定性或不完全性等非线性,一般难以获得精确的数学模型。过去在研究这些系统时,必须提出并遵循一些比较苛刻的假设条件,而这些假设在应用中又往往与实际不相符合。为了提高控制性能,传统控制系统可能变得很复杂,不仅增加设备投资,而且会降低系统的可靠性。因此,自动控制的出路就在于实现控制系统的智能化,或者采用传统的和智能的混合控制方式。自1965年费根鲍姆等人研制成功第一个专家系统DENLDRA以来,专家系统获得了飞速的发展,并且运用于包括化学、数学、物理、生物、医学、农业、气象、地质勘探、军事、工程技术、法律、商业、空间技术、自动控制、计算机设计和制造等众多领域,产生了巨大的经济效益和社会效益。现在,专家系统已成为人工智能领域中最活跃、最受重视的领域。2工作原理2.1 专家系统的基本结构专家系统由知识库(Knowledge Base)、推理机(Inference Engine)、综合数据库(Global Database)、解释接口(Explanation Interface)和知识获取(Knowledge Acquisition)等五部分组成。如下图1所示,图1. 专家系统的基本组成专家系统中的知识的组织方式是,把问题领域的知识和系统的其他知识分离开来,后者是关于如何解决问题的一般知识或如何与用户打交道的知识。领域知识的集合称为知识库,而通用的问题求解知识称为推理机。按照这种方式组织知识的程序称为基于知识的系统,专家系统是基于知识的系统。知识库和推理机是专家系统中两个主要的组成要素。知识库是知识的存储器,用于存储领域专家的经验性知识以及有关的事实、一般常识等。知识库中的知识来源于知识获取机构,同时它又为推理机提供求解问题所需的知识。推理机是专家系统的“思维”机构,实际上是求解问题的计算机软件系统。推理机的运行可以有不同的控制策略。解释接口又称人-机界面,它把用户输人的信息转换成系统内规范化的表示形式,然后交给相应模块去处理,把系统输出的信息转换成用户易于理解的外部表示形式显示给用户,回答用户提出的问题。综合数据库又称为“黑板”或“数据库”。它是用于存放推理的初始证据、中间结果以及最终结果等的工作存储器(Working Memory)。综合数据库的内容是在不断变化的。在求解问题的初始,它存放的是用户提供的初始证据。解释接口又称人机界面,它把用户输入的信息转换成系统内规范化的表示形式,然后交给相应模块去处理,把系统输出的信息转换为用户易于理解的外部表示形式显示给用户。2.2 专家控制系统的工作原理专家控制系统有知识基系统、数值算法库和人机接口三个并发运行的子过程。三个运行子过程之间的通信是通过五个信箱进行的,这五个信箱即出口信箱(Outbox)、人口信箱(In box)、应答信箱(Answer box)、解释信箱(Result box)和定时器信箱(Timer box)。如下图2为一个专家控制系统的典型结构图。图2 专家控制系统的典型结构图系统的控制器由位于下层的数值算法库和位于上层的知识基子系统两大部分组成。数值算法库包含的是定量的解析知识,进行数值计算,快速、精确,由控制、辨识和监控三类算法组成,按常规编程直接作用于受控过程,拥有最高的优先权。控制算法根据来自知识基系统的配置命令和测量信号计算控制信号,例如PID算法、极点配置算法、最小方差算法、离散滤波器算法等,每次运行一种控制算法。当基于知识的控制器直接影响被控对象时,这种控制叫做直接专家控制。如图3所示。图3 直接专家控制系统专家系统间接地对控制信号起作用,或者说,当基于知识的控制器仅仅间接影响控制系统时(譬如监督控制系统,调节关键结构参数;又如为了避免控制回路的突发效应切断参数估计过程等),我们把这种专家控制称为间接专家控制系统,或监控专家控制。如图4所示。图4 间接专家控制系统专家控制虽然引用了专家系统的思想和方法,但它与一般的专家系统还有重要的差别:1. 通常的专家系统只完成专门领域问题的咨询功能,它的推理结果一般用于辅助用户的决策;而专家控制则要求能对控制动作进行独立的、自动的决策,它的功能一定要具有连续的可靠性和较强的抗扰性。2. 通常的专家系统一般处于离线工作方式,而专家控制则要求在线地获取动态反馈信息,因而是一种动态系统,它应具有使用的灵活性和实时性,即能联机完成控制。3个人总结本学期的课题分组,我选择了专家控制小组,在对整个智能控制内容学习的基础之上,又着重对自己所选的专家控制进行了重点地研习,翻看了很多教材来了解专家控制的基本内容,并查阅了很多相关文献以追踪专家控制的前沿发展概况,了解到国内外相关领域的学者所做的一些工作。作为一个六人小团队,我们在课堂上所做的报告在内容上各有分工,我主要是对知识库中知识表示方法在课堂上作了自己的报告。在对知识表示方法作进一步深入学习的时候,自己还有一个很大的收获,我了解到在知识表示方法中有一种Petri网知识表示法,而petri网正是自己的研究生的专业方向,正是通过对专家控制的相关学习,我找到了petri和专家控制的知识表示两个不同学科之间的契合点,这也极大的引起了我的兴趣,而且通过查阅文献,我了解到国内的一些好多学者都在做petri网知识表示方法的相关研究,这为我自己今后的学习提供了一个很好的方向。下面我简单介绍一些自己所做报告的核心内容。知识库是专家系统的核心组成部分,用于存取和管理问题求解所需的专家知识和经验。一个专家系统的能力很大程度上取决于其知识库中所含知识的数量和质量。知识库的建立包括知识的获取和知识的表示,知识获取要解决的问题是如何从专家那里获得专门知识;而知识表示就是要将专家的知识和经验表达成计算机能理解的形式。知识表示的方法有很多种:状态空间法,问题归约法,谓词逻辑法,语义网络法,Petri网表示法,面向对象表示法,过程表示法,框架表示法等等。问题归约法:已知问题的描述,通过一系列变换把这个问题最终变为一个子问题集合,这些子问题的解可以直接得到,从而解决初试问题。为了证明如何使用问题归约法求解问题我们引入一个例子“梵塔难题”。如图5所示,图5 梵塔难题然后,我们引入这样的一种更容易被计算机所存储和处理的结构:所有问题归约的目的是最终产生具有明显解答的本原问题。这些问题可以由状态空间搜索中走动一步就能解决的问题,对终止搜索过程起着明显的作用。Petri网作为一种高效的建模和分析工具,近年来得到了快速的发展,但是Petri网作为一种纯理论工具,并不能适合所有领域的应用需求。所以,针对不同领域的研究对象,很多学者提出了各种各样改进的Petri网理论,如近年来得到普遍应用的随机Petri网、有色Petri网以及多值Petri网等,模糊Petri网作为Petri网的一个重要分支,也越来越多地引起了人们的兴趣。特别是应用在人类知识的表示和人工智能中非常合适,在这一方面,已有许多学者进行了研究。从整个专家控制领域看,遗憾的是,目前在国内化工应用的专家控制系统基本停留于理论研究阶段,还未产业化。二 模糊逻辑控制1概述模糊控制是以模糊集合论、模糊语言变量及模糊逻辑为基础的计算机智能控制。模糊控制从其诞生至今也不过30年的时间,1974年马达尼(Maindani)教授在他的博士论文中首次论述了如何将模糊逻辑应用于过程控制,从而开创了模糊控制的先河。在这之后的30年间的发展中,模糊控制在理论和应用研究方面均取得了重大的成功。传统的控制方法在执行控制时,往往需要取得对象的数学模型,比如PID控制。但是一些学者发现人类在处理复杂对象的过程,并不是首先建立被控对象的数学模型,然后根据这一模型去精确地计算出系统所需要的控制量,而是完全在模糊概念的基础上利用模糊的量完成对系统的合理控制。人们正是因为从中得到了启示,最终导致了模糊控制的诞生。可以看到,经验和知识将扮演重要的角色,通过对经验和知识进行推理进而产生相应的控制策略。模糊控制从1974年到现在,模糊控制的发展经历了两个阶段,即简单模糊控制阶段和自我完善模糊控制阶段。简单模糊控制阶段指在计算机系统上把控制器上的推理过程处理成控制表,这种模糊控制器结构简单但不灵活,自适应能力和鲁棒性有限,控制精度不高;自我完善模糊控制阶段指具有参数自调整、自组织和自学习功能的模糊控制器,这样使模糊控制系统的性能得到了很大的提高。20世纪80年代末,日本首先将模糊控制技术应用于家用电器领域,之后相继推出了模糊洗衣机、电冰箱、空调器、电饭锅等,显示了模糊控制强大的生命力。2基本原理模糊控制是利用模糊数学的基本思想和理论的控制方法。在传统的控制领域里,控制系统动态模式的精确与否是影响控制优劣的最主要关键,系统动态的信息越详细,则越能达到精确控制的目的。然而,对于复杂的系统,由于变量太多,往往难以正确的描述系统的动态,于是工程师便利用各种方法来简化系统动态,以达成控制的目的,但却不尽理想。换言之,传统的控制理论对于明确系统有强而有力的控制能力,但对于过于复杂或难以精确描述的系统,则显得无能为力了。因此便尝试着以模糊数学来处理这些控制问题。一般的模糊控制系统包含以下五个主要部分:(1) 定义变量:也就是决定程序被观察的状况及考虑控制的动作,例如在一般控制问题上,输入变量有输出误差e与输出误差之变化率ec,而控制变量则为下一个状态之输入u。其中e、ec、u统称为模糊变量。(2) 模糊化(Fuzzify):将输入值以适当的比例转换到论域的数值,利用口语化变量来描述测量物理量的过程,依适合的语言值(Linguistic value)求该值相对之隶属度,此口语化变量我们称之为模糊子集合(fuzzy subsets)。(3) 知识库:包括数据库(data base)与规则库(rule base)两部分,其中数据库是提供处理模糊数据之相关定义;而规则库则藉由一群语言控制规则描述控制目标和策略。(4) 逻辑判断:模仿人类下判断时的模糊概念,运用模糊逻辑和模糊推论法进行推论,而得到模糊控制讯号。此部分是模糊控制器的精髓所在。(5) 解模糊化(defuzzify):将推论所得到的模糊值转换为明确的控制讯号,作为系统的输入值。2.1 模糊控制器 带有模糊控制器的控制系统结构原理图,如下图1所示。图1 带有模糊控制器的控制系统结构原理图2.2 模糊控制器的研究模糊控制器一般采用反馈控制结构,从结构上分析,常见模糊控制器一般可分为二维、三维模糊控制器。类似于PID控制器,二维模糊控制器一般也称PD或PI型模糊控制器,三维模糊控制器称为PID型模糊控制器。(1)基于模糊自适应PID控制器的设计以模糊PID控制器为例,PID控制具有结构简单、稳定性能好、可靠性高等优点,尤其适用于可建立精确数学模型的确定性控制系统。但是在实际的应用中,大多数工业过程都不同程度地存在非线性、参数时变性和模型不确定性,因而一般的PID控制无法实现对这样过程的精确控制。模糊控制对数学模型的依赖性弱,不需要建立过程的精确数学模型。模糊自适应PID控制器比常规PID控制器明显地改善了控制系统的动态性能,抗干扰能力更强,且易于实现,便于工程应用。(2)模糊自适应PID控制器的原理模糊自适应PID控制器是应用模糊数学的基本理论和方法,把规则的条件、操作等用模糊集表示,并把这些模糊控制规则及有关信息作为知识存进计算机的知识库中,然后计算机根据控制系统的实际响应情况运用模糊推理,即可自动实现对PID参数的调整,这就是模糊自适应PID控制。(3)模糊自适应PID控制器的结构在实际应用中,一般是以误差e和误差的变化率de/dt(ec)作为控制器的输入,可以满足不同时刻的e和ec对PID参数自整定的要求。利用模糊控制规则在对PID参数进行修改,便构成了自适应模糊PID控制器,结构图如图1所示:图1 自适应调整模糊控制器结构图2.2 隶属函数的确定方法隶属函数的确定,应该是反映出客观模糊现象的具体特点,要符合客观规律,而不是主观臆想的。但是,一方面由于模糊现象本身存在着差异,而另一方面,由于每个人在专家知识、实践经验、判断能力等方面各有所长,即使对于同一模糊概念的认定和理解,也会具有差别性,因此,隶属函数的确定又是带有一定的主观性,仅多少差异。正因为概念上的模糊性,对于同一个模糊概念,不同的人会使用不同的确定隶属函数的方法,建立不完全相同的隶属函数,但所得到的处理模糊信息问题的本质结果应该是相同的。目前常用确定隶属函数的方法如模糊统计法:其基本思想是对论域E上的一个确定元素是否属于论域上的一0e个可变动的清晰集合,做出确切的判断。3个人总结对模糊控制的学习,从中我了解了模糊数学的基本思想,作为一种研究和处理模糊性现象的一种数学理论和方法,它以不确定的物理事物为研究对象,更加接近工程实用,相比于其他几种控制方法,现阶段在工程上模糊控制得到了更好的应用,模糊控制作为智能控制领域最具有实际意义的一种方法,已经在工业控制领域,家用电器自动化领域和其他很多行业中解决了传统控制方法无法或者难以解决的问题,取得了令人瞩目的成果。但是,虽然模糊控制的理论和应用取得了很大的进展,但是就目前的状况来看,尚缺乏重大的突破,因此模糊控制无论在理论和应用上都有待于进一步的深入研究和探讨。三 神经网络控制1概述神经网络(简称神经网络,Neural Network)是模拟人脑思维方式的数学模型。神经网络是在现代生物学研究人脑组织成果的基础上提出的,用来模拟人类大脑神经网络的结构和行为,它从微观结构和功能上对人脑进行抽象和简化,是模拟人类智能的一条重要途径,反映了人脑功能的若干基本特征,如并行信息处理、学习、联想、模式分类、记忆等。人工神经网络本身各简单结点没有显在的物理意义,但综合网络可描述复杂和非线性系统的控制和辨识问题,而且能做到并行实时、冗余容错的运算。它有如下特点:能充分逼近任意非线性特性;分布式并行处理机制;自学习和自适应能力;数据融合能力;适合于多变量系统;多变量处理;以及可硬件实现。这些特点使神经网络成为非线性系统建模与控制的一种重要方法,因此神经网络成为实现非线性预测控制的关键技术之一。神经网络最早的研究是1943年心理学家McCulloch和数学家Pitts合作提出的,他们提出的MP模型拉开了神经网络研究的序幕。神经网络的发展大致经历了三个发展阶段:1946-1969为初期,在此期间的主要工作包括Hebb(1949)The Organization of Behavior一书中提出的Hebb学习规则,他的基本思想是:大脑在器官接受不同的任务刺激时,大脑的突触在不断的进行变化,这些不停的变化导致了大脑的自组织形成细胞集合,循环的神经冲动会自我强化。Hebb在文中给出了突出调节模型,描述了分布记忆,即后来的关联论(connectionist);这个阶段另一个重要的工作为Rosenblatt基于MP模型,增加了学习机制,推广了MP模型研制了感知机。Rosenblatt感知机器的工作激发了许多的学者对神经网络研究的极大兴趣,美国上百家有影响的实验室纷纷投入到这个领域。1969年Minsky和Papert指出感知机的缺陷并表示出对该方法研究的悲观态度,同时由于专家系统方法展示出的强大活力,使得神经网络在很长时间内处于一个发展的低潮。第二阶段即为1970-1986期间的发展低潮阶段,在此期间科学家们做出了大量的工作,如Hopfield对网络引入能量函数的概念,给出了网络的稳定性判据,提出了用于联想记忆和优化计算的途径。1981-1984年Kohonen提出自组织映射网络模型。1986年Rumelhart等人提出误差反向传播神经网络,简称BP网络。目前BP网络已经得到广泛应用。1987年至今为发展期,在此期间,神经网络得到了国际重视,许多国家都展开研究,形成神经网络发展的另一个高潮。2基本原理2.1 神经元模型人工神经元是神经网络的基本处理单元。它是对生物神经元的简化和模拟。图2给出了一种简化的神经元结构。如下图1所示。P1P2PnW1W2Wna f图1 神经元结构从图中可见,它是一个多输入、单输出的非线性元件,其输入/输出关系可描述为 其中是从其它细胞传来的输入信号,为阈值,权系数表示连接的强度,说明突触的负载。称为激发函数或作用函数,其非线性特征可用阈值型、分段线性型和连续激发函数近似。2.2 神经网络学习方法神经网络学习方法有多种,网络的学习规则可以分为三类:相关规则,即仅仅根据连接间的激活水平改变权值;纠错规则,即依赖关于输出节点的外部反馈来改变权系数;无教师学习规则,即学习表现为自适应于输入空间的检测规则。(1)Hebb学习方法Hebb规则是最早的神经网络学习规则之一,是一种联想式学习方法,由Donald Hebb在1949年作为大脑的一种神经元突触调整的可能机制而提出,从那以后Hebb规则就一直用于人工神经网络的训练。这一学习规则可归纳为“当某一突触连接两端的神经元同时处于激活状态(或同为抑制)时,该连接的强度应增加,反之应减弱”。Hebb学习规则是一种无教师的学习方法,它只根据神经元连接间的激活水平改变权值,因此这种方法又称为相关学习或并联学习。Hebb学习规则是一切神经网络学习规则的基础,可以说,以后所有的学习规则都是基于Hebb规则的变形。(2)多层前向网络单层前向网示意图: 输入层 输出层双层前向网不含反馈的人工神经网络: 输入层(X) 隐层(Z) 输出层(Y) x1 y1 x2 y2 xd yc (d个) W(1) (M个) W(2) (c个)典型的多层前向网络包括BP(Back Propagation)网络和RBF(Radial Basis Function)网络。下面简单介绍一下BP网络。BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,它是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer),如图2所示。图2 BP神经网络结构示意图BP神经网络的算法由工作信号的正向传播和误差信号的反向传播两个阶段组成。正向传播时,工作信号由输入层输入,经隐含层处理后再从输出层输出。在正向传播阶段,网络的权值和阈值是固定不变的,每一层神经元的状态只影响下一层神经元的状态。若输出层得不到期望输出,则转向反向传播,在反向传播阶段,误差信号沿误差函数负梯度方向不断地修正各层的权值和阈值,使得误差信号最终达到输出精度要求,从而实现输入和输出的非线性映射。BP网络是将W-H学习规则一般化,对非线性可微分函数进行权值训练的多层网络,权值的调整采用反向传播(Back-propagation)的学习算法,它是一种多层前向反馈神经网络,其神经元的变换函数是S型函数,输出量为0到1之间的连续量,它可实现从输入到输出的任意的非线性映射。但是BP网络拓扑结构的设计没有确定的规则,即网络隐层数、每层隐节点个数及其激活函数的选取,在理论上没有一个明确的规定;BP算法的收敛速度慢,且收敛速度和初始权值的选择有关;由于是非线性优化,不可避免的存在局部极小问题。3个人总结从开始的对人工神经网络的初步了解到最后模型的建立,我对人工神经网络的认识不断加深。神经网络作为自动控制及智能控制专业的一个重要分支,有其独特的控制方法,而在整个神经网络控制算法中,我重点学习了Hebb学习方法和多层前向网络中的BP(Back Propagation)网络。而我自己的研究方向petri网虽然有很强的模糊推理能力,但它也有相应的弊端和缺点,例如,Petri网在柔性制造系统故障诊断中缺乏较强的自学习能力,难以精确描述故障发生的不确定性,Petri网与神经网络相结,建立故障诊断的模糊神经网络Petri网模型,提高了故障诊断系统的精度。现在国内一些相关学者在做相关方面的工作,并且已经在故障诊断过程中得到了应用。此外,通过这段时间的学习中,让我学到神经网络很多的算法规则和思想,这也将在我以后的学习中可以拿来借鉴。神经网络的应用已经涉及各个领域,并且在智能控制、模式识别、信号处理、连续语音识别、图像处理、生物医学工程等方面均取得了实质性的进展。我希望再经过一段时间的发展,神经网络控制技术还可以在控制速度和精度上更加接近于人脑,届时神经网络应用将会给人们进步带来新的变革。四 学习控制1概述学习控制是智能控制的一个重要分支。K.S.Fu把学习控制和智能控制相提并论,从发展学习控制的角度首先提出智能控制的概念。他推崇在控制问题中引入拟人的自学习功能,研究各种机器系统可以实现的学习机制。学习控制与自适应控制一样,是传统控制技术发展的高级形态。它能够按照运行过程中的“经验”和“教训”来不断改进算法,增长知识,以便更广泛地模拟高级推理、决策和识别等人类的优良行为和功能。自适应控制的应用范围比较有限。当受控对象的运动具有可重复性时,即受控制系统每次进行同样的工作时,就可把学习控制用于该对象。学习控制已成为智能控制的一个重要领域。学习与掌握学习控制的基本原理和技术能够明显增强控制工程师处理实际控制问题的能力,并提供对含有不确定性现实世界的敏锐理解。2. 基本方法2.1 学习控制具有四个主要功能:搜索、识别、记忆和推理。学习控制系统分两类,即在线学习控制系统和离线学习控制系统,分别如图1和图2所示。图1 在线学习控制系统图2 离线学习控制系统2.2 学习控制方案自20世纪70年代初以来,研究者已经提出各种各样的学习控制方案。学习控制的主要方案如下:基于模式识别的学习控制,迭代学习控制,重复学习控制,连接主义学习控制,基于规则的学习控制,拟人自学习控制,状态学习控制。(一) 迭代学习控制1978年,日本学者Uchiyama提出一个控制高速运动机械手的思想,后来Arimoto等人发展了Uchiyama的思想,于1984年提出了迭代学习控制(Iterative Learning Control,ILC)的概念。迭代学习控制最早是在工业机器人的快速跟踪控制的研究中提出的,这种控制方法适合于某种具有重复运动性质的被控对象,利用系统先前的控制经验和输出误差来修正当前的控制作用,使系统输出尽可能收敛于期望值。与鲁捧控制一样,ILC也能处理实际动力学系统中的不确定性,但它能实现完全跟踪,控制器形式更为简单且需要较少的先验知识。ILC经历了二十年的发展,不仅在实际应用中取得了良好效果,而且ILC的理论与方法不断地完善,取得了丰硕成果,其强大的生命力受到控制界的极大关注,已经成为智能控制的一个方向。如图3所示为迭代学习控制原理框图迭代学习控制是一种学习控制策略,它通过迭代应用先前试验得到的信息(而不是系统参数模型),以获得能够产生期望输出轨迹的控制输入,改善控制质量。迭代学习控制的任务如下:给出系统的当前输入和当前输出,确定下一个期望输入使得系统的实际输出收敛于期望值。(二)基于模式识别的学习控制基于模式识别的学习控制方法的基本思想是,针对先验知识不完全的对象和环境,将控制局势进行分类,确定这种分类的决策,根据不同的决策切换控制作用的选择,通过对控制器性能估计来引导学习过程,从而是系统总的性能得到改善。该控制器中含有一个模式(特征)识别单元和一个学习(学习与适应)单元。模式识别单元实现对输入信息的提取与处理,提供控制决策和学习与适应的依据;学习与适应单元的作用是根据在线信息来增加和修改知识库的内容,改善系统的性能。如图4所示为基于模式识别的学习控制。图4 基于模式识别的学习控制2.3 学习控制系统举例用于弧焊过程的自学习模糊神经控制系统,其自学习模糊神经控制模型如图5所示。图5 自学习模糊神经控制系统原理图3个人总结由于迭代学习控制方法产生不久,其基本理论还远未形成,学习控制要发展成为一种具有完整理论基础的控制方法,并且更好地应用于实际工程中,还需要人们投入相当的精力和时间,进行深入地研究。根据所查到的文献资料表明,学习控制理论研究的成果不仅零散,而且在研究中还存在着这样或那样的不足,主要表现在以下几个方面:学习控制不收敛,导致目标跟踪精度太差,学习控制算法不是全局而只是局部收敛,很大程度上依赖于初始输入信号,而这在实际工程应用中是很难把握的。此外,在学习控制过程中,都要求每次学习过程要经过相同的初始状态,而在有些实际工程的运用中,每次都会存在一定的误差,不可能完全一样。就目前而言,学习控制方法一般都要求在学习控制的过程中,寻找“学习矩阵”。而这些“学习矩阵”要满足一些必要的收敛条件,在系统不满足目前的一般收敛条件的情况下能否利用这一方法,需要哪样的技术处理及新的改进措施。通过这段时间对学习控制的学习,我了解到学习控制已成为智能控制的一个重要领域,学习与掌握学习控制的基本原理和技术能够明显增强我们处理实际控制问题的能力,并提供对含有不确定性现实世界的敏锐理解。从目前的研究工作来看,学习控制研究已经发展成为智能控制的一个新的发展方向,我们相信,在不久的将来,学习控制研究将会成为最热门的研究课题之一,也将在实际工程中越来越被广泛地应用。五 分层递阶控制1概述分层递阶智能控制系统(Hierarchically Intelligent Control System)是在研究早期学习控制系统的基础上,并从工程控制论的角度总结人工智能与自适应、自学习和自组织控制的关系之后而逐渐形成的,是智能控制的最早理论之一。现有两种分级递阶控制理论:(1)基于知识/解析混合多层智能控制理论;(2)“精度递增伴随智能递减”的分层递阶智能控制理论。其中,应用最为广泛的是由萨里迪斯提出的基于3个控制层次和IPDI原理的三层递阶智能控制系统。该理论主要应用于解决大型复杂系统的控制问题,复杂系统的结构特点是:系统阶次高,其子系统相互关联,系统的滞价目标多但又有可能相互冲突、含有不确定性因素。2. 基本思想2.1.递阶系统的基本结构递阶智能控制系统由三个基本控制级构成,其级联交互结构如图1所示。图1 分层递阶控制系统结构(一)组织级:负责整个系统的推理、规划、决策、长期记忆、信息交流等,是智能最高的级别,主要进行的是基于知识的各种信息处理和决策。(二)协调级:由不同的协调器组成,每个协调器由微型计算机来实现。一旦由组织级产生和选择的最好任务序列(完备规划)被送到协调级,就提供了全部必要的细节,成功地执行了所选规划。在有可能达到最小时间性能指标的地方,执行并行任务。该结构在横向上能够通过分配器实现各协调器间的数据共享。(三)执行级:执行由协调级发出的指令。根据具体要求对每个控制问题进行分析。执行级由许多与专门协调器相联接的执行装置组成的。每个执行装置由协调器发出的指令进行访问。2.2 系统递阶结构描述递阶控制系统是指系统各子系统的控制作用是由按照一定优先级和从层关系安排的决策单元实现的。同级决策单元之间可平行工作(对下级实施作用),并受上级干预,各子系统可通过上级交换信息。其多层描述结构图(图1)如下:自组织 自适应 直接控制 最优化被控系统自动选择模型结构与控制,适应环境改变关于模型和控制规律的自适应确定控制器的设定值图1 多层控制结构将图1展开后形成多级多目标结构,如图2所示:即:当系统由若干可分且相互关联的子系统组成时,可将所有决策单元一定支配关系递阶排列,同一级各单元要受上一级的干预,同时又对下一级决策单元施加影响,同一级决策单元若有互相冲突的决策目标,由上一级决策单元加以协调,所以便于多级多目标结构,形成金字塔形,同级间不交换信息,上下级间交换信息,协调的最终目标是使全局达到优化或近似优化。从图中看出,所谓多层描述,实际是对一个复杂系统的决策问题纵向分解,按任务的复杂程度分成若干个子决策层(r层)。而多级描述则是考虑各自系统的关联,将决策问题进行横向分解(n级)。该控制系统的智能主要体现在高层上(即第一级)。在这一层遇到的问题大都有不确定性,所以需要采用基于知识的组织级,便于利用人的直觉推理逻辑和经验等知识,其工作过程可从两个方面来描述:从横向上看,把一个复杂系统分解成若干相互关联的子系统,单独配置控制器,便于直接控制,使复杂问题得以简化。从纵向上看,把控制整个复杂系统所需要的知识的多少(或所需的智能的程度)从高到低进行分解,形成多层次,图2 多级多目标结构2.3递阶控制的一般原理其基本原理是把一个总体问题P分解成有限数量的子问题Pi,P的目标应使复杂系统的总体准则取得极值。(1)是不考虑各子问题Pi之间的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东省威海市乳山市2024-2025学年初三年级下学期第二次月考试题含解析
- 山西省太原市名校2025年初三下学期5月四校联考英语试题试卷含答案
- 山东外贸职业学院《金文与摩崖隶书(秦汉书法史论)》2023-2024学年第二学期期末试卷
- 浙江省温州市环大罗山联盟2025年高三下学期期末质量检测试题历史试题含解析
- 江苏省溧水县重点名校2025年初三练习题二(全国卷)数学试题含解析
- 湛江市年模拟物理试题(二)
- 2025商品代理合作合同协议书样本
- 急性中毒抢救护理常规
- 2025美容院劳动合同模板
- 2025年工程保修合同范本
- 《形势与政策》 课件-端好能源的饭碗
- 【MOOC】传感技术及应用-哈尔滨工业大学 中国大学慕课MOOC答案
- 财务票据领取管理协议书
- 水土保持方案投标文件技术部分
- 幼儿园幼儿盥洗活动
- 企业环保知识培训课件
- 结核分枝杆菌(MTB)异质性耐药研究进展
- 车间安全隐患及预防措施
- 智慧粮库管理系统
- 地震应急防灾手册
- 《颅内压增高的临床表现》教学课件
评论
0/150
提交评论