




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学习控制智能控制1第六章Learning
control学习控制智能控制2Ch6学习控制的基本概念重复(学习)控制迭代学习控制6.16.26.36.4强化学习控制学习控制的基本概念智能控制36.1学习是指获取新知识、新技能等的过程。学习是获取知识的主要方式,也是提高智能水平的基本途径。将学习能力引入控制系统,运用控制理论的基本原理和方法分析和研究学习过程,便得到学习控制。1 学习控制的提出智能控制4在分析设计控制系统时,如果能够获得被控对象的精确模型且其先验知识是完全已知的,那么很多经典控制策略(包括频域设计方法、状态反馈控制、输出反馈控制、最优控制等)都可用于控制系统设计,并获得满意的控制性能;如果只能得到被控对象的统计性描述(如概率分布等)且其先验信息是局部或全局已知的,那么随机系统理论可用于控制系统设计。但是,在实际控制工程中,物理系统不可避免地受到各种未知外界环境影响,这些影响通常难以用模型精确描述,即其先验信息是未知的。因此,针对先验知识未知的情况,无法基于上述方法进行系统设计。1智能控制5学习控制的提出针对先验知识未知的情况,主要采取如下两种解决方案。解决方案1:通过直接忽略未知信息或基于未知信息猜测值进行系统设计。这是一种较为保守的控制方案,通常只能获得一般或次优的控制效果。解决方案2:
在物理系统运行过程中,对未知信息进行估计,基于估计信息并采
用优化控制方法进行系统设计。如果这种估计能逐渐逼近未知信息的真实情况,那么就可与先验信息完全已知的情况一下,得到满意的优化控制性能。这便是学习控制。1 学习控制的提出智能控制6学习控制的任务是在系统运行中估计未知不确定信息并基于这种估计的信息确定最优控制策略,从而逐步改进系统性能。学习控制通过自动获取知识、积累经验、不断更新和扩充知识以实现改善控制性能的目的。应当指出,学习控制所面临的系统特性在一定环境条件下是确定的,尽管事先并不清楚,但是随着过程的发展是可以弄清楚的。也就是说,不可知的信息无法学习,学习是对事先未知的规律性知识的学习。2 学习控制的定义及特点智能控制7虽然学习这一概念在日常生活中使用极其广泛,但目前对“学习”没有公认的统一定义。因学习的概念丰富而又难以界定,学习控制的研究目前也缺乏系统性的理论表述。《韦氏词典》对学习词条的一个释义是“基于经验对行为的修正”。学习控制是指通过各种技术或方法,在系统运行过程中能够学习环境和被控对象的各种未知不确定性信息,然后将学到的信息作为“经验”用于未来决策或控制以改进控制性能。2 学习控制的定义及特点智能控制8学习到的信息被视为控制器的“经验”,当类似的控制情况再次出现时,经验可用于改善控制质量。例如,从重复控制情况中提取的新信息用于更新与该控制情况相关的估计或经验。从不同控制情况中提取的信息中获得不同的经验。类似控制情况可以分组形成一类控制情况。一些学习控制器的主要功能还包括对不同类别控制情况进行分类,以便可以逐步为各类控制情况和可接受的控制动作建立最佳控制策略。2智能控制9学习控制的定义及特点学习控制通过对未知信息的估计而逐步改善控制性能或降低不确定性对系统控制性能的不利影响。从上述学习控制的概念来看,学习问题可以看作是函数未知量的估计或逐次逼近问题,该函数表征被控系统本身特性学习控制的特点①
有一定的自主性:能够自我改进性能②
动态过程:通过与外界环境反复作用来改进性能③
有记忆功能:需要积累经验,用以改进其性能。④
有性能反馈。需要明确它的当前性能与某个目标性能之间的差距施加改进操作。3 学习控制的分类智能控制10根据学习机制的不同,学习控制大致可以分为有外部监督的学习控制(离线学习控制)、无外部监督的学习控制(非监督学习控制或在线学习控制)以及强化学习控制。有外部监督的学习控制在有外部监督的学习控制过程中,期望答案(例如,系统的期望输出或期望的最佳控制动作)通常被认为是精确的。在已知答案的指导下,控制器修改其控制策略或控制参数以提高系统性能。3智能控制11学习控制的分类无外部监督的学习控制在无外部监督的学习控制过程中,期望答案并不完全为人所知。设计学习控制器通常采用两种方法。第一种方法是通过考虑所有可能的答案来执行学习过程。第二种方法是,控制器使用性能指标来指导学习过程。强化学习控制不同于上述监督和非监督学习,强化学习使用训练信息来评估所采取的动作,而不是通过给予正确的动作来指导学习过程。具体而言,强化学习根据重复训练信息评估所采取的动作,并基于所获得的奖励来自行改变控制规则。在强化学习过程中,虽然期望答案并不完全为人所知,但这并不意味着没有监督作用。3 学习控制的分类智能控制12自上世纪70年代初以来,学习控制的研究方向主要包括基于模式识别的学习控制
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司间合同合股转让协议样本
- 股权转让合同修改协议
- 山东移动企业邮箱服务合同条款
- 商业装修补偿合同模板
- 城市监控系统工程合同范本
- 技术采购合同样本
- 18《慈母情深》第二课时 教学设计-2024-2025学年语文五年级上册统编版
- 派遣工劳动合同范例
- 售后服务合同承诺书范本
- 4 上学路上第一课时 教学设计-2023-2024学年道德与法治一年级上册统编版
- 4月23日幼儿园世界读书日读书绘本名人读书故事春暖花开日正是读书时课件
- 指导青年教师课堂教学活动方案
- 一年级美术课后辅导方案-1
- 免疫学基础与病原生物学课件
- 2022版义务教育(地理)课程标准(附课标解读)
- 《锻造安全生产》课件
- 中考英语阅读理解(含答案)30篇
- 文化产业管理专业大学生职业生涯规划书
- DSM-V美国精神疾病诊断标准
- 文献的载体课件
- 混凝土强度回弹检测方案
评论
0/150
提交评论