版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、多智能体系统协调控制一致性问题研究摘要:本文首先给出了多智能体系统协调控制一致性问题的发展情况,介绍了解决一致性问题的主要原理和适用范围,对一致性协议进行了总结,对一致性问题研究的主要领域进行了 简单的概括。文章最后对多智能体系统未来的发展方向进行了探讨和分析,提出几个具有理论和实践意义的研究方向。关键词:分布式人工智能;多智能体系统;协调控制;一致性问题引言多智能体系统在20世纪80年代后期成为分布式人工智能研究中的主要研究 对象。研究多智能体系统的主要目的就是期望功能相对简单的智能体之间进行分 布式合作协调控制,最终完成复杂任务。多智能体系统由于其健壮、可靠、高效、 可扩展等特性,在计算机
2、网络、机器人、电力系统、交通控制、社会仿真、虚拟 现实、军事等方面有着广泛应用1-3。智能体的分布式协调合作能力是多智能体 系统的基础,是发挥多智能体系统优势的关键,也是整个系统智能性的体现。在多智能体分布式协调合作控制问题中,一致性问题作为智能体之间合作协 调控制的基础,主要是研究如何基于多智能体系统中个体之间有限的信息交换, 来设计的算法,使得所有的智能体的状态达到某同一状态的问题。一致性协议问题作为智能体之间相互作用、传递信息的规则,它描述了每个智能体和与其相邻 的智能体的信息交换过程。近年来,一致性问题的研究发展迅速,包括生物科学、物理科学、系统与控制科学、计算机科学等各个领域都对一致
3、性问题从不同层面进行了深入分析,一致性问题作为智能体之间合作协调的基础, 受到越来越多研究者的关注,成为系 统与控制领域的一个重要研究课题。多智能体系统协调控制中一致性问题阐述2.1图论基础知识图论和矩阵论是一致性问题研究分析中非常重要的工具, 很自然的会想到用 图论相关知识来表示多智能体相互间传递信息的过程。如果用 G = (V ,E)来表示 一个图,其中V表示非空顶点的集合,E V2表示节点对组成的边的集合。 假设 集合V中共有n个节点,切编号为i口2,., n?。如果第i个节点和第j个节点之间有信息传递,则该节点对有连边。在无向图中,节点对是无序的,即节点对间 连边没有方向,Vi,Vj
4、E= Vj,ViE。然而在有向图中,第i个节点有边指向第j个节点并不代表第j个节点有边指向第i个节点,即边是有向的。顶点集V和 边集E通常决定了网络拓扑图的序与尺寸。 在动态网络系统中,边集E统称为系 统的通信复杂度。2.2矩阵论基础为了表示节点与边的关系,通常采用邻接矩阵 A =aij来表示。具体定义如下:剛 i,je E-.0otherwise()对于无向图G ,其邻接矩阵是对称的。对于每一个智能体,采用的是分布式控制策略,能够通信的范围是有限的, 主要通过自身的状态和能够进行通信的邻居状态来进行状态的变化。通常用邻域集N来表示智能体的邻域集。第i个智能的邻域集定义如下:Ni 二打 V;a
5、j =0, j V;(i, j) El(2)如果智能体j是i的邻居,且aj -0,则表示智能体i可以接收j的信息。如 果网络拓扑结构时变,为切换拓扑网络结构,则G=(V,E)为动态图,记为G(t) =(V,E(t)。其中边集E(t)、邻接矩阵A(t)及每个智能体i的领域集M(t)均时变。在许多应用中,网络拓扑结构经常为切换拓扑,如移动机器人通信网络。2.3 一致性问题数学描述对于多智能体系统中的单个智能体i的状态可以表示为z/t)二ui,若所有智能 体的状态最终趋于相等,则表示为|z(t) Zj(t)|T 0i 式 j 且 tT(3)多智能体系统协调控制一致性问题理论分析用z(t)表示第i个智
6、能体的状态信息。状态信息是用来表示智能体进行协调 控制所需要的信息,可以是速度、位置、角度、决策量等信息。3.1基于连续时间的一致性协议Offati-Saber等人4提出了一种基于连续时间的分布式一致性协议,协议如下:Z(t)=送 aj(Zj(t) z(t)j -Ni(t)该协议只需通过智能体的邻域信息传递就可达到整个系统趋于一致。该协议也可用矩阵的方式表示:z - -LZ(5)其中:L为多智能体系统网络图的拉普拉斯矩阵。若系统拓扑结构为无向图, 则系统逐渐收敛到所有智能体初始值的平均值,即 a = (1/n厂Zi (0)这种协议称 为平均一致性协议,该协议在传感器网络信息融合等领域有广泛的应
7、用。3.2基于离散时间的一致性协议基于离散时间的一致性协议如下所示:Zi(k+1)=z(k+1)2 送 aj(Zj(k)Zj(k)(6)j 刮(k)也可用矩阵的方式表示:Z(k 1) =D(k)Z(k)( 7)其中为调整因子,一般取(0, f,0:1 ; D(k)=l-;L(k),I为单位 矩阵,D(k)为非负矩阵。3.3基于切换拓扑结构的一致性协议在实际应用当中,多智能体系统的网络拓扑结构时常发生变化,通常将这种时变的拓扑结构称为切换拓扑结构。造成网络拓扑动态变化的原因有很多,比如 在车辆编队控制过程中车辆位置发生了变化;在移动机器人进行通讯过程中,由于网络的故障造成信息传递丢失。通常来说,
8、基于切换拓扑结构的一致性协议能 够很好地应对拓扑结构动态变化的要求,最后使智能体的状态趋于一致。(8)网络切换拓扑结构可以用动态图 G(s(t)表示,其中s(t)为切换信号,贝U切换 拓扑的一致性协议可表示为:Z L(G(s(t)Z3.4带时滞一致性协议智能体之间进行信息传递交换的过程当中,经常会存在信息传递延时所带来 的时滞问题。目前,带时滞的一致性协议主要分为三类:a)对称时滞一致性协议, 智能体本身接收和发送信息都有固定时滞;b)非对称时滞一致性协议,智能体本 身接收信息有固定时滞,发送信息没有时滞;C)时变时滞一致性协议,时滞是随 时间动态变化,不是固定的常数。对称时滞一致性协议为:
9、TOC o 1-5 h z HYPERLINK l bookmark8 o Current Document Zi(t)二 aj(Zj(t - )-Zi(t- )(9)j-叫(t)不对称时滞一致性协议为: HYPERLINK l bookmark10 o Current Document Zj (t)二 aj (Zj (t - )- Zi (t)( 10)j WN j (t)时变时滞一致性协议为:乙(t)=為 aj (Zj (t - j )- Zi (t - j (t)(11)j N i (t )其中: j (t)为时变时滞,其(t)曲)。一致性问题的研究应用进展目前,一致性问题的研究发展迅速
10、,国内外学者研究了一致性问题在具体应 用中的性质,取得了一定的成果。在这里简要介绍在蜂涌问题、聚集问题和编队 控制中的研究成果。4.1蜂涌问题在一个多智能体系统中,所有的智能体最终能够达到速度矢量相等,相互间 的距离稳定称为蜂涌问题。蜂涌行为可以认为是群集的一种特殊情况。Reynoldd5 于1987年提出了关于蜂涌运动的基本模型-Boid模型。该模型包含了三条启 发 式规则,用于描述单智能体如何依赖群中其他智能体的速度和距离而运动:a)分离性,各成员之间避免碰撞;b)内聚性,各成员朝着一个平均的位置进行聚合; c)排列性,各成员沿着一个平均的方向共同运动,尽量与邻居范围内的群体成员 保持速度
11、匹配。Vicsek等人于1995年从统计力学的角度提出了 Vicsek模型,该模型中智能体的方向是其邻域内智能体方向值的平均值。Jadbabaie等人将Vicsek模型进行了理论证明分析, 证明了最近邻法则能够让所有的智能体能最终向相同的方 向移动并趋于一致。Olfati SabeP给出了设计和分析分布式蜂涌协议的理论框架,证明群体的 迁移行为可用对等的智能体网络来表示,还给出群的Lyap u nov稳定性分析。Su等人9重新研究了在缺少以上两个关键假设情况下多智能体蜂拥的问题。 作者对 Olfati-Saber 的算法进行了改进,实现了对虚拟领航者的渐近跟踪,给出 了收敛的速度, 所有智能体
12、的中心位置和速度将指数收敛到虚拟领航者的中心位 置和速度。聚集问题Ando 提出了一种用于向单点运动、有限视力的自治移动机器人的聚集的分 布式协议。 Ando 的算法要求所有机器人相互之间能全局通信,这种要求过高, 机器人的通信负担也很重。Lin 等10,11研究了自治的移动智能体编队时聚集在一点的一致性问题,提出 了三种编队协议以及聚集的必要条件, 通过分布式控制, 使得一群自治的移动智 能体获取特定的编队, 并聚集到一点。 作者还研究了编队过程中碰撞发生、 队形 进化的问题。Fan g12设计了一种新分布式移动协议,使得所有的智能体在局部通信的情 况下,在给定的感应范围内聚集。Con te
13、m13提出了一种新的用于保证聚集的分布式协议充分条件, 提出的条件要比之前相关的文献都宽松些, 尤其是提出了用 于代替连续情况的不连续点的协议所需较为宽松的条件。编队控制多平台编队控制是一致性策略应用的典型领域之一,文献 14设计了编队控 制律,用来保持空间飞行器高度一致;文献 15考虑输入约束情况下,采用了非 线性无中心一致性协议研究了无人机编队中高度保持问题。此外,文献 16采用 一致性策略分析了轮式小车追捕问题中的编队稳定性, 并且认为该问题可以看作 是连续时间系统线性一致性问题的特例。 在网络条件下, 引入随机通信噪声和信 息丢包问题,文献 17采用一致性策略研究了基于信息交换的多边形
14、编队控制方 法。文献 18给出了分析一致性和编队稳定性的基本框架,并基于此框架解决了单积分器和广义动力学模型的编队变换问题。结束语多智能体系统协调合作控制中的一致性问题研究需要以图论、 矩阵论、控制 论、人工智能为理论依据, 以一致性协议为主要的研究对象, 要求一致性协议在 满足实时性、 鲁棒性的同时又能使系统体现智能性。 未来研究的内容可集中在以 下几个方面:在不对称时变时滞环境下保持收敛和稳定的一致性协议,并能应用到智 能群体成员之间共同作用、协调运作的群集运动控制问题中。在切换拓扑环境下一致性协议的设计和应用。如在聚集应用中研究确 保智能体系统时时连通的初始网络拓扑结构和对应的一致性协议
15、的设计; 以及存 在通信异步、通信噪声、障碍物情况下,对应的一致性协议的设计;不对称时变 时滞一致性协议的研究;网络存在坏点情况下的一致性协议设计。带约束条件和优化目标的多智能体系统一致性理论。目前大部分文献研 究的一致性问题都是在无线约束条件下进行的, 但是多机器人系统的协调与控制 中 ,通常需要考虑如智能体本身的限制条件(如加速度 / 燃油)和所处环境中的 约束条件(如障碍 /威胁)等等,并期望多智能体收敛到一个指定 /优化的均衡状 态,而不是仅仅是达成一致。 随着一致性系统理论的进一步成熟, 诸如有限时间 快速一致算法、满足避碰约束的蜂拥算法等带约束条件和优化目标的多智能体一 致性问题将
16、成为研究的热点参考文献:SYCRA KP. Multi-agent systems J.AI Magazine, 1998,19(2):7992JENNINGS N R.SYCARA K, WOOLDRIGE M.A roadmap of agent research and development J.Autonomous Agents and Multi Agent System, 1998, 1(1):7-38.WOOLDRIDGE M. An introduction to multi agent system M. 2nd.s.1.:Wiley , 2009OLFATI-SABER
17、R, MURRAY R M. Consensus problems in net-works of agents with switching topology and time-delays J.Automatic Control, 2004, 49(2):1520-1532.REYNOI.DS C. Hocks. Herds and schools: a distributed behavioral model J.Computer Graphics, 1987, 21(4):25-34.VICSEK T, CZIROK A, BEN-JACOB E. Novel type of phas
18、e transition in a system of self-driven particles J.Physical Review Letters, 1995, 75(6):1226.1229.JADBABAIE A, LIN Jie, MORSE A S, Coordination of groups of mobile autonomous agents using nearest neighbor rules J.Automatic Control,2003.48 (6):988-1001.OLFATI-SABER R. Flocking for multi-agent dynami
19、c systems algorithms and theory J.Automatic Control, 2006, 51(3):401-420.SU Hou-sheng, WANG Xiao-fan. LIN Zoug-li Flocking of multi-agents with a virtual leaderJ.Automatic Control,2009,54(2);293-307LIN Ji, MORSE AS, ANDERSON B D O. The multi-agent rendezvous problem, part l-the synchronous cageC./Pr
20、oc of the 43rd IEEE Conference on Decision and Contr01. 2004:1926-1931.LIN Ji, MORSE AS, ANDERSON B DO. The multi-agent rendezvous problem, part 2-the asynchronous caseC/Proc of the 43rd IEEE Conference on Decision and Contr01.2004:2120.2147.FANG J, MORSE A S. CAO M. Multi-agent rendezvousing with a
21、 finite set of candidate rendezvous pointsC/Proc of American Control Conference.2008:765-770.CONTE G. The rendezvous problem with discontinuous control policiesJ.Automatic Control.2010,55(1);279-283.Lawton J, Beard R. Synchronized multiple spacecraft rotationsJ. Automatica(S0005-1098), 2002, 38(8):1359-1364.Bauso D, Giarr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度服装区域代理销售合同3篇
- 2024年度范香网络游戏开发与合作合同2篇
- 围挡施工承包合同完整版
- 盘扣脚手架年度租赁合同(二零二四年版)
- 商铺经营权转让合同书5篇
- 正规完整版存量买卖合同标准版可打印
- 二零二四年度劳动合同及工资支付借条3篇
- 个人门面房出租简单的合同
- 2024年度航空公司机载娱乐系统合同
- 维修服务合同模板
- 礼盒销售方案
- 茶百道整合营销方案
- 腰椎间盘突出症一病一品
- 2024-2024英语全国卷一完形填空整合
- 2024年湖北兴发化工集团股份有限公司招聘笔试参考题库含答案解析
- 脑梗死伴高血压3级病例分析专题报告
- 孕妇心衰健康宣教
- 工程量计算表(模板)
- 急诊科的工作风险与安全防范措施
- 社区矫正法教育知识讲座
- 医疗健康管理项目推广运营方案
评论
0/150
提交评论