未知环境下多机器人编队控制系统研究4_第1页
未知环境下多机器人编队控制系统研究4_第2页
未知环境下多机器人编队控制系统研究4_第3页
未知环境下多机器人编队控制系统研究4_第4页
未知环境下多机器人编队控制系统研究4_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

未知环境下多机器人编队控制系统研究第4章动态环境下基于行为的机器人运动规划研究4.1引言在机器人研究中机器人自主导航是一个非常关键的领域,而这其中机器人的运动规划则是解决机器人自主导航问题核心中得核心,一直以来都是机器人研究领域的一个重要研究课题。但是真是开始对机器人运动规划的研究真正还是在20世纪60年代。19世纪洛扎诺.佩雷斯和韦斯利两位科学家第一次将构型空间(C-空间)的概念引入机器人运动规划的研究中,这对于现代智能机器人的运动规划是一次划时代的革命。科学家们一般认为,机器人的运动规划应该分为三种:第一种是轨迹规划,所谓的轨迹规划就是机器人处于相对静止状态时其全身各个部位姿态调整的路径规划。这里所说的路径就是指机器人各个关节的运动轨迹。轨迹规划是机器人运动规划的重要组成部分。他主要是通过插补函数获得路径上的插补点,再通过求解运动学逆解转换到关节空间,从而形成各关节的运动轨迹;第二种是序列规划,也可以说是全局运动规划。它只要是指机器人控制系统选定一个特点的工作区域,将整个空间划定为各个作业点,从起始点开始作业,经过空间中各个作业点,最终又回到起始作业点得最优工作序列。这种规划主要适用于对周边环境信息掌握充分的基础上;第三种是路径规划,它主要是指机器人在运动路线的选择上,从起始点到终点,自动避开静态或者动态的障碍物,选择一条最优的安全路径。根据机器人对周边环境的了解和认知程度不同,包括全局路径规划和局部路径规划两种,全局路径规划的前提是机器人掌握较为完全的周边环境信息,能够在此基础上规划出最优的运动路径;而局部路径规划,则是由于机器人对周边环境信息不是很了解,掌握不够全面的,或者是完全未知的情况下,通过对周边工作环境的探测,获得相应的静态或动态障碍物的信息,包括障碍物的尺寸大小、形状、未知等等信息,从而进行路径的规划。相对来说,路径规划的自主性能应用性更强,更适合位置环境下多机器人编队的运动操作。当前世界各国,在机器人运动规划方面大多集中于静态环境,对动态环境中机器人的运动规划研究不多,但是事实上机器人运动过程中会经常碰到动态的障碍物,因此,本章从静态和动态两个方面对机器人的运动规划展开研究。4.2常用的运动规划方式当前,按照从路径搜索策略角度考虑,按照环境类型的表示方式,机器人运用规划大致可以分为自由空间几何构造的规划、前向图搜索算法、假设—修正法三种。下面我们就对这三种运用规划进行一个系统的分析。4.2.1基于自由空间几何构造的规划方法什么是基于自由自由空间几何构造的规划方法?一般认为,就是通过构造某种图来描述环境的自由空间,从图上找到满足某种准则的最优路径。这种方法一般有两个步骤:首先是,构造一个描述自由空间关系图,图的构造是前提条件,常用的图的构造方法有可视图法、Voronoi图法、栅格分解法和切线图法。搜索算法一般采用Dijkstra算法或A*算法;其次是,按照一定的准则(最短距离、最少时间等)寻找一条最优路径。4.2.2前向图搜索算法通过对地形的描述所得到的地形图构造完成后,如何搜索和选择最优路径就成了关键。目前,研究领域常用的前向图搜索算法有贪心算法、Dijkstra算法、A*算法、D*算法和人工势场法。贪心算法虽然是一种最简单的图搜索算法,但同时也是一种并不是很完备的算法,它忽略了全局的最优化,而仅仅考虑到了局部费用最小化。Dijkstra算法是目前机器人运动规划领域最常用,也是路径搜索最短的较为经典的算法,它可以在显式图中找到从源节点到任意节点的最短路径,或者从目标节点到图中任意节点的最短路径。A*算法是应用极广的隐式图启发式搜索算法,其距离函数的定义具有启发性,在栅格结构的数据集上性能相当好,适合于静态隐式图的最短路径搜索。D*算法适合于解决动态图的最优搜索,人工势场法适合于解决局部规划问题。图的前向搜索算法和图的后向搜索算法结合,可以构成图的双向搜索算法。4.2.3假设—修正法通过“路径假设,路径检验,中间点生成”的过程将运动规划问题分解为若干子问题来求解。假设-修正法首先在起始点和目标点之间按照一定的方式生成一条路径,然后对该路径进行碰撞检测,若没有碰撞,则路径规划结束,若有碰撞,则在起始点和目标点之间插入一无碰撞中间点,然后再重复上面的过程。假设-修正法的关键在于中间点生成的方法,它决定了该算法的求解效率,文献[10]给出了一种以机器人和各障碍物之间的距离作为启发性信息的中间点生成方法,加快了求解速度,但这种中间点生成方法也会出现局部极小点问题。假设-修正法的优点是算法简单,但假设-修正法每次都要对新生成的路径进行碰撞检测,计算量较大。4.3基于行为的机器人运动控制系统结构结合2.6节设计的分层式行为及层间信息融合结构,本章具体设计了一种基于多机器人编队传感器的行为控制系统,如图4.1所示。图4.1机器人行为控制结构图一般来说,机器人的行为控制系统其主体结构可以分为上中下三个部分,也是三个层次。上层行为在单个机器人的运动规划中表现为往目标方向前行的行为,也就是说以目标为导向的的行为即,她的基本作用是控制机器人的大体运动方向和运动趋势,在假设修正法中体现为在假设成立的时候及时的修正方向,根据目标点与自身的距离大小,适时地调整运动速度和角度,从而保证机器人以较快的速度和准确度到达目标点。但是机器人所面对的环境不仅仅是静态的环境,往往还有更为复杂的动态环境,也就是说存在的那些动态障碍物,根据上文提出的分层式行为融合结构,我们可以将躲避静态障碍物行为纳入中层行为,将躲避动态障碍物行为纳入下层行为。4.4机器人行为设计在本章中,我们所设计的机器人编队其行为主要包括奔向目标、躲避静态障碍物和避免动态障碍物三种行为,以下我们分别阐述下这三种行为的设计思想4.4.1奔向目标行为在一个机器人编队中,奔向目标行为从本质上来说是针对于处于领航者角色的机器人所应该具有的行为,因为其他的机器人都是处于跟随状态,对于跟随者来说,奔向目标行为没有任何的意义,因此我们在设计时关注的应该是领航者机器人。奔向目标行为使得机器人向最终目标点运动,其结构为:根据机器人的当前点和目标点确定机器人的运动方向和运动速度。运动速度决定于他们之间的距离,运动方向由矢量跟踪法来确定。V(4-1)其中:(x,y)为队伍最终目标位置,(x,y)为机器人当前位置,式(4-1)给出奔向目标行为的输出向量V,图4.2描述了奔向目标的行为。图4.2奔向目标行为4.4.2躲避静态障碍物行为所谓的躲避静态障碍物的行为就是机器人根据探测器所探测到的周边环境信息,从而决定接下来如何运动才能避开这些不动的障碍物。奔向目标的行为和当前运动的行为相互结合,就能使机器人能够顺利的绕开障碍物到达指定的目标点。躲避静态障碍物这个行为从本质上来说,不仅是决定了机器人在遇到障碍物之后机器人的运动行为,而且还决定了何时抑制其底层的奔向目标行为。在机器人的运动规划中,躲避静态障碍物行为发挥着关键性的作用。第一,在周边环境静态障碍物数目很多的情况下,尤其是碰到了较为复杂的环境机器人路径规划的优劣在很大程度上取决于的设计状况是否合理;其次,与动态的障碍物相比,静态障碍物是静止的,是在机器人所有复杂的行为中唯一一个可以确定的信息。一般情况下,在在分层式层间信息融合控制结构中的中层行为中,要根据的运动速度和输出的方向为参考量,进行各自的计算行为。一般情况下,在整个运动规划中,机器人规避静态障碍物的方法主要有三种,分别是切线避障法、人工势场法和固定角转向法。在本课题研究中我们总共设计了确定性采样法和划分通行域法两种避开障碍物的方法,具体如下:4.4.2.1确定性采样法机器人在比较复杂的环境中,其对未知环境的信息掌握不多,这就影响了周边环境模型的建立,在这种情况下,就必须对周边的环境进行采样,通过传感器进行随机的采用,从而描绘出一个较为简单的周边环境以此对其运动路径进行规划。本文基于传感器的随机采用方法SRT,设计了一种确定性运动规划方法SDT(Sensor-basedDeterministic-samplingTree)。SDT算法的伪代码描述如下:BUILD_SDT()for=1toPERCEPTION();ADD();loopDETERMINISTIC_DIR();;until(VALID(,)orifVALID(,)MOVE_TO();elseMOVE_TO(,);;return说明::初始点,:终点,:机器人下一步的可能选择点,:运动步数,:机器人运动的最大步数,:每前进一步传感器的探测次数,:每跨出一步传感器的最大探测次数,:机器人周边的安全范围,:为保证机器人跨出下一步处在安全范围之内的常数,且有0<<1,:保存机器人所走过的路线信息,PERCEPTION(q)为探测q点附近的安全范围的函数,DETERMINISTIC_DIR(q)为确定q点的采样方向的函数,RAY()为探测q点处方向安全距离r的函数,DISPLACE为确定机器人下一步候选点的函数,VALID(q,)为判断q点处是否满足运行条件的函数。在未知环境中,机器人获取相应的环境信息主要是通过传感器,传感器因为相应的技术水平和种类不同其探测的范围也不一样,一般机器人对环境信息的掌握和了解主要是通过对不同传感器所传回来的环境信息进行判断、分析、融合。目前,在机器人身上运用较多的传感器主要有四种分别是声纳阵列传感器、超声传感器、红外传感器和碰撞传感器。本课题研究选用的主要是声纳阵列传感器,声纳阵列传感器的工作原理是首先输出一系列的距离值,通过事先已经确定的多个声纳在机器人运动方向上的角度,确定在机器人运动的各个方向上是否有障碍物,并测算出机器与这些障碍物之间的距离。打个比方,有一个声纳跟机器人目前运动方向的角度为60度,而其输出的距离值为1.5M,那么就表示在机器人左前方约60度1.5M处有一个障碍物。如果这个声纳在其所面对的角度上没有探测到障碍物,那么其输出的距离值就是-1。在本课题研究中,我们设定的机器人传感器是具有16个声纳的声纳阵列,如图4.3所示。图4.3中,中间的小圆圈代表的是机器人;最短的那个箭头指示的是机器人前进的方向和角度;16个声纳传感器分布在机器人360°的方向上,并且是很均匀的分布,用S0~S15表示;长箭头代表的是这16个传感器分别所探测的方向;最外面的大圆代表的是各个探测器所探测的范围。每个传感器的探测范围都是以圆心角为360/16=22.5°的一个扇形区域。图4.3声纳阵列布置图图4.4“星型”采样模型图机器人在其运动过程中一般将其奔向行为的方向作为其具体的采样方向,它只能读取声纳采样相关扇形区域上的环境信息,这就是图4.4所示的1.45、1.65、1.70、1.65、1.45这几个不是零的扇形区域。在上图中箭头所指示的方向为机器人的采样方向,图中非字表示这个传感器所探测的范围内所允许的障碍物的最近距离,当然这是以机器人的大小,也就是直径为单位长度的。我们这里所看到的数据都是我们根据机器人的尺寸大小和运动的速度等要求结合仿真实验获得的数据。一般来说,如果机器人探测方向所采集到的数据符合要求,那么机器人就会进行下一步的计算,如果不满足的话,那么其采用的方向就会像最近的方向偏转,进行重新采用。我们在电视中看到机器人在一些障碍物上停留几秒钟后,有把头转向一边,其实就是他在进行环境信息的采样。4.4.2.2划分通行域法一般情况下,前向图搜索算法用到的是切线图避障法,以下我们进行简单的介绍。我们将定义为半径为的圆形机器人,为圆形障碍物,其半径为,并且他中心位于。当一个机器人运动到某个位置上,检测到它与障碍物的距离小于原先设定的固定值,并且判断出该障碍物会影响到其继续前进时,它就会沿着该障碍物的内公切线方向进行运动,从而避开了障碍物,防止产生碰撞。在这里用代表机器人与障碍物中心连线和内公切线之间的夹角,用公式进行表示。表示机器人到障碍物中心形成的单位方向向量,用公式V=进行表示。从而通过图4.5来说明切线避障行为,并且用公式式来给出其输出向量。该公式中“±”表示的是该机器人前进一步,主要是指向左侧或向右侧)的运动方向,θ为两条内公切线夹角,我们取夹角较小的避障方向时的θ来计算输出方向向量。从图4.5可以看出此时应取避障方向时的值。图4.5切线避障通过上文的描述,我们对切线避障法的原理有了相对较多的了解,同时也明白,在障碍物较少的情况下,机器人运用传统的切线避障法能够很快的获得最优的运动路径。但是如果周边环境相当一复杂,障碍物较多的情况下,切线避障法就不大灵光了,出现偏差的可能性会很大,用其规划最佳的路径显然困难重重。因此,在本课题研究中,我国通过对传统切线避障法的原理的剖析和利用,进而设计出了更为科学的划分通行域法。他的基本原理就是:首先,将机器人运动方向附近的区域按照可以通行和不可以通行划分成两个区域,即可通行域和不可通行域。当机器人与目标点的连线在可通行域范围内时,控制者就发送指令控制机器人沿有利于机器人协调协作的方向偏转。以下我们介绍下这种方法的实现过程:如图4.6所示,以机器人的几何中心为极点、以机器人当前的运动方向为极轴建立一个极坐标系。在这个坐标系里,机器人和障碍物碰撞区域的转角范围为[,],考虑到机器人的几何尺寸,计算左偏角和右偏角时加入虚拟机器人(VirtualRobot)的半径。可知复杂环境中并存多个静态障碍物时,可得到i个碰撞范围[,],(),求出其范围当然并集得到碰撞域,之外的范围即为切线可通行域。在中最小的偏转角方向取优作为下一步的运动方向。图4.6划分通行域法模型图说明:(4-5)(4-6)综合以上分析,我们可以得出这样的结论,那就是传统的切线法和我们新设计的划分通行域法在机器人运动环境中障碍物较少时,都可以很好的队机器人进行运动规划,但是当周边的环境相对复杂时。划分通行域法就显示出了其优点,其能够比传统的切线法更快、更好的为机器人进行最优运动规划。因为在本课题研究中我们研究的主要是机器人在在静态环境和动态复杂环境中运动规划,因此我们只采用划分通行域法进行运动规划。4.4.2.3仿真及分析为了更为主观的知道在机器人运动规划中确定性采样法和划分通行域法的优势和劣势,我们分别在相对简单和相对复杂的环境中进行了几组实验,实际的详细结果,如下图所示:在上面四组实验中,我们通过引入路径长度率这个概念来衡量路径的优劣,所谓路径长度率是指机器人行进的距离与目标点和初始点直线距离的比值。因此路径长度率越小,所用算法的避障性能越好。表4.1列出了确定性采样法和划分通行域法分别在简单环境和复杂环境下的路径长度率和有无死锁情况。表4.1路径长度率表通过上述实验,我们对比分析了相关的实验数据和机器人运动轨迹的数据,可以发现,划分通行域法确实在很多方面优于确定性采样法,其寻找狭窄通道的能力明显的优于确定性采样法,路径长度率低,轨迹平滑,不存在死锁,机器人路径规划的效果非常好。但是,确定性采样法也有其可取之处,比如在简单的环境中,一些障碍物直接的距离比较近得情况下,机器人就能很好的避开障碍。同时确定性采样法可以仅依靠机器人自身传感器进行环境探测来完成避障任务。所以,在本课题设计中,我们兼顾了两种方法,在躲避静态障碍物时,我们选择性的采用切线可通行域法和确定性采样法,或者两个都用。如果通过各个机器人之间的联合探测和侦察获得了较为全面的信息,那么久采用划分通行域法。4.4.3躲避动态障碍物行为在机器人的运动过程中,虽然说碰到的代发多是静态障碍物,动态障碍物碰到的很少,因此躲避动态障碍物的设计在机器人的运动规划中使用的几率并不是很高。但是,躲避动态障碍物的设计却比躲避静态障碍物的设计复杂的多,其处理的的信息也相对复杂,难度也高。虽然用到的不是很多,但是要提高机器人对环境的适应能力,我们就必须完善机器人躲避动态障碍物的设计,传统的前向图搜索算法虽然考虑到了动态障碍物的位置信息,但是却忽视了其运动的趋势,因此很容易出现偏差,误导机器人。尤其是面对多机器人编队,其运动量将会大大增加,会给机器人控制系统造成很大的影响。基于此,本文通过对运动规划方法中得智能化算法的分析和借鉴,最终决定使用模糊控制原理来设计,通过模糊规则,结合着人类的控制经验,得到非线性的控制规律。同时参考分层式行为融合结构上层传递过来的运动方向和运动速度,机器人可以进行更为精确的控制预测。下面介绍的设计过程。4.4.3.1模糊控制简介模糊控制即模糊逻辑控制,是以模糊集合论、模糊语言变量和模糊逻辑推理为基础的一种计算机数字控制技术。如图4.11所示,模糊控制器主要由四大部分构成:(1)模糊化这部分的主要作用是将输入的精确量转化成模糊化量。其中输入量包括外界的参考输入、系统的输出或状态等。模糊化的具体过程如下:首先是为了使得输入量符合模糊控制器的要求,对这些输入量进行处理,把输入量转变为符合模糊控制器要求的量;其次,为了使经过处理的量变化到各自的讨论区域,对这些输入量进行尺度变换;再次,就是进行模糊处理,将已经变换到论域范围的输入量进行模糊处理,使原先精确的输入量变成模糊量,并用相应的模糊集合来表示。(2)知识库通常,知识库一般由数据库和模糊控制规则库两部分组成,它包含了具体应用领域中的知识和要求的控制目标。数据库主要包括各语言变量的隶属度函数,尺度变换因子以及模糊空间的分级数等;规则库包括了用模糊语言变量表示的一系列控制规则。它们反映了控制专家的经验和知识。(3)模糊推理模糊推理是基于模糊逻辑中相应的推理规则和其所蕴含的关系进行的,它是模糊控制器的核心,它具有基于模糊概念的模拟人的推理能力。(4)清晰化清晰化主要是通过将模糊推理得到的控制量(模糊量)变换为实际用于控制的清晰量来实现其作用的,它主要包括两大块内容:一是,将模糊的控制量经清晰化变换变成表示在论域范围的清晰量;二是,将表示在论域范围的清晰量经尺度变换变成实际的控制量。图4.11典型的模糊推理系统图4.4.3.2运动控制模型的建立(1)机器人与运动障碍物碰撞的预测模型如图4.12所示,机器人R与运动障碍物O(其半径分别为)沿直线运动,当它们运动到区间[A,B],[C,D]时,由于距离很近,很容易发生碰撞,故称区间[A,B],[C,D]为易碰撞区域。只要有一个物体在易碰撞区域外,两者就不会发生碰撞。图4.12碰撞预测模型图如图4.12所示,由数学知识可以推导出:(2)动态障碍物运动轨迹拟合怎么样才能准确的测定出动态障碍物的运动速度、运动方向是机器人在躲避障碍物过程中利用模糊控制的关键。由于我们得到了动态障碍物相应的运动数据,诸如方向和速度,我们就可以对其未来的运动趋势进行预测,从而将其运动速度和方向进行模糊化处理,进而获得模糊控制器所需用的输入量,最后利用模糊规则对机器人进行控制。一般来说,越为复杂的环境,动态障碍物的运动情况就越复杂,在本课题研究中我们把动态障碍物的运动情况进行了简化,简化处理了它的运动轨迹,将动态障碍物的轨迹拟合成直线运动。根据机器人传感器探测到的障碍物连续三个时刻的位置(,)xy(i=1,2,3),其运动轨迹由最小二乘法拟合而成。设动态障碍物的运动轨迹公式为:P(x)=a+bx(4-9)根据直线拟合的最小二乘法原理,用下面的方程组求解a,b4.4.3.3躲避动态障碍物行为设计躲避动态障碍物的行为处于分层融合式控制结构(图4.1)处于行为层的最底层,在这之前机器人的运动速度和运动方向已经由前两层的行为大体确定了。当机器人所携带的传感器在相应的范围内探测到动态障碍物时,会进行模糊处理,通过改变自身的运动速度,尽量做到不用调整运动方向和轨迹,就能够避开可能碰撞的动态障碍物;当传感器没有探测到动态障碍物时,躲避动态障碍物行为会将前两层传递来的运动参数原值输出。当机器人在进行模糊处理的过程中,我们首先根据拟合的运动轨迹对相互碰撞的可能性进行分析和判断,如果判断出存在相撞的可能性,就进入下一步的模糊处理。本课题研究中我们设计的模糊控制器是双输入单输出,为了确保较高的控制精度,根据机器人和障碍物的运行状态采用三种不同的模糊控制器,如表4.2所示。控制器1的第一个输入为机器人运动到其易撞区前端所需时间论域为[0,10],第二个输入分两种情况:(1)当机器人较动态障碍物先到达易撞区时,第二个输入为动态障碍物到达易撞区时机器人在易撞区内的相对位置(前部、中间、后部)(为机器人到易撞区前端的距离),论域为[0,1];(2)当动态障碍物较机器人先到达易撞区时,第二个输入为机器人到达易撞区时动态障碍物在易撞区内的相对位置(为动态障碍物与易撞区前端之间距离),论域为[-1,-0]。控制器2的第一个输入为机器人运动到其易撞区前端的时间,论域为[0,10](单位:s),第二个输入为动态障碍物在易撞区内的相对位置,论域为[0,1]。控制器3的第一个输入为动态障碍物运动到其易撞区前端的时间,论域为[0,10](单位:s),第二个输入为机器人在易撞区内的相对位置,论域为[0,1]。这三种模糊控制器的输出都是机器人的运动速度,论域为[0,200](单位:mm/s)。当机器人和动态障碍物都在易撞区域时,仅通过改变机器人的运动速度难以避开碰撞,所以我们设计了转向控制器,利用躲避静态障碍物中的传统方法—固定角度转向法,来避开碰撞。上述三种控制器中,以控制器1的设计最为复杂,控制器2、3设计起来相当于控制器1的一部分:输入值相似,输出值有所不同。下面我们以控制器1为例说明模糊控制器的设计过程。控制器1的两个输入皆为连续型论域,采用单点模糊化方法,将第一输入T论域划分为{VS,S,M,L,VL}(V:very,S:short,M:middle,L:long),第二输入P论域划分为{NB,NM,NF,PF,PM,PB}(N:negative,B:back,M:middle,F:front,P:positive),输出V论域划分为{VF,F,M,S,VS}(V:very,F:fast,M:middle,S:slow),所有的隶属度函数都采用三角形函数,隶属度分别为m(T),m(P),m(V),如图4.13所示。控制规则表如表4.3所示。本文中and运算采用求交(取小)的方法;合成运算“o”采用最大—最小的方法;蕴含运算“”采用求交的方法。由于通过模糊推理进行手工计算计算量非常之大且极易出错,为此我们采用MATLAB的模糊逻辑工具箱(Fuzzytoolbox)来实现。下面我们以T=0,P=-4为例,说明运用MATLAB的模糊逻辑工具箱(Fuzzytoolbox)的实现过程。如图4.14,调节输入input1=0,input2=-4,输出output1=7.36,经尺度变换转化为实际的输出量V=184.0。由此可得到模糊控制响应表见表4.4。4.5动态环境下机器人运动规划仿真为了验证前面我们设计的分层式行为融合结构在机器人运动中各种行为同时运行的有效性,我们专门在仿真平台上进行了机器人基于行为的仿真实验。在本实验中,所有的障碍物都是人为设置的,机器人的探测范围大于运动的范围,依靠自身所携带的传感器,机器人就可以对周边的环境进行探测,而且探测的距离是自身半径的五倍之多。为了重点验证模糊控制的有效性,我们设置了三种机器人和障碍物相遇情形,分别需要机器人通过转向、加速和减速等三种方式来避开动态障碍物。仿真过程如下图所示。4.6本章小结本章主要介绍了机器人运动过程中主要的几种运动规划方法,通过对比他们寻找最优运动路径的能力和对环境适应能力,从而决定了本课题研究所采用的运动规划方法。基于对常用运动规划方法的分析,我们利用分层式行为融合结构,设计了一种机器人的行为控制系统。在该系统中,针对单个机器人的运动规划,其设计的重点是躲避静态障碍物行为和躲避动态障碍物的行为。在躲避静态障碍物方面,根据周边环境的掌握程度来确定,如果周边环境的信息少就采用确定性采样法,如果周边环境信息多久采用划分通行域法;在躲避动态障碍物方面,首先,对动态障碍物的运动轨迹进行拟合,然后采用模糊控制原理来改变机器人的运动速度,完成躲避动态障碍物行为的设计。仿真对比实验证明了设计的各种行为都能够有效的处理各自的行为对象,分层式行为融合控制结构在各种环境中都能够有效的对行为进行融合,并得到理想的控制效果。第5章基于改进leader-follower的多机器人编队控制5.1引言在大自然中,很多动物往往都是以编队的形式出现的,比如大雁、鱼群,甚至于麻雀也是按照某种集合形状进行编队飞行的,在整个编队中,个体与个体之间往往都保持着一种相对不变的位置关系,从而使得他们能够更有效的获取周边的环境信息,第一时间发现天敌或食物,进而躲避食物链上层的捕食者和围捕猎物。可见,编队是生物应对复杂环境,充分发挥自身功能的一种绝佳方式,正如狼群一样,一只狼不可怕,一群狼就变得非常可怕了,连老虎都要退避三舍。动物界的这种现象也给了我们一个非常好的启示,那就是如果机器人团队在执行任务的过程中采用编队形式,保持队形,同样也能发挥出超过个体简单几何组合的作用。当前,随着科学技术的迅猛发展,在军事、工业、航空航天等领域急需拥有强大功用的机器人,但是单个机器人目前显然不能达到这种要求,因此,经过编队的机器人其强大的能力就显得非常重要了,必然会在这些领域广泛的应用。所以,我们说在这种情况下研究机器人编队的有效合理的控制方法具有非常重大的实用价值和现实意义。本章在第三章分析的多机器人编队控制方法基础上,采用基于改进leader-follower的编队控制方法,对静态和动态环境下多机器人系统的队形形成和队形保持展开了研究。5.2队形形成所谓的队形形成其主要研究的是如何让众多的机器人从无序的几何组合中变成一个相对来说有规律性的组合,而且这种规律性还必须具备一定的稳定状态。这些组合中,机器人与机器人之间的距离、角度都有严格的规定,在什么情况下机器人编队的探测距离最远?在什么样的情况下机器人完成任务的速度最快?这些都是研究者所需要考虑的。一般来说,队形机器人编队的队形只是出于相对的稳定状态,随着环境和任务得变化,队形也会随之发生变化,并形成新的队形。5.2.1队形形成方法队形形成首先要解决的问题还是单个机器人的运动控制问题,各个机器人自主运动到对应的队形目标点,就形成了简单的队形。但是这中间就存在着2个问题:一是,怎么样确定每个机器人的队形目标点;二是,机器人如何准确的运动到队形目标点?针对于这两个问题,相关领域的很多专家学者提出好几种解决方法,诸如KazuoSugihara和XiaopingYun等提出的Merge-Then-Circle算法和Circle-Then-Adjust算法,他们主要是听过机器人本身的运动规划自主调整彼此间的距离和夹角来形成预定队形。本文采用基于改进leader-follower的编队控制方法,因此采用分配队形点的方法,先指定某个机器人的队形目标点,各机器人到达队形目标点后队形形成。为了提高队形形成的速度,我们充分的利用了编队中机器人相互间得通讯功能,采用最小路径的方案,即首先列举出所有的队形点分配方法,然后求得其中各机器人平均路径最短的方案。5.2.2队形形成算法流程在刚开始进行队形整队的时候,由leader读取follower的位置信息,通过计算产生队形点,形成队形阶段队形参考点位于多机器人系统的中心点,与leader机器人身份无关。算法的具体流程描述如下:图5.1队形形成流程图5.2.3队形形成仿真及分析在仿真结果中,由空心圆连成的为机器人的运动轨迹,我们看到每个机器人都能找到距离自己最近的队形分配点,没有出现绕路的情况,达到了缩短队形形成时间的目的。5.3队形保持对于队形保持来说,主要可以分为以下三个方面的研究内容:(1)固定队形完全保持适合于对机器人之间的位置有严格要求的任务,此时,机器人之间的相对位置关系应当绝对不变;(2)固定队形不完全保持任务允许机器人在运动中由于环境约束等原因偏离自己的理想位置,偏离后机器人系统会努力尽快恢复原先队形;(3)可变队形控制系统可以根据任务和环境的需要在多种队形中切换。本文主要采用固定队形完全保持,机器人系统可根据周围环境进行可变队形控制,实现队形切换。5.3.1传统的基于leader-follower的队形控制方法保持队形我们采用的是基于leader的队形控制方法,其基本思想是:在多机器人组成的群体中,某个机器人被指定为leader,其余作为它的follower,follower以一定的间隔跟踪leader的位置和方向。根据leader机器人与follower机器人机器人之间的相对位置关系,就可以形成不同的网络拓扑结构,即形成不同的队形。该方法中,多机器人的协作是通过共享leader机器人的状态等知识实现的。leader机器人可以控制系统的运动趋势,各个follower通过保持与leader一定的距离、方向角等约束实现队形控制。因此leader-follower法的优点是仅仅给定leader的行为或轨迹就可以控制整个机器人群体的行为,可以把编队控制问题简化为独立的跟踪问题,每个机器人只需要获得它的领航机器人的状态信息,从而大大简化了机器人间的合作问题。下面我们应用传统的leader-follower的编队方法进行仿真,仿真图为图5.6-图5.8所示。图5.6由于障碍物环境中follower避障路径的增加,加之leader机器人和follower机器人之间的联系非常弱,某个机器人的避障路径变长,导致脱离leader的通讯范围,出现离队现象,图5.7出现队形的稍微变形,避开第二个障碍物以后变形较大,到达目标位置时已完全变形。为了克服这个缺点我们加入队形反馈机制。具体的原理将在下节详细介绍。5.3.2引入条件反馈的基于leader-follower队形控制图5.9队形条件信息反馈的控制结构图队形条件信息反馈的基本原理为:初始时leader接受任务T,然后根据环境信息E进行运动规划,并将自身的运行状态和任务信息T通过黑板通知Robot(i=1,2,…,n),每个follower根据任务T计算自己在队形中的期望位置(i=1,2,...,n),结合环境信息E,根据控制策略产生控制量,即()。队形信息被反馈给leader,其中为follower当前位置。在正常运动时leader不将队形反馈信息作为自己运动的依据,依靠follower自行调整速度来提高队形保持率。只有当个别机器人处于通讯范围边缘时,leader降低运动速度,使得落后机器人能够赶上,防止follower掉队。图5.10队形保持控制流程图多机器人队形保持与控制时首先形成预定的队形,然后保持队形避开障碍物运动到目标点。仿真中机器人的半径为2cm,步长为0.2cm,间隔时间为120ms,我们规定队形中follower的位置误差为1.5cm,即follower的位置与leader的预期位置之差小于1.5cm时不影响编队。我们分别设置了静态障碍物环境,动态障碍物环境,实现了多机器人的队形保持与控制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论