(机械电子工程专业论文)集控式足球机器人防守策略的研究.pdf_第1页
(机械电子工程专业论文)集控式足球机器人防守策略的研究.pdf_第2页
(机械电子工程专业论文)集控式足球机器人防守策略的研究.pdf_第3页
(机械电子工程专业论文)集控式足球机器人防守策略的研究.pdf_第4页
(机械电子工程专业论文)集控式足球机器人防守策略的研究.pdf_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 足球机器人系统是一种工作在噪声及对抗性的复杂环境下,通过协作配合以 完成一个共同任务的多智能体系统。由于具有高科技对抗性和娱乐性而吸引了广 大的科研人员投身其中,极大地促进了人工智能的发展。 本文在了解足球机器人的起源、发展以及国内外足球机器人研究现状的基础 上,针对微型足球机器人的防守策略做了系统分析和研究。 首先分析了决策系统的特点和目前典型的决策系统的推理模型,在以往分层 递阶式的决策结构的基础上,增加了紧急情况处理通道,使系统在局部上有灵活 的反应能力,在全局上有长远的规划能力和较好主动性、目标性。利用模糊逻辑 的方法具体实现了决策系统的态势分析和任务分配,为足球机器人防守策略的研 究做好了准备。 其次划分了从前场到后场的防守层次,对前场进攻中的攻守平衡策略、中场 后场的层次化防守策略、后卫角色的防守策略进行了详细的设计。 在分析了原有守门员策略分区的优点和不足的基础上,提出了小球对球门的 威胁度的概念,并以此为依据,采用威胁度的等值线对原有矩形分区法进行了改 进;对各危险分区的防守策略进行了设计,采用了线性差值站位法,有效地提高 了守门员的反应速度,使守门员的防守能力大大加强;对罚球时对方罚球队员以 弧线射门的方式进行了分析,并对此时守门员的防守策略做了详细论述。 最后,在建立了足球机器人运动学模型的基础上,利用m i d d l el e a g u e s i m u r o s o t ( m l s ) 仿真系统,对所论述的足球机器人守门员策略进行了仿真实 验,证明了其合理性和有效性。 关键词:足球机器人防守策略层次化防守守门员策略罚球 a b s t r a c t t h es o c c e rr o b o ts y s t e mc a nb er e p r e s e n t e dc o n c r e t e l ya sm u l t i p l ea g e n t sm o v i n g i na c o m p l i c a t e ,r e a l - t i m e a n dn o s i y s u r r o u n d i n g s f u l lo f a n t a g o n i s m a n d a c c o m p l i s h i n gac o m m o nt a s k m i s s i o nt h r o u g hc o l l a b o r a t i o n m a n yr e s e a r c h e r sa r e a t t r a c t e dt od e v o t ei n t oi tb e c a u s eo fi t sh i g h - t e c hc o m p e t i t i o na n dg o o da m u s e m e n t r o b o ts o c c e rg r e a t l ye n h a n c e st h ed e v e l o p m e n to fa r t i f i c i a li n t e l l i g e n c e a i m i n ga to u rf i r am i r o s o tf i v ev s f i v em i c r os o c c e rr o b o t ,t h i sd i s s e r t a t i o n m a k e sap r o f o u n da n ds y s t e m i cr e s e a r c ho ni t sd e f e n c es t r a t e g ya n dg o a l t e n d e r s t r a t e g ya n dm e t h o d so nt h eb a s i so fm yg e n e r a l l yk n o w i n gi t so r i g i na n d d e v e l o p m e n lw e l lu n d e r s t a n d i n gi t sd o m e s t i ca n do v e r s e a ss t a t u sq u oo fr e s e a r c ha n d f u l l yc o m p r e h e n d i n gi t ss t r a t e g ys u b s y s t e m f i r s t l y , a i m i n ga tt h ec h a r a c t e r so ft h es o c c e rr o b o td e c i s i o nm a k i n gs y s t e m ,w e p r e s e n tam o d e lo fs t r a t e g ys y s t e mw h i c ha d d se m e r g e n c ym o d e lt od e a lw i t ht h e c a s u a la n de m e r g e n ti n c i d e n t st h r o u g ht h ea r b i t r a t o r b a s e do nf u z z yl o g i c ,t h e s i t u a t i o na n a l y s i sa n da s s i g n m e n ta l l o c a t i o na r er e a l i z e d , p r o v i d i n gas o l i db a s ef o rt h e f o l l o w i n gr e s e a r c ho nd e f e n s es t r a t e g y s e c o n d l y ,t h el a y e r so fd e f e n s ef o r mf r o n tt ob a c ka r ed e f i n e d b a l a n c eb e t w e e n a t t a c ka n dd e f e n s ea n ds t r a t i f i e dd e f e n s es t r a t e g yi nm i d f i e l da n dt h ed e f e n s es t r a t e g y f o rf u l l b a c kr o l ea r ed e s i g n e di nd e t a i l e d b a s eo nt h ed e e p a n a l y s i so fp r e v i o u sd i v i s i o nr e g i o n s ,an o v e ld e s i g n e d g o a l k e e p e rs t r a t e g yi sa d o p t e d t h ec o n c e p t i o no fd e g r e eo fm e n a c ei sp r o p o s e d ,i n w h i c ht h ed e t e r m i n a t i o no ft h er e g i o nb o r d e ri so fe n o u g he v i d e n c ew i t ht h ei s o l i n e s o fm e n a c e an e wl o c a t i o nm e t h o db a s e do nl i n e a ri n t e r p o l a t i o ni sp r e s e n t e di no r d e r t or e d u c et h er e s p o n s et i m eo ft h eg o a l k e e p e r t h ec a p a b i l i t yo fc o n t r o l i n gb a l lo f o p p o n e n tk i c k e ra tp e n a l t y - k i c ks i t u a t i o n si sa n a l y z e da n da n dt h eg o a l t e n d e rt a c t i c w i t hr e s p e c tt ot h ea t t a c k e ri na r cp a t hi sd e s i g n e d a tl a s t ,o nt h eb a s eo fk i n e m a t i c sm o d e lo fs o c c e rr o b o t ,t h er e a l i z i n gg o a l i e s t r a t e g yi sd e s i g n e da n ds i m u l a t i o no nt h em i d d l el e a g u es i m u r o s o t ( m l s ) i sc a r r i e d o u t t h er e s u l tp r o v e st h ef e a s i b i l i t ya n de f f i c i e n c yo ft h es t r a t e g y k e yw o r d s :s o c c e rr o b o t ,d e f e n s es t r a t e g y , s t r a t i f i e dd e f e n c e ,g o a l t e n d e r , p e n a l t y k i c k 2 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得墨鲞盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者虢吁签字隅p 口7 年f 月少同 学位论文版权使用授权书 本学位论文作者完全了解丕洼盘鲎有关保留、使用学位论文的规定。 特授权叁鲞盘堂可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者躲多婿新躲爽再 u 签字日期:矽7 年6 月7 夕日 签字日期:加哆年6 月l _ 日 第一章绪论 1 1 引言 第一章绪论 r o b o t ,这是一个令人们在脑海里产生片片遐想的名词。它首次出现在1 9 2 0 年捷克戏剧作家卡勒鲁查培克发表的科幻戏剧罗萨姆万能机器人制造公司 r t 中,经过8 0 年的科技发展,它己经从虚幻的事物变成了能为人类服务的 实物,同时也成为高科技的代名词之一。s o c c e r ,这是一个令人们热血沸腾的名 词。在体育项目中,它是最受人们欢迎的运动,也是全球普及率最高的运动。机 器人足球,这是两个最引人注目的名词相结合的产物,这也预示着它将成为世界 上备受关注的名词之一。 早在机器人世界杯赛会( r o b o c u p ) 成立之初,倡导者们就郑重地预言“到2 0 5 0 年,一个全部由自主的人形机器人组成的足球队,按照国际足联( f i f a ) 的规则将 与当时的世界杯冠军队进行足球比赛,并且要赢得这场人机大战的胜利。”,在 这样个令人兴奋、充满激情的梦想的鼓舞下,众多研究人员投入到了这项课题 中。 自九十年代初开始,由于足球机器人是一个多学科交叉的课题,涵盖了智能 机器人系统、多智能体系统、实时图像处理与模式识别、智能体结构设计、实时 规划和推理、移动机器人技术、机器传动与驱动控制、传感器与数据融合和无线 通讯等学科,所以得到各国学者的重视。机器人足球活动所波及的范围越发广泛, 比赛类型也不断增多,机器人足球比赛己渐渐成为人工智能与机器人领域的小型 高科技试验平台。 1 2 足球机器人比赛介绍 1 2 1 足球机器人的发展 机器人足球比赛的设想首先是由加拿大不列颠哥伦比亚大学的教授a l a n m a c k w o r t h 在1 9 9 2 年的论文o ns e e i n gr o b o t s ) ) 中提出的【l 】,旨在推动人工智 能学科的发展,为智能机器人提出了一个新的具有标志性和挑战性的课题。随后, 1 9 9 2 年1 0 月在东京召开的关于“人工智能领域的巨大挑战”学术讨论会 ( w o r k s h o po ng r a n dc h a l l e n g e si na r t i f i c i a li n t e l l i g e n c e ,o c t 19 9 2 ,t o l 【) r o ) 上,与 第一章绪论 会的研究人员对制造和训练机器人进行足球比赛以促进相关领域的研究进行了 探讨。在一些学者的积极倡导和s o n y 公司的大力支持下,成立了由国际人工 智能学会组织的国际机器人足球协会( r o b o c u p :t h er o b o tw o r l dc u p i n s t i t u t e ) , 并于1 9 9 6 年在日本举行了一次表演赛【2 】,获得成功。 为了推广机器人足球比赛,韩国学者金钟焕发起了国际机器人足球协会联合 厶i j ( f i r a :f e d e r a t i o no fi n t e r n a t i o n a lr o b o ts o c c e ra s s o c i a t i o n ) ,从19 9 6 年开 始每年也举办一届国际性的微型机器人世界杯足球赛( m i r o s o t ) 。f i r a 总部设 在韩国大田高等科学技术研究院( 1 认i s t ) ,它有2 0 多个成员国。 f i r a 与r o b o c u p 的主要区别之一是f i r a 允许采用集中控制方式【5 】,而 r o b o c u p 要求必须采用分布式控制方式,相当于每个队员有自己的大脑,因而是 一个独立的“智能体”。 1 2 2 足球机器人研究的意义 机器人足球是一个多智能体系统( m u l t i a g e n ts y s t e m ) 的典型问题,又是研 究分布式人工智能( d i s t r i b u t e da r t i f i c i a li n t e l l i g e n c e ) 的理想平台。在多智能体 系统中不但研究每个智能体本身的体系结构,而且更着重研究各智能体之间的协 调与合作问题。 在人工智能的发展道路上曾出现过计算机象棋。它是用计算机对人类进行的 象棋比赛,它作为博奕的典型问题在人工智能领域发展了搜索与产生式理论,成 为发展人工智能的第一个里程碑。经过漫长的5 0 年后,i b md e e pb l u e 软件终 于打败了世界象棋冠军k a s p r o v 。它给人类展示了计算机专家系统可以击败人类 天才的可能性。但是计算机象棋只反映人类社会的一个侧面,即它是一个单智能 体对另一个单智能体,在静态环境下,以非实时方式进行的知识处理问题。而实 际的人类社会发生的绝大部分问题是,一群多智能体对另一群多智能体,在复杂 动态环境下,以实时方式进行的知识处理问题。在人工智能领域出现的多智能体 系统就要研究和解决这种人类社会客观存在的实际问题,因此可以说,多智能体 系统是发展人工智能的一个新的突破,它将过去封闭和孤立的知识系统发展为开 放、分布的知识系统,使人工智能面向更多的实际应用领域。 过去既然通过计算机象棋这个典型问题来推动了人工智能中的搜索和产生 式理论,那么现在能否找到另一种典型问题来推动多智能体系统的发展呢? 答案 是肯定的,那就是机器人足球。这是因为在机器人足球中不但包含着多智能体系 统要研究的全部内容,而且其中所包含的动态环境与实时性要求比一般系统更为 苛刻。 机器人足球是研究多智能体系统的典型问题。首先,机器人足球比赛是一群 第一章绪 论 机器人对另一群机器人对抗的分布式多机器人系统,其中每个机器人是具有决策 能力的a g e n t 。在比赛过程中每个机器人不但能发挥个人能力,而且还能通过协 调与合作还发挥集体力量;其次,在比赛场地上的各球队机器人为了射门或防守 到处奔跑,因此成为时时刻刻变化的非常复杂的动态环境;再次,为了战胜对方, 双方机器人球队必须实时地了解我方和敌方阵营的动态变化,并根据这一动态变 化提出行为决策,即全面进攻或防守或局部协作防守等比赛策略问题。同时为执 行这些决策,各智能体之间必须通过通信来解决协调与合作问题。 机器人足球涵盖了诸多高新技术,是一项人工智能与机器人领域的应用基础 研究课趔引。举行机器人足球比赛的目的正是为了促进分布式人工智能和机器人 领域及相关各学科的发展,进而为其相关技术在生产及生活中的应用打下良好的 基础。机器人足球比赛能调动起广大的,特别是年轻科技工作者的积极性与创造 性,不但有力地推动了人工智能技术中的视觉、传感融合、行为决策、知识处理 等技术的发展,而且还促进了将无线通讯、智能控制、机电一体化等许多关键技 术集成为一体的综合技术的发展。这些关键技术对我国新型产业的建设及对传统 产业的技术改造都具有非常重要的实际意义。 1 3 足球机器人分类 1 3 1 集中控制( 集控式) 足球机器人系统 集控式足球机器人系统即集中视觉遥控无脑多机器人系统( r e m o t e b r a i n l e s s r o b o ts o c c e rs y s t e m ) ,此类机器人系统包括f i r a 微型机器人和r o b o c u p 的小型 机器人( f 1 8 0 ) ,这类机器人系统由安放球场上方的摄像头摄取图象,送至主机进 行图象分析与识别,由决策系统进行统一决策,产生相应的指令,再通过通讯模 块发送到本队队员,产生相应的动作。 1 3 2 分布控制式( 分布式) 足球机器人系统 全部功能环节均由机器人独立实现,也就是基于机器人的足球机器人系统 ( r o b o t b a s e dr o b o ts o c c e rs y s t e m ) ,常常称之为分布控制式( 自主式) 足球机器人系 统。r o b o c u p 的中型机器人赛( f 2 0 0 0 ) 属于此类系统。此类机器人摄像头置于机 器人小车之上,各机器人分别感知,视场是变动的,视野局限信息不完整,给决 策带来更多的困难。于是感知器官便不仅局限于视觉,还可辅以红外和声纳等, 进行距离和障碍检测。这样信息( 传感器、数据) 融合成为首当其冲的技术难题。 机器人间的信息沟通则要靠无线通信网络。网络形式与通信协议也成为制约系统 第一章绪论 性能的关键技术。从长远来看自主式机器人是发展方向,应当给予深入研究。 1 3 3 腿型机器人与人型机器人系统 以上各种参加足球比赛的机器人的行进机构均是车轮式( 或履带式) ,而不是 腿式,与人的体形差别很大。 当主动感知与思维决策等智能环节可以基本实现后,便有研究人员开始研制 。腿型( 1 e g g e d ) 机器人与人形( h u m a n o i d ) 机器人系统参加足球比赛。索尼公司4 足机 器狗( a l b o ) 踢球就是腿型机器人研究的一个典型实例。 目前己有双足的机器人能够完成踢球动作,使人真正看到了机器人踢足球的 原型。腿型机器人研究的最大难题还在于如何将走行机构做得小巧、灵活、协调、 易控。由于腿是有许多关节构成的,这无疑对机构学、运动学、动力学、及多变 量非线性控制等带来极大的难度。显然,这也是当前机器人学科的前沿课题。 1 4 集控式微型足球机器人系统概述 本文研究工作主要针对f i r am i r o s o t5 v s 5 的比赛展开的。 图卜1f i r a 系列微型机器人的比赛平台 如图1 1 所示为m i r o s o t 微型足球机器人系统【9 1 ,整个系统需要的硬件设备 有:一个摄像头和配套的图像采集卡,机器人小车若干,无线通讯发射器,用于 管理整个系统的计算机。 该系统由四个子系统构成:视觉子系统、决策子系统、无线通信子系统和机 器人小车子系统。系统运行时,首先由视觉系统识别球场上目标的位姿,再由策 略系统根据这些位姿信息规划出战术并计算出小车的左右轮速,然后通过通讯系 统将轮速指令以通信的方式发送给球场上的机器人,场地上的机器人根据辨识出 自己的指令,完成要求的动作。 第一章绪论 因此,微型足球机器人系统可以视为具有视觉反馈的大闭环系统。整个系统 的结构如图1 2 所示。 图1 2 微型足球机器人系统结构示意图 ( 1 ) 视觉子系统 视觉子系统是机器人系统的图像采集部分,j 由摄像头、图像采集卡等硬件设 备和处理软件组成。通过视觉系统,能够确定本方机器人、对方机器人的位姿及 球的位置。比赛规则规定,每队有自己的队标,每个机器人还有自己的色标。在 比赛中,视觉系统连续、快速地采集赛场上的图像,并通过辨识小球和机器人顶 部的色标得到场上运动实体的有关位姿信息,以供决策子系统进行分析。 场上形势瞬息万变,要求视觉系统必须具备快速性和准确性。比赛过程中还 可能出现各类干扰,在设计时应考虑抗干扰措施【l 例。 ( 2 ) 机器人小车子系统 机器人小车子系统由通信接收模块、c p u 板、动力驱动装置和能源系统组 成,作为一个执行工具,机器人小车应能正确地接收上位机指令并根据指令要求 迅速完成决策子系统的意图( 带球、射门、拦截等战术动作) 。为了满足机器人 足球比赛的要求,机器人小车的运动性能尤为重要。机器人小车应具备高度的机 动性和灵活性,能够快速实现前进、后退、转弯、停车等基本动作。由于比赛环 境存在多种干扰,如电机的电火花对无线接收机及车载c p u 的干扰、强烈碰撞 造成的电缆插接件及机械零部件的松动等等,不仅对机器人的结构,而且对控制 系统的设计都有严格的要求。另外,可维护性也是很重要的,包括硬件可维护性 和软件可维护性。在硬件结构的设计上,要考虑便于安装和检修,软件的设计要 考虑采用模块化结构设计,便于调试、纠错和升级。微型足球机器人小车的设计 - 1 j 一 地 - 一 跳 - 费 - 一 比 - - - 一 引壬剧一 引甬一系雨一南一 讯商一 婵甫| 第一章绪论 主要涉及无线通信、自动控制及机械学等多个学科】。 ( 3 ) 通信子系统 根据比赛规则,机器人必须以无线方式通信。一般采用无线射频通信。主机 的控制指令通过计算机串口送至无线通信模块,调制后发送出去。机器人车载通 信接收器接收信号并解调,然后传送给车载微处理器。为了实现一对多的通信, 一般都采用广播式传送,所有机器人采用统一的通信频率,而发给不同机器人的 命令则根据不同的标识位进行区分。通常采用单向通信方式。通信子系统应该在 通信速度、通信质量等方面不断地改进和提高1 1 2 】。 ( 4 ) 决策子系统 决策子系统相当于足球机器人闭环系统中的控制器,是整个系统的大脑。他 将视觉系统传来的数据信息( 场上全部机器人的和球的位置坐标、方向角和运动 速度) 作为输入量,通过综合分析机器人和球的位姿信息、机器人和球的动态特 性、场上的进攻或防守态势、对己方的策略分配等诸方面,确定足球机器人的左、 右轮轮速,然后再通过通讯系统实现对足球机器人的控制。 1 5 足球机器人防守策略的研究现状及存在的问题 随着足球机器人比赛水平的不断提高,微型足球机器人系统由原先的3 v s 3 到现在的5 v s 5 再到1 l v s 1 1 ,双方队员的个数不断增多,场上机器人的增多了, 使多机器人的协作成为了可能。场上智能体的数目增加了,意味着场上的态势更 加复杂了,因此策略库的丰富性和完善性对球队取得比赛的胜利起着至关重要的 作用。 ( 1 ) 防守是足球机器人决策系统中的重要一环。不少球队采用六步推理 模型和四层决策结构构建防守策略系统【l3 1 ,框架结构通用性强,但需要进一步作 好细节处理工作。文献【1 4 】论述了当对方在不同区域控球时不同防守策略的选择 机制,以及采用某一防守策略时,各队员如何选择相应动作。文献 1 5 】对区域防 守的优缺点进行了分析,提出了一种改进的区域防守策略。防守策略的实施是通 过防守动作的组合来实现的,相比于进攻动作,不需要特别高的精度,不要求复 杂的轨迹规划,需要较高的速度等等。文献 1 6 】采用实时自组织模糊决策树进行 决策,将小球所在区域以及双方控球状态划分成1 2 种情况,针对每种情况提出了 相应的策略,该方法可以直接给出动作级决策结果,但决策结构有些复杂。文献 1 7 】列出了常见的反应行为,并给出了有利目标点的计算方法,其缺点是没有给 出一个合适的行为触发机制。文献 1 8 】把防守的过程分解为寻找防守对象寻找防 守动作和防守动作的执行三部分,防守者与防守对象之间是一一对应的关系。 第一章绪论 经过对大多数防守策略的研究发现,以往的防守策略都是以选择合适的队 员进行防守,再为该队员选择合适的动作为主线进行研究,而对多机器人的协作 防守方面研究比较少。由于比赛规则规定除守门员外,其它机器人无论从项部或 侧面看去机器人持球部分不能超过球的3 0 ,这就意味着足球机器人的持球能力 受到了很大的限制,使得机器人不能带球突然转过较大的角度,再加上我们所研 究的机器人没有踢球器,其传球能力也很低,这就使得防守时如果在局部取得人 数优势,使其协作防守成为了可能。 ( 2 ) 守门员的防守策略:守门员是防守的最后一条防线,守门员的动作 设计在整个系统设计中显然是非常重要的一环,守门员的活动范围一般都在禁区 之内,要选择一个合适的位置封锁对方的射门角度,并且当对方射门时能够及时 将球扑到。因此如何选择守门员的站位点,得到了研究者的广泛关注。 文献【1 9 】提出一种基于小球区域的防守算法。它把比赛场地划分成不同的 危险区,根据小球在不同区域的位置和运动方向来选择决策动作。这种方法处理 比较细致,对各种情况都能进行较为准确的判断。但是若场地划分过细,当球在 快速穿越多个区域时,其防守策略可能无法平滑过渡,致使防守失误。 文献【2 0 】提出一种滞后点防守策略。无论机器人在什么位置,采用统一的 算法决定守门员的位置。该方法简单实用。它还提出了双重预测防守策略,守门 员与防守队员配合防守,减轻了守门员的防守压力。但是若防守队员防守不当, 可能造成乌龙球。 文献【2 l 】:根据小球距球门的距离不同,对球门的威胁程度是不同的,将 场地划分成3 个区域:主危险区、次危险区和无危险区。当小球在场上处于不同的 区域时,守门员要采取相应不同的防守策略。 以上所介绍的守门员防守策略都是以矩形的形式对危险区进行划分的,而 这种划分是缺少理论依据的。同时,这些防守策略都是建立在假设对方进攻队员 撞球射门的基础之上,认为在无碰撞的情况下,球轨迹必为平面上的某一条直线, 在碰撞情况下,其轨迹也为一条折线,不会出现某段为圆弧的情况。由于本文所 论及的集控式m i r o s o t 足球机器人没有踢球器,采用撞球( p o o lb a l l ) 方式射门的 精度无法得到保证,且撞球后意味着本方控球权的丢失,因此在实际的比赛中, 多数的入球是由进攻队员直接推球( p u s hb a l l ) 射门实现的。同时,随着足球机器 人比赛水平的不断提高,比赛的双方越来越难把球送到对方门前,为了有效地利 用这为数不多的得分机会,很多球队加强了对射门算法的研究,出现了很多优秀 的射门算法,比如时间最优射门【2 2 】、曲线射门【2 3 】【2 4 】【2 5 】、基于遗传算法射f - j 2 6 】等, 如何提高守门员的响应速度和对不同射门算法的适应性,这给守门员策略的研究 提出了新的挑战。 第一章绪 论 1 6 本文要论述的主要内容 本文以f i f am i r o s o t5 v s 5 足球机器人为研究平台,集中对微型足球机器 人的防守策略进行了研究。 本论文内容安排如下: 第一章绪论。介绍了足球机器人的发展及其研究意义。简要介绍了微型足 球机器人的各个子系统的功能。提出了决策子系统需要解决的问题,并确定本文 研究重点。 在第二章里将对足球机器人决策系统的特点及设计要求进行分析,介绍决策 系统的整体模型及实现方法等,为防守策略的研究打下基础。 在第三章里将会对足球机器人整体的防守策略进行研究,划分了从前场到后 场的层次化模型,对局部配合防守策略的各种情况进行分析。针对守门员的重要 性和特殊性,对守门员策略进行专门的论述,以期寻找到一种更好守门员防守策 略。 在第四章里首先给出了微型足球机器人的运动模型,并在此基础上对仿真系 统的结构进行了论述,并对足球机器人守门员策略进行了仿真实验,以验证第三 章的守门员策略的合理性。 第五章总结及展望。 第二章足球机器人决策子系统分析 第二章足球机器人决策子系统分析 2 1 决策子系统的特点 在足球机器人系统中决策子系统的任务就是根据当前球场上的比赛态势,做 出部署,给队员发出指令,控制队员踢球的行为。显然这种思维过程必须是丰富 多彩和千变万化的。作为人类,球员的思维通常包括形象思维和逻辑思维两部分。 在激烈的体育比赛中通常以形象思维为主。球员不仅要思考自身如何踢好球,还 要兼顾与队友的配合。而在机器人足球比赛中,所有的这些思维过程都得由决策 子系统来完成。比如在赛场上具有如图2 1 所示的态势时:r 1 r 5 为我方机器人 e r l e r 5 为对方机器人,人类会立即看出r 3 防守位置比较好,应该前去抢球或 阻截等动作,r 4 应该协防,并防止对方球员e r 4 传球给e r 5 。然而机器人决策 系统从视觉子系统那里得到的只是一些包含机器人位姿和球的位置的数据信息, 这使人类形象思维的优势荡然无存。 图2 - 1 反映比赛瞬间态势的示意图 人类对球场信息的处理通常是在模糊概念上,如:远、近、快、慢、有利、 无利等概念,用人类特有的思维进行推理、决断。而决策子系统则是靠呆板的程 序语言和对精确的数据进行处理来工作的。如何将人类决策的思维过程形式化、 规范化,并用计算机程序表现出来,这属于知识工程的范畴,是崭新的前沿领域, 这也是机器人足球决策子系统的任务和难点所在。 第二章足球机器人决策子系统分析 通常足球机器人决策系统的任务是根据视觉子系统的辨识结果:场上实体 ( 机器人与球) 的位姿( 位置( x ,y ) 与朝向角0 ) ,来决定本方各机器人的左右轮速度, 以使各机器人走出期望的轨迹,实现理想的配合,在双方激烈的竞争中,将球踢 进对方的球门,并力争我方不失球。如果将视觉子系统得出的轮速和位置信息用 ( 2 m + 1 ) x 3 矩阵,表示( m 为识别机器人的个数) ,而将决策子系统发出的轮速信 息用( 疗2 ) 矩阵d 表示,其中n = 5 为我方机器人的个数。那么可以将决策子系统 的开发形式化为如下的函数关系: 0 = 厂( ,)( 2 1 ) | 足球机 ,数据。 卜、足球机 器人决 爿盥i 十 v ,1 。7 、“t 策系统 右轮速 设定b j |“、| 图2 - 2 决策系统输入输出模块图 公式( 2 1 ) 描述的决策系统是从状态空间到动作空间转换的过程。而图2 2 形 象地显示了决策系统输入量和输出量的情况,同时也说明了决策系统要完成的任 务。式( 2 1 ) 已经能够描述决策系统的工作过程了,不难看出它具有如下特征: 1 ) 描述是一个动态过程,而不是一个静态过程; 2 ) 没有唯一解,因为不同的决策算法有不同的解: 3 ) 无法给出解析解,因为除了部分演绎推理外,更多的函数关系表现为规则式 知识和产生式推理; 4 ) 求解复杂而困难,需要将模糊的形象思维转化为严谨的逻辑推理与数学计算 过程。因为在人类的足球活动中形象思维占有较大比例,而形象思维如何描 述和抽象还是没有很好解决的问题。 通过对足球机器人决策系统特点的分析,对决策子系统的设计提出了以下要 求: 1 ) 实时性:足球机器人比赛有快速时变的特点,一种情况不会维持很长时间 不变。这就要求决策系统在一种情况出现后立即产生相应的对策,否则会延 误战机,最终导致比赛失利; 2 ) 协作性:足球机器人系统是一个多个体系统,这就需要决策系统对这些机 器人的任务进行协调,使机器人能协同一起来完成一个共同的任务皲门 第二章足球机器人决策子系统分析 得分。 3 ) 学习能力和自适应性:足球机器人比赛过程中 h 现的情况很多,不同情况切 换的速度很快,对手的战术打法赛前也不知道,这就要求决策系统能对这些 变化做出及时合理地判断,对曾遇到的情况快速做出反应,对无经验的情况 具有学习的能力,通过学习逐渐地适应并寻找出应对的最佳策略,以适应遇 到各种对手的比赛。 4 ) 可扩展性:对于足球比赛来说,赛场上可能出现的情况实在太多,一两个 人是无法将所有情况都考虑周全。这就需要搭建一个开放式结构的决策系 统,以便吸收不同人的新鲜想法和做法,便于引进先进的算法,使系统逐步 充实,逐步完善。这样也可使决策系统具有很强的维护性。 2 2 决策子系统推理模型的分析 近年来,国内外学者提出了很多决策系统的设计思路,目前典型的策略研 究方法有场地分区法、四层决策澍2 8 1 、六步推理模型2 9 1 等等。 ( 1 ) 场地分区法 人为的在球场上划分出若干区域,然后根据小球所处的区域不同,采用不 同的战术策略。这种方法简单易行,体现了小球是决策系统的核一1 5 这一设计思想, 但是这种方法只注重小球位置,忽略了机器人位姿和机器人与小球的相对位置关 系等其他重要信息,并不能全面的表达球场形势,不能很好的适应快速动态变化 的球场形势;此外场地分区法也会影响机器人运动的连贯性,一致性。划分区域 可以采用等分法和不等分法,等分法在决策的同时还可以用于路径规划,但是却 不能表达球场不同区域的不同特性,而且过于细密的划分会增大程序的处理量。 ( 2 ) 四层决策法 四层决策法将决策系统自上而下划分为四个层次。具体划分如下: 信息预处理层:输入为( 2 所- t - 1 ) x 3 视觉辨识矩阵,通过预处理与特征状态提 取,提取出双方机器人的位置和方向以及小球的位置信息,进一步分析出各实体 之间位置关系,实体速度等决策信息,为进一步的态势分析和决策推理作准备。 高层决策层:通过对场上的实体位置、速度、角度、运动趋势的分析及敌 方策略的分析,决定我方的进攻防守策略,如全攻全守、层次化防守等。决策的 生成,是基于产生式推理。 1 策略与分区。不同的比赛策略,采用不同的分区方法。这将不等份场地 分区法引入到了四层决策法中。 2 策略与角色分配。策略不同,场上队员的目标和任务就不同,角色采用 第_ 章足球机器人决策子系统分析 的动作行为也不相同,角色的定义也就不同。 3 策略与队形。队形取决于比赛的策略,攻和守的队形是不同的,全攻全 守与攻守兼备策略下队形也是不同的,不同的策略要选择不同的队形完成策略任 务。 4 角色分配与转换。角色分配可以是静态的,每个队员有自己固定的角色, 方法简单;也可以是动态的,动态的角色分配更能适应多变,不定的球场状态, 动态的角色分配要有合理的角色转换条件。 5 其他决策与处理。例如冲突检测与处理;故障检测与处理;边界检测与 处理,犯规预防处理等。 底层策略层:根据高层决策采用的策略,在该层选择恰当的动作,动作选 择可以应用轨迹规划,遗传算法,人工势场法等算法,要综合考虑机器人运动学 与动力学模型,建立适应不同环境,完成不同任务的动作函数。 动作实现:决策系统最终输出的是我方机器人的左右车轮轮速,用以跟踪 规划好的路径,通过对轨迹的跟踪,完成各种动作,实现战术和战略任务。 ( 3 ) 六步推理模型 东北大学首先提出了这个推理模型,并将其运用到实际的比赛中。该模型 认为足球机器人的决策过程可以分为六个步骤:1 ) 输入信息与处理;2 ) 态势分 析和策略选择;3 ) 队形确定与角色分配;4 ) 目标位置确定;5 ) 运动轨迹规划; 6 ) 小车轮速确定。步骤1 ) 、4 ) 、5 ) 、6 ) 为演绎推理,可以由建立好的数学模 型计算出来;而步骤2 ) 和3 ) 为产生式推理,有专家系统完成。该模型符合一 种很朴素的解决问题的思路:先规划任务,在协调,最后执行。六步推理模型很 好的描述了f i r a 机器人的决策系统的决策思路,但是由于它将决策过程分解的 很细因此在决策系统中要关注很多细节,在实际决策中并不是十分适用。 2 3 决策子系统的设计 决策子系统设计应考虑以下几个问题: ( 1 ) 足球机器人比赛环境复杂。决策子系统面对的是一个复杂、动态、难 以准确得到模型的环境。决策子系统应能适应复杂的环境,为进一步的决策提供 良好的背景数据基础。 ( 2 )由于决策的目的就是取得比赛的胜利。所以决策子系统应该能适应并 击败对方,因此,策略库应该是开放性的,决策子系统应具有一定的自学习的能 力。 ( 3 )由于必须实时控制小车,因而决策必须满足实时性要求,能在较短的 第_ 章足球机器人决策子系统分析 时问内完成决策过程。决策时间越短,实时性越好。 我们将采用分层递阶控制的方法开发决策子系统,这是一种集中控制方式。 即用一个全局控制器,对五个机器人进行统一控制。 分层递阶控制方式对决策思路进行逻辑上的分层,一般来说,决策思路是先 确定机器人之间的协作关系,然后根据配合的要求确定每个机器人的运动方式。 分层的具体方式可以有一定的不同。 本文在传统的分层递阶式结构基础上,增加了紧急情况处理这条数据流通 道,数据可以在这两条数据流中有选择的流动,如图2 3 所示。 图2 3 混合式决策结构 数据流动方向由信息预处理的结果决定,即在信息预处理模块中存在一个数 据流向的仲裁器。这样的结构可以克服分层递阶式结构反应能力较差的缺点,又 可以使系统在局部上有灵活的反应能力,在全局上有长远的规划能力和较好主动 性、目标性。 左侧的数据流将决策系统分为态势分析、任务分配、动作选择与规划、动作 执行几个功能模块,由上及下,模块的工作范围越来越小,求解精度越来越高, 第章足球机器人决策子系统分析 系统智能则越来越低。 右侧的数据流用来快速处理紧急情况。人类在紧急情况卜,会直接应用常识 快速做出反应。模仿人类这一特性,在足球机器人遇到了紧急情况,态势分析, 角色分配等就显得烦琐而无用,直接通过紧急情况处理可以显著地提高反应的实 时性。 2 4 决策系统子模块常用研究的方法 2 4 1 决策系统态势分析研究 正如在传统的人类足球比赛中,一支球队不可能永远进攻,也不可能永远 处于防守状态,需要根据球场情况,实时的改变攻防转换,好的球队,球员能够 在整体上贯彻教练意图,就像有教练在随时告诉球员如何踢球。在机器人足球比 赛中,小车正如队员一样,需要教练决策系统的实时指导,决策系统也需要根 据球场上情况,如球场全部机器人的位置和姿态,小球位置和运动趋势等数据信 息,判断出当前环境下的攻守态势,及时地调整比赛战术策略,反馈到球场机器 人,由机器人完成战术意图。 态势策略研究采用信息融合技术。信息融合技术是对机器人足球比赛场上 实时数据进行处理、互联、评估以及多源信息组合,以获得准确的状态和身份估 计、完整而及时的赛场态势和威胁评估。信息融合技术强调三个核心方面: 1 ) 信息融合是在几个层次上完成对多源信息的处理过程,其中每一层都表 示不同级别的信息抽象; 2 ) 信息融合包含探测、互联、相关、估计以及信息组合; 3 ) 信息融合的结果包括低层次上的状态和身份估计,以及较高层次上的整 个战术态势估计。 目前,态势策略研究还没有一个完美的方法。信息融合技术、神经网络技 术、遗传算法、进化算法在态势分析研究中都有一定的效果。 2 4 2 任务分配研究 机器人足球比赛是在复杂动态环境下的多智能体系统活动,既存在协作又 存在对抗,并且机器人队员在赛场上的角色是需要适应环境变化的。如何做好角 色分配、协同动作设计研究,是机器人足球比赛策略的又一重要任务。 角色分配是任务分配的具体化,角色分配策略是对赛场上的形势进行分析 处理,因此需要对球场数据进行模糊化与抽象化,再根据一定的规则分配角色, 第,一章足球机器人决策子系统分析 使得足球机器人在比赛巾互丰h 配合、协同作战,更好地完成各自任务义不至于出 现冲突,提高系统的可靠性。角色分配一般包含以下三个子任务:确定队形,分 配角色和角色转换。 目前,应用于任务分解分配研究方法主要有: p e t r i 网方法:p e t r i n e t 作为决策过程建模的一种强有力的方法,既可以反映 静态变化过程,又能描述系统的动态过程。机器人足球系统具有离散事件系统的 特征。所以可以用p e t r i 网建立机器人角色转换模型【3 1 1 。 用p e t r i n e t 分析机器人足球角色转换关系清楚明了,容易找出转换规律。 在攻防转换过程中,两个机器人与小球距离与角度完全一样时,它们都有可能成 为主攻和主防,这是可以通过时间来决定优先权。即在t i 加入时间的函数,用 p e t r i n e t 也容易找出其冲突及解决办法。用p e t r i n e t 建立的机器人足球模型,容 易程序实现。基于p e t r i n e t 的机器人角色转换,直接明了,表达清楚。 增强式学习算法【3 2 】【3 3 】【蚓:增强式学习算法是一种无监督的学习方法,可以 通过逻辑智能体一机器人在决策程序中的对应的自学习能力,找出合理的任务分 配方法。增强式学习由于它的普遍适用性受到了广泛的关注,利用增强式学习来 提高移动机器人的适应能力是当前研究的热点。其中q 算法由于其实现简单, 在研究中应用最广。 2 4 3 动作策略研究 动作策略研究的是机器人队员的动作设计及其实现方法。根据机器人在球 场上所要完成的任务,最后可以分解为一个个不同的动作,因此动作是决策系统 的基础和核心。动作按照层次的高低,可以分为战术动作、技术动作、基本动作。 战术动作是技术动作和基本动作的组合,是机器人之间相互配合完成的动作,例 如一传一射、二过一等;技术动作是基本动作的组合,由单个机器人完成的动作, 如进攻、防守、守门等;基本动作是机器人完成的简单的动作,如到定点

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论