交叉口智能信号控制.ppt

上传人：y*** IP属地：广东上传时间：2020-01-15 格式：PPT 页数：60 大小：2.38MB 积分：30 举报 版权申诉

已阅读5页，还剩55页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

交叉口智能信号控制指导教师徐良杰教授小组成员安树科邹权韩冬成现代道路交通管理理论及应用 THEMAINCONTENTS 交叉口智能信号控制单路口智能信号控制随着经济的快速发展人民生活水平的不断提高社会对城市交通提出了更高的要求制约城市道路通行能力的瓶颈道路交叉口也越来越受到人们的重视提高交叉口通行能力和降低延误的最有效的方法之一就是交通信号控制信号控制研究范围涉及相位分配的确定性能函数的选取控制参数的确定和配时方案的生成及配套的硬件设备选取等多个领域 1 发展历程 2 交通信号控制系统的分类定时式脱机系统自适应控制系统智能控制系统点控方式线控方式面控方式 3 信号控制方法应用现状目前在全球范围广泛采用的交通信号控制系统包括澳大利亚的SCATS系统和英国的SCOOT系统 SCATS属于方案选择式控制系统每个交叉口配时方案根据子系统的整体需要进行选择现在上海运行着该系统 SCOOT属于方案生成式实时自适应控制系统采用小步长渐进寻优的方法连续实时地调整绿信比周期和时差3个参数北京已引进该系统国内其他城市交通控制系统应用情况 1 单路口智能信号控制定时控制根据以往观测到的交通需求按预先设定的配时方案进行控制因此它对交通需求的随机变化是无法响应的感应控制方法缺陷感应控制只能检测是否有车辆到达而不关心有多少辆车到达因此它无法真正响应各相位的交通需求也就不能使车辆的总延误最小例如设某相位最短绿时为10s 最大绿时为40s 单位绿延时为5s 则在5s绿延时结束前如果只有一辆车到达仍须给出5s的单位绿延时极端情况下重复上述过程直到最大绿时共放行了11辆车而在此期间下一相位车道却有15辆车等待绿灯很显然总的车辆延误没有达到最小 1 单路口两相位的模糊控制 1977年 Pappis等人设计了一种单路口两相位模糊逻辑控制器计算机仿真结果证实了该方法的有效性这是最早将模糊逻辑用于交通控制的例子下面从延误模型模糊算法和模糊控制几方面进行介绍 1 延误模型考虑两相位控制的十字路口东西向为一个相位南北向为一个相位假定各方向到达的车辆是随机的且到达的车辆数服从均匀分布两个方向的饱和流量均为3600veh h 无转向车流设则红灯相位开始后第n s 内的车辆排队长度为式中 p表示前一个绿灯期间未清完的车辆数则红灯期间排队车辆总的等待时间为如果在第n s 内有一辆车到达否则令s为饱和流量则绿灯相位开始后第n s 内未清完的车辆排队长度为式中为前一个红灯期间等候的车辆数上式括号里的数为正时 z取1 否则z为0 则绿灯期间车辆总的等待时间为因此一个周期内一个方向上的车辆总延误为有效红灯时间R s 内的延误有效绿灯时间R s 内的延误平均每辆车的延误模型为 2 模糊算法该算法主要控制绿灯的延时时间分别在绿灯的第7s 17s 27s 37s和47s实施控制在路口停车线前S m 处设置车辆检测器若测得车辆的速度为则其从检测器到临界点所花费的时间为例如南北方向绿灯持续到第17s准备实施控制时设在下一个10s中相继每一个时间单位1s横穿临界点南北方向的车辆数与等候的车辆数东西方向已由检测器得到分别为设准备实施控制时已有5辆车等候东西方向则下一个10s开始后各秒到达和等候的车辆累积数分别为引入以下模糊变量 T表示时间的模糊输入变量其取值为很短短中等等 A表示到达数的模糊输入变量此处指到达正在通行的车道上的车辆数其取值为很多极少等 Q表示等候车辆数的模糊输入变量其取值为任意很少等 E表示延长时间的模糊输入变量时间A和延长时间E的赋值表到达数A的赋值表等候车辆数Q的赋值表引入两种新的运算规则设为实轴上的模糊子集是其隶属度函数且是使达到最大的中的元素则和为定义在U上的模糊集且有很明显模糊集任意 any 在整个论域上都为1 3 模糊控制下面根据一些具体数据说明如何进行模糊控制以第2次控制即在绿灯第27s时为例并设即考虑下一个10s的第8s 即在以后的8s中如现在的信号灯不变则有4辆车通过临界点即在即在以后的8s中如现在的信号灯不变则有5辆车等候即信号灯的当前状态再保持8s 根据第二次控制中的第1条规则我们有类似地求得其余4条控制规则的隶属度分别为按照上述方法分别取则可得到控制决策表如下表所示由于延长10s 所对应的隶属度0 8为最大故决定控制器应保持当前状态10s不变每次控制均按上述过程进行如果模糊决策后要延长的时间小于10s 则系统将在延时结束后进行状态转换然后在下一个相位进行模糊推理如果表最后一行所有的值均小于0 5 则不进行延时系统的状态即相位要立刻转换如果表中的最后一行有两个或两个以上相同的最大值则取更长的那个延长时间模糊逻辑控制器与传统控制器的性能比较 2 单路口的神经网络自学习控制模糊控制规则一经确定就不再改变即不具备实时学习功能这样一来系统的信号控制效果完全依赖于控制规则的合理性和遍历性这对于交通状况复杂的路口特别是多相位路口是很难做到的针对单路口多相位信号控制方式提出了一种具有实时学习功能的神经网络信号控制方法 1 单路口的神经网络自学习控制在车流量大和车流复杂的情况下传统信号控制方法很难实施有效的控制但一个经验丰富的交通警察却能应付自如这说明可模拟交通警察思维的智能控制方法在复杂路口的信号控制方面有着广泛的应用前景设所研究的平面交叉路口为一个十字形交叉路口其中东西南北4个进口均具有左转直行和右转条车道 2 单路口的神经网络自学习控制交通警察交通指挥的过程首先将通行权交给某一方向在此期间他将不断评价目前的交通状况1 如果通行方向的大部分车辆已疏散而另一个方向车辆数增多他会把通行权交给另一个方向 2 如果各方向的车辆数均比较多则通行时间较长 3 如果各方向的车辆数均比较少则通行时间较短具有在线自学习功能的智能控制方案结构图 3 控制算法 1 评价准则评价准则环节的作用是评价一个评价周期内假设由6个信号周期组成某一信号配时方法的控制效果并由此评价准则修正信号周期和各相位的绿信比设为第i个信号周期结束时的总排队长度为第i个信号周期内第j个相位所有方向达到的车辆总数为第i个信号周期内第j个相位中所有方向放行的车辆总数为第i个周期结束时第j个相位所有方向车流排队长度之和为一个评价周期内各信号周期结束时的总排队长度的平均值为一个评价周期内各信号周期结束时第j个相位中所有方向车流的排队长度的平均值则有式中当括号内的数小于0时 z 0 否则z 1 且有定义将分为大较大中小和很小5档对应的周期增量分别为10s 7s 5s 0s和 5s 则为即为下一个评价周期内将要采用的新信号周期长度然后计算最后计算j 1 2 3 4 4 神经网络在该信号控制系统中两个神经网络作为控制器处于系统的底层任何时刻只有一个在工作而另一个则根据需要由评价准则确定处于学习或空闲状态输入输出 C和学习样本和训练方式神经网络的学习样本分两个阶段获取第一在网络运行前先将交警的指挥经验用规则的形式表示出来然后用这些准则来训练两个神经网络训练好的神经网络即可作为信号控制器投入运行由于控制信号是4相位的信号控制规则的获取比较困难且控制规则也往往不具备遍历性因而此时的神经网络性能还不是最优的还需要在运行过程中逐步进行优化第二在系统运行过程中每隔一个评价周期 6个信号周期按照前面所述的方法计算一次输入输出训练处于空闲状态的神经网络如此重复一个神经网络投入运行一个学习随着时间的推移训练样本将会越来越多网络训练也将会越来越困难为避免出现样本爆炸问题采取了所谓的样本截断法即事先规定训练样本的规模如300个可根据需要任意设定然后按照顺序移位的方式用新样本逐个淘汰旧样本神经网络自学习控制方法简称方法1 神经网络学习交警控制经验方法简称方法2 控制效果比较 2 基于智能体的信号交叉口控制基于智能体的信号交叉口控制交通信号控制系统在物理位置和控制逻辑上分散于动态变化的网络交通环境将每个路口的交通信号控制器看做一个异质的智能体非常适合采用无模型自学习数据驱动的多智能体强化学习方法建模与描述自Thorpe于1997年首次将强化学习 reinforcementlearning RL 方法应用于交通信号最优化控制以来多智能体强化学习 multi agentreinforcementlearning MARL 在区域交通自适应控制领域迅速发展并已有实际应用多智能体强化学习智能体它们单独的和环境进行交互在一种情况下它们各自优化自己的目标但这些目标之间有约束另一种情况下它们联合起来优化一个主要的目标方程根据具体的情况会有不同的变化绝大多数研究以假设的静态随机环境为研究对象采用完全孤立或部分状态合作的协调机制进行本地路口的最优化控制这制约了网络交通控制系统的整体效益近年来基于动作联动的MARL控制方法发展迅速其以联动协同的方式逼近全局最优的控制策略同时算法的验证也由假设的交通网络向现实的交通网络发展 MARL控制的演化发展 1 MARL控制系统的优势从控制理论来看 MARL控制可根据控制效果的反馈信息自主学习并优化策略知识是一种真正的闭环反馈控制从控制范围来看其可精确推理多个路口间的最优联合动作丰富了区域交通协调控制的内容及形式从控制实时性来看它没有复杂的模型优化模块采用秒级的即时决策可实时响应时变交通流的变化从系统可拓展性来看分散式MARL控制具有统一的结构模型可针对特定路网结构和交通流特性进行相应改造从系统兼容性来看 MARL控制本身仅需要系统的输入和输出数据对数据具体采集的技术和形式无要求交通信号RL智能体的标准模型如图1所示每个路口的交通信号机被抽象为一个智能体控制对象为道路交通网络上时变交通流 RL智能体与被控对象在闭环系统中不断进行交互通过观察交通环境的实时状态提取信号控制所需的交通状态信息和反馈奖励信息选择相应的行为动作并执行进而跟踪评测所选择动作的控制效果以累积回报收益最大化为目标优化控制策略直至收敛到状态和动作的最优概率映射因而 RL智能体将控制系统的优化过程按照时间进程划分为状态相互联系的多个阶段并在每个阶段根据当前状态进行最优决策这是典型的马尔可夫决策过程 Markovdecisionprocess MDPs 2 RL控制标准模型根据RL智能体学习频率及优化参数的不同交通信号RL优化技术分为周期式和非周期式控制 CyclicorAcyclic 两种类型其主要技术特征如表1所示 3 RL控制优化技术在相位结构和相位顺序固定的前提下周期式RL控制以周期绿信比和相位差作为控制方案的配时参数每隔当前周期的整数倍时间间隔采用RL算法对这些参数进行优化调整以响应路口交通需求波动这种优化技术的控制方案结构固定配时参数更新具有滞后性并通过相位差技术实现走廊方向的信号协调是一种响应式 responsive 自适应交通控制 1 固定周期式RL控制方法非周期式RL控制遵循感应信号控制的逻辑框架在满足交通控制基本约束的前提下根据时变交通流的波动每隔单位延长时间采用RL算法对相位结构相位顺序或绿灯时长进行优化以实时响应交通需求的变化这种优化技术摒弃了传统协调控制中周期和相位差的概念由实际交通流即时决策相位方案及相位时长并通过多个路口信号灯的联动实现区域交通协调控制以尽可能保证车队连续通行是一种实时 real time 自适应交通控制 2 非周期式RL控制方法交通网络MARL控制是单路口RL控制向随机博弈 stochasticgame SG 环境下区域交通网络的扩展以期通过多个路口RL智能体间的联动协调逼近网络交通流的最优均衡策略由于区域内全部RL智能体同时学习和同时决策每一个RL智能体都面临移动目标学习问题 moving targetlearningproblem 即本地智能体的最优策略将随着区域内其他智能体策略的变化而变化 4 交通网络MARL控制通过构建多路口间信号的联动协调机制采用基于协调的MARL进行系统的分散决策与优化根据智能体间交通状态和信号动作的协调水平交通网络MARL控制可分为三类完全独立的多智能体强化学习控制 totallyindependentMARL 部分状态合作的多智能体强化学习控制 partiallystatecooperationMARL 和动作联动的多智能体强化学习控制 joint actionMARL 此方法假设路口处于静态随机的交通环境即每个RL智能体的决策仅受路口本地状态和本地动作的影响只须通过在式 1 的更新规则中增加智能体的索引下标将单智能体RL控制方法直接拓展并应用到多个路口即可其基本形式如下 1 完全孤立的MARL控制部分状态合作的MARL控制通过智能体间的点对点通信获得上下游路口的交通数据并以此拓展本地RL智能体的交通状态的感知空间构造了部分状态联合的值函数提高其对动态随机环境的观察能力其基本形式如下 2 部分状态合作的MARL控制为同时克服MARL控制的同时学习挑战和决策挑战动作联动的MARL控制将式 1 中单智能体的状态和动作分别替换为动态随机环境下的联合状态和联合动作并在每一个博弈对策阶段估计均衡策略的值函数实现多个智能体间的同时对策如此反复迭代逼近最优策略以此寻找随机环境下系统的唯一均衡其基本形式如下 3 动作联动的MARL控制 5 基于智能体的信号交叉口控制研究现状城市交通信号控制系统具有典型的分布式特征且在时变的复杂交通网络环境下仅凭局部路口的优化不能表征整体网络的性能在交换关联路口信息的基础上仍需要设计路口间精细的协调机制采用联合的配时策略提升整体交通网络的控制效益智能体技术的自治性协作性和交互性符合分布式交通信号自适应控制的内在需求这体现在智能体路口信号控制器可以感知周围环境并及时响应环境变化且在没有人或其他因素的直接干预下智能体能够自发的根据目标和环境的要求主动做出规划实现交通控制的自动化同时通过各分布式路口智能体的相互协作构建多智能体控制系统 multiagentsystem 以实现全局路网的控制目标本部分从两方面综述智能体技术在城市交通信号控制系统及其关联领域中的应用包括基于智能体的交通控制系统架构研究基于智能体的交通信号控制方法研究 1 基于智能体的交通控制系统构架及平台传统的城市交通控制模型多采用集中式架构 SCATS系统 TUC系统及SCOOT系统子区内部分集中当路口规模扩大时集中式的控制系统不能满足大量交通数据的通信传输和控制策略的实时优化且系统维护难度大 PRODYN系统 OPAC系统和RHODES系统采用分散式架构有效均衡了集中式交通控制模型的通信需求和计算荷载但这类系统采用交通模型预测路口环境演化且不具备自学习能力在高饱和度等复杂交通条件下控制效果差多智能体系统又称分布式软件平台支持和管理智能体的运行智能体可分为静态智能体和移动智能体相应地多智能体系统分为静态智能体系统和移动智能体系统各个智能体模块作用于智能体网络系统的每个节点为使智能体和智能体系统可在异构的管理平台上相互操作智能体的设计应当符合智能体的通用标准近年来应用智能体技术实现全息交通数据环境下交通运输系统的优化成为研究和应用的热点之一但是只是少数学者研究采用智能体技术开发的控制系统构架可分为分层式网络式和混合式种分层式结构将整个系统分解成若干个子系统各子系统彼此之间的交互较弱网络式结构是一种完全分散的智能体系统各智能体之间相互通信且独立进行决策因而各分布式的智能体仅考虑局部效益不能从全局的角度预测整个网络状态混合式结构正是结合了分层式和网络式的特征进行设计 INTRYS和TRYSA2系统Hernandez比较了城市智能交通管理系统的两种结构集中分层式和分散网络式分别提出了INTRYS和TRYSA2两个系统并应用于相同城市交通网络的管理 INTRYS通过分层式结构对智能体进行协调管理而TRYSA2则采用网络分散式协调分析结果表明网络式结构具有高同步可重用及可拓展性好等特性但对具有高复杂度的协调任务分层式结构则优于网络式这是因为分层式结构搜索关联智能体进行计算的速度更快多数基于智能体技术开发的应用系统只关注由静态智能体组成的分布式多智能体系统为了验证移动智能体技术在智能交通系统中应用的潜力 Chen在提出的多智能体系统中集成了移动智能体用以提高既有系统大范围交通控制与管理的灵活性及自适应性并开发了一个符合IEEE的FIPA标准的移动智能体系统Mobile C 将其应用于交通的管理和检检与静态智能体相比移动智能体具有从网络中一个系统转移到另一个系统的能力具有减小网络负载支持断开控制支持异构环境动态生成组件等功能因而系统可在运行过程中实时地动态更新任务的代码及算法并采用移动智能体技术将其发送到目标子系统中执行研究表明智能体的快速移动特性为解决大范围交通控制与管理的挑战带来了新的机遇为实时远程交互卸载数据荷载跨平台操作以及定制化服务等带来了新的解决方案移动智能体系统Mobile C Wang等提出的一个基于智能体的网络级交通管理系统ADAPTS 该系统将一个复杂的网络控制算法分解成多个以任务为导向的控制智能体实现网络级的自适应交通信号控制 ADAPTS采用了级的分层式结构最高层负责规划和推理控制智能体的任务序列中间层负责协调和分派控制智能体最底层则实现各控制智能体的运行系统采用移动智能体技术实现各个控制智能体实现控制智能体在远程交通控制中心至现场交通控制器以及现场控制器之间的灵活转移以响应不同交通交件下交通需求变化有效提升了智能交能控制系统的灵活性 ADAPTS系统 TBMCS系统 Katwijk开发了一个面向道路交通管理的多智能体系统测试平台TBMCS 其支持在不同策略及条件下对多智能体系统系统性能进行测试和检验从而加快基于多智能体应用系统的原型设计与开发由智能体模型环境模型以及通信模型组成且通信模块符合标准分别模拟智能体的智能决策环境状态表达和协同交互城市化和机动化进程的加快交通拥堵交通安全和污染恶化等问题已成为世界各大城市共同面对的挑战传统集中式交通控制系统依懒于预测模型的精度且无法处理时变交通流的不确定性国内外许多学者开始应用智能体技术探寻大范围交通控制的智能解决方案包括城市交通控制 urbantrafficcontrol UTC 模型交叉口信号控制路径诱导与的集成系统以及分布式交通数据管理下表中列出了智能体技术在道路交通信号控制中的代表性研究 2 基于智能体的交通信号控制方法智能体技术在道路交通信号控制系统中应用智能体技术在道路交通信号控制系统中应用总结城市交通网络环境具有典型的动态性和随机性在不能完全获取交通系统状态信息不能完全理解系统内部机理不能建立被控对象精确模型的条件下基于MARL的交通信号控制方法仅利用控制过程的输入和输出数据自主寻找隐含的控制知

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

交叉口智能信号控制.ppt

文档简介

温馨提示

最新文档

评论

交叉口智能信号控制.ppt

文档简介

温馨提示

最新文档

评论

相关文档