1 引言
Agent 是运行于动态环境中的具有较高自制能力的实体,具有自主性、分布性、协调性和一定学习、推理能力。多智能体系统通过Agent 间的通讯、合作、协调和控制表达系统功能及行为特性。城市交通系统是自然的、分布的、复杂的、动态的、规模庞大的系统,采用多Agent 技术建模城市交通系统可为交通决策者和使用者提供良好的解决方案。从二十世纪80 年代末,就有学者将多Agent 技术引入到城市交通系统的建模中,利用其协作、存储、智能性和自治性为使用者提供在线决策支持、实时交通控制,或利用其对客观世界的准确描述进行交通系统运行仿真,发现交通系统中的问题、规律或验证新的理论和算法。本文从ITS 框架中的先进的交通管理系统(ATMS)、先进的出行者信息系统(ATIS)、先进的公交系统(APTS)三个方面对Agent 技术在城市交通系统中的应用现状展开论述,最后指出多Agent 技术在城市交通系统的应用中需解决的问题以及发展趋势。
2 多Agent在ATMS中的应用
在ATMS 中,多Agent 技术主要用于提供实时的决策支持并进行适当的管理控制。根据Agent 慎思型和反应型两种模型结构,建构基于Agent 的城市交通管理系统也有两种思路:分层递阶式和完全分布式。
2.1 分层递阶式结构
分层递阶式结构的每一级都由功能、结构类似的Agent 组成,同级Agent 间可相互协调,上级Agent可作为对应下级Agent 的协调单元,下级Agent 向所属上级Agent 传输局部系统环境和系统控制的反馈信息,为上级Agent 提供决策依据。最早的分层递阶式系统就是KITS 和TRYS.
KITS 产生于在1992-1994 年间,将交通领域知识分解成与路网拓扑结构相匹配的单元集合,提供专门的推理机制进行交通决策和管理。如图1 所示,底层的Agent 通过协作完成交通监控和管理任务,Actor 是直接和问题区域对应的交通评价和管理单元,Supervisor 负责全局路况分析、解释以及合成全局行动方案。KITS 的成功表明:基于知识的模型可以和多Agent 技术相集合来提高城市交通系统的监控和管理能力。
图 1 KITS 架构图
TRYS 是在1991-1994 年间建立的实时自适应的交通管理决策系统。如图2 所示,TRYS 的结构与KITS 相似,通过Agent 访问实时采集的路况数据,并由Agent 内部的知识库和推理引擎对数据进行分析处理,coordinator 负责协调各Agent的工作以形成全局解决方案。与KITS 不同的是,TRYS 中的问题区域由独立的、功能强大的Agent负责监督。
图 2 TRYS 架构图。
翟高寿和Choy根据递阶控制结构理论及城市交通系统的结构特征,提出了四层的分层递阶式结构,分别是:决策层(城市交通控制决策系统)、战略控制层(若干区域协调控制系统)、战术控制层(若干路口控制系统)、执行层(检测器、信号控制器和信号灯等)。
该结构的协调控制策略在TRYS 基础上进一步下放到了路口级,建立了路口Agent,每个路口成了一个智能的知识系统,可及时根据路口交通状况进行控制策略的实时部署与调整,更好地适应了交通系统动态性、实时性强的特点,对突发性交通流的变化有很好的适应和调节能力。
2.2 完全分布式结构
在完全分布式结构的系统中,Agent 凭借自身的知识和智能与相邻区域Agent 协调共同完成路口的管制。最初的应用就是西班牙的TRYSA2 系统,如图3 所示。TRYSA2 Agent 有一个控制计划集,每个计划都被赋予了能够减轻交通压力的效用值。系统可通过评估相关Agent 的计划效用值合成系统最优的解决方案。Oliveira 、承向军、杨兆升等学者也先后提出了以路口Agent 为基本控制单元的完全分布式控制结构,系统中的Agent 都具备了一定的存储、匹配和智能计算功能,可依靠良好的协调算法实现多Agent 之间的协调与合作以达到整体优化和控制的目的。
图 3 TRYSA2 架构图。
2.3 两种架构的性能比较
分层递阶式充分体现了集中和分散控制的有机结合,考虑到了全局利益,可使协调有目的地进行,但是区域Agent 和主控Agent 的实现稍显复杂。完全分布式具有反应快速、灵活性强等特点,可充分发挥Agent 的自治性、协调性,但由于Agent 自身能力有限、系统的知识又过于分散,解决全局问题的能力略显不足,Agent 间的协调机制会对系统性能产生较大影响。在扩展性上,完全分布式只需把新Agent 注册到其他Agent 中并修改相应的方案和知识库即可将新Agent 扩充到当前的Agent 群体中,而分层递阶式需要整合区域控制中心和主控中心,重新赋予各Agent优先权关系。在协作复杂度上,分层递阶式从每一个Agent 控制方案中选择一个本地最优的方案,完全分布式在所有的Agent 中通过搜索策略来查找最佳方案,因此后者工作量较大。
2.4 多Agent 的协调控制与优化
多Agent 通过协调实现系统的分布式并行运行,提高任务的执行效率。在基于多Agent 的ATMS 中,有三种协调方式:①建立专门的协调Agent;②将协调行为分散至各Agent 中,由Agent 自主地完成;③集中与分布相结合的方法,Agent 自身即可以完成某些协调行为,又可以接受高层Agent 制定的规划。当前常用的协调方法有黑板模型、博弈模型、协调器、交换意见等。
黑板模型信息传输量大,对信息传输的稳定性也有一定的要求,适用于简单的分布式多路口控制。博弈论模型适用于分层递阶结构的上下级Agent 间和完全分布结构的同级Agent 间的协调,但由于重复博弈过程中需要进行复杂的均衡点收敛控制,所以基于交通信息博弈的计算量较大。协调器可基于一定的目标将同级和下级Agent 产生的提案合成全局的提案。协调器降低了系统的通信量和其他Agent 的实现复杂度,但却增加了协调器Agent 自身的设计复杂度和计算量。交换意见法对系统通信的稳定性有很大的要求,当单个Agent 节点出现通信故障时,系统将无法正常工作。
从上述几种方法的分析中可以看到,协调过程需要传输大量数据,因此容易造成传输网络的拥塞。目前,很多学者都采用强化学习的方法来优化本地的交通信息。强化学习方法是以环境提供的加强信号作为性能评价的反馈,完成从状态到行为的映射的学习,特别适合处理不断变化的路网环境。Baher、欧海涛等都基于强化学习研究了实时自适应的交通信号控制,减少路口节点间的大量通讯需求,增强了决策的可靠性。
2.5 相关应用研究
Ronald通过将分离独立的交通设施建模成能互相协作的Agent,研究了动态交通管理设备互相协作的可能性。Filippo实现了一种基于多Agent 架构的交通管理系统CARTESIUS,在分析偶发性阻塞和在线制定集成控制方案过程中展示了良好的协作推理和解决冲突的能力,可为交通管理人员协调多区域间的快车道和地面街道的路网阻塞提供实时决策支持。
Bo Chen等人将移动Agent 技术融入到交通管理系统中,增强了处理不确定事件和环境动态变化的能力,提出了一种基于柔性Agent 的实时交通检测和管理系统。
3 多Agent在ATIS中的应用
ATIS 可以影响出行行为,增强路网性能。当前采用Agent 技术研究ATIS 主要是针对不同的出行需求构建各式智能的出行信息系统,为出行者提供高质量的出行信息和导航服务;另外是研究ATIS 条件下的出行者行为以及ATIS 对城市交通的影响。
3.1 基于Agent 的典型出行信息系统框架
为实现路网管理者和出行者之间的有效协调,需要在不严重影响个体出行者的使用偏好(出行类型、路径选择、离开/到达时间等)基础上有效地基于时空二维分配路网。基于此,Adler 和Blue 研究了智能出行信息系统(IT IS),专为出行者提供出行计划和导航辅助信息,提出一种代表出行者的车载智能导航Agent,可以学习、定义并校准路径和出行计划偏好。在此基础上,他们又提出基于多Agent 的交通管理和路径导航协作系统(CTMRGS)的概念框架,使路网管理者、信息提供者和出行者之间能有效的协调和沟通。系统采用原则协商指导出行者Agent 和信息提供者Agent 之间的交互,找到一个时最优的出行方案,最后指出更多的智能将会被用来捕捉和呈现出行者的真实意图和行为。
3.2 ATIS 影响下的基于多Agent 仿真的出行者行为研究
ATIS 的有效性取决于系统提供信息的能力以及出行者对出行信息的反应。因此,了解出行者的行为及其在出行信息下的决策过程便显得尤为重要,这将有助于设计出高效的ATIS.目前,国内外很多学者都采用Agent 仿真方法研究ATIS 环境下的出行者行为。
Dia首先提出利用多Agent 仿真来研究实时交通信息影响下的驾驶员行为。通过对驾驶员行为(特性、心理、知识、偏好等)的调查采用BDI(信念-渴望-意图)结构建模,配合交通仿真组件评价交通实时信息对驾驶员行为的影响。Rossetti基于BDI 架构提出了基于DRACULA(一种结合用户学习和微观模拟的动态路径分配模型)的多Agent 扩展模型对出行者进行建模,允许出行者对出行路径和离开时间做出理性选择。
驾驶员的行为会影响到ATIS 系统收益和系统的整体性能。Rossetti 基于谓词逻辑表达方式对出行者Agent 建模,使决策过程中呈现了更多的出行者心理因素。仿真结果表明,系统的整体性能会受到出行信息需求和交通网络拓扑结构的影响,当出行信息单独向个体提供的时候,总体影响可以得到很大改善。
Joachim将出行者建模成Agent,基于两条平行路径的路网分析了ATIS 环境中的出行者路径选择行为,研究指出出行信息的特性很大程度上影响了ATIS的潜在收益。赵凛在Joachim 的基础上,通过对系统中的微观行为建立基于Agent 的仿真模型来观察系统"涌现"出来的宏观特征。仿真结果显示ATIS对通勤者出行前的出行规划有一定影响,随着交通量的增加,交通系统的不确定性也随之增加,ATIS 系统收益会有所提高。
3.3 相关应用研究
Zargayouna提出了一种基于Agent 的出行者信息服务中心架构,通过实例化大量的交通实体,建立了基于环境的服务、信息资源和出行者主动交互支持模型,允许实体间建立各自感兴趣的交互。
Wahle提出了一个基于多Agent 的实时交通流在线仿真和预测框架,通过历史数据的启发结合当前动态数据可提供对路径选择行为和交通走向的短期预测。王健采用数据挖掘中的决策树方法获取出行者信息需求,使用Agent 技术建立了基于移动终端的信息服务网络框架。Chou构建了基于多Agent的停车导航协商网络,将汽车、停车场和导航系统建模成Agent,通过各Agent 的协作为驾驶员选择价格和路线最优的停车场。
4 多Agent在APTS中的应用
4.1 基于多Agent 的公交运行状态检测
公交运行状态检测对于确保公交系统的正点到站、运行具有重要的意义。采用AVM 系统获取公交运行数据进行扰动(延迟和超行)检测缺乏对全局路况的总览而且稳定性差,很难提供基于时空二维的路况进展状态。因此,Flavien提出了采用多Agent 技术诊断公交扰动以及检测定位数据传输的连贯性。公交车和站点被建模成Agent,站点Agent 备有公交运行时间表,负责计算公交到站后的调度;公交车Agent负责向STOP Agent 报告路网实际状态,供STOPAgent 将车辆到达的理论时间和当前实际时间相比较以检测公交扰动。在此基础上,他们又对扰动的整个生命周期进行了动态建模,把扰动模型融合到多Agent 决策支持系统中,研究了扰动对路网活动的影响。模型包括三个信息区域:后继区域(延迟公交车后继站点),关键区域(延迟公交车所在的站点),先前区域(延迟公交车的前驱站点)。如图4 所示,最底层的STOP Agent 接收BUS Agent 传来的信息,中间层的STOPAREA Agent 负责从STOP Agent 中收集信息合成交通评价、客流信息、路况进展系数等,顶层的INCIDENT Agent 形成综合的实时调度决策。
图4 基于分级多Agent 公交扰动检测框架图。
4.2 基于多Agent 的公交系统运行仿真
公交系统的运行仿真可用于调整公交调度、评价公交路网结构以及制定策略。David采用多Agent仿真方法描述了公交系统运行,将公交车和出行者建模成Agent,所有的模型都结合了公交操作、出行者行为和道路交通负载。文中使用了多项logit 模型配备交通需求,评价了步行、汽车、公交模式的效用,并基于效用模型制定了出行者的出行路线和交通行为。仿真主要关注了公交乘客载荷和乘客等待时间。
仿真结果表明,通过将公交车和出行者建模成Agent,可方便地模拟公交车在运行过程中可能出现的各种状况(饱和、不足),为特殊事件(事故、阻塞)的发生制定有效的调度策略。
5 结论与展望
ITS 的将来会被各式智能、自治的Agent 布满整个交通系统中,通过互联网、无线网络或自组织网络连接,不断采集信息做出智能决策,最终使交通系统获得彻底的智能。要使Agent 发挥更大的作用,还需要在实际应用中充分考虑城市交通系统及其内含实体的特点(出行方式特征、交通规则、路网结构、出行心里),缓解通信需求、降低运算量及协调复杂度、优化系统组织结构、增强系统的稳定性和安全性。多Agent 今后在城市交通系统中的研究方向应主要集中在以下几方面:
(1) 多个Agent 系统的信息融合,如在交通管理系统、出行信息系统、导航系统、停车系统间共享信息,通过协调多系统的工作,提高路网运行效率和出行信息服务质量;
(2) 针对城市交通系统存在的问题,研究面向特定应用领域的多Agent 系统结构、协调算法和组织优化技术,形成规范的技术体系,包括通信环境、建模方法、评价方法等;
(3) 将更多Agent 新技术引入到城市交通系统设计当中,如移动Agent、Agent 规范、Agent 体系结构、Agent 通信和语言、Agent 组织与联盟、Agent学习与规划、Agent 协商与协调等方向上的新技术;
(4) Agent 技术理论研究在城市交通中的应用已形成一定的规模,如何更高效地发挥Agent 的特性使之与城市交通更紧密的结合与适应将会成为新的研究热点;
(5) Agent 的广泛应用会把更多的人工智能、系统工程、控制理论、优化算法和分布式计算技术引入到实际的交通问题解决中来,为Agent 的具体应用提供更多的新思路。