《电子技术应用》
您所在的位置:首页 > 人工智能 > 设计应用 > 干线动态协调控制的深度Q网络方法
干线动态协调控制的深度Q网络方法
《信息技术与网络安全》2020年第6期
郭瑝清1,陈 锋1,2
1.中国科学技术大学 信息科学技术学院,安徽 合肥230027; 2.安徽中科龙安科技股份有限公司,安徽 合肥230088
摘要: 为有效降低城市交通干线的车均延误与停车次数,将深度Q网络引入干线协调控制,给出了一种干线动态协调控制的DDDQN(Dueling Double Deep Q Network)方法。该方法结合双重深度Q网络与基于竞争架构深度Q网络,并将干线作为整体处理,通过深度神经网络挖掘干线各交叉口协调控制的相关性,基于Q学习进行交通信号控制决策。通过仿真实验,在近饱和流量和干线存在初始排队的情况下,将DDDQN方法与现有绿波方法,以及经典深度Q网络、双重深度Q网络、基于竞争架构深度Q网络的干线协调控制算法进行对比,实验结果表明基于DDDQN的干线动态协调控制算法性能优于其他四种方法。
中图分类号: TP181
文献标识码: A
DOI: 10.19358/j.issn.2096-5133.2020.06.001
引用格式: 郭瑝清,陈锋. 干线动态协调控制的深度Q网络方法[J].信息技术与网络安全,2020,39(6):1-6.
A deep Q network method for dynamic arterial coordinated control
Guo Huangqing1,Chen Feng1,2
1.School of Information Science and Technology,University of Science and Technology of China,Hefei 230027,China; 2.Anhui LoongSec Science and Technology Ltd.,Hefei 230088,China
Abstract: In order to effectively reduce the average delay and number of stops for urban traffic trunk roads,a deep Q network is introduced to arterial coordinated control, and a DDDQN(Dueling Double Deep Q Network) method is presented in this paper. This method combines the double deep Q network and the dueling deep Q network, and views the trunk road as a whole. The deep neural network is applied to find the correlation of the coordinated control for each intersection in the trunk road, and Q learning makes these decisions for traffic signal control. Through simulation platform, in the condition of near saturation and initial queue, the method proposed in this paper is compared with the existing green wave method, the arterial coordinated methods respectively based on deep Q network, double deep Q network, and dueling deep Q network. The experimental results show that the performance of DDDQN algorithm is better than the other four methods.
Key words : urban traffic;arterial coordinated control;deep Q network;double deep Q network;dueling deep Q network

随着城市人口的增多与经济的快速发展,我国汽车保有量不断增长,城市交通拥堵问题日益严峻。而城市交通干线是城市交通的动脉,实现干线各交叉口间交通信号的动态协调,有效地疏导干线车辆,对于缓解城市交通拥堵具有重要意义。

       目前,城市主干道多交叉口的协调控制,主要采用Maxband和Multiband法以及图解法、数解法等绿波方法。LITTLE J D C等人最早提出最大绿波带宽Maxband模型;GARTNER N H等人在Maxband模型的基础上,提出复合绿波带宽Multiband模型;陈昕等人对图解法进行了优化,基于绿波带的中心线交点,设计了一种新的双向绿波图解法;卢凯等人[在绿灯中心点型双向绿波协调设计数解法的基础上,建立了一种绿灯终点型的双向绿波数解法,从而减少了干线车队的延误时间;曲大义等人在绿波协调中考虑了公交车辆的影响,并通过增加绿信比与对公交车辆适当的提速,进一步提升了交叉口的通行效率。

       现有的绿波方法难以准确地描述复杂的城市干线交通流状态,且采用静态的控制模式,无法有效地协调时变的干线交通流。随着人工智能的不断发展,采用深度强化学习实现城市交通信号优化控制已成为研究的热点。HA-LI P等人为提高交叉口通行能力,提出了一种基于深度强化学习算法的单交叉口信号优化控制方法;GAO J等人提出一种深度强化学习算法,从实时的交通流数据中自动提取有用特征,实现单交叉口交通流的自适应控制,并采用经验回放和目标网络技术,提高了算法的稳定性;LI C C等人为提高城市路网通行能力,提出了一种用于区域交叉口交通信号控制的深度强化学习算法,通过多智能体学习最佳的交通信号控制策略;VAN DER POL E采用Max-plus算法和基于深度强化学习的多智能体方法,实现城市交通区域协调控制。

       在深度强化学习领域,目前对于城市交通信号控制的研究,多以单交叉口为研究对象,而对于多交叉口的协调处理,普遍采用多智能体的协调控制。本文结合了双重深度Q网络(Double Deep Q Network,Double DQN)与基于竞争架构深度Q网络(Dueling Deep Q Network,Dueling DQN),设计了基于DDDQN(Dueling Double Deep Q Network,DDDQN)的干线动态协调控制算法。通过将干线多交叉口的交通信号作为一个整体进行处理,相比于采用多智能体协调控制,减轻了智能体间通信协调的负担,且智能体通过获取多交叉口的实时状态,掌握干线全局信息,并使用Dueling DQN网络结构模型,能更充分地发挥网络提取干线交通流特征的能力,挖掘出多交叉口间协调控制的相关性。实验结果表明,本文方法相比于现有绿波方法、经典的深度Q网络(Deep Q Network,DQN)、以及Double DQN与Dueling DQN,能够更有效地降低城市主干道的车均延误和车辆的停车次数等重要的交通评价指标。



本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003143


作者信息:

郭瑝清1,陈  锋1,2

(1.中国科学技术大学 信息科学技术学院,安徽 合肥230027;

2.安徽中科龙安科技股份有限公司,安徽 合肥230088)


此内容为AET网站原创,未经授权禁止转载。