期刊文章详细信息
文献类型:期刊文章
XU Jianmin;ZHOU Xiangpeng;SHOU Yanfang(School of Civil and Transportation Engineering,South China University of Technology,Guangzhou 510640,Guangdong,China;Guangzhou Institute of Modern Industrial Technology,South China University of Technology,Guangzhou 510640,Guangdong,China)
机构地区:[1]华南理工大学土木与交通学院,广东广州510640 [2]华南理工大学广州现代产业技术研究院,广东广州510640
基 金:国家自然科学基金面上项目(61873098);广东省自然科学基金项目(2018A030313250);广东省科技计划项目(2016A030305001)。
年 份:2022
卷 号:41
期 号:8
起止页码:24-29
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊
摘 要:为了提高交通控制算法的适应性和鲁棒性,缓解城市交通拥堵,提出了一种改进的D3QN(dueling double deep Q-network, D3QN)自适应信号控制方法。首先对几种强化学习自适应控制模式进行分析,然后在固定步长动作模式的基础上提出了不定步长动作模式,并构造了一种基于空间占有率的奖励函数;最后使用Sumo软件,对中山市东区街道某交叉口分别在稳定流和随机流场景下进行仿真。仿真结果表明:该方法具有良好的收敛性,有效地降低了延误时间和排队长度。
关 键 词:交通工程 交通仿真 自适应控制 交通流 深度强化学习
分 类 号:U491.51[物流管理与工程类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...