登录    注册    忘记密码

期刊文章详细信息

基于启发式深度Q学习的多机器人任务分配算法  ( EI收录)  

Multi-robot task allocation algorithm b Multirobot task allocation algorithm based on heuristically accelerated deep Q network

  

文献类型:期刊文章

作  者:张子迎[1] 陈云飞[2] 王宇华[2] 冯光升[2]

ZHANG Ziying;CHEN Yunfei;WANG Yuhua;FENG Guangsheng(College of Computer Science,JIAYING University, Meizhou 514015,China;College of Computer Science and Technology,Harbin Engineering University, Harbin 150001,China)

机构地区:[1]嘉应学院计算机学院,广东梅州514015 [2]哈尔滨工程大学计算机与科学技术学院,黑龙江哈尔滨150001

出  处:《哈尔滨工程大学学报》

基  金:国家自然科学基金项目(61502118).

年  份:2022

卷  号:43

期  号:6

起止页码:857-864

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD2021_2022、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:针对多机器人任务分配方法在环境复杂性增加时出现的维度灾难问题,本文提出了一种基于启发式深度Q学习的多机器人多任务分配算法。采用神经网络代替传统强化学习中的Q值,避免了强化学习在高维度空间下的状态-动作空间的局限性问题;将轨迹池引入深度Q学习算法中启发动作的选择策略,提高了算法的收敛速度;在动作选择决策之中引入动态探索因子,保证算法对环境中的未知空间的充分探索,进而提高算法的学习效率。通过实验证明:基于启发式深度Q学习的任务分配算法成功缓解了复杂环境下多机器人多任务分配的维度灾难问题,通过实验对比,证明基于启发式深度Q学习的任务分配算法在收敛速度和任务分配结果方面存在明显的提升。

关 键 词:任务分配  神经网络  强化学习  Q值 高纬度 启发式深度Q学习  维度灾难 动态探索  

分 类 号:TP242]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心