期刊文章详细信息
人群环境中基于深度强化学习的移动机器人避障算法
Obstacle Avoidance Algorithm for Mobile Robot Based on Deep Reinforcement Learning in Crowd Environment
文献类型:期刊文章
SUN Lixiang;SUN Xiaoxian;LIU Chengju;JING Wen(Institute of Intelligent Manufacturing,Yancheng Polytechnic College,Yancheng 224005,China;Tongji Artifical Intelligence Research Institute,Suzhou 215131,China;School of Electronics and Information Engineering,Tongji University,Shanghai 201804,China)
机构地区:[1]盐城工业职业技术学院智能制造学院,江苏盐城224005 [2]同济人工智能(苏州)研究院,江苏苏州215131 [3]同济大学电子与信息工程学院,上海201804
基 金:国家重点研究开发计划(2016YFD0700905);2020年江苏省产学研合作项目(BY2020338);2020年江苏省大学生创新创业训练计划项目(202013752028Y)。
年 份:2022
卷 号:51
期 号:1
起止页码:107-118
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:为了控制移动机器人在人群密集的复杂环境中高效友好地完成避障任务,本文提出了一种人群环境中基于深度强化学习的移动机器人避障算法。首先,针对深度强化学习算法中值函数网络学习能力不足的情况,基于行人交互(crowd interaction)对值函数网络做了改进,通过行人角度网格(angel pedestrian grid)对行人之间的交互信息进行提取,并通过注意力机制(attention mechanism)提取单个行人的时序特征,学习得到当前状态与历史轨迹状态的相对重要性以及对机器人避障策略的联合影响,为之后多层感知机的学习提供先验知识;其次,依据行人空间行为(human spatial behavior)设计强化学习的奖励函数,并对机器人角度变化过大的状态进行惩罚,实现了舒适避障的要求;最后,通过仿真实验验证了人群环境中基于深度强化学习的移动机器人避障算法在人群密集的复杂环境中的可行性与有效性。
关 键 词:深度强化学习 人机共融 行人空间行为 移动机器人避障
分 类 号:TP242.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...