期刊文章详细信息
文献类型:期刊文章
YAN Jiaojie;ZHANG Qieshi;HU Xiping(Shenzhen Institute of Advanced Technology,Chinese Academy of Sciences,Shenzhen,Guangdong 518055,China;Shenzhen College of Advanced Technology,University of Chinese Academy of Sciences,Shenzhen,Guangdong 518055,China)
机构地区:[1]中国科学院深圳先进技术研究院,广东深圳518055 [2]中国科学院大学深圳先进技术学院,广东深圳518055
基 金:国家自然科学基金(U1913202,U1813205);深圳科技计划基础研究项目(JSGG20191129094012321,JCYJ20180507182610734)。
年 份:2021
卷 号:47
期 号:10
起止页码:16-25
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:路径规划作为移动机器人自主导航的关键技术,主要是使目标对象在规定范围内找到一条从起点到终点的无碰撞安全路径。阐述基于常规方法和强化学习方法的路径规划技术,将强化学习方法主要分为基于值和基于策略两类,对比时序差分、Q-Learning等基于值的代表方法与策略梯度、模仿学习等基于策略的代表方法,并分析其融合策略和深度强化学习方法方法的发展现状。在此基础上,总结各种强化学习方法的优缺点及适用场合,同时对基于强化学习的路径规划技术的未来发展方向进行展望。
关 键 词:路径规划 强化学习 深度强化学习 移动机器人 自主导航
分 类 号:TP242]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...