期刊文章详细信息
文献类型:期刊文章
ZHANG Rongxia;WU Changxu;SUN Tongchao;ZHAO Zengshun(College of Electronic and Information Engineering,Shandong University of Science and Technology,Qingdao,Shandong 266590,China)
机构地区:[1]山东科技大学电子信息工程学院,山东青岛266590
基 金:中国博士后科学基金特别资助项目(2015T80717);山东省自然科学基金(ZR2020MF086)。
年 份:2021
卷 号:57
期 号:19
起止页码:44-56
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊
摘 要:路径规划的目的是让机器人在移动过程中既能避开障碍物,又能快速规划出最短路径。在分析基于强化学习的路径规划算法优缺点的基础上,引出能够在复杂动态环境下进行良好路径规划的典型深度强化学习DQN(DeepQ-learningNetwork)算法。深入分析了DQN算法的基本原理和局限性,对比了各种DQN变种算法的优势和不足,进而从训练算法、神经网络结构、学习机制、AC(Actor-Critic)框架的多种变形四方面进行了分类归纳。提出了目前基于深度强化学习的路径规划方法所面临的挑战和亟待解决的问题,并展望了未来的发展方向,可为机器人智能路径规划及自动驾驶等方向的发展提供参考。
关 键 词:深度强化学习 路径规划 神经网络结构 AC框架
分 类 号:TP242]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...