期刊文章详细信息
基于深度强化学习的机器人运动控制研究进展 ( EI收录)
Research progress of robot motion control based on deep reinforcement learning
文献类型:期刊文章
DONG Hao;YANG Jing;LI Shao-bo;WANG Jun;DUAN Zhong-jing(School of Mechanical Engineering,Guizhou University,Guiyang 550025,China;State Key Laboratory of Public Big Data,Guizhou University,Guiyang 550025,China;Key Laboratory of Advanced Manufacturing Technology of Ministry of Education,Guizhou University,Guiyang 550025,China)
机构地区:[1]贵州大学机械工程学院,贵阳550025 [2]贵州大学省部共建公共大数据国家重点实验室(筹),贵阳550025 [3]贵州大学现代制造技术教育部重点实验室,贵阳550025
基 金:国家重点研发计划项目(2018AAA0101803);国家自然科学基金项目(51475097,91746116);工信部资助项目(工信部联装[2016]213号);贵州省科技计划项目(黔科合人才[2015]4011);贵州省重点实验室建设项目(黔科合平台人才[2016]5103);贵州大学培育项目(贵大培育[2019]22号)。
年 份:2022
卷 号:37
期 号:2
起止页码:278-292
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD2021_2022、EAPJ、EI、IC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:复杂未知环境下智能感知与自动控制是目前机器人在控制领域的研究热点之一,而新一代人工智能为其实现智能自动化赋予了可能.近年来,在高维连续状态-动作空间中,尝试运用深度强化学习进行机器人运动控制的新兴方法受到了相关研究人员的关注.首先,回顾了深度强化学习的兴起与发展,将用于机器人运动控制的深度强化学习算法分为基于值函数和策略梯度2类,并对各自典型算法及其特点进行了详细介绍;其次,针对仿真至现实之前的学习过程,简要介绍5种常用于深度强化学习的机器人运动控制仿真平台;然后,根据研究类型的不同,综述了目前基于深度强化学习的机器人运动控制方法在自主导航、物体抓取、步态控制、人机协作以及群体协同等5个方面的研究进展;最后,对其未来所面临的挑战以及发展趋势进行了总结与展望.
关 键 词:复杂未知环境 人工智能 高维连续空间 深度强化学习 仿真至现实 机器人运动控制
分 类 号:TP242]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...