期刊文章详细信息
基于深度强化学习的机械臂控制快速训练方法
Fast Training Method for Manipulator Control Based on Deep Reinforcement Learning
文献类型:期刊文章
ZHAO Yinfu;FENG Zhengyong(School of Electronic Information Engineering,China West Normal University,Nanchong,Sichan 637009,China)
机构地区:[1]西华师范大学电子信息工程学院,四川南充637009
基 金:西华师范大学英才基金(17YC046);西华师范大学博士科研启动项目“异构无线网络流媒体传输QOE优化”(13E003)。
年 份:2022
卷 号:48
期 号:8
起止页码:113-120
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:人工智能在机器人控制中得到广泛应用,机器人控制算法也逐渐从模型驱动转变为数据驱动。深度强化学习算法可在复杂环境中感知并决策,能够解决高维度和连续状态空间下的机械臂控制问题。然而,目前深度强化学习中数据驱动的训练过程非常依赖计算机GPU算力,且训练时间成本较大。提出基于深度强化学习的先简化模型(2D模型)再复杂模型(3D模型)的机械臂控制快速训练方法。采用深度确定性策略梯度算法代替机械臂传统控制算法中的逆运动学解算方法,直接通过数据驱动的训练过程控制机械臂末端到达目标位置,从而减小训练时间成本。同时,对于状态向量和奖励函数形式,使用不同的设置方式。将最终训练得到的算法模型在真实机械臂上进行实现和验证,结果表明,其控制效果达到了分拣物品的应用要求,相比于直接在3D模型中的训练,能够缩短近52%的平均训练时长。
关 键 词:机械臂 位置控制 人工智能 深度强化学习 深度确定性策略梯度算法
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...