期刊文章详细信息

基于PID控制更新的Sarsa强化学习算法及应用
Sarsa Reinforcement Learning Algorithm and Application Based on PID Control Update

文献类型：期刊文章

作　　者：吴雯珑[1] 龚谊承[1,2]

机构地区：[1]武汉科技大学理学院数学与统计系,湖北武汉 [2]武汉科技大学,冶金工业过程系统科学湖北省重点实验室,湖北武汉

出　　处：《应用数学进展》

年　　份：2022

卷　　号：11

期　　号：12

起止页码：8723-8733

语　　种：中文

收录情况：RCCSE、普通刊

摘　　要：针对强化学习中Sarsa算法收敛速度慢且效果不稳定的问题,考虑到PID控制操作简单且鲁棒性高,提出基于PID控制优化的Sarsa算法,即Pid_Sarsa。其主要思想是将Sarsa算法中Q值的迭代方式改进为三项之和,分别对应PID控制中的比例、积分和微分,体现了对当前、过去和未来的误差进行控制的思想,理论上提高了样本利用率。为了对比Pid_Sarsa算法与Sarsa和n_Sarsa(取n = 5)两种传统算法的效果,选择悬崖寻路这一经典路径规划游戏作为算例,实验表明:Pid_Sarsa算法收敛速度更快、效果更稳定,且得到的路径安全程度比Sarsa算法高2.38%,比5步Sarsa算法高4.76%。

关键词：强化学习 Sarsa PID控制路径规划

分类号：TP18]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于PID控制更新的Sarsa强化学习算法及应用
Sarsa Reinforcement Learning Algorithm and Application Based on PID Control Update

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于PID控制更新的Sarsa强化学习算法及应用 Sarsa Reinforcement Learning Algorithm and Application Based on PID Control Update

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于PID控制更新的Sarsa强化学习算法及应用
Sarsa Reinforcement Learning Algorithm and Application Based on PID Control Update