登录    注册    忘记密码

期刊文章详细信息

基于强化学习的参数自整定及优化算法    

Parameter self-tuning and optimization algorithm based on reinforcement learning

  

文献类型:期刊文章

作  者:严家政[1] 专祥涛[1,2]

YAN Jiazheng;ZHUAN Xiangtao(School of Electrical Engineering and Automation,Wuhan University,Wuhan 430072,China;Shenzhen Research Institute,Wuhan University,Shenzhen 518057,China)

机构地区:[1]武汉大学电气与自动化学院,湖北武汉430072 [2]武汉大学深圳研究院,广东深圳518057

出  处:《智能系统学报》

基  金:深圳市知识创新计划项目(JCYJ20170818144449801).

年  份:2022

卷  号:17

期  号:2

起止页码:341-347

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊

摘  要:传统PID控制算法在非线性时滞系统的应用中,存在参数整定及性能优化过程繁琐、控制效果不理想的问题。针对该问题,提出了一种基于强化学习的控制器参数自整定及优化算法。该算法引入系统动态性能指标计算奖励函数,通过学习周期性阶跃响应的经验数据,无需辨识被控对象模型的具体数据,即可实现控制器参数的在线自整定及优化。以水箱液位控制系统为实验对象,对不同类型的PID控制器使用该算法进行参数整定及优化的对比实验。实验结果表明,相比于传统的参数整定方法,所提出的算法能省去繁琐的人工调参过程,有效优化控制器参数,减少被控量的超调量,提升控制器动态响应性能。

关 键 词:强化学习  整定  优化  学习算法 时滞 控制器 液位控制 动态响应  

分 类 号:TP273]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心