期刊文章详细信息
文献类型:期刊文章
YAN Jiazheng;ZHUAN Xiangtao(School of Electrical Engineering and Automation,Wuhan University,Wuhan 430072,China;Shenzhen Research Institute,Wuhan University,Shenzhen 518057,China)
机构地区:[1]武汉大学电气与自动化学院,湖北武汉430072 [2]武汉大学深圳研究院,广东深圳518057
基 金:深圳市知识创新计划项目(JCYJ20170818144449801).
年 份:2022
卷 号:17
期 号:2
起止页码:341-347
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊
摘 要:传统PID控制算法在非线性时滞系统的应用中,存在参数整定及性能优化过程繁琐、控制效果不理想的问题。针对该问题,提出了一种基于强化学习的控制器参数自整定及优化算法。该算法引入系统动态性能指标计算奖励函数,通过学习周期性阶跃响应的经验数据,无需辨识被控对象模型的具体数据,即可实现控制器参数的在线自整定及优化。以水箱液位控制系统为实验对象,对不同类型的PID控制器使用该算法进行参数整定及优化的对比实验。实验结果表明,相比于传统的参数整定方法,所提出的算法能省去繁琐的人工调参过程,有效优化控制器参数,减少被控量的超调量,提升控制器动态响应性能。
关 键 词:强化学习 整定 优化 学习算法 时滞 控制器 液位控制 动态响应
分 类 号:TP273]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...