期刊文章详细信息

基于马氏决策过程模型的动态系统学习控制:研究前沿与展望 ( EI收录)
Learning Control of Dynamical Systems Based on Markov Decision Processes:Research Frontiers and Outlooks

文献类型：期刊文章

作　　者：徐昕[1] 沈栋[2,3] 高岩青[3,4] 王凯[3,5]

机构地区：[1]国防科学技术大学机电工程与自动化学院自动化研究所,长沙410073 [2]中国科学院自动化研究所,北京100190 [3]复杂系统智能管理与控制国家重点实验室,北京100190 [4]美国亚利桑那大学系统与工业工程学院 [5]国防科学技术大学军事计算实验与平行系统技术研究中心,长沙410073

出　　处：《自动化学报》

基　　金：国家自然科学基金(61075072;90820302;60921061);霍英东青年教师基金优选资助课题(114005);教育部新世纪优秀人才支持计划(NCET-10-0901)资助~~

年　　份：2012

卷　　号：38

期　　号：5

起止页码：673-687

语　　种：中文

收录情况：BDHX、BDHX2011、CSCD、CSCD2011_2012、EI(收录号：20122315093191)、IC、INSPEC、JST、MR、PUBMED、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘　　要：基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programming,ADP)理论与方法的研究进展,其中包括时域差值学习理论、求解连续状态与行为空间MDP的值函数逼近方法、直接策略搜索与近似策略迭代、自适应评价设计算法等,最后对相关研究领域的应用及发展趋势进行分析和探讨。

关键词：学习控制 MARKOV决策过程增强学习近似动态规划机器学习自适应控制

分类号：TP181] TP13]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于马氏决策过程模型的动态系统学习控制:研究前沿与展望 ( EI收录)
Learning Control of Dynamical Systems Based on Markov Decision Processes:Research Frontiers and Outlooks

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于马氏决策过程模型的动态系统学习控制:研究前沿与展望 ( EI收录) Learning Control of Dynamical Systems Based on Markov Decision Processes:Research Frontiers and Outlooks

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于马氏决策过程模型的动态系统学习控制:研究前沿与展望 ( EI收录)
Learning Control of Dynamical Systems Based on Markov Decision Processes:Research Frontiers and Outlooks