登录    注册    忘记密码

期刊文章详细信息

强化学习算法与应用综述    

Overview on Algorithms and Applications for Reinforcement Learning

  

文献类型:期刊文章

作  者:李茹杨[1,2] 彭慧民[1,2] 李仁刚[1,2] 赵坤[3]

LI Ru-Yang;PENG Hui-Min;LI Ren-Gang;ZHAO Kun(Inspur(Beijing)Electronic Information Industry Co.Ltd.,Beijing 100085,China;State Key Laboratory of High-End Server&Storage Technology,Inspur Group Co.Ltd.,Beijing 100085,China;Guangdong Inspur Big Data Research Co.Ltd.,Guangzhou 510632,China)

机构地区:[1]浪潮(北京)电子信息产业有限公司,北京100085 [2]浪潮集团有限公司高效能服务器和存储技术国家重点实验室,北京100085 [3]广东浪潮大数据研究有限公司,广州510632

出  处:《计算机系统应用》

年  份:2020

卷  号:29

期  号:12

起止页码:13-25

语  种:中文

摘  要:强化学习是机器学习领域的研究热点,是考察智能体与环境的相互作用,做出序列决策、优化策略并最大化累积回报的过程.强化学习具有巨大的研究价值和应用潜力,是实现通用人工智能的关键步骤.本文综述了强化学习算法与应用的研究进展和发展动态,首先介绍强化学习的基本原理,包括马尔可夫决策过程、价值函数、探索-利用问题.其次,回顾强化学习经典算法,包括基于价值函数的强化学习算法、基于策略搜索的强化学习算法、结合价值函数和策略搜索的强化学习算法,以及综述强化学习前沿研究,主要介绍多智能体强化学习和元强化学习方向.最后综述强化学习在游戏对抗、机器人控制、城市交通和商业等领域的成功应用,以及总结与展望.

关 键 词:强化学习  算法  应用  多智能体强化学习 元强化学习  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心