期刊文章详细信息
文献类型:期刊文章
LI Ru-Yang;PENG Hui-Min;LI Ren-Gang;ZHAO Kun(Inspur(Beijing)Electronic Information Industry Co.Ltd.,Beijing 100085,China;State Key Laboratory of High-End Server&Storage Technology,Inspur Group Co.Ltd.,Beijing 100085,China;Guangdong Inspur Big Data Research Co.Ltd.,Guangzhou 510632,China)
机构地区:[1]浪潮(北京)电子信息产业有限公司,北京100085 [2]浪潮集团有限公司高效能服务器和存储技术国家重点实验室,北京100085 [3]广东浪潮大数据研究有限公司,广州510632
年 份:2020
卷 号:29
期 号:12
起止页码:13-25
语 种:中文
摘 要:强化学习是机器学习领域的研究热点,是考察智能体与环境的相互作用,做出序列决策、优化策略并最大化累积回报的过程.强化学习具有巨大的研究价值和应用潜力,是实现通用人工智能的关键步骤.本文综述了强化学习算法与应用的研究进展和发展动态,首先介绍强化学习的基本原理,包括马尔可夫决策过程、价值函数、探索-利用问题.其次,回顾强化学习经典算法,包括基于价值函数的强化学习算法、基于策略搜索的强化学习算法、结合价值函数和策略搜索的强化学习算法,以及综述强化学习前沿研究,主要介绍多智能体强化学习和元强化学习方向.最后综述强化学习在游戏对抗、机器人控制、城市交通和商业等领域的成功应用,以及总结与展望.
关 键 词:强化学习 算法 应用 多智能体强化学习 元强化学习
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...