期刊文章详细信息
文献类型:期刊文章
YANG Siming;SHAN Zheng;DING Yu;LI Gangwei(State Key Laboratory of Mathematical Engineering and Advanced Computing,Zhengzhou 450001,China;94162 Troops of PLA,Xi’an 710600,China;78100 Troops of PLA,Chengdu 610031,China)
机构地区:[1]数学工程与先进计算国家重点实验室,郑州450001 [2]中国人民解放军94162部队,西安710600 [3]中国人民解放军78100部队,成都610031
基 金:国家自然科学基金(61971092,61701503)。
年 份:2021
卷 号:47
期 号:12
起止页码:19-29
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:深度强化学习是指利用深度神经网络的特征表示能力对强化学习的状态、动作、价值等函数进行拟合,以提升强化学习模型性能,广泛应用于电子游戏、机械控制、推荐系统、金融投资等领域。回顾深度强化学习方法的主要发展历程,根据当前研究目标对深度强化学习方法进行分类,分析与讨论高维状态动作空间任务上的算法收敛、复杂应用场景下的算法样本效率提高、奖励函数稀疏或无明确定义情况下的算法探索以及多任务场景下的算法泛化性能增强问题,总结与归纳4类深度强化学习方法的研究现状,同时针对深度强化学习技术的未来发展方向进行展望。
关 键 词:深度学习 强化学习 深度强化学习 逆向强化学习 基于模型的元学习
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...