期刊文章详细信息
文献类型:期刊文章
机构地区:[1]吉林电子信息职业技术学院计算机系,吉林吉林132021
年 份:2011
卷 号:24
期 号:1
起止页码:47-49
语 种:中文
收录情况:CSA、CSA-PROQEUST、IC、INSPEC、RCCSE、普通刊
摘 要:强化学习不需要具有先验知识,通过试错与环境交互获得策略的改进,具有自学习和在线学习能力,是构造智能体的核心技术之一。文中首先综述了强化学习模型和基本原理,然后介绍了强化学习的主要算法,包括Sarsa算法、TD算法、Q-学习算法及函数估计算法,最后介绍了强化学习的应用情况及未来研究方向。
关 键 词:强化学习 Sarsa算法 瞬时差分算法 Q-学习算法 函数估计
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...