登录    注册    忘记密码

期刊文章详细信息

强化学习的模型、算法及应用    

Reinforcement Learning Model,Algorithms and Its Application

  

文献类型:期刊文章

作  者:战忠丽[1] 王强[1] 陈显亭[1]

机构地区:[1]吉林电子信息职业技术学院计算机系,吉林吉林132021

出  处:《电子科技》

年  份:2011

卷  号:24

期  号:1

起止页码:47-49

语  种:中文

收录情况:CSA、CSA-PROQEUST、IC、INSPEC、RCCSE、普通刊

摘  要:强化学习不需要具有先验知识,通过试错与环境交互获得策略的改进,具有自学习和在线学习能力,是构造智能体的核心技术之一。文中首先综述了强化学习模型和基本原理,然后介绍了强化学习的主要算法,包括Sarsa算法、TD算法、Q-学习算法及函数估计算法,最后介绍了强化学习的应用情况及未来研究方向。

关 键 词:强化学习  Sarsa算法  瞬时差分算法  Q-学习算法 函数估计

分 类 号:TP301.6]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心