登录    注册    忘记密码

期刊文章详细信息

神经网络增强学习的梯度算法研究  ( EI收录)  

A Gradient Algorithm for Neural-Network-Based Reinforcement Learning

  

文献类型:期刊文章

作  者:徐昕[1] 贺汉根[1]

机构地区:[1]国防科学技术大学自动化研究所,长沙410073

出  处:《计算机学报》

基  金:国家自然科学基金 ( 6 0 0 75 0 2 0 )资助 .

年  份:2003

卷  号:26

期  号:2

起止页码:227-233

语  种:中文

收录情况:BDHX、BDHX2000、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:针对具有连续状态和离散行为空间的Markov决策问题 ,提出了一种新的采用多层前馈神经网络进行值函数逼近的梯度下降增强学习算法 .该算法采用了近似贪心且连续可微的Boltzmann分布行为选择策略 ,通过极小化具有非平稳行为策略的Bellman残差平方和性能指标 ,以实现对Markov决策过程最优值函数的逼近 .对算法的收敛性和近似最优策略的性能进行了理论分析 .通过Mountain Car学习控制问题的仿真研究进一步验证了算法的学习效率和泛化性能 .

关 键 词:神经网络 增强学习  梯度算法 MARKOV决策过程 值函数逼近  机器学习  

分 类 号:TP183]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心