期刊文章详细信息

神经网络增强学习的梯度算法研究 ( EI收录)
A Gradient Algorithm for Neural-Network-Based Reinforcement Learning

文献类型：期刊文章

作　　者：徐昕[1] 贺汉根[1]

机构地区：[1]国防科学技术大学自动化研究所,长沙410073

出　　处：《计算机学报》

基　　金：国家自然科学基金 ( 6 0 0 75 0 2 0 )资助 .

年　　份：2003

卷　　号：26

期　　号：2

起止页码：227-233

语　　种：中文

收录情况：BDHX、BDHX2000、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊

摘　　要：针对具有连续状态和离散行为空间的Markov决策问题 ,提出了一种新的采用多层前馈神经网络进行值函数逼近的梯度下降增强学习算法 .该算法采用了近似贪心且连续可微的Boltzmann分布行为选择策略 ,通过极小化具有非平稳行为策略的Bellman残差平方和性能指标 ,以实现对Markov决策过程最优值函数的逼近 .对算法的收敛性和近似最优策略的性能进行了理论分析 .通过Mountain Car学习控制问题的仿真研究进一步验证了算法的学习效率和泛化性能 .

关键词：神经网络增强学习梯度算法 MARKOV决策过程值函数逼近机器学习

分类号：TP183]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

神经网络增强学习的梯度算法研究 ( EI收录)
A Gradient Algorithm for Neural-Network-Based Reinforcement Learning

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

神经网络增强学习的梯度算法研究 ( EI收录) A Gradient Algorithm for Neural-Network-Based Reinforcement Learning

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

神经网络增强学习的梯度算法研究 ( EI收录)
A Gradient Algorithm for Neural-Network-Based Reinforcement Learning