期刊文章详细信息

基于BP神经网络的双层启发式强化学习方法 ( EI收录)
A Heuristic Two-layer Reinforcement Learning Algorithm Based on BP Neural Networks

文献类型：期刊文章

作　　者：刘智斌[1,2] 曾晓勤[2] 刘惠义[2] 储荣[2]

机构地区：[1]曲阜师范大学信息科学与工程学院,山东日照276826 [2]河海大学计算机与信息学院,南京210098

出　　处：《计算机研究与发展》

基　　金：国家自然科学基金项目(60971088;60571048)

年　　份：2015

卷　　号：52

期　　号：3

起止页码：579-587

语　　种：中文

收录情况：AJ、BDHX、BDHX2014、CSA-PROQEUST、CSCD、CSCD2015_2016、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘　　要：强化学习通过与环境交互的方式进行学习,在较大状态空间中其学习效率却很低.植入先验知识能够提高学习速度,然而不恰当的先验知识反而会误导学习过程,对学习性能不利.提出一种基于BP神经网络的双层启发式强化学习方法 NNH-QL,改变了传统强化学习过程的盲目性.作为定性层,高层由BP神经网络构成,它不需要由外界提供背景知识,利用Shaping技术,将在线获取的动态知识对底层基于表格的Q学习过程进行趋势性启发.算法利用资格迹技术训练神经网络以提高学习效率.NNHQL方法既发挥了标准Q学习的灵活性,又利用了神经网络的泛化性能,为解决较大状态空间下的强化学习问题提供了一个可行的方法.实验结果表明:该方法能够较好地提高强化学习的性能且具有明显的加速效果.

关键词：NNH-QL 强化学习 Q学习神经网络路径规划

分类号：TP18]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于BP神经网络的双层启发式强化学习方法 ( EI收录)
A Heuristic Two-layer Reinforcement Learning Algorithm Based on BP Neural Networks

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于BP神经网络的双层启发式强化学习方法 ( EI收录) A Heuristic Two-layer Reinforcement Learning Algorithm Based on BP Neural Networks

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于BP神经网络的双层启发式强化学习方法 ( EI收录)
A Heuristic Two-layer Reinforcement Learning Algorithm Based on BP Neural Networks