登录    注册    忘记密码

期刊文章详细信息

基于BP神经网络的双层启发式强化学习方法  ( EI收录)  

A Heuristic Two-layer Reinforcement Learning Algorithm Based on BP Neural Networks

  

文献类型:期刊文章

作  者:刘智斌[1,2] 曾晓勤[2] 刘惠义[2] 储荣[2]

机构地区:[1]曲阜师范大学信息科学与工程学院,山东日照276826 [2]河海大学计算机与信息学院,南京210098

出  处:《计算机研究与发展》

基  金:国家自然科学基金项目(60971088;60571048)

年  份:2015

卷  号:52

期  号:3

起止页码:579-587

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CSA-PROQEUST、CSCD、CSCD2015_2016、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:强化学习通过与环境交互的方式进行学习,在较大状态空间中其学习效率却很低.植入先验知识能够提高学习速度,然而不恰当的先验知识反而会误导学习过程,对学习性能不利.提出一种基于BP神经网络的双层启发式强化学习方法 NNH-QL,改变了传统强化学习过程的盲目性.作为定性层,高层由BP神经网络构成,它不需要由外界提供背景知识,利用Shaping技术,将在线获取的动态知识对底层基于表格的Q学习过程进行趋势性启发.算法利用资格迹技术训练神经网络以提高学习效率.NNHQL方法既发挥了标准Q学习的灵活性,又利用了神经网络的泛化性能,为解决较大状态空间下的强化学习问题提供了一个可行的方法.实验结果表明:该方法能够较好地提高强化学习的性能且具有明显的加速效果.

关 键 词:NNH-QL  强化学习  Q学习 神经网络 路径规划

分 类 号:TP18]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心