期刊文章详细信息
基于BP神经网络的双层启发式强化学习方法 ( EI收录)
A Heuristic Two-layer Reinforcement Learning Algorithm Based on BP Neural Networks
文献类型:期刊文章
机构地区:[1]曲阜师范大学信息科学与工程学院,山东日照276826 [2]河海大学计算机与信息学院,南京210098
基 金:国家自然科学基金项目(60971088;60571048)
年 份:2015
卷 号:52
期 号:3
起止页码:579-587
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CSA-PROQEUST、CSCD、CSCD2015_2016、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:强化学习通过与环境交互的方式进行学习,在较大状态空间中其学习效率却很低.植入先验知识能够提高学习速度,然而不恰当的先验知识反而会误导学习过程,对学习性能不利.提出一种基于BP神经网络的双层启发式强化学习方法 NNH-QL,改变了传统强化学习过程的盲目性.作为定性层,高层由BP神经网络构成,它不需要由外界提供背景知识,利用Shaping技术,将在线获取的动态知识对底层基于表格的Q学习过程进行趋势性启发.算法利用资格迹技术训练神经网络以提高学习效率.NNHQL方法既发挥了标准Q学习的灵活性,又利用了神经网络的泛化性能,为解决较大状态空间下的强化学习问题提供了一个可行的方法.实验结果表明:该方法能够较好地提高强化学习的性能且具有明显的加速效果.
关 键 词:NNH-QL 强化学习 Q学习 神经网络 路径规划
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...