期刊文章详细信息
文献类型:期刊文章
机构地区:[1]南京大学计算机软件新技术国家重点实验室,南京210093
基 金:国家自然科学基金(60103012;69905001);国家"973"重点研究发展规划(2002CB312002)资助~~
年 份:2004
卷 号:30
期 号:1
起止页码:86-100
语 种:中文
收录情况:BDHX、BDHX2000、CSCD、CSCD2011_2012、EI、IC、INSPEC、JST、MR、PUBMED、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类图,分别在马尔可夫环境和非马尔可夫环境下讨论最优搜索型和经验强化型两类算法;然后结合近年来的研究综述了强化学习技术的核心问题,包括部分感知、函数估计、多agent强化学习,以及偏差技术;最后还简要介绍强化学习的应用情况和未来的发展方向.
关 键 词:机器学习 强化学习 马尔可夫环境 函数估计 偏差技术
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...