期刊文章详细信息
文献类型:期刊文章
Ding Meng;Zhang Yipeng;Li Shuqin(School of Computer,Beijing Information Science&Technology University,Beijing 100101,China;Joint Laboratory of Sensing&Computational Intelligence,Beijing Information Science&Technology University,Beijing 100101,China)
机构地区:[1]北京信息科技大学计算机学院,北京100101 [2]北京信息科技大学感知与计算智能联合实验室,北京100101
基 金:国家自然科学基金资助项目(61502039);2017年度教育教学改革研究专项招标课题(2017JGZB08).
年 份:2020
卷 号:37
期 号:2
起止页码:470-472
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:基于深度学习模型的有监督训练依赖于大量高质量标定数据,但众多小众计算机博弈比赛棋种存在缺少人类对局记录作为训练样本的问题,因此在使用深度学习模型前如何生成一个合理标定的局面数据集是值得研究探讨的问题。针对点格棋博弈问题,提出了一种数据哈希去重以及局面标定方法。根据不同阶段回合局面数据的特点,通过alpha-beta完全搜索、回溯标定、并行化MCTS算法标定以及对称扩展技巧,收集并标定不同回合数的点格棋局面样本。实验共获得了包含15000000个带标定点格棋局面样本的数据集,为基于深度学习模型的点格棋有监督训练提供了保障。此外,所提方法也为其他棋种训练数据的获取提供了有价值的借鉴。
关 键 词:数据标定 点格棋 棋盘局面 计算机博弈
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...