期刊文章详细信息
文献类型:期刊文章
ZHENG Yan-bin;XIA Zhi-chao;GUO Zhi;HUANG Yong-zhong;LIU Wen-fen(Guangxi Key Laboratory of Cryptography and Information Security, Guilin University of Electronic Technology 1, Guilin 541004, China;School of Computer Science and Network Security, Dongguan University of Technology 2 , Dongguan 523808, China)
机构地区:[1]桂林电子科技大学广西密码学与信息安全重点实验室,桂林541004 [2]东莞理工学院计算机与网络安全学院,东莞523808
基 金:国家自然科学基金(61602125;61866008;61862011;61862012);广西自然科学基金(2016GXNSFBA380153;2017GXNSFAA198192;2018GXNSFAA138116);广西密码学与信息安全重点实验室项目(GCIS201625;GCIS201704);桂林电子科技大学研究生教育创新计划项目(2018YJCX51)资助
年 份:2018
卷 号:18
期 号:35
起止页码:162-168
语 种:中文
收录情况:BDHX、BDHX2017、RCCSE、ZGKJHX、核心刊
摘 要:为构建东盟十国知识图谱,需要对相关文本进行命名实体识别工作。设计一种基于双向GRU-CRF的神经网络模型,对中国驻东盟十国大使馆中文新闻数据进行命名实体识别。以预训练的领域词向量为输入,利用双向GRU网络从向量化的文本中提取语义特征;再通过CRF层预测并输出最优标签序列。为了进一步改善结果,在双向GRU和CRF层之间添加两层隐藏层。在数据预处理方面,提出一种数据集划分算法,对文本进行更加科学合理的划分。在东盟十国数据集上,将该模型与几种混合模型进行对比,结果显示所提模型在人名、地名、组织机构名识别任务中拥有更好的识别性能。
关 键 词:双向GRU-CRF 命名实体识别 东盟十国 知识图谱
分 类 号:TP183]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...