登录    注册    忘记密码

期刊文章详细信息

东盟十国新闻文本的命名实体识别    

Named Entity Recognition of News Texts in Ten ASEAN Countries

  

文献类型:期刊文章

作  者:郑彦斌[1,2] 夏志超[1] 郭智[1] 黄永忠[1] 刘文芬[1]

ZHENG Yan-bin;XIA Zhi-chao;GUO Zhi;HUANG Yong-zhong;LIU Wen-fen(Guangxi Key Laboratory of Cryptography and Information Security, Guilin University of Electronic Technology 1, Guilin 541004, China;School of Computer Science and Network Security, Dongguan University of Technology 2 , Dongguan 523808, China)

机构地区:[1]桂林电子科技大学广西密码学与信息安全重点实验室,桂林541004 [2]东莞理工学院计算机与网络安全学院,东莞523808

出  处:《科学技术与工程》

基  金:国家自然科学基金(61602125;61866008;61862011;61862012);广西自然科学基金(2016GXNSFBA380153;2017GXNSFAA198192;2018GXNSFAA138116);广西密码学与信息安全重点实验室项目(GCIS201625;GCIS201704);桂林电子科技大学研究生教育创新计划项目(2018YJCX51)资助

年  份:2018

卷  号:18

期  号:35

起止页码:162-168

语  种:中文

收录情况:BDHX、BDHX2017、RCCSE、ZGKJHX、核心刊

摘  要:为构建东盟十国知识图谱,需要对相关文本进行命名实体识别工作。设计一种基于双向GRU-CRF的神经网络模型,对中国驻东盟十国大使馆中文新闻数据进行命名实体识别。以预训练的领域词向量为输入,利用双向GRU网络从向量化的文本中提取语义特征;再通过CRF层预测并输出最优标签序列。为了进一步改善结果,在双向GRU和CRF层之间添加两层隐藏层。在数据预处理方面,提出一种数据集划分算法,对文本进行更加科学合理的划分。在东盟十国数据集上,将该模型与几种混合模型进行对比,结果显示所提模型在人名、地名、组织机构名识别任务中拥有更好的识别性能。

关 键 词:双向GRU-CRF  命名实体识别 东盟十国 知识图谱

分 类 号:TP183]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心