登录    注册    忘记密码

期刊文章详细信息

多神经网络协作的军事领域命名实体识别  ( EI收录)  

Multi-neural network collaboration for Chinese military named entity recognition

  

文献类型:期刊文章

作  者:尹学振[1] 赵慧[2] 赵俊保[3] 姚婉薇[1] 黄泽林[1]

YIN Xuezhen;ZHAO Hui;ZHAO Junbao;YAO Wanwei;HUANG Zelin(School of Software Engineering,East China Normal University,Shanghai 200062,China;Shanghai Key Laboratory of Trustworthy Computing,Kast China Normal University,Shanghai 200062,China;Beying Remote Sensing Information Institute,tieijing 100085,China)

机构地区:[1]华东师范大学软件工程学院,上海200062 [2]华东师范大学上海市高可信计算重点实验室,上海200062 [3]北京遥感信息研究所,北京100085

出  处:《清华大学学报(自然科学版)》

基  金:国家自然科学基金资助项目(61702190)。

年  份:2020

卷  号:60

期  号:8

起止页码:648-655

语  种:中文

收录情况:BDHX、BDHX2017、CAS、CSCD、CSCD2019_2020、EI、IC、JST、MR、PROQUEST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。

关 键 词:军事命名实体识别  双向偏码器(BERT)  模糊边界  多神经网络

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心