期刊文章详细信息
多神经网络协作的军事领域命名实体识别 ( EI收录)
Multi-neural network collaboration for Chinese military named entity recognition
文献类型:期刊文章
YIN Xuezhen;ZHAO Hui;ZHAO Junbao;YAO Wanwei;HUANG Zelin(School of Software Engineering,East China Normal University,Shanghai 200062,China;Shanghai Key Laboratory of Trustworthy Computing,Kast China Normal University,Shanghai 200062,China;Beying Remote Sensing Information Institute,tieijing 100085,China)
机构地区:[1]华东师范大学软件工程学院,上海200062 [2]华东师范大学上海市高可信计算重点实验室,上海200062 [3]北京遥感信息研究所,北京100085
基 金:国家自然科学基金资助项目(61702190)。
年 份:2020
卷 号:60
期 号:8
起止页码:648-655
语 种:中文
收录情况:BDHX、BDHX2017、CAS、CSCD、CSCD2019_2020、EI、IC、JST、MR、PROQUEST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。
关 键 词:军事命名实体识别 双向偏码器(BERT) 模糊边界 多神经网络
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...