登录    注册    忘记密码

期刊文章详细信息

多头注意力与字词融合的中文命名实体识别    

Chinese Named Entity Recognition by Integrating Multi-Heads Attention Mechanism and Character and Words Fusion

  

文献类型:期刊文章

作  者:赵丹丹[1,2] 黄德根[1] 孟佳娜[2] 谷丰[2] 张攀[2]

ZHAO Dandan;HUANG Degen;MENG Jiana;GU Feng;ZHANG Pan(School of Computer Science and Technology,Dalian University of Technology,Dalian,Liaoning 116024,China;School of Computer Science and Engineering,Dalian Minzu University,Dalian,Liaoning 116600,China)

机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116024 [2]大连民族大学计算机科学与工程学院,辽宁大连116600

出  处:《计算机工程与应用》

基  金:国家科技部科技创新2030—“新一代人工智能”重大项目(2020AAA0108004);国家自然科学基金(U1936109,61876031);辽宁省教育厅2019年度科学研究经费项目(LJYT201906)。

年  份:2022

卷  号:58

期  号:7

起止页码:142-149

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊

摘  要:命名实体识别(named entity recognition,NER)是自然语言处理中重要的基础任务,而中文命名实体识别(Chinese named entity recognition,CNER)因分词歧义和一词多义等问题使其尤显困难。针对这些问题,提出多头注意力机制(multi-heads attention mechanism,Multi-Attention)与字词融合的中文命名实体识别模型(CWA-CNER)。将汉语文本字向量与其在句中可能成词的词向量进行拼接,并将其送入长短时记忆网络(bidirectional long short-term memory neural network,BiLSTM)提取上下文语义信息,进而利用多头注意力机制捕获句中元素间联系的紧密程度,最后通过条件随机场(conditional random field,CRF)进行实体标注。该模型在Boson数据集,1998和2014年《人民日报》三种语料上进行实验,其F1值均达到90%以上,结果表明了模型的有效性。

关 键 词:命名实体识别(NER)  多头注意力机制  字词融合  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心