期刊文章详细信息
多头注意力与字词融合的中文命名实体识别
Chinese Named Entity Recognition by Integrating Multi-Heads Attention Mechanism and Character and Words Fusion
文献类型:期刊文章
ZHAO Dandan;HUANG Degen;MENG Jiana;GU Feng;ZHANG Pan(School of Computer Science and Technology,Dalian University of Technology,Dalian,Liaoning 116024,China;School of Computer Science and Engineering,Dalian Minzu University,Dalian,Liaoning 116600,China)
机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116024 [2]大连民族大学计算机科学与工程学院,辽宁大连116600
基 金:国家科技部科技创新2030—“新一代人工智能”重大项目(2020AAA0108004);国家自然科学基金(U1936109,61876031);辽宁省教育厅2019年度科学研究经费项目(LJYT201906)。
年 份:2022
卷 号:58
期 号:7
起止页码:142-149
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊
摘 要:命名实体识别(named entity recognition,NER)是自然语言处理中重要的基础任务,而中文命名实体识别(Chinese named entity recognition,CNER)因分词歧义和一词多义等问题使其尤显困难。针对这些问题,提出多头注意力机制(multi-heads attention mechanism,Multi-Attention)与字词融合的中文命名实体识别模型(CWA-CNER)。将汉语文本字向量与其在句中可能成词的词向量进行拼接,并将其送入长短时记忆网络(bidirectional long short-term memory neural network,BiLSTM)提取上下文语义信息,进而利用多头注意力机制捕获句中元素间联系的紧密程度,最后通过条件随机场(conditional random field,CRF)进行实体标注。该模型在Boson数据集,1998和2014年《人民日报》三种语料上进行实验,其F1值均达到90%以上,结果表明了模型的有效性。
关 键 词:命名实体识别(NER) 多头注意力机制 字词融合
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...