期刊文章详细信息
文献类型:期刊文章
LI Lishuang;GUO Yuankai(School of Computer Science and Technology, Dalian University of Technology, Dalian, Liaoning 116023, China)
机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116023
基 金:国家自然科学基金(61672126)
年 份:2018
卷 号:32
期 号:1
起止页码:116-122
语 种:中文
收录情况:BDHX、BDHX2017、CSCD、CSCD2017_2018、JST、RCCSE、ZGKJHX、核心刊
摘 要:命名实体识别是自然语言处理任务的重要步骤。近年来,不依赖人工特征的神经网络在新闻等通用领域命名实体识别方面表现出了很好的性能。然而在生物医学领域,许多实验表明基于领域知识的人工特征对于神经网络模型的结果影响很大。因此,如何在不依赖人工特征的情况下获得较好的生物医学命名实体识别性能是有待解决的问题。该文提出一种基于CNN-BLSTM-CRF的神经网络模型。首先利用卷积神经网络(CNN)训练出单词的具有形态特征的字符级向量,并从大规模背景语料训练中得到具有语义特征信息的词向量,然后将二者进行组合作为输入,再构建适合生物医学命名实体识别的BLSTM-CRF深层神经网络模型。实验结果表明,不依赖任何人工特征,该文方法在BiocreativeⅡGM和JNLPBA2004生物医学语料上都达到了目前最好的结果,F-值分别为89.09%和74.40%。
关 键 词:生物医学命名实体识别 LSTM CNN
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...