期刊文章详细信息
结合注意力机制的Bi-LSTM-CRF中文电子病历命名实体识别
Medical name entity recognition based on Bi-LSTM-CRF and attention mechanism
文献类型:期刊文章
ZHANG Huali;KANG Xiaodong;LI Bo;WANG Yage;LIU Hanqing;BAI Fang(School of Medical Imaging,Tianjin Medical University,Tianjin 300203,China)
机构地区:[1]天津医科大学医学影像学院,天津300203
基 金:京津冀协同创新项目(17YFXTZC0020)。
年 份:2020
卷 号:40
期 号:S01
起止页码:98-102
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSCD、CSCD_E2019_2020、IC、JST、PROQUEST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:在中文电子病历命名实体识别任务中,为了消除传统命名实体识别方法高度依赖人工提取特征这一不足,设计了双向长短时记忆(Bi-LSTM)网络与条件随机场(CRF)结合的网络模型,并在联合网络的基础上添加注意力机制,从而优化实体识别准确率。首先,将中文电子病历数据集进行脱敏处理及序列标注等预处理;其次,结合词嵌入技术将电子病历文本序列进行词向量化表示,并利用Bi-LSTM网络模型构造包含前向和后向文本的语义特征;然后,将双向特征序列输入到注意力层,利用注意力机制对文本特征向量的语义编码分配不同的注意力权重,进一步强化当前信息与上下文信息之间潜在的语义关联性;最后,输入到CRF层中,由此提取出实体。实验结果表明,该注意力机制与Bi-LSTM-CRF模型融合的新方法能有效提高中文电子病历命名实体识别的准确率。
关 键 词:电子病历 双向长短时记忆网络 条件随机场 注意力机制 实体识别
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...