期刊文章详细信息
面向中文电子病历文书的医学命名实体识别研究——一种基于半监督深度学习的方法
Recognizing Clinical Named Entity from Chinese Electronic Medical Record Texts Based on Semi-Supervised Deep Learning
文献类型:期刊文章
Jing Shenqi;Zhao Youlin(School of Information Management,Nanjing University,Nanjing,210023;School of Biomedical Engineering and Informatics,Nanjing Medical University,Nanjing,211166;Center for Data Management,The First Affiliated Hospital of Nanjing Medical University(Jiangsu Province Hospital),Nanjing,210096)
机构地区:[1]南京大学信息管理学院,南京210023 [2]南京医科大学生物医学工程与信息学院,南京211166 [3]南京医科大学第一附属医院(江苏省人民医院)数据应用管理中心,南京210096
基 金:国家重点研发计划项目“重大慢性非传染性疾病防控研究”重点专项“糖尿病信息化管理平台与传播体系创建及示范应用”(2018YFC1314900);江苏省重点研发计划“重大慢性病综合防控体系构建与示范”(BE2020721)。
年 份:2021
卷 号:11
期 号:6
起止页码:105-115
语 种:中文
收录情况:CSSCI、CSSCI2021_2022、JST、NSSD、RCCSE、RWSKHX、普通刊
摘 要:电子病历文书详细记录患者诊疗全过程,蕴藏的医学知识是电子病历中最丰富的,因此挖掘电子病历文书潜在的知识结构具有十分重要的价值。面向非结构化电子病历知识挖掘的首要工作是命名实体识别,现有的医学领域命名实体识别方法面临标注数据质量偏低、标注数据不足的问题,同时现有方法中均只考虑文本的序列特性,忽略文本中词间、字间的依赖关系,限制了命名实体识别效果。本文提出一种基于半监督深度学习的医学命名实体识别方法,即结合具有专家权威的中文百科半自动化实体标注法及BERT-GCN-CRF框架,对电子病历文本进行医学命名实体识别抽取。以真实电子病历文本作为实验对象,该模型获取的准确率、召回率、F1值均有明显提高,其中P、R和F1综合平均值分别为84.6%、84.0%和84.2%,同时人工标注工作量显著减少。本文提出的方法对电子病历的非结构化文本挖掘工作有重要意义。
关 键 词:医学命名实体识别 电子病历文书 知识挖掘 半监督深度学习 BERT-GCN-CRF
分 类 号:G302] R-02]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...