期刊文章详细信息
BiLSTM-CRF模型在中文电子病历命名实体识别中的应用研究
Applied Research on Named Entity Recognition in Chinese Electronic Medical Record Based on BiLSTM-CRF Model
文献类型:期刊文章
WANG Ruojia;WEI Siyi;WANG Jimin(Department of Information Management,Peking University,Beijing 100871,China;Institute of Ocean Research,Peking University,Beijing 100871,China;Department of Information Science,Cornell University,Ithaca,NY 14850,USA)
机构地区:[1]北京大学信息管理系,北京100871 [2]北京大学海洋研究院,北京100871 [3]康奈尔大学信息科学学院,美国14850
年 份:2019
卷 号:1
期 号:2
起止页码:53-66
语 种:中文
收录情况:NSSD、普通刊
摘 要:[目的/意义]健康医疗大数据是我国重要的基础性战略资源。中文电子病历的命名实体识别有助于从大量非结构化文本中提取重要信息,从而为医疗数据挖掘与应用奠定基础。[方法/过程]为探讨深度学习算法在中文电子病历命名实体识别中的效果,本研究通过标注语料集,建立BiLSTM-CRF模型对电子病历中症状、检查、疾病、药物、治疗五类实体进行了识别,并与传统CRF方法进行对比,同时对不同标注方案、标注粒度以及标注类别对模型识别效果的影响进行了分析。[结果/结论]BiLSTMCRF模型在基于词的BIOES标注方案下实体识别效果最好,F值为78.12%;从实体类别来看,检查类实体的识别效果最好,而疾病类实体的识别效果不太理想。
关 键 词:深度学习 电子病历 命名实体识别 BiLSTM-CRF模型 条件随机场
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...