期刊文章详细信息
文献类型:期刊文章
Ben Yanyan;Pang Xueqin(School of Mathematics and Statistics,Huazhong University of Science and Technology,Wuhan 430074,China;Archives of Wuhan University of Science and Technology,Wuhan 430081,China)
机构地区:[1]华中科技大学数学与统计学院,武汉430074 [2]武汉科技大学档案馆,武汉430081
基 金:国家自然科学基金项目(项目编号:11971185)的研究成果之一。
年 份:2023
卷 号:7
期 号:5
起止页码:123-132
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD_E2023_2024、CSSCI、CSSCI2023_2024、IC、NSSD、RCCSE、RWSKHX、SCOPUS、ZGKJHX、核心刊
摘 要:【目的】针对命名实体边界识别困难问题,融入词信息以改进在线问诊记录中临床关键特征的识别与推断。【方法】基于MacBERT与条件随机场构建模型,对词位置和词性等词信息进行位置“软”嵌入,利用说话者角色嵌入引入对话文本信息。同时,引入加权多分类交叉熵解决实体类别不均衡问题。【结果】在春雨医生互联网在线问诊记录上开展实证研究,本文模型在命名实体识别任务上的F_(1)值为74.35%,相比直接利用MacBERT模型提高近2个百分点。【局限】未设计专门对中文分词的模型。【结论】与直接利用MacBERT模型建模相比,融入词信息等更多维度特征能有效提升模型的识别能力。
关 键 词:中文命名实体识别 在线医疗问诊 词信息融入 MacBERT 加权交叉熵
分 类 号:TP393] G250[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...