登录    注册    忘记密码

期刊文章详细信息

基于BERT的警情文本命名实体识别    

Alarm text named entity recognition based on BERT

  

文献类型:期刊文章

作  者:王月[1,2] 王孟轩[1,2] 张胜[1,2] 杜渂[1,2]

WANG Yue;WANG Mengxuan;ZHANG Sheng;DU Wen(DS Information Technology Company Limited,Shanghai 200032,China;The First Research Institute of Telecommunications Technology,Shanghai 200032,China)

机构地区:[1]迪爱斯信息技术股份有限公司,上海200032 [2]电信科学技术第一研究所,上海200032

出  处:《计算机应用》

基  金:上海市信息化发展(大数据发展)专项资金资助项目(201901043);上海市产业转型升级专项资金(产业技术创新)资助项目(JJ-YJCX-01-18-3418)~~

年  份:2020

卷  号:40

期  号:2

起止页码:535-540

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:针对警情领域关键实体信息难以识别的问题,提出一种基于BERT的神经网络模型BERT-BiLSTMAttention-CRF用于识别和提取相关命名实体,且针对不同案由设计了相应的实体标记注规范。该模型使用BERT预训练词向量代替传统Skip-gram和CBOW等方式训练的静态词向量,提升了词向量的表证能力,同时解决了中文语料采用字向量训练时词语边界的划分问题;还使用注意力机制改进经典的命名实体识别(NER)模型架构BiLSTM-CRF。BERT-BiLSTM-Attention-CRF模型在测试集上的准确率达91%,较CRF++的基准模型提高7%,也高于BiLSTM-CRF模型86%的准确率,其中相关人名、损失金额、处理方式等实体的F1值均高于0.87。

关 键 词:警情文本  命名实体识别 预训练语言模型  标注规范  词向量  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心