期刊文章详细信息
文献类型:期刊文章
WANG Yue;WANG Mengxuan;ZHANG Sheng;DU Wen(DS Information Technology Company Limited,Shanghai 200032,China;The First Research Institute of Telecommunications Technology,Shanghai 200032,China)
机构地区:[1]迪爱斯信息技术股份有限公司,上海200032 [2]电信科学技术第一研究所,上海200032
基 金:上海市信息化发展(大数据发展)专项资金资助项目(201901043);上海市产业转型升级专项资金(产业技术创新)资助项目(JJ-YJCX-01-18-3418)~~
年 份:2020
卷 号:40
期 号:2
起止页码:535-540
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、ZGKJHX、ZMATH、核心刊
摘 要:针对警情领域关键实体信息难以识别的问题,提出一种基于BERT的神经网络模型BERT-BiLSTMAttention-CRF用于识别和提取相关命名实体,且针对不同案由设计了相应的实体标记注规范。该模型使用BERT预训练词向量代替传统Skip-gram和CBOW等方式训练的静态词向量,提升了词向量的表证能力,同时解决了中文语料采用字向量训练时词语边界的划分问题;还使用注意力机制改进经典的命名实体识别(NER)模型架构BiLSTM-CRF。BERT-BiLSTM-Attention-CRF模型在测试集上的准确率达91%,较CRF++的基准模型提高7%,也高于BiLSTM-CRF模型86%的准确率,其中相关人名、损失金额、处理方式等实体的F1值均高于0.87。
关 键 词:警情文本 命名实体识别 预训练语言模型 标注规范 词向量
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...