登录    注册    忘记密码

期刊文章详细信息

基于BERT的盗窃罪法律文书命名实体识别方法    

BERT Based Named Entity Recognition for Legal Texts on Theft Cases

  

文献类型:期刊文章

作  者:李春楠[1] 王雷[2] 孙媛媛[1] 林鸿飞[1]

LI Chunnan;WANG Lei;SUN Yuanyuan;LIN Hongfei(School of Computer Science and Technology,Dalian University of Technology,Dalian,Liaoning 116024,China;People's Procuratorate of Jinzhou,Jinzhou,Liaoning 121000,China)

机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116024 [2]锦州市人民检察院,辽宁锦州121000

出  处:《中文信息学报》

基  金:“十三五”国家重点研发计划(2018YFC0830603)

年  份:2021

卷  号:35

期  号:8

起止页码:73-81

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊

摘  要:法律文书命名实体识别是智慧司法领域的关键性和基础性任务。在目前法律文书命名实体识别方法中,存在实体定义与司法业务结合不紧密、传统词向量无法解决一词多义等问题。针对以上问题,该文提出一种新的法律文本命名实体定义方案,构建了基于起诉意见书的法律文本命名实体语料集LegalCorpus;提出一种基于BERT-ON-LSTM-CRF(Bidirectional Encoder Representations from Transformers-Ordered Neuron-Long Short Term Memory Networks-Conditional Random Field)的法律文书命名实体识别方法,该方法首先利用预训练语言模型BERT根据字的上下文动态生成语义向量作为模型输入,然后运用ON-LSTM对输入进行序列和层级建模以提取文本特征,最后利用CRF获取最优标记序列。在LegalCorpus上进行实验,该文提出的方法F_(1)值达到86.09%,相比基线模型lattice LSTM F_(1)值提升了7.8%。实验结果表明,该方法可以有效对法律文书的命名实体进行识别。

关 键 词:BERT  法律文书 命名实体识别 有序神经元  

分 类 号:D924.35] D926.13[法学类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心