期刊文章详细信息
文献类型:期刊文章
LI Chunnan;WANG Lei;SUN Yuanyuan;LIN Hongfei(School of Computer Science and Technology,Dalian University of Technology,Dalian,Liaoning 116024,China;People's Procuratorate of Jinzhou,Jinzhou,Liaoning 121000,China)
机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116024 [2]锦州市人民检察院,辽宁锦州121000
基 金:“十三五”国家重点研发计划(2018YFC0830603)
年 份:2021
卷 号:35
期 号:8
起止页码:73-81
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊
摘 要:法律文书命名实体识别是智慧司法领域的关键性和基础性任务。在目前法律文书命名实体识别方法中,存在实体定义与司法业务结合不紧密、传统词向量无法解决一词多义等问题。针对以上问题,该文提出一种新的法律文本命名实体定义方案,构建了基于起诉意见书的法律文本命名实体语料集LegalCorpus;提出一种基于BERT-ON-LSTM-CRF(Bidirectional Encoder Representations from Transformers-Ordered Neuron-Long Short Term Memory Networks-Conditional Random Field)的法律文书命名实体识别方法,该方法首先利用预训练语言模型BERT根据字的上下文动态生成语义向量作为模型输入,然后运用ON-LSTM对输入进行序列和层级建模以提取文本特征,最后利用CRF获取最优标记序列。在LegalCorpus上进行实验,该文提出的方法F_(1)值达到86.09%,相比基线模型lattice LSTM F_(1)值提升了7.8%。实验结果表明,该方法可以有效对法律文书的命名实体进行识别。
关 键 词:BERT 法律文书 命名实体识别 有序神经元
分 类 号:D924.35] D926.13[法学类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...