登录    注册    忘记密码

期刊文章详细信息

古汉语实体关系联合抽取的标注方法    

Annotation Method for Extracting Entity Relationship from Ancient Chinese Works

  

文献类型:期刊文章

作  者:王一钒[1] 李博[2] 史话[3] 苗威[1] 姜斌[2]

Wang Yifan;Li Bo;Shi Hua;Miao Wei;Jiang Bin(School of Northeast Asia Studies,Shandong University,Weihai 264209,China;School of Mechanical,Electrical&Information Engineering,Shandong University,Weihai 264209,China;School of Transborder Studies,Arizona State University,Tucson 85257,USA)

机构地区:[1]山东大学东北亚学院,威海264209 [2]山东大学机电与信息工程学院,威海264209 [3]亚利桑那州立大学跨境研究学院,图森85257

出  处:《数据分析与知识发现》

基  金:国家社会科学基金专项(项目编号:17VGB005)的研究成果之一。

年  份:2021

卷  号:5

期  号:9

起止页码:63-74

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、SCOPUS、ZGKJHX、核心刊

摘  要:【目的】针对古汉语数据集标注规范研究缺失的现实,提出一套面向古汉语的实体关系标注方法。【方法】通过对逻辑语义学、深度学习、历史学的有机融合,提出古汉语实体关系抽取数据集标注方法,由"关系配价标注""命题逻辑标注"以及"单一关系存在"原则构成,适用于小样本学习。【结果】利用Word Embedding-BiGRU-CRF端到端关系序列标注模型,在《史记》文本数据集上进行实验,在实体关系抽取与命题逻辑抽取任务上F1值分别达到42.02%与34.07%。【局限】未使用BERT、ALBERT等预训练模型,而是选择了较为经典的Word2Vec模型完成词嵌入任务。从模型最终的结果来看,相关研究仍有较大的上升空间。【结论】初步验证了标注方法与联合抽取模型的可行性,填补了面向古汉语实体关系抽取的研究空白。

关 键 词:自然语言处理 实体关系抽取 序列标注  《史记》

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心