期刊文章详细信息

古汉语实体关系联合抽取的标注方法
Annotation Method for Extracting Entity Relationship from Ancient Chinese Works

文献类型：期刊文章

作　　者：王一钒[1] 李博[2] 史话[3] 苗威[1] 姜斌[2]

Wang Yifan;Li Bo;Shi Hua;Miao Wei;Jiang Bin(School of Northeast Asia Studies,Shandong University,Weihai 264209,China;School of Mechanical,Electrical&Information Engineering,Shandong University,Weihai 264209,China;School of Transborder Studies,Arizona State University,Tucson 85257,USA)

机构地区：[1]山东大学东北亚学院,威海264209 [2]山东大学机电与信息工程学院,威海264209 [3]亚利桑那州立大学跨境研究学院,图森85257

出　　处：《数据分析与知识发现》

基　　金：国家社会科学基金专项(项目编号:17VGB005)的研究成果之一。

年　　份：2021

卷　　号：5

期　　号：9

起止页码：63-74

语　　种：中文

收录情况：BDHX、BDHX2020、CSCD、CSCD_E2021_2022、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、SCOPUS、ZGKJHX、核心刊

摘　　要：【目的】针对古汉语数据集标注规范研究缺失的现实,提出一套面向古汉语的实体关系标注方法。【方法】通过对逻辑语义学、深度学习、历史学的有机融合,提出古汉语实体关系抽取数据集标注方法,由"关系配价标注""命题逻辑标注"以及"单一关系存在"原则构成,适用于小样本学习。【结果】利用Word Embedding-BiGRU-CRF端到端关系序列标注模型,在《史记》文本数据集上进行实验,在实体关系抽取与命题逻辑抽取任务上F1值分别达到42.02%与34.07%。【局限】未使用BERT、ALBERT等预训练模型,而是选择了较为经典的Word2Vec模型完成词嵌入任务。从模型最终的结果来看,相关研究仍有较大的上升空间。【结论】初步验证了标注方法与联合抽取模型的可行性,填补了面向古汉语实体关系抽取的研究空白。

关键词：自然语言处理实体关系抽取序列标注《史记》

分类号：TP391]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

古汉语实体关系联合抽取的标注方法
Annotation Method for Extracting Entity Relationship from Ancient Chinese Works

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

古汉语实体关系联合抽取的标注方法 Annotation Method for Extracting Entity Relationship from Ancient Chinese Works

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

古汉语实体关系联合抽取的标注方法
Annotation Method for Extracting Entity Relationship from Ancient Chinese Works