期刊文章详细信息
文献类型:期刊文章
Wang Yifan;Li Bo;Shi Hua;Miao Wei;Jiang Bin(School of Northeast Asia Studies,Shandong University,Weihai 264209,China;School of Mechanical,Electrical&Information Engineering,Shandong University,Weihai 264209,China;School of Transborder Studies,Arizona State University,Tucson 85257,USA)
机构地区:[1]山东大学东北亚学院,威海264209 [2]山东大学机电与信息工程学院,威海264209 [3]亚利桑那州立大学跨境研究学院,图森85257
基 金:国家社会科学基金专项(项目编号:17VGB005)的研究成果之一。
年 份:2021
卷 号:5
期 号:9
起止页码:63-74
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、SCOPUS、ZGKJHX、核心刊
摘 要:【目的】针对古汉语数据集标注规范研究缺失的现实,提出一套面向古汉语的实体关系标注方法。【方法】通过对逻辑语义学、深度学习、历史学的有机融合,提出古汉语实体关系抽取数据集标注方法,由"关系配价标注""命题逻辑标注"以及"单一关系存在"原则构成,适用于小样本学习。【结果】利用Word Embedding-BiGRU-CRF端到端关系序列标注模型,在《史记》文本数据集上进行实验,在实体关系抽取与命题逻辑抽取任务上F1值分别达到42.02%与34.07%。【局限】未使用BERT、ALBERT等预训练模型,而是选择了较为经典的Word2Vec模型完成词嵌入任务。从模型最终的结果来看,相关研究仍有较大的上升空间。【结论】初步验证了标注方法与联合抽取模型的可行性,填补了面向古汉语实体关系抽取的研究空白。
关 键 词:自然语言处理 实体关系抽取 序列标注 《史记》
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...