登录    注册    忘记密码

期刊文章详细信息

基于深度学习的方志物产资料实体自动识别模型构建研究    

Automatic Recognition of Produce Entities from Local Chronicles with Deep Learning

  

文献类型:期刊文章

作  者:徐晨飞[1,2] 叶海影[2] 包平[1]

Xu Chenfei;Ye Haiying;Bao Ping(Institution of Chinese Agricultural Civilization,Nanjing Agricultural University,Nanjing 210095,China;Economics and Management School,Nantong University,Nantong 226019,China)

机构地区:[1]南京农业大学中华农业文明研究院,南京210095 [2]南通大学经济与管理学院,南通226019

出  处:《数据分析与知识发现》

基  金:国家社会科学基金重大项目“方志物产知识库构建及深度利用研究”(项目编号:18ZDA327);教育部人文社会科学研究青年基金项目“基于语义的方志物产资料知识组织与知识聚合实证研究”(项目编号:19YJC870027)的研究成果之一。

年  份:2020

卷  号:4

期  号:8

起止页码:86-97

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD_E2019_2020、CSSCI、CSSCI2019_2020、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:【目的】探究古籍方志物产资料中物产别名、人物、产地及引书等4种实体的自动识别,用于方志物产知识库的构建。【方法】以机构特藏《方志物产》云南卷为基础语料,在文本预处理与语料标注基础上,采用4种深度学习模型Bi-RNN、Bi-LSTM、Bi-LSTM-CRF、BERT进行实验,并对实验结果进行对比分析。【结果】Bi-LSTM-CRF模型与Bi-LSTM模型相比,P值提高5.54%,F值提高3.51%;BERT模型的R值达到了83.36%,优于其他模型;Bi-LSTM-CRF模型对引书实体识别效果最好,F值为89.71%;BERT模型对人物实体识别效果最好,F值为87.90%。【局限】由于古籍方志文本语料特性,以及相关实体的认定需掌握领域知识,在人工标注过程中或存在一些漏标与错标的情况,导致模型未能最优化。【结论】研究表明深度学习方法对古籍方志文本实体识别任务的可行性与优越性。

关 键 词:深度学习  方志物产  命名实体识别 模型构建 数字人文  

分 类 号:G255[图书情报与档案管理类] K290[历史学类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心