期刊文章详细信息
基于藏文Albert预训练语言模型的图采样与聚合实体关系抽取
Graph Sampling and Aggregation Entity Relation Extraction Based on Tibetan Albert Pre-trained Language Model
文献类型:期刊文章
YU Tao;Nyima Ciren;YONG Cuo;Nyima Trashi(College of Information Science and Technology,Tibet University,Lhasa,Tibet 850000,China;Key Laboratory of Tibetan Information Technology and Artificial Intelligence of Tibet,Tibet University,Lhasa,Tibet 850000,China;Engineering Research Center of Tibetan Information Technology,Ministry of Education,Tibet University,Lhasa,Tibet 850000,China)
机构地区:[1]西藏大学信息科学技术学院,西藏拉萨850000 [2]西藏大学西藏自治区藏文信息技术人工智能重点实验室,西藏拉萨850000 [3]西藏大学藏文信息技术教育部工程研究中心,西藏拉萨850000
基 金:科技部重点研发计划重点专项(2017YFB1402200);西藏自治区科技创新基地自主研究项目(XZ2021JR002G)。
年 份:2022
卷 号:36
期 号:10
起止页码:63-72
语 种:中文
收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊
摘 要:实体关系抽取任务是对句子中实体对间的语义关系进行识别。该文提出了一种基于Albert预训练语言模型结合图采样与聚合算法(Graph Sampling and Aggregation,GraphSAGE)的实体关系抽取方法,并在藏文实体关系抽取数据集上实验。该文针对藏文句子特征表示匮乏、传统藏文实体关系抽取模型准确率不高等问题,提出以下方案:①使用预先训练的藏文Albert模型获得高质量的藏文句子动态词向量特征;②使用提出的图结构数据构建与表示方法生成GraphSAGE模型的输入数据,并通过实验证明了该方法的有效性;③借鉴GraphSAGE模型的优势,利用其图采样与聚合操作进行关系抽取。实验结果表明,该文方法有效提高了藏文实体关系抽取模型的准确率,且优于基线实验效果。
关 键 词:藏文 实体关系抽取 ALBERT GraphSAGE
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...